pandas和numpy笔记
pandas笔记
pandas.read_csv不忽略首行
可以在read_csv函数中加入参数header=None
,如下:
1 | train_data = pd.read_csv("train.csv", header=None) |
pandas.to_csv忽略index
可以在to_csv函数中加入参数index=False
,如下:
1 | # 忽略index |
pandas去掉不是数字的列
1 | # remove the non-numeric columns |
pandas转numpy
1 | # create a numpy array with the numeric values for input into scikit-learn |
获取pandas.DataFrame第一列的数据
1 | # DataFrame第一列 |
numpy笔记
获取numpy.array中最后一列的数据
1 | y = to_nparray[:,-1] # 最后一列 |
numpy.dtype:int转字符串
1 | # np.dtype: int转字符串 |
numpy拼接字符串array
1 | # numpy拼接字符串 |
numpy按行合并两个numpy.array
1 | # 按行合并两个numpy.array,ID和res是np.array |
numpy.array转DataFrame
1 | # numpy.array转DataFrame |
numpy产生随机矩阵
1 | # 产生小数矩阵 |
numpy保留小数点后一位
1 | # out: optional |
Scipy笔记
求解正态分布
可以使用scipy.stats.norm求解正态分布,示例如下:
1 | import numpy as np |
运行结果如下:1
2[[0.09472978 0.11983675 0.13478507]
[0.13478507 0.11983675 0.09472978]]