对python中的pandas库使用的总结
1、DataFrame对象:
这个对象可以看成是Series组成 的字典,也就是在外形上二者较为相似。如下图:
import pandas as pn
data={'color':['blue','green','yellow','red','NaN'],
'object':['ball','pen','pencil','paper','pen'],'price':[1.2,1.3,1.6,.4,1.2]}
fram =pn.DataFrame(data)
print(fram)
fram=pn.DataFrame(data,columns=['object','price'])#选取列值
print(fram)
fram=pn.DataFrame(data)
print(fram.loc[2],fram.loc[3])#输出第2,第3行
print(fram.loc[[2,4]])#输出第2,第4行
print(fram[2:4])#输出第2,第3行
在实验中,我们会发现其实这个东西我们输入的时候,必须各行都是长度一致的。也就是说,我们第一行如果有4个数据,第二行也得有4个数据,如果我们实际只有三个,那就输入一个NaN。如果空着话,程序是会报错的。