目录
创建时间索引
1
| dates = pd.date_range('20140729',periods=6)
|
创建6*4的数据
randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列
1
| df = pd.DateFrame(np.random.randn(6,4),index=dates,columns=list('ABCD'))
|
使用字典来创建数据框,创建一个列名为A的数据框,索引是自动创建的整数
1 2
| df2 = pd.DateFrame({'A':np.random.randn(6),}) print(df2)
|
字典创建DataFrame的例子
1 2
| df2 = pd.DataFrame({'A':pd.Timestamp('20140729'),'B':pd.Series(1),}) print(df2)
|
字典内的数据长度不同,以最长的数据为准,比如B列有4行
1 2
| df2 = pd.DataFrame({'A':pd.Timestamp('20140729'),'B':pd.Series(1,index=list(range(4)))) print(df2)
|
查看各行的数据格式
使用head查看前几行数据,可以指定前几行
使用tail查看后5行数据
查看数据框的索引
查看列明用columns
查看数据值,用values
查看描述性统计,用describe
使用type看一下输出的描述性统计是什么样的数据类型 - DataFrame数据
使用T来转置数据,也就是行列转换
对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序