hand
_1_21_3
4
python3.X - 数据分析 - Pandas
共95篇
python3.X - 数据分析 - Pandas
返回栏目
1k
0k
5k
0k
0.1k
0k
2k
3k
1k
1k
0.2k
3k
0k
4k
3k
3k
3k
3k
0.5k
5k
1k
0.3k
3k
4k
7k
2k
7k
0.8k
0.9k
1k
1k
2k
0.4k
0.6k
0.6k
0.5k
0.9k
0.9k
1k
0.9k
1k
0.8k
1k
0.4k
0.4k
0.3k
0.6k
1k
0.9k
1k
1k
1k
0.8k
1k
0.8k
1k
0.7k
0.6k
4k
0.4k
3k
0.7k
0.8k
0.8k
0.2k
2k
1k
0.7k
0.7k
0.4k
0.5k
3k
0.1k
0.7k
0.9k
0.3k
1k
0.4k
0.4k
1k
0.5k
0.1k
0.7k
1k
0k
0.2k
0.7k
0.3k
0k
0k
0.1k
0k
0k
0k
3k
返回python3.X - 数据分析 - Pandas栏目
作者:
贺及楼
成为作者
更新日期:2024-08-14 11:13:04
DataFrame是表格型数据结构,包含一组有序的列,每列可以是不同的值类型。
DataFrame有行索引和列索引,可以看成由Series组成的字典。
Pandas 的 DataFrame 是一个二维标签化数据结构,可以将其想象为一个 Excel 电子表格或 SQL 数据库中的表,其中有行和列。DataFrame 是 Pandas 中用于存储和操作结构化数据的主要工具。
import numpy as np
import pandas as pd
from datetime import datetime as dt
# 通过字典创建DataFrame
df_1=pd.DataFrame({'A':1.0,
'B':pd.Timestamp(2019,8,19),
'C':pd.Series(1,index=list(range(4)),dtype='float32'),
'D':np.array([3]*4,dtype='int32'),
'E':pd.Categorical(['test','train','test','train']),
'F':'foo'})
A | B | C | D | E | F | |
---|---|---|---|---|---|---|
0 | 1.0 | 2019-08-19 | 1.0 | 3 | test | foo |
1 | 1.0 | 2019-08-19 | 1.0 | 3 | train | foo |
2 | 1.0 | 2019-08-19 | 1.0 | 3 | test | foo |
3 | 1.0 | 2019-08-19 | 1.0 | 3 | train | foo |
df_1.index # 返回行的序号
Int64Index([0, 1, 2, 3], dtype='int64')
df_1.columns # 返回列的序号名字
Index(['A', 'B', 'C', 'D', 'E', 'F'], dtype='object')
df_1.values # 把每个值进行打印出来
[[1.0 Timestamp('2019-08-19 00:00:00') 1.0 3 'test' 'foo']
[1.0 Timestamp('2019-08-19 00:00:00') 1.0 3 'train' 'foo']
[1.0 Timestamp('2019-08-19 00:00:00') 1.0 3 'test' 'foo']
[1.0 Timestamp('2019-08-19 00:00:00') 1.0 3 'train' 'foo']]
df_1.T # 翻转数据
0 | 1 | 2 | 3 | |
---|---|---|---|---|
A | 1 | 1 | 1 | 1 |
B | 2019-08-19 00:00:00 | 2019-08-19 00:00:00 | 2019-08-19 00:00:00 | 2019-08-19 00:00:00 |
C | 1 | 1 | 1 | 1 |
D | 3 | 3 | 3 | 3 |
E | test | train | test | train |
F | foo | foo | foo | foo |
python3.X - 数据分析 - Pandas
整章节共95节
快分享给你的小伙伴吧 ~