书闪笔记
书闪文章
IT
python3.X - 数据分析 - Pandas
pandas教程 - 详细版
1
置顶帖 - 本帖收集增加的内容
公开
2
置顶帖 - 本帖收集增加的内容
公开
3
pandas教程 - 非常详细版
公开
4
pandas教程 - 详细版
公开
5
Anaconda - 安装
公开
6
Jupyter-notebook - Jupyter-notebook
公开
7
Pandas - 概述、安装、下载
公开
8
数据结构 - 列型 - Series()
公开
9
数据结构 - 表格型 - DataFrame()
公开
10
前置方法 - 打印优化设置
公开
11
导入数据 - pd.DataFrame(data) - 读[]list
公开
12
导入数据 - pd.read_csv() - 读CSV文件
公开
13
导入数据 - pd.read_table(fname) - 读定分隔符文本
公开
14
导入数据 - pd.read_excel(filename) - 读Excel文件
公开
15
导入数据 - pd.read_sql(query, conobject) - 读sql
公开
16
导入数据 - pd.read_json(jsonstr) - 读json字符串
公开
17
导入数据 - pd.read_html(url) - 解析URL或HTML
公开
18
导入数据 - pd.read_clipboard() - 粘贴板获取内容
公开
19
导入数据 - pd.read_xml() - XML
公开
20
创建DataFrame - 数据DataFrame
公开
21
创建DataFrame - 空DataFrame、方法流通
公开
22
重要概念 - inplace=True - 原df修改
公开
23
数据类型 - int64、float64、bool、datetime64
公开
24
数据类型 - pd.Timestamp() - 时间
公开
25
数据类型 - pd.Timedelta() - 时长
公开
26
数据类型 - print(df.dtypes) - 查看数据类型
公开
27
重要函数 - apply(fun) - 传入方法
公开
28
转换 - df["列"].apply() - 字段是list转多行
公开
29
转换 - df.explode("要拆的列") - 字段是list转多行
公开
30
转换 - df["列"].apply() - 字段是dict转成多列
公开
31
转换 - pd.melt() - 多列转多行
公开
32
转换 - pd.pivot() - 多行转多列
公开
33
转换 - 多列合并
公开
34
判断 - if df.empty: - Data Frame 是否为空
公开
35
DataFrame信息 - df.shape[0] - [0]行数、[1]列数
公开
36
DataFrame信息 - list(data) - 全部列名
公开
37
DataFrame信息 - df.info() - 数据集的数据类型
公开
38
DataFrame信息 - df.describe() - 描述
公开
39
列级 - df["新列名"] = 0 - 新增列和基础值
公开
40
列级 - df[""] = df[""].xx - 数据截取、数据转换日期
公开
41
列级 - astype("float64") - 替换数据类型
公开
42
列级 - df.set_index("columns") - 列转索引
公开
43
列级 - df.reset_index() - 索引转列
公开
44
列级 - df.reset_index() - 索引重置
公开
45
列级 - df_new = df.rename() - 列改名
公开
46
列级 - df.columns=["a","b"] - 重命名列名
公开
47
列级 - df.drop() - 删除列
公开
48
行级 - df.append(s) - 增加行
公开
49
行级 - df.drop() - 删除行,清空
公开
50
内容 - sort_value() - 排序
公开
51
内容 - df.drop_duplicate() - 去重
公开
52
内容 - df.dropna() - 删除所有包含空值的行
公开
53
内容 - str.replace() - 替换
公开
54
内容 - df.where() - NaN转换为None
公开
55
内容 - df.fillna() - NaN转换
公开
56
内容 - python语法判空
公开
57
选择数据 - random_rows = df.sample(3) - 随机3行
公开
58
选择数据 - df[] - python切片
公开
59
选择数据 - df.loc[:,:] - 行名,列名 - 时间范围
公开
60
选择数据 - df.nlargest() - 最大最小时间
公开
61
选择数据 - df.iloc[:,:] - 行index,列index
公开
62
选择数据 - df[] - df[选择指定列]
公开
63
选择数据 - df[][] - df[选择指定列][筛选条件]
公开
64
选择数据 - df[df["A"] == "a"]] - 列A等于a的数据
公开
65
获得数据值 - 选择后.index[0] - index
公开
66
for - for循环 - 较慢不建议用
公开
67
分组 - df.groupby(by="A列") - 分组
公开
68
运算 - df["A"].value_counts() - 按a列数量统计
公开
69
运算 - 选择后.sum() - 求和
公开
70
运算 - 选择后.mean() - 平均值
公开
71
运算 - df["C"]=df["A"]-df["B"]
公开
72
运算 - df.agg() - 聚合运算
公开
73
修改数据 - 选择数据 = 修改值
公开
74
合并数据 - df1.append(df2) - df2加到df1的尾
公开
75
合并数据 - pd.concat([df1,df2,df3]) - 多表合并
公开
76
合并数据 - df3=df1.add(df2) - 加法运算合并
公开
77
合并数据 - df.merge() - 多功能合并
公开
78
整理 - df = df[["A","B"]] - 重排列
公开
79
整理 - df.round({}) - 小数点后2位
公开
80
导出数据 - df. to_dict() - dict{}
公开
81
导出数据 - df. tolist() - list[]
公开
82
导出数据 - df.to_csv() - CSV文件
公开
83
导出数据 - df.to_excel(filename) - Excel文件
公开
84
导出数据 - df.to_sql() - mysql数据库
公开
85
导出数据 - df.to_json(filename) - Json格式到文本
公开
86
导出数据 - df.to_html() - HTML
公开
87
导出数据 - df.to_xml() - XML
公开
88
导出数据 - df. to_markdown() - markdown
公开
89
matplotlib - 配置显示图表
公开
90
matplotlib - plt.subplot(,,) - 行,列,按列第几个
公开
91
matplotlib - plt.plot(,,) - 显示图表
公开
92
matplotlib - plt.xlabel(“”) - X/Y轴名字
公开
93
matplotlib - plt.title(“”) - 标题
公开
94
matplotlib - plt.legend() - label小图示
公开
95
提升 - 数据分析方法
公开
pandas教程 - 详细版
请在此开始你的创作