书闪笔记
书闪文章
IT
python3.X - 数据分析 - Pandas
前置方法 - 打印优化设置
1
pandas教程 - 非常详细版
2
Pandas - 概述、安装、下载
3
数据结构 - 列型 - Series()
4
数据结构 - 表格型 - DataFrame()
5
前置方法 - 打印优化设置
6
导入数据 - pd.DataFrame(data) - 读[]list
7
导入数据 - pd.read_csv() - 读CSV文件
8
导入数据 - pd.read_excel(filename) - 读Excel文件
9
导入数据 - pd.read_sql(query, conobject) - 读sql
10
导入数据 - pd.read_json(jsonstr) - 读json字符串
11
导入数据 - pd.read_html(url) - 解析URL或HTML
12
导入数据 - pd.read_clipboard() - 粘贴板获取内容
13
导入数据 - pd.read_xml() - XML
14
创建DataFrame - 数据DataFrame
15
创建DataFrame - 空DataFrame、方法流通
16
重要概念 - inplace=True - 原df修改
17
数据类型 - int64、float64、bool、datetime64
18
数据类型 - pd.Timestamp() - 时间
19
数据类型 - pd.Timedelta() - 时长
20
数据类型 - print(df.dtypes) - 查看数据类型
21
重要函数 - apply(fun) - 传入方法
22
转换 - df["列"].apply() - 字段是list转多行
23
转换 - df.explode("要拆的列") - 字段是list转多行
24
转换 - df["列"].apply() - 字段是dict转成多列
25
转换 - pd.melt() - 多列转多行
26
转换 - pd.pivot() - 多行转多列
27
转换 - 多列合并
28
判断 - if df.empty: - Data Frame 是否为空
29
DataFrame信息 - df.shape[0] - [0]行数、[1]列数
30
DataFrame信息 - list(data) - 全部列名
31
DataFrame信息 - df.info() - 数据集的数据类型
32
DataFrame信息 - df.describe() - 描述
33
列级 - df["新列名"] = 0 - 新增列和基础值
34
列级 - df[""] = df[""].xx - 数据截取、数据转换日期
35
列级 - astype("float64") - 替换数据类型
36
列级 - df.set_index("columns") - 列转索引
37
列级 - df.reset_index() - 索引转列
38
列级 - df.reset_index() - 索引重置
39
列级 - df_new = df.rename() - 列改名
40
列级 - df.columns=["a","b"] - 重命名列名
41
列级 - df.drop() - 删除列
42
行级 - df.append(s) - 增加行
43
行级 - df.drop() - 删除行,清空
44
内容 - sort_value() - 排序
45
内容 - df.drop_duplicate() - 去重
46
内容 - df.dropna() - 删除所有包含空值的行
47
内容 - str.replace() - 替换
48
内容 - df.where() - NaN转换为None
49
内容 - df.fillna() - NaN转换
50
内容 - python语法判空
51
选择数据 - random_rows = df.sample(3) - 随机3行
52
选择数据 - df[] - python切片
53
选择数据 - df.loc[:,:] - 行名,列名 - 时间范围
54
选择数据 - df.nlargest() - 最大最小时间
55
选择数据 - df.iloc[:,:] - 行index,列index
56
选择数据 - df[] - df[选择指定列]
57
选择数据 - df[][] - df[选择指定列][筛选条件]
58
选择数据 - df[df["A"] == "a"]] - 列A等于a的数据
59
获得数据值 - 选择后.index[0] - index
60
for - for循环 - 较慢不建议用
61
分组 - df.groupby(by="A列") - 分组
62
运算 - df["A"].value_counts() - 按a列数量统计
63
运算 - 选择后.sum() - 求和
64
运算 - 选择后.mean() - 平均值
65
运算 - df["C"]=df["A"]-df["B"]
66
运算 - df.agg() - 聚合运算
67
修改数据 - 选择数据 = 修改值
68
合并数据 - df1.append(df2) - df2加到df1的尾
69
合并数据 - pd.concat([df1,df2,df3]) - 多表合并
70
合并数据 - df3=df1.add(df2) - 加法运算合并
71
合并数据 - df.merge() - 多功能合并
72
整理 - df = df[["A","B"]] - 重排列
73
整理 - df.round({}) - 小数点后2位
74
导出数据 - df. to_dict() - dict{}
75
导出数据 - df. tolist() - list[]
76
导出数据 - df.to_csv() - CSV文件
77
导出数据 - df.to_excel(filename) - Excel文件
78
导出数据 - df.to_sql() - mysql数据库
79
导出数据 - df.to_json(filename) - Json格式到文本
80
导出数据 - df.to_html() - HTML
81
导出数据 - df.to_xml() - XML
82
导出数据 - df. to_markdown() - markdown
83
matplotlib - 配置显示图表
84
matplotlib - plt.subplot(,,) - 行,列,按列第几个
85
matplotlib - plt.plot(,,) - 显示图表
86
matplotlib - plt.xlabel(“”) - X/Y轴名字
87
matplotlib - plt.title(“”) - 标题
88
matplotlib - plt.legend() - label小图示
89
提升 - 数据分析方法
请支付后查看内容
本内容为付费内容,支付后即可解锁全部精彩内容。
前往支付
如已支付,请刷新页面
pandas print