1 | | 置顶帖 - 本帖收集增加的内容 | 公开 | | |
---|
2 | | 置顶帖 - 本帖收集增加的内容 | 公开 | | |
---|
3 | | pandas教程 - 非常详细版 | 公开 | | |
---|
4 | | pandas教程 - 详细版 | 公开 | | |
---|
5 | | Anaconda - 安装 | 公开 | | |
---|
6 | | Jupyter-notebook - Jupyter-notebook | 公开 | | |
---|
7 | | Pandas - 概述、安装、下载 | 公开 | |  |
---|
8 | | 数据结构 - 列型 - Series() | 公开 | | .png&w=128&q=75) |
---|
9 | | 数据结构 - 表格型 - DataFrame() | 公开 | | .png&w=128&q=75) |
---|
10 | | 前置方法 - 打印优化设置 | 公开 | |  |
---|
11 | | 导入数据 - pd.DataFrame(data) - 读[]list | 公开 | | ![导入数据 - pd.DataFrame(data) - 读[]list](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202b6%2F%E5%AF%BC%E5%85%A5%E6%95%B0%E6%8D%AE-pd.DataFrame(data)-%E8%AF%BB%5B%5Dlist.png&w=128&q=75) |
---|
12 | | 导入数据 - pd.read_csv() - 读CSV文件 | 公开 | | -%E8%AF%BBCSV%E6%96%87%E4%BB%B6.png&w=128&q=75) |
---|
13 | | 导入数据 - pd.read_table(fname) - 读定分隔符文本 | 公开 | | |
---|
14 | | 导入数据 - pd.read_excel(filename) - 读Excel文件 | 公开 | | -%E8%AF%BBExcel%E6%96%87%E4%BB%B6.png&w=128&q=75) |
---|
15 | | 导入数据 - pd.read_sql(query, conobject) - 读sql | 公开 | | -%E8%AF%BBsql.png&w=128&q=75) |
---|
16 | | 导入数据 - pd.read_json(jsonstr) - 读json字符串 | 公开 | | -%E8%AF%BBjson%E5%AD%97%E7%AC%A6%E4%B8%B2.png&w=128&q=75) |
---|
17 | | 导入数据 - pd.read_html(url) - 解析URL或HTML | 公开 | | -%E8%A7%A3%E6%9E%90URL%E6%88%96HTML.png&w=128&q=75) |
---|
18 | | 导入数据 - pd.read_clipboard() - 粘贴板获取内容 | 公开 | | -%E7%B2%98%E8%B4%B4%E6%9D%BF%E8%8E%B7%E5%8F%96%E5%86%85%E5%AE%B9.png&w=128&q=75) |
---|
19 | | 导入数据 - pd.read_xml() - XML | 公开 | | -XML.png&w=128&q=75) |
---|
20 | | 创建DataFrame - 数据DataFrame | 公开 | |  |
---|
21 | | 创建DataFrame - 空DataFrame、方法流通 | 公开 | |  |
---|
22 | | 重要概念 - inplace=True - 原df修改 | 公开 | |  |
---|
23 | | 数据类型 - int64、float64、bool、datetime64 | 公开 | |  |
---|
24 | | 数据类型 - pd.Timestamp() - 时间 | 公开 | | -%E6%97%B6%E9%97%B4.png&w=128&q=75) |
---|
25 | | 数据类型 - pd.Timedelta() - 时长 | 公开 | | -%E6%97%B6%E9%95%BF.png&w=128&q=75) |
---|
26 | | 数据类型 - print(df.dtypes) - 查看数据类型 | 公开 | | -%E6%9F%A5%E7%9C%8B%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B.png&w=128&q=75) |
---|
27 | | 重要函数 - apply(fun) - 传入方法 | 公开 | | -%E4%BC%A0%E5%85%A5%E6%96%B9%E6%B3%95.png&w=128&q=75) |
---|
28 | | 转换 - df["列"].apply() - 字段是list转多行 | 公开 | | ![转换 - df["列"].apply() - 字段是list转多行](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f120302%2F%E8%BD%AC%E6%8D%A2-df%5B_%E5%88%97_%5D.apply()-%E5%AD%97%E6%AE%B5%E6%98%AFlist%E8%BD%AC%E5%A4%9A%E8%A1%8C.png&w=128&q=75) |
---|
29 | | 转换 - df.explode("要拆的列") - 字段是list转多行 | 公开 | | -%E5%AD%97%E6%AE%B5%E6%98%AFlist%E8%BD%AC%E5%A4%9A%E8%A1%8C.png&w=128&q=75) |
---|
30 | | 转换 - df["列"].apply() - 字段是dict转成多列 | 公开 | | ![转换 - df["列"].apply() - 字段是dict转成多列](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202d1%2F%E8%BD%AC%E6%8D%A2-df%5B_%E5%88%97_%5D.apply()-%E5%AD%97%E6%AE%B5%E6%98%AFdict%E8%BD%AC%E6%88%90%E5%A4%9A%E5%88%97.png&w=128&q=75) |
---|
31 | | 转换 - pd.melt() - 多列转多行 | 公开 | | -%E5%A4%9A%E5%88%97%E8%BD%AC%E5%A4%9A%E8%A1%8C.png&w=128&q=75) |
---|
32 | | 转换 - pd.pivot() - 多行转多列 | 公开 | | -%E5%A4%9A%E8%A1%8C%E8%BD%AC%E5%A4%9A%E5%88%97.png&w=128&q=75) |
---|
33 | | 转换 - 多列合并 | 公开 | |  |
---|
34 | | 判断 - if df.empty: - Data Frame 是否为空 | 公开 | |  |
---|
35 | | DataFrame信息 - df.shape[0] - [0]行数、[1]列数 | 公开 | | ![DataFrame信息 - df.shape[0] - [0]行数、[1]列数](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202ef%2FDataFrame%E4%BF%A1%E6%81%AF-df.shape%5B0%5D-%5B0%5D%E8%A1%8C%E6%95%B0%E3%80%81%5B1%5D%E5%88%97%E6%95%B0.png&w=128&q=75) |
---|
36 | | DataFrame信息 - list(data) - 全部列名 | 公开 | | -%E5%85%A8%E9%83%A8%E5%88%97%E5%90%8D.png&w=128&q=75) |
---|
37 | | DataFrame信息 - df.info() - 数据集的数据类型 | 公开 | | -%E6%95%B0%E6%8D%AE%E9%9B%86%E7%9A%84%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B.png&w=128&q=75) |
---|
38 | | DataFrame信息 - df.describe() - 描述 | 公开 | | -%E6%8F%8F%E8%BF%B0.png&w=128&q=75) |
---|
39 | | 列级 - df["新列名"] = 0 - 新增列和基础值 | 公开 | | ![列级 - df["新列名"] = 0 - 新增列和基础值](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202d5%2F%E5%88%97%E7%BA%A7-df%5B_%E6%96%B0%E5%88%97%E5%90%8D_%5D%3D0-%E6%96%B0%E5%A2%9E%E5%88%97%E5%92%8C%E5%9F%BA%E7%A1%80%E5%80%BC.png&w=128&q=75) |
---|
40 | | 列级 - df[""] = df[""].xx - 数据截取、数据转换日期 | 公开 | | ![列级 - df[""] = df[""].xx - 数据截取、数据转换日期](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202ce%2F%E5%88%97%E7%BA%A7-df%5B__%5D%3Ddf%5B__%5D.xx-%E6%95%B0%E6%8D%AE%E6%88%AA%E5%8F%96%E3%80%81%E6%95%B0%E6%8D%AE%E8%BD%AC%E6%8D%A2%E6%97%A5%E6%9C%9F.png&w=128&q=75) |
---|
41 | | 列级 - astype("float64") - 替换数据类型 | 公开 | | -%E6%9B%BF%E6%8D%A2%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B.png&w=128&q=75) |
---|
42 | | 列级 - df.set_index("columns") - 列转索引 | 公开 | | -%E5%88%97%E8%BD%AC%E7%B4%A2%E5%BC%95.png&w=128&q=75) |
---|
43 | | 列级 - df.reset_index() - 索引转列 | 公开 | | -%E7%B4%A2%E5%BC%95%E8%BD%AC%E5%88%97.png&w=128&q=75) |
---|
44 | | 列级 - df.reset_index() - 索引重置 | 公开 | | -%E7%B4%A2%E5%BC%95%E9%87%8D%E7%BD%AE.png&w=128&q=75) |
---|
45 | | 列级 - df_new = df.rename() - 列改名 | 公开 | | -%E5%88%97%E6%94%B9%E5%90%8D.png&w=128&q=75) |
---|
46 | | 列级 - df.columns=["a","b"] - 重命名列名 | 公开 | | ![列级 - df.columns=["a","b"] - 重命名列名](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202b7%2F%E5%88%97%E7%BA%A7-df.columns%3D%5B_a_%2C_b_%5D-%E9%87%8D%E5%91%BD%E5%90%8D%E5%88%97%E5%90%8D.png&w=128&q=75) |
---|
47 | | 列级 - df.drop() - 删除列 | 公开 | | -%E5%88%A0%E9%99%A4%E5%88%97.png&w=128&q=75) |
---|
48 | | 行级 - df.append(s) - 增加行 | 公开 | | -%E5%A2%9E%E5%8A%A0%E8%A1%8C.png&w=128&q=75) |
---|
49 | | 行级 - df.drop() - 删除行,清空 | 公开 | | -%E5%88%A0%E9%99%A4%E8%A1%8C%EF%BC%8C%E6%B8%85%E7%A9%BA.png&w=128&q=75) |
---|
50 | | 内容 - sort_value() - 排序 | 公开 | | -%E6%8E%92%E5%BA%8F.png&w=128&q=75) |
---|
51 | | 内容 - df.drop_duplicate() - 去重 | 公开 | | -%E5%8E%BB%E9%87%8D.png&w=128&q=75) |
---|
52 | | 内容 - df.dropna() - 删除所有包含空值的行 | 公开 | | -%E5%88%A0%E9%99%A4%E6%89%80%E6%9C%89%E5%8C%85%E5%90%AB%E7%A9%BA%E5%80%BC%E7%9A%84%E8%A1%8C.png&w=128&q=75) |
---|
53 | | 内容 - str.replace() - 替换 | 公开 | | -%E6%9B%BF%E6%8D%A2.png&w=128&q=75) |
---|
54 | | 内容 - df.where() - NaN转换为None | 公开 | | -NaN%E8%BD%AC%E6%8D%A2%E4%B8%BANone.png&w=128&q=75) |
---|
55 | | 内容 - df.fillna() - NaN转换 | 公开 | | -NaN%E8%BD%AC%E6%8D%A2.png&w=128&q=75) |
---|
56 | | 内容 - python语法判空 | 公开 | |  |
---|
57 | | 选择数据 - random_rows = df.sample(3) - 随机3行 | 公开 | | -%E9%9A%8F%E6%9C%BA3%E8%A1%8C.png&w=128&q=75) |
---|
58 | | 选择数据 - df[] - python切片 | 公开 | | ![选择数据 - df[] - python切片](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202fe%2F%E9%80%89%E6%8B%A9%E6%95%B0%E6%8D%AE-df%5B%5D-python%E5%88%87%E7%89%87.png&w=128&q=75) |
---|
59 | | 选择数据 - df.loc[:,:] - 行名,列名 - 时间范围 | 公开 | | ![选择数据 - df.loc[:,:] - 行名,列名 - 时间范围](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202bb%2F%E9%80%89%E6%8B%A9%E6%95%B0%E6%8D%AE-df.loc%5B%2C%5D-%E8%A1%8C%E5%90%8D%2C%E5%88%97%E5%90%8D-%E6%97%B6%E9%97%B4%E8%8C%83%E5%9B%B4.png&w=128&q=75) |
---|
60 | | 选择数据 - df.nlargest() - 最大最小时间 | 公开 | | -%E6%9C%80%E5%A4%A7%E6%9C%80%E5%B0%8F%E6%97%B6%E9%97%B4.png&w=128&q=75) |
---|
61 | | 选择数据 - df.iloc[:,:] - 行index,列index | 公开 | | ![选择数据 - df.iloc[:,:] - 行index,列index](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202bc%2F%E9%80%89%E6%8B%A9%E6%95%B0%E6%8D%AE-df.iloc%5B%2C%5D-%E8%A1%8Cindex%2C%E5%88%97index.png&w=128&q=75) |
---|
62 | | 选择数据 - df[] - df[选择指定列] | 公开 | | ![选择数据 - df[] - df[选择指定列]](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202b4%2F%E9%80%89%E6%8B%A9%E6%95%B0%E6%8D%AE-df%5B%5D-df%5B%E9%80%89%E6%8B%A9%E6%8C%87%E5%AE%9A%E5%88%97%5D.png&w=128&q=75) |
---|
63 | | 选择数据 - df[][] - df[选择指定列][筛选条件] | 公开 | | ![选择数据 - df[][] - df[选择指定列][筛选条件]](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202b8%2F%E9%80%89%E6%8B%A9%E6%95%B0%E6%8D%AE-df%5B%5D%5B%5D-df%5B%E9%80%89%E6%8B%A9%E6%8C%87%E5%AE%9A%E5%88%97%5D%5B%E7%AD%9B%E9%80%89%E6%9D%A1%E4%BB%B6%5D.png&w=128&q=75) |
---|
64 | | 选择数据 - df[df["A"] == "a"]] - 列A等于a的数据 | 公开 | | ![选择数据 - df[df["A"] == "a"]] - 列A等于a的数据](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202d2%2F%E9%80%89%E6%8B%A9%E6%95%B0%E6%8D%AE-df%5Bdf%5B_A_%5D%3D%3D_a_%5D%5D-%E5%88%97A%E7%AD%89%E4%BA%8Ea%E7%9A%84%E6%95%B0%E6%8D%AE.png&w=128&q=75) |
---|
65 | | 获得数据值 - 选择后.index[0] - index | 公开 | | ![获得数据值 - 选择后.index[0] - index](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202cf%2F%E8%8E%B7%E5%BE%97%E6%95%B0%E6%8D%AE%E5%80%BC-%E9%80%89%E6%8B%A9%E5%90%8E.index%5B0%5D-index.png&w=128&q=75) |
---|
66 | | for - for循环 - 较慢不建议用 | 公开 | |  |
---|
67 | | 分组 - df.groupby(by="A列") - 分组 | 公开 | | -%E5%88%86%E7%BB%84.png&w=128&q=75) |
---|
68 | | 运算 - df["A"].value_counts() - 按a列数量统计 | 公开 | | ![运算 - df["A"].value_counts() - 按a列数量统计](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f120300%2F%E8%BF%90%E7%AE%97-df%5B_A_%5D.value_counts()-%E6%8C%89a%E5%88%97%E6%95%B0%E9%87%8F%E7%BB%9F%E8%AE%A1.png&w=128&q=75) |
---|
69 | | 运算 - 选择后.sum() - 求和 | 公开 | | -%E6%B1%82%E5%92%8C.png&w=128&q=75) |
---|
70 | | 运算 - 选择后.mean() - 平均值 | 公开 | | -%E5%B9%B3%E5%9D%87%E5%80%BC.png&w=128&q=75) |
---|
71 | | 运算 - df["C"]=df["A"]-df["B"] | 公开 | | |
---|
72 | | 运算 - df.agg() - 聚合运算 | 公开 | | -%E8%81%9A%E5%90%88%E8%BF%90%E7%AE%97.png&w=128&q=75) |
---|
73 | | 修改数据 - 选择数据 = 修改值 | 公开 | |  |
---|
74 | | 合并数据 - df1.append(df2) - df2加到df1的尾 | 公开 | | -df2%E5%8A%A0%E5%88%B0df1%E7%9A%84%E5%B0%BE.png&w=128&q=75) |
---|
75 | | 合并数据 - pd.concat([df1,df2,df3]) - 多表合并 | 公开 | | ![合并数据 - pd.concat([df1,df2,df3]) - 多表合并](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202be%2F%E5%90%88%E5%B9%B6%E6%95%B0%E6%8D%AE-pd.concat(%5Bdf1%2Cdf2%2Cdf3%5D)-%E5%A4%9A%E8%A1%A8%E5%90%88%E5%B9%B6.png&w=128&q=75) |
---|
76 | | 合并数据 - df3=df1.add(df2) - 加法运算合并 | 公开 | | -%E5%8A%A0%E6%B3%95%E8%BF%90%E7%AE%97%E5%90%88%E5%B9%B6.png&w=128&q=75) |
---|
77 | | 合并数据 - df.merge() - 多功能合并 | 公开 | | -%E5%A4%9A%E5%8A%9F%E8%83%BD%E5%90%88%E5%B9%B6.png&w=128&q=75) |
---|
78 | | 整理 - df = df[["A","B"]] - 重排列 | 公开 | | ![整理 - df = df[["A","B"]] - 重排列](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202f3%2F%E6%95%B4%E7%90%86-df%3Ddf%5B%5B_A_%2C_B_%5D%5D-%E9%87%8D%E6%8E%92%E5%88%97.png&w=128&q=75) |
---|
79 | | 整理 - df.round({}) - 小数点后2位 | 公开 | | -%E5%B0%8F%E6%95%B0%E7%82%B9%E5%90%8E2%E4%BD%8D.png&w=128&q=75) |
---|
80 | | 导出数据 - df. to_dict() - dict{} | 公开 | | -dict%7B%7D.png&w=128&q=75) |
---|
81 | | 导出数据 - df. tolist() - list[] | 公开 | | ![导出数据 - df. tolist() - list[]](/_next/image?url=https%3A%2F%2Fbookchips.com%2Fchips%2F6850eb130b9569655f1202fc%2F%E5%AF%BC%E5%87%BA%E6%95%B0%E6%8D%AE-df.tolist()-list%5B%5D.png&w=128&q=75) |
---|
82 | | 导出数据 - df.to_csv() - CSV文件 | 公开 | | -CSV%E6%96%87%E4%BB%B6.png&w=128&q=75) |
---|
83 | | 导出数据 - df.to_excel(filename) - Excel文件 | 公开 | | -Excel%E6%96%87%E4%BB%B6.png&w=128&q=75) |
---|
84 | | 导出数据 - df.to_sql() - mysql数据库 | 公开 | | -mysql%E6%95%B0%E6%8D%AE%E5%BA%93.png&w=128&q=75) |
---|
85 | | 导出数据 - df.to_json(filename) - Json格式到文本 | 公开 | | -Json%E6%A0%BC%E5%BC%8F%E5%88%B0%E6%96%87%E6%9C%AC.png&w=128&q=75) |
---|
86 | | 导出数据 - df.to_html() - HTML | 公开 | | -HTML.png&w=128&q=75) |
---|
87 | | 导出数据 - df.to_xml() - XML | 公开 | | -XML.png&w=128&q=75) |
---|
88 | | 导出数据 - df. to_markdown() - markdown | 公开 | | -markdown.png&w=128&q=75) |
---|
89 | | matplotlib - 配置显示图表 | 公开 | | |
---|
90 | | matplotlib - plt.subplot(,,) - 行,列,按列第几个 | 公开 | | |
---|
91 | | matplotlib - plt.plot(,,) - 显示图表 | 公开 | | |
---|
92 | | matplotlib - plt.xlabel(“”) - X/Y轴名字 | 公开 | | |
---|
93 | | matplotlib - plt.title(“”) - 标题 | 公开 | | |
---|
94 | | matplotlib - plt.legend() - label小图示 | 公开 | | |
---|
95 | | 提升 - 数据分析方法 | 公开 | | |
---|