微信登录

python3.X - 数据分析 - Pandas

图标标题权限标签图片
1置顶帖 - 本帖收集增加的内容公开
2置顶帖 - 本帖收集增加的内容公开
3pandas教程 - 非常详细版公开
4pandas教程 - 详细版公开
5Anaconda - 安装公开
6Jupyter-notebook - Jupyter-notebook公开
7Pandas - 概述、安装、下载公开
Pandas - 概述、安装、下载
8数据结构 - 列型 - Series()公开
数据结构 - 列型 - Series()
9数据结构 - 表格型 - DataFrame()公开
数据结构 - 表格型 - DataFrame()
10前置方法 - 打印优化设置公开
前置方法 - 打印优化设置
11导入数据 - pd.DataFrame(data) - 读[]list公开
导入数据 - pd.DataFrame(data) - 读[]list
12导入数据 - pd.read_csv() - 读CSV文件公开
导入数据 - pd.read_csv() - 读CSV文件
13导入数据 - pd.read_table(fname) - 读定分隔符文本公开
14导入数据 - pd.read_excel(filename) - 读Excel文件公开
导入数据 - pd.read_excel(filename) - 读Excel文件
15导入数据 - pd.read_sql(query, conobject) - 读sql公开
导入数据 - pd.read_sql(query, conobject) - 读sql
16导入数据 - pd.read_json(jsonstr) - 读json字符串公开
导入数据 - pd.read_json(jsonstr) - 读json字符串
17导入数据 - pd.read_html(url) - 解析URL或HTML公开
导入数据 - pd.read_html(url) - 解析URL或HTML
18导入数据 - pd.read_clipboard() - 粘贴板获取内容公开
导入数据 - pd.read_clipboard() - 粘贴板获取内容
19导入数据 - pd.read_xml() - XML公开
导入数据 - pd.read_xml() - XML
20创建DataFrame - 数据DataFrame公开
创建DataFrame - 数据DataFrame
21创建DataFrame - 空DataFrame、方法流通公开
创建DataFrame - 空DataFrame、方法流通
22重要概念 - inplace=True - 原df修改公开
重要概念 - inplace=True - 原df修改
23数据类型 - int64、float64、bool、datetime64公开
数据类型 - int64、float64、bool、datetime64
24数据类型 - pd.Timestamp() - 时间公开
数据类型 - pd.Timestamp() - 时间
25数据类型 - pd.Timedelta() - 时长公开
数据类型 - pd.Timedelta() - 时长
26数据类型 - print(df.dtypes) - 查看数据类型公开
数据类型 - print(df.dtypes) - 查看数据类型
27重要函数 - apply(fun) - 传入方法公开
重要函数 - apply(fun) - 传入方法
28转换 - df["列"].apply() - 字段是list转多行公开
转换 - df["列"].apply() - 字段是list转多行
29转换 - df.explode("要拆的列") - 字段是list转多行公开
转换 - df.explode("要拆的列") - 字段是list转多行
30转换 - df["列"].apply() - 字段是dict转成多列公开
转换 - df["列"].apply() - 字段是dict转成多列
31转换 - pd.melt() - 多列转多行公开
转换 - pd.melt() - 多列转多行
32转换 - pd.pivot() - 多行转多列公开
转换 - pd.pivot() - 多行转多列
33转换 - 多列合并公开
转换 - 多列合并
34判断 - if df.empty: - Data Frame 是否为空公开
判断 - if df.empty: - Data Frame 是否为空
35DataFrame信息 - df.shape[0] - [0]行数、[1]列数公开
DataFrame信息 - df.shape[0] - [0]行数、[1]列数
36DataFrame信息 - list(data) - 全部列名公开
DataFrame信息 - list(data) - 全部列名
37DataFrame信息 - df.info() - 数据集的数据类型公开
DataFrame信息 - df.info() - 数据集的数据类型
38DataFrame信息 - df.describe() - 描述公开
DataFrame信息 - df.describe() - 描述
39列级 - df["新列名"] = 0 - 新增列和基础值公开
列级 - df["新列名"] = 0 - 新增列和基础值
40列级 - df[""] = df[""].xx - 数据截取、数据转换日期公开
列级 - df[""] = df[""].xx - 数据截取、数据转换日期
41列级 - astype("float64") - 替换数据类型公开
列级 - astype("float64") - 替换数据类型
42列级 - df.set_index("columns") - 列转索引公开
列级 - df.set_index("columns") - 列转索引
43列级 - df.reset_index() - 索引转列公开
列级 - df.reset_index() - 索引转列
44列级 - df.reset_index() - 索引重置公开
列级 - df.reset_index() - 索引重置
45列级 - df_new = df.rename() - 列改名公开
列级 - df_new = df.rename() - 列改名
46列级 - df.columns=["a","b"] - 重命名列名公开
列级 - df.columns=["a","b"] - 重命名列名
47列级 - df.drop() - 删除列公开
列级 - df.drop() - 删除列
48行级 - df.append(s) - 增加行公开
行级 - df.append(s) - 增加行
49行级 - df.drop() - 删除行,清空公开
行级 - df.drop() - 删除行,清空
50内容 - sort_value() - 排序公开
内容 - sort_value() - 排序
51内容 - df.drop_duplicate() - 去重公开
内容 - df.drop_duplicate() - 去重
52内容 - df.dropna() - 删除所有包含空值的行公开
内容 - df.dropna() - 删除所有包含空值的行
53内容 - str.replace() - 替换公开
内容 - str.replace() - 替换
54内容 - df.where() - NaN转换为None公开
内容 - df.where() - NaN转换为None
55内容 - df.fillna() - NaN转换公开
内容 - df.fillna() - NaN转换
56内容 - python语法判空公开
内容 - python语法判空
57选择数据 - random_rows = df.sample(3) - 随机3行公开
选择数据 - random_rows = df.sample(3) - 随机3行
58选择数据 - df[] - python切片公开
选择数据 - df[] - python切片
59 选择数据 - df.loc[:,:] - 行名,列名 - 时间范围公开
 选择数据 - df.loc[:,:] - 行名,列名 - 时间范围
60选择数据 - df.nlargest() - 最大最小时间公开
选择数据 - df.nlargest() - 最大最小时间
61 选择数据 - df.iloc[:,:] - 行index,列index公开
 选择数据 - df.iloc[:,:] - 行index,列index
62选择数据 - df[] - df[选择指定列]公开
选择数据 - df[] - df[选择指定列]
63选择数据 - df[][] - df[选择指定列][筛选条件]公开
选择数据 - df[][] - df[选择指定列][筛选条件]
64选择数据 - df[df["A"] == "a"]] - 列A等于a的数据公开
选择数据 - df[df["A"] == "a"]]  - 列A等于a的数据
65获得数据值 - 选择后.index[0] - index公开
获得数据值 - 选择后.index[0] - index
66for - for循环 - 较慢不建议用公开
for - for循环 - 较慢不建议用
67分组 - df.groupby(by="A列") - 分组公开
分组 - df.groupby(by="A列") - 分组
68运算 - df["A"].value_counts() - 按a列数量统计公开
运算 - df["A"].value_counts() - 按a列数量统计
69运算 - 选择后.sum() - 求和公开
运算 - 选择后.sum() - 求和
70运算 - 选择后.mean() - 平均值公开
运算 - 选择后.mean() - 平均值
71运算 - df["C"]=df["A"]-df["B"]公开
72运算 - df.agg() - 聚合运算公开
运算 - df.agg() - 聚合运算
73修改数据 - 选择数据 = 修改值公开
修改数据 - 选择数据 = 修改值
74合并数据 - df1.append(df2) - df2加到df1的尾公开
合并数据 - df1.append(df2) - df2加到df1的尾
75合并数据 - pd.concat([df1,df2,df3]) - 多表合并公开
合并数据 - pd.concat([df1,df2,df3]) - 多表合并
76合并数据 - df3=df1.add(df2) - 加法运算合并公开
合并数据 -  df3=df1.add(df2) - 加法运算合并
77合并数据 - df.merge() - 多功能合并公开
合并数据 - df.merge() - 多功能合并
78整理 - df = df[["A","B"]] - 重排列公开
整理 - df = df[["A","B"]] - 重排列
79整理 - df.round({}) - 小数点后2位公开
整理 - df.round({}) - 小数点后2位
80导出数据 - df. to_dict() - dict{}公开
导出数据 - df. to_dict() - dict{}
81导出数据 - df. tolist() - list[]公开
导出数据 - df. tolist() - list[]
82导出数据 - df.to_csv() - CSV文件公开
导出数据 - df.to_csv() - CSV文件
83导出数据 - df.to_excel(filename) - Excel文件公开
导出数据 - df.to_excel(filename) - Excel文件
84导出数据 - df.to_sql() - mysql数据库公开
导出数据 - df.to_sql() - mysql数据库
85导出数据 - df.to_json(filename) - Json格式到文本公开
导出数据 - df.to_json(filename) - Json格式到文本
86导出数据 - df.to_html() - HTML公开
导出数据 - df.to_html() - HTML
87导出数据 - df.to_xml() - XML公开
导出数据 - df.to_xml() - XML
88导出数据 - df. to_markdown() - markdown公开
导出数据 - df. to_markdown() - markdown
89matplotlib - 配置显示图表公开
90matplotlib - plt.subplot(,,) - 行,列,按列第几个公开
91matplotlib - plt.plot(,,) - 显示图表公开
92matplotlib - plt.xlabel(“”) - X/Y轴名字公开
93matplotlib - plt.title(“”) - 标题公开
94matplotlib - plt.legend() - label小图示公开
95提升 - 数据分析方法公开
python3.X - 数据分析 - Pandas