pandas教程 - 非常详细版
Pandas - 概述、安装、下载
数据结构 - 列型 - Series()
数据结构 - 表格型 - DataFrame()
前置方法 - 打印优化设置
导入数据 - pd.DataFrame(data) - 读[]list
导入数据 - pd.read_csv() - 读CSV文件
导入数据 - pd.read_excel(filename) - 读Excel文件
导入数据 - pd.read_sql(query, conobject) - 读sql
导入数据 - pd.read_json(jsonstr) - 读json字符串
导入数据 - pd.read_html(url) - 解析URL或HTML
导入数据 - pd.read_clipboard() - 粘贴板获取内容
导入数据 - pd.read_xml() - XML
创建DataFrame - 数据DataFrame
创建DataFrame - 空DataFrame、方法流通
重要概念 - inplace=True - 原df修改
数据类型 - int64、float64、bool、datetime64
数据类型 - pd.Timestamp() - 时间
数据类型 - pd.Timedelta() - 时长
数据类型 - print(df.dtypes) - 查看数据类型
重要函数 - apply(fun) - 传入方法
转换 - df["列"].apply() - 字段是list转多行
转换 - df.explode("要拆的列") - 字段是list转多行
转换 - df["列"].apply() - 字段是dict转成多列
转换 - pd.melt() - 多列转多行
转换 - pd.pivot() - 多行转多列
转换 - 多列合并
判断 - if df.empty: - Data Frame 是否为空
DataFrame信息 - df.shape[0] - [0]行数、[1]列数
DataFrame信息 - list(data) - 全部列名
DataFrame信息 - df.info() - 数据集的数据类型
DataFrame信息 - df.describe() - 描述
列级 - df["新列名"] = 0 - 新增列和基础值
列级 - df[""] = df[""].xx - 数据截取、数据转换日期
列级 - astype("float64") - 替换数据类型
列级 - df.set_index("columns") - 列转索引
列级 - df.reset_index() - 索引转列
列级 - df.reset_index() - 索引重置
列级 - df_new = df.rename() - 列改名
列级 - df.columns=["a","b"] - 重命名列名
列级 - df.drop() - 删除列
行级 - df.append(s) - 增加行
行级 - df.drop() - 删除行,清空
内容 - sort_value() - 排序
内容 - df.drop_duplicate() - 去重
内容 - df.dropna() - 删除所有包含空值的行
内容 - str.replace() - 替换
内容 - df.where() - NaN转换为None
内容 - df.fillna() - NaN转换
内容 - python语法判空
选择数据 - random_rows = df.sample(3) - 随机3行
选择数据 - df[] - python切片
选择数据 - df.loc[:,:] - 行名,列名 - 时间范围
选择数据 - df.nlargest() - 最大最小时间
选择数据 - df.iloc[:,:] - 行index,列index
选择数据 - df[] - df[选择指定列]
选择数据 - df[][] - df[选择指定列][筛选条件]
选择数据 - df[df["A"] == "a"]] - 列A等于a的数据
获得数据值 - 选择后.index[0] - index
for - for循环 - 较慢不建议用
分组 - df.groupby(by="A列") - 分组
运算 - df["A"].value_counts() - 按a列数量统计
运算 - 选择后.sum() - 求和
运算 - 选择后.mean() - 平均值
运算 - df["C"]=df["A"]-df["B"]
运算 - df.agg() - 聚合运算
修改数据 - 选择数据 = 修改值
合并数据 - df1.append(df2) - df2加到df1的尾
合并数据 - pd.concat([df1,df2,df3]) - 多表合并
合并数据 - df3=df1.add(df2) - 加法运算合并
合并数据 - df.merge() - 多功能合并
整理 - df = df[["A","B"]] - 重排列
整理 - df.round({}) - 小数点后2位
导出数据 - df. to_dict() - dict{}
导出数据 - df. tolist() - list[]
导出数据 - df.to_csv() - CSV文件
导出数据 - df.to_excel(filename) - Excel文件
导出数据 - df.to_sql() - mysql数据库
导出数据 - df.to_json(filename) - Json格式到文本
导出数据 - df.to_html() - HTML
导出数据 - df.to_xml() - XML
导出数据 - df. to_markdown() - markdown
matplotlib - 配置显示图表
matplotlib - plt.subplot(,,) - 行,列,按列第几个
matplotlib - plt.plot(,,) - 显示图表
matplotlib - plt.xlabel(“”) - X/Y轴名字
matplotlib - plt.title(“”) - 标题
matplotlib - plt.legend() - label小图示
提升 - 数据分析方法