pandas print

微信登录

python3.X - 数据分析 - Pandas

前置方法 - 打印优化设置

pandas教程 - 非常详细版

Pandas - 概述、安装、下载

数据结构 - 列型 - Series()

数据结构 - 表格型 - DataFrame()

前置方法 - 打印优化设置

导入数据 - pd.DataFrame(data) - 读[]list

导入数据 - pd.read_csv() - 读CSV文件

导入数据 - pd.read_excel(filename) - 读Excel文件

导入数据 - pd.read_sql(query, conobject) - 读sql

导入数据 - pd.read_json(jsonstr) - 读json字符串

导入数据 - pd.read_html(url) - 解析URL或HTML

导入数据 - pd.read_clipboard() - 粘贴板获取内容

导入数据 - pd.read_xml() - XML

创建DataFrame - 数据DataFrame

创建DataFrame - 空DataFrame、方法流通

重要概念 - inplace=True - 原df修改

数据类型 - int64、float64、bool、datetime64

数据类型 - pd.Timestamp() - 时间

数据类型 - pd.Timedelta() - 时长

数据类型 - print(df.dtypes) - 查看数据类型

重要函数 - apply(fun) - 传入方法

转换 - df["列"].apply() - 字段是list转多行

转换 - df.explode("要拆的列") - 字段是list转多行

转换 - df["列"].apply() - 字段是dict转成多列

转换 - pd.melt() - 多列转多行

转换 - pd.pivot() - 多行转多列

转换 - 多列合并

判断 - if df.empty: - Data Frame 是否为空

DataFrame信息 - df.shape[0] - [0]行数、[1]列数

DataFrame信息 - list(data) - 全部列名

DataFrame信息 - df.info() - 数据集的数据类型

DataFrame信息 - df.describe() - 描述

列级 - df["新列名"] = 0 - 新增列和基础值

列级 - df[""] = df[""].xx - 数据截取、数据转换日期

列级 - astype("float64") - 替换数据类型

列级 - df.set_index("columns") - 列转索引

列级 - df.reset_index() - 索引转列

列级 - df.reset_index() - 索引重置

列级 - df_new = df.rename() - 列改名

列级 - df.columns=["a","b"] - 重命名列名

列级 - df.drop() - 删除列

行级 - df.append(s) - 增加行

行级 - df.drop() - 删除行，清空

内容 - sort_value() - 排序

内容 - df.drop_duplicate() - 去重

内容 - df.dropna() - 删除所有包含空值的行

内容 - str.replace() - 替换

内容 - df.where() - NaN转换为None

内容 - df.fillna() - NaN转换

内容 - python语法判空

选择数据 - random_rows = df.sample(3) - 随机3行

选择数据 - df[] - python切片

选择数据 - df.loc[:,:] - 行名,列名 - 时间范围

选择数据 - df.nlargest() - 最大最小时间

选择数据 - df.iloc[:,:] - 行index,列index

选择数据 - df[] - df[选择指定列]

选择数据 - df[][] - df[选择指定列][筛选条件]

选择数据 - df[df["A"] == "a"]] - 列A等于a的数据

获得数据值 - 选择后.index[0] - index

for - for循环 - 较慢不建议用

分组 - df.groupby(by="A列") - 分组

运算 - df["A"].value_counts() - 按a列数量统计

运算 - 选择后.sum() - 求和

运算 - 选择后.mean() - 平均值

运算 - df["C"]=df["A"]-df["B"]

运算 - df.agg() - 聚合运算

修改数据 - 选择数据 = 修改值

合并数据 - df1.append(df2) - df2加到df1的尾

合并数据 - pd.concat([df1,df2,df3]) - 多表合并

合并数据 - df3=df1.add(df2) - 加法运算合并

合并数据 - df.merge() - 多功能合并

整理 - df = df[["A","B"]] - 重排列

整理 - df.round({}) - 小数点后2位

导出数据 - df. to_dict() - dict{}

导出数据 - df. tolist() - list[]

导出数据 - df.to_csv() - CSV文件

导出数据 - df.to_excel(filename) - Excel文件

导出数据 - df.to_sql() - mysql数据库

导出数据 - df.to_json(filename) - Json格式到文本

导出数据 - df.to_html() - HTML

导出数据 - df.to_xml() - XML

导出数据 - df. to_markdown() - markdown

matplotlib - 配置显示图表

matplotlib - plt.subplot(,,) - 行，列，按列第几个

matplotlib - plt.plot(,,) - 显示图表

matplotlib - plt.xlabel(“”) - X/Y轴名字

matplotlib - plt.title(“”) - 标题

matplotlib - plt.legend() - label小图示

提升 - 数据分析方法

请支付后查看内容

本内容为付费内容，支付后即可解锁全部精彩内容。

如已支付，请刷新页面

pandas print