Pandas 的 info() 函数是一个用于提供 DataFrame 信息的有用工具。当你想要快速了解 DataFrame 的结构和内容时,info() 可以提供以下类型的信息:
内存使用情况:
显示 DataFrame 所占用的内存量。
非空值的行数:
显示每一列非空(非NaN)的行数。
数据类型:
列出 DataFrame 中每列的数据类型。
索引信息:
如果设置了索引,info() 会显示索引的名称和类型。
可变数据类型列:
显示哪些列包含可变数据类型(即列中的数据类型不统一)。
列的缺失值:
显示每列的缺失值数量。
数据集中的重复列:
如果存在重复的列名,info() 会显示警告信息。
info() 方法可以打印出df的信息,
import numpy as np
import pandas as pd
df = pd.DataFrame(data=[{"A":"one", "B":1, "C":11}, {"A":"two", "B":2, "C":22}])
A | B | C | |
---|---|---|---|
0 | one | 1 | 11 |
1 | two | 2 | 22 |
df.info() # 输出数据集的数据类型
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2 entries, 0 to 1
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 2 non-null object
1 B 2 non-null int64
2 C 2 non-null int64
dtypes: int64(2), object(1)
memory usage: 176.0+ bytes