• 主页

  • 投资

  • IT

    🔥
  • 设计

  • 销售

  • 共95篇

    python3.X - 数据分析 - Pandas

关闭

返回栏目

关闭

返回python3.X - 数据分析 - Pandas栏目

37 - DataFrame信息 - df.info() - 数据集的数据类型

作者:

贺及楼

成为作者

更新日期:2024-10-18 14:33:07

info()数据集的数据类型

info() 简介

Pandas 的 info() 函数是一个用于提供 DataFrame 信息的有用工具。当你想要快速了解 DataFrame 的结构和内容时,info() 可以提供以下类型的信息:

内存使用情况:
显示 DataFrame 所占用的内存量。

非空值的行数:
显示每一列非空(非NaN)的行数。

数据类型:
列出 DataFrame 中每列的数据类型。

索引信息:
如果设置了索引,info() 会显示索引的名称和类型。

可变数据类型列:
显示哪些列包含可变数据类型(即列中的数据类型不统一)。

列的缺失值:
显示每列的缺失值数量。

数据集中的重复列:
如果存在重复的列名,info() 会显示警告信息。

info() 方法可以打印出df的信息,

  1. import numpy as np
  2. import pandas as pd
  3. df = pd.DataFrame(data=[{"A":"one", "B":1, "C":11}, {"A":"two", "B":2, "C":22}])
A B C
0 one 1 11
1 two 2 22
  1. df.info() # 输出数据集的数据类型
  1. <class 'pandas.core.frame.DataFrame'>
  2. RangeIndex: 2 entries, 0 to 1
  3. Data columns (total 3 columns):
  4. # Column Non-Null Count Dtype
  5. --- ------ -------------- -----
  6. 0 A 2 non-null object
  7. 1 B 2 non-null int64
  8. 2 C 2 non-null int64
  9. dtypes: int64(2), object(1)
  10. memory usage: 176.0+ bytes

df.info()