• 主页

  • 投资

  • IT

    🔥
  • 设计

  • 销售

  • 共95篇

    python3.X - 数据分析 - Pandas

关闭

返回栏目

关闭

返回python3.X - 数据分析 - Pandas栏目

26 - 数据类型 - print(df.dtypes) - 查看数据类型

作者:

贺及楼

成为作者

更新日期:2024-08-14 11:34:00

dtypes查看数据类型

简介

在 Pandas 中,dtypes 是数据类型(Data Types)的简称,它们定义了 DataFrame 中列(或 Series)的数据类型。了解和使用正确的数据类型对于数据的处理、存储和性能至关重要。

查看数据类型

  1. import pandas as pd
  2. import numpy as np
  3. # 创建数据字典
  4. data = {
  5. 'int_col': [1, 2, np.nan], # 整数列
  6. 'float_col': [1.1, 2.2, 3.3], # 浮点数列
  7. 'bool_col': [True, False, True], # 布尔列
  8. 'str_col': ['apple', 'banana', 'cherry'], # 字符串列
  9. 'cat_col': pd.Categorical(['red', 'blue', 'red'], categories=['red', 'blue', 'green']), # 分类列
  10. 'datetime_col': pd.to_datetime(['2021-01-01', '2021-01-02', '2021-01-03']), # 日期时间列
  11. 'timedelta_col': pd.to_timedelta([1, 2, 3], unit='D'), # 时间差列
  12. 'complex_col': [1+2j, 3+4j, 5+6j], # 复数列
  13. 'interval_col': pd.IntervalIndex([pd.Interval(0, 1), pd.Interval(2, 3), pd.Interval(4, 5)]), # 区间列
  14. # 'period_col': pd.PeriodIndex(["2021-01", "2021-02", "2021-03"], freq='M'), # 周期列 (不再支持)
  15. 'index_col': [100, 101, 102], # 索引列
  16. }
  17. # 创建 DataFrame
  18. df = pd.DataFrame(data)
  19. # 打印 DataFrame
  20. print(df)
  21. print(df.info())
  22. print(df.dtypes)
  1. int_col float_col bool_col str_col cat_col datetime_col timedelta_col complex_col interval_col index_col
  2. 0 1.0 1.1 True apple red 2021-01-01 1 days 1.000000+2.000000j (0, 1] 100
  3. 1 2.0 2.2 False banana blue 2021-01-02 2 days 3.000000+4.000000j (2, 3] 101
  4. 2 NaN 3.3 True cherry red 2021-01-03 3 days 5.000000+6.000000j (4, 5] 102
  1. <class 'pandas.core.frame.DataFrame'>
  2. RangeIndex: 3 entries, 0 to 2
  3. Data columns (total 10 columns):
  4. # Column Non-Null Count Dtype
  5. --- ------ -------------- -----
  6. 0 int_col 2 non-null float64
  7. 1 float_col 3 non-null float64
  8. 2 bool_col 3 non-null bool
  9. 3 str_col 3 non-null object
  10. 4 cat_col 3 non-null category
  11. 5 datetime_col 3 non-null datetime64[ns]
  12. 6 timedelta_col 3 non-null timedelta64[ns]
  13. 7 complex_col 3 non-null complex128
  14. 8 interval_col 3 non-null interval[int64]
  15. 9 index_col 3 non-null int64
  16. dtypes: bool(1), category(1), complex128(1), datetime64[ns](1), float64(2), int64(1), interval(1), object(1), timedelta64[ns](1)
  17. memory usage: 478.0+ bytes
  18. None
  1. int_col float64
  2. float_col float64
  3. bool_col bool
  4. str_col object
  5. cat_col category
  6. datetime_col datetime64[ns]
  7. timedelta_col timedelta64[ns]
  8. complex_col complex128
  9. interval_col interval[int64]
  10. index_col int64
  11. dtype: object