• 主页

  • 投资

  • IT

    🔥
  • 设计

  • 销售

  • 共95篇

    python3.X - 数据分析 - Pandas

关闭

返回栏目

关闭

返回python3.X - 数据分析 - Pandas栏目

63 - 选择数据 - df[][] - df[选择指定列][筛选条件]

作者:

贺及楼

成为作者

更新日期:2024-10-16 11:27:57

筛选条件

作用:有筛选条件

筛选df

  1. import numpy as np
  2. import pandas as pd
  3. ## roles = ['R1', 'R2', 'R3', 'R4'] # 要显示的列,可以自定义
  4. roles = list(df) # 要显示的列,list()此方法可以获得df的全部列
  5. data = df[roles][
  6. (df['R0'] == "目标字符" )
  7. & (df['R0'] != "不要的目标字符" )
  8. & (df['R1'] < 20)
  9. & (df['R2'] > 20)
  10. & (df['R3'] < 1000)
  11. & (df['R4'] > 4000)
  12. & (df['R5'].isnull()) # 空的
  13. & (df["R6"].isin (["2","1"])) # 在列表
  14. & (~ df["R7"].isin (["2","1"])) # 不在列表
  15. &(df["R8"].str.contains("包含")) # 包含
  16. ]
  17. print (data)
  1. ## 注意,这里筛选之后,index是不变的,要改变index的话就要reset_index()

时间筛选

  1. # hour = datetime.time(now.hour, now.minute, now.second, 0)
  2. hour = datetime.time(12, 60, 60, 0)
  3. role = list(df)
  4. df = df[role][
  5. (df['start_time'] < hour)
  6. & (df['end_time'] > hour)
  7. ]

时间筛选

看本文章:选择数据 - df.loc[:,:] - 行名,列名 - 时间范围