• 主页

  • 投资

  • IT

    🔥
  • 设计

  • 销售

  • 共95篇

    python3.X - 数据分析 - Pandas

关闭

返回栏目

关闭

返回python3.X - 数据分析 - Pandas栏目

66 - for - for循环 - 较慢不建议用

作者:

贺及楼

成为作者

更新日期:2024-10-18 12:49:47

for循环

总结

都可以一行一行地读出数据

方法 索引 返回数据 速度
iterrows() 有索引 133秒
itertuples() 有索引 3秒
zip() 没有索引 1秒

方式1 iterrows()

  1. import numpy as np
  2. import pandas as pd
  3. df= pd.DataFrame({'a': range(0, 10), 'b': range(10, 20)})
  4. print(df)
  5. for index, row in df.iterrows():
  6. print (index)
  7. print (row)
  8. data = str(row['b'])
  9. print(data) # 获得值
  10. df.loc[index, '修改值的列'] = "new_data" # 修改值
  11. print(df)
  1. a b
  2. 0 0 10
  3. 1 1 11
  4. 2 2 12
  5. 3 3 13
  6. 4 4 14
  7. 5 5 15
  8. 6 6 16
  9. 7 7 17
  10. 8 8 18
  11. 9 9 19
  12. 0
  13. a 0
  14. b 10
  15. Name: 0, dtype: int64
  16. 10
  17. 1
  18. a 1
  19. b 11
  20. Name: 1, dtype: int64
  21. 11
  22. 2
  23. a 2
  24. b 12
  25. Name: 2, dtype: int64
  26. 12
  27. 3
  28. a 3
  29. b 13
  30. Name: 3, dtype: int64
  31. 13
  32. 4
  33. a 4
  34. b 14
  35. Name: 4, dtype: int64
  36. 14
  37. 5
  38. a 5
  39. b 15
  40. Name: 5, dtype: int64
  41. 15
  42. 6
  43. a 6
  44. b 16
  45. Name: 6, dtype: int64
  46. 16
  47. 7
  48. a 7
  49. b 17
  50. Name: 7, dtype: int64
  51. 17
  52. 8
  53. a 8
  54. b 18
  55. Name: 8, dtype: int64
  56. 18
  57. 9
  58. a 9
  59. b 19
  60. Name: 9, dtype: int64
  61. 19
  62. a b 修改值的列
  63. 0 0 10 new_data
  64. 1 1 11 new_data
  65. 2 2 12 new_data
  66. 3 3 13 new_data
  67. 4 4 14 new_data
  68. 5 5 15 new_data
  69. 6 6 16 new_data
  70. 7 7 17 new_data
  71. 8 8 18 new_data
  72. 9 9 19 new_data

方式2 itertuples()

  1. df= pd.DataFrame({'a': range(0, 10000), 'b': range(10000, 20000)})
  2. count=0
  3. for tup in df.itertuples():
  4. print(tup)
  5. print(tup.b)
  6. print(tup[0])
  7. print(tup[1::])
  8. print(type(tup[1:]))
  9. count+=1
  10. if count>5:
  11. break
  1. Pandas(Index=0, a=0, b=10000)
  2. 10000
  3. 0
  4. (0, 10000)
  5. <class 'tuple'>
  6. Pandas(Index=1, a=1, b=10001)
  7. 10001
  8. 1
  9. (1, 10001)
  10. <class 'tuple'>
  11. Pandas(Index=2, a=2, b=10002)
  12. 10002
  13. 2
  14. (2, 10002)
  15. <class 'tuple'>
  16. Pandas(Index=3, a=3, b=10003)
  17. 10003
  18. 3
  19. (3, 10003)
  20. <class 'tuple'>
  21. Pandas(Index=4, a=4, b=10004)
  22. 10004
  23. 4
  24. (4, 10004)
  25. <class 'tuple'>
  26. Pandas(Index=5, a=5, b=10005)
  27. 10005
  28. 5
  29. (5, 10005)
  30. <class 'tuple'>

方式3 zip()

  1. df= pd.DataFrame({'a': range(0, 10000), 'b': range(10000, 20000)})
  2. count=0
  3. for tup in zip(df['a'], df['b']):
  4. print(tup)
  5. print(type(tup[1:]))
  6. count+=1
  7. if count>5:
  8. break
  1. (0, 10000)
  2. <class 'tuple'>
  3. (1, 10001)
  4. <class 'tuple'>
  5. (2, 10002)
  6. <class 'tuple'>
  7. (3, 10003)
  8. <class 'tuple'>
  9. (4, 10004)
  10. <class 'tuple'>
  11. (5, 10005)
  12. <class 'tuple'>