Pandas 的 replace() 函数用于替换 DataFrame 中的值。这个函数非常有用,可以用于数据清洗和转换,允许你将指定的值或值的集合映射到新的值。
以下是 replace() 函数的一些关键特点:
值替换:
可以将一个或多个值替换为新值。
就地替换:
通过设置 inplace=True,可以就地修改 DataFrame,不返回新的 DataFrame。
使用字典:
通常使用字典来指定要替换的值及其新值。
正则表达式:
可以使用正则表达式来匹配值。
限制替换范围:
可以指定列或行的范围来限制替换操作。
替换数据类型:
替换操作可以改变列的数据类型。
作用:把数据里的1,234变成1234
import numpy as np
import pandas as pd
df = pd.DataFrame(data=[{"A":"one", "B":"a", "C":11}, {"A":"two", "B":np.NaN, "C":"2,2"}, {"A":"one", "B":1, "C":"1,2"}])
A | B | C | |
---|---|---|---|
0 | one | a | 11 |
1 | two | NaN | 2,2 |
2 | one | 1 | 1,2 |
a = df['人数'].str.replace(',', '') # a可打印,原DataFrame不生效
df['人数'] = df['人数'].str.replace(',', '') # 原DataFrame生效
df['C'] = df['C'].str.replace(',', '')
A | B | C | |
---|---|---|---|
0 | one | a | NaN |
1 | two | NaN | 22 |
2 | one | 1 | 12 |
注意!没有,的变成空值