hand
13
_1_21_49
4
python3.X - 数据分析 - Pandas
共95篇
python3.X - 数据分析 - Pandas
返回栏目
1k
0k
5k
0k
0.1k
0k
2k
3k
1k
1k
0.2k
3k
0k
4k
3k
3k
3k
3k
0.5k
5k
1k
0.3k
3k
4k
7k
2k
7k
0.8k
0.9k
1k
1k
2k
0.4k
0.6k
0.6k
0.5k
0.9k
0.9k
1k
0.9k
1k
0.8k
1k
0.4k
0.4k
0.3k
0.6k
1k
0.9k
1k
1k
1k
0.8k
1k
0.8k
1k
0.7k
0.6k
4k
0.4k
3k
0.7k
0.8k
0.8k
0.2k
2k
1k
0.7k
0.7k
0.4k
0.5k
3k
0.1k
0.7k
0.9k
0.3k
1k
0.4k
0.4k
1k
0.5k
0.1k
0.7k
1k
0k
0.2k
0.7k
0.3k
0k
0k
0.1k
0k
0k
0k
3k
返回python3.X - 数据分析 - Pandas栏目
作者:
贺及楼
成为作者
更新日期:2024-10-18 14:35:04
Pandas 的 dropna() 函数用于删除数据中的缺失值(通常表示为 NaN)。这个函数对于数据清洗特别有用,因为缺失值可能会影响数据分析和模型训练的结果。
以下是 dropna() 函数的一些关键特点:
删除缺失值:
可以删除包含缺失值的行或列。
就地删除:
通过设置 inplace=True,可以就地修改 DataFrame,不返回新的 DataFrame。
指定轴:
可以指定删除行(axis=0)或列(axis=1)中的缺失值。
删除所有含缺失值的行或列:
设置 how=’any’ 删除任何包含缺失值的行或列。
设置 how=’all’ 仅删除所有值都是缺失值的行或列。
限制删除数量:
通过 thresh 参数可以指定每行或每列必须有至少多少个非缺失值才会被保留。
处理多重索引:
对于具有多级索引的 DataFrame,dropna() 也可以应用于索引层级。
import numpy as np
import pandas as pd
df = pd.DataFrame(data=[{"A":"one", "B":"a", "C":11}, {"A":"two", "B":np.nan, "C":22}, {"A":"one", "B":1, "C":12}])
A | B | C | |
---|---|---|---|
0 | one | a | 11 |
1 | two | NaN | 22 |
2 | one | 1 | 12 |
df1 = df.dropna() # 删除所有包含空值的行
A | B | C | |
---|---|---|---|
0 | one | a | 11 |
2 | one | 1 | 12 |
index索引没有变,要更新一下,具体使用列级 - df.reset_index() - 索引重置
df2 = df1.reset_index(drop=True)
import numpy as np
import pandas as pd
df = pd.DataFrame(data=[{"A":"one", "B":"a", "C":11}, {"A":"two", "B":np.nan, "C":22}, {"A":"one", "B":1, "C":12}])
print(df)
df1 = df.dropna()
print(df1)
df2 = df1.reset_index(drop=True)
print(df2)
python3.X - 数据分析 - Pandas
整章节共95节
快分享给你的小伙伴吧 ~