hand
_1_21_83
4
python3.X - 数据分析 - Pandas
共95篇
python3.X - 数据分析 - Pandas
返回栏目
1k
0k
5k
0k
0.1k
0k
2k
3k
1k
1k
0.2k
3k
0k
4k
3k
3k
3k
3k
0.5k
5k
1k
0.3k
3k
4k
7k
2k
7k
0.8k
0.9k
1k
1k
2k
0.4k
0.6k
0.6k
0.5k
0.9k
0.9k
1k
0.9k
1k
0.8k
1k
0.4k
0.4k
0.3k
0.6k
1k
0.9k
1k
1k
1k
0.8k
1k
0.8k
1k
0.7k
0.6k
4k
0.4k
3k
0.7k
0.8k
0.8k
0.2k
2k
1k
0.7k
0.7k
0.4k
0.5k
3k
0.1k
0.7k
0.9k
0.3k
1k
0.4k
0.4k
1k
0.5k
0.1k
0.7k
1k
0k
0.2k
0.7k
0.3k
0k
0k
0.1k
0k
0k
0k
3k
返回python3.X - 数据分析 - Pandas栏目
作者:
贺及楼
成为作者
更新日期:2024-08-14 12:46:58
在Pandas中,set_index 是一个用于设置 DataFrame 索引的函数。这个函数使你可以指定一列或多列作为 DataFrame 的行索引,从而改变数据的视角和组织方式。以下是 set_index 函数的一些关键特点:
重设索引:
set_index 允许你将现有的列转换为索引,从而改变数据的组织结构。
多级索引:
可以设置多个列作为索引,创建一个分层索引(MultiIndex)。
就地修改:
通过设置 inplace=True,set_index 可以就地修改原始 DataFrame,不返回新的 DataFrame。
保持列:
如果不想将指定的列用作索引,但仍然想保留它们作为列,可以使用 drop=False。
索引验证:
set_index 会检查索引的唯一性和排序状态,确保索引的有效性。
适用于时间序列数据:
set_index 特别适用于将时间序列数据设置为索引,以便于时间序列分析。
import numpy as np
import pandas as pd
df = pd.DataFrame(data=[{"A":"one", "B":"a"}, {"A":"two", "B":"b"}, {"A":"one", "B":1}])
A | B | |
---|---|---|
0 | one | a |
1 | two | b |
2 | one | 1 |
df.set_index('A', inplace=True) # A列转为索引
data = df.set_index('A', inplace=False) # A列转为索引
B | |
---|---|
A | |
one | a |
two | b |
one | 1 |
转成索引列可以固定住
inplace = True:不创建新的对象,直接对原始对象进行修改;
inplace = False:对数据进行修改,创建并返回新的对象承载其修改结果。
python3.X - 数据分析 - Pandas
整章节共95节
快分享给你的小伙伴吧 ~