统计数据
返回一个df
a | ||
---|---|---|
香蕉 | x | x |
香蕉 | x | x |
雪糕 | x | x |
胡萝卜 | x | x |
胡萝卜 | x | x |
胡萝卜 | x | x |
import numpy as np
import pandas as pd
df_a = df["a"].value_counts()
香蕉 | 2 |
雪糕 | 1 |
胡萝卜 | 3 |
加名字
df_a.name ="num" # 加名字
num | |
---|---|
香蕉 | 2 |
雪糕 | 1 |
胡萝卜 | 3 |
df["a"].value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)
sort=True: 是否要进行排序;默认进行排序
ascending=False: 默认降序排列;
ascending=True时,按升序排列.
normalize=False: 是否要对计算结果进行标准化并显示标准化后的结果,默认是False。
normalize=True时,可计算出不同字符出现的频率,画柱状图统计时可以用到.
bins=None: 可以自定义分组区间,默认是否;
dropna=True:是否删除缺失值nan,默认删除
f_da = df_data['A列'].value_counts().reset_index()
df_da.columns = ['A列名', 'B列名'] # 列名重置