hand
_1_21_46
4
python3.X - 数据分析 - Pandas
共95篇
python3.X - 数据分析 - Pandas
返回栏目
1k
0k
5k
0k
0.1k
0k
2k
3k
1k
1k
0.2k
3k
0k
4k
3k
3k
3k
3k
0.5k
5k
1k
0.3k
3k
4k
7k
2k
7k
0.8k
0.9k
1k
1k
2k
0.4k
0.6k
0.6k
0.5k
0.9k
0.9k
1k
0.9k
1k
0.8k
1k
0.4k
0.4k
0.3k
0.6k
1k
0.9k
1k
1k
1k
0.8k
1k
0.8k
1k
0.7k
0.6k
4k
0.4k
3k
0.7k
0.8k
0.8k
0.2k
2k
1k
0.7k
0.7k
0.4k
0.5k
3k
0.1k
0.7k
0.9k
0.3k
1k
0.4k
0.4k
1k
0.5k
0.1k
0.7k
1k
0k
0.2k
0.7k
0.3k
0k
0k
0.1k
0k
0k
0k
3k
返回python3.X - 数据分析 - Pandas栏目
作者:
贺及楼
成为作者
更新日期:2024-08-05 22:43:16
例子编号 | 描述 | 代码示例 |
---|---|---|
1 | 读取文本并转换为 DataFrame | pd.read_clipboard() |
2 | 读取文本并转换为 DataFrame | pd.read_csv(pd.compat.StringIO(pyperclip.paste())) |
3 | 读取表格数据 | pd.DataFrame([row.split() for row in pyperclip.paste().split('\n')])] |
4 | 读取 Excel 格式数据 | ...load_workbook(filename=BytesIO(pyperclip.paste().encode('utf-8'))) |
5 | 读取 JSON 格式数据 | pd.DataFrame(json.loads(pyperclip.paste())) |
6 | 读取 HTML 表格数据 | pd.read_html(str(BeautifulSoup(pyperclip.paste(), 'html.parser').find('table'))) |
7 | 读取特殊分隔符数据 | pd.read_csv(pd.compat.StringIO(pyperclip.paste().replace('\t', ','))) |
8 | 处理缺失值 | pd.read_csv(pd.compat.StringIO(data), na_values=['NA', '--']) |
9 | 转换数据类型 | pd.read_csv(pd.compat.StringIO(data), dtype={'Column1': int, 'Column2': float}) |
10 | 设置索引列 | pd.read_csv(pd.compat.StringIO(data), index_col='ID') |
11 | 数据清洗 | pd.read_csv(pd.compat.StringIO(data)).applymap(lambda x: x.strip() if isinstance(x, str) else x) |
import numpy as np
import pandas as pd
cdf = pd.read_clipboard()
pyperclip
获取剪贴板中的文本,并用 Pandas 转换为 DataFrame。代码:
import pandas as pd
import pyperclip
# 从剪贴板获取数据
data = pyperclip.paste()
# 假设数据是 CSV 格式
df = pd.read_csv(pd.compat.StringIO(data))
print(df.head())
# 假设表格数据已经以某种方式被格式化为字符串
table_data = pyperclip.paste().split('\n')
df = pd.DataFrame([row.split() for row in table_data])
print(df.head())
代码:
import openpyxl
# 从剪贴板获取 Excel 数据
data = pyperclip.paste()
# 将字符串转换为 Excel 文件
workbook = openpyxl.load_workbook(filename=BytesIO(data.encode('utf-8')))
sheet = workbook.active
df = pd.DataFrame(sheet.values)
print(df.head())
代码:
import json
# 从剪贴板获取 JSON 数据
json_data = pyperclip.paste()
data = json.loads(json_data)
df = pd.DataFrame(data)
print(df.head())
代码:
from bs4 import BeautifulSoup
# 从剪贴板获取 HTML 数据
html_data = pyperclip.paste()
soup = BeautifulSoup(html_data, 'html.parser')
tables = soup.find_all('table')
for table in tables:
df = pd.read_html(str(table))[0]
print(df.head())
# 假设数据是以制表符分隔
data = pyperclip.paste().replace('\t', ',')
df = pd.read_csv(pd.compat.StringIO(data))
print(df.head())
# 读取数据并处理缺失值
df = pd.read_csv(pd.compat.StringIO(data), na_values=['NA', '--'])
print(df.head())
# 转换列的数据类型
dtypes = {'Column1': int, 'Column2': float}
df = pd.read_csv(pd.compat.StringIO(data), dtype=dtypes)
print(df.head())
# 设置索引列
df = pd.read_csv(pd.compat.StringIO(data), index_col='ID')
print(df.head())
# 清洗数据,去除空格
df = pd.read_csv(pd.compat.StringIO(data)).applymap(lambda x: x.strip() if isinstance(x, str) else x)
print(df.head())
python3.X - 数据分析 - Pandas
整章节共95节
快分享给你的小伙伴吧 ~