
| 例子编号 | 描述 | 代码示例 |
|---|---|---|
| 1 | 读取文本并转换为 DataFrame | pd.read_clipboard() |
| 2 | 读取文本并转换为 DataFrame | pd.read_csv(pd.compat.StringIO(pyperclip.paste())) |
| 3 | 读取表格数据 | pd.DataFrame([row.split() for row in pyperclip.paste().split('\n')])] |
| 4 | 读取 Excel 格式数据 | ...load_workbook(filename=BytesIO(pyperclip.paste().encode('utf-8'))) |
| 5 | 读取 JSON 格式数据 | pd.DataFrame(json.loads(pyperclip.paste())) |
| 6 | 读取 HTML 表格数据 | pd.read_html(str(BeautifulSoup(pyperclip.paste(), 'html.parser').find('table'))) |
| 7 | 读取特殊分隔符数据 | pd.read_csv(pd.compat.StringIO(pyperclip.paste().replace('\t', ','))) |
| 8 | 处理缺失值 | pd.read_csv(pd.compat.StringIO(data), na_values=['NA', '--']) |
| 9 | 转换数据类型 | pd.read_csv(pd.compat.StringIO(data), dtype={'Column1': int, 'Column2': float}) |
| 10 | 设置索引列 | pd.read_csv(pd.compat.StringIO(data), index_col='ID') |
| 11 | 数据清洗 | pd.read_csv(pd.compat.StringIO(data)).applymap(lambda x: x.strip() if isinstance(x, str) else x) |
import numpy as npimport pandas as pdcdf = pd.read_clipboard()
pyperclip 获取剪贴板中的文本,并用 Pandas 转换为 DataFrame。代码:
import pandas as pdimport pyperclip# 从剪贴板获取数据data = pyperclip.paste()# 假设数据是 CSV 格式df = pd.read_csv(pd.compat.StringIO(data))print(df.head())
# 假设表格数据已经以某种方式被格式化为字符串table_data = pyperclip.paste().split('\n')df = pd.DataFrame([row.split() for row in table_data])print(df.head())
代码:
import openpyxl# 从剪贴板获取 Excel 数据data = pyperclip.paste()# 将字符串转换为 Excel 文件workbook = openpyxl.load_workbook(filename=BytesIO(data.encode('utf-8')))sheet = workbook.activedf = pd.DataFrame(sheet.values)print(df.head())
代码:
import json# 从剪贴板获取 JSON 数据json_data = pyperclip.paste()data = json.loads(json_data)df = pd.DataFrame(data)print(df.head())
代码:
from bs4 import BeautifulSoup# 从剪贴板获取 HTML 数据html_data = pyperclip.paste()soup = BeautifulSoup(html_data, 'html.parser')tables = soup.find_all('table')for table in tables:df = pd.read_html(str(table))[0]print(df.head())
# 假设数据是以制表符分隔data = pyperclip.paste().replace('\t', ',')df = pd.read_csv(pd.compat.StringIO(data))print(df.head())
# 读取数据并处理缺失值df = pd.read_csv(pd.compat.StringIO(data), na_values=['NA', '--'])print(df.head())
# 转换列的数据类型dtypes = {'Column1': int, 'Column2': float}df = pd.read_csv(pd.compat.StringIO(data), dtype=dtypes)print(df.head())
# 设置索引列df = pd.read_csv(pd.compat.StringIO(data), index_col='ID')print(df.head())
# 清洗数据,去除空格df = pd.read_csv(pd.compat.StringIO(data)).applymap(lambda x: x.strip() if isinstance(x, str) else x)print(df.head())