例子编号 | 描述 | 参数/功能 | 预期结果描述 |
---|---|---|---|
1 | 读取 JSON 文件 | read_json |
JSON 文件数据的前 5 行 |
2 | 读取 JSON 字符串 | read_json |
JSON 字符串表示的数据 |
3 | 读取 JSON 行 | lines=True |
每行作为单独记录的前 5 行 |
4 | 指定 JSON 编码 | encoding='utf-8' |
使用特定编码的 JSON 数据 |
5 | 读取 JSON 指定列 | columns |
选择列的 JSON 数据 |
6 | 读取嵌套 JSON | orient='index' |
嵌套 JSON 转换为索引的表格 |
7 | 转换 JSON 日期列 | convert_dates=True |
日期字符串转换为日期时间对象 |
8 | 使用默认值读取 JSON | default_handler |
缺失值替换为 NaN |
9 | 保持原始类型读取 JSON | typ='series' |
作为 Series 保持原始类型 |
10 | 分块读取大型 JSON 文件 | chunksize |
分块输出大型 JSON 数据 |
11 | 复杂的 json 数据 | pd.json_normalize() |
复杂的 json 数据 |
import pandas as pd
df = pd.read_json('data.json')
print(df.head())
json_str = '{"col1": [1, 2], "col2": ["a", "b"]}'
df = pd.read_json(json_str)
print(df.head())
df = pd.read_json('data.json', lines=True)
print(df.head())
df = pd.read_json('data.json', encoding='utf-8')
print(df.head())
df = pd.read_json('data.json', columns=['col1', 'col3'])
print(df.head())
df = pd.read_json('data.json', orient='index')
print(df.head())
df = pd.read_json('data.json', convert_dates=True)
print(df.head())
df = pd.read_json('data.json', default_handler=lambda x: float('nan'))
print(df.head())
df = pd.read_json('data.json', typ='series')
print(df.head())
chunksize = 10
for chunk in pd.read_json('data.json', chunksize=chunksize):
print(chunk.head())
复杂的 json 数据,可以使用 pd.json_normalize()