
| 例子编号 | 描述 | 参数/功能 | 预期结果描述 |
|---|---|---|---|
| 1 | 读取 JSON 文件 | read_json |
JSON 文件数据的前 5 行 |
| 2 | 读取 JSON 字符串 | read_json |
JSON 字符串表示的数据 |
| 3 | 读取 JSON 行 | lines=True |
每行作为单独记录的前 5 行 |
| 4 | 指定 JSON 编码 | encoding='utf-8' |
使用特定编码的 JSON 数据 |
| 5 | 读取 JSON 指定列 | columns |
选择列的 JSON 数据 |
| 6 | 读取嵌套 JSON | orient='index' |
嵌套 JSON 转换为索引的表格 |
| 7 | 转换 JSON 日期列 | convert_dates=True |
日期字符串转换为日期时间对象 |
| 8 | 使用默认值读取 JSON | default_handler |
缺失值替换为 NaN |
| 9 | 保持原始类型读取 JSON | typ='series' |
作为 Series 保持原始类型 |
| 10 | 分块读取大型 JSON 文件 | chunksize |
分块输出大型 JSON 数据 |
| 11 | 复杂的 json 数据 | pd.json_normalize() |
复杂的 json 数据 |
import pandas as pddf = pd.read_json('data.json')print(df.head())
json_str = '{"col1": [1, 2], "col2": ["a", "b"]}'df = pd.read_json(json_str)print(df.head())
df = pd.read_json('data.json', lines=True)print(df.head())
df = pd.read_json('data.json', encoding='utf-8')print(df.head())
df = pd.read_json('data.json', columns=['col1', 'col3'])print(df.head())
df = pd.read_json('data.json', orient='index')print(df.head())
df = pd.read_json('data.json', convert_dates=True)print(df.head())
df = pd.read_json('data.json', default_handler=lambda x: float('nan'))print(df.head())
df = pd.read_json('data.json', typ='series')print(df.head())
chunksize = 10for chunk in pd.read_json('data.json', chunksize=chunksize):print(chunk.head())
复杂的 json 数据,可以使用 pd.json_normalize()