pandas json

表格总结

例子编号	描述	参数/功能	预期结果描述
1	读取 JSON 文件	`read_json`	JSON 文件数据的前 5 行
2	读取 JSON 字符串	`read_json`	JSON 字符串表示的数据
3	读取 JSON 行	`lines=True`	每行作为单独记录的前 5 行
4	指定 JSON 编码	`encoding='utf-8'`	使用特定编码的 JSON 数据
5	读取 JSON 指定列	`columns`	选择列的 JSON 数据
6	读取嵌套 JSON	`orient='index'`	嵌套 JSON 转换为索引的表格
7	转换 JSON 日期列	`convert_dates=True`	日期字符串转换为日期时间对象
8	使用默认值读取 JSON	`default_handler`	缺失值替换为 NaN
9	保持原始类型读取 JSON	`typ='series'`	作为 Series 保持原始类型
10	分块读取大型 JSON 文件	`chunksize`	分块输出大型 JSON 数据
11	复杂的 json 数据	`pd.json_normalize()`	复杂的 json 数据

1: 读取 JSON 文件

描述：从 JSON 文件中读取数据并转换为 DataFrame。

代码：

import pandas as pd
df = pd.read_json('data.json')
print(df.head())

预期结果：输出 JSON 文件中的数据的前 5 行。

2: 读取 JSON 字符串

描述：从 JSON 格式的字符串中读取数据。

代码：

json_str = '{"col1": [1, 2], "col2": ["a", "b"]}'
df = pd.read_json(json_str)
print(df.head())

预期结果：输出 JSON 字符串表示的数据的前 5 行（此例中只有 2 行）。

3: 读取 JSON 行

描述：将 JSON 对象的每一行作为 DataFrame 的一行。

代码：

df = pd.read_json('data.json', lines=True)
print(df.head())

预期结果：输出 JSON 文件中每一行作为单独记录的前 5 行。

4: 指定 JSON 文件的编码

描述：读取具有特定编码的 JSON 文件。

代码：

df = pd.read_json('data.json', encoding='utf-8')
print(df.head())

预期结果：输出使用 UTF-8 编码的 JSON 文件的数据。

5: 读取 JSON 并指定列

描述：从 JSON 数据中选择特定的列。

代码：

df = pd.read_json('data.json', columns=['col1', 'col3'])
print(df.head())

预期结果：输出 JSON 文件中指定列的数据。

6: 读取嵌套 JSON

描述：读取嵌套的 JSON 对象并将其转换为表格。

代码：

df = pd.read_json('data.json', orient='index')
print(df.head())

预期结果：输出将嵌套 JSON 对象转换为索引的 DataFrame。

7: 从 JSON 读取并转换日期列

描述：将 JSON 中的日期字符串转换为日期时间对象。

代码：

df = pd.read_json('data.json', convert_dates=True)
print(df.head())

预期结果：输出 JSON 数据中日期字符串转换为日期时间对象的 DataFrame。

8: 读取 JSON 并使用默认值

描述：在 JSON 数据缺失时使用默认值。

代码：

df = pd.read_json('data.json', default_handler=lambda x: float('nan'))
print(df.head())

预期结果：输出 JSON 数据，缺失值被替换为 NaN。

9: 读取 JSON 并保持原始类型

描述：保持 JSON 数据的原始数据类型。

代码：

df = pd.read_json('data.json', typ='series')
print(df.head())

预期结果：输出 JSON 数据作为 Pandas Series，保持原始类型。

10: 从 JSON 读取并处理大数据

描述：使用 chunksize 分块读取大型 JSON 文件。

代码：

chunksize = 10
for chunk in pd.read_json('data.json', chunksize=chunksize):
    print(chunk.head())

预期结果：分块输出大型 JSON 文件的数据。

11:复杂的 json 数据

复杂的 json 数据，可以使用 pd.json_normalize()

.bat程序教程	python入门基础教程	Pandas教程	Pygame教程
Django3.2.9教程	Flask1.1.1教程	python3.X - 区块链教程	Java教程
Spring教程	C#教程	PHP教程	R教程
Node.js教程	mysql数据库教程	Redis数据库教程	MongoDB数据库教程
RabbitMQ教程	Lua教程	FindBI教程	HTML5教程
CSS教程	Javascript教程	jQuery教程	微信小程序教程
微信小游戏教程	Vue.js教程	服务器教程	TensorFlow教程
PyTorch教程	Unity教程	Objective-C教程	Android教程
AppleScript教程	Mac - SHELL教程	算法教程	Python教程
数据库教程	运维工具教程	Nginx教程	Docker教程

pandas json

表格总结

1: 读取 JSON 文件

2: 读取 JSON 字符串

3: 读取 JSON 行

4: 指定 JSON 文件的编码

5: 读取 JSON 并指定列

6: 读取嵌套 JSON

7: 从 JSON 读取并转换日期列

8: 读取 JSON 并使用默认值

9: 读取 JSON 并保持原始类型

10: 从 JSON 读取并处理大数据

11:复杂的 json 数据

精彩教程