微信登录

音频处理 - 音频文件分析与生成

图标标题权限标签图片
1音频基础 - pydub - 音频文件格式转换与基础剪辑 公开
2音频分析 - librosa - 音频特征提取与频谱分析 公开
3文件处理 - soundfile - WAV/FLAC等格式读写 公开
4音频处理 - scipy.signal - 滤波、频谱分析与信号处理 公开
5实时处理 - sounddevice - 麦克风音频实时录制播放 公开
6语音处理 - speech_recognition - 语音识别与转文本 公开
7音频特征 - essentia - 音乐/语音特征提取与分析 公开
8深度学习 - tensorflow-io - 音频数据加载与预处理 公开
9音频生成 - midiutil - MIDI音乐文件生成与编辑 公开
10音频增强 - noisereduce - 实时音频降噪处理 公开
11音乐分析 - madmom - 节拍检测与音乐信息检索 公开
12语音合成 - gtts - 文本转语音文件生成 公开
13音频可视化 - matplotlib - 波形图、频谱图绘制 公开
14音效处理 - pedalboard - 音频效果器链处理 公开
15格式转换 - pydub - MP3/WAV等格式互转 公开
16音频合成 - fluidsynth - MIDI转音频合成 公开
17特征提取 - python_speech_features - MFCC等语音特征计算 公开
18文件处理 - wave - Python标准库WAV读写 公开
19语音分析 - aubio - 音高、节奏与音色检测 公开
20音频流处理 - pyaudio - 音频流录制与实时处理 公开
21音频处理 - scipy.io.wavfile - WAV文件读写与处理 公开
22语音增强 - pypesq - 语音质量评估与增强 公开
23音乐生成 - magenta - 基于AI的音乐生成库 公开
24深度学习 - torchaudio - PyTorch音频处理工具 公开
25音频分析 - pyAudioAnalysis - 音频分类与特征提取 公开
26语音识别 - whisper - 高精度多语言语音转文本 公开
27音频切片 - silero - 语音活动检测与分割 公开
28声学处理 - pyroomacoustics - 房间声学模拟与处理 公开
29特征计算 - pyts - 时间序列音频特征提取 公开
30音频增强 - audiomentations - 数据增强与干扰模拟 公开
31音频分析 - vamp - 音频插件特征提取框架 公开
32音频处理 - audiocraft - Meta开源音频生成模型 公开
33语音处理 - webrtcvad - 实时语音活动检测 公开
34声纹识别 - pyannote-audio - 说话人分离与识别 公开
35音频生成 - magenta - 神经网络音乐生成 公开
36特征提取 - librosa - 节拍、调性、和弦分析 公开
37音频转换 - ffmpeg-python - FFmpeg命令行封装 公开
38音频处理 - pysndfx - 音频效果器应用(均衡/混响) 公开
39语音合成 - pyttsx3 - 离线文本转语音库 公开
40音频分析 - essentia - 音乐节拍、情绪分析 公开
41音效生成 - sinode - 正弦波合成与声音设计 公开
42语音处理 - opensmile - 语音情感特征提取 公开
43音乐检索 - jellyfish - 音频指纹匹配与检索 公开
44音频生成 - csound - 音频合成与算法作曲 公开
45文件处理 - audioread - 跨平台音频解码 公开
46音频处理 - pyrubberband - 音频变速变调处理 公开
47深度学习 - kapre - 音频预处理层(Keras/TF) 公开
48语音识别 - vosk - 离线语音识别库 公开
49音频处理 - pymir - 音乐信息检索工具包 公开
50特征提取 - tsmixer - 时间序列混合特征计算 公开
51音频可视化 - seaborn - 音频数据统计可视化 公开
52语音增强 - deepfilternet - 基于AI的语音降噪 公开
53音频生成 - mingus - MIDI音乐生成与理论处理 公开
54音频分析 - yaafe - 音频特征提取框架 公开
55语音处理 - parselmouth - 语音分析(Praat算法) 公开
56音频处理 - torchaudio.functional - 音频变换函数库 公开
57语音生成 - tacotron2 - 端到端语音合成模型 公开
58音乐处理 - music21 - 乐谱分析与生成 公开
59音频处理 - resampy - 高质量音频重采样 公开
60特征提取 - pyAudioProcessing - 分段音频特征分析 公开
61语音识别 - pocketsphinx - 轻量级语音识别 公开
62音频生成 - csound - 算法作曲与音频渲染 公开
63语音分析 - pyworld - 语音参数合成与修改 公开
64音频增强 - pystoi - 语音质量客观评估 公开
65音频处理 - pedalboard - VST插件集成处理 公开
66文件处理 - soundfile - 多格式音频快速读写 公开
67音乐生成 - pretty_midi - MIDI数据处理与生成 公开
68语音处理 - torchaudio - 语音数据加载与增强 公开
69深度学习 - espnet - 端到端语音处理工具包 公开
70音频分析 - mir_eval - 音乐信息检索评估 公开
71音频生成 - hydracore - 多轨道音频合成引擎 公开
72语音处理 - shennina - 语音特征可视化工具 公开
73音频处理 - pyfftw - FFT加速计算库 公开
74特征提取 - marsyas - 音频特征提取框架 公开
75语音合成 - mimic3 - 本地化TTS引擎 公开
76音频处理 - pytsmod - 时间拉伸与变调处理 公开
77音乐分析 - mirdata - 开源音乐数据集加载 公开
78语音识别 - google-cloud-speech - 云端语音转文本 公开
79音频增强 - nlpaug - 音频数据增强库 公开
80音频生成 - pysynth - 简单波表合成器 公开
81文件处理 - aifc - AIFF格式文件读写 公开
82音频处理 - pyrubberband - 实时音高修正 公开
83语音分析 - librosa - 语音基频与共振峰检测 公开
84深度学习 - asteroid - 语音分离与去混响 公开
85音频可视化 - plotly - 交互式音频图表生成 公开
86音频处理 - pyACA - 音频内容分析工具包 公开
87语音生成 - tortoise-tts - 高质量多风格语音合成 公开
88音乐处理 - mido - MIDI消息解析与生成 公开
89音频分析 - essentia-streaming - 实时音频特征提取 公开
90语音处理 - pyAudioAnalysis - 语音情绪识别 公开
91音频生成 - omegaconf - 音频合成配置管理 公开
92文件处理 - ogg - OGG音频文件解析 公开
93音频处理 - pyfilter - 实时音频滤波处理 公开
94特征提取 - pyentropy - 音频信息熵计算 公开
95语音增强 - RNNoise - 实时语音降噪算法 公开
96音频合成 - subtractive - 减法合成器实现 公开
97音乐生成 - ImproVAE - 变分自编码器音乐生成 公开
98语音处理 - pywebrtc - WebRTC音频处理封装 公开
99音频分析 - pymir - 音乐节奏模式分析 公开
100文件处理 - pymedia - 多媒体文件格式支持 公开
101语音合成 - Coqui-TTS - 开源语音合成框架 公开
102音频处理 - pysox - SoX音频处理工具绑定 公开
103深度学习 - speex - 语音编解码与处理 公开
104音频生成 - sound-synthesis - 物理建模合成器 公开
105语音分析 - opensmile - 多模态特征提取工具 公开
106音频处理 - pyacoustid - 音频指纹识别与匹配 公开
107文件处理 - audiotools - 音频元数据编辑工具 公开
108音乐检索 - dejavu - 音频指纹识别与检索公开