音频基础 - pydub - 音频文件格式转换与基础剪辑
音频分析 - librosa - 音频特征提取与频谱分析
文件处理 - soundfile - WAV/FLAC等格式读写
音频处理 - scipy.signal - 滤波、频谱分析与信号处理
实时处理 - sounddevice - 麦克风音频实时录制播放
语音处理 - speech_recognition - 语音识别与转文本
音频特征 - essentia - 音乐/语音特征提取与分析
深度学习 - tensorflow-io - 音频数据加载与预处理
音频生成 - midiutil - MIDI音乐文件生成与编辑
音频增强 - noisereduce - 实时音频降噪处理
音乐分析 - madmom - 节拍检测与音乐信息检索
语音合成 - gtts - 文本转语音文件生成
音频可视化 - matplotlib - 波形图、频谱图绘制
音效处理 - pedalboard - 音频效果器链处理
格式转换 - pydub - MP3/WAV等格式互转
音频合成 - fluidsynth - MIDI转音频合成
特征提取 - python_speech_features - MFCC等语音特征计算
文件处理 - wave - Python标准库WAV读写
语音分析 - aubio - 音高、节奏与音色检测
音频流处理 - pyaudio - 音频流录制与实时处理
音频处理 - scipy.io.wavfile - WAV文件读写与处理
语音增强 - pypesq - 语音质量评估与增强
音乐生成 - magenta - 基于AI的音乐生成库
深度学习 - torchaudio - PyTorch音频处理工具
音频分析 - pyAudioAnalysis - 音频分类与特征提取
语音识别 - whisper - 高精度多语言语音转文本
音频切片 - silero - 语音活动检测与分割
声学处理 - pyroomacoustics - 房间声学模拟与处理
特征计算 - pyts - 时间序列音频特征提取
音频增强 - audiomentations - 数据增强与干扰模拟
音频分析 - vamp - 音频插件特征提取框架
音频处理 - audiocraft - Meta开源音频生成模型
语音处理 - webrtcvad - 实时语音活动检测
声纹识别 - pyannote-audio - 说话人分离与识别
音频生成 - magenta - 神经网络音乐生成
特征提取 - librosa - 节拍、调性、和弦分析
音频转换 - ffmpeg-python - FFmpeg命令行封装
音频处理 - pysndfx - 音频效果器应用(均衡/混响)
语音合成 - pyttsx3 - 离线文本转语音库
音频分析 - essentia - 音乐节拍、情绪分析
音效生成 - sinode - 正弦波合成与声音设计
语音处理 - opensmile - 语音情感特征提取
音乐检索 - jellyfish - 音频指纹匹配与检索
音频生成 - csound - 音频合成与算法作曲
文件处理 - audioread - 跨平台音频解码
音频处理 - pyrubberband - 音频变速变调处理
深度学习 - kapre - 音频预处理层(Keras/TF)
语音识别 - vosk - 离线语音识别库
音频处理 - pymir - 音乐信息检索工具包
特征提取 - tsmixer - 时间序列混合特征计算
音频可视化 - seaborn - 音频数据统计可视化
语音增强 - deepfilternet - 基于AI的语音降噪
音频生成 - mingus - MIDI音乐生成与理论处理
音频分析 - yaafe - 音频特征提取框架
语音处理 - parselmouth - 语音分析(Praat算法)
音频处理 - torchaudio.functional - 音频变换函数库
语音生成 - tacotron2 - 端到端语音合成模型
音乐处理 - music21 - 乐谱分析与生成
音频处理 - resampy - 高质量音频重采样
特征提取 - pyAudioProcessing - 分段音频特征分析
语音识别 - pocketsphinx - 轻量级语音识别
音频生成 - csound - 算法作曲与音频渲染
语音分析 - pyworld - 语音参数合成与修改
音频增强 - pystoi - 语音质量客观评估
音频处理 - pedalboard - VST插件集成处理
文件处理 - soundfile - 多格式音频快速读写
音乐生成 - pretty_midi - MIDI数据处理与生成
语音处理 - torchaudio - 语音数据加载与增强
深度学习 - espnet - 端到端语音处理工具包
音频分析 - mir_eval - 音乐信息检索评估
音频生成 - hydracore - 多轨道音频合成引擎
语音处理 - shennina - 语音特征可视化工具
音频处理 - pyfftw - FFT加速计算库
特征提取 - marsyas - 音频特征提取框架
语音合成 - mimic3 - 本地化TTS引擎
音频处理 - pytsmod - 时间拉伸与变调处理
音乐分析 - mirdata - 开源音乐数据集加载
语音识别 - google-cloud-speech - 云端语音转文本
音频增强 - nlpaug - 音频数据增强库
音频生成 - pysynth - 简单波表合成器
文件处理 - aifc - AIFF格式文件读写
音频处理 - pyrubberband - 实时音高修正
语音分析 - librosa - 语音基频与共振峰检测
深度学习 - asteroid - 语音分离与去混响
音频可视化 - plotly - 交互式音频图表生成
音频处理 - pyACA - 音频内容分析工具包
语音生成 - tortoise-tts - 高质量多风格语音合成
音乐处理 - mido - MIDI消息解析与生成
音频分析 - essentia-streaming - 实时音频特征提取
语音处理 - pyAudioAnalysis - 语音情绪识别
音频生成 - omegaconf - 音频合成配置管理
文件处理 - ogg - OGG音频文件解析
音频处理 - pyfilter - 实时音频滤波处理
特征提取 - pyentropy - 音频信息熵计算
语音增强 - RNNoise - 实时语音降噪算法
音频合成 - subtractive - 减法合成器实现
音乐生成 - ImproVAE - 变分自编码器音乐生成
语音处理 - pywebrtc - WebRTC音频处理封装
音频分析 - pymir - 音乐节奏模式分析
文件处理 - pymedia - 多媒体文件格式支持
语音合成 - Coqui-TTS - 开源语音合成框架
音频处理 - pysox - SoX音频处理工具绑定
深度学习 - speex - 语音编解码与处理
音频生成 - sound-synthesis - 物理建模合成器
语音分析 - opensmile - 多模态特征提取工具
音频处理 - pyacoustid - 音频指纹识别与匹配
文件处理 - audiotools - 音频元数据编辑工具
音乐检索 - dejavu - 音频指纹识别与检索