auk

aukit

audio toolkit. 好用的语音处理工具箱,包含语音降噪、音频格式转换、特征频谱生成等模块。

Showing:

Popularity

Downloads/wk

0

GitHub Stars

140

Maintenance

Last Commit

3mos ago

Contributors

3

Package

Dependencies

5

License

Categories

Readme

aukit

aukit

audio toolkit: 语音和频谱处理的工具箱。

安装


pip install -U aukit

  • 注意

    • 可能需另外安装的依赖包:tensorflow, pyaudio, sounddevice。

    • tensorflow<=1.13.1

    • pyaudio暂不支持python37以上版本直接pip安装,需要下载whl文件安装,下载路径:https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio

    • sounddevice依赖pyaudio。

    • aukit的默认音频采样率为16k。

版本

v1.4.6

audio_cli

命令行,播放音频,去除背景噪声,音频格式转换。

支持递归处理文件夹内的全部音频。

命令行

说明
  • 用位置参数来控制。

  • 名称说明

    • inpath:输入音频路径或目录。

    • outpath:输出音频路径或目录,如果为目录,则输出的子目录按照inpath的子目录格式输出。

    • sr:音频采样率,默认16000或自动识别采样率。

    • in_format:输入音频格式,主要用以限制为指定后缀名的文件,如果不设置,则处理目录的全部文件。

    • out_format:输出音频格式,主要用以音频格式转换,设置输出音频的后缀名。

  • 中括号【[]】里面的是可选参数。

工具

  • auplay: 播放音频

auplay inpath [sr] [in_format]

  • aunoise: 语音降噪

aunoise inpath outpath [in_format]

  • auformat: 音频格式转换

auformat inpath outpath out_format [in_format]

audio_changer

变声器,变高低音,变语速,变萝莉音,回声。

基于librosa的变声。

audio_editor

语音编辑,切分音频,去除语音中的较长静音,去除语音首尾静音,设置采样率,设置通道数。

音频格式相互转换,例如wav格式转为mp3格式。

切分音频,去除静音,去除首尾静音输入输出都支持wav格式。

语音编辑功能基于pydub的方法,增加了数据格式支持。

audio_griffinlim

griffinlim声码器,线性频谱转语音,梅尔频谱转语音,TensorFlow版本转语音,梅尔频谱和线性频谱相互转换。

audio_io

语音IO,语音保存、读取,支持wav和mp3格式,语音形式转换(np.array,bytes,io.BytesIO),支持【.】操作符的字典。

audio_noise_remover

语音降噪,降低环境噪声。

audio_normalizer

语音正则化,去除音量低的音频段(去除静音),调节音量。

语音正则化方法基于VAD的方法。

audio_player

语音播放,传入文件名播放,播放wave数据,播放bytes数据。

audio_spectrogram

语音频谱,语音转线性频谱,语音转梅尔频谱。

audio_tuner

语音调整,调整语速,调整音高。

audio_world

world声码器,提取语音的基频、频谱包络和非周期信号,频谱转为语音。调音高,调机器人音。

历史版本

v1.4.6

  • 变声采用librosa包的stft。

v1.4.5

  • logger改为file

v1.4.4

  • Dict2Obj方法增加parse方法。

v1.4.3

  • 修正Dict2Obj的get方法达不到预期的bug。

  • 修正world声码器变声静音报错的bug。

v1.4.1

  • 修正安装依赖报错的bugs。

  • set系列改为convert系列,如set_sample_rate改为convert_sample_rate。

  • Dict2Obj用dotmap模块的DotMap代替。

v1.4.0

  • 增加音频格式转换方法。

  • 命令行批量处理语音,支持音频播放、语音降噪、音频格式转换。

  • 增加命令行工具:auplay, aunoise, auformat。

  • 调整日志输出方法。

v1.3.12

  • 减少不必要的依赖,最低依赖只保留pydub, scipy, numpy, librosa。

Rate & Review

Great Documentation0
Easy to Use0
Performant0
Highly Customizable0
Bleeding Edge0
Responsive Maintainers0
Poor Documentation0
Hard to Use0
Slow0
Buggy0
Abandoned0
Unwelcoming Community0
100
No reviews found
Be the first to rate

Alternatives

No alternatives found

Tutorials

No tutorials found
Add a tutorial