本文最后更新于 2024-11-04,文章内容可能已经过时。

conda create -n paddle python=3.10
conda activate paddle

ChatTTS

git clone https://github.com/2noise/ChatTTS
cd ChatTTS
pip install --upgrade -r requirements.txt -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

ERNIE Bot

ERNIE Bot基础教程 - 飞桨AI Studio星河社区

pip install erniebot -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

鉴权

在百度个人中心复制

import erniebot

erniebot.api_type = 'aistudio'
erniebot.access_token = '{YOUR-ACCESS-TOKEN}'

PaddlePaddle

开始使用_飞桨-源于产业实践的开源深度学习平台

笔者是在自己的迷你主机上跑的,现在还没有弄明白amd迷你主机gpu的使用方法,因此安装的cpu的版本。

pip install paddlepaddle

PaddleSpeech

pip install pytest-runner
pip install paddlespeech

修复 kaiser 导入失败

在使用PaddleSpeech的时候如果出现了ImportError: cannot import name 'kaiser' from 'scipy.signal' (/opt/conda/envs/python35-paddle120-env/lib/python3.10/site-packages/scipy/signal/__init__.py)

可以参考[Fix] 修复 kaiser 导入失败

在该文件中修改即可

#from scipy.signal import kaiser
from scipy.signal.windows import kaiser

Pyaudio

sudo apt-get install libasound-dev portaudio19-dev libportaudio2 libportaudiocpp0
pip install pyaudio

Snowboy

基于 Snowboy 实现语音唤醒 | 拾遗记

Snowboy 是一个可定制的热词检测引擎,可以利用它来实现语音唤醒功能。

sudo apt install build-essential git swig libatlas-base-dev sox -y
sudo apt install portaudio19-dev python3-pyaudio -y

Github 上存在两个 Snowboy 的代码库,一个是 Kitt.ai/Snowboy,在 Kitt.ai 不维护之后,Seasalt.ai/Snowboy 又继续维护了一段时间。

我们首先要把 Snowboy 的代码库拉下来:

git clone https://github.com/seasalt-ai/snowboy.git

然后进行编译:

cd snowboy/swig/Python3
make

之后修复代码中的包引入问题,将 examples/Python3/snowboydecoder.py 文件中的 from . import snowboydetect 修改为 import snowboydetect

运行测试

官方提供了一些预置的唤醒词模型,位于 resources/models/ 文件夹下。

之后运行 examples/ 文件夹下的 demo.py 文件来进行验证语音唤醒功能:python demo.py resources/models/snowboy.umdl

当说出唤醒词 snowboy 时程序会播放叮的声音,这样就代表语音唤醒成功了。