使用 Edge-TTS 轻松实现文本转语音
什么是 Edge-TTS?
Edge-TTS 是微软提供的一款文本转语音(TTS)工具,依赖于 Microsoft Edge 的在线语音合成服务,支持多种语言和不同风格的声音。与传统的离线 TTS 工具相比,Edge-TTS 的声音更加自然,语音合成质量更高。
在本文中,你将学习如何安装、配置和使用 Edge-TTS 将文本转换为音频文件。
环境准备
在使用 Edge-TTS 之前,需要确保你的系统具备以下环境:
Python 3.7 以上版本
可以通过以下命令检查你的 Python 版本:1
python --version
Edge-TTS 安装
Edge-TTS 是一个 Python 工具,可以通过pip
安装:1
pip install edge-tts
网络连接
Edge-TTS 需要通过网络连接微软的语音合成服务,因此需要稳定的网络环境。
使用 Edge-TTS 的基本操作
1. 将文本转换为音频文件
Edge-TTS 可以将输入的文本转换成指定格式的音频文件(如 MP3)。
以下是基本使用命令:
1 | edge-tts --text "你好,欢迎使用Edge-TTS工具!这里是阿希の小镇" --voice zh-CN-XiaoxiaoNeural --output output.mp3 |
- **
--text
**:输入的文本内容。 - **
--voice
**:指定语音风格,例如zh-CN-XiaoxiaoNeural
代表中文普通话的自然女声。 - **
--output
**:输出文件的路径及名称。
示例:
执行上述命令后,将生成一个名为 output.mp3
的音频文件。
2. 支持的语言和声音
Edge-TTS 支持多种语言和音色。你可以通过以下命令查看所有可用的语音:
1 | edge-tts --list-voices |
部分语音示例:
语言 | 语音名称 | 描述 |
---|---|---|
中文(普通话) | zh-CN-XiaoxiaoNeural | 自然女声 |
中文(普通话) | zh-CN-YunjianNeural | 自然男声 |
英文(美国) | en-US-AriaNeural | 英语自然女声 |
英文(美国) | en-US-GuyNeural | 英语自然男声 |
注意:根据需求选择合适的语言和声音名称。
3. 读取文本文件并生成语音
Edge-TTS 还支持直接读取文本文件,将其中的内容转换为语音文件。
步骤:
- 新建一个文本文件
input.txt
,输入以下内容:1
Edge-TTS 是微软提供的文本转语音工具,声音自然流畅,适合多种场景使用。
- 使用以下命令读取文件并生成音频:
1
edge-tts --text-file input.txt --voice zh-CN-XiaoxiaoNeural --output result.mp3
参数解析:
- **
--text-file
**:指定输入的文本文件路径。 - **
--voice
**:指定语音风格。 - **
--output
**:指定输出音频文件名称。
运行完成后,会生成一个名为 result.mp3
的音频文件。
进阶使用:添加语速和音量控制
Edge-TTS 允许自定义语速和音量,可以通过 SSML(语音合成标记语言)来实现。
示例 SSML 文件
新建一个 example.ssml
文件,内容如下:
1 | <speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="zh-CN"> |
- **
rate
**:语速(如+10%
表示加快 10%)。 - **
volume
**:音量(如loud
表示音量加大)。
使用 SSML 文件生成语音
运行以下命令:
1 | edge-tts --ssml example.ssml --output advanced.mp3 |
常见问题
命令执行失败?
- 确保 Python 和 edge-tts 已正确安装。
- 使用
pip show edge-tts
检查安装路径。
语音无法播放?
- 确保输出文件格式(如 MP3)与播放器兼容。
网络问题?
- Edge-TTS 需要网络连接,请检查网络状态。
总结
通过 Edge-TTS,你可以轻松实现文本转语音,生成高质量的音频文件。它支持多种语言和自然语音风格,非常适合博客配音、播客制作或语音助手开发等场景。
赶快试试,将你的文字转化为优美的语音吧!
如果你需要进一步的帮助,或者想了解更多 Edge-TTS 的用法,欢迎在评论区交流!