什么是 Edge-TTS?

Edge-TTS 是微软提供的一款文本转语音(TTS)工具,依赖于 Microsoft Edge 的在线语音合成服务,支持多种语言和不同风格的声音。与传统的离线 TTS 工具相比,Edge-TTS 的声音更加自然,语音合成质量更高。

在本文中,你将学习如何安装、配置和使用 Edge-TTS 将文本转换为音频文件。


环境准备

在使用 Edge-TTS 之前,需要确保你的系统具备以下环境:

  1. Python 3.7 以上版本
    可以通过以下命令检查你的 Python 版本:

    1
    python --version
  2. Edge-TTS 安装
    Edge-TTS 是一个 Python 工具,可以通过 pip 安装:

    1
    pip install edge-tts
  3. 网络连接
    Edge-TTS 需要通过网络连接微软的语音合成服务,因此需要稳定的网络环境。


使用 Edge-TTS 的基本操作

1. 将文本转换为音频文件

Edge-TTS 可以将输入的文本转换成指定格式的音频文件(如 MP3)。
以下是基本使用命令:

1
edge-tts --text "你好,欢迎使用Edge-TTS工具!这里是阿希の小镇" --voice zh-CN-XiaoxiaoNeural --output output.mp3
  • **--text**:输入的文本内容。
  • **--voice**:指定语音风格,例如 zh-CN-XiaoxiaoNeural 代表中文普通话的自然女声。
  • **--output**:输出文件的路径及名称。

示例
执行上述命令后,将生成一个名为 output.mp3 的音频文件。


2. 支持的语言和声音

Edge-TTS 支持多种语言和音色。你可以通过以下命令查看所有可用的语音:

1
edge-tts --list-voices

部分语音示例

语言 语音名称 描述
中文(普通话) zh-CN-XiaoxiaoNeural 自然女声
中文(普通话) zh-CN-YunjianNeural 自然男声
英文(美国) en-US-AriaNeural 英语自然女声
英文(美国) en-US-GuyNeural 英语自然男声

注意:根据需求选择合适的语言和声音名称。


3. 读取文本文件并生成语音

Edge-TTS 还支持直接读取文本文件,将其中的内容转换为语音文件。

步骤

  1. 新建一个文本文件 input.txt,输入以下内容:
    1
    Edge-TTS 是微软提供的文本转语音工具,声音自然流畅,适合多种场景使用。
  2. 使用以下命令读取文件并生成音频:
    1
    edge-tts --text-file input.txt --voice zh-CN-XiaoxiaoNeural --output result.mp3

参数解析

  • **--text-file**:指定输入的文本文件路径。
  • **--voice**:指定语音风格。
  • **--output**:指定输出音频文件名称。

运行完成后,会生成一个名为 result.mp3 的音频文件。


进阶使用:添加语速和音量控制

Edge-TTS 允许自定义语速和音量,可以通过 SSML(语音合成标记语言)来实现。

示例 SSML 文件

新建一个 example.ssml 文件,内容如下:

1
2
3
4
5
6
7
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="zh-CN">
<voice name="zh-CN-XiaoxiaoNeural">
<prosody rate="+10%" volume="loud">
你好,这是一段使用 Edge-TTS 合成的语音,这里是阿希の小镇。
</prosody>
</voice>
</speak>
  • **rate**:语速(如 +10% 表示加快 10%)。
  • **volume**:音量(如 loud 表示音量加大)。

使用 SSML 文件生成语音

运行以下命令:

1
edge-tts --ssml example.ssml --output advanced.mp3

常见问题

  1. 命令执行失败?

    • 确保 Python 和 edge-tts 已正确安装。
    • 使用 pip show edge-tts 检查安装路径。
  2. 语音无法播放?

    • 确保输出文件格式(如 MP3)与播放器兼容。
  3. 网络问题?

    • Edge-TTS 需要网络连接,请检查网络状态。

总结

通过 Edge-TTS,你可以轻松实现文本转语音,生成高质量的音频文件。它支持多种语言和自然语音风格,非常适合博客配音、播客制作或语音助手开发等场景。

赶快试试,将你的文字转化为优美的语音吧!


如果你需要进一步的帮助,或者想了解更多 Edge-TTS 的用法,欢迎在评论区交流!