Ai应用
Ai资讯
AI生图
AI生视频
AI生PPT
AI数字人系统

首页 > Ai导航 > Ai工具箱 > Ai语音工具

Fish Speech

Fish Speech

Fish Audio 开发的文本转语音 (TTS) 解决方案。它提供先进的 TTS 功能并支持多种语言，完美支持中英日语言的开源TTS模型。

#Ai工具箱 #Ai语音工具

访问Fish Speech

收藏

Fish Speech简介

Fish Speech 是 Fish Audio 开发的文本转语音 (TTS) 解决方案。它提供先进的 TTS 功能并支持多种语言，完美支持中英日语言的开源TTS模型，语音处理接近人类水平，模型使用约十五万小时三语数据训练，对中文支持非常的完美。

Fish Speech特点：

模型版本：当前稳定版本为 Fish Speech 1.1.2，正在更新至 1.2 版本 1。初始版本 Fish Speech V1 使用 15 万小时的英语、中文和日语音频数据进行训练。
许可：代码库根据 BSD-3-Clause 许可证发布，而模型根据 CC-BY-NC-SA-4.0 许可证发布。
在线演示：用户可以通过 Huggingface Spaces 和 Fish Audio 2 上提供的在线演示来尝试 Fish Speech。
系统要求：对于推理，需要至少 4GB 内存的 GPU，而微调则需要 16GB 的 GPU 内存。该系统同时支持Linux和Windows。
Windows 设置：非专业 Windows 用户可以通过提供的批处理脚本 ( install_env.bat ) 安装环境。可以选择使用镜像站点下载依赖项并启用模型编译的编译环境。
致谢：Fish Speech 的发展受到多个项目的影响，包括 VITS2、Bert-VITS2、GPT VITS、MQTTS、GPT Fast 和 GPT-SoVITS。

Fish Speech.jpg

Fish Speech应用：

语音助手：Fish Speech 可以集成到语音助手平台中，以多种语言提供听起来自然的响应，可以增强用户交互性和可访问性。

有声读物旁白：高质量的语音合成使 Fish Speech 适合生成书面内容的有声读物版本。

语言学习：鱼语音支持英语、中文和日语，可用于语言学习应用程序，通过生成目标语言的语音来帮助学生练习发音和听力技能。

辅助工具：Fish Speech 可用于辅助工具中，通过将文本转换为语音来帮助视障用户。

客户服务机器人：与客户服务机器人集成可以通过自然的语音实现与客户交互。

内容创作：可以使用 Fish Speech 为视频、播客和其他多媒体内容生成画外音。

Fish Speech由 fishaudio 开发，作为一个仅有亿级参数的模型，Fish Speech 的设计非常的轻量而且高效。它可以在个人设备上轻松运行和微调，很方便成为您的私人语音助手。

github代码：https://github.com/fishaudio/fish-speech

huggingface：https://huggingface.co/fishaudio/fish-speech-1.2

相关资讯：

10款优秀的开源TTS语音模型推荐

Fish Speech 与 Google 的Tacotron或Amazon Polly等其他TTS模型相比如何？

与Fish Speech相关工具

Spark-TTS

SparkAudio团队开发的文本转语音（TTS）系统，基于 Qwen2.5 构建，能够生成自然、高质量的语音。并支持...

FishAudio

一个在线AI文本转语音合成配音声音克隆平台，以其自然、富有表现力的语音生成技术，为用户带来了前所未有的音频体验。

kokoroTTS

一款开源、高性能的文本转语音（TTS）模型，Kokoro TTS拥有8200万参数，基于StyleTTS 2架构，提供高...

Ciallo TTS

一款免费的在线文本转语音工具，支持超过300种不同语言和口音的声音，可调节语速和语调，提供即时试听和下载功能。

ChatTTS-Forge

ChatTTS-Forge

一个围绕 TTS生成模型开发的项目，ChatTTS-Forge为用户提供灵活的TTS生成能力，支持多种音色、风格控制、长...

ToucanTTS

一套用于最先进语音合成的工具包，ToucanTTS覆盖超过7,000种语言的大型多语言模型。

最新工具

即梦AI

荐

剪映Dreamina的中文品牌名称，是一个集成了AI作图和AI视...

星火绘镜

一款由科大讯飞推出的AI文生视频创作平台，可以轻松地从文字描述生...

讯飞智作

一款集AI配音、虚拟数字人视频生成、PPT生成视频、数字人定制等...

配音神器PRO

一款功能强大的配音软件，提供调整语速、插入停顿、检测敏感词、调节...

声动视界SoundView

一款面向带货短视频的AI视频工具，声动视界SoundView提供...

Udio

由前 Google Deepmind 研究人员开发的AI音乐生成...

Suno AI

Suno AI 是由 Anthropic 公司开发的一款 AI ...

Noiz AI

一款专注于语音合成与克隆的AI工具，依托自研的超大语音模型，能够...

NotaGen

由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款 ...

Spark-TTS

SparkAudio团队开发的文本转语音（TTS）系统，基于 Q...

人生若只如初见

用户登录