首页 > Ai资讯 > Ai产品

Llasa:一款基于Llama的文本转语音（TTS）,生成效果自然流畅富有感情

映技派于2025-03-04发布在Ai产品

Llasa是什么？

Llasa是由香港科技大学音频实验室开发的开源文本转语音（TTS）系统，基于 LLaMA 架构，结合了 XCodec2 语音标记技术，能够生成高质量、自然流畅、富有感情的语音，提高了语音合成的自然度、韵律准确性和情感表达能力，生成效果比较自然。

Llasa核心功能

高质量语音合成：能生成自然流畅的语音，支持中英文双语，语音自然度和情感表达出色。
情感表达：可合成带有快乐、悲伤、愤怒等情感色彩的语音，让语音更自然生动。
语音克隆：只需15秒声音样本，就能高度准确地克隆声音，保留原声音色和情感特征。
零样本学习：对没见过的说话者或情感也能进行语音合成，无需额外微调。
长文本支持：能处理长文本输入并生成连贯语音输出，适用于有声读物、语音播报等场景。

Llasa技术原理

架构：基于单层向量量化（VQ）编解码器和单个Transformer架构，与标准LLaMA模型完全对齐。
语音分词器：用XCodec2将语音波形编码为离散标记，保留语义和声学信息。
训练与推理扩展：增加模型规模（如1B、3B、8B参数）或训练数据量（如25万小时语音数据），提升语音自然度和情感表达能力。
自回归生成：逐个生成语音标记，保证语音在语义和韵律上与输入文本一致。

Llasa模型版本

Llasa有1B、3B和8B参数版本，支持中英文，可满足不同硬件资源和应用场景需求。

Llasa应用场景

适用于虚拟现实、游戏、无障碍服务、客户服务以及教育等领域以及适合做有声读物或语音助手。

智能语音助手：Llasa TTS能让智能设备或软件有自然流畅的语音交互功能，使用户体验更好。
有声读物与在线教育领域：它能把文本内容转化成生动语音，用于有声读物制作和在线教育，方便学生通过听来学习。
语音播报与客服：Llasa TTS可用于新闻播报、交通信息提示和客服系统，让信息传递更高效。
游戏与娱乐：它能为角色或虚拟形象配上个性化语音，增强沉浸感。
广告与市场营销：企业能用Llasa TTS生成广告语音，提升品牌宣传效果。
语音克隆与内容创作：Llasa TTS支持零样本语音克隆，只要15秒左右音频样本就能克隆特定人声的音色和情感，可用于广告配音、视频制作或个性化语音内容创作。

GitHub仓库：https://github.com/zhenye234/LLaSA_training

HuggingFace模型库：https://huggingface.co/collections/HKUSTAudio/llasa

在线体验Demo：https://huggingface.co/spaces/srinivasbilla/llasa-3b-tts

#文本转AI语音

CogView4：全球首个支持生成汉字的开源文生图生成模型

GitPodcast:将GitHub仓库的结构转换成播客内容

llasa 3B TTS：基于LLaMA架构的文本到

llasa 3B TTS：基于LLaMA架构的文本到

2025-01-25

Noiz AI配音使用教程指南

Noiz AI配音使用教程指南

2025-04-12

Speech-02：MiniMax Audio新发布

Speech-02：MiniMax Audio新发布

2025-04-01

OpenAI 发布了三款全新语音模型，包括两款语音转

OpenAI 发布了三款全新语音模型，包括两款语音转

2025-03-21

Octave：Hume AI发布的一款TTS模型，可

Octave：Hume AI发布的一款TTS模型，可

2025-02-27

Zonos-TTS：多语言文本转语音模型，支持声音克

Zonos-TTS：多语言文本转语音模型，支持声音克

2025-02-11

最新工具

选品酷BigTracker

一款由BQool比酷尔科技公司开发的专为寻找亚马逊爆款的卖家量身...

云知改写

一个基于先进深度语义分析、智能 AI 及文本处理技术开发的论文查...

Remove.photos

一款免费的图片背景去除工具，能 00% 自动在3秒内去除图片背景...

VideoIdeas Ai

一个为 YouTube博主量身定制的视频内容生成工具。它能在短时...

OnePPT

一款创新型AIPPT智能生成工具，提供智能写作、PPT生成、模板...

Hugo

一个使用 Go 语言开发的开源静态网站生成器，速度快，灵活性高。...

企鹅读伴

腾讯SSV数字支教实验室推出的AI阅读教育产品，由腾讯混元大模型...

Krillin AI

一款本地的视频翻译、配音和语音克隆的工具，适用于哔哩哔哩、小红书...

Lovart AI

一个全球首个适用于设计目的的自适应设计AI智能体平台，能将创意转...

ByeCode

一个新一代AI无代码开发平台，通过可视化拖拽组件，用户无需编码即...

用户登录