Ai应用
Ai资讯
AI生图
AI生视频
AI生PPT
AI数字人系统

首页 > Ai资讯 > Ai产品

Speech-02：MiniMax Audio新发布的一款强大的文本转语音（TTS）模型

Speech-02于2025-04-01发布在Ai产品

Speech-02是什么？

MiniMax Audio Speech-02是一款强大的文本转语音（TTS）模型，能够将任何文件或URL瞬间转化为逼真的音频。它支持高达20万字符的单次输入，覆盖30多种语言，并带有地道口音。此外，Speech-02还支持无限语音克隆、亚秒级流媒体处理以及多种音频格式（如FLAC、WAV、MP3和PCM）。

Speech-02模型提供两种版本：speech-02-hd-preview（以99%的语音相似度和工作室级清晰度为特点，适合配音、有声书等需要逼真表现的场景）和speech-02-turbo-preview（在低延迟和高性能之间取得平衡，适合实时应用）。

Speech-02：MiniMax Audio新发布的一款强大的文本转语音（TTS）模型.webp

语言与语音能力

多语言支持：Speech-02支持30多种语言的文本转语音，包括英语、中文、日语、韩语、法语、德语、西班牙语、葡萄牙语、意大利语、阿拉伯语、俄语、土耳其语、荷兰语、乌克兰语、越南语、印地语、泰语、波兰语、罗马尼亚语、希腊语、芬兰语和印尼语等，且带有地道口音。
语音库丰富：拥有300多个真实自然的声音，支持多种语言的地道表达。

技术性能

单次输入字符数：单次输入支持高达20万字符。
流媒体处理速度：支持亚秒级流媒体处理。
模型版本：包括speech-02-hd-preview和speech-02-turbo-preview。前者以99%的语音相似度和工作室级清晰度为特点，适合配音、有声书等需要逼真表现的场景；后者则在低延迟和高性能之间取得平衡，适合实时应用。

Speech-02功能特性

无限语音克隆：能够以行业领先的质量，快速克隆出多种风格和语调的语音。
语音控制：用户可以轻松控制语音的情感、音量、速度和输出格式。
语音混合：可以将现有的语音组合起来，创造出全新的独特语音。
音频格式支持：支持FLAC、WAV、MP3和PCM等多种音频格式。

Speech-02应用场景

有声书制作：适合将长篇小说、学术论文等转化为高质量的音频内容。
播客创作：帮助播客创作者制作更具吸引力和多样性的内容。
电影与游戏配音：提供电影级低音和沉浸式音频效果。
国际会议与翻译：支持在多种语言之间即时无缝切换。

目前，Speech-02模型已经在MiniMax Audio平台及API平台上线，但国内版尚未推出。

官方链接

MiniMax Audio平台：https://www.minimax.io/audio

MiniMax Audio API平台：https://www.minimax.io/platform

收藏

#文本转AI语音

Saber：一款效果跟纸质手写的跨平台开源笔记应用

上一篇

Saber：一款效果跟纸质手写的跨平台开源笔记应用

Amazon Nova Act：亚马逊推出的具备操控网页浏览器并自主执行简单任务的的AI智能体

下一篇

Amazon Nova Act：亚马逊推出的具备操控网页浏览器并自主执行简单任务的的AI智能体

相关文章

llasa 3B TTS：基于LLaMA架构的文本到

llasa 3B TTS：基于LLaMA架构的文本到

2025-01-25

OpenAI 发布了三款全新语音模型，包括两款语音转

OpenAI 发布了三款全新语音模型，包括两款语音转

2025-03-21

Llasa:一款基于Llama的文本转语音（TTS）

Llasa:一款基于Llama的文本转语音（TTS）

2025-03-04

Octave：Hume AI发布的一款TTS模型，可

Octave：Hume AI发布的一款TTS模型，可

2025-02-27

Zonos-TTS：多语言文本转语音模型，支持声音克

Zonos-TTS：多语言文本转语音模型，支持声音克

2025-02-11

SpeechGPT 2.0-preview：首个面向

SpeechGPT 2.0-preview：首个面向

2025-01-27

最新文章

最新工具

Awesome LangGraph

Awesome LangGraph

一份精心整理的 LangGraph 资源合集，涵盖了基础介绍、入...

VDSpeak

一个专注于为YouTube视频提供多语言翻译和配音服务的在线工具...

PydanticAI

一个Pydantic 团队开发的Python代理框架，可以通过生...

AutoGLM沉思

智谱推出的一款集深度研究与实际操作能力于一体的AI Agent产...

JustAI

一款AI文案写作与营销工具，能生成多场景文案，包括小红书笔记、抖...

巧文书

原通答AI，一款专为企业打造的AI智能写标书工具，通过AI大模型...

Ai2 Paper Finder

Ai2 Paper Finder

一款由艾伦AI研究所发布的基于LLM的文献搜索系统，Ai2 Pa...

Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI ...

Ghibli AI

一款专门用于生成吉卜力风格的AI图像生成器，能够根据用户的文本描...

快出题

金数据旗下的一款AI驱动的在线考试软件，能够快速生成题库并自动组...

人生若只如初见

用户登录