Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

Voice-Pro,一款集字幕、翻译和TTS于一体的多语言音频处理工具 ,一键安装。

Voice-Pro主要功能:

Voice-Pro支持超过90多种语言的实时翻译,适合直播或即时翻译场景。

Voice-Pro主要功能:

Studio选项卡

  • 提供 YouTube 下载器、噪音消除、字幕、翻译和 TTS 的集成环境

  • ffmpeg支持的所有视频/音频格式都可以使用

  • 可选择输出音频格式(wav、flac、mp3)

  • 100 种语言的语音识别和字幕创建

  • 选择适合 PC 性能的字幕创建选项(Whisper 模型和计算类型)

  • 翻译成 100 多种语言并通过 TTS 生成语音

  • 多语言视频中保留了原始视频的BGM和音效。

  • 支持TTS语音速度、音量、音调调节

Whisper Caption卡

  • 专门用于创建字幕的选项卡。支持 90 多种语言

  • 显示使用视频创建的字幕

  • 提供世界级亮点功能

  • 提供降噪功能(1-Demucs、2-MDXNet)

Translate选项卡

  • 专用翻译选项卡。支持 100 多种语言

  • 支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)

  • 也可以直接输入文字

  • 自动检测上传文件的语言

TTS选项卡

  • 仅 TTS 选项卡。支持超过100种语言和400种语音

  • 支持字幕文件(ass、ssa、srt、mpl2、tmp、vtt、microdvd、json)

  • 也可以直接输入文字

  • 自动检测上传文件的语言

  • 音调、音量和速度可调

Live Translation选项卡

  • 实时语音识别和翻译支持

  • 选择音频输入源,例如麦克风、扬声器等。

  • 提供保存捕获的音频、识别的字幕和翻译的字幕的功能

Batch选项卡

  • 批量处理大量文件

  • 字幕、翻译、TTS

Voice-Pro特征:

  • 您可以下载 YouTube 视频(mp4、webm)并将其另存为音频文件(mp3、wav、flac)。

  • 您可以通过消除噪音和分离人声来提高语音识别的准确性。使用MDX-Net和Meta的Demucs 。

  • 通过ai语音识别,提供自动字幕制作、机器翻译、TTS功能。

  • 您可以轻松制作多语言视频。

  • 一键安装。安装后,您可以永久使用它,无需额外费用。 (※ 免费版有30分钟使用时间限制)

  • 提供Web-UI 。推荐使用谷歌Chrome浏览器。

Voice-Pro项目地址:https://github.com/abus-aikorea/voice-pro


收藏

相关文章

最新工具
Aidge
Aidge

基于阿里巴巴国际数字商业集团的大语言模型和多模态大模型,为客户提...

叠叠加数据
叠叠加数据

一款专为跨境电商卖家设计的AI数据分析和选品工具,主要用于帮助卖...

Oneimg
Oneimg

文字转图片应用,无需拖拽排版,直接输入内容,一键导出长图。

十分会写
十分会写

一个利用AI赋能文书写作平台。提供全面的AI文书工具,涵盖降重、...

FacePoke
FacePoke

一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放...

集思录
集思录

一个以数据为本的投资社区,提供新股、可转债、债券、ETF、封闭式...

VideoToConvert
VideoToConvert

一个免费的在线视频转换工具,支持多种格式转换,如 MOV 转 M...

VidFul.ai
VidFul.ai

一个利用Kling AI和Luma AI Dream Machi...

SocialBook
SocialBook

专注于海外网红营销领域。SocialBook利用人工智能、大数据...

GPT智库
GPT智库

一款强大的人工智能大模型综合应用,提供智能对话、文生图、图生图、...