Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

#Ai工具箱 #Ai开源项目

Whisper语音识别模型简介

Whisper 是Openai 开源音频转文字的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Whisper有五种模型尺寸，提供速度和准确性的平衡，其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求和相对速度。

码多多Al智能聊天系統

码多多Al智能聊天系統是一款基于人工智能技术的聊天系统AI源码。...

豆包MarsCode

字节跳动旗下推出的一个免费AI编程助手，一个基于 AI 的云 I...

Agent TARS

一个字节跳动开源的多模态 AI 代理工具，Agent TARS能...

Motionshop

AI角色动画工具，通过先进的视频处理和3D渲染技术，Motion...

AnimateDiff

AnimateDiff 是一个能够将个性化的文本转换为图像的扩展...

ProPainter

ProPainter，一键移除视频内的移动物体，一键移除视频水印...

TryOnDiffusion

TryOnDiffusion就谷歌推出的一项新虚拟试穿功能，能够...

PydanticAI

一个Pydantic 团队开发的Python代理框架，可以通过生...

BotSharp

一个基于.NET开发的开源AI多智能体应用开发框架，它可以快速将...

Colors

一个开源的学术期刊配色推荐器，收集整理了众多高质量论文插图的配色...