DUIX

DUIX

硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互。

#Ai工具箱 #Ai开源项目
收藏

DUIX简介

硅基智能开源了DUIX,DUIX是2D 真人级、aiGC 实时渲染数字人模型!DUIX(Dialogue User Interface System)是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,让每个开发者可轻松创建智能化、个性化的数字人Agent,并应用到各行各业。

Duix:硅基数字人SDK.jpg

开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力实现数字人实时交互

可在Android和iOS多终端一键部署,DUIX还提供了 14 个数字人模板

支持低成本快速部署在 iOS、安卓或者大屏上,在平板、车载系统上也能流畅运行

支持 50 帧/秒的流畅画面,视频生成效率超过 1:0.5、满足直播等一些对实时性要求很高的场景

能精准的模拟动作、说话的唇形、微表情

DUIX适用场景:

部署成本低: 无需客户提供技术团队进行配合,支持低成本快速部署在多种终端及大屏。

网络依赖小: 适合地铁、银行、政务等多种场景的虚拟助理自助服务。

功能多样化: 可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。

DUIX核心功能:

部署成本低: 无需客户提供技术团队进行配合,支持低成本快速部署在多种终端及大屏。

网络依赖小: 适合地铁、银行、政务等多种场景的虚拟助理自助服务。

功能多样化: 可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。

实时视频交流:用户可以与数字人进行实时对话。

个性化定制:用户可以根据个人兴趣,选择自己喜欢的外观和声音,打造独特的交互体验。

多角色扮演:数字人可以成为你的伴侣、爱人或“百科全书”,满足需求。

情感联系:通过互动,用户与数字人建立情感纽带,享受陪伴的乐趣。

时刻:数字人的“时刻”展示了他们的虚拟生活,用户可以更深入地了解他们的个性和兴趣。

DUIX常见问题:

1.可以支持数字人定制吗?是基于照片还是视频?

答:可以支持数字人定制,我们是基于视频进行数字人定制。您可以定制专属的数字人用于SDK中。但定制的数字人属于付费服务,您可以联系客服邮箱。

2.如何定制形象?

答:定制硅基数字人需要拍摄一段 3-5 分钟的真人出镜口播视频,具体出镜姿势、口播内容,可以根据最终的真实使用场景来确定。比如用来制作法律咨询相关视频,即可选择正装出镜,口播法律相关内容,这样整体情景比较一致。

3.定制形象如何收费?

答:我们提供与SDK开源接口配套的数字人定制,定制价格为9800元/套,包括形象+声音,若有更多定制需求,可以联系客服邮箱。

4.数字人形象怎么更新?

答:目前开源的主要提供公共模特,有需求可以定制

5.形象克隆有API接口么?

答:训练服务目前只支持部署在我们的内部服务器进行调用

6.播报的wav文件,支持流式数据吗?

答:流式驱动正在做改造优化,暂时还不支持;

7.播报开始结束有没有相关回调方法?

答:播报开始结束的回调方法详见sdk文档

8.数字人动作有没有相关api控制?

答:数字人动作API,暂时还不支持

DUIX商业案例展示:

https://apps.apple.com/us/app/duix-your-ai-companion/id6451088879

商业案例展示.jpg

与DUIX相关工具