高说服力数字人:基于文心多模态大模型,具备“剧本生成”能力,声形超逼真
高说服力数字人是什么?
高说服力数字人是2025年4月25日,在百度Create大会上,百度创始人李彦宏发布的数字人产品。高说服力数字人声形超逼真、内容更专业、互动更灵活,能带来超越真人的体验。它由百度电商“慧播星”平台打造,基于文心4.5大模型,具备“剧本生成”能力,能让表情、语气、动作随台词实时调整,使情绪转折和动作切换自然流畅。比如百度生成的数字人,相貌、声音、动作和神情都很逼真,几乎和真人一样。
高说服力数字人核心技术
剧本驱动多模匹配:借助大语言模型生成剧本,涵盖台词、视觉标签和语音标签生成。生成台词时,同步生成数字人的动作、表情和语调等信息,对齐各模态位置,实现多模态内容匹配和位置对齐,生成有表现力、形神兼备的数字人。
多智能体调度:数字人能依据直播间实时热度和转化情况,灵活调度助播、场控、运营等角色促进转化,像适时切换镜头画面、调度图片和视频素材等,实现“一人即一支营销团队”。例如某汽车直播间,数字人主播讲解时,助播同步调出3D车型模型,转化效率提升40%。
多模高度融合:可完美复刻真人与直播间装修。百度研制数字人视频生成大模型,将视频、剧本、语音等多模态信号用于数字人高可控生成,再通过影空间对齐生成足够时长的视频内容。
面向数字人场景的语音合成:基于文心大模型预测文本风格、情绪及韵律起伏,通过文本自控语音合成大模型实现指令遵循合成,控制声音效果平滑流畅,结合直播文本和发音人信息,合成自然流畅的声音。
高说服力数字人应用场景
电商直播:这是高说服力数字人的重要应用领域。它能不知疲倦直播,覆盖商品讲解到氛围引导全流程。如某美妆直播间,数字人导购转化率比真人高25%;“溶溶精致生活”用慧播星数字人直播,月GMV达15万+,收益提升30%;“美丽家居服工厂”GMV增长60%;美妆个护品牌“左颜右色”用数字人试妆展示,单场GMV达29万+,直播间转化率提升60%。数字人还能根据直播间实时反馈自动决策,如发放优惠券、切换商品等。
其他领域:目前数字人系统正拓展到多行业,广泛应用于法律、教育、金融、汽车等垂类场景。部分汽车经销商用数字人进行车型介绍和互动问答;图书直播中,数字人能引经据典;健康产品带货时,能结合用户血糖等数据个性化推荐。法律行业的“法在心间”,新增律师数字人项目,依托慧播星脚本创作和大模型知识储备,精准解答法律问题、规避风险词,上线后线索获取成本降低75%,线索量提升近5倍。
高说服力数字人优势
低门槛:百度慧播星有“一键克隆”功能,用户录一段最短2分钟的直播视频上传训练,就能拥有专属数字人,人人可当主播。还能用ai帮写直播脚本,打造个性化直播间。
低成本:目前使用“高说服力数字人”直播月均成本控制在千元以内,比传统直播节省约80%。系统技术成本也在下降,过去一年下降约三分之二。在百度站内,商家借助平台扶持,几乎零成本就能开播。
高说服力数字人使用教程
录制视频:打开百度APP,搜索“慧播星”,点击“手机端一键开播”“创建数字人”。用手机录制一段2-3分钟的真人出镜视频,视频要求全程露脸,无需准备专业设备。
选择或自定义人设、主题和脚本:在等待视频上传时,可以选择慧播星准备好的人设,如情感咨询、读书分享等,AI会自动生成人设指南、直播主题和脚本。也可以自定义人设,如塑身爱好者等,并选择“AI帮我写”脚本来生成相关内容,整个脚本生成过程不到2分钟。
等待数字人制作完成:制作时间一般在3小时左右,制作好后会通过短信通知,页面也会提示开播时间。