京东数科AI主播上岗 可用于招聘、客服等多场景
【TechWeb】5月28日消息,近日,AI主播亮相京东数科产业AI公开课,而这也是京东数科自主研发的AI虚拟数字人产品首次出现在公众面前。据介绍,京东数科融合了2D和3D技术,将传统方法与深度学习结合,仅需使用一段几分钟的人物视频数据,经过几小时训练就可以合成出写实风格的AI虚拟数字人。
据悉,为了顺利实现文字到语音的转化,京东数科自研了轻量级对抗语音合成技术,通过结合深度神经网络在多人数据上进行个性化建模,达到音色丰富、特色鲜明的语音合成效果,甚至可以模拟人的呼吸和停顿,听感酷似真人。高效轻量的对抗神经网络大幅提升了合成速度,合成1秒音频只需0.07秒,合成时延仅为业界水平的1/3,充分支持多场景实时语音合成。
在语音生成视频的阶段,为了使AI主播形象更加逼真,京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。为了在口型匹配方面达到完美效果,京东数科AI实验室利用大量语音数据,并特意设计了鲁棒的语音特征,使其可以被不同音色、语言和语速的合成语音所驱动,且都能保持准确、连贯的口型。
最终,京东数科开发出了高度还原真人形象的AI虚拟数字人,在AI算法的驱动下,只需输入文本内容,“小妮”就能根据语义实时进行主持,且表情、动作和语音表达非常自然逼真。
京东数科AI实验室首席科学家薄列峰表示:“AI主播小妮的推出,是京东数科在多模态AI技术领域一次成功的落地应用。除了在客服、招聘等领域的应用之外,我们还将服务内容创造者,通过AI虚拟数字人技术,把静态图文内容转化为由‘真人’讲解的短视频,满足用户对多样化呈现形式的需求,增强用户黏性和社区活跃度。”
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
盒马CEO侯毅将退休 CFO严筱磊将兼任CEO
卖完即止!特斯拉Model Y HW3.0现车优惠最高超1万元
央视315晚会曝光六大互联网消费黑幕 你中招了吗?
借4万多元、到手2万多元?央视315晚会曝光同程金融APP礼品卡套路
央视315晚会曝光婚恋平台乱象 世纪佳缘、珍爱网等被点名
央视315曝光AI伪造变脸变声诈骗
央视315曝光主板机黑灰产业链:网络水军利用主板机随意更改IP 逃避监管
去年央视315曝光的企业,现在怎么样了?
小米汽车即将开售 雷军回应“个别用户或公司享有优先购车权”
更多
- OpenAI CEO透露GPT-5发布时间尚未确定 终极目标是开发AGI
- 苹果iPad Air也有望转向OLED屏 但要等2028年
- 消息称20多年的Apple ID将成历史 在今年被Apple Account取代
- XAI大模型Grok-1已正式开源 但并不是在马斯克说的上周
- 特斯拉高管看好东南亚市场潜力 电动汽车和储能电池都有发展潜力
- 宝马集团去年交付超过37万辆纯电动汽车 PHEV也交付超过19万辆
- 苹果再收购一家AI初创公司 已在年初收购DarwinAI
- TikTok被意大利开出1000万欧元罚单 涉及3家分支机构
- 半导体面板等推动 2月份韩国ICT产品出口额增至165亿美元
- 特斯拉柏林超级工厂已恢复生产Model Y 停产期间员工工资不受影响