京东数科AI主播上岗 可用于招聘、客服等多场景
【TechWeb】5月28日消息,近日,AI主播亮相京东数科产业AI公开课,而这也是京东数科自主研发的AI虚拟数字人产品首次出现在公众面前。据介绍,京东数科融合了2D和3D技术,将传统方法与深度学习结合,仅需使用一段几分钟的人物视频数据,经过几小时训练就可以合成出写实风格的AI虚拟数字人。
据悉,为了顺利实现文字到语音的转化,京东数科自研了轻量级对抗语音合成技术,通过结合深度神经网络在多人数据上进行个性化建模,达到音色丰富、特色鲜明的语音合成效果,甚至可以模拟人的呼吸和停顿,听感酷似真人。高效轻量的对抗神经网络大幅提升了合成速度,合成1秒音频只需0.07秒,合成时延仅为业界水平的1/3,充分支持多场景实时语音合成。
在语音生成视频的阶段,为了使AI主播形象更加逼真,京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。为了在口型匹配方面达到完美效果,京东数科AI实验室利用大量语音数据,并特意设计了鲁棒的语音特征,使其可以被不同音色、语言和语速的合成语音所驱动,且都能保持准确、连贯的口型。
最终,京东数科开发出了高度还原真人形象的AI虚拟数字人,在AI算法的驱动下,只需输入文本内容,“小妮”就能根据语义实时进行主持,且表情、动作和语音表达非常自然逼真。
京东数科AI实验室首席科学家薄列峰表示:“AI主播小妮的推出,是京东数科在多模态AI技术领域一次成功的落地应用。除了在客服、招聘等领域的应用之外,我们还将服务内容创造者,通过AI虚拟数字人技术,把静态图文内容转化为由‘真人’讲解的短视频,满足用户对多样化呈现形式的需求,增强用户黏性和社区活跃度。”
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
宁德时代:拟投资不超105亿元扩建动力电池生产线
网易Q4财报:游戏业务贡献近七成营收 平均每日进账约1.5亿
Crypto.com:全球加密货币用户数超1亿
泰国证交会就加密货币投资出台征求意见函 或要求年收入100万泰铢
名创优品公布2021财年Q2财报 净利润环比增长约70%
蘑菇街2021财年Q3营收1.465 亿元 首次实现单季度盈利
澜起科技2020年净利润11亿 同比增长18.31%
映客发布盈利预喜公告:2020年净利润同比增超200% 营收增长约五成
韩媒:SK海力士未来5年将斥资43亿美元购买极紫外光刻机 预计不少于20台
更多
- Crypto.com:全球加密货币用户数超1亿
- 泰国证交会就加密货币投资出台征求意见函 或要求年收入100万泰铢
- 韩媒:SK海力士未来5年将斥资43亿美元购买极紫外光刻机 预计不少于20台
- 理想汽车预计Q1交付量为10500至11500辆 同比增262.6%至297.1%
- 全球芯片短缺将持续一段时间 慧荣科技预计会到2022年底
- 加拿大银行VersaBank将在未来几个月内推出加元挂钩数字货币
- 巴菲特商业搭档芒格:比特币波动性太大 无法成为全球性交易媒介
- 研究机构预计全球AI市场营收今年将达到3275亿美元 同比增长16.4%
- 空中电动出租车创企Joby Aviation将通过与SPAC合并来公开上市
- 产业链消息人士:全球LCD面板价格在3月份将会更高