小米AI实验室六篇论文获ICASSP2022收录,多模态语音唤醒挑战赛夺冠
1月22日,全球语音、声学顶级会议ICASSP 2022公布了论文入选名单,小米AI实验室6篇学术论文被接收。小米“自由说”系统在MISP(基于多模态信息的语音处理)挑战赛中荣获多模态语音唤醒第一名和多模态语音识别第二名,并受邀在今年5月的全球会议上向工业界和学术界进行方案报告。这也是小米语音方向取得的第6个世界级比赛冠军。
ICASSP(International Conference on Acoustics, Speech and Signal Processing)即国际声学、语音与信号处理会议,是IEEE主办的全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,在国际上享有盛誉并具有广泛的学术影响力。
小米AI实验室被录用的论文涉及语音识别、语音合成、声学语音质量评价等诸多方向。此次,小米语音、声学取得了优异的成绩,离不开小米工程师们在实际业务中扎实的技术积累,将实践中总结的技术进步向业界和学术界进行回馈,共同促进AI技术的繁荣和发展。
在语音领域,小米语音团队在2017年开始在学术顶会发表重要论文,并在TTS(语音合成)全面自研以及在合成的韵律、个性化、以及情感这三个方面实现了重大的突破;智能生活助理小爱同学的声音定制效果、合成流畅度与稳定性、合成的情感化都有显著提升。
同时,小米在语音唤醒和预训练方面进行了深入研究,提升了手机个性化语音唤醒和小米闻声的性能,降低了小爱误唤醒率,保障了语音唤醒的质量,受到ICASSP的审稿人的高度评价。
在声学领域,小米声学团队致力于AI声学技术的研究及工程落地,为小米手机及IoT全生态硬件产品打造业界领先的音频体验。目前AI通话降噪、协同唤醒、协同放音、空间音频等技术已在手机、电视、小爱、耳机等60余款产品中落地。4年来累计过审专利已达123项。
未来,小米将不断探索科技新高度,为大家带来更多黑科技,让更多人享受科技带来的美好生活。
您可能也感兴趣:
官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
外媒:苹果MR头显设计独特复杂 给生产带来前所未有的挑战
iPhone 15 Pro Max核心参数曝光:首发3nm A17芯片+8GB内存
机构数据显示特斯拉Model Y一季度在国内销售9.44万辆
马斯克深夜到访特斯拉上海超级工厂 新款Model 3或将量产
阿里影业2023财年经调整EBITA盈利2.95亿元 同比增加106%
周鸿祎:多模态大模型+物联网 是下一个风口
FF 91迎来交付时刻 贾跃亭开抖音造势 你愿意再次为梦想窒息吗?
赛力斯:大股东质押风险可控 不存在平仓风险
苹果WWDC23主题演讲有望超过2个小时 成苹果最长主题演讲之一
更多
- 哪吒汽车5月全系交付13029辆 同比增长18%,哪吒GT交付1716辆
- 360孙浩:进军SMB市场,360安防产品有独特优势
- 再创品牌新高 广汽埃安5月销量45003辆,同比增长114%
- 高通骁龙8 Gen3参数曝光:5颗大核加持 小米14系列或将首发
- 推动安防行业新升级 360智慧生活举行视觉大模型及AI硬件新品发布会
- 最远可续航1370公里 吉利银河L7上市:售价13.87-17.37万元
- 马斯克深夜到访特斯拉上海超级工厂 新款Model 3或将量产
- 阿里影业2023财年经调整EBITA盈利2.95亿元 同比增加106%
- 周鸿祎:多模态大模型+物联网 是下一个风口
- 赛力斯:大股东质押风险可控 不存在平仓风险
更多
- 苹果App Store去年创收1.1万亿美元 超九成归于开发者和企业
- 韩国半导体出口额同比仍在下滑 5月份降至73.7亿美元
- 外媒:苹果MR头显设计独特复杂 给生产带来前所未有的挑战
- 机构数据显示特斯拉Model Y一季度在国内销售9.44万辆
- 苹果WWDC23主题演讲有望超过2个小时 成苹果最长主题演讲之一
- LG电子正同初创公司Tenstorrent联手研发下一代芯片
- 苹果推出Android版Apple Music Classical古典音乐应用
- 外媒称苹果已下调MR头显上市首年销量预期 由300万台降至90万台
- WWDC23临近 苹果MR头显屏幕规格曝光:搭载2块1.41英寸屏幕
- 苹果正式发布WWDC23预告 混合现实头显有望发布