阿里达摩院推出新目标检测框架DAMO-YOLO 兼顾速度与精度
通用目标检测是计算机视觉的基本问题之一,在目标检测经典框架YOLO的基础上,阿里达摩院新推出了新框架DAMO-YOLO,兼顾速度与精度,已成为最新的SOTA。达摩院已宣布将该框架开源,并在魔搭社区上免费开放使用。
所谓目标检测,是让AI在图片中找到某些特定物体,不仅要识别这些对象的种类,还得标注出这些物体的位置。可以说,没有目标检测,自动驾驶等AI应用无从谈起。YOLO全称是You Only Look Once,只需要看一眼就可以识别出图中物体的类别和位置。从2016年提出以来,YOLO因其高效、精准成为了目标检测的经典算法框架,并不断演进,获得广泛使用。

目标检测示意
达摩院研究团队在YOLO基础上进行了一系列创新,对原有架进行了大幅的修改,形成了新框架DAMO-YOLO,创新包括:基于神经网络结构搜索技术(NAS)的高效检测骨干网络(backbone),更深的多尺度特征融合检测颈部(neck),精简的检测头结构(head),以及引入蒸馏技术进一步提升效果。其中,新骨干网络结构采用了阿里自研的MAE-NAS,这是一种启发式和免训练的NAS搜索方法,可以用于快速大范围搜索各种不同规模的骨干网络结构。由于这些创新和优化,DAMO-YOLO在严格限制时延的情况下显著提升了精度,成为YOLO框架中的新SOTA。

DAMO-YOLO和其他YOLO的性能对比
为了进一步提升实用性,DAMO-YOLO引入TinyNAS技术,使得用户可以根据硬件算力情况进行低成本的检测模型定制,提高硬件利用效率并且获得更高精度。模型之外,DAMO-YOLO还提供高效的训练策略以及便捷易用的部署工具,以便快速解决工业落地中的实际问题。目前,该框架已在AI模型社区魔搭ModelScope上线,支持快速调用,0代码可以体验模型效果,1行代码实现模型推理,10行代码实现模型调优。
使用入口:https://www.modelscope.cn/models/damo/cv_tinynas_object-detection_damoyolo/summary
您可能也感兴趣:
官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
国内用户使用ChatGPT会有法律风险吗?
特斯拉全职员工超过12万 今年还有望进一步增加
机构预计去年全球电动汽车电池装机517.9GWh 同比大增超过70%
耗时十余年 日本国产大飞机项目宣告流产
快手:正开展大规模语言模型相关研究
昆仑万维:将在今年内发布中国版类ChatGPT代码开源 防止大公司技术垄断
货拉拉入局跑腿业务 预计3月中旬全面开放骑手注册
GSMA MWC上海2023年6月28日开幕
特斯拉Model Y和Model 3成2022年加州最畅销汽车
更多
- 特斯拉全职员工超过12万 今年还有望进一步增加
- 机构预计去年全球电动汽车电池装机517.9GWh 同比大增超过70%
- 耗时十余年 日本国产大飞机项目宣告流产
- 特斯拉Model Y和Model 3成2022年加州最畅销汽车
- Zoom宣布将裁员1300人 约占其全球员工总数15%
- 分析师称Apple Watch Series X和Apple Watch SE 3都将配备更大屏幕
- 拼多多Temu在加拿大开始测试 最快将于一季度推出
- 特斯拉前AI主管宣布将加入马斯克创立的OpenAI
- 机构分析师称近九成苹果用户拥有iPhone 超过七成有iPad
- Netflix出手打击账户共享行为:不住一起不能共享账号