从炼大模型到大小模型协同进化!产研界联合发布端云协同平台“洛犀”
1月24日,在 “中国工程院院刊:信息领域青年学术前沿论坛”上,阿里巴巴达摩院、上海浙江大学高等研究院、上海人工智能实验室联合发布“洛犀”端云协同平台。该平台提供一站式的端云协同模型训练、部署、通信能力,致力于促进大小模型协同进化,构建充分利用大模型应用潜力的新一代人工智能体系。
因惊艳的性能表现和前所未有的任务迁移性,AI大模型在2021年迎来大爆发,但能耗问题限制其参数扩张及应用落地。2022达摩院十大科技趋势指出,大模型参数竞赛正进入冷静期,大小模型将在云边端协同进化——大模型向边、端的小模型输出模型能力,小模型负责实际的推理与执行,同时小模型再向大模型反馈算法与执行成效,让大模型的能力持续强化。
在此背景下,阿里巴巴达摩院联合上海浙江大学高等研究院、上海人工智能实验室研制了“洛犀”平台。该名取自宇宙中大小星体间永恒的洛希吸引力,并含强大、坚韧之意,寓意大小模型珠联璧合。
洛犀平台沉淀了端云两侧最佳实践的算法组件和平台服务。其中,平台在端侧以python/js package的形式提供服务,包含表征、文本理解、图计算等能力;在端云链路上,平台提供实现端云协同关键的通信能力,包括方案分发、数据通信链路;端云协同的模型训练累积沉淀在云端,包括端模型训练等。
包含10万亿参数的达摩院大模型M6,是目前业界最大的多模态预训练模型。通过洛犀平台技术,联合研究团队成功将3.4亿参数版本的M6模型高精度压缩至百万参数的10MB大小,以1/30的体积还原了90%以上性能,并试点部署于搜索场景,成为业界首个落地的端上预训练模型。此外,团队还借助洛犀完成了图神经网络、排序模型、强化学习等技术在端云协同范式下的部署。
“须弥藏芥子,芥子纳须弥。”浙江大学上海高等研究院常务副院长吴飞教授如此形容大小模型间的辩证关系。庞大的须弥山如何纳入极微小的种子中?答案是取其精髓、化繁为简。大模型通过高精度压缩,化身为终端可用的小模型,小模型的实践累积起来,将不断提升云端大模型的认知推理能力,实现“集众智者无畏于圣人”。
达摩院智能计算实验室负责人周靖人介绍,团队将进一步探索端云协同框架下端模型和云模型的协同机理,并完善算法方案和业务实践。洛犀平台未来计划对开发者开放,让大小模型协同进化的时代加速到来。上海人工智能实验室主任助理王延峰教授表示,实验室将携手产学研精英,共同构建具有国际影响力的人工智能生态。
您可能也感兴趣:
官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
理想汽车第一个百万辆量产车完成时间大概率会短于特斯拉
年轻人的第一台NAS该如何入手?(三)如何用Windows系统搭建NAS?
Meta正式发布人工智能聊天机器人Meta AI
分析师称iPhone 16系列将搭载A18、A18 Pro芯片 命名方式再度调整
ChatGPT再升级:终于可浏览互联网 不再局限于两年前旧数据
消息称iPhone SE 4在苹果内部代号Ghost 设计和硬件配置都将升级
法拉第未来计划通过发行股票筹集最多9000万美元资金
11999元起!华为Mate60 RS 非凡大师今日首销:直板手机旗舰之王
分析师普遍预计特斯拉Q3交付46.2万辆电动汽车 不及Q2
更多
- 理想汽车第一个百万辆量产车完成时间大概率会短于特斯拉
- iPhone 15系列初期所需显示屏主要由三星供应 京东方有望年底开始供货
- 投行分析师下调特斯拉三季度交付量预期 由45.5万辆降至44万辆
- Meta新一代VR头显Quest 3开启预订 起售价为499美元
- Meta正式发布人工智能聊天机器人Meta AI
- 分析师:苹果明年对3纳米制程工艺需求将低于预期
- 微软前首席产品官帕奈将担任亚马逊设备和服务业务负责人
- 分析师称iPhone 16系列将搭载A18、A18 Pro芯片 命名方式再度调整
- ChatGPT再升级:终于可浏览互联网 不再局限于两年前旧数据
- 消息称iPhone SE 4在苹果内部代号Ghost 设计和硬件配置都将升级