“史上最强开源大语言模型”Falcon 40B已在Amazon SageMaker JumpStart中可用
【TechWeb】6月9日消息,在Hugging Face上登顶、并搅动大模型领域风云的“新选手”Falcon 40B又有了新动态。
亚马逊云科技宣布,从6月7日起,两个开源Falcon大语言模型Falcon 40B和Falcon 7B已在Amazon SageMaker的机器学习中心Amazon SageMaker JumpStart中可用。
SageMaker JumpStart提供了预训练模型、内置算法和预构建的解决方案模板,可帮助用户快速上手机器学习,以执行文章总结和图片生成等任务。
用户只需在SageMaker Studio中轻点鼠标就可以部署和使用Falcon模型,或者通过SageMaker Python SDK以编程方式使用。
这意味着,现在,各个行业、各种规模的企业/开发者都可以快速轻松地部署自己的Falcon 40B模型,并对其进行定制以满足特定需求,如翻译、问答、信息总结、图像识别等应用程序。此举对生成式AI行业发展可谓意义重大。
Falcon 40B是谁?牛在哪儿
Falcon 40B是阿布扎比技术创新研究所(TII)推出的开源大型语言模型,是阿联酋首个大型人工智能模型。

Falcon 40B参数400亿,在1万亿高质量token上进行了训练。其性能超越硅谷大佬扎克伯格旗下650亿参数的LLaMA,以及StableLM、RedPajama和MPT等知名开源模型,一举登顶HuggingFace 开源大语言模型全球榜。

Hugging Face 开源LLM排行榜
Hugging Face一直被认为是大模型领域GitHub,因此Hugging Face的榜单被从业者给予了很高的参考价值。
不仅性能剽悍,Falcon 40B还是一个在训练资源上有很高效率的模型,只用到GPT-3 75%的训练预算,性能就显著超越GPT-3,且推理阶段的计算也只需GPT-3的1/5。
优异的表现让Falcon 40B获得“史上最强开源大语言模型”称号。
更重要的是,Falcon 大语言模型采用开源Apache 2.0许可证,基于开源原则,广泛地允许“免费使用”(如果商业化开源收入超过100万美金,需要缴纳10%的授权费用),这为广大AIGC产品开发者大开了方便之门。
开源的Falcon 40B让开发者能够构建和定制满足独特用户需求的AI工具,模型权重可供下载,检查和部署在任何地方。
基于亚马逊云科技训练完成
此番,Falcon开源大语言模型在Amazon SageMaker JumpStart中可用,可谓对生成式AI行业意义重大,广大开发者都很是兴奋。
事实上,Falcon大语言模型和Amazon SageMaker的“渊源很深”。
Falcon 大语言模型提供的两个不同规模的开源版本——Falcon 40B和Falcon 7B均是使用Amazon SageMaker的数据预处理和模型训练任务从零开始构建。
通常而言,构建、训练和部署大语言模型可能需要数周甚至数月的时间,并耗资数千万美元。为了实现更好的性能和成本效益,TII使用Amazon SageMaker构建其Falcon 40B模型。
SageMaker是一个托管API集合,用于开发、训练、调优和托管机器学习(ML)模型,包括大语言模型。SageMaker Training提供了具有用户自定义硬件配置和代码的计算集群。计算作业按运行次数计费,按秒分配任务,这意味着用户在未使用服务时无需为GPU资源付费。
据悉,TII使用SageMaker Training API提供的瞬态集群来训练Falcon大语言模型,最多支持48个ml.p4d.24xlarge实例(384个英伟达A100 GPU)。
现在,TII正在训练下一代Falcon大语言模型,将训练扩展到3136个A100 GPU(392个ml.p4d实例)。
除了Falcon外,Stability AI、AI21 Labs和LG AI等知名大模型也是使用SageMaker处理其大语言模型工作负载。
从TII对Amazon SageMaker的深度使用来看,为了让客户更轻松地访问该模型,Falcon 40B可以通过Amazon SageMaker Jumpstart部署可谓是水到渠成。
模型拿来可用 加速AIGC应用产品落地
在生成式AI赛道上,亚马逊云科技可谓是“既要”、“又要”的典型代表。“既要”为第三方大语言模型产品如Falcon 40B、Stability AI等提供基础计算能力和训练平台,同时,“又要”为第三方客户/开发者提供诸多可使用的“大语言模型产品”。
今年4月,亚马逊云科技推出Amazon Bedrock托管服务和Amazon Titan模型。Amazon Bedrock让开发者可以通过API访问AI21Labs、Anthropic和Stability AI等热门AI公司的预训练基础模型,还提供对亚马逊云科技开发的基础模型系列Amazon Titan的独家访问。
现在,通过Amazon SageMaker JumpStart,各行业客户都可以快速轻松地部署自己的Falcon 40B模型,并进行个性化定制。
那么,截至目前,在亚马逊云科技,开发者可以访问、部署、使用的大语言模型就有AI21Labs、Anthropic、Stability AI、Amazon Titan、Falcon 40B等。开发者可以在其中找到适合自身业务的模型,快速上手,使用自有数据基于基础模型进行定制,并将定制化模型集成并部署到应用程序。这一方式无疑将极大加速大语言模型应用产品的落地。
您可能也感兴趣:
官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
特斯拉推出Powershare双向充电功能 目前仅适用于Cybertruck
斥资13亿港元 阿里影业完成收购大麦网全部股权
拖大象、抗子弹、快过911!Cybertruck赛博皮卡北美开启交付
起价6万美元 特斯拉正式交付首批Cybertruck电动皮卡
B站Q3游戏营收降三成 CEO陈睿回应游戏业务调整
通用汽车计划大幅削减旗下自动驾驶汽车子公司Cruise支出
OpenAI宣布阿尔特曼正式重新成为CEO 新董事会正式成立
迪士尼CEO鲍勃·伊格尔:将于2026年底合同到期时卸任
谷歌研究人员发现OpenAI旗下ChatGPT可以泄露敏感信息
更多
- 智界S7上路,再次遥遥领先?
- 新能源车11月销量成绩出炉:理想提前达成年度目标,小鹏再创单月新高
- 最高续航715公里 哪吒S新享版车型上市:售价19.98万元起
- 比亚迪11月销量30.19万辆,方程豹、仰望品牌迎来交付
- 戴伟民、柴琇等业界大咖齐聚2023搜狐财经年度论坛 分享企业增长新路径
- 阿里云通义千问开源72B、1.8B两款大语言模型 并首度开源音频大模型
- PTC可持续发展副总裁:及早着手CSRD的3个理由
- 昆仑万维发布「天工 SkyAgents」平台,零代码打造AI智能体
- 起点读书为配角“填坑”《斗罗大陆》《凡人修仙传》等作品再更新
- 比亚迪推12月限时优惠政策:8.98万元买秦PLUS DM-i
更多
- 亚马逊委托马斯克旗下SpaceX进行三次火箭发射任务
- 阿斯麦监事会拟任命Christophe Fouquet为总裁兼首席执行官
- Canalys:在连续7个季度下滑后 全球PC出货量将在Q4恢复5%同比增长
- 11月份韩国芯片出口95亿美元 时隔15个月再次同比增长
- 调查机构:2023年全球智能手机出货量将同比下降5% 创近10年新低
- 特斯拉周四开始交付电动皮卡Cybertruck 但公司股价不涨反跌
- 特斯拉推出Powershare双向充电功能 目前仅适用于Cybertruck
- 苹果部分芯片将由Amkor在亚利桑那州新工厂封装
- 起价6万美元 特斯拉正式交付首批Cybertruck电动皮卡
- 通用汽车计划大幅削减旗下自动驾驶汽车子公司Cruise支出