不输ChatGPT 国产AI大模型开测:为中文优化、支持国产CPU训练
ChatGPT今天升级了GPT-4模型,AI能力更加强大,国内在这方面也在迅速追赶,又一个国产版ChatGPT问世了,现在智谱AI推出的ChatGLM开始内测。
据介绍,对话机器人 ChatGLM(alpha内测版:QAGLM),这是一个初具问答和对话功能的千亿中英语言模型, 并针对中文进行了优化,现已开启邀请制内测,后续还会逐步扩大内测范围。

与此同时,继开源 GLM-130B 千亿基座模型之后,我们正式开源最新的中英双语对话 GLM 模型: ChatGLM-6B,结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。
经过约 1T 标识符的中英双语训练,辅以监督微调、 反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 虽然规模不及千亿模型,但大大降低了用户部署的门槛,并且已经能生成相当符合人类偏好的回答。
ChatGLM 参考了 ChatGPT 的设计思路,在千亿基座模型 GLM-130B1 中注入了代码预训练,通过有监督微调(Supervised Fine-Tuning)等技术实现人类意图对齐。
ChatGLM 当前版本模型的能力提升主要来源于独特的千亿基座模型 GLM-130B。它是不同于 BERT、GPT-3 以及 T5 的架构,是一个包含多目标函数的自回归预训练模型。
2022年8月,我们向研究界和工业界开放了拥有1300亿参数的中英双语稠密模型 GLM-130B1,该模型有一些独特的优势:
双语: 同时支持中文和英文。
高精度(英文): 在公开的英文自然语言榜单 LAMBADA、MMLU 和 Big-bench-lite 上优于 GPT-3 175B(API: davinci,基座模型)、OPT-175B 和 BLOOM-176B。
高精度(中文): 在7个零样本 CLUE 数据集和5个零样本 FewCLUE 数据集上明显优于 ERNIE TITAN 3.0 260B 和 YUAN 1.0-245B。
快速推理: 首个实现 INT4 量化的千亿模型,支持用一台 4 卡 3090 或 8 卡 2080Ti 服务器进行快速且基本无损推理。
可复现性: 所有结果(超过 30 个任务)均可通过我们的开源代码和模型参数复现。
跨平台: 支持在国产的海光 DCU、华为昇腾 910 和申威处理器及美国的英伟达芯片上进行训练与推理。
2022年11月,斯坦福大学大模型中心对全球30个主流大模型进行了全方位的评测2,GLM-130B 是亚洲唯一入选的大模型。
在与 OpenAI、谷歌大脑、微软、英伟达、脸书的各大模型对比中,评测报告显示 GLM-130B 在准确性和恶意性指标上与 GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(作为公平对比,只对比无指令提示微调模型)中表现不错(下图)。

图1. 斯坦福大学基础模型中心对全球 30 个大模型的评测结果(2022年11月)
您可能也感兴趣:
官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
特斯拉第500万辆电动汽车产自上海超级工厂 是辆Model 3
第四范式上市闯关终成功:4次递表港交所 拟募资额大幅缩水
美国作家协会和17位知名作家对OpenAI发起集体诉讼
比亚迪已将海豚推向日本市场 起售价363万日元长续航版超过400万日元
OpenAI推出新版人工智能图像生成器DALL-E 3
消息称华为汽车业务人事再调整 靳玉志接任华为车 BU CEO
蔚来手机今日发布?打造以车为中心的智能终端
Neuralink将进行首次人体临床试验 现已正式开启招募
小鹏G9焕新上市:扶摇架构赋能的技术实力
更多
- 存储芯片需求持续低迷 三星存储业务部门和SK海力士Q3仍可能亏损
- 消息人士称若获批准 京东方年内可向标准版iPhone15供应500万块屏幕
- 特斯拉第500万辆电动汽车产自上海超级工厂 是辆Model 3
- 消息称苹果正测试27英寸和32英寸OLED面板 有望用于下一代iMac
- 美国作家协会和17位知名作家对OpenAI发起集体诉讼
- 比亚迪已将海豚推向日本市场 起售价363万日元长续航版超过400万日元
- OpenAI推出新版人工智能图像生成器DALL-E 3
- 外媒称全球电动汽车平台开发竞争日趋激烈 大众通用等均在研发
- LG新能源通过发行绿色债券筹资10亿美元 将用于电池和可再生能源项目
- 特斯拉Model 3焕新版有望下月开始在意大利交付 已运抵展厅