新版阿尔法狗赢过旧版:3天训练后以100比0击败旧版
北京时间10月19日早间消息,谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo软件,它可以完全靠自己学习围棋。
这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。
经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。
结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。
值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。(书聿)
官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
梅赛德斯-奔驰击败特斯拉 率先在加州获得自动驾驶技术批准
投行称苹果服务业务2024财年营收有望接近1000亿美元
扎克伯格透露Meta计划将生成式人工智能融入每一款产品中
台积电5月份营收57亿美元 环比大增但同比仍在下滑
外媒称特斯拉正同西班牙洽谈建设超级工厂 投资45亿欧元
若每年生产37.5万辆 特斯拉Cybertruck现有订单需要4年才能完成
继福特之后 通用汽车宣布明年起接入特斯拉超级充电网络
投行看好iPhone 15及Vision Pro 已上调苹果股票目标价
特斯拉计划每年生产37.5万辆Cybertruck全电动皮卡
更多
- 讯飞星火大模型V1.5发布:综合能力三大升级,发布星火APP
- 一汽集团总经理邱现东:今年起“ALL IN”新能源,停止燃油技术投入
- 蔚来汽车2023年一季度营收106.8亿元 同比增加7.7%
- 村田推出支持150℃温度补偿的车用晶体谐振器“XRCGA_F_A”系列
- 基于台积电3nm(N3E)工艺技术的Cadence 16G UCIe 2.5D先进封装IP成功流片
- 微博热搜上线暖新闻机制 加大正能量内容扶持
- 华为新一代分布式数据库GaussDB解析:给世界一个更优选择
- 跨境电商业务年增300% 禾观科技的乘云出海之路
- 英特尔推出全新专业级图形显卡——锐炫Pro A60和Pro A60M
- “史上最强开源大语言模型”Falcon 40B已在Amazon SageMaker JumpStart中可用