人工智能产品(人工智能产品代理)

Mark wiens

发布时间:2022-09-08

人工智能产品(人工智能产品代理)

 

文 | 竞核

继攻克围棋、《星际争霸》后,DeepMind开始瞄准手游了。

5月初,DeepMind推出 AndroidEnv后,开始密集测试诸多手游。最新加入体验挑战的是安卓版《The Battle of Polytopia》,它由瑞典开发商Midjiwan 制作并发行,是一款回合制文明策略游戏。

游戏故事背景设定在一个奇异而又平坦的方块星球。玩家可领导 12 个不同文明中的一个,扩张帝国、研究科技并成为整个星球的统治者来最终取得胜利。

游戏拥有单人和多人模式,最多可支持 12 名玩家。

目前,Midjiwan 正跟DeepMind合作,将《The Battle of Polytopia》集成到AndroidEnv中,成为后者一项常规任务。

大爆炸,变革性体验要来了?

我们发现这款游戏是一个特别有趣的挑战,因为它有许多功能,如处理长期规划、不完善信息、多样化 UI 元素和非确定性。DeepMind 评论说。

针对本次合作,Midjiwan 总经理Christian Lövstedt则表示,DeepMind 是人工智能领域巨人般的存在,能拥有这样强大的合作伙伴,并成为平台一份子,我们感到非常自豪和兴奋。

在Polytopia玩家群体中,不乏资深玩家。融入人工智能后,想必也会给玩家体验带来不一样的变化。

AndroidEnv作为一个AI平台,允许AI代理在游戏中自定义任务,比如寻找公园的方向、预定航班甚至于获取最高分。

AI代理主要依据屏幕上显示的图像做出决策,它能像人类一样通过触摸屏和手势进行操作。

理论上,AI能够帮助开发者实现内容快速生成、自动生成剧情,乃至促进NPC智能化和多风化。

以腾讯AI Lab为例。在竞技博弈AI方面,腾讯AI Lab推出了绝艺跟觉悟。前者主要涉及棋牌项目中的围棋和麻将,完成从完全信息博弈到非完全信息博弈的拓展。

后者主要涉及到MOBA类手游《王者荣耀》及体育类的足球,分别在异构分布式multi-agent和更多智能体+长配合方面进行探索尝试。

笔者获悉,《王者荣耀》项目组一直在尝试各种新玩法,但效果往往不尽如人意。意外的是,AI人机对战参与率极高,超过10%的玩家。

这意味着,日活用户达到大几百万。官方披露的数据显示,AI觉悟挑战共吸引超过数千万玩家参与。

此外,基于AI对于游戏理解的专业策略分析和声音文本的综合体现,腾讯也推出了王者荣耀虚拟主播。

在美术资源方面,腾讯AI Lab涉及虚拟人和3D动作生成。据悉,内部团队正在着手尝试在动作生成方面得到更真实的游戏表现,使其适配各类动作、地形和突发情况。

机遇与挑战并存

看似变革性体验背后,其实需要耗费大量成本。

互联网小常识:分布式内存访问技术是将对称多处理技术(SMP)与集群技术结合起来,用于多达64个或更多的CPU的服务器之中,以获得更高的性价比。

一位兼具游戏跟AI背景的资深人士告诉笔者,AI的确可以有效提升游戏体验。掣肘在于,样本大、训练成本高。

像《王者荣耀》这类大DAU,高流水竞技性产品,固然可以一试。对于中型体量产品而言,往往不太划算。

一位创业游戏公司高层说,小样本模型效果不错的话,拿几千万尝试也不是没有可能。换言之,大样本模型,让企业望而却步。

眼下业界常讨论AGI(通用人工智能),可产品灵活性仍是一大难题。

DeepMind遇到成本、灵活性困境,无疑最具代表性。

据估算,AlphaGo整体训练成本高达3500万美元,消耗能量足以支持12760个人类大脑在三天内不眠不休地工作。

在备受关注的《星际争霸》项目上,DeepMind也遭遇了类似难题。

2019年2月28日凌晨,DeepMind旗下游戏AI AlphaStar,以5比0大比分,击败了世界上最强大的职业星际争霸玩家之一。当时它被视为突破人类智力的最后阵地。

通常情况下,训练AlphaStar需要使用Google v3 TPU,用以支撑数千个《星际争霸II》协同运行。

AlphaStar共对战14天,每个代理使用16个TPU。在培训期间,每个智能体都经历了长达200年的实时游戏。

粗略估算下来,训练成本达到数百万美元。抛开成本不谈,AlphaStar灵活性亦备受质疑。

纽约大学心理学系教授Gary F. Marcus认为,上述方案限制重重。在单一地图上使用同一种族进行对战时,其成绩确实优于人类。

不过一旦在其它地图使用不同种族时,表现就要差很多。要想切换操作风格,必须得从头开始重新训练AlphaStar。

互联网小常识:DNS服务器和DHCP服务器都需要固定的IP地址。DHCP默认的租约期限设置为8天,最小单位为分钟,租约到期前客户端需要续订,续订工作由客户端自动完成,作用域激活后DHCP服务器才能为客户机分配IP地址。DHCP服务器中常用的选项有路由器选项和DNS服务器选项。

简言之,即系统缺乏足够的灵活性。这一特性会让DeepMind训练成本迅速放大。

数据不会说谎。根据去年年底DeepMind向英国公司注册局备案提交的最新财务报告。

报告显示,近三年DeepMind亏损额分别为4.77亿英镑(2019);4.702亿英镑 (2018);3.02亿英礡(2017)。

营收方面,2019年DeepMind收入达2.66亿英镑;2018年达到1.03亿英镑;2017年营收为5442万英镑。

综合近三年业绩表现,不难发现DeepMind营收确系稳步增长,亏损敞口逐步收小。不过需要指出的是,DeepMind大部分客户依赖于母公司Alphabet旗下关联公司。

某种程度上,这也说明DeepMind商业化还有非常高的提升空间。AI龙头企业尚且如此,国内AI游戏厂商估计也大差不差。

只有有效解决样本、成本、灵活性等问题,AI游戏才会真正大爆发。

互联网小常识:通过浏览器配置交换机的条件:(1)在用于配置的计算机和被管理的交换机上都已经配置好了IP地址,它们之间能够通过网络进行通信。(2)被管理交换机必须支持HTTP服务,并以启动该服务。(3)在用于管理的计算机中必须安装有支持Java的Web浏览器(4)在用于管理的计算机上,需要下载并安装Java-plugin(5)在被管理的交换机上,需拥有管理权限的用户账号和密码。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186