科技之全球垄断
时间:2023-05-21 来源: 作者:昭灵驷玉
时间一天天过去,娜芙的雏形也在罗晟连续熬夜奋战之下完成了开拓性阶段,虽然距离真正意义上的人工智能还远远不及,但这是0和1的突破。
这个世界不管如何,都得接受真的有天才的存在,人比人只会气死人。
更气的是天才的人还更努力。
今天一早,罗晟来到了公司,不过他并没有处理公司的事务,呆在办公室在折腾娜芙,原初代码都已经编写完毕。
罗晟打开他专用的工作电脑链接云端,位于苏城数据中心,他的私人云服务。
飞快的索引到了“nov”文件夹,一番操作确认无误之后便毫不犹豫的启动并将“娜芙”唤醒。
看着百分比进度条不断推进,罗晟耐心的等待着。
不过他也知道就算娜芙现在被唤醒了,现在也妥妥的是个“人工智障”,路要一步一步走,从“人工智障”升级到“人工智能”再升级到“强人工智能”甚至到最后的终极形态“超人工智能”,都不是一蹴而就的。
完成第一步往往是最艰难的。
【100%,启动完成!】
“奈斯!!”
盯着屏幕的罗晟看到这一幕顿时精神大振,二话不说立即接入外网,他早就已经做好了一个“外挂”。
此时此刻,罗晟打开暴雪战网,然后飞快的注册了一个战网号,id昵称就叫“nov”。
然后,他花了几分钟的时间把nov今天要干的事情给安排好,就是让“她”在暴雪战网的《星际争霸:母巢之战》天梯系统中冲击排位赛。
与那些顶尖的玩家竞技。
这是罗晟给娜芙确定的第一个学习课程,让“她“在即时战略游戏(rts)上促进深度学习进行研究。
星际争霸本质上是一场快节奏的战争游戏,玩家扮演的是统领全局的指挥官角色,所以玩家的任何一个操作、决定、意识都会直接或间接决定了一场对抗的胜负。
玩家需要时刻考虑经济与军事的发展均衡,在极短的时间内做出大量的决策,暴兵、开矿、攀科技、进攻、防守、偷袭与反偷袭、骚扰与反骚扰、侦察与反侦察等等。
这样的一款即时战略类游戏无疑是让nov进阶的绝好平台,不过罗晟对“她”进入天体系统与那些顶尖的人类玩家进行排位赛对抗之前,给了娜芙一定的限制.
首先是战争迷雾,和人类玩家一模一样,不然就是开地图挂了。
其次是对nov进行apm与epm的限制,如果不作限制,人类玩家100%必败,根本不可能打得过,这显然不是公平对抗,也不是罗晟的初衷,对nov深度学习训练也没有太大的帮助。
所谓的apm就是玩家每分钟的操作次数,像韩国的顶尖星际玩家,apm平均可以飙升到恐怖的500以上,而epm就是玩家每分钟的有效操作次数,apm是只要玩家点击了鼠标键盘都会计入其中,瞎点一通也都算,所以apm存在大量的废操作,而epm每一个操作都是有效操作,比如重复操作这种行为,再多也只计1次。
罗晟给娜芙设置了550的apm上限值,能够做到与世界顶尖星际职业选手一样的数值,而epm的上线设置在188数值。
在操作层面限制了娜芙,使其与人类顶尖职业玩家处在伯仲之间,那么“她”想要打败人类的顶尖选手,就需要在“智能”层面得到发挥,接地气的说,意识很重要。
罗晟把一切都搞定了之后,抖了抖精神,果断把娜芙放到战网中,让“她”进入天体系统匹配玩家进行对抗。
暴雪的战网系统在罗晟的眼里就是渣渣存在,有着100%的绝对信心足以保证“玻璃渣”的系统是检测不出娜芙有任何异常的,让她伪装成人类玩家与真实的人类玩家进行对抗。
而与此同时,娜芙也接入了蓝星科技的数据库,通过深度学习算法在不断的接触和分析海量的信息,这并不会妨碍到“她”同时在天梯上与人类星际玩家进行比赛。
这就是人类与ai相比,后者无与伦比的优势就体现出来了。
接下来,罗晟就不做任何干预了,一动不动的坐着,盯着电脑屏幕。
现在他的电脑已经被娜芙接管,并且进入天梯系统开始匹配玩家,对战模式选择的是竞技水平含量最高的1v1对抗模式。
而罗晟此刻是一言不发,他静静的观看娜芙的第一视角,搜索对手花了不到十秒的时间很快就搜到了玩家。
第一局对抗正式开始。
……
第229章【一夜爆红的神秘高手(二合一)】
随着游戏进入对抗阶段,罗晟期待满满的观看娜芙的第一视角,看看表现如何。
这场对抗是[人族vs虫族],人类对手是一名虫族玩家,而娜芙选择的则是人族。
游戏刚刚开局,观看娜芙第一视角的罗晟就感觉巨尴尬,因为“她”控制着四个农民在地图晃悠了一圈,然后才回头去采矿,持续时间大约半分钟左右。
得,开局就大劣。
这还打泥煤,真是个人工智障。
这一幕直接把罗晟看醉了。
不明白的还以为“她”对这个世界充满了好奇呢,果然是个人工智障。
随后,娜芙连续造了两个房子,罗晟本以为“她”会把兵营建筑放下去,然而“她”并没有建造兵营。
而是存了一笔钱去开二矿去了……
观看第一视角的罗晟突然觉得,娜芙现在的这些行为操作,就是个纯新人第一次接触星际争霸这款游戏一样,没有任何区别。
随着时间一分一秒的流逝,与之对抗的虫族玩家前来侦察,看到对手的开局。
虫族玩家也看傻了。
什么鬼?
这是什么打法?
于是爆了一波小狗过来,这个时候娜芙才刚刚造第一个机枪兵,还没出来。
随着对手一波侦察部队试探性进攻的小狗进入矿区,娜芙抵抗了一会无力回天,最终打出gg结束了比赛。
第一场对抗被对方一小股侦察部队给打死了。
其实对面的人类玩家实力并不高,只是一名普通玩家而已,想要遇到真正的顶级职业玩家,娜芙需要在天梯中不断的对抗,战胜一个个人类对手,每一次胜利都会匹配到更强的对手,直到登上金字塔顶端与真正的顶级职业玩家对抗。
当然了,以罗晟的技术完全可以强行修改匹配系统的算法,让娜芙直接匹配到顶尖玩家,不过他没有那么做。
目前,星际争霸这款游戏是时下爆火的电竞游戏,玩的人超级多,尤其是韩国那边。
甚至有个夸张的说法,眼下在韩国,10-40岁的男子如果说他不会打星际会被疯狂嘲讽。
……
很快,第二局对抗开始了,这一次是tvt对抗局,即[人族vs人族]。
到了第二局对抗,娜芙有了明显的进步,这一局对抗虽然同样输了,但至少把兵推到了对手的家里。
一波主力全送掉之后,被对方机械化战术反推回来。
再次打出gg。
下一把快速重开。
……
当到了第五局对抗,又是tvz,也即是[人族vs虫族]。
接连输掉比赛的娜芙,终于展现了“她”非同凡响的一面,其强大的学习能力让“她”适应了这个水平的“tvz”对抗,并且轻松的以操作碾压战胜了对手。
这一场对抗娜芙虽然以堪比顶级职业选手的操作水平把对手打败,但其中一个细节就是“她”从来不会在相同的地方犯第二次错误。
换个说法就是,娜芙的学习进步速度太恐怖了,每一次对抗对“她”来说都是学习。
罗晟通过这五场与人类玩家对抗的比赛中也看到了娜芙暴露出来的一个缺陷,就是除了特定的分兵战术,“她”并不能形成灵活的兵力分配。
在输掉的第四局对抗中,一名高水平的人类玩家对娜芙的基地不停的多线骚扰,而“她”一旦回防对方就立刻跑路,等“她”的兵出门展开进攻的时候又转回来继续骚扰。
这场对抗,面对人类玩家的灵活出兵策略,娜芙只能被动应战,无法形成对人类玩家的有效进攻,也导致了最后滚雪球效应起来了。
最终落败。
第五局对抗结束之后,罗晟让娜芙停止了匹配对手,然后对其重新进行了一次大幅的升级优化。
他觉得这样的学习效率仍然显得太慢。
娜芙的智能体采用的是深度学习算法,罗晟对其进行了一次精心升级之后,包括了神经网络、通过强化学习的自我对弈,多智能体学习、模仿学习等算法或技术。
其中所谓的自我对弈,简单说就是自我学习,通过不断的试错找到让自己胜率最大的游戏方式。
而通过自我对弈和强化学习,构成了开放端学习算法的基本范式,学习人的策略,并确保娜芙的智能体在整个游戏过程中不断探索这些策略,从而让“她”获得更大的升级与进步。
此外,由于星际争霸这款游戏具有巨大的动作空间,会让许多先前强化学习方法变得无效。
罗晟因此还为娜芙开发了一种全新的算法进行非策略强化学习,使得“她”能从旧有的历史决策的游戏中有效的更新决策。
而罗晟的终极目的可不是让娜芙成为一个“imba”的星际争霸ai玩家,而是以此为起点,让“她”能够胜任复杂多变的其它应用场景。
如果“她”只是在星际争霸的比赛中成为超级高手,换个场景,例如在围棋、语言或其它领域就不行了,那依然是个纯粹的人工智障,和真正的人工智能有着巨大的差距。
……
时间一分一秒的流逝,罗晟猫在他的办公室不知不觉就耗费了三个多小时,为娜芙完成了第二次的优化升级才下班,时间已经不早了。
罗晟在离开办公室之前,又把娜芙放进了暴雪星际战网的天梯中,让“她”与人类玩家不停的对抗。
搞定这一切就没有在管了,下午还要去蔚蓝海岸公司处理一些工作,还有一场会议什么。
而被放养的娜芙就在做一件事情,不断与人类玩家对战。
娜芙的背后支撑“她”的几乎是整个苏城数据中心,消耗的是算力资源,是电费。
事实上如果没有钱,是不可能养得起一个人工智能的,就更别说是开发阶段了。
如果是像ibm公司这样的人工智能研发机构,制约其发展的可能是开发者本身,但见证过人工智能的罗晟,对于开发而言反而是最轻松的。
但仍然有问题制约着他。
那就是硬件,娜芙的成长被现在的硬件水平限制了,如果有更好的硬件基础,会迎来一次质的飞跃。
深度网络需要高端gpu在大量数据的合理时间内进行训练,这些硬件非常昂贵,当然在罗晟这里没有贵这个说法。
可问题是现在没有符合他要求的硬件,有钱都没得买,今后只能自己起炉灶搞硬件了,
如果没有先进硬件基础来训练深层网络以实现高性能是不可行的。
不仅仅要使用高端gpu,还需要快速的cpu、存储以及快速和超大容量的ram。
……
随着时间的推移,娜芙通过不断的对战,胜率从“她”赛事生涯第一局开始的惨不忍睹,逐渐出现了反转,胜率正在快速的提高。
在操作层面,娜芙毫无疑问是世界第一,没有人类玩家能够在这个层面与“她”抗衡,哪怕是被限制了apm和epm。
但这不是重点,重点是娜芙在游戏中所表现出来的“意识”、“行为”与“决策”,这是才是智能化的体现。
……
不知不觉,娜芙已经在天梯上对抗了27场,胜率已经攀升到了70%左右,这是非常高的胜率了。
罗晟为了提高娜芙“进化”的效率,让“她”在对战的同时,进入了蓝星科技集团的海量数据库以及星际争霸的一些网站去访问一些顶尖选手的“战报”视频,通过对人类玩家的游戏回放视频并行训练,然后与其他对手对抗训练。
后台运行中的一个脚本会让“她”每隔一段时间就迭代升级,通过强化学习进行更新,然后再进行新的对抗。
而每次迭代就匹配新的对手,同时冻结原来打败过的对手,匹配对手的概率决定了智能体采用的学习目标函数,如此一来保留了多样性的同时增加难度。
随着自我博弈的进行,娜芙逐渐开发出了越来越成熟的战术,或者说相对最优解,这一过程和人类玩家发现战术的过程类似,新的战术体系不断击败旧的战术体系,然后取代旧的战术体系。
……
到了第32局对抗,如同攀登天梯一样,娜芙不断的击败对手,不断的自我迭代,变得越来越强,碰到的人类玩家也越来越强,但90%都已经成为了“她”的手下败将。
此时此刻,又一轮对抗开始了,而娜芙匹配到的选手已经达到了职业玩家的对抗水平了。
所有被“她”击败的人类玩家都不知道他们的对手今天才开始接触这个游戏,更不知道他们的对手不是人类,而是一个ai。
这一局对抗是[人族vs虫族],双方的id分别是[nov]与[=y.j=f91]。
对战一开始,两边正常开局运营和侦察,id叫[=y.j=f91]的这名人类玩家正位于杭城的某间屋子里,他已经离开了“意境”这支战队。
但现在还保留这个id,而他现在是一名真正的星际职业选手,在国内星际界是一流顶尖高手,江湖人送外号“江南狗王”,作为一名虫族玩家,其小**作在游戏开局前五分钟号称世界级。
五分钟后就……
好吧,要是f91跑到韩国去,他的实力在那边就是个洗碗的,蹲饮水机的都能吊打他,随便拉出一个韩国的星际职业选手都可能把他吊起来打。
猜你喜欢