请联系Telegram电报飞机号:@hg4123

阿尔法狗与人类棋子对决《 # 》人类棋手和阿尔法狗的差距有多大

2024-09-05 6:26:45 足球内幕 貊巍然

大家好,今天小编关注到一个比较有意思的话题,就是关于阿尔法狗与人类棋子对决的问题,于是小编就整理了3个相关介绍阿尔法狗与人类棋子对决的解答,让我们一起看看吧。

谷歌AIAlphaStar以10:1的比分完胜职业选手,这对以后的游戏意味着什么?

AI人工智能越来越先进,不说别的行业,用到游戏中,以后的 Boss 越来越难打了,游戏的智能化也会越来越逼真了,游戏可玩性肯定会逐渐提高!

我经常用人族、神族 1 VS 7 个电脑,按这个趋势,以后恐怕 7 VS 1 个电脑都有很大难度!

阿尔法狗与人类棋子对决《 # 》人类棋手和阿尔法狗的差距有多大

围棋和星际不同的地方在于一个是已知博弈一个是未知博弈。

首先来看一下ai下围棋,围棋用19*19格子,落子点总共有361个,围棋是一个计算量相当庞大的策略游戏,在这一点上星际争霸无法匹及。

ai在一开始学习星际争霸的时候,会进步十分缓慢,因为对ai来说,点在不同的像素上,都是不同的一个决策,通过学习ai会明白,点这一片区域都是一样的。围棋是一个可以长时间决策的游戏,星际是一个需要瞬间决策的游戏,后面再来分析这两种情况。

再说已知和未知,围棋所有棋子可见,ai可以根据当前情况做出最正确的判断。星际存在战争迷雾,(rts跟moba不同,moba的战争迷雾影响人物位置和一些野怪刷新,rts战争迷雾则影响更大,假设(ai)pvt(人类),ai没探路,默认开矿,人族开车拖农民一波,ai稳输,不可能赢。再比如ai探路看到二矿的情况下,是否会进行二次探路,人类有可能退二矿封侦查补兵营打一波,也有可能外面野vs开飞机)

最后说一下昨天的几场比赛,前十场是之前打的录像。在这十场中ai可以操控所有的已知视野,ai 10:0击败了the little one和mana。我说实话,tlo和mana算不上顶点选手,可以算一线选手。其中有两三场操作完爆。最后一场是现场打的,ai也限制了视野,只能操控屏幕内的单位,在mana进行双线之后,ai的决策树出现了明显的问题,不会分兵,被mana一直牵在家里无法出门,这也导致了后面的落败。

纵观几场比赛,都是在汇龙岛上的pvp,ai战术以爆追裂为主,当然也有先知换农民这种操作,爆自爆球。ai的运营也是先满采主矿,在开二矿,在最后一把mana也采用了这种运营方式,ai也有一个水晶卡气矿的操作,暂时不知道为什么要这样做,运营方式也有待商议,我明天要测试一下才能有结果。

不管怎么说,和围棋一样,ai打开新世界的大门

AIAlphaStar在录像里面复盘可以看出来,瞬间EPM已经达到1200+,而人类极限是180,工程师此前表示会把AIAIphaStar的操作能力限制在人类能力范围内,目前看下来还是有很多次依靠超乎常人的操作能力翻盘,尤其是对阵MANA的那盘。

所以我个人的观点是还需要对人工智能的操作能力进行严格限制,之后的对局才更加有参考价值。

不过还有一点细思极恐的,如果是AI自主突破“主人”的限制自主学习的作弊呢?

如果真能做到限制api和扫描小地图次数时打赢maru或serral之类的顶级选手,那说明ai在实用性上又进了一步。虽然是10比1,但那个1是现原形的。。。

其实人工智能不用超过人类,能取代绝大多数人的工作就行。未来绝大多数人的工作也许只是为了生活不那么无聊,离北京折叠这部小说中说的情况就更近了。。。。

Ai在游戏上的胜利意味着 ai的多因素复合运算能力超越人类 这种进步很大的拉近了机器的复杂逻辑能力与人类的逻辑能力之间的距离。同时也意味着机器进一步取代人类的能力,大胆预测,不远的将来中人类将全面机械化。

阿尔法元(AlphaGo Zero)为什么能无师自通?

Alpha Zero是Deepmind继AlphaGo Zero(主要针对围棋推出的算法)之后推出的终极对弈杀器,在经过短短几个小时的训练就相继征服了国际象棋,日本将棋以及中国围棋。

那么Alpha Zero为何会如此强大呢,这其中的关键就在于深度神经网络和蒙特卡洛搜索树的结合。其中深度神经网络的输入当前以及历史的棋盘布局,输出下一步的下棋位置的概率分布以及胜率。蒙特卡洛搜索树则是一种常用的搜索树,通过不断的推演棋盘之后的状态,从而下那些胜率高的位置。在蒙特卡洛搜索的过程中结合了深度神经网络对于当前棋盘的评估,使得蒙特卡洛搜索的质量更好。

整个训练过程就可以归结为两步:

1. 利用蒙特卡洛搜索树和深度神经网络的自我对弈(self-play)得到更好的下棋数据;

2. 用这些数据来训练神经网络,以提高其评估的质量。反复的运行上述过程,就可以不断提高Alpha Zero的下棋水平

在这里我们可以将Alpha Zero的训练过程比作人的学习过程。人在开始学习的时候,不知道该怎么下,就可能会胡乱的下棋。但是经过几轮的下棋之后,人就会讲之前的下棋经验累积起来,慢慢的开始了解到什么时候该下哪里以及我是快输了还是赢了。此外人在下棋的过程中,总会是推演之后的下棋状态,从而下的位置更好。然后随着下的盘数增加,人的经验就回越来越丰富,下棋的水平也越来越高。这其中人脑就是深度神经网络,能够存储过去的经验,而结合神经网络的蒙特卡洛搜索就是基于当前的经验和未来的推演来得到更好的棋局,神经网络的训练过程就是总结棋局成为经验。

但是Alpha Zero为什么能在那么短时间内就能去的如此之快的进步。这就在于其中使用了大量的TPU和CPU,使得Alpha Zero能在极短的时间内就能下很多盘棋,大大加快了学习的速度。

Master版的阿尔法狗,怎么说都应该算是人类的学生,只不过青出于蓝而胜于蓝,现在被“纯自学野路子版”的阿尔法元吊打,的确颇有点让人情何以堪的滋味。

要解释为什么阿尔法元(AlphaGo Zero)能无师自通,那答案取决于两个因素:首先是围棋的本质,其次是算法。即围棋这类完全信息博弈并且胜负判断精确且规则明确的问题,在本质上可以不依赖前人的探索,而完全从零开始在足够巧妙的算法和硬件配合下,既能在短时间内到达相当的水平和高度。这依赖的是首先可以进行自对弈,其次能从自对弈中提取分析胜败的相关因素和特征,并投入到下一轮自对弈中去进行检验。

对比一下人类的自学能力所需要的前置条件:首先,得有一个合格的人脑,即一个大约由数百亿神经元组合连接而成的硬件系统,其次得有一个基本的初始输入,包括认字脱盲拥有基础阅读理解能力,这可以类比为人类的算法系统。在这两者配合之下,至少部分人就拥有了不依赖老师,而自己学习新知识甚至开拓新领域的能力。

而AlphaGoZero并非一无所有,它有两大神经网络架构,供它从每一局的自对弈中提取分析胜败的特征算法,即自我反省能力,自我总结能力,并且将这种反省和总结立即投入到下一局的实战中进行校验的能力。

而之所以能只通过490万局自对弈就能胜过从前三千万局的成果,我想这主要是因为算法的改进,尤其是特征提取方面的改进造成的,要知道从前的AlpahGo的一些基础特征,比如虎口之类的认知靠的是外界输入设定的,这说明老版本的特征提取能力不强,当然在能够利用人类经验的情况下,许多棋型特征都可以作为先验知识输入,这样在初期显示出来的水平较高,但在后期则可能受制于这些权重较高的经验而误入歧途。

这就是为何阿尔法元的成功,证明了两件事。其一,围棋是可以完全从零开始进行AI化的游戏,其二,人类经验在一定程度上是有局限的,会限制AI在极高水平时候的提高和成长。但我们还是得看到,阿尔法元 vs Master版本时候,并未到达全胜,总还是给人类经验留下点颜面了。另外,看到阿尔法元的成长史,也颇为有趣,万丈高楼也得有个地基啊。

当人类还在担心会被人工智能夺走在这个世界上的主导权的时候,人工智能已经潇洒地挥挥手,专心发展自己的世界去了,不带走一片云彩……在未来的宇宙中,人类注定只是悲催的苦力?

围棋的下法总计3的361次方,这个数字极其庞大,比整个宇宙原子总和还要多,因此利用暴力穷举法来验证所有走法的可行性显然不切实际。幸运的是人类可以巧妙的方法大大缩小这一数字,下面举两个浅例来简单说明,因为复杂的我也不敢乱说,毕竟对电脑方面不是太懂,首先我们观察棋盘,容易发现它是一个中心的对称的,也就是假设黑子第一手下在右上角星位,白子第一手下在左下角星位,实质上和第一手下在左下角星位,白子第一手下在右上角星位是一样的,只要棋盘顺时针转180度,盘面就完全一样,而在下法里,这算2种下法,这样我们就能省去接近75%的重复图形。然而仅仅减去这么多显然还想去甚远,但我们发现有些棋显然无意义或不能放,比如按照棋规,棋不能放在对方的眼位里,又或者送给别人征子的自杀棋(弃子不算),这些算起来可以排除将近99.999%的无用的计算,但这仍然不够,所以下面就要形成一些定式,即虽然我不知道所有走法的对错,但我知道某些走法一定对,那我开局就往这方面去走,一旦你走错就速败,走对了也只是均势而已,然而我们知道随着棋盘子摆的越来越多,复杂度就急剧下降,所以胜负往往在中盘就已决定了,后期电脑转用穷举法足够应对,翻盘几乎不可能。

找对了模型改进了算法!说明客观规律存在真理,工程领域所累积的科技成果,将使人与人之间的劳动能力差距越来越小,只要人类没有被转基因,“按需生产自主交换”的共产主义社会一定会到来!

一个机器人会比一个人聪明吗?为什么?

从知识的存储量来说,这是肯定的,机器人在某一个特定的领域能发挥巨大的作用。

比如下围棋,阿尔法狗已经超越了所有的围棋选手,各种围棋大师和世界冠军都不是阿尔法狗的对手,打得围棋界的选手毫无信心,这种水平破世界记录非常轻松,所以阿尔法狗为了不打击人类的信心,已经不再和人下围棋了。

魔方机器人,之前我们看最强大脑,被里面的选手玩魔方的酷炫动作惊呆了,这都还不能算是世界记录,世界记录是美国的一位14岁的男孩完成,当时只用了4.904秒,而最新出来的机器人,仅仅用了0.637秒就完成了,这个德国的机器人频频打破自己的世界记录,人类简直不可能超越。

算术,一听到这个,大家都知道机器人肯定获胜了吧,最强大脑选手心算,有时候还要想一样,而机器人,只用把题目告诉他,基本上不用0.01秒就能得出答案了,这种能力人类不可能完成,这种世界记录对机器人都没有什么好炫耀了的。

至于体育方面的,举重,扔铅球这类纯靠力量的比赛,机器人都能轻轻松松的打破世界记录,现在机器人挑战的是踢足球,打乒乓球和羽毛球等等,现在已经有公司研发了踢足球的机器人,相信以后打败人类肯定没有问题,只要羽毛球和乒乓球,这个要比足球简单很多,击败国家队选手也就是时间问题

还有很多方面,机器人已经完胜人类,不过这些机器人都是单一领域的选手,现在还没有那个机器人既能踢足球,又能打乒乓球,如果真的出现了这样的机器人,那么人工智能的时代才算是真正的来临,到时候人类才需要真正的考虑,人工智能是否会威胁到人类的发展了。

错了!机器人不聪明,也没法聪明!但它计算的速度比人类快而已!它是利用所学知识的积累,与现实情况比较来做出概率判断,取其最大值的那一种结果,然后按照这个结果做决定。它所积累的信息越多,判断出的结果可能就越科学,因为计算力超强,可能这个判断比对过程用时非常短!这是它比人类厉害的地方。但它的选择绝对是它数据库里所存在的结果!哪怕有千亿种结果,但它绝不会超出里面所学的结果!这句话可以理解为:它学的领域绝对比人强!但它没学的,绝对不会!而且不存在用现有的知识推导出新的知识!你教给它:在没有桥的小河上可以用木头架桥!它绝对会用木头建成各种桥(只有它学过的)。但它绝不会用绳子架桥!因为它学的是:架桥通过不能涉水的河流。它就只会架桥。但它不知道架桥是为了通过河流。只要能过去即可,用竹竿撑也行,一根绳吊过去也行!这些它如果没学,它都不会!也可以理解:它如果找不到木头,它就永远过不了河!当然了,这个程序员也可以写进程序,让它会做。但就算这个写了它也不代表能够举一反三!因为一台机器,程序再复杂,数据库再庞大!它也没有智慧!更无法得到启迪!

一个机器人肯定会比一个人聪明

我大体理解AI背后的技术,我认为机器人肯定会比人聪明,而且会聪明很多很多,届时,人和机器不在一个级别,互相无法对话。

我们对于AI和人是谁强谁弱、谁控制谁、AI有无恶意,还有很大的争论。

下面2个名人的意见代表其中一个派别,他们认为AI会远远超过人类,而且很可能有恶意(或者失控)。

霍金认为:人工智能的崛起可能是人类文明的终结,生物大脑和计算机在本质上是没有区别的。

马斯克认为:人工智能是人类生存最大威胁。

一个原因是AI的能力在以指数级的速度增长

图像识别能力:

记得几年前,图像识别的算法不完善,计算能力也弱,机器的图像识别能力就很弱。绝大多数人就嘲笑:“你看,2岁的人类小孩就能轻易识别一只猫,那么强大的计算机却识别不了。”

但是,随着硬件速度变快,神经网络算法的突破,就几年功夫,图像识别对机器就是小菜一碟,现在到处都可以刷人脸了。而且,机器不光能识别,还能根据图片写出描述文章。

音频识别能力:

以前的语音输入法,以我的体验来看,识别率大概在70%以下,不可能在日常生活中使用。

而现在,你看看各家公司的语音输入法,各个都是98%以上的识别率。用小米便签APP、苹果的备忘录APP,直接对着设备说话,然后就能发现你的话一字不落地生成文字,很是方便。

音频识别背后用的也是AI技术,就几年时间。

围棋等能力:

更不要说,几年前我们也嘲笑:“机器肯定没有办法在围棋上赢人类,因为要计算围棋每个棋子的可能路径,其计算量是天文数字。”

那结果和上述的2个案例一样,阿尔法狗把人类的脸打得啪啪作响,有些人被打醒了,还有很多人仍然不相信。

机器是可以换算法的,之前的穷尽路径的办法不行,就用神经网络的方式。而以后还会有更好的算法。

另一个原因是AI可能产生的“自我意识”,然后自我学习,自我增强

我们会总结,在狭窄的领域中,机器确实已经远超人类。但是,机器不会举一反三,不会有目标,没有意识,没有“灵魂”。

这样说,是认为只有人类才有意识。

那我们需要问问:到底什么是生命?还有生命最初的意识来自哪里?

根据《生命3.0》,生命的定义是:可以自我复制的信息处理系统。

生命的核心也在于信息。

以今天生物科学的发达程度,受过一般教育的人都知道,每个人的不同,都是因为基因不同。而基因,其实就是一段信息,这段信息包含了这个生命体为了生存,对外部环境的信息处理的源程序。

基于《生命3.0》对生命的定义,一个计算机病毒也可以说是一个生命。它们能自我复制,自我处理信息,自我散播。张小龙等一众互联网大佬推荐的书籍《失控》中,有一个实验:在某种环境下,不同的计算机病毒会发生“反应”,从而产生新的病毒。这点就很类似我们自然界的碳基生物的繁殖。那么,称他们为“硅基生物”也不是瞎扯淡。

计算机病毒能自我求存和“繁殖”,我们能认为病毒有“意识”,或至少有“求生意识”。它不光不想被干掉,它还想繁衍下一代。

如果比作生物,在硅的世界,从病毒这种最初级的生物,到AI算法的生物,是一种进化的飞跃。

我们或许说AI不会有“生存和繁殖”意识,和病毒不一样,但这也只是到目前为止。我们设想下,AI和病毒的结合会怎么样,目前我们没有看到类似的报告,但这种结合的可能性非常大。

一旦将“意识”结合AI算法,AI突然发现他有了“自己的想法”,会有目标地吃信息,实现更大的飞跃。

总结

未来难以预测,这些只是基于我的经验和知识的一种假设和推导。

机器比人类聪明,这点在目前就已经是事实。

AI正在各个领域贡献他的聪明才智,为我们服务。

我们还在研发强人工智能、通用人工智能,将来能用于更复杂的领域,机器会越来越“聪明”,超过人类只是一个小目标。

到此,以上就是小编对于阿尔法狗与人类棋子对决的问题就介绍到这了,希望介绍关于阿尔法狗与人类棋子对决的3点解答对大家有用。