百科问答小站 logo
百科问答小站 font logo



AlphaGo 能战胜李世石吗? 第1页

  

user avatar   bopengbopeng 网友的相关建议: 
      

现在的比分是 0:2,小李的状态很不佳,这次也完全可能被零封。但目前的 AlphaGo,可能并非人类不可战胜。


【UPDATE:对 AlphaGo 和围棋人工智能有兴趣的朋友,我最近在写一个系列,介绍如何自制你的"AlphaGo",请点击:

知乎专栏

UPDATE:第四盘,电脑盲点出来了。我在下面说过,逻辑性是 DNN 的盲点,可以误导 MCTS 的展开,某些怪招是走入了错误的变化,而不全是什么神之一手天外飞仙。同时 AlphaGo 也会出现盲区。正是如此。之前我在这里还说 Google 很鸡贼,不公开 AlphaGo 失败的棋谱,也不开放任何对弈,避免显示自己的弱点,下面不时有人出来喷“凭什么要求Google公布”云云,言辞非常不客气,我就编辑掉并关闭评论了,各位现在理解了吗。许多做机器学习的朋友不了解电脑围棋,如果真研究过近年来的电脑围棋文献,会发现和跑个 ImageNet 的程度不一样,需要的逻辑知识更丰富。电脑围棋未来会完美战胜人类棋手(且必须加入更多Domain-dependent的方法),但恐怕不是今天。NOT TODAY。我们看看 Google DeepMind 的 Hassabis 怎么说吧:

@demishassabis 26m26 minutes ago

Lee Sedol is playing brilliantly! #AlphaGo thought it was doing well, but got

confused on move 87. We are in trouble now...

@demishassabis 7m7 minutes ago

Mistake was on move 79, but #AlphaGo only came to that realisation on around

move 87

这就正是我在此所说的“电脑吃惊”。 其实即使对于AI研究,最完美的情况也并不是碾压李世石,而是我们看到人机之间的此消彼长,互相学习。围棋是一个极其有趣的问题,希望看到它能为AI研究贡献更多世界的奥秘,而不是如此轻易地被彻底解决。


AlphaGo的核心是 MCTS + DNN + RL。之前没有说 RL,但它其实是很有意思的部分,因为在从前的对弈程序研究中,RL 的效果一般并不好。RL 的弱点是 overfit,也就是虽然小道消息公布目前这个版本的 AlphaGo 面对去年的战胜樊麾的版本的胜率是 100%,估计 ELO 分已经超出 4000,号称天下无敌,但这里面实际是会有很大的水分的可能。在其他棋类的例子上,有这样的例子: RL 后的程序秒杀 RL 前的程序,但面对其它不同棋风程序的胜率反而略微降低。下面我们看 MCTS 和 DNN 的缺陷。

================================================

身为人类,恰好对于电脑围棋、General Game Playing、机器学习有过一点研究,希望在此为形势不利的一方支招。冀望研究AI的朋友们此时都开放一点,告诉公众和棋手,目前AI所存在的缺陷,而不是有意无意地只想搞个大新闻。很理解Google等公司作为利益相关者,大谈AI的长处,不会自揭短板。Google这次取得的成就也非常伟大。但即便从公司利益出发,现在为人类棋手支招,事实上也有利于进一步促进AI水平的提高。如果人类不在最佳状态,那么对于机器的测试又如何能测试出机器的极限?下文如有错漏,请各位不吝补充。

1) 复杂的劫争、复杂的对杀(Semeai)、"看似有利实际不成立的棋"、"看似不利实际合理的棋"(做过对弈程序的朋友会清楚,这些反应出来就是"漏看","过分乐观")等等,一言喻之,所谓 trap,一直是蒙特卡洛树搜索(MCTS)甚至对弈树搜索的软肋,如 International Conference on Computers and Games 2013 论文集中,多篇都讨论过这类缺陷的表现。


AlphaGo 通过运用深度神经网络评估和选点、tree与playout的知识共享、历史知识共享、暴力增加搜索速度和节点数,等等,弥补了大部分"漏看"的情况,但"漏看"仍会存在。对于围棋,尤其如此。


这首先来自于,由于对弈树太大,所以MCTS在每一层都会尽快选中少数点集中搜索。如果一开始的选点全部或大部分错了,根据合格的MCTS的设计,仍然可以在后续搜索中找回正确的选点,但需要的时间会很多,有可能就会漏看;其次,在playout中,也同样会有覆盖不够的盲点,影响局面评估。


一个具体的例子。AlphaGo 在局势均衡时,出现的怪招,如果是在短兵相接的情况下出现的,一部分会是算路极深的妙手,但也会有一些属于这样的误算(就是没看到后续双方的正解,而是陷入了错误的变化),表现出来就是损棋。后文会继续谈电脑的怪招问题。


2) 同样,深度神经网络(DNN)也存在盲点,且这种盲点属于此方法的根本问题,现阶段无可能解决。下面是一个普通人不了解的事情:DNN与目前的绝大多数机器学习算法,所学习到的,其实都是统计知识,而不是精确的逻辑知识。


举个图像识别的例子。给DNN一群人在一起的照片,DNN现在可以数出里面有多少个人,且有时比人类还要强。比如只露了某个身体部位,也可能识别出来。但是,也永远会有人类看上去一目了然,但DNN识别错误的情况,因为DNN完全没有办法学到什么是人的精确定义!


这方面经典的文章是 Deep neural networks are easily fooled: High confidence predictions for unrecognizable images ,下图左边精心构造的噪音图像会被DNN以非常高的置信度判定为存在某某物品(有趣的是,可以在右边看到,我们也可以构造出“有点像这个物品”的假图像,说明DNN学到了许多东西,只是不精确)。

如果我们拿到 AlphaGo 的网络权重数据,同样可以构造许多类似的欺骗局面。但是,我们拿不到。不过,目前看来,这种问题已经在对局中显现了。


一个典型的例子是布局部分,所谓的"走错定式"。


与普通人的想象不一样,DNN虽然学习过无数局棋谱,但是绝不会简单地死记硬背棋谱。这是DNN的胜利,它有能力大致学习到棋谱中所反应的更有趣的精神,如布局的方向选择,某个局部和另一个局部之间的联系,等等;而另一方面,DNN所学习到的围棋知识,也存在着同样的"不精确性"与"逻辑性缺陷",正如雾里看花。


那么,布局走错次序、走错位置、不同布局的杂糅等等,在了解的人看来,就很可能是DNN的签名(MCTS也有类似的缺陷,因为在它看来布局的许多不同位置的胜率都差不多,结果实际行棋就会有不精细之处)。人类所应该做的,就是不要想太多,按照棋理与布局理论给予还击(是的,人类的布局理论一定还有缺陷,但以 AlphaGo 目前的水准,恐怕还达不到这一层)。


如果不了解这件事,把电脑想得太神秘莫测,只求稳,如小李在第二局的一些应对,则会正中电脑的下怀,把自己绕进去了。关于此,柯棋渣的直播和孟主播的复盘 围棋TV_极速点评之人机大战特别版都说得很好。


电脑的某些怪招,也同样是这么来的,不一定都是什么天外飞仙。此前举的复杂劫争、对杀等等,也存在精密的逻辑成分(如每个劫材的精确大小、先后手,全棋盘各个局部之间的复杂关系,等等),会是电脑的弱项。另一方面,官子部分虽然也要精确算,但以 AlphaGo 目前的运算能力恐已足以暴力搜索解决(团队应该会在此时接入精确的搜索树而非蒙特卡洛树),不能指望它出错了(看似出错的地方,都是棋局大幅领先时MCTS的签名而已,不改变胜负)。


3) 关键的部分来了。怎么应对 AlphaGo


单从对局来说:


第一,自己不能出错,每步棋要达到 80 分的质量。 因为电脑抓漏抓棋形缺陷等等的能力有时会很强(就看MCTS是否刚好考虑到了那个变化),不能给它机会。


第二,如果看到 AlphaGo 的怪招(特别是棋局开局与中前期的怪招),先想想是否是自己看漏了,如果似乎不是,那么不要把它想得太高明,应该用正常的方法反击,而不要心虚求稳。这样才可慢慢积聚起优势。否则就是安乐死,仿佛不知道输在哪里。


第三,同样,AlphaGo的行棋有时会有不精细之处。发现时,都应积极抓住处理。


第四,一些需要了解的地方:


1. 从 AlphaGo 的 DNN 设计来看,它会略微更喜欢走离 自己上一手 / 对方上一手 很近的点。


2. 目前的MCTS算法,电脑容易略微高估自己,低估人的战斗能力和活棋能力。如果人表现得好,电脑是会吃惊的(评论有朋友问什么叫电脑吃惊,这个做过对弈程序的朋友都知道,就是起初认为局势一片大好的评估函数,突然就开始急转直下了,哈哈)。


3. 许多人都已经知道,目前的电脑围棋程序在领先的时候都会求稳,下缓手(因为实际测试,这样的胜率确实更高)。


以上是对局的方面。而更重要的事情是在对局之外

上面是媒体报道使用的一张图片。这张图片看了令人觉得挺难过。李世石和从前的卡斯帕罗夫一样,现在面对的心理压力,前所未有的巨大。希望能有机器学习专家找到李世石,介绍 AlphaGo 的算法和可能存在的缺陷,让他能够调整状态,奋力再战!


此次对局,是 AlphaGo 在暗,人类棋手在明。AlphaGo 看过所有人类棋手的棋谱,而人类棋手却始终蒙在鼓里。有些不厚道的是,Google 故意放烟雾弹,只公布了去年的较弱的版本的对局谱,并且绝不谈最新版本的棋力情况,有心理战的嫌疑。


这并不改变 Google 取得了伟大成就的事实,不过也留下了口实。心理因素,对于人类而言太重要了。打个比方,如果换成爱虐电脑,与机器斗争经验丰富的罗洗河,局面会是如何,会比较有趣。


如果 Google 不是仅仅为了追求宣传效应,那么建议在此次或此一系列对局事件后,开放与 AlphaGo 对弈的接口,让所有人类顶尖棋手前来实验。即使收费,也会有许多人愿意。


人类的学习能力,在许多方面仍然远强于机器学习。通过反复测试,完全可能试出 AlphaGo 的缺陷,学会 AlphaGo 学习棋谱与自我对局所生成的经验(DNN 里面的经验也是有办法直接显示给人类的,不是纯粹的黑箱)。这与象棋的情况不同。围棋很特殊,可以说是最适合人类的一种棋类,比象棋等要适合得多。樊麾在与 AlphaGo 多次对弈后长棋了,其他人类棋手也会有类似的发现。电脑能进步,人也一样。一个强大的对手,可以推动围棋的新发展。


(要找到AlphaGo 的缺陷所在,最直接的,是看 AlphaGo 自我对弈的棋谱。自我对弈,就总有一方会输,那么就看看是如何输的。说起这个,许多人可能不知道,对局程序里有大量的内部信息,比如程序估计的选点,每个点的胜率,以及每个点的变化图解。如果再略微分析一下,还可以显示程序认为哪里是局势的关键点,哪里已经尘埃落定,哪里是未来可能争斗最激烈的区域,以及DNN的形式判断理由,等等等等。如果 Google 愿意把这些数据显示出来,那就更有意思了。)


行文至此,东方渐白。我相信在围棋这个毕竟是人类创造的棋盘游戏上,机器在不久的将来会彻底战胜人类,断绝一切幻想,正如现在的象棋,但我只想说,NOT TODAY!如果您同意本文的意见,请记得给本文 up vote 一下吧,对,就是点一下左上角那个向上的剪头。


何况,这只是 AI 漫漫长路的一个小小驿站。别的不说,前沿的理论数学的证明,很难想象现在的 AI 怎么理解,更不谈怎么推导。代数拓扑和代数几何有希望。数论最难。更简单的例子,AI 什么时候能写出我们在这里的回帖?目前的电脑架构,恐怕希望不大。生物计算机,量子计算机,分子计算机,可能才是正解。不说了,先睡了...


彭博 于 2016年3月11日晨



补充:


对于电脑围棋关注过很多年,大部分这方面的文献都读过,也写过程序。此处写下的 MCTS 和 DNN 的漏洞,既是许多文献的意见,也是自己的经验所得。如果哪位有不同意见,很欢迎指正。


但是,这里的所有评论,居然没有一个人正面谈论这个问题(如这些漏洞是否存在,该如何解决),一群人去争论些边边角角的杂事,如 Google 是否应该公开权重公开棋谱之类,有没有可能解读出权重里面的信息等等,各路人瞎吵,令人无语。这是新一代的中医vs西医之争吗?信噪比太低了,全清空罢。


最后,点名批评之前评论中的许多人,学了一点机器学习课本知识,就开始 show,太可怕了。世界很复杂,我们都还得虚心学习一个。实际的问题千变万化,不是课本可以涵盖。是的,我对于喜欢人身攻击的人就是这么不留情。讨论问题很好,有些人一上来就人身攻击,这是什么路数?


我还搜索了一下,好像很多人都在知乎吐槽喷子,还有人总结说喷子最喜欢抓住他们懂的那点东西死缠烂打。比如 MCTS 这么简单,但对于机器博弈又极其重要的东西,他们很多就不懂,很多课本也不教,所以他们就啥都不会说。关于本文说的主要论题,他们也啥都不会说(真令人失望),就会反复纠缠一些细节。很多时候,我特别特别不想回他们的评论,因为感觉在免费教他们。但是看他们在下面吧,又觉得很容易误导观众(他们会互相点赞!很牛的),怎么办呢?现在我学会了,就是拉黑+关闭评论......


user avatar   gao-fei-long-50 网友的相关建议: 
      

-

写在前面的话:

1. 本答所有内容,均经过答主深思熟虑,答主对文中的每一句话负责。

2. 以答主专业水平之差,眼界之限,谬误在所难免,故本文仅具参考意义。

3. 答主欢迎来自任何人的一切态度友善的正当指教。

4. 本答不是科普文,而是写给特定人群看的,见谅。


谨希望所有看下去的朋友明晰以上四点。


-

人机大战本身造成人与机器对立的天然属性,使其能吸引所有人的目光。

但大家容易忽略的是,一切最核心的因素,归根结底都是人的因素。

这里面重要的不仅仅是人与机器之间的关系,更是人与人之间的关系。


这次的人机大战,很容易让身处漩涡中央的围棋界和人工智能界产生莫名的对立感。

尽管理智的围棋人和AI研究者,都明白这技术进步的重大意义,部分人也明白一些可能的合作的重要性。

但落到比赛本身上,产生对立的态度就在所难免。


当然,包括答主在内的很多人,起初对待预测赛果的态度,不过只当个轻松的猜测,颇有笑看天地翻覆的见证感。

可随着许多心态保守而态度激烈的相关从业者的不断发声,某些对立的存在感越来越强。

而近来答主见到的几乎所有媒体的刻意推波助澜,进一步助长了公众眼中的这种对立感。


随着某些可见对立在舆论中宣传度的升级,众多友好合作的声音渐渐被压了下去。

不仅公众眼中只见大战之硝烟四起,漩涡中央人群也普遍感到了更大的压力感。

很多受到媒体过当助推的激烈言辞,已经难言到底是傲慢与偏见,还是追求传播。


答主私以为不妥。


-

三日后的大战本身极具“符号”意义,笔者且尽量抛开主观因素,讨论一下可能出现的各种赛果。

以下我们先只讨论理论上的所有可能,不谈概率(毕竟没法判断概率),请大家尽量保持冷静客观的看待。


  • 李世石5:0 AlphaGo

这大概说明AlphaGo在最近六个月内对高手棋谱的学习以及自对弈的学习过程中,没有取得突破性的大幅度进步。

而李世石发挥正常,故在让先到让两子的水平差距下,李世石将AlphaGo横扫。


  • 李世石4:1 AlphaGo

这种情况和第一种情况的差距其实极大,因为AlphaGo能否赢一盘是一个重要的标志。

但这也有两种可能,一种是AlphaGo取得了不小的进步,已经有了接近一流职业棋手的水平,故而硬碰硬的从李世石手中抢下了一盘胜利。

另一种可能是李世石在某一盘棋中出现了不可思议的失误,或者在连胜几盘后为了挑战自我或是试探AlphaGo的水平,采取了开局变相让子之类的冒险下法,而遭遇一败。

后一种情况下,说明AlphaGo或者进步不大,或者有较小幅度的进步,但未能接近一流职业棋手的水平。


  • 李世石3:2/2:3 AlphaGo

不论棋局过程如何,一旦出现了这等比分,基本就说明AlphaGo在六个月内取得了大幅度的进步,已经具有了和李世石这等顶尖棋手争胜的实力。

对人和人之间的争棋来说,3:2和2:3决定了胜负方,区别极大。但对此次的人机争棋来说,两者其实没太大区别。

如果出现了这种情况,那么任何人类棋手,哪怕是现在较之李世石更强的柯洁,在面对AlphaGo时也难言必胜。


  • 李世石1:4/0:5 AlphaGo

如果李世石的发挥基本正常,没有受到极不正常突发事件的影响,那么这种比分说明AlphaGo已经达到或者超越了人类顶尖水平。

老实说,这种水平可能已经距离“围棋上帝”不远了。


-

对于李世石,很多媒体都将之宣传为“世界第一人”,但准确的描述应该是“曾经的世界第一人”。

(正当答主完成本答时,柯洁已在农心杯最后一局中战胜李世石,并将数月以来两人的交手战绩改写为8:2,一个放在旧时代十番棋里已将对手降级的比分)


针对李世石二十年职业生涯中,所有世界比赛的成绩,以及与其他所有顶尖棋手的对比,我在一年前写过如下回答:如何评价李世石? - 高飞龙的回答


因为是一年前的回答,故而不包括最近一个赛季的数据。

但考虑到李世石最近一年来的水平、状态、成绩与棋坛地位与一年前相比,没有发生重大改变,故而以上文章的结论仍然适用于现在。


-

依据答主现在之见闻,围棋界与人工智能界对比赛结果的预判有着极大的分歧。

答主个人浅见,这分歧的存在本身原属寻常,也算不上什么激烈的对抗。

但是,一些朋友在坚持自己判断的情况下,还对与自己相反的意见加以嘲讽和鄙斥,就显得心胸略有不宽了,答主私以为这值得我们引以为鉴。


围棋界中,大家的判断方差不大,没听说有人认为AlphaGo能够取胜甚至横扫李世石。

大家判断的分歧主要在于AlphaGo是否能够取得一胜。

正如李世石所言,AlphaGo赢和不赢是重大的分水岭,其只要赢下第一盘,可能就意味着人工智能在围棋盘上超越人类的时刻不远了。


说一个八卦,围棋界内私下开盘,基本为李世石让4.5局开盘,同时设定李世石低赔率和AlphaGo高赔率。

哪怕在这种情况下,据答主所知,大部分人仍然押李世石获胜,也就是说很多人认为AlphaGo赢哪怕一盘的概率连一半都不到。

相对于此,答主个人的主观态度较为激进,认为AlphaGo赢得一盘的概率能够达到甚至超过五成。


要说人工智能界的声音,答主所闻则要混乱一些。

也有小部分人认为李世石将轻松获胜,但笔者听到的大部分声音都支持AlphaGo获胜,甚至还有一些声音认为前文所言的最后一种可能会出现,也即李世石一胜难求。


来自这两个领域之外的声音,答主所闻则完全混乱,判断两方获胜的人数可能不相上下。


-

对此,答主谨谈一些个人主观看法。


我们对赛果的判断,当成笑谈即可,没必要上纲上线。

大家闹着玩玩能够增进友谊,争得脸红脖子粗则大可不必。

毕竟三日后即将开赛,我们静候事实就是了。


更何况,无论比赛本身被赋予的“符号”意义有多强,也只是一场比赛而已。

不论哪方获胜,比分如何,更重要的都是我们未来的发展。

无论是人工智能的发展,还是围棋的发展。


有些人工智能领域的朋友嘲讽那些坚信李世石会获胜的朋友,认为他们不懂深度学习,分析棋谱也走入了歧路。

这话有道理。


还有一些人工智能专家认为这次AlphaGo没有用到很多围棋知识,而一定程度上接近通用机,并且理论上没有瓶颈或上限。

这话一定程度上可能也没错。


可是另一方面,这么说的朋友可能也不太懂围棋。

深度学习神经网络加蒙特卡洛算法,本身从程序角度来说可能没有瓶颈,但围棋学习的规律本身是有瓶颈的。


围棋的规则简单纯粹,虽为人类所定却浑然天成。

规则已定之后,围棋盘上的规律就是客观存在的,不依人类的主观看法而转移。


围棋的发展史,其实就是一部人类不断探索围棋本身规律的历史。

人类围棋水平的进步,其实就是体现了人对围棋本身规律的掌握程度,而并不是什么“艺术创造”。


而规律盘旋向上,到一定程度自然出现难点和瓶颈。

虽然对人和机器来说,彼此间可能遇到的难点和瓶颈不一定完全相同。


-

这也引发了进一步的问题,AlphaGo所代表的人工智能围棋程序的意义。

答主私以为,容易想到的意义有两层。


一者,为通用机的意义。

AlphaGo虽然不是纯粹的通用机,但和二十年前战胜人类的堪称傻大笨粗的国际象棋程序相比,简直不可同日而语。

通用机对其他诸如医疗、社会安全以及自动驾驶等各种大小领域的意义,已经有很多专家进行了阐述,答主非此专业,不敢赘言。


二者,为围棋工具的意义。

一旦AlphaGo,或者其他的类似程序在将来超越人类,就意味着那个特定程序对于围棋客观规律的探索可能已经走在了人类的前面。

当然,机器本身可以发现和遵循规律,总结提炼的工作却须人类来做。

这样,特定的超级围棋程序就可能成为人类探索围棋规律的强大工具,而这对围棋发展的意义不言自明。


这第二点,近来少有闻及。

这意义虽然比不上第一点的意义那么影响广泛、深远,不那么现实和伟大,但也很有价值。

答主很希望大家清楚这一点,无论你来自围棋界,还是人工智能界,或是其他旁观者。


-

不多谈通用意义,将讨论范畴缩回围棋领域。


抛开这次人机大战的赛果讨论而从长远来看,人工智能围棋程序的发展前景无非两种可能:

1. 超越人类,不管是这次就超越还是将来超越。

2. 短期内遇到瓶颈而未能超越,并且长远的超越时间点因遥远而未知。


从现在的形势来看,第一种可能的概率也许较大,但第二种可能性在理论上也一样存在。

如果第一种可能在短期内发生,答主认为其不会对围棋及围棋界的发展造成毁灭性的影响。

甚至,人工智能在围棋盘上超越人类,对围棋发展的影响很可能是正面居多,而负面较少。


答主认为,这取决于我们对待此事的态度,以及将来处理问题的方式,对此答主先不做过多展开。

正如有些顶尖棋手所言,也许我们应该重新思考“围棋是什么”。

同时我们也需要认真思考,围棋的未来发展应该如何,我们对待围棋的态度应该如何,我们又应该如何在人力所能及的范围内对发展进行导向。


-

我们正在见证历史,但历史不是一个个节点,而是连绵不绝的。

历史也不是完全自动向前移动的,而是要由我们推动和导向的。


我们不是观众,而是主人公。




-

注:本答首发于答主在雷锋网的个人专栏,转载须经授权。


user avatar   patchouli-exarch 网友的相关建议: 
      
  • AlphaGo要GG了啊

GG还不至于,只要CPU还在

  • 这个时候不是大劣吗?

大劣大劣

  • AG这种比赛能扳回来吗?我就想看看他怎么扳?

你专业解说?

  • 是呀!李世石多他那么多比赛经验呢。开局经验没用,现在经验有用了啊,大家打完算计剩下一堆比赛经验就当爸爸了。

  • 他们又开始来了,哎呀奶不死的,告诉你这种不可能的AG能翻盘的。

翻不了盘,真翻不了。

  • 翻不了,这落后五十个气。

形势也差太多了。

  • 是呀,我们两个好歹还是看了那么多盘棋的,虽然下的有点臭。

不不不,你先不要把我跟你拉在一起,我现在什么都不知道,我感觉很迷茫。

  • 你这种怂逼,连这种都不敢承认,你还是不是专业解说!

我不是呀,我是彩笔解说啊,我怎么能跟黄旭东您,皓月争辉呢?

  • 你连判断的勇气都没有了,我看不起你!这种局面怎么可能输?!

AG巨大劣势

AG面如死灰

AG阵型很差

AG大龙被缠

AG气门被封

AG无路可逃

AG被黑棋撞脸

AG反打脱靴

哦,这个脱靴,这个脱靴立功了!

  • AG打赢了!

没有没有,局势差太多了!

  • 啧,你要知道我比你快十秒啊!

哎呀,AG居然打赢了!

  • 尼玛的,看得懂~这个比赛。

所以说,AlphaGo想赢还是很简单的,让黄旭东当比赛解说就行了

以上

——————————————————————————————————————

完全不会下围棋,上面全是胡诌的,求别挑我错....

bilibili.com/video/av16

user avatar   damon-dance-for-me 网友的相关建议: 
      

李世石赢不了AlphaGo.不仅李赢不了,柯洁也赢不了。从此以后没有任何一个人类能赢得了AlphaGo.

樊和李世石有差距,李世石和柯洁有差距。刚学围棋的小屁孩和世界大师有差距。但小屁孩与世界冠军的差距,以AI的标准,可能只不过是一个愚蠢的猩猩和一个聪明的猩猩之间的差距。

世界冠军和小屁孩的差距在人类看来是天大的差距,因为这两者代表着人类智力的两端。但AI并不局限于人类的智力。如果说3岁小孩的棋力是1,柯洁是1000,但AlphaGO的棋力是100万。 对100万而言,1和1000是没什么区别的。如果AI能表态,它说不定会说:在他看来,柯洁与刚学棋的小孩子没什么区别,都是随便几下就被玩死的水平。

AlphaGO能赢欧洲冠军,说明它的算法和架构是正确有效的。期望李世石能赢,等于是期望这样一个算法的能力恰好掉在樊和李世石的中间。这是拿人的经验、人的时间观去丈量计算机的进步速度。在人的尺度上,从樊到李这一段差距,是可望而不可及的差距;而在AI的尺度上,可能人和猩猩在围棋上已经是差不多的水准了...

本座甚至有这样一个悲观的猜想,alphaGo的出棋速度可能是经过人工限制的,也许AI早就把落子算好了,但硬耗着等设定的时间到了才出。如果AI时时刻刻秒出落子的话,那对对面的人类棋手会造成怎样的毁灭性心理打击...


user avatar   kaifulee 网友的相关建议: 
      

先直接回答这个问题,下面再分析AlphaGo和人工智能的未来。我认为AlphaGo这次的比赛打败李世乭比较悬,但是1-2年之内必然完胜人类。

  1. 按照两者的Elo(围棋等级分),可以算出去年年底的AlphaGo打败李世乭的概率相当低。如何算出的呢?AlphaGo去年年底的顶级分布式版本的Elo是3168(见下面第一张图),而李世乭的Elo大约是3532(全球围棋手Elo: Go Ratings ,见下面第二张图)。

    按照这两个等级分的两个棋手对弈,李世乭每盘的胜算为89%(,公式见:How to Guide: Converting Elo Differences To Winning Probabilities : chess)。如果对弈一盘,AlphaGo尚有11%的获胜的可能性,而整个比赛五盘胜出三盘或更多,AlphaGo就只有1.1%的可能性了。(当然,这是几个月前的AlphaGo,也许今天已经超越了:见下面第三点)。
  2. AlphaGo不是打败了欧洲冠军吗?有些人认为AlphaGo去年底击败了欧洲冠军樊麾,所以挑战(前)世界冠军应有希望。但是,樊麾只是职业二段(Elo 3000左右),而李世乭是职业九段(ELO 3532)。这两位的差别是巨大的,完全不能混为一谈。就比如说一个人乒乓球打败了非洲冠军,并不代表他就可以成功挑战中国冠军。
  3. AlphaGo有可能在这几个月突飞猛进,进而击败李世乭吗?AlphaGo的负责人说:”外界不知道我们这几个月进步了非常多“。(来自:Odds favor machine over human in big Go showdown )。这点确实有可能。AlphaGo进步的方法有两个:(1)增加硬件:我们从Nature的文章可以看到:从1202个CPU到1920个CPU,AlphaGo的ELO只增加了28,而且线性地增加CPU,不会看到线性的ELO成长。若要达到364 ELO积分的提升,需要的CPU将达到天文数字(有篇文章估计至少要10万个CPU:AlphaGo and AI Progress)。当然,谷歌有钱有机器,但是纯粹加机器将会碰到并行计算互相协调的瓶颈(就是说假设有十万万台机器,它们的总计算能力很强,但是彼此的协调将成为瓶颈)。在几个月之内增加两个数量级的CPU并调节算法,降低瓶颈,应该不容易。(2)增加学习功能:AlphaGo有两种学习功能,第一种是根据高手棋谱的学习,第二种是自我对弈,自我学习。前者已经使用了16万次高手比赛,而后者也在巨大机组上训练了8天。这方面肯定会有进步,但是要超越世界冠军可能不容易。最后,换一种分析方式:如果从过去深蓝击败世界冠军的“成长过程”来看,深蓝大约1993年达到职业大师水平,4年后才在一场六盘的比赛中击败世界冠军(大约500Elo积分点的提升)。今天的AlphaGo应该和1993年的深蓝相似,刚进入职业大师水平。若要击败世界冠军,虽然未必需要4年的时间,但是几个月似乎不够。
  4. 还有什么以上未考虑的因素,导致AlphaGo获胜吗?如果谷歌刻意未出全力和樊麾对抗,或者有其它学习或并行计算方面超越了Nature里面的描述,那AlphaGo完全有可能获胜。

既然写了这么多,就对这个题目再发表一些看法:

  1. AlphaGo 是什么?在今年一月的Nature (nature.com/nature/journ )有AlphaGo的详细介绍,AlphaGo是一套为了围棋优化的设计周密的深度学习引擎,使用了神经网路加上MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云计算资源,结合CPU+GPU,加上从高手棋谱和自我学习的功能。这套系统比以前的围棋系统提高了接近1000分的Elo,从业余5段提升到可以击败职业2段的水平,超越了前人对围棋领域的预测,更达到了人工智能领域的重大里程碑。
  2. AlphaGo 是科学的创新突破吗?AlphaGo是一套设计精密的卓越工程,也达到了历史性的业界里程碑,不过Nature文章中并没有新的“发明”,AlphaGo的特点在于:不同机器学习技术的整合(例如:reinforcement learning, deep neural network, policy+value network, MCTS的整合可谓创新)、棋谱学习和自我学习的整合、相对非常可扩张的architecture(让其充分利用谷歌的计算资源)、CPU+GPU并行发挥优势的整合。这套“工程”不但有世界顶级的机器学习技术,也有非常高效的代码,并且充分发挥了谷歌世界最宏伟的计算资源(不仅仅是比赛使用,训练AlphaGo时也同样关键)。
    AlphaGo的跳跃式成长来自几个因素:1)15-20名世界顶级的计算机科学家和机器学习专家(这是围棋领域从未有的豪华团队:也许你觉得这不算什么,但是要考虑到这类专家的稀缺性),2)前面一点提到的技术、创新、整合和优化。3)全世界最浩大的谷歌后台计算平台,供给团队使用,4)整合CPU+GPU的计算能力。
  3. AlphaGo是个通用的大脑,可以用在任何领域吗?AlphaGo里面的深度学习、神经网络、MCTS,和AlphaGo的扩张能力计算能力都是通用的技术。AlphaGo的成功也验证了这些技术的可扩展性。但是,AlphaGo其实做了相当多的围棋领域的优化;除了上述的系统调整整合之外,里面甚至还有人工设定和调节的一些参数。AlphaGo的团队在Nature上也说:AlphaGo不是完全自我对弈end-to-end的学习(如之前同一个团队做Atari AI,用end-to-end,没有任何人工干预学习打电动游戏)。如果AlphaGo今天要进入一个新的应用领域,用AlphaGo的底层技术和AlphaGo的团队,应该可以更快更有效地开发出解决方案。这也就是AlphaGo真正优于深蓝的地方。但是上述的开发也要相当的时间,并且要世界上非常稀缺的深度计算科学家(现在年待遇行情已达250万美金)。所以,AlphaGo还不能算是一个通用技术平台,不是一个工程师可以经过调动API可以使用的,而且还距离比较远。
  4. 如果这次AlphaGo没有打败李世乭,那还要多久呢?IBM深蓝从进入大师级别到比赛击败世界冠军花了四年。AlphaGo应该会比深蓝更快提升自己,因为深蓝需要新版本的硬件,和针对Kasparov的人工调节优化,而AlphaGo是基于谷歌的硬件计算平台,和相对通用的深度学习算法。所以,几个月太短,4年太长,就预计1-2年之间吧。
  5. 从国际象棋到围棋,到底是不是巨大的突破呢?肯定是的,在这篇文章里面(在国际象棋领域,电脑已经可以战胜人脑,那么围棋领域电脑还差多远? - 计算机 ),第一位回答者分析了围棋的复杂度为 而国际象棋则只有 。在1997年深蓝击败世界冠军时,大家都认为:深蓝使用的是人工调整的评估函数,而且是用特殊设计的硬件和”暴力“的搜索 (brute-force) 地征服了国际象棋级别的复杂度,但是围棋是不能靠穷举的,因为它的搜索太广(每步的选择有几百而非几十)也太深(一盘棋有几百步而非几十步)。而AlphaGo的发展让我们看到了,过去二十年的发展,机器学习+并行计算+海量数据是可以克服这些数字上的挑战的,至少足以超越最顶尖的人类。
  6. AlphaGo 若打败了世界冠军,就意味着计算机超越人脑?或者可以思考了吗?我的回答:
  • 在可以凭逻辑分析推算的问题上,机器即将远远把人类抛在后面。机器速度会越来越快,学习能力会越来越强,数据会越来越多。当年,大家讨论“国际象棋输给机器不算什么,围棋才是真正的智慧”只是我们人类维护自己尊严但是不实际的幻想!今天,我们该面对现实了!
  • 在大数据+机器学习+大规模并行计算的时代,我们将看到无数的商机和产品,能够在预测、分析、推荐等方面,产生巨大的商业和用户价值。不过,这些解决方案和人类相比,其实没有什么意义,因为人差太远了(比如说:推荐引擎将能推荐你最可能会买的产品、想吃的菜,想认识的人;自动交易能得到更高的投资回报和风险比例。。。)。
  • 在感知方面,人类也将会被机器超越。今天的语音识别,人脸识别,未来的自动驾驶,都是例子。
  • 但是,以上都还是冷冰冰的技术,机器打败了世界冠军也没有感到高兴(甚至说不出为什么)。对于那些科幻片的粉丝们:机器人是否会人性化?这还是未知的。毕竟,在情感、喜怒哀乐、七情六欲、人文艺术、美和爱、价值观等方面,机器离人还差的很远,甚至连基础都没有。对人工智能的研究者,这是下一个挑战。对我们人类,在下个突破之前,我们还是多发展右脑吧!

P.S. - 也许有人好奇,为什么这个话题我说了这么多,因为在1986年,我在读书时,曾经开发了一套黑白棋系统(复杂度),击败了黑白棋的世界团体冠军,而当年的那套系统也有(非常粗浅的)自我学习的能力。有兴趣的网友可以在这里看到我当年的文章:

A pattern classification approach to evaluation function learning

) 。


user avatar   hei-yu-yi 网友的相关建议: 
      

电脑赢下第一局。

赛前黄旭东称看好李世石。

前半场李世石有巨大的优势,后半场出现谜之失误,尚未确认是否和神秘的东方力量有关。

(xxxxx!)


user avatar   xie-dan-9 网友的相关建议: 
      

著作权归作者所有。

商业转载请联系作者获得授权,非商业转载请注明出处。

作者:谢丹

链接:

AlphaGo 能战胜李世石吗? - 啥都好奇 - 知乎专栏

来源:知乎

还有两天就要比赛了,其实这个问题之前有真正专家回答了,就是facebook 的darkforest的开发者田渊栋的回答, AlphaGo的分析 - 远东轶事 - 知乎专栏

如何看待 Google 围棋 AI AlphaGo 击败欧洲围棋冠军? - 田渊栋的回答


把这些具体内容看了,至少是讨论前这个问题的一个必须阅读吧。

但是看这个答案的很多人的回答,包括大v的,说的话都觉得有些草率啊。

至少:

1,google AI作者, 樊麾,这都是围棋高手,他们完全明白弱二段和顶尖九段的差距。

2,google 至少目前看来并不是发神经病地宣传,目前体现出来的新闻发布是很务实的。


3,AlphaGo 作者觉得有50%战胜的可能。

所以,我认为:

1,以上条件成立,AlphaGo 一定有很大的进步。这个进步不是口头的,而是有指标性的。我个人认为,至少在等级分上,AlphaGo可能已经开始接近甚至超过李世石了。

2,无论职业选手还是业余选手,都能看到之前棋谱AlphaGo有些错误的地方。做为一个工程师,至少要新的算法已经能解决过去错误,才算是超越过去。你可以想象,过去有一百个bug,如果新算法能自动规避99个bug,这才是超越性发展。做为一个工程师,才会认为新的AlphaGo成就超越过去。


3,无论中美,都有足够的围棋人才,为AlphaGo 指出过去的错误。从工程角度说,这种错误指出并不是为了简单的一着或者定式的一步。而是要其在系统上认识到产生错误原因,以及能根本解决这些错误,才是最重要的。

假设AlphaGo 自我评估的等级分已经超越了李世石。那么问题就变成了,这个等级分能否标志AlphaGo 真正能战胜李世石。


从AlphaGo 和其它电脑AI的比赛结果,以及与 樊麾的对抗,可以认为这个等级分的数值,是非常有效果的。等级分预测胜负,预测是相当准确的。

很多答案,觉得AlphaGO的下法存在众多漏洞,于是就开始脑袋一拍,就得出自己结论了。但是,这些漏洞,AlphaGo的作者和团队都是知道的。他们的资源比几个业余选手可多多了。 他们敢夸下海口,那么说明这些已知的漏洞,基本补好了。


如何看待罗洗河表示让四子挑战AlphaGO? - 围棋

最worstcase,AlphaGO自我训练后,发现自己等级分远超过李世石。瓶颈并不在算法上,而是在训练的次数上和算力上。 这种情况下,可能李世石只能胜一盘,甚至一盘不胜。

我个人,还是认同alphago 的作者的自我认识,50%胜率,2:3或者3:2的结果。个人还是偏向于AlphaGo会胜利,相信工程师说话是有根据的,有职业道德的。


user avatar   shi-yidian-ban-98 网友的相关建议: 
      

老实说,业内并不太提所谓“流量明星”。

泛娱乐行业的链条大概是这个样子:

明星IP——内容创意制作执行——宣发播出平台——用户


明星是内容和平台方的上游,

业内不提什么流量明星,

划分一般是头部明星、一线明星、二三线明星、夕阳明星这样的,

标准就一个,出场费多少钱。


而内容和平台方采购明星的时候,谁来决定明星的价格呢?

其实,是最终的用户来决定明星的价格的。

泛娱乐行业赚钱就是那么几个套路:广告费、用户付费(门票、电影票、会员费等)、游戏、打赏、衍生品。

头部明星,能够带来更高的用户消费规模,内容和平台方才能赚钱,生态链上面不赚钱的话,整个行业吃什么?

所以,记住这句话,明星值多少钱赚多少钱,是用户决定的。

别再傻傻的问为什么戏子能赚那么多钱,问为什么政府不出来管管之类的。


当年新英体育,雄心勃勃的买下英超版权,准备大干一场,IDG也投了不少钱,结果呢,愿意付费观看英超的人聊聊,本都收不回来。

去年市场大谈特谈的知识付费,现在你看还提吗?

不愿意付钱,谈个锤子哟。


所以知乎上好多人,一边看不起为娱乐业花钱的粉丝,说别人是付智商税;

一边呢,又看不上头部明星,觉得是靠脸吃饭的流量明星。

那您倒是无条件的为喜欢的明星或者内容掏钱呀,而且要掏大钱才行,因为您曲高和寡嘛,俗人10个人每人掏1块您这边要1个人掏10块才能打平对吧。


比如,你愿意为看世界杯付多少钱?100、1000?

你愿意为看有詹俊张璐解说的世界杯付多少钱?100、1000、10000?

或者换个角度,

广告主愿意为你的注意力花多少钱?

前些年互联网有一个价值鄙视链还有印象吧,

少女》儿童》少妇》老人》狗》男人,

和前面所讲的一样道理。




  

相关话题

  如何评价以巴加沙冲突是「首次 AI 战争」? 
  深度学习(机器学习)的下一步如何发展? 
  AI 算法在芯片设计方法学和 EDA 工具中有哪些应用和潜力? 
  有哪些人工智能上的事实,没有一定人工智能知识的人不会相信? 
  分类问题的label为啥必须是 one hot 形式? 
  ICML 2018 有哪些值得关注的亮点? 
  围棋人工智能的发展历程是怎么样的? 
  如何评价深度学习之父Hinton发布的Capsule论文? 
  如何看待滴滴章文嵩称,滴滴面临的问题比 AlphaGo 复杂 100 倍? 
  将「李世乭」转写成「李世石」是正确的吗? 

前一个讨论
萝卜太辣 RoboTerra 是一家什么样的公司?
下一个讨论
怎么评价中国的公共知识分子?





© 2025-01-18 - tinynew.org. All Rights Reserved.
© 2025-01-18 - tinynew.org. 保留所有权利