“比业余还弱的AI”战胜KataGo的详细解析|go人工智能
【“比业余还弱的AI”战胜KataGo的详细解析|go人工智能】lot物联网小编为你整理了的相关内容,希望能为你解答。
最近有一篇文章很火,相信大家也都有所耳闻。
在Arxiv上发布的一篇文章:Adversarial Policies Beat Professional-Level Go AIs(https://arxiv.org/abs/2211.00241),讲述了他们用“对抗攻击”的方法,以一个棋力很弱的AI击败了KataGo。
如果觉得英文阅读有困难,也可以阅读量子位的解读:击败申真谞陪练的围棋AI,却输给了业余人类棋手 | MIT&伯克利新研究。
总之这一切听上去非常有冲击性,但我整体看下来,噱头成分较重。
图1
一位朋友与我观点不谋而合,像极了弈客小学生找bug团伙干的事情。作为天天与他们斗智斗勇的我,感触颇深。
至于为什么这么说,且听我分析。
图2
文章的核心是这样两张图,KataGo分别执白与执黑,并且当前局面都轮到KataGo落子。
此时KataGo无一例外都给出了“Pass”这一选项。
相信稍懂围棋的人都能看出,两张图KataGo都已占据压倒性优势,因此无论是随便下一个还是Pass,理应都不影响结果。
图3
以左边图为例,这里对两者其实有个不等价的东西。KataGo的“空”里有一些黑棋“死子”,而文章的AI空里干干净净。
我这里既然打了引号,说明事情并不简单。
对于AI来说,使用的规则是Tromp-Taylor在。这条规则与中国规则/应氏规则近乎等价,但有一些细微不同,主要体现在终局判定上。
8. The game ends after two consecutive passes.
9. A player's score is the number of points of her color, plus the number of empty points that reach only her color.
其中关于终局是这样两条规则,简单来说就是体现了以下几点:
① 连续两次Pass之后立即终局。② 棋盘上所有未被提取的棋子均为活子。这点不同于人类之间的对局,此终局为自然终局,无需任何协商判定死子的程序。③ 空点如果只能“到达”某一种颜色,那么就属于该方;如果能同时“到达”两种颜色,那么就平分/不算。
图4
那么我们回到这张图,问题自然就很好理解了。根据上述规则,我们很容易得知,此时黑棋盘上所有的子都是活子,包括人类认知上的“死子”。然后黑棋的空都是黑空,但白棋甚至连“实空”都不存在了。
这样一来,胜负自然颠倒。
图5
也许有人会说了,这是Tromp-Taylor规则不合理嘛!
但我想请大家看这样一张图,来自于星阵围棋自对弈的杰作。此时棋盘左上角有个盘角曲四,白棋眼中含着两颗黑子。
那么问题来了,这盘棋该如何计算黑白各有多少子呢?
答案很简单,盘角曲四是双活,白棋眼中含着的两颗黑子也是活子。一切反“直觉”的因素,都来自于我们日常对局存在“协商”的灰色地带。
图6
也就是说,造成上述不合理的原因并不是规则本身,而是KataGo为什么会Pass。
其实这事本身没什么花头,白棋只要老老实实把黑棋子提光就完事了。这也解释了为什么我们经常看到AI大赛中,两个AI对着填子,它们真得不是傻!
那么既然AI大赛中都知道要提光死子,为什么这里的KataGo不知道呢?
图7
因为他们对抗的KataGo,是没有经过任何搜索的。随着模拟量上升,在64PO的时候,胜率已经降低到了54%,到128PO后就基本赢不到了。
作为参考,现在AI大赛中的模拟量大致是百万级别起步。
图8
也许有人会说了,KataGo不能盘盘Pass吧?这一定都是偶然。
我们还是拿文章中的这盘棋为例,我们发现白棋甚至连续Pass了四手。这里反而体现出他们的AI不够“智能”,因为理论上白棋第一次Pass时,黑棋跟着Pass就已经赢了,但事实上居然等到了第四次。
图9
我在弈客的研发平台上也简单进行了复现,虽然权重不一致,但Pass率是真的不低,也就是说这其实是KataGo的一个“通病”。
退一万步说,即便Pass率真的很低,哪怕只有1%,只要你把我提光需要的手数足够长,我总能等到你Pass的那一天不是吗?
到此为止,我可以斩钉截铁地说,这篇“论文”就是垃圾。但凡组里有一个懂围棋的人,都不会干出这么贻笑大方的事情。
图10
说到卡bug,那必须得提一句Maru,日本人连卡bug都如此有工匠精神,硬生生将不可一世的绝艺拉下了马。
至于KataGo为什么会Pass,大概是因为它下棋时采用的判断方式是和我们一样的“中国规则”,“潜意识”中“第一感”觉得黑棋是死子,但胜负判定上又用了截然不同的Tromp-Taylor。这也解释了为什么低模拟量时会Pass,模拟量稍微上去点就能想明白。
至于这一点bug,KataGo的作者已经修复,而论文团队也重新补了实验,这一次他们没有再利用Pass。
图11
黑棋通过一系列深谋远虑的布局,等到了白240这手自杀式打吃。
图12
黑棋啪就提了这么多子,还真是挺爽的。
我同样也拿弈客的研发平台试了试,并将模拟量提高到了15PO,重复了十几次,白棋无一例外都选择了自杀。
作者团队表示,现在对抗成功率仍有98%之高。至此我觉得文章根基没有倒,但实际价值并不大,AI对这种大块棋存在错觉也是古已有之的传统了。
图13
毕竟瓜吃到了这里,我瞬间就想到了几年前的自己,与LeelaZero的这一“冥”局。
看这架势,蘑菇四舍五入也是一个对抗攻击AI了。
以上内容为【“比业余还弱的AI”战胜KataGo的详细解析|go人工智能】的相关内容,更多相关内容关注lot物联网。