学龙网,快速且全面的体育新闻和赛事资讯报道网,主要有以下栏目:热门资讯、NBA资讯、国际足球、篮球世界杯、足球世界杯、世界女子排球、电子竞技、综合体育以及汽车资讯与网友讨论等等信息。

关于我们联系我们

学龙网 - 专业的体育资讯报道网站.英超欧冠NBA这里都有讨论。

当前位置: 首页 > 意甲 > 国米新闻 >

花式!柯洁:此生都赢不了AI 下1000盘输1000盘zt

时间:2021-01-12 20:00人气:来源: 学龙网

  尽管是人类第一,但与AI人工智能正式对决,柯洁在人机大战中完败,如今再谈到AI,柯洁不再霸气外露,而是承认确实不是AI的对手。

  对于是否用AI帮助训练,柯洁说道:“对的,现在基本上所有的训练都是AI训练,就是之前我经常会用远程服务器跟AI进行对决,但是其实也是下100盘输100盘,下1000盘也输1000盘。因为对我来讲,我承认是一个比较感性的人,对我的信心,就觉得好像好没意义啊,非常痛苦。”

  “就是单方面受虐,花式虐你,对我来讲这种训练方式其实让我非常痛苦,弃坑了,它就是老师,它就是大数据培养出来的,我跟大家讲一个例子,我跟他下了一步棋,它立马给你降点,认为你这个点不是最优的,他觉得这手棋下是100分,但是你下的线分,所以你的胜率就会往下掉。其实你的胜率是五五开,你会看到胜率一点点往下掉,掉到零,就没有起来过,就像一样。正常,互上互下,他就是一个直接跌停。”

  绝望的柯洁对AI是输得心服口服,承认自己这一生是打不败AI了,“主要是我太笨了,未来能有战胜他的人类,但是至少我认为,我这辈子是没有什么希望了。”

  在节目中,前皇室战争职业选手斑斑和柯洁对决五子棋,他们是来自复旦和清华的高手,有意思的是两人边下五子棋边要回答问题,现场气氛热烈,而两位高智商选手回答问题也是妙趣横生。

  第一盘棋柯洁输了,第二盘棋柯洁落子的时候还要回应“心目中恋爱的理想型”,世界冠军的答案是“善解人意”,最智慧的是,当被问道如果回到过去,最想回到什么时候,一直还房贷的柯洁作答:“回到房价还没有涨的时候。”这引发现场观众笑声,而对于如果电竞俱乐部想让你当电竞选手,怎么样你才会同意,柯洁实话实说:“用金钱打动我”。最不想跟别人交换什么,柯洁的答案是“身高”,而第二盘棋柯洁笑到最后。(江枫)

  AlphaGo初始版本还是使用的behavior cloning+MCTS,就是从人的经验里学习下围棋,后来的Zero版本就直接放弃Behavior Cloning,暴力RL了。之前的版本还是又可能被未来的人类战胜,过后的版本就已经是已经是围棋这项运动里面的天花板了。 区别在于人类发明围棋本身也是通过经验积累来得出定式和套路,人类教给AlphaGo的也是人本身的经验和定式,然而几千年人类积累的经验很可悲未必是最优解。当你把游戏规则告诉机器开始暴击检索的时候,机器能够找到这个游戏真正的最优解,可惜的是RL本身还是一个黑盒,不能够总结出机器做决定的规律回馈给人本身再学习,不过可能是RL未来的方向之一吧,现在做offline RL很火的原因之一。

  那一天还非常遥远,穷举围棋的计算量远远超出计算机能承载的程度。现在的ai是依靠图形识别先筛选少量的点,然后具体的算这几个点。所以ai对计算机要求最高的是显卡,而不是cpu

  其实并不是alpha go自己和自己下,是alpha zero和aloha go下。alpha go预先输入了大量的人类棋手数据来,而alpha zero没有任何先验数据,从0开始完全靠自我学习能力来训练。一开始alpha go完虐alpha zero,但到了后期,alpha go连一次也胜不了alpha zero。虽然都叫alpha,但是完全不同的ai。

  现在发现点完三三不用两头扳就能活棋,多长一下就可以先手分头抵消对方的厚势了,算起来不亏(左边是以前的点三三定式,右边是AI时代的点三三定式)

  对面不是最优解,但是你也不能保证在对面下出非最优解的时候自己也下出最优解啊。。更何况很多时候每手棋的胜率波动只在1%以内,对于人类而言小的根本感觉不到

  现在发现点完三三不用两头扳就能活棋,多长一下就可以先手分头抵消对方的厚势了,算起来不亏(左边是以前的点三三定式,右边是AI时代的点三三定式)

  AlphaGo初始版本还是使用的behavior cloning+MCTS,就是从人的经验里学习下围棋,后来的Zero版本就直接放弃Behavior Cloning,暴力RL了。之前的版本还是又可能被未来的人类战胜,过后的版本就已经是已经是围棋这项运动里面的天花板了。 区别在于人类发明围棋本身也是通过经验积累来得出定式和套路,人类教给AlphaGo的也是人本身的经验和定式,然而几千年人类积累的经验很可悲未必是最优解。当你把游戏规则告诉机器开始暴击检索的时候,机器能够找到这个游戏真正的最优解,可惜的是RL本身还是一个黑盒,不能够总结出机器做决定的规律回馈给人本身再学习,不过可能是RL未来的方向之一吧,现在做offline RL很火的原因之一。

  成立于2004年,前身为学龙网体育网。2009年学龙网体育网成为中国最大的体育网站。从学龙网体育网成立至今,内容丰富广泛,除了体育赛事,



本类推荐