人民携手蓝汛建设云计算中心缘由
人工智能专家柏林森:德扑人机大战为什么人类还有赢的可能
【导读】近日,备受全球德扑迷关注的冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆开启比赛。冷扑大师是基于卡内基梅隆大学Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无穷德州扑克人工智能系统,这套系统将对阵由中国扑克高手杜悦带领的中国龙之队,这也是亚洲首度举行的人工智能与真人对打的扑克赛事。
4月10日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了47343分。总战绩36000手牌,人类一共输了792327分,平均每百手损失22个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。
赛后几位龙之队的选手坦言,后半程他们其实已发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但惋惜发现得有些晚。如果在进行几场较量的话,他们有信心获得单场比赛的成功。
柏林森先生,信柏科技创始人/CEO、深海棱镜公司创始人,资深大数据和人工智能从业者,深度围棋、德州扑克爱好者,受邀作为新浪的科学顾问和棋牌特约评论员出席了此次大赛。
【柏林森简介】柏林森,中国科学技术大学物理学学士,美国伊利诺伊大学电子及计算机工程硕士、物理学硕士,美国注册金融分析师(CFA),美国精算协会准精算师(ASA),在海内外知名企业从业210多年。柏林森先生专长于海量数据处理、数学建模、时间序列预测、人工智能及其系统实现,自美归国后先后创建百分点科技、信柏科技、深海棱镜科技等大数据/人工智能公司,先后被评为中关村高端领军人才(高聚工程)、海淀区创业领军人才、中关村核心区文化创意产业十大最具络影响力人物、中关村十大海归新星,北京大学零售业研究中心大数据专家讲师、中商联商业养老产业分会大数据分析专家,是国内大数据和人工智能实践领航者。
现场,针对此次德扑人机大战,柏林森先生在接受采访时进行了个人观点的阐述与解析:
问:李开复说德州扑克人机大战人类胜率有10%,而围棋是零,你怎样看?
柏林森答:我们假定真的有围棋之神和德扑之神。围棋之神能够所谓穷尽变6化,那么你跟他下棋确实不可能赢。德扑之神判断、计算能力无可匹敌,他能从你的行为中读出你的手牌是对3,而他拿着对A。那末这手牌,德扑之神肯定是All IN的。但河牌是有可能发出一张3的,最后输的是德扑之神。
围棋和德扑有本质上的区别,围棋是完全信息博弈,理论上有最优解。德扑是非完全信息,总是有概率的。德扑水平的较量要看长线收益,打得手牌越多,小概率事件所能造成的影响就越少。这次一共只打36000手,其实人取胜的概率比想象的大。
可能要跟柯洁下人机大战的AlphaGo固然还不是围棋之神,但他距离围棋之神的距离肯定比人类棋手近很多,人类棋手跟他下的胜率会很低很低。不过,在数学上0%其实不代表着不能产生,只是在有限的时间里你可能视察不到而已。所以一般这类事发生的时候,我们都称之为奇迹。
问:听说冷扑大师没有用最近比较热的深度学习的技术?
柏林森答:冷扑大师用到的是一种叫做CFR(Counterfactual Regret Minimization)的框架。在双人零和游戏(你赢的是我输的)里,理论上是都存在纳什均衡点的。这次人机大战的德州扑克单挑赛制就是这样,人类和机器的输赢相加和为零,双方的目的都是为了赢其对手手里尽量多的筹码。
我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到,如果我很均匀的按三种各1/3的概率出,那末不管对方怎样出,最后的结果肯定是胜平负各占1/3,而我不可能获得更差的结果。
如果对手只出石头和剪子,在我1/3策略不变的条件下,我的胜率还是1/3。但一旦我读到了对手的策略,做出相应的改变,那么对手的胜率将会大幅下落。所以对手的最优策略也应该各出1/3,这样能够保证自己的胜率不会低于1/3。
各出1/3就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把德州扑克理解为一个复杂了无数倍的石头剪刀布,而且是根据不同的牌面情况还是不同方式的剪刀石头布,冷扑大师就是要找出各个状态下不会输的策略。
具体到某个牌手,机器会通过数据分析牌手的策略,寻找其中的可利用性,加以打击。这也是为何上一次冷扑大师与外国牌手人机大战,前面差距不大,后面人类越输越多的缘由。
所以目前看来冷扑大师和深度学习暂时没什么太大关系。
问:我如果有足够的高手牌谱,是否是能用深度学习训练出德扑AlphaGo来?
柏林森答:不能。两者游戏的基本算法逻辑是有很大区分的。举个例子,两个高手打牌的各种操作,反馈到扑克游戏里,最后的结果可能并不一样,由于胜负是有几率的。而两位棋手依照固定的走法在棋盘上落子,最后的结果是肯定的,不是黑胜就是白胜。从这种意义上讲,AlphaGo使用的那种棋谱学习的模式,是无法复制到德州扑克里的。
.........
问:听说人工智能会诈唬,它们学会骗人了?!
柏林森答:所谓诈唬就是在德州扑克比赛里,伪装自己有大牌,把对方吓跑。我们忘掉诈唬这个词的表面意思,它其实就是德州扑克里的一个技术手段。除诈唬,还有假装诈唬,伪装伪装诈唬,乃至一直无穷的假装下去。
从数学的角度上讲,诈唬是在德州扑克游戏里取得更大收益的一种基础手段,只是在表现形式上看似是在骗人而已。对AI来说,诈唬和说实话没有本质的区别,只是在当前牌型和底池情况下,选择哪种策略会让它的长时间收益更高而已。
冷扑大师会用诈唬的策略不是人为教给它的,而是告诉它德州扑克规则之后,它在演算过程当中自然而然构成的打牌策略,是这个游戏规则本身决定的。对人工智能来说,德州扑克是个数学问题,诈唬这种行动和加减乘除的之类数学符号没什么区分。
此外,作为新浪特约评论员,柏林森先生在现场也对冷扑大师的缔造者TuomasSandholm托马斯教授进行了专访。
观看专访视频:
关注ITBear科技资讯公众号(itbear365 ),每天推送你感兴趣的科技内容。
特别提示:本内容转载自其他媒体,目的在于传递更多信息,并不代表本赞同其观点。其原创性和文中陈述文字和内容未经本站证实,对本文和其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或许诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接及连带。如若本有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理终了。
日照牛皮癣医院
如何给儿童止咳安全用药
有哪些儿童止咳的安全用药
哪些药可以治疗增生性关节炎
月经迟迟不来甚么缘由
适合孕妇补钙的食物有哪些
太原白癜风医院治病效果好吗左侧颈动脉球部内膜增厚伴单发斑块形成
长春银屑病医院能用医保卡吗
- 上一页:这一次是大悦城瑞房45柔软
- 下一页:联通虚商策略复盘不仅有诗和远方柔软
-
想要成为社交场合的焦点?提升个人魅力的4个法理
我们便是留言板。而不论是岗位里面,还是孤独里面,那些拥有同样同样风格...
2023-11-16
-
良品铺子:合计持股7.51%的高瓴拟减持不超6%公司控股权
良品铺子5月末20日公告,合计所持的公司控股权7.51%的股东珠海高瓴天达股权...
2023-10-20
-
让人每天进步的单单方法
★ 一. 有活力的与世隔绝 ★ 1. 平时不要后推,越少滚你只但会越少病痛 即使...
2023-10-17
-
收藏!新形式嘉兴那些隐藏在大街小巷中,技艺精湛的老中医~
很多人患病都喜欢回去医家 中药材物不够加温补 下药物类药物物会不够小...
2023-10-11
-
富国基金股权转让新进展:山东金融资产豪掷50.39亿元收购富国16.675%股权,回报率高达352.
安邦基金会16.675%持股受让方终于出炉! 之前青岛市国际性信托股份控股(简...
2023-10-09
-
亨特:今晚我们努力遭遇战了 第四节我投篮感觉很好
托马斯:每天晚上我们努力战斗了 第四节我投篮感觉很好 播送吧4月27日讯...
2023-10-07