聪明人为什么无法征服世界? 2019-03-02 20:52

  为什么是(德州)扑克高手统治世界,而非围棋(象棋)高手?这个话题偶尔被人提起,结论引人深思。

  前段时间,著名的斯坦福华人教授张首晟不幸辞世。他在物理上的卓越成就,和投资方面的困局,形成了鲜明对比。

  香港科技大学的教授戴希还记得,张首晟用几张餐巾给他讲比特币背后的数学原理和区块链技术,一直讲到半夜。

  “我后来看过好几本介绍区块链的书,但再没一个人能用如此简洁的语言,把其背后的数学原理讲得那么透彻。”

  围棋是完美信息游戏,物理世界也是追求用简单的模型来解决复杂的问题。我把这二者归为“简单的复杂游戏”。

  这类事情,有点儿像攀登珠峰,异常艰难,也没有头绪,但山就在那里,到最后拼的是智商、坚忍、思考的深度。

  隐居森林的俄罗斯数学家佩雷尔曼,破解费马大定律的怀尔斯,单枪匹马,如同绝世大侠。痴迷于公式的张教授也是这方面的高手。

  “只要人类还在经营各种机构,包括金融机构,就会有人承担不适当的风险。有时有人会进行盗窃,而有的人甚至都不清楚他们所承担的风险。这就是生意的本质。”

  德州扑克是一种包含很多隐藏信息的“不完美信息”游戏,属于非对称信息博弈。玩家只掌握不对称的信息,他不知道对手手中是什么牌,不知道五张公共牌会开出怎样的结果,也不知道对手猜测自己握有怎样的手牌。

  德州扑克中有更多人性和运气的成分。所以我们经常可以看到半路出家的业余选手,女大学生,歌手,投资人,卖汉堡的,都能拿个扑克冠军什么的。

  答案应是,当人算不如天算时,傻瓜会战胜聪明人,因为傻瓜具有解决方案的多样性。从数学规划角度讲,当全局有唯一最优解时,诸葛亮往往胜于臭皮匠;

  金立老板输掉公司。但也可能是,手机行业不好了,公司输了,令老板爱赌露出水面。这个因果我们先不谈。

  喜欢下围棋的人,按理说大局观不会差,思考也有深度。例如围棋爱好者马云,虽然水平很一般,但公司战略颇有围棋智慧。

  但金立老板为什么却陷入赌场,连公司也输掉了?这或许是因为,围棋给人一种控制局面、发现最优解的错觉。

  作为围棋爱好者,压力大的时候我会下盘棋“放松”一下。下棋不是费脑子吗?但是有边界的棋盘,大致可控的计算,落子与对手的反馈,输赢的即时满足,能给我带来“有所为”的幻觉。

  “作为一个物理学家,很难承认你不能仅仅通过推理赢牌,但是扑克就是这样。你不能为扑克建造一个完美的模型,因为所要考虑的变量太多了,你似乎无法穷尽。从这个意义上来讲,打牌就是现实生活的写照。”

  围棋虽然复杂,但似乎是完全透明的。通过基于神经网络的深度学习,计算机已经征服棋手,但是对付德州扑克,AI还处在很早的阶段。

  德州扑克是一门技术,也是一门艺术。算得出来的那部分被称为是技术,无法计算的那部分,则是艺术。围棋也曾经被认为是技术+艺术,但有趣的是,围棋的艺术那部分,被证明也是可以计算的。

  从技术的角度来看,你应该扮演理性代理人,寻找最小化风险、最大化收益的下注方式。班热在比赛开始的时候是遵循这种方式的。

  很多时候想得过多还很坏事,即所谓的Over Thinking。数算的危险在于,让你误以为自己能做很多,但实际上你并做不到。

  据说德州扑克女子第一人Vanessa Selbst告别扑克圈之后,可能加入全球最大对冲基金桥水基金。

  Selbst在此前12年的扑克赛事中赢得了1190万美元奖金。2017年12月31日她表示自己将从职业扑克圈隐退。

  “四个月前我开始做一些交易研究和策略研究,大环境总体上来说有点类似于之前打扑克时的环境——一群‘书呆子小孩儿’一起协作试图打败对手。每天的生活很疲惫但也很兴奋。总有新的东西让我不断学习,前一天我觉得我基本上掌握了某件事情,第二天我可能就会面对失败的挑战。”

  德扑是金融人士酷爱的游戏,赌注,风险,理性,贪婪,欺诈,德州扑克既是极好的仿真训练,又是高度吻合的隐喻。

  我们必须“接受不确定性的事实,并学会在其中生存。因为没有什么魔力能够提供确定性,我们的计划必须不借助它也能实施”。

  有人说,怎么能用来隐喻人生呢?难道人生不比赌场更加难测?大多数人不比赌徒更加孤注一掷吗?

  风险这个词儿会被应用在不同场合,在这里我特指可衡量的不确定性。例如赌场里的老,对于每次的结果是无法预测的,但长期玩儿下去,赌场以大于50%的优势概率稳稳吃死你。

  在风险已知的世界里,包括概率在内 的所有事物都是确定的,逻辑思维和统计学足以让我们做出明智的决策。

  她觉得自己很,也不再勤奋训练了。她高估了自己的水平。也许她的首个冠军来自“不确定性”,而非对“风险”的控制力。

  在一个快速上升的市场,也能挣钱,但别觉得自己是天才。这其中有多少是靠运气?有多少靠实力?

  一种最简单的办法是:当你赢了的时候,你要说“我运气真好”;当你输了的时候,别说“运气差”或者“差一点儿”,而是从技术角度去反思。

  瑞士最高法院于2010年裁定德州扑克是一个以运气机率为主的游戏(game of chance),因为“简单的数学、策略及心理学在此游戏中所占的分量比不上运气成分”。

  美国宾夕法尼亚州上诉法院于2010年3月裁定德州扑克为非法,因为认定德州扑克的运气成分大于技巧成分。

  在那些运气是技术的一大部分的游戏中——例如德州扑克和风险投资——长线的结果总是会趋向玩家(投资人)真实的技术实力,而在短线中,运气决定了一切。

  怪诞行为学鼻祖 Steven Levitt,在测量了运气与技术在德州扑克中的关系后,总结道:

  但这个结论也有一个大坑,我们在游戏前如何鉴定出谁是高手?上面这个结论,会不会是幸存者偏差式的统计错觉呢?

  “当你能够量化你谈论的事物,并且能用数字描述它时,你对它就确实有了深入了解。但如果你不能用数字描述,那么你的头脑根本就没有跃升到科学思考的状态。”

  就像天气预报说明天有80%概率下雨一样,你也要养成类似的思考和沟通方式。例如假如有人约你周末吃饭,当你不确认时,别说“也许可能或许大概”这类台词,你最好说:我有60%的把握。

  给出一个估值,看起来很傻,但是在我心目中,可以拿来区别不同类型的人。懂得量化和概率思维的人极少,能够照此行事的更少。

  首先,改变任何事情都追求100%确定的心态。试想一下,这件事情我线%的可能是什么?就像是在扑克牌桌上,高手计算下一张牌的可能性一样;

  第二是保持一个更加开放的心态。从更多的渠道获取不同角度、多元的信息,而不是跟不同的人问询,然后不断确认自己已经肯定的事情和观点,“尝试着找那些你从来没觉得需要向他们请教的人聊一聊,你也许有意外的收获”。

  对德州扑克深有研究的人工智能专家余小鲁说,金融圈最感兴趣的就是风险。德州扑克对玩家的一个大的考验,就是要长期保持一种风险中性(risk neutral)的态度。

  但恰恰在绝大多数的金融市场和德州牌桌上,要当长期的成功玩家,必须学会自然地选择第一种打法。因为根据期望值计算,第一种的回报是1000,大于第二种。当然,这个和筹码总值也有关。

  1968年,马克斯刚到花旗银行工作时,他们的口号是“胆小难成大事”。采取明智而审慎的投资方式,争取胜多负少,及在成功时获得的收益要多过在失败时遭受的损失十分重要。

  但避免所有的损失则会带来严重后果,坚持这样的投资方法也绝非制胜之举。这样可能会确保你避免损失,但同样也可能导致你无法取得收益。

  就此,许多人心目中最伟大的冰球运动员韦恩·格雷茨基(Wayne Gretzky) 说的话可能会为你带来一些启发,他曾说:“如果你不出手,就会100%地错过进球的机会。”

  Duke曾经担任业余选手比赛评论员,有一次她告诉现场观众,说当前的局面,A选手赢的概率是76%,B赢的概率是24%,结果B赢了比赛,当时观众就说“你的预测错了”,Duke回答:“不是预测错了,她已经说过了B选手赢的概率是24%,也就是概率24%事件发生了。”

  执行完之后,迅速归零。要将执行和结果分开。不管现实多么灰暗,自己手上的牌多么卑微,未来多么渺茫,仍然敢于做决定,并且坚定地选最好的那一手,是一种非常了不起的天赋。

  我们每个人都被设计成“自动驾驶”的智能生物,为此付出的代价是,克服人性的弱点是非常不容易的。

  对牌手来说,游戏目标不应是赢取单局彩金,而是基于数学(概率论)及心理学上做出正确的决定。因为如此一来,期望回报值为正的情形下,可将每一局的平均利益最大化,长久下来赢钱总额会比输钱多。

  顶尖高手,能够始终保持稳定的决策能力,不会因为周围环境的变化、自己的输赢而影响决策,他们通过训练自己,养成了深思熟虑解决问题的习惯。

  普通牌手,他们的心情很容易随着周围的环境发生变化,从而导致决策水平的不稳定,极端的情况下,他们甚至是依靠条件反射来做决定。

  在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。

  博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

  生命的个体也许并不是对于许多不同的生存策略进行理性的选择,而是通过偶然的试错过程发现了最优的策略。当所有个体都完成了最优生存策略的“自然选择”之后,就达到了纳什均衡。

  在人类出现的东非大峡谷,那些高个子的人类祖先,因为生存更加困难(高个子更容易被豺狼虎豹看见,在野兽追来时更难以躲避),心脏负荷大,需要更多的食物而处于生存劣势。

  但,恰恰因此,只有那些生存能力较强的高个子基因遗传下来了。这是一种不对称信息博弈中的信号博弈现象。

  高个子是发送优良基因的信号,所以人们在谈对象的时候,一般喜欢高个子,这是因为他们或许载有更加优良的基因,可以通过与他们结合把自己的基因遗传下去,因为既然高个子生存更加困难,但是当他们还生存着时,就意味着他们具有更加强大的生存基因。

  表面看起来,喜欢高个子是因为我们觉得高个子赏心悦目,是美的元素。其实,人类的美感是与生存能力联系起来的。这是所谓进化博弈论的发现。

  1983年美洲杯帆船赛决赛前4轮结束之后,“自由号”在这项共有7轮比赛的重要赛事当中暂时以3胜1负的成绩排在首位。

  第五轮比赛一开始,由于“澳大利亚二号”抢在发令枪响之前起步,不得不退回到起点线后再次起步,这使“自由号”获得了 37秒的优势。

  这一回,“澳大利亚二号”大胆押宝押对了,因为风向果然按照澳大利亚人的心愿偏转了,“澳大利亚二号”以 1分 47秒的巨大优势赢得这轮比赛。

  帆船比赛给我们提供了一个很好的机会,观察“跟随领头羊”策略的一个很有意思的反例。成绩领先的帆船,通常都会照搬尾随船只的策略。

  “生活中没有什么可怕的事物,只有需要理解的事物。现在是我们理解更多事物的时候了,只有这样,我们害怕的事物才有可能越来越少。”

  可能每一个长期的德州扑克玩家,都各有各的“顿悟”瞬间。我自己印象最深的“顿悟”,不是在牌桌上悟到的,而是在多年前学物理学的时候。

  大家可能都听说过布朗运动,就是花粉颗粒在水溶液中不停的做无规则运动。记得当年我学习布朗运动在数学上的理论,叫马尔可夫过程。

  简单地说,这种过程必须具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中与之前的历史无关。

  学到这里,我突然吓了一大跳,意识到德州扑克比赛就是一个马尔可夫过程,状态就是你桌子的筹码量。

  比如我桌子上现在有一万个筹码,是刚刚由五千个筹码翻倍赢来的,还是两万个筹码被别人一个Bad Beat输了一半剩下的,数学上是绝对无区别的,也就是说接下来我在这个比赛的成绩,只跟我现在有一万个筹码这个事实相关,跟我如何拥有这一万个筹码的历史无关。

  但对人来说,两者的区别是天上地下。人性虽然是不可以完全克服的,但从这个时候起,我就尽量让自己像水中的花粉,完全“无记忆”地打牌。

  我曾经说过,每个牛人都是一个人肉阿尔法狗。阿尔法狗下围棋的特点是什么?它下的每一手棋都会重新思考,并且从终局推算赢棋概率。

  比如坐在牌桌上,每当系统风险给你带来不利的时候你的情绪会失控,会开始胡乱地加注入池、胡乱地诈底或者买一些不该买的牌。那么在这种情况下你的决策就属于非理性决策,更容易造成亏损。

  扑克牌技术并不是制胜的关键,逢赌必赢也不是成为顶尖高手的必备条件,而是一场心理战,其中很重要的一个策略就是克服“自利偏差”(Self-Servicing Bias)的心理障碍。

  在Annie Duke看来,这种“自利偏差”就是扑克牌最的高手和普通牌手的分水岭,想要成为顶尖高手,最重要的途径之一就是克服这个心理。

  Annie Duke获胜的关键在于,每局牌结束之后的短暂间隙,她都会迅速回溯刚才的比赛,总结自己在决策过程中成功之处和犯过的错误:

  “最差的决定也可能在运气的帮助之下赢钱,而最好的决定也可能因为时机不对而输钱,好和坏不能以结果来定义,我必须要分清楚究竟是我的技术导致还是运气的帮忙,这点非常重要”。

  以德州扑克的加注行为为例,表面上看起来是玩家展示对底牌的信心,但也可能只是诈唬,想偷鸡。所以职业扑克选手总是要解读对方。

  所以最好的扑克选手也是最好的骗子,用最真诚的诈唬和最始料不及的下注打乱对手的阵脚。他们知道对一个牌手而言,最重要的不是你手中有什么牌,而是让对手认为你手中有什么牌。

  梅隆大学开发的AI程序Libratus把这一点做到了极致。它的下注非常的随机化,甚至超过了人类最好玩家的水平。

  前面提及的扑克高手、斯坦福物理学家班热,在一次大型比赛的最后阶段,遇到了运气非常好的好莱坞制片人戈尔德。

  班热拿到了一对K,他打算玩儿一把大的,全部押上,这让他看起来有点儿夸大自己的实力,但其实是通过假装扮强,而令对方觉得他可能很弱。对方中计了。

  这和数学无关,而是某种冒险。基于的直觉,以及对对手的情绪控制,班热赢光了对手的数百万美金筹码。

  《为什么大猩猩比专家高明》里提及,牌手们知道运气的重要性。很多竞技选手和金融人士,会保持某些生活上的一贯性,穿一样款式的衣服,一样颜色的,等等。

  注意力的资源是非常稀缺的。班热打牌期间,他的早餐是一个三明治,一小杯橙汁,一杯浓茶,消化10分钟~20分钟后,开车去体育馆,严格按照程序锻炼身体。

  所有这些习惯看起来非常疯狂,但是参加比赛的时候,你不能分心去想早餐吃什么,游泳多少圈,这一点至关重要。例行习惯的好处就是让生活保持简单,这样我就能一门心思考虑扑克、扑克、扑克了。

  以体育里的直觉为例,专业技能是一种无意识的智慧。德国球员穆勒说:如果你开始思考,那你必输无疑。

  “简而言之,意识包含两个不同的思考系统,一个是有意识的理性思考系统,另一个是无意识的快速的感性思考系统。”

  最好的投资人和最好的扑克牌手一样,需要在二者之间找一个平衡点,恰当地运用两个脑系统,互相协调,取长补短。

  在现实中,我们应找到一个专业方向或者应用领域,去亲身实践,形成反馈循环,将思考转化为直觉,但又不断调校,如此才能成为“双脑决策”的高手。

  人类通常解决问题有多种思维方法,有一种方法是逻辑推理和计算,这就是搜索所有可能的解决方案,来寻找一个最佳的方案;

  还有一些方法不需要通过搜索所有的问题解决的可能性,而只是根据我们的经验、直觉,选择较少的问题解决的方案,这个叫做启发式的问题解决策略。

  一个充满了不确定性的世界里,简单的经验法则,比精确的计算更有助于人们做出好的决策;少即是多。复杂问题并不一定需要复杂的解决方法,应该先寻找简单的方法。

  我理解这是现实世界“设计者”的某种仁爱。我们常常感觉生活是无力的,但也因此,我们被置于一个保护垫当中。

  所以,现实既具有很大的容错性(看看,你过得那么一塌糊涂,日子照样还可以继续),又具有很大的可能性(每个人都可能中某种人生彩票)。

  如此一来,你可以凭借聪明,凭借冷静,凭借伪装,凭借坚持,凭借分享,甚至凭借运气,来征服这个世界。

  启蒙运动就是人类脱离自己所加之于自己的不成熟状态,不成熟状态就是不经别人的引导,就对运用自己的理智无能为力。

  当其原因不在于缺乏理智,而在于不经别人的引导就缺乏勇气与决心去加以运用时,那么这种不成熟状态就是自己所加之于自己的了。

  在康德那里,判断力是“一种只能被付诸实践,而不能被传授的特殊能力”,判断力处理特殊事物,如果思维的我离开一般概念的领域,进入特殊现象的世界,那么精神就需要一种新的“天赋”来处理它们。

  康德认为:“一个迟钝或精神褊狭的人......通过学习和训练确实能成为有学问的人。但是,这样的人仍然缺乏判断力,经常可以看到,有学问的人在应用其科学知识的时候往往违背初衷,因而不能得到好的结果。”