有一种歧视叫自利

(《瞭望东方周刊》,2014年12月25日)

我最近在微博推荐了哈佛大学搞的一个“内隐联系测验(IAT)”,这个测验可以用非常巧妙的办法发现一个人是否有针对黑人的种族歧视。微博评论中有多人反馈,说他们的测试结果是他们对黑人的印象比对白人更好。看来恒大外援埃尔克森说得对,中国没有种族歧视。

但这并不意味着中国没有歧视。中国有地域歧视,有性别歧视,有年龄歧视,这些歧视并不比种族歧视好 — 而且如果你把它们想明白了,也许会发现种族歧视也没那么坏。

先别担心,本文仍将保持政治正确。我要说的是歧视其实是一种特别有用的思维方式,人人都用。因为这个原因,想要依靠宣传教育去消除歧视是根本不可能的。而且我们将会看到,虽然消除对一个群体的歧视很难,但是任何个人都可以让自己不被歧视。

哈佛的测试能观测人的内心,可是研究真正重要的歧视问题得讲究一个论事不论心的原则。打开任何一个国内足球新闻的网友评论,里面最热闹的永远是山东人跟广东人对掐。这些口水没什么意义,得看人们怎么做。一个广东球迷到山东饭馆吃饭,饭馆老板会不会因为歧视他而有钱不赚?招工不用女人和老人,大学不录取农村考生,生意不跟河南人做,这样的歧视才是实质性的。

最好的办法不是做问卷调查,而是做实验。比如不久前三个美国商学院的研究者搞了个针对美国大学教授的种族歧视实验。他们从259个大学中随机选择了6500个教授,以学生的名义给这些教授发电子邮件,假装希望成为这些教授的博士生。所有电子邮件的内容完全相同,唯一不同点是发信人名字,这样教授可以根据名字猜出发信人的种族和性别。

结果这些引领自由主义风气之先为人师表的教授们并未让研究者失望 — 实验表明他们的确有种族和性别歧视。在歧视最严重的商学院,如果你是一个白人男生,你的套磁信获得回复的可能性有87%;如果你是女生,或者是黑人、西裔、印度人或者中国人,你获得回复的平均可能性只有62%。更令我气愤的是尽管一向以谦虚好学闻名,中国学生居然是以上所有人群中被教授们歧视得最厉害的。

这个研究还发现,那些本身就是少数群体的教授居然也歧视本群体的学生!女教授也歧视女学生,黑人教授也歧视黑人学生,西裔教授也歧视西裔学生,……唯一的例外是华裔教授并不歧视中国学生。

这就有点奇怪了。如果“歧视”就是对某个特定人群心怀恶意,那么怎么解释一个大学教授居然会歧视自己的种族?也许更合理的解释是教授们之所以更偏爱白人男生,是因为白男在学业上取得成功的可能性更大?也许教授认为带个白男学生更有面子?也许中国学生收到的回复少是因为中国学生平时写的套磁信太多?

类似这样“用数字发现真相”的研究非常之多。风险投资者歧视女性,他们在同等条件下更乐意把钱投给男性创业者,而且长得越帅越好 — 相比之下女性创业者的相貌却并不能带来加分;硅谷公司歧视老年人,以至于有秃头的年轻人为了找到硅谷工作而去做头发移植;女科学家的论文的被引用次数少于男科学家……等等等等。

考察这些研究,我们很容易产生这么一个感觉:也许这些所谓歧视并不是发自内心地敌视某个群体,而仅仅是出于某种自利目的。既然在我们的印象中成功的创业者和科学家大都是男的,学东西快干活猛的工程师都是年轻人,我们最方便的办法自然就是更关注这些群体。这种心理也许是偏见,但真谈不上是什么坏心。可是你怎么证明这一点呢?

2007年格拉德威尔的Blink一书,和2008年耶鲁大学教授Ian Ayres的Super Crunchers一书,都提到了一个派学生假扮顾客去车行买车的实验。在美国买车可以跟销售讨价还价。这项1989年的实验中六个学生,有男有女,有白人有黑人,跑遍芝加哥所有车行,结果发现销售们对黑男总是狠狠地要高价,对黑女稍好,对白女又更好点,而对白男则一上来就给一个不错的价格。后来类似的研究更发现黑人不但拿不到好价格,而且拿不到好的车贷利率,甚至连试驾的机会都比白人少。

这难道不是赤裸裸的种族歧视吗?讲价的目的就是把生意做成,你给这么高的要价,不是摆明了为了歧视连生意都不做了吗?

但是别着急,关于黑人买车的研究还在继续。在2013年出版的The Why Axis一书中,两位行为经济学家Uri Gneezy和John List介绍了自己最新的买车实验。他们发现黑人的确受到价格歧视 — 但是你得看买什么车。如果一个黑人去车行要看五万美元的宝马,他得到的报价的确会比白人高,而且经常不给试驾。可是如果是低档次的车,那么黑人跟白人得到的价格是一样的!

所以销售给黑人一个高报价根本就不是因为他歧视黑人,而是因为他觉得黑人收入低反正也买不起,索性用一个高报价结束对话!

歧视有两种。一种是“敌意歧视”,损人不利己,宁可不赚你的钱也不跟打交道,甚至还要故意黑你。另一种则是“经济歧视”,对某一人群的区别对待无关个人感情,纯粹是出于自利。现在随着社会进步,敌意歧视其实正在减少,而经济歧视则在增加。

跟给黑人报高价一样,很多看似是敌意歧视的现象实际上是经济歧视。黑人来了把钱包看紧点,机场安检更重视中东长相的人,加强对同性恋者的艾滋病防控,人们这么做并不是出于仇恨这些群体,而仅仅因为黑人犯罪率更高,大多数恐怖分子是中东人,以及同性恋感染艾滋病毒的可能性远远高于异性恋。

经济歧视者使用的思维方式也可以称为“统计歧视”:我们很难充分了解一个单独的人,干脆就用他所在的群体给人的一般印象来代替他。这种思维当然是一种偏见,很容易犯错,一定会有人受到冤枉。但这种思维也是有用的。最近我们一家领着孩子在美国过机场安检,有几次被直接领到绿色通道,不用脱鞋也不用把笔记本电脑从包里拿出来,显然工作人员感觉拖家带口的人不太可能是恐怖分子。我有一次自己走,居然也因为人畜无害的中国人长相享受了这样的待遇。这种区别对待的方法对很多人来说肯定是不公平的,但是它提高了效率。

现在我们还可以再想想种族歧视。种族歧视的起源,也许就是一种经济歧视。2013年一本进化心理学新书The Rational Animal中说,不愿意跟异族人接触其实是人的一种非常基本的自动思维。这种思维与审美无关,它来自避免疾病的本能。过去疾病很容易在人与人之间传播,而外来人往往能带来新的疾病 — 任何看过《枪炮病菌与钢铁》的人都知道本地人很难对抗外来人的病菌。也许种族歧视就是这样从本能变成行为禁忌,从禁忌变成群体偏见,从偏见变成恶意。

时至今日,除了个别特别愚蠢的人拿别人的种族找自己的优越感之外,真正恶意的歧视已经不多见了。经济歧视,才最值得关注。坏消息是想要消除针对某个群体的经济歧视非常困难。好消息是对个人来说经济歧视是有解的!

The Why Axis一书中有个让黑人问路的实验特别值得我们深思。研究者找了不同性别和年龄的白人和黑人在芝加哥街头问路 — 他们问的其实是一个特别容易找到的地方 — 并统计这些人各自受到了什么级别的帮助。结果不出所料,白人女青年受到的帮助最多,黑人男青年受到的帮助最少,人们可能用一句“不知道”把他打发掉,甚至还可能随便给他指个错误的方向。不过老年黑人和女性黑人仍然得到了足够的帮助。看来这可能是针对黑人男青年犯罪率高的一种经济歧视,不愿花时间给他指路是出于自我保护。

这个歧视怎么破?研究者让同一个黑人男青年西装革履,打扮成一个成功的商人形象再去问路,结果就获得了很好的帮助!

想要强行改变一个群体的整体形象,可以使用大规模宣传和教育的办法,比如好莱坞电影中尽量给黑人正面的形象。有研究发现在做IAT之前先看一些关于黑人的正面新闻,尤其是当黑人运动员刚刚拿了一块奥运金牌的时候,测试出来的歧视程度就可能会被改善。但是这种宣传的作用有限,而且如果一个种族的犯罪率明明很高,你非得把他们都描写成无辜的受害者,你不是误导别人吗?

再者,宣传和教育对经济歧视的具体行动意义不大。如果一个工程系教授不愿意录取女研究生是因为他认为女生科研能力不如男生,你能用宣传教育的方法消除这个性别歧视吗?

弱者抱怨别人歧视,强人都是自己主动出击。

有传闻说John List等人做的这些行为经济学实验有可能会得一个诺贝尔经济学奖,既然如此我们就再说一个。残疾人经常受到歧视。List等人做实验发现,如果一个残疾人去修车铺修车,他得到的报价,比健康人修同样的车要高30%。这是修车铺故意欺负残疾人吗?其实是因为他们吃定了残疾人行动不便,不愿意货比三家。

在后续的实验中研究者让这个残疾人一进修车铺先说一句话。结果这一句话就能确保他拿到跟健康人一样的价位。

这句神奇的话是,“我今天要拿三个报价。”…

webr00t

türk porno

怎样杀死海星

(已发表于《瞭望东方周刊》,2014年10月)

我知道这种类比可能会让人反感,但新疆暴恐案的恐怖分子和比特币、p2p盗版下载,以及维基百科有一个共同点。他们都是去中心化的组织形态。

我们熟悉的组织,比如公司、军队和政府,通常有明确的上下级关系。底层听从中层指挥,中层接受高层领导,而高层则是整个组织的大脑,负责研究战略和制定计划。想要击溃一个这样的组织最好的办法当然是擒贼先擒王,只要把“司令部”消灭,整个组织就算不立即死亡也会瘫痪。

可是在网上反盗版却完全是另外一回事。在互联网时代的最早期,所有公共内容都要放在中心服务器上,各地网民都从这些有限的若干个服务器上下载。服务器和网民是类似于传统的上下级关系 — 这时候反盗版比较容易,你只要把那些包含非法内容的服务器都关了就行。可是后来出现了p2p,换句话说就是网民到网民的技术,盗版文件在网民的个人电脑之间互相传递,根本就不需要什么中央服务器。现在人们常用的迅雷、电驴、BT等下载工具,就都是基于p2p的。迅雷背后至少还有个公司,而电驴和BT根本就不属于任何公司。这种下载方式是“去中心化(decentralized)”的:人们自由下载,随意分享,既不打算赚谁的钱,也不用被谁管。像这样的情况应该关谁的电脑呢?更关键的是,每个文件都同时存在于多个电脑之中,哪怕你关掉一批也很难对整个系统造成影响!

美国商业咨询师Ori Brafman和CATS软件公司前CEO Rod A. Beckstrom 2008年出了一本专门研究去中心化组织的书,《海星与蜘蛛:无领导组织不可阻挡的力量》(The Starfish and the Spider: The Unstoppable Power of Leaderless Organizations)。此书标题的类比相当恰当。传统组织就如同蜘蛛,它的智力集中在大脑,只要你把蜘蛛的头去掉,蜘蛛就会死亡。而去中心化组织就如同海星,海星根本就没有头。它的智能分布在身体各处,一旦你打掉它身体的一部分,那个部分甚至可能自己再长成另一个海星。

所以杀死海星比杀死蜘蛛困难得多。当初西班牙人入侵南美洲非常轻易地就征服阿兹特克帝国和印加帝国。这是因为这两个帝国都是蜘蛛式的组织结构,权力集中在统治者手里,中央政府一倒全国立即崩溃,“竟无一个是男儿”。可是西班牙人打到北美洲,面对更加落后的阿帕奇族的时候,却打不下去了。阿帕奇族是个海星式组织,没有统一的领导人,各部落在政治上是一个非常松散的联盟。阿帕奇的英雄并不直接指挥调动什么大军,他们只是作为战斗榜样从精神上去感召别人。这样即便有几个部落被击溃,剩下的族人仍然能继续战斗,根本谈不上擒贼先擒王。结果阿帕奇族跟白人抗争了几百年,一直到十九世纪才向美国政府投降。

这样看来去中心化其实是一种非常古老的分权体制,显然中国历史上在春秋时代也有类似的特点。到了现代,政府和公司往往是集权的,去中心化反而不太容易被人理解。

1995年,当时的一个互联网接入服务商Netcom公司的CEO Dave Garrison跑到法国去跟投资者见面,想要说服他们对互联网业务投资。这些法国投资者都有很好的商业头脑,他们非常热衷于美国人搞的新东西,但是有一件事他们理解不了。他们一直问Garrison一个问题:谁是互联网的主席?Garrison解释说互联网是“网络的网络”,并没有集中的领导机构。可是法国人认为不管什么东西都肯定得有一个领导才能避免混乱,他们不明白去中心化这种结构,甚至以为双方的交流肯定出了翻译上的问题。最后Garrison被逼无奈之下,说他自己是互联网的主席!

互联网没有主席。整个互联网是一个开放的基础设施,所有计算机都可以接入和扩大它,并没有哪家公司或哪个国家拥有和指挥它。在互联网时代,去中心化组织不再限于政治和人,而被很多东西所采纳。比特币没有中央发行机构,任何人都可以自己开采和私下交易。维基百科的内容贡献者都是不要钱也不接受指定任务的志愿者。豆瓣上的兴趣小组很大程度上是用户自我管理。没人指挥,几乎没人管理,这些东西却也发展壮大了。

把去中心化组织的成员联系在一起的不是领导人,而是某个共同的理念或者需求。有时候组织有一个名义上的领导,但其对整个组织的控制能力极其有限,更多的是一个精神领袖。有时候各地会有自己的小圈子,但这些小圈子之间的关系是非常松散的。最厉害的是,组织的信息和智力分布在所有成员中,并没有统一的发展计划,最好的主意往往来自第一线而不是来自中央。这使得去中心化组织能快速演化,有时候成长的速度极其惊人。

不过去中心化组织有个关键的弱点:你很难通过这样的组织赚大钱。分权的产业利润低,只有集权才能获得高利润。在这方面我觉得美国电信史是个很好的例子。哥伦比亚大学法学院教授Tim Wu在The Master Switch一书中总结,美国电信史就是一部在分权和集权中摇摆的历史。一个新生事物刚出来的时候往往是去中心化的,比如最早的无线电台都是由业余爱好者设立,每个电台的功率都很低只能覆盖有限地区,它们自由地播放各种内容,很像今天的个人网站。在这个阶段没人能赚大钱,人们甚至认为听电台广播是个高雅的绅士行为,根本没有商业因素。等到美国全国广播公司(NBC)把电台业务一统江湖,能做到一个节目同时覆盖全国各地,广告业务才变得非常赚钱,电台才成为一个利润丰厚的产业。

这也同时说明去中心化的组织干不了太大的事儿。自由软件社区是去中心化的,如果你像自由软件基金会的创始人Richard Stallman一样只使用自由软件,你的确获得了自由,而完全不用担心被谁监视。可是自由软件很不好用!好不容易装个Linux操作系统,后面使用中还有无穷无尽的麻烦。比特币交易平台资质不一。维基百科内容质量饱受诟病。就连看个电影,用BT下盗版还不如直接交钱给视频网站方便。面对这些麻烦,更多的人宁可放弃一点自由选择集权的大公司。正如当年的阿帕奇部落,去中心化经常是一种适合原始阶段的组织方式。

不幸的是,恐怖组织是去中心化的。他们干不了统治国家这样的大事,甚至也根本不可能分裂国家,但是他们干的“小事”就足以给社会带来极大的麻烦了。

本·拉登的确策划了911,但在大多数情况下,基地组织并不直接计划和指挥恐怖袭击。各地恐怖分子因为伊斯兰主义这种意识形态(不是伊斯兰教这种宗教)而实施恐怖袭击,基地组织的主要作用是给恐怖分子提供培训和榜样。恐怖分子们可能形成小圈子,但这些小圈子并不受基地组织统一领导。甚至有的恐怖分子拿了基地组织这个“品牌”就自发行动,比开个麦当劳连锁店都容易。

中国警方从未明确回答新疆恐怖分子到底是有上级组织的还是自发的这个问题。但从公开的报道来看,至少有部分恐怖分子是因为接受了极端宗教思想,看了暴力恐怖音视频而采取行动,似乎并没有来自境外势力的直接指挥。如果是这样的话,那么反恐就更加困难!这意味着我们要消灭的是海星而不是蜘蛛。

怎样杀死海星?《海星与蜘蛛》给了三个策略。这些策略虽然出现在一本六年前的书里,后来还是被其他涉及到反恐的论述所印证,现在我们了解一下可能也不全是纸上谈兵。

第一个策略是改变环境。既然你们是靠一种意识形态联系在一起,我就让你这个意识形态没有市场。

在这方面,以提出“北京共识”这个概念而闻名的英国学者乔舒亚·库珀·雷默在The Age of the Unthinkable(中译本《不可思议的年代》)这本书中说的更好。雷默说当面对一个变化的系统的时候,人们往往关注于那些快速变化的因素,比如人对森林的砍伐;但真正对系统影响最大的,却是那些变化很慢的因素,比如说气候和环境。黎巴嫩真主党是世界上最有创新精神和最成功的游击队,他们首创在同一时刻的不同地点发动恐怖袭击,而且还发明了遥控炸弹。真主党的成功秘诀恰恰在于其赖以生存的环境。他们在黎巴嫩的村落里不仅仅搞炸弹,也修学校,修医院,盖房子,搞社区建设。黎巴嫩人如果有什么邻居太吵影响我休息之类的社区问题,首先想到的是去找真主党。真主党把对西方的仇恨和宗教联系在一起,再加上群众基础,这些东西有很强的韧性,恰恰属于“变化很慢的因素”。以色列可以把真主党的房子炸了,但是摧毁群众基础很难。

乌鲁木齐“5.22”暴恐案的恐怖分子来自新疆最穷的地区[1]。当地人学汉语的热情不高,但是宗教势力非常强大,这可能就是恐怖分子在中国的典型环境。中国政府目前采取的一些反恐措施,包括在南疆实行免费高中教育,确保每家至少有一人就业之类,有人认为是“会叫的孩子有奶吃”,但其实这可以改变恐怖分子的生存环境。

第二个策略是先把海星变成蜘蛛再杀。美国人当初是怎么最终打败阿帕奇部落的呢?美国人给阿帕奇部落首领发牲畜。有了财富之后,这些部落首领就有了实权,他们可以通过支配财富来实施自己的权力,各个领导之间开始互相争斗,最终一个集权化了的部落就容易对付了。“匿名戒酒会(Alcoholics Anonymous)”本来是个完全非营利的去中心化民间互助组织,壮大以后为了宣传会员的故事而出了一本书,结果这本书带来的利润很快让组织开始“变味”了,人们立即想要通过集权来分配利润。利益可以使分权组织变的集权,但把这个规律用在反恐上恐怕不太合适,谁也不想等待恐怖组织做大。

第三个策略是把自己去中心化。这并不是非得把正规军变成游击队,而是要借鉴去中心化组织的分布式智力和灵活多变的特点。在这方面,美军在伊拉克的经验 — 尽管在很多时候被人当成笑话 — 其实非常值得借鉴。

2008年之前的驻伊美军的确像是一个笑话。萨达姆政权是个典型的蜘蛛式组织,美军一旦打下巴格达,伊拉克军队立即兵败如山倒,美军在整个进攻阶段才死了139人。可是占领容易重建难,去中心化的当地武装迅速兴起,游击战风起云涌,结果美军在重建阶段竟有超过四千人阵亡。我们一般认为美军占领伊拉克完全是一个战略错误,当地人的文化传统跟你根本不是一路,你孤军面对充满敌意的国土岂能不败?

但是我读经济学作者蒂姆·哈福德的Adapt: Why Success Always Starts with Failure一书,发现这个所谓战略错误其实是可以用战术来弥补的!哈福德说,2008年之前,拉姆斯菲尔德非常相信中央指挥的力量。美军的作战方法是用计算机模拟最精确的战场情况,制定周密的作战计划,然后让士兵去不折不扣地执行。但事实证明这根本不好使,真正有用的智慧来自第一线的底层官兵,而不是来自五角大楼。

不管拉姆斯菲尔德怎么想,前线士兵在作战中总结了一套第一手经验。这些经验“像中学生传阅色情杂志一样”在官兵中私下流传,最后还是引起了高层的重视并被整理出来。等到这套经验再被下发到前线以后,拉姆斯菲尔德对游击战的看法已经完全不重要了。2008年,伊拉克形势迎来一个转折点:当地武装全面撤退,美军的死亡人数戏剧性下降。

这些经验是什么呢?哈福德特意提到一位“H上校”的故事。H上校发现大部分伊拉克当地人之所以不愿意跟美军合作,并不是因为他们仇恨美军 — 可能他们更恨萨达姆。这些人不合作是因为他们害怕被报复。毕竟你美军可能打完就走,游击队的人可是要跟我们长期相处。H上校的策略就是在自己负责的整个城市中建立29个哨所,这些哨所条件很差,但美军士兵在里面长期驻扎绝不后退,给当地人一种可靠感。

最初美军为了守卫这些哨所伤亡很大,但是坚持下来以后,当地人的态度突然发生了奇迹般的变化。人们愿意跟美军合作了,甚至慢慢地,双方开始交谈。

H上校的种种措施包括要求手下必须尊重当地人。他说如果你不尊重一个伊拉克人,你就是在为敌人工作。

一个叫乔治的士兵贡献了一条经验。他说美军应该留胡子。因为他发现伊拉克人喜欢留胡子的人,他们很难相信没胡子的人。

这不就是我们常说的“密切联系群众”吗?跟正牌基地组织、真主党和伊拉克游击队相比,新疆恐怖分子就算是海星也只能算最小的海星,而我们的群众基础更胜美军和以色列百倍。只要切实掌握恐怖分子的活动规律,充分吸收第一线的经验,再加上密切联系群众,反恐有何之难?

—-
[1] 环球时报,《乌市暴恐案暴恐分子老家:警车不多维稳标语不少》http://news.sina.com.cn/c/2014-05-27/084530239222.shtml…

我的新书出版了!《万万没想到:用理工科思维理解世界》


2014年10月1日,电子工业出版社

京东链接

亚马逊

当当

豆瓣页面

 
至2015年5月,本书获奖情况

– 第十届“文津图书奖”,国家图书馆主办,10本获奖图书之一
– 2014“中国好书”,中国图书评论学会和中央电视台主办,30本获奖图书之一
– 2014“大众喜爱的50本书”,新闻出版局主办
– 豆瓣读书2014年度最受关注图书-非虚构类;
– 豆瓣2014年度盘点好书;
– 电子社2014年度好书;
– 百道网好书;
– 虎嗅网读点推荐
– 《环球人物》《南都周刊》等诸多大媒体推荐图书;


赵南元老师所作的序

我和万维钢未曾谋面,但在网上神交已久,互为读者和粉丝。在模糊的记忆中,最早似乎是通过刘夙给的链接发现了同人于野的博客,读过一篇之后便停不下来了。恰逢需要出差,灵机一动,利用一台贪便宜买来又没啥用的MP4的电子书功能,把他博客里的几十篇文章都下载到MP4里面,在动车上大饱眼福。其实旅程的无聊不算什么痛苦,毕竟有窗外的景色可看,知道有好文章却要在数日后方能有时间看,才足以令人牵肠挂肚,很不舒服。

从前听长辈说,人到老年,看书看皮儿,看报看题儿。我原以为,大概是因为老花眼看不清小字之故。或者是来日无多,学习的性价比下降,学习欲望也就相应减退了。等到自己也到了这个年纪,就发现这两个原因固然都有,但不是最主要的。最主要的是,看东西多了就会发现,真正有价值,值得花功夫和精力认真去看的作品,少之又少。当然,对于年轻人而言,这种态度显然不对,年轻人看什么都新鲜,都未知,都长见识,不吃前两个烧饼,只吃第三个烧饼也吃不饱。不阅读很多糟粕,也没有能力发现精华。

微博上常看到推荐书目,也没兴趣点开看都推荐了些什么书,估计不外乎一些名著。提起名著,就想起一句名言:所谓名著,就是人人都说应该看,但谁也不看的书。我也多次看到本年诺贝尔文学奖得主的大作堆在书店里无人问津。如果让我来推荐的话,我不会推荐那些适合用来装X的名著,只会推荐一本书,就是这本尚未成名之著《万万没想到》。

推荐的理由就是:这本书真的有用,而且对大多数人都有用。

世上有用的书很多,例如各种专业书籍,你不读就进入不了这个行当,但是如果你并不想进入这个行当,专业书对你的用处就不大。而这本书就如同一部人生指南,只要想改善自己人生的人,这本书都值得一读。

指导人生的书可谓汗牛充栋,但是其中有用的却如凤毛麟角。

本书值得一读的理由可归结为四点:

第一是新颖性。正如本书的书名《万万没想到》所示,本书所介绍的知识大多是与流行说法背道而驰的,可以改变我们很多固有的错误观念。我说本书有用也基于这个理由,毕竟,阅读一大堆老生常谈而不改变原来的想法,无异于浪费时间。

第二是科学性。本书的新颖,绝非信口开河的标新立异,而是由严谨的科学实验得到的结论。唯此才能有力地颠覆旧观念。这也是我认为本书很靠谱的理由。

第三是可操作性。本书不只是价值观的指针,更是行动的指南。有很多具体建议帮助你把领悟的道理付诸实施,这是很多类似作品所难以企及的。

第四是深刻性。本书不仅提供了知识,更提供了获得知识的方法和判断知识是否可信的准则,即所谓”元知识”的内容。读过本书,对于今后接受和评判新知识具有指导意义。

此外,本书的可读性也是出类拔萃的。语言生动,引人入胜,捧起书就想一气读完。这当然是好作品的基本要求,毋庸赘言。
本书内容分为三部分。

第一部分谈的是人性。在文艺作品的评论中,常常可以看到说此作品深刻的刻画了人性。但是如果你想通过欣赏这些作品使你对人性有更深入或与众不同的看法,那你百分之百会失望。本书所谈的人性,都是通过认知科学的实验研究,得出我们自身的认知倾向。这些倾向并非十全十美,往往造成我们的错误认识。了解我们自身思考过程中的陷阱,可以有意识地避免很多常犯的错误,学会用理性审查直觉。

第二部分谈励志。如今励志书也属于畅销的一类,大抵是成功人士的自传,有些甚至宣称我的成功可以复制。但是你真要想复制,时过境迁,物是人非,别人走过的路永远不会是自己能走的路。本书告诉我们励志也是有科学规律的,告诉我们如何以己之长克人之短。即使是读书一事,也有很多具体的技巧,更不用说要成为某项技艺的顶尖高手,科学的训练必不可少。至少在如何学习和训练以提升自己这方面,本书是介绍了很多实用诀窍的。

第三部分讲科学。科学的思想方法对人大有益处,起码可以大大减少受骗上当。特别是在信息爆炸的今天,缺乏科学精神会让脑袋里堆满垃圾。遗憾的是,现实中科学素养合格者在普通人群中只占不到百分之五。掌握大量的科学知识和从事科学研究也未必能使头脑中的科学精神同步增长,院士说蠢话也并不罕见。本书涉及具体的科学知识不多,但对于培养科学精神大有补益。我很希望文人们也来读一读这本书,不奢望他们会由此养成科学精神,即使能够由此了解一下”理呆们”如何想问题,也是一大收获。

如果说本书有何不足,那就是作者还有很多精彩文章未能收录,读者只能期待下一本书了。等不及的可以杀奔同人于野的博客,先睹为快。


技术说明和感谢

写“学而时嘻之”博客八年以来,得到读者和编辑的很多帮助鼓励,现在出了第一本书。从三四年前开始,就不断有出版社跟我说你出书吧,拖到现在的一个原因是我想出一本足够好,对得起读者的书。这本书不应该是以前文章的简单合集,否则网上都看过了何必再买一本?

我必须攒到足够拿得出手的文章,这些文章放在一起能够形成若干主题,只有这样才值得升级为一本书。本书中按三个主题选择了文章,文章之间互有联系,所有文字都进行了认真修改完善。

书中一些重点文章,做了大量的补充和改写,有不少东西是从未发表过的新内容。比如《练习一万小时成天才?》一文,现在新版的篇幅是原来的五倍以上,其中包括大量的新研究结果和素材,思想比过去丰富了很多。有些猛料一直忍着没在博客和微博说,就等着用在书里。

我确保书中内容达到我在出书时刻对相关领域的最新理解。书中提到最新的研究,是2014年刚出来的;书中用到最新的例子,是2014年7月的。

在写书过程中我发现纸质书相对电子版有一个排版优势。所有参考文献都列入当前页面的尾注中,方便查阅。而且尾注还有一个特别的好处,可以用来发表一点不适合放在正文的议论。出版社给用了很好的纸张,装订工艺也相当不错。

本来应该在书中写一段感谢词,但出版社为把定价控制在40元以内,严格限定页数(最理想页数是16的倍数,此书正好272页),一页都不能再多了。

特别感谢电子工业出版社的林飞翔老师在策划、编辑和出版过程中所做的大量工作。感谢赵南元老师给写了非常慷慨的序。感谢姬十三、土摩托、范致行、张明扬、李淼和郑诗亮老师阅读初稿并写了推荐词。感谢项婷婷和王天一老师的幕后指导。书中很多文章最初在新知客、果壳网、上海书评、商界评论、新知等媒体发表,中间得到诸多编辑的指教。最应该感谢的还是众多读者给我提供的大量反馈,这些反馈是我写作的“刻意练习”中最重要一环。读者能发现有意思和有用,就是这本书的追求。

图书已经开始在京东预售,国庆后可送至读者手中。

谢谢!

万维钢…

夺魁者本色

(《东方早报·上海书评》,2014年8月3日)

我上初中的时候经常踢足球,大部分男生都参加,而且是一本正经地分队比赛。有一次极其难得,几个女生要求跟着一起踢。她们在场上几乎不起作用,但已足够让我们受宠若惊。比赛中一个女生问了我一个问题,这个问题令我终生难忘。

她问我,为什么球出界了让对方掷界外球 — 难道不应该谁踢出界谁负责把球捡回来发球吗?

苍天啊。掷界外球是一种权利!你想怎么发就怎么发,你获得了一次进攻的机会!但是女生不这么看。她们也许认为踢球是一种社交活动,就如同舞会,在这种情况下一个人跑到场外捡别人踢出去的球的确不怎么公平。

但男生把踢球视为竞争。竞争,是一种非常特别的心理状态。这不是你好我好的游戏,这意味着一定会有人赢有人输。在竞争中我们可以争先恐后地做一些平时不愿意做或者做不好的事情,也可能因为过度紧张而发挥不了平时的水平。一件事如果不是竞争,哪怕像高空跳伞一样惊险,做过三次以后你就会慢慢获得平常心;一件事如果是竞争,哪怕是舞蹈比赛,你不管比过多少次还是会同样感到压力。

现在已经有很多关于怎么勤学苦练的书了。比如我们知道,要想在某一方面达到世界先进水平,最好的办法是进行刻意练习。但有水平是一回事,遇到竞争的场合能不能把自己的水平比出来,是另一回事。近年来科学家针对竞争做了不少研究,美国学者Po Bronson 和 Ashley Merryman 2013年出了一本Top Dog: The Science of Winning and Losing(《夺魁者:关于输赢的科学》),对这些研究做了非常漂亮的总结。我们在生活中经常能听到关于竞争的议论,但我敢说这本书中的有些研究结果,会大大出乎你的预料。

有的人特别喜欢竞争,哪怕本来不是个比赛他都想跟人分个高下;有的人特别不爱竞争,遇到正式比赛还想着跟对手聊天。有的人平时表现不错一到关键时刻就会被压力摧垮,有的人却能在压力下超水平发挥。是什么决定了这些人的不同表现呢?是文化传统吗?是家庭环境吗?是他们最近的心情吗?是星座吗?是手相吗?

有最多科学证据支持的答案是……手相。具体说来是无名指相对于食指的长度。想要彻底理解这件事,我们得从男女的竞争差异说起。有一个很有意思的研究,是中国人贡献的。

如果你经常看跟教育有关的新闻,你可能会注意到一个“最牛女生宿舍”现象:

  • 南开大学社会学专业某女生宿舍,四人中有两个专业第一,另有一被保送至中国人大,还有一人申请出国;
  • 南京邮电大学某宿舍八个女生全部考研成功;
  • 郑州大学118宿舍四个女生全部考上英美名校金融专业研究生,而616宿舍的四个女生则全部考上国内名校;
  • 西交利物浦大学某宿舍四个女生中三人考上剑桥,另一人考上帝国理工。

等等等等。一个宿舍的人互相激励共同进步,这听起来非常正常,可问题是,怎么没有“最牛男生宿舍”呢?

因为最牛的男生一般对自己的宿舍没什么好影响。中国大学给新生安排宿舍是强制性的,学生本人没有选择权,而校方安排宿舍的唯一标准是每个宿舍的学生尽可能来自五湖四海,完全不考虑入学成绩。对研究者来说这简直是个最理想的自然随机实验。哈佛和北大的两个研究者,Li Han 和 Tao Li,分析了中国某沿海省份著名大学2134个学生的高考成绩和在大学的平时成绩,研究他们的成绩怎么受室友的影响[1]。

他们发现女学霸对其所在宿舍来说是一盏明灯。如果一个女生的入学成绩比较弱,但是她有成绩好的室友,那么她在大学的学习成绩会因此受益。她很可能被室友激励,甚至可能得到了室友的直接帮助。可是男生宿舍里没有这样的效应。数据显示,那些学习最好的男生,甚至对自己宿舍其他人的成绩有个负面影响!

这并不是因为男学霸压制室友,而是因为作为男人,跟学霸做室友的滋味并不好受。《夺魁者》说,男孩什么都想竞争,每时每刻都想跟人比,而且还过度自信。上一所好大学之前,女孩能清楚地估计到自己面对这么多好学生将不会具备什么优势 — 所以在大学遇到困难她能够去寻求帮助,并且会得到帮助。而男孩从来没想过自己会输。如果输了他也不会去寻求帮助,他会拒绝承认自己输了,实在不行就干脆放弃这个项目。

男人在决定参与竞争之前并不在乎失败的风险,可是竞争中一旦遇到挫折就容易放弃。女人却总能合理评估竞争风险,一般不爱竞争,但是一旦参与了,就算遇到挫折也常常能坚持下来。

这样看来男人的竞争模式似乎比较愚蠢……但真实世界不只是大学生考研。在很多情况下,过度自信和敢出手恰恰是男人的优势。

比如为什么大多数政客是男的。这不是因为选民有性别歧视,事实上女候选人真参选的话,她获得的政治捐款和得票率都并不比男的低。女政客少,是因为女人不爱参选。女人不参选,是因为她们能合理对待自己当选的可能性。

有研究者对美国各州议员进行统计调查,问卷包括两个问题:1,你是否打算参选国会议员;2,你认为如果你参选,你赢的可能性是多少。结果非常有意思,关键数字是20%:

  • 如果自己评估的胜率是20%以下,很多男性政客仍然要参选,而女的就不愿意参选了。有些男的是不管概率多低都要参选。
  • 可是如果自我评估的胜率是在20%以上,女的甚至可能比男的更愿意参选。

对政治选举来说20%可是个巨大的数字。美国政界中如果一个在位者竞选连任,他获胜的几率非常之大,高达95%。女人不跟他争,是理性的选择。结果就是最后选上的都是男人。

了解过进化心理学的人可能会立即指出男女的竞争差异是由两性性生理决定的,男人搞搞冒险性行为无所谓,女人冒险要是一旦怀孕事可就大了,所以女人必然不如男人爱冒险。但《夺魁者》没提进化心理学。很多证据显示,一个人爱不爱竞争和冒险,其实是由一种激素 — 睾酮,这个天然的雄性激素的分泌水平所决定的。男性有睾丸可以分泌睾酮,但别忘了肾上腺和卵巢也分泌睾酮。

人们早就知道睾酮可以增加人的体能和爆发力,而最新的发现,睾酮居然对国际象棋也有好处。在一个研究中参加比赛的棋手们被时不时地测量睾酮水平,结果发现他们的成绩居然可以用其在临近比赛开始时的睾酮水平来预测。赛前睾酮分泌得越多,就越有可能赢得比赛,哪怕排名分没那么高都行。

这样说来,我们听运动员说今天状态出没出来,可能背后是睾酮在起作用。人似乎可以通过分泌睾酮来使自己达到最佳比赛状态。另有研究发现医生做越高难度的手术,其手术当天早上分泌的睾酮就越多。还有实验发现使用睾酮药物甚至能提升数学成绩。

睾酮,可以让人在竞争中更敢于冒险,更乐意投入比赛,在比赛中更无私,更关心队友,更可能抗议对手犯规,甚至能更多的诉诸于理性认知而不是感情冲动。如果一个人睾酮水平不够,他就很难进入来之能战战之能胜的兴奋状态。这何止是雄性激素,简直是竞争激素。

可是女人的基础睾酮水平只有男人的七分之一。基础水平低如果在赛场上临时多分泌一些也不错,但很多研究发现,女人在比赛中的睾酮水平并不像男人一样增加。而这居然是因为女人喜欢在比赛之前跟竞争对手聊天!实验发现如果把她们隔离开来使之看不到对手无法做赛前交流,然后互相用自己的进度刺激对方,那么女人的睾酮水平也会增加。

但是不要低估基础睾酮水平的重要性。基础睾酮水平低很可能极大地影响了女性的冒险精神。有人统计发现在天使投资人中有15%的女性,而在风险投资人中女性只占不到7%。尽管有充分证据表明华尔街的女交易员成绩不但不比男人差,而且还可能更好,但绝大多数股票交易员都是男的。一般女性很可能是吃了睾酮的亏。那么那些敢冒险的女性,她们拥有什么样的睾酮水平呢?

现在可以谈手相了。一个人基础睾酮水平可以反映在无名指和食指的长度比上。胎儿在子宫中的发育同时受到睾酮和雌激素的影响。这两种激素影响胎儿大脑的同时,也影响手指。睾酮水平相对雌激素水平越高,人的无名指相对于食指就越长。

2011年,两个意大利经济学家就此搞了个研究[2]。他们找人采访了超过两千个自己创办公司的企业家,给他们的右手拍了照片,然后用照片统计这些人的无名指和食指的长度比。结果发现越是成功的企业家,其无名指相对食指就越长,那些最成功企业家的无名指要比食指长10%到20%!更有意思的是其中有780个女企业家。通常情况下,男性的无名指比食指略长,女性的无名指比食指略短。可是这些意大利女企业家的无名指比食指长,而且其长出的比例比男性还显著!也可能正是因为这个原因,这些女企业家平均而言比男企业家更成功,她们的公司更大,成长更快,她们工作起来更猛。

如此说来,想要了解一个人适不适合参加竞争,得看无名指长度?!事实差不多就是这样。而且这个研究还不是孤立的。在《夺魁者》书中后面的参考文献中,我还发现好几个正文没有提到的类似研究,不只是企业家,从高水平运动员到华尔街高频交易员,成功者都有更长的无名指。

对无名指不够长的人来说这恐怕是个重大打击。但是像这样的打击还没完。

台湾的国中升高中考试可能像大陆的高考一样重要,通过了的学生可以进入通往大学的高级中学,通不过的则只能进入职业学校或者专科学校。试题相当难,通过率只有39%,而且通过之后能去的最好高中和差一点的高中分数线相差很小。参加这样的考试显然要面对巨大的压力,最吃亏的就是那些平时明明水平很高,一到关键考试就不行学生。

台湾师范大学的张俊彦率领的团队研究发现[3],像这样的学生有一个同样类型的单个基因,叫做COMT基因。

人脑兴奋起来高速运行要分泌多巴胺,它的作用是帮助神经细胞传递脉冲。我们赌赢了高兴,看见美女产生爱情,遇到大事激动,面对压力紧张,都与多巴胺有关。多巴胺少了人就兴奋不起来,多巴胺太多人又会兴奋过度。有一种酶负责在大脑的前额皮质中清除多巴胺,而COMT基因就是这个酶的编码。这个基因有两种变异类型:一种产生快酶,能够快速清除多巴胺,另一种则产生慢酶。多数人同时拥有这两种酶,但有的人只有快酶,有的人只有慢酶。

如果你的COMT酶是快酶,那么你面对压力的时候就很容易保持一颗平常心。这并不是因为你主观上定力过人,而是因为多出来的多巴胺会被迅速清理掉。有些学者把这样的人成为“战士(Warriors)”,因为他们临危不惧。而如果你的COMT酶是慢酶,那么面对压力多巴胺就容易过多,导致自己惊慌失措,这样的人则被称为“颤士(Worriers)”。亚洲国家的颤士比例不高,大约只有8%。

平时没有压力的时候战士的多巴胺也被清理的很快,于是他们就会表现为缺乏干劲,不兴奋。而颤士则因为平时也能维持一个比较高的多巴胺水平而表现很好。此前有很多研究表明,颤士的平均认知能力和智商其实都高于一般人。

总而言之,战士在战时表现超过颤士,颤士在平时表现超过战士。这正是张俊彦等人研究证实的结果:颤士们的成绩平均比别人低了8%。对升学考试来说,这是一个足以决定命运的差距。

所以决定一个人爱不爱竞争的,是睾酮水平。而决定一个人面对竞争压力怎么发挥的,是COMT基因。原来竞争这件事,不是谁想玩都能玩好的。难道说,有的人天生就擅长竞争,他们特别适合上场比赛,有的人天生更适合安稳的生活,他们的位置就只能在观众席?

也不是!从对策论角度来说,竞争其实有两种。一种是有限博弈(finite game),这种竞争就好像体育比赛一样有结束的时候,你比赛中必须全力以赴,比较强调爆发力,更适合男性或者战士参加。一种是无限博弈(infinite game),竞争永远都在进行,讲究持续力,需要你能够在其中偷偷地自我调整和恢复,更适合女性或者颤士参加。

这本书里最厉害的一个人物并非是哪个长着超长无名指的企业家,而是一位女足教练。Anson Dorrance担任北卡罗来纳大学女足教练超过三十年,总共获得了二十一项全国冠军。他很可能根本不了解关于COMT基因的什么新研究,但是他很了解女人。

大部分女孩不愿意竞争,尤其不愿意在队内搞竞争。她们害怕损害跟同伴的关系,担心队友不喜欢自己。Dorrance的做法就是找一个典型的敢于竞争的女孩 — 她在训练的时候非常拼命,玩真的,别的女孩都抱怨甚至来告状 — 然后他告诉所有队员:每个人都应该像她这么踢。他要求队员不要反感竞争,要把竞争当成常事!

在平时训练中,Dorrance想尽办法给队员加压。他搞了各种考核指标并把所有数据排名张榜公布,让她们时刻面临竞争压力。注意这个做法跟美国现在的校园文化格格不入,学校为了维护孩子的自信心从来不搞成绩排行榜,从这个角度说反而是中国学校的一年好几次考试排名更能培养人的竞争力。

在比赛中,Dorrance给队员减压。球队落后,他在中场只对队员说一句话:“现在你怎么想?”这句话一问,女孩们都非常自责,认为失败应该由自己来承担。女孩是重感情的,一旦你表现出对她很支持,她就会对你感恩戴德。注意这招只对女运动员管用。男运动员需要时刻被加压,Dorrance曾经带过男队,那时候他总在中场的时候大喊大叫地刺激队员。不过鉴于中国男足特别害怕压力,我怀疑也许他们需要女足的训练方法。

竞争,是对人的提升。古希腊是先有的奥运会才有的民主制度。奥运会是一个公平竞争的场合,人们习惯了这种公平竞争,政客们习惯了公开辩论,两百年后,风气形成,才实行民主。不过生活中大多数事情并不是竞争,睾酮高也不总是好事。睾酮特别高的男人很难与人相处,有时候女人不竞争反而能把事办好[4]。

但不论如何,我敢打赌你在阅读此文过程中查看了一下自己的无名指。好消息是无名指的研究还没讲完。研究者认为生理因素大约只能解释40%到60%的竞争力,后天教育和文化传统仍然有作用。意大利大部分女企业家集中在文化宽容的东北部,在这里先天资质并不特别出众的女人也有出头的可能性。

可是一个女人要想在意大利南部地区奋斗成功,她的无名指长度必须出类拔萃!

——–
[1] Li Han and Tao Li, The gender difference of peer influence in higher education, Economics of Education Review, 2009, vol. 28, issue 1, pages 129-134. http://econpapers.repec.org/article/eeeecoedu/v_3a28_3ay_3a2009_3ai_3a1_3ap_3a129-134.htm
[2] Guiso, Luigi, & Aldo Rustichini, “What Drives Women Out of Entrepreneurship: The Joint Role of Testosterone and Culture,” European University Institute & EIEF Working Paper, ECO 2011/2012 (2011).
[3] 文汇报:台研究破解「抗壓基因」http://paper.wenweipo.com/2013/02/09/TW1302090001.htm,论文是 Yeh, Ting-Kuang, Chun-Yen Chang, Chung-Yi Hu, Ting-Chi Yeh, & Ming-Yeh Lin, “Association of Catechol-O-Methyltransferase (COMT) Polymorphism and Academic Achievement in a Chinese Cohort,” Brain & Cognition, vol. 71(3), pp. 300–305 (2009),http://www.sciencedirect.com/science/article/pii/S0278262609001146
[4] 2013年大西洋月刊有篇文章专门谈这个问题:Kirsten Kukula & Richard Wassersug, The Modern Female Eunuch, Apr 1 2013.…

主题锤子和素材钉子的军备竞赛

(百度知道)

百度使用数据分析对2014高考作文题目预测这件事,值得再写篇文章。这是一次相当成功的预测,据有人分析,预测“命中了全国18卷中12卷作文方向”。其实在我看来还不止如此,甚至可以说全中。不过这些都不重要,甚至高考也不重要。重要的是,大数据的这种玩法,会给世界带来什么改变。


锤子和钉子

中国高考作文的出题方法有个固定的套路:给你讲一段小故事,然后让你根据这个故事,想想自己受到什么启发,写篇文章。换句话说你的作文重点根本不是这个故事,故事只是你要写的主题的一个素材。

同一个素材,各人思考角度不同,可以对应不同的主题。但更重要的是,不同的素材可以对应同样的主题。

比如全国卷的一个题目是“不要给野生动物喂食,否则它会丧失自己的觅食能力”。出题者的意图显然不是让人写一篇关于野生动物喂养的科普文章。

一个角度是把自己想象成野生动物,主题是年轻人应该自己闯荡,不能依赖前人经验的灌输。这不就是百度预测“生命的多彩”中的“奋斗”、“自由”和“青春”吗?而使用同样的主题,只要把文章稍加修改,完全还可以对付上海市的作文题:“你可以选择穿越沙漠的道路和方式,所以你是自由的;你必须穿越这片沙漠,所以你又是不自由的。”

另一个角度则是把自己想象成面对野生动物的人,那么主题就是要尊重自然,保护环境。这不就是百度预测“发展的困惑”中的“自然”、“环境”和“尊敬”吗?同样的主题下把文章稍加修改又可以对付辽宁省的作文题:“可惜漫天繁星没有了,沧海桑田转眼之间啊!当年那些祖先山洞边点燃篝火,看月亮初升天汉灿烂,他们欣赏的也许才是美景。”

现在我们的关键问题来了。到底是主题多呢,还是素材多?答案当然是素材多。素材怎么编都可以,但全体高中生都能想明白和说明白的道理就那么几个 — 具体说来,据百度数据分析发现,只有六个方面而已。

只要一个人熟读这六个方面各种可能主题的文章,掌握其写作套路,不管高考出什么素材都能应对自如。

这就正如有句谚语说“如果你手里有一把锤子,你看什么东西都是钉子”。这句谚语本来是贬义的,意思是告诫人们不要把什么东西都往自己掌握的有限理论上套。比如近年来人们学会了进化心理学之后,就不管看到什么社会现象都想用进化心理学解释,以至于我现在一听进化心理学就浑身起鸡皮疙瘩。

可是如果把这个锤子精神用在准备考试上,那是最好不过了 — 只不过你需要掌握的不是一把,而是六把锤子 — 有了这六把锤子就可以对付几乎所有的高考钉子。其实锤子精神还可以用在领导讲话上,任何事情都必须“高举中国特色社会主义伟大旗帜,以邓小平理论、“三个代表”重要思想为指导,深入贯彻落实科学发展观……”这方面目前一共有三把常用锤子,它们总是同时出现。

那么百度发现这些锤子用的是什么技术呢?


主题模型

给你一篇文章,你怎么能看出来这篇文章是说什么的呢?具体说来,你怎么能让机器知道这篇文章是说什么的呢?这个思想叫做“主题模型(topic modeling)”。

百度作文预测使用的主题模型技术叫做“隐含狄利克雷分布(Latent Dirichlet allocation,LDA)”。这是一个2003年才被提出的新技术,它的发明人之一正是刚刚加入百度,负责“百度大脑”项目的吴恩达。

LDA的基本思想非常简单。计算机认为文章只不过是一些词汇的集合。而每个主题,也只是一些关键词的集合。计算机没必要“理解”每个主题或者每个词的意思,甚至根本不用管这些词出现的先后顺序。

我们人为地设定一些主题,并且在数据分析的帮助下给每个主题设定好关键词。比如“狗”的主题下的关键词可以包括“骨头”、“汪星人”、“忠诚”、“朋友”等等,如果是最近的研究恐怕还要加上“广西玉林”。这些关键词的设定没必要非常严格,到底哪个词更重要可以交给机器去发现。

这样我们就有了一个主题的集合,每个主题又都是一大堆关键词的集合。同样一个词可以在多个主题中出现,但是在不同主题下出现的概率是不同的。

计算机要做的仅仅是使用一定的数学方法对根据每篇文章中的词汇进行分析。一篇文章拿过来,你要做的就是把事先设定的所有主题一个一个的过一遍,计算这篇文章中的词汇对应每个主题的可能性是多少。计算结果,就是这篇文章说的是每个主题的概率大小。一篇文章也许可以有超过一个主题,这不是问题。关键在于,计算机可以判断一篇文章最有可能说的是什么主题,第二可能说的是什么主题……这就相当于计算机已经“读懂”了这篇文章。

百度只要把海量的作文都用这种方法分析一遍,就得到了各种不同主题的出现总概率。更进一步,再结合年度风云搜索信息和当年的热点新闻信息,就可以判断现在最流行的作文主题是什么了。

LDA有很多应用。只要把“文章”改成“图像”,把“主题”改成“物体”,它就可以用来分析一张图片中都有什么物体,并用于给图像分类。它还可以用来分析音乐的乐句,再结合每首歌的受喜爱程度,就可以用于歌曲推荐。我猜主题模型的方法还可以用于分析新闻报道、电影剧本、小说和游戏情节,这样机器就能比任何文化批评家更早意识到现在流行什么。

如果机器如此厉害,人又当如何呢?


未来

设想几年之后,所有考生都知道了百度能预测作文题。这些考生将会熟练掌握百度指出的任何主题。这样一来,他们的高考作文成绩将会非常接近 — 而这是出题者所不愿意看到的,因为高考的作用不是为了证明学生学得好,而是为了选拔,选拔要求必须有比分差距。

出题者怎么办?他们必须打破俗套,发明全新主题!从这个意义上讲数据分析带来了社会进步。

但这有一个问题。数据分析会迅速发现这个新主题,并且促使它以比以往快得多的速度流行开来。等到所有考生都掌握了新的主题,这个新主题就又没用了。

所以数据分析的真正作用是能让好东西迅速流传开来……然后迅速消亡。这里说的当然不只是高考作文,更重要的是电影剧情之类。

华尔街的金融公司使用各种数学模型进行股票交易。这些模型的特点是一开始如果只有你在用,你也许可以非常赚钱,可是一旦别人也开始用同样的模型,那么市场就会在这方面变得越来越有效率,以至于这个模型的回报率就越来越低。于是你就只能再去发明一个新模型,一个更复杂的模型。直到这个模型也变得不好使。

结果华尔街就永远需要新模型,而且越来越复杂,越来越不容易赚钱。这是一场军备竞赛。

主题也是如此。一个好使的主题会因为有太多人使用而变得不再好使,人们被迫发明新主题,但新主题也将会变得不好使。

这都是互联网和数据分析带来的。整个过程的节奏可能会越来越快。历史必然加速前进,直到………