每个人都在说谎!还在用谷歌?你的小秘密,Google比你更清楚

2017年06月22日 加拿大第一生活


互联网时代,人们唯一不会撒谎的对象就是搜索引擎。夜深人静,不可与人言的苦闷、或者疑问,甚至不可描述的事情,都可以毫无保留地写进搜索框,来寻找答案。人们觉得只需要关机之前,清理一下缓存,就真是“神不知、鬼不觉”了,而事实上,搜索引擎(国内的Baidu和其他地区的Google)记住了这一切。



最近一本5月份才刚刚推出的新书《每一个人都在说谎》火爆全球。英文版的原称是Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us What We Really Are 。尽管本书洋溢着有趣的奇闻异事和违反直觉的事实,但细思极恐,大数据时代,Google才最真实的揭示了人的本能和真实想法,让我们看到被隐藏的真相。



本书的作者Seth Stephens-Davidowitz本科毕业于斯坦福,从哈佛拿到经济学博士,因为对数据的热爱受邀加入谷歌,现在他在宾大沃顿商学院教授一门数据课程,他也是《纽约时报》的数据专家。《每一个人都在说谎》是Seth这些年大数据分析的最新成果,读起来非常有意思。


今天,加拿大第一生活就把书中一些有意思的成果结论分享给大家。


人人都在撒谎,只是程度不同而已



 

人人都在撒谎,只是程度不同而已。那么积少成多之后,我们眼睛看到的世界就和实际的世界完全不同,在这样谬之千里的基础上,所做的很多决定都有可能是错误的,至少是滞后的。这大概就是我们经常觉得国家政策和市场脱节、广告商花了大价钱还做了一个很烂的广告、我花了那么多心思还得不到领导的欢心、别人赚钱那么容易为什么我赚钱这么难等问题的原因。


最常搜索的关键词


分析Google Search,还可以发现,最常用的有关“上瘾”的关键词,顺序排列是:毒品、性、色情、酒精、糖、爱、赌博、Facebook

 


假如你做一个同类的有关“上瘾”的问卷调查,答案也许是音乐、阅读、运动等等。大数据告诉我们,每个人都会说谎你看过一份履历表,喜好一栏会填上喝酒、吸毒、一夜情吗?The Internet is for Porn, eh?



调查问卷、民调并不够可靠


数据不一定可靠,因为很多人面对问卷调查都不会说真话;真正可靠的是大数据,因为大数据是人类被动而且自愿贡献的,记录着人的真实行为(或者是动机),所以大数据作为诚实、实时而海量的数据,它比通过民调采集而来的数据,更能预知未来,提供洞察。


Seth的最基础大数据来源,是Google Search,也就是全世界每天超过20亿人都会用到的搜寻器(当然很不幸,它的资料不包括需要翻墙的互联网用户)。通过分析Google Search和时间、事件发生的关系,会有很多惊人的发现。


比如去年的美国总统选举,大部分传媒、民意测验都预测希拉里会打败特朗普,成为新一任的总统。结果呢?她输了。这是怎么回事?因为民意测验出现了非常大的数据偏差。



第一,抽取的样本不够代表性;第二,抽取的样本太少;第三,很多回答问卷的人其实都是在说谎。因为他们觉得大部分的人都会投票给希拉里,所以他们会随大流的回答,这是学术上所谓的随大流效应(Bandwagon Effect),其实,他们的问卷答案不一定代表他们的实际行为。


相反,通过大数据分析,就是通过“聆听”美国用户的对话、评论、动作,我们会发现特朗普的好感度远远超过希拉里,他的胜出是一点都奇怪。他当选美国总统,完全不是大家说的“黑天鹅”。


社交媒体正在让我们变得痛苦


我们都多多少少地知道,人们不可能像他们在朋友圈,Facebook上表现的那样成功、富有、有吸引力、有智慧,还轻松愉快。然而,我们都无法避免将我们的内心生活与我们的朋友们精心挑选的生活做比较。

 

其实,一个在屏幕面前的匿名者,往往会告诉搜索引擎他们不透露给社交媒体的东西;他们甚至把不告诉任何人的东西告诉搜索引擎。谷歌(Baidu)是他们的数字吐真剂。我们在谷歌上输入的词汇比我们在朋友圈、Facebook或Instagram上呈现的图片更诚实。



有时,有不同来源的数据的对比颇为有趣。比如,妻子如何谈论她们的丈夫。


在社交媒体上,完成“我丈夫是...”这个短句的最常见形容是“最好的”、“我最好的朋友”、“惊人的”、“最伟大的”,以及“可爱的”。在谷歌上,最常见的完成这个短句的五个词之一也是“惊人的”。这没问题。另外四个是:“一个混蛋”、“烦人的”、“同性恋”,以及“刻薄的”。


花五年的时间盯着计算机屏幕,研究人类的一些最奇怪、最黑暗的想法,可能不会让大多数人觉得是美好时光,但这些诚实的数据出乎意料地令人安慰。在不安全感、焦虑、挣扎和欲望方面,你不必感到那么孤独,每个人都有秘密,都在撒谎。


一旦你看到了足够多的搜索数据汇总,你很难会把我们在社交媒体上看到的那种精心挑选的自我形象那么当真。换言之,把谷歌数据教给的信息作这样的总结:我们都是一团糟。


不要将你的搜索与他人的朋友圈帖子做比较


嗯,你可能不是数据科学家。你可能不知道该如何用统计分析语言coding写代码、或计算置信区间。但你仍然可以用大数据和数字吐真剂来终止嫉妒,或者至少不让嫉妒过于扰乱你的情绪。


每当你在朋友圈、Facebook上潜水之后对自己的生活感到沮丧时,就上谷歌去,在搜索框中开始键入单词。谷歌的自动填充功能会告诉你其他人正在做的搜索。键入“我总是...”之后,你也许能看到一些来自他人搜索的建议,比如“我总是感到疲劳”,或“我总是腹泻”。这可以提供与社交媒体上截然不同的对比,那里所有的人都似乎“总是”在加勒比度假。


随着我们的生活越来越多地转到网上,我建议一个由大数据得来的21世纪的新自救口头禅:不要将你的谷歌搜索与他人的Facebook帖子做比较



社交媒体上撒谎很常见


有一个特别有意思的话题,就是其实人也会在社交媒体上撒谎。这就是所谓的”社交讨好偏见“ (Social Desirability Bias) 了。


大部分能公开的东西,内容都会经过选择。大部分人不会选择公开让其他人讨厌、鄙视、批评的内容,因为他们需要显示讨好其他人的一面。这也就是所谓的“数字谎言”,包括发帖、点赞、个人描述,全部都只是片面,不代表真实。



真正不会骗人的,是他们的行为:搜寻、浏览、点击、刷屏,这些才反映他们想什么和想要什么。我们每天用互联网,用手机的行为,就是真实的数据了。


可以打败高盛的大数据公司


每个月特定的一个周五,都是包括高盛在内的华尔街各大金融机构最为忙碌的时间点。大部分人早上7点就会到公司,忐忑地等待着一个数字在彭博终端上蹦出来,他们好第一时间进行市场操作。这个数字就是每个月的失业率。中国人可能不太理解,这个数字在美国的重要性就相当于是每年中国的GDP增速,所有的国家财政政策、金融政策等都会根据这个数字进行调整,金融市场自然也会跟着波动。


但是因为失业率的收集方法很古老,而且还有时延,所以往往是就算这个月情况有所好转,但是得到数字显示失业率很难看,那么政策就要调整。这个滞后性有时是灾难性的。现在都21世纪了,大数据的时代,有什么办法可以让这个古老的统计方法改进一下吗?


谷歌的科学家们已经可以早于高盛和美国白宫,拿到经济数据了。他们通过大量的数据分析,发现经济好、房价涨的时候,人们普遍搜索的关键词是“新房的施工队”、“房贷比率”、“优惠的房贷利息”等,而经济差、房价跌的时候,人们搜索的关键词是“快速卖房流程”、“资不抵债”、“抵押贷款减免救济”等等。这些实时性的搜索,远比美国官方统计的数据更能反映真实情况。


我是一个可爱的广告位


话说回到“失业率”上来。谷歌的科学家们发现,失业率有上升的迹象,那么有几个关键词的搜索频率就会增长。当然不是“新工作”、“失业办公室”,搜索最多的居然是色情网站!这个正常人乍一听要脸红的事情,居然是很多失业的人搜索最多的地方。不过想想也对,这些人正好有大把的空闲时间,而且经济还没有完全衰退的迹象,所以他们觉得借失业给自己放个假,过几天再去找工作也好。而等到美国白宫和华尔街拿到失业率的上升数据,那至少是一个月之后的事情,政策出台又得一段时间。

 

Seth在此总结了一下,他认为大数据的价值并不在于“大”,而在于数据可否给你提供新的信息,这些信息是以往从来没有被收集和发现的


照片上的笑脸越来越多


通过图片分析,美国人拍照的发型和表情从1900年代开始不断变化。不论男女,本来拍照都是很严肃的,然后大家慢慢的,开始有笑容了。这是什么原因?

100多年前,拍一张好的照片的成功率很低,所以必须等好久,而且要练习好“正确”的表情。然后慢慢的,摄影机普及了,胶卷也便宜了,拍好照片的成功率提升了,大家没有那么紧张了,就开始微笑了。到现在,大家用的是数码照片,拍好一张照片的成功率差不多是100%,所以根本不用紧张,随时可以用什么表情都可以,大家也选择最开心的照片了。


你的搜索记录,最真实的揭示了你的性生活


说起隐私,很多人第一时间联想到的不是自己的身份证、银行卡,而是自己的私生活。在中国,人们还不习惯在公开场合讨论“性”这个话题。但是在欧美,人们更加开放——但千万别以为他们愿意讨论,就愿意说实话。人们是在“性”这个话题上撒谎的频率,高的惊人。


Seth这本书确实提及了很多关于”性“的话题,似乎想告诉大家,这个话题确实是大禁忌,人说的跟想的和做的完全不一样:这包括了伴侣的数目、性行为的次数、每次的时长、满意度,全部都是谎言。


美国人的婚姻中存在的最大问题是无性婚姻。根据谷歌的数据,搜索“无性婚姻”的人数比搜索“不幸福婚姻”的人数多了3倍半,是“无爱婚姻”的8倍!这是社会学家通过问卷怎么都发现不了的,因为问卷里只有1%的人承认自己过去一年没有性生活,但实际上这个数字远远大于1%。


一个小小的社会学调研,得出的结论和实际情况都能谬之千里,更何况是那些更重要的数据:比如失业率、GDP增速、购买力、行业发展、投资情况等等。我们普通人如果根据这些数字来投资、国家如果根据这些错误的数据来制定政策,你觉得结果会怎么样?想想都是件很可怕的事情。


有关描写以暴力侵害妇女的色情文学


这对于色情文学而言是一大主题,但觉得有点出人意料的是,该主题在女性群体中远比在男性群体中更受欢迎。对于女性而言,它属于最受欢迎的色情文学体裁之一。如果以搜索次数来衡量,女性针对暴力色情的搜索量约是男性的两倍。


What should you say on a first date if you want a second?


男士如何确定约会对象对他感兴趣?对于女性而言,如果在首次约会中频繁使用“我”这个词来表达自己则是表明她感兴趣;而如果一位男士用低沉、单调的声音说话则是表明他感兴趣;如果一位女士不感兴趣,她将使用诸如“有点儿”、“稍微”、“或许”等避重就轻的词语;而一位男士可通过对女士所讲的笑话会心一笑或者对她表示支持(比如说“那一定很困难”或者“听起来很难”),就可以增加对方第二次约会的可能性。


当然这并不是什么艰深复杂的事儿,但我认为很多男士可能有必要了解一下。一位女士可通过多使用“我”这个词谈论自己的事来增加对方继续约会的几率。看起来这有点儿与传统观点相悖。我觉得很多女士都认为他们不应该过多谈论自己,然而事实上男士似乎很喜欢女士在首次约会时就能够敞开心扉。


约会了一段时间,有关男友的头号吐槽搜索词?


是“我男朋友不和我啪啪啪”,这比“我女朋友不和我啪啪啪”更加常见。前者大概是后者的两倍。这并不意味着相对于女友而言,2倍多的男友们拒绝性爱。这可能是源于当一位男友拒绝性爱时,其女友更有可能求助于谷歌搜索,因为(相较于女性拒绝男性而言)这更加出人意料。因为在流行文化中,男士应该时常渴求性爱,但我认为这些研究数据确实表明回避性行为的男士可能比传统上认为的更常见。


有关身体,最多男性搜寻的是关于生殖器官的大小,最多女性搜寻的是关于生殖器官的气味。这也反映了一些女性内心的渴望。很多的问题,我们并不了解,因为这涉及到难言之隐,也因为这对于很多人而言是一件尴尬的事情。不过,因为人们把一切都告诉了谷歌,现在我们才了解到这种不安全感是多么普遍。


最诡异的发现:印度男人与母乳


Google大数据还发现了一个很有意思的事,全球范围内,搜索母乳喂养的,大多是母亲哺育婴儿,而在印度,很多男性在搜索母乳,却是为了自己。Why are adult men in India so eager to have their wives breastfeed them? 为什么印度成年男性如此渴望让妻子给自己哺乳?小编也不清楚,只有印度人自己知道吧,尽管印度的医生和男性并不承认他们这么干。


两个体会


第一点令人沮丧,甚至有点儿令人恐惧。这本书名为《Everybody Lies》,全书以种族主义为开端,在调查中受访者表示他们并不在乎奥巴马(Barack Obama)是黑人。但与此同时,他们进行了很多有关种族主义的搜索,且数据真切地显示出,许多美国人没有投票给奥巴马恰恰因为他是黑人。


人们能够做到说一件事,而行为却截然相反。就像黑暗总是被隐藏在文明社会之中,这让我觉得世界有点儿糟糕,有点儿令人可怕和惊骇。


第二点则是普遍存在的不安全感,这让人觉得有点儿释怀。无论是在朋友面前还是在社交媒体上,人们会装门面、讲排场,确保自己自信而圆滑。但本质上来说,我们都是焦虑的,我们都是敏感的。



这让我感到没那么孤单,也让我更富有同情心。我现在会认为,即便人们在微信朋友圈、Facebook上表现的很轻松,但每个人仍然都有自己面临困难的时刻。Life is not easy.


Schadenfreude


Schadenfreude,是个从德语来的词。意思呢,就是看到别人犯错和倒霉的时候心里或多或少觉得高兴的感觉。咱中文管这个叫‘幸灾乐祸’。而英文并没有这个可以代替的词,只能引入这个德文词。每个人都会或多多少有幸灾乐祸的心里,无关国籍肤色。这么说你是不是又轻松了些?


作者的其他一些结论还包括:


  • Do violent movies increase violent crime? ——暴力电影是不会提升暴力犯罪率的,相反是会让暴力犯罪下降。真正能预测暴力犯罪率的,是酒精的消耗量。

  • Do parents treat sons differently from daughters?——父母比较能够容忍儿子的坏行为和脾气,但是对于女儿的这些行为,一般都不会容忍。

  • 每一次美国总统演说要平等对待非白人和穆斯林,美国人对他们的仇视程度就会增加一点。

  • 每一次大家反对苹果的新产品,批评它没有新意,都能够让苹果的产品销量创高峰。


书中还有很多其他有意思的问题,比如:

  • How much sex do people really have?

  • How many Americans are actually racist? 

  • How many people actually read the books they buy?


近期,无论加拿大,美国还是英国,恐怖主义行为,针对亚裔和穆斯林的族裔仇恨事件频发。不得不承认,正如小编最喜欢的音乐剧之一Avenue Q中唱的那样:Everyone is A Little Bit Racist!每个人内心深处都是或多或少的种族主义者,不同族群之间都存在着歧视,同一群体内部的鄙视链和歧视有时候更甚。


真实的人性或时代,远比我们想象中,或者愿意相信的更复杂、多面。


Seth这本书精彩有趣,有中文版的话,一定要看看!有助于我们更了解真实的世界和人类。英文版在亚马逊就买得到:

https://www.amazon.com/Everybody-Lies-Internet-About-Really/dp/0062390856,只要16刀!


部分资料来源纽约时报等

相关文章阅读:

这本书风靡北美,因为它能培养孩子一生受用的好品格

家长最值得陪孩子看的100部BBC经典纪录片!码起来,慢慢看!

BBC评出100年来最伟大的11本儿童读物,你的孩子读过吗?


近期热文:

多伦多最贵的8大在售豪宅长啥样?80000000人民币起,土豪们请看过来

好消息!国内高考成绩也可以申请加拿大顶尖大学!还不快来看看你的分数能上哪些学校

喜大普奔!!!加拿大C-6法案昨天正式通过, 移民入籍门槛大大降低

2017版移民加拿大方法大全,看完就知道你适合哪一种!

13个关于加拿大的真相,中国人不知道,海外华人却知道!



收藏 已赞