刚刚过去的这个周末,美国《纽约时报》和英国《观察者报》爆出了一个惊天大新闻:
一家叫做剑桥分析(Cambridge Analytica)的数据公司,非法窃取5000万Facebook用户资料后用算法进行大数据分析,根据每个用户的日常喜好、性格特点、行为特征,预测他们的政治倾向;
借助Facebook的广告投放系统,这家公司可以在数据分析的基础上对每个用户进行个性化定制、有高度针对性的新闻推送,进行潜移默化的洗脑,最终达到不知不觉中影响他们投票选择的目的;
比如,根据 Tom 在社交网络上的留言和点赞情况,大数据可以推测出他是一个喜欢枪的人,所以推送中会出现“希拉里将要禁枪”的内容;再比如,Lily 是一个认为宽松的移民政策会导致治安情况变差的人,所以会向她推送“希拉里要给任何移民绿卡”的内容……
原本还摇摆于川普和希拉里之间的 Tom 和 Lily,在看到这些内容推送后,最终把票投给了川普。
消息的来源是剑桥分析的前员工威利(Christopher Wylie),他向媒体详细地披露了其中的内幕。
几个数字足以看出这件事的热度:
纽约时报网站上一般文章的评论不过几十条上百条,但这一次有几千条评论;
《观察者报》隶属卫报集团,卫报网站上的报道被转发了14万次。
听起来匪夷所思,但通过大数据来影响选民的政治倾向并不算是什么太新鲜的事,过去媒体上已经有不少相关的报道。
这一次之所以成为重磅头条,是因为:
第一,数据的量级实在恐怖,整整5000万Facebook的用户数据,接近Facebook美国活跃用户总数的三分之一,美国选民人数的四分之一。
第二,这些数据在用户不知情的情况下非法窃取后用于政治目的,媒体因此定性为史上规模最大的泄密。
剑桥分析是怎么窃取Facebook用户数据、又怎么使用这些数据的呢?
先说一件几年前在美国一家财经杂志上看到的事情。说的是美国某个内陆州一个中年男子向Target超市投诉,因为这家超市给他未成年的女儿投递孕期用品的小广告。
结果几天以后,这个父亲又来道歉了,因为他的女儿去医院做了检查,发现真的怀孕了。原来Target的系统根据她女儿近一段时间的消费购买习惯,自动分析出她有了怀孕的迹象。
这就是大数据的恐怖之处——可以在家人朋友、乃至本人知道怀孕之前,就先推算出你怀孕了。
Target虽然是一家规模很大的连锁超市巨头,但手头的数据毕竟只是用户买过哪些商品。Facebook就不一样了,坐拥22亿的活跃用户,数据规模要比Target大得多,两者根本不是一个量级,因此可以分析出来的东西就更多、更精准。
这些海量的数据是一座取之不竭的金矿,也是Facebook最大的财富,让每一个有野心的人都垂涎三尺。
Facebook有个特别的地方是,绝大多数用户都用真名真姓注册,同时会在上面登记大量的个人信息——生活的城市、毕业学校、工作单位,等等等等,可以说是每个人都把自己生活中的社交关系链完整地移植到了Facebook上。
Facebook还有一个独创的机制,叫like,微博的点赞就是向他们学的。Facebook鼓励用户点赞,每个用户每天都会有大量的点赞行为。
而这个点赞,可以透露出很多甚至连家人朋友都不知道的隐藏信息。Facebook内部就一直通过分析点赞行为,来实现广告的精准投放。
剑桥分析开发了一个让用户进行“个性人格测试”的 Facebook app(类似微信的小程序),每个用户做完这个测试,就可以得到5美元。
因为这个app是寄生在Facebook平台上的,用户需要授权开发者获得自己的Facebook资料以及自己的好友信息才能使用。通过这样滚雪球的方式,剑桥分析最终得到了5000万名用户的资料。
他们为最初的一批测试者建立心理画像,通过比对他们的回答和他们的个人资料建立一个强大的算法模型,再用这个模型来预测和影响其他用户的行为模式和投票选择。
比如说,针对那些还在犹豫不决的中间选民,他们会推送有针对性的新闻乃至假新闻,潜移默化地改变和操控他们的心理。
容易被煽动起来的,就推送耸人听闻的内容;看起来智商比较高的,就把内容包装得再巧妙一些;虽然支持特朗普但是可能不太愿意捐款和出门投票的,就强调下形势的严峻性,调动他们的积极性。
总之就是投其所好,高度精准的个性定制。
Facebook原本有机会制止这一切的发生。早在2014年,他们就监测到了剑桥分析大量获取用户资料的异常行为,但可能是过于麻木,并没有采取有效的措施,而是放任剑桥分析继续非法使用自己的用户数据。
而对外界,他们一直隐瞒着这一切,上个月他们在接受美国国会关于Facebook上假新闻的质询时,还坚称自己的用户数据从来没有被挪作他用。
甚至在这次《纽约时报》和《观察者报》的重磅报道出台后,他们做的第一个反应,竟然是封杀了爆料者、剑桥分析前员工威利的Facebook账号。
正是因为这样的做法,所以Facebook现在站在了风口浪尖,成为美国人千夫所指的邪恶公司。
如何对这样坐拥海量数据、但却缺乏透明度的公司进行立法监管,是现在美国人正在激烈讨论的话题。
[上一篇] 我们该从Facebook史上最大数据泄露事件中明白什么?
[下一篇] 打造最佳客户体验银行,招行开启零售银行登顶之路