《大数据》:巨量资料预测未来,挑战世界互动方式

《大数据》:巨量资料预测未来,挑战世界互动方式

试读连结

有一天下午坐在我旁边的同事突然问我,你正在听周杰伦的歌,对吗?我吓了一跳,差点从椅子上跳起来。我耳机音量调得很小,声音并未从耳机流露出来,电脑画面也没显示我在听谁的歌,怎幺坐在我隔壁的同事会知道?他神秘的笑笑说:「Facebook告诉我的。」

这时我才惊觉,原来我不知不觉在各种系统的应用里,不断的将我的使用习惯、个人喜好、甚至我思我见透露出去。在Facebook上、在twitter上,在这个以分享为概念的Web2.0时代,让资讯变得更加大量製造。

就像牛津大学网路研究所教授麦尔荀伯格(Viktor Mayer-Schonberger)所写的《大数据》(Big Data)这本书中提到:「网路的出现,让追蹤我们、监视我们变得更容易,就如Amazon会监视我们的购物喜好,Google会监视我们的浏览习惯、Twitter会知道我们在想什幺。至于Facebook除了上述资讯之外,甚至监视我们的社交关係。电信公司不但知道我们和谁讲话,还知道有谁在我们附近。」

作者麦尔荀伯格是研究「巨量资料」领域的权威,他在本书中阐述「巨量资料」如何挑战人类的生活方式,以及世界互动的方式。例如, 2009年全美正面临防疫H1N1的紧急情况,几位Google的工程师只是突发奇想的将美国民众在Google搜寻的关键字与美国疾病管制局的资料相互比对,居然意外的发现,只要掌握关键字搜寻几乎可以同步掌握流感疫情的传播情况。

这样惊人的同步掌控疫情,只是工程师透过一些演算法进行比对,并不需要亲自跑去医院搜集病情资料或检体。

作者更举出「巨量资料」甚至让我们抛下因果关係,只需简单的相信「相关性」。例如,电子商务网站总是希望将更多的商品加入消费者的购物车,因此推荐系统变得非常重要。以亚马逊网站旧有的推荐系统来看,当你买了一本婴儿书,旧系统只会推荐你更多的婴儿书,他们一直觉得这样的推荐购物清单是很愚蠢的。于是亚马逊网站其后研发出「品项对品项」的协同筛选技术,当你下次买了一本婴儿书,系统会自动推荐你买奶瓶、尿布、甚至婴儿车。作者提到,透过善用「相关性」,不用将资料一一抽丝剥茧,只要找到重要的指标便能让资料说话、预测未来。

这让我想起汤姆克鲁斯「关鉴报告」的那部电影,警方在嫌疑犯会犯下罪行之前就先逮补他们。当时我看这部电影时,觉得相当荒谬,因为那个被称之为「犯人」的人,其实什幺都没做,就必需要被抓起来,只因为系统根据一些线索分析后,预测他接下来可能会犯案。作者提到,这样的「预测系统」已应用在美国的假释委员会里,将资料分析的结果作为某个囚犯是否能够假释的参考资料。甚至在美国有越来越多城市,採用预测治安系统,根据犯罪的频率、团体、人种、社经地位等去分析哪些路段是否要特别加强巡逻,以防治犯罪。

其实,每次看到科技应用与人性对峙的状况时,不禁都让我感到寒颤。正如作者也在书中指出,这是一条危险的道路,如果巨量资料能够预测未来谁可能犯罪,光是预防可能还是有人会觉得不够,甚至会想要先去惩罚那些可能会犯罪的人。

作者站在客观的立场提出,「巨量资料出现的确让量变引发质变,如果以负责任的态度使用巨量资料,会是一个理性协助决策的工具,但如果使用得不够明智,就会成为强权的工具造成压迫──轻则有可能是让客户和员工感到委屈,重则可能使得公民受害。」

例如,网路提唱「匿名化」,然而在网路上我们所曝露的资料越来越多,其实要「反匿名化」倒不是件太难的事。书中就举出,AOL某次公布一些旧有的搜寻资料编号,原本只是想从这些资料里分析出一些有趣的资讯,AOL也已删除重要的用户名称、IP位址等资讯,但是《纽约时报》还是能在短短几天用一些关键字,找到某编号的人,并登门访问。这事就好像我们常在新闻里看到的「人肉搜索」,网路几乎无所不能,只要几项关键资讯,网友就能在短时间内把真实人物纠出来。

因此在这本书最后,作者也提出了反思,他说:「如果这个世界都是由资料来告诉我们,该如何做决定,那幺人活着、或者你我的直觉,又还有什幺意义呢?」作者认为,巨量资料是一项资源、工具,它的目的是通知,而不是解释。最终希望当我们在使用这项工具时,必须要怀有更多的谦卑,以及许多的人性。

也许,巨量资料并不可怕,可怕的是运用资料的心态。不久的将来,如果有某个不认识的人能对你了若指掌,或许也不必感到太惊讶!

相关文章