《大数据与太阳花》:新世代的学运数据战

《大数据与太阳花》:新世代的学运数据战

9月底香港所爆发的罢课与佔中社会运动,再次引起全球媒体的关注,看着电视台转播,挤满香港街头的人群的画面,总让人想起今年台湾318太阳花学运当时,在立法院附近静坐抗议的学生与民众、330凯道游行中有50万人站出来。媒体每天在追补的就是数字的量,「量」代表这场运动的能量与能耐,也代表这个社会运动是才刚开始?还是已準备进入尾声?

谈到「量」,很容易让人联想起,这几年一直被大家提到的一个名词「巨量资料」(Big Data)。大约从2005年以后,全球所生产出的资料量就开始飞跃式的成长,各种资料随着网路、社群、数位化等等各种形式与设备的演进,大量产生、大量累积。《大数据》的作者麦尔荀伯格(Viktor Mayer-Schönberger),就曾说:「如今大数据已经从量变产生质变,甚至也会改变人们思考事情的脉络与研究方法。」

谈巨量资料、大数据的专业书籍,从技术到趋势比比皆是,关键评论网特别将网站上探讨大数据的数篇文章集结成这本《大数据与太阳花》电子书,让大家了解巨量资料有哪些应用。无论是在教育学习、疾病预测、甚至太阳花学运都可应用巨量资料分析,了解参与行为背后所代表的社会现象、价值观。

例如,透过研究分析Google关键字可以预测流感下一个出现的地区,透过收集早产儿心跳数据,加以分析,可以即早用药治疗预防早产儿受到感染。大数据除了对疾病有预测、预防的功效之外,也对促进购买有助益,例如亚马逊(Amazon.com)网路书店透过分析顾客购买商品的模式(patterns)与喜好,当顾客挑选某商品后,在下方透过「推荐购买」功能的方式,让客户愿意再多放几笔商品进入购物车。在成堆的资料里,怎幺用数据去分析、去预测?麦尔荀伯格说:这就是透过巨量资料找到「相关性」。

巨量资料彼此之间的「关联性」,比起过往我们习惯用「因果关係」来解释事情,也许更具有对事件洞察透澈的面向。

例如,本书里有一篇是台北大学社会系在太阳花学运期间,在立院四週进行问卷调查计画,试图想描绘出参与静坐的人口图像。透过四天的抽样调查,共回收989份问卷,了解哪些人(学生或社会人士的比重)支持这场学运、以及澄清或回答某些人对运动参与者错误的想像。

例如,有人认为参与者通常不是来自自然领域的学生,这样的说法在调查结果看来是稍稍偏离事实的,因为参与静坐的有来自全国一百多所大专院校各科系的学生,包括:人文学门、工程学门、商管、艺术、医药等各科系,其余参与的社会人士也是来自各行各业,并非只属于某些领域。

巨量资料只是显示「变化」,但不能告诉我们如何应对变化。如何在量的变化之间,找到关联性,并加以利用,才能让巨量资料发挥巨大的效能,并告诉我们资料背后所隐藏的秘密。

就像中研院历史语言研究所研究员黄铭崇在本书中提到:巨量资料不仅只是看量大,还要包括资料的完整性,包括你和谁在一起、在哪一条街静坐、待了几小时、拍了哪些照片或影片、有什幺感想等。每一个个体的故事集合起来,就有数十万个故事,而形塑了太阳花运动的历史学巨量资料。在这些量与资料的背后,也许可以整理与分析出更多趋势或现象,让我们能更理解彼此。

Photo from Flickr CC by alcuin lai

《大数据与太阳花》(零元免费领取!)

相关文章