Big Data 醫癌症、贏選舉、救難民

A+A-
圖片來源:周子瑜臉書 TWICE - Tzuyu 쯔위

大數據並不單指數字統計,分析對象包括文字、聲源、影片等各式資訊,整合而成趨勢或模式,有助理解現況,因時制宜,而大數據已涉足多個領域,並且成效甚彰。據美國調查顯示,1000 強企業之中,有 6 成以上現正籌備大數據計劃,反映趨勢分析已成主流商業模式。由聽歌、旅行住宿到遷徙、就醫、投票,無數個人決定背後都有企業整合處理,小如酒店拓展生意,大如預測選舉結果或促進醫學發展,業界甚至表示有助研發癌症療法。影響如此深遠,你不能不知大數據的應用趨勢:

 

how you will die
圖片來源:How You Will Die

推算你幾時死

南加大諾利斯西區癌症中心主任 David Agus 表示,現時癌症病人資料散佈於各大醫院,業內難以跨院研究,假如能夠開放癌症病歷,將個案匯合成大數據,將有助研究療法。另外,現有不少醫療企業與科技公司合作,分析用戶健康資料,例如瑞士藥廠 Novartis 借用美國科技公司 Qualcomm 的雲端平台,讓病人和醫生得以在手機或電腦查核服藥、覆診及康復進度,一來方便,二來資料歸納成大數據後,有助評估藥效,細分療法。大數據甚至有助預測死時死因,美國疾病控制及預防中心(CDC)綜合性別、種族、地區分類,統計死亡年齡及死因,只要在「How You Will Die」網站輸入年齡、性別和種族,系統就會推算你的死亡年齡及死因--當然只是推測。

 

圖片來源:周子瑜臉書 TWICE – Tzuyu 쯔위

預測選舉結果

即時數據分析對選戰至關重要,政黨均以建立選民資料庫為要務,美國數據公司 NGP VAN 就專門收集選民資料,管理民主黨全國委員會的資料庫,現時持有近二億名選民的資料,比目前已登記選民多出 5000 萬,數目之多足以左右大選結果,掌握潛在選民數據,代表選戰宣傳更有效率,從而提高勝算。大數據亦能預測選舉結果,譬如台灣大選前夕爆發周子瑜事件,表面上激發大批選民改投民進黨,但據統計分析顯示,呼應群組集中在 18 – 34 歲,該年齡層本來就是蔡英文的主要票源,因此對選舉大環境影響其實有限。綜觀 facebook 上各候選人的正互動數,分別為朱立倫 52900(27.6%)、蔡英文 114200(59.5%)及宋楚瑜 24700(12.9%),數據分析與選舉結果大抵吻合,證明甚具參考價值。

 

一名難民兒童抵埗希臘
圖片來源:路透社

融合難民政策

整合難民個人資料,準確而即時地分析,有助各國政府預估影響,因應情況制訂移民政策。IMF 報告聲稱,中東難民潮短期將為德國、瑞典、奧地利帶來些微 GDP 增長,長遠財政平衡則視乎難民融入就業市場的快慢和比率,而青壯年人口佔多數將為歐盟區帶來龐大勞動力,貢獻 0.1% GDP 增長。不過,「經濟學人」指出,該預估「極難確定」,因為有關移民資料不足,由遷徙趨勢、教育水平、就業意願均未清楚。鑑於是次難民潮的成因及規模前所未有,過往關於難民經濟影響的研究已不合時,急需更新人口資料庫。其中一個做法,就是借用手機,從電話來往、登入網絡、IP 地址及社交網站偵測難民遷徙路線及規模。現時全球七十億手機用戶之中,至少有五十億來自發展中地區,大數據極具潛力應用於難民統計,如今硬件齊備,只欠整合分析。

 

圖片來源:Wikipedia
圖片來源:Wikipedia

酒店廣告促銷

大數據有助酒店分析市場需求,從而制定配套吸納客源。美國連鎖酒店 Red Roof Inn 統計發現,2013 / 14 年度冬天由於極端天氣,航班取消率高達 3%,即每日約有九萬名旅客滯留機場,意味機場附近的住宿需求甚大。摸清旅客的搜尋模式後,Red Roof Inn 針對特定地區及手機用戶推銷酒店,結果該區生意增長多達一成。