疫苗達 70% 有效率?先看看「誤差範圍」為實

A+A-
圖片來源:mark peterson/Corbis via Getty Images

在資訊爆炸的年代,數碼分析技術愈來愈發達,主流媒體也大搞數據新聞,量化研究成為很多學科的主流。我們閱讀政治和疫情新聞時,不時會看到各種似是而非的數字。然而,不少讀者甚至是記者,都不曾接受基本的統計學訓練,未必能理解數字背後的真正含意,其中一個重要概念就是「誤差範圍」(Margin of Error)。

美國康涅狄格大學統計學教授 Ofer Harel 在學術網站 The Conversation 撰文,向讀者講解統計學的入門概念「誤差範圍」。他指出,在 2020 年,數據統計扮演極為重要的角色,例如武肺測試的精確度、各種療法和疫苗測試的有效率,以及各電視台對美國大選的民調預測等等。Harel 認為以上問題皆牽涉不確定性,科學研究要作出精確的預測,大前題是研究人員和讀者要明白相關不確定性的程度,而誤差範圍就是用於量化預測的潛在偏差。

Harel 指,自己身為一個統計學家,工作是要按照數據來作出推論和預測。在無限的金錢和時間下,他大可以依據腦海中的研究問題,進行一個能覆蓋所有研究對象的測試或意見調查。例如要找出美國的武肺感染率,最理想的做法是對所有美國人進行測試,可是現實中這種想法不切實際,進行科學實驗時,研究專家往往難以接觸全個目標組群(target population),要作相應取捨。

其中一個符合科學精神的取捨方法是「抽樣」(Sampling)。研究人員從目標群之中抽取樣本,再建立理論模型來作出預測。根據統計學理論,從樣本觀察得來的結果可以代表整個目標群。好的抽樣要盡力做到具代表性,例如要照顧到性別、種族、經濟狀況、生活方式和其他人口特徵的分佈情況。樣本數目愈大,理論上就愈接近真實情況,研究人員也會對預測的精確度更有信心。可是,只要牽涉到抽樣,就難免會存在不確定性。

Harel 再以藥物研發為例子。當新藥面世,對於地球上任何一個人,其有效率必然界乎 0 % 至 100% 之間,可是這項預測並沒有意思。統計學家的任務就是要把預測範圍大大縮窄,令到有效率變得有意義,而此預測範圍就稱為「信賴區間」(Confidence Intervals),即研究人員認為有信心最終結果會落入這個範圍。統計學家會透過數學公式,考慮樣本數目、回應範圍,以及概率法則(Law of Probability),得出信賴區間。

假若一種新藥在 10 人身上作測試,當中對 7 人有效,有效率就是 70%。可是,這 10 個人身上的結果,並不足以預測到全國人口的情況,專家就要進行計算,理解當中的不確定性,結果信賴區間是界乎 42% 到 98%,上下限相距 56%,把這個範圍除以 2 的話,就是「誤差範圍」,在這個設例是 +\-28%。誤差範圍愈大,預測就愈不準確,這個設計的誤差範圍接近 30%,可說是不合格的預測。

當研究人員把樣本數目增加至 1,000 人,而新藥在當中 700 人之中產生效用,有效率依然是 70%,但這一次的預測就大大精準得多。假設計算過後,信賴區間是 67% 到 73%,誤差範圍就是 +\-3%。統計學家總希望自己做到 100% 的預測,但這往往是不可能的任務。預測總會存在不確定性,專家要以誤差範圍清楚表達不確定性的程度。讀者閱讀科研報告時,也要明白專家面對的局限,一拼考慮數字背後的誤差範圍,才能得出有效結論。