迷思止步 - 系列十:組織防疫大隊不能沒有Big Data

自今年三月底起,對岸陸續傳出 H7N9 禽流感確診病例,迄今已有三十餘人因而死亡,台灣也曾出現一起境外移入病例;對於幾年前曾歷經 SARS 恐慌的人們,自然戒慎恐懼,無不對防疫一事多所關注。事實上,若善用海量資料 (Big Data) 分析技術,亦有助於大大提升疫情防治成效。

四月期間,驚傳某蘇州台商自境外移入 H7N9,當時不免讓人餘悸猶存,只因數年前 SARS 疫情爆發並肆虐,不僅在各地傳出確診甚至死亡病例,也曾上演駭人聽聞的封院故事,無論如何,大家都不想回到過去那段驚慌歲月。

令人稍感寬慰的是,透過黏膜、唾液等途徑在共住者之間傳播的 H7N9 病毒,雖然致死率不輸 SARS,但比較不會在短期內大規模集中爆發;然而有專家 提醒,H7N9 不乏進化後、再引起流感大爆發的「潛能」,尤其入秋期間,更宜小心謹慎,因此面對 H7N9 防疫工作,萬萬不能因公眾關注度轉淡而掉以輕心。

如何減緩 H7N9 的感染力與致死率?不可諱言,箇中主要癥結,仍繫於醫藥界的病毒研究成果,但扣除掉病毒研究,針對疫情防治、保障民眾生命與健康等事項,主管機關尚有另一項重大任務,即是組織「防疫大隊」,藉此在疫期爆發的早、中、後期,皆施以適當處置,力求讓傷害減損到最低程度。

比起十餘年前的 SARS,如今要想建立 H7N9 防疫大隊,不論主客觀條件,顯然都更為有利,主要關鍵就在於,近 1~2 年來風起雲湧的海量資料分析技術,一方面有助於打破由來已久的資料疆界,藉此讓散落於各個公民營機構的相關資料,得以整合與透通,利於被交互善用,二方面可用以彙集來自國內外的未結構化資料,譬如疫情相關新聞,與各項醫學報告,利於主管機關精確掌握 H7N9 疫情的最新趨勢脈絡;三方面則將結構化資料、非結構化資料,通通予以融會貫通,接著深入剖析這些海量資料,從中萃取出足以遏阻疫情擴散的關鍵因子。

對抗疫情,彷若犯罪偵防情節

稍早前,在本系列「迷思止步,資料庫應用大無限!」第五篇專欄文章,曾以「沒有好工具,豈能抓住魔鬼細節?」為題,闡述一家名為 Klout 的公司,如何透過 Hadoop、Hive 及 SQL Server 2012 等海量資料處理暨分析技術,成功發揮了「垃圾變黃金」的奇效,推出饒富吸引力的「社群媒體用戶影響力衡量」服務。

除此之外,此篇文章亦援引美國 CBS 電視公司製作的「疑犯追蹤 (Person of Interest)」影集,闡明情治機關可以借助海量資料分析技術,藉由眾多資訊的抽絲剝繭,有效制止犯罪活動,適時挽救無辜百姓的生命財產。

事實上,看似型態大不相同的 H7N9 防疫需求,裡頭同樣蘊含了許許多多的魔鬼細節,也頗適合依樣畫葫蘆,沿用海量資料分析技術來創造妙效。

比方說,意欲快速串接不同單位的資料,並一舉融合外部的非結構化資料、串流資料,用戶垂手可得的工具與利器,便可謂不少。職掌疫情的主管機關,即可透過 Microsoft Big Data 整合式平台,輔以適用於 SQL Server 或 SQL Server PDW 的 Hadoop 連接器,輕鬆整合 Hadoop 與資料倉儲、商業智慧解決方案,藉由結構化及未結構化資料來深入了解疫情發展狀況。

當然,疫情防治畢竟涉及人命關天,往往講求快、狠、準,務必爭取時效加緊設計並部署 MapReduce 程式,動員大量運算資源,並利用最短時間進行資料轉換與清理,倘若套用傳統佈建模式,少不得仍需要費時琢磨,恐對防疫成效產生延誤。此時用戶不妨善用 Windows Azure Service 平台,一方面獲取數百種應用程式、智慧型資料挖掘演算法 ,及 SQL Server Integration Services(SSIS)、Data Quality Services 等資料轉換及清理工具之豐富素材,二方面透過簡單易用的 HDInsight 服務,輕鬆配置整個 Hadoop 環境,藉由雲端服務開啟隨需擴充的方便之門,順勢化解防疫作戰的燃眉之急。

一旦建立海量資料運算環境,緊接著,相關人員亦無須歷經冗長的學習曲線,即能動用熟悉工具執行關鍵分析任務,一來可運用 Excel 的 Hive 增益集來分析 Hadoop 資料集,二來也可利用 SQL Server 2012 當中的 PowerPivot 或 Power View 機制,將 Hadoop 資料集予以視覺化並善加分析,透過這些途徑,即可迅速擷取防疫致勝的寶貴線索。

憑藉精準佈局,力阻疫情擴大

究竟這套奠基於海量資料技術的「防疫大隊」劇本,如何確保民眾的健康與安全?首先,透過衛生與出入境管理單位的異質資料整合,主管機關即可精確統計各縣市居民接觸疫區的頻率,從而針對頻度較高的縣市,強化早期篩檢的工作,並未雨綢繆準備相對大量疫苗,預先配置到這些轄區內的市立或署立醫療院所。

緊接著,主管機關亦可藉由新聞及醫療文獻的探索,愈步愈趨地緊盯疫情動向,繼而剖析各地醫院的醫療及隔離設施的整備度,藉以作為資源補強或調度的依據,以便於能靠著充分的準備,以及有條不紊的安置措施,為確診病例進行有效的診斷與隔離,使得病患獲致最悉心的照護,也一併降低其餘民眾的恐慌。由此可見,Big Data 不僅是企業增進盈利的法寶,也是確保國泰民安的關鍵技術之一,重要性不言可喻。