D4SG

政府開放資料的下一步,以資料驅動的公共治理

By | D4SG | 3 Comments

開放資料,世界第一之後

台灣的政府開放資料 (open government data) 在以開放為原則,不開放為例外的主張之下,2015年,被英國開放知識基金會評比為世界第一。在以量取勝的策略達到成效之後,如何更進一步在政府內部根植開放文化是追求卓越的首要目標。

政府開放資料之所以重要,除了能促進公民與政府之間的資訊對稱之外,更重要的是能利用開放資料創造社會、經濟和環境的價值。這種以開放資料驅動社會價值的過程,參與對象不僅是政府對公民,還包括政府對企業、媒體、非營利組織,甚至是政府內部不同部門。

目前政府開放資料的活化應用大多偏向「訊息揭露」,譬如台鐵時刻表、即時空氣品質等,藉由網站、手機APP供民眾方便查詢。在世界第一之後,筆者認為追求卓越的政府應該思考如何透過開放資料的分析研究創造公共價值進而驅動政策治理。

沒人做我們做–D4SG資料英雄計畫

DSP智庫驅動是筆者與幾位志同道合的朋友共組的公司,旨在提供企業、政府、非營利組織資料科學解決方案。基於激發資料價值、改善社會的熱情,DSP智庫驅動發起D4SG資料英雄計畫 (Data for Social Good Fellowship),媒合台灣環境資訊協會與資訊、新聞背景的資料英雄,利用兩個月的時間,結合行政院環境保護署農委會農業試驗所的開放資料,進行D4SG守護農地計畫,完成一個農地重金屬污染與列管分析專案。

筆者以專業顧問的身份參與D4SG守護農地計畫,幫助環境資訊協會利用數據作倡議,將所關注的農地安全問題佐以政府開放資料,轉譯成可執行的資料分析專案。這份專案報告試圖透過農試所(81年至97年的農地土壤採樣調查資料,共13萬筆表土資料)與環保署(91年至今的管制農地資料)兩個不同政府部門的資料套疊,利用資料科學方法做「快篩」,從那些農試所驗得土壤重金屬超標,但目前環保署仍未管制到的真空地帶找出超標熱區。期盼相關單位能真正地為農地做「診斷」,查證其重金屬污染狀況。

重金屬農地污染分析

以資料科學方法對未列管農地做「快篩」。右圖顯示桃園機場左側多個埤塘附近同時有重金屬超標採樣點 (黃色:農試所資料) 以及農地列管區塊 (環保署資料,紅色:列管中;橘色:解除列管)。然而在桃機右側的南崁溪周邊雖有列管農地,但僅小面積,可能還有很多沒有被列管到。

D4SG守護農地計畫的價值有三:

一直以來,政府的組織架構都是以業務職責區分,在任務分配上便於垂直分工,但缺點是跨部會的資訊流通或是業務合作,受限於法規與責任歸屬上而出現橫向斷層。由環團與資料英雄合作的D4SG守護農地計畫,以跨部會的政府開放資料為基礎,提出以資料科學輔以政策治理的農地重金屬污染快篩模型,不僅促使兩份資料所屬當局的即刻回應,更提供了跨部會溝通與合作的契機。

>> 延伸閱讀

消滅饑餓與貧窮的資料科學

By | D4SG, Data Science | No Comments

英國致力於消滅飢餓與貧窮的慈善機構 Trussell Trust ,整合超過 420 家食物銀行建立合作網路,藉由資料科學方法,將食物募集站與社會福利數據進行交叉分析找出糧食募集與發放的真空地帶。

食物銀行是一群慈善組織,以提供未能解決「三餐」基本需要的人士家庭緊急及短暫的膳食援助為目的。把即期食物捐贈出來,從食物的募集、分類到配送,讓資源獲得最有效的分配與使用。

在英國致力於發放緊急救濟食品的慈善機構 Trussell Trust 說到:「依賴緊急救濟食品度日的人士家庭不斷創下紀錄,光是去年就發放了近百萬份的基本口糧。」這間整合420間食物銀行的慈善機構更進一步指出,貧窮與飢餓的規模不僅不會減少,反將越演越烈。(Link)

藉由資料科學,從食物募集站與社會福利數據的交叉分析有望找出食物銀行營運的真空地帶。由赫爾大學、Coppelia、AAM Associates 等組織所組成的資料科學團隊,透過英國2011年的食物銀行普查資料,預測出急需食物銀行援助的區域。

由英國的食物銀行及資料科學團隊所開發的食物募集與需求地圖,圖片來源:Youtube

關於資料科學在食物銀行上的應用,美國也有類似的案例。知名資料分析公司 APT 協助華盛頓特區食物銀行 (Capital Area Food Bank, CAFB) 建構飢餓熱點地圖,從各個區域的資料挖掘出食物募集與需求的缺口。(Link)

由美國的食物銀行及資料科學團隊所開發的飢餓熱點地圖,圖片來源:CAFB

台灣也有食物銀行,多年來以協助不勝枚舉的弱勢人士與家庭。可惜的是,還沒有看到與運用資料科學優化營運的具體案例。有沒有機會製作一張屬於台灣的食物供需地圖,挖掘出迫切需要援助的弱勢家庭?

這是非常有可能的!透過政府開放資料擷取出全台灣的社會救助資料以及食物銀行的募集與發放場站資料,食物供需地圖的基本雛型就出來了。更進一步,利用空間統計方法建構預測模型,可以找出潛在的高風險區,輔助食物發放站點的設置。

這種資料科學所驅動的公益合作方式蔚為浪潮,由開拓基金會、教育部 ITSA、智庫驅動等組織所發起的 D4SG 計畫 (Data for Social Good, http://d4sg.org) 正是一經典案例。目前已經協助超過40 個非營利組織、20 個政府機關親身體驗資料價值,讓想像力起飛。在資料氾濫的大數據時代,由資料所驅動的革命即將引爆,未來政府、企業、非營利組織與資料科學團隊的合作模式,將成為不可或缺的要素。

今年七月,D4SG 媒合公益組織與資料團隊以長期專案解決真實問題的資料英雄計畫即將展開,目前正在招募資料英雄與公益組織的提案,關心用資料做公益的朋友,不妨多多關注 D4SG 計畫 (http://d4sg.org)

更完整的評論內容,請見五月份的《有物報告》。