112年度GIS專題中心暑期實習生成果介紹(9)
專題題目:北高診所疾病資料建模與QGIS GWR和GTWR功能實現
實習學生:劉宸宇 (淡江大學統計學系)
指導老師:詹大千 研究員
詹大千研究員所指導之實習生劉宸宇進行專題研究內容有兩個主題,第一個是對於台北和高雄各診所資料分析和建模,另一個是在QGIS軟體開發GWR跟GTWR分析功能。
1.台北高雄診所資料分析和建模
資料收集:
針對台北和高雄各診所從2019年至2023年每日四種疾病資料進行清理,並加入各診所的五種天氣資料,包含日照時數、降雨量、平均濕度、平均風速以及平均氣溫,六種空氣污染資料,包含懸浮微粒、細懸浮微粒、一氧化碳、二氧化硫、臭氧以及二氧化氮,和GVI資料。
資料建模:
劉同學考量到天氣以及空氣污染對於疾病得延期效應,將每一種天氣和空氣污染變數,當日到前三天的資料進行整理,使每筆資料包含每一種天氣和空氣污染指數當日到前三日每一天的資料,總共四十四個變數。並將資料區分為台北高雄、各疾病以及各年層。並對每一個資料透過Stepwise 選取變數,所選取的變數以及其他節假日、季節等變數加入,進行Poisson Regression的建模。
2.QGIS軟體GWR和GTWR功能開發
在QGIS軟體中結合了R GWmodel套件中的gwr和gtwr相關程式,提供使用者在QGIS軟體中建立GWR和GTWR模型。
GWR和GTWR介紹:
GWR 地理加權回歸:在GIS中用於探索空間數據之間關係的統計技術。相較於傳統的迴歸模型中,會假設每個觀測值的關係都是固定的,但在現實生活中,某些現象可能會因地理位置的不同而改變。
GTWR 地理時間加權回歸:屬於GWR的擴展版本,除了考慮地理位置對於反應變數的影響,也考慮到時間的影響。
Processing R GTWR 優點:
1. 操作簡單:使用者僅需要安裝R 以及QGIS當中安裝Processing R Provider插件,並將相關程式文檔複製到指定路徑下即可使用。
2. 時間分組:使用者可以根據需求將資料當中的時間變數進行分組,不論是每日、每月、每年以及期數都可以進行分組,例如將每五天分為一組,作為新的時間變數,使用者可以調整所需要的單位(年、月、日或是預設單位),以及區間,GTWR模型會使用新建立的時間分組作爲時間變數。
3. 模型視覺化:執行程序後,會新增各解釋變數在各個地點以及時間的模型係數結果視覺化圖片(如下圖),其中若該地點在這解釋變數有顯著的話則會根據係數大小顯示不同顏色,若不顯著則會是白色。