112年度GIS專題中心暑期實習生成果介紹(8)
專題題目:以維基資料註記的資源的敘述、探索、呈現
實習學生:陳皆錫(國立清華大學工業工程與工程管理學系)
指導老師:莊庭瑞 副研究員
陳皆錫同學針對「政府資料開放平臺、國網中心資料集平台、Depositar」三個平台的四種情境「概要瀏覽該資料平台的網站、搜尋『資料集』呈現的功能列、搜尋『資料集』呈現的查詢結果、瀏覽搜尋到的『資料集』結果(資訊列)」進行盤點,試著找出「機會點」進而發展實作。
1.資料管理平台的機會點: 三個資料管理平台 X 四種使用場景體驗、比較與發現
2.運用Cosine Similarity計算Wikidata item的Property、Value、en-label發展關鍵字推薦模式——以Depositar為場域
以Depositar的資料集關鍵字為場域,藉由Wikidata的Item結構化資料,依序展開特徵迭代、擷取Property、Value、en-label作為特徵,計算相似度,並推薦類似的關鍵字。社群網絡應用於Wikidata關鍵字發展Depositar資料集推薦系統
3.社群網絡應用於Wikidata關鍵字發展Depositar資料集推薦系統
在發展關鍵字的推薦之後,接著藉由「關鍵字的推薦模式」發展「資料集的推薦模式」。也就是說,這是一個Bottom-up建立起的推薦模式。
4.以「類別資料」視角,運用Wikidata關鍵字的Property實現餘弦相似度推薦Depositar資料集
5.DMP視角下,基於CKAN機制的Depositar資料集與Wikidata關鍵字的資訊儀表板
開發一個資訊視覺化的儀表板,希望能協助Depositar管理人員觀察Wikidata在Depositar資料集的使用狀況。
6.以JupyterBook呈現實習成果