∥ ∥ 中研院 ∥ 人社中心 ∥ 繁體中文 ∥ English
本專題中心蔡宗翰研究員組織跨國、跨領域研究團隊,成員包括:美國紐約州立大學奧本尼分校電腦科學系張明清副教授 (現為人社中心訪問學者)、德國馬克斯普朗克科學史研究所陳詩沛研究員,以及人社中心廖泫銘研究副技師、陳哲安專任助理、候任謙實習生,共同發表研究成果於DH領域國際頂級期刊-Digital Scholarship in the Humanities。該篇研究論文提出了一種新的方法,使用深度學習技術自動將中國地方志的插圖進行分類。研究目標是希望能針對大量地方志影像數位化成果進行更深入資訊組織,透過4,309張人工標記和組織過地方志插圖圖像資料集上,將未分類的地方志圖像進行三個粗略類別和九個細分類,研究並評估了八種深度學習神經網絡的性能;實驗表明DaViT神經網絡的分類準確率最高,達到了93.9%的F1分數和90.6%分類準確率,結果證明了深度學習模型在準確識別和分類歷史地方志插圖方面上十分有效。研究團隊還開發了一個Web服務介面,使研究人員可以輕鬆運用已經訓練完成的模型;未來可以將此數位人文方法擴展到中國地方志之外的其他掃描圖檔研究上,例如藝術史研究的視覺材料。
全文連結: https://academic.oup.com/dsh/advance-article/doi/10.1093/llc/fqad065/7450448
Jhe-An Chen, Jen-Chien Hou, Richard Tzong-Han Tsai, Hsiung-Ming Liao, Shih-Pei Chen, Ming-Ching Chang(2023), Image classification for historical documents: a study on Chinese local gazetteers, Digital Scholarship in the Humanities, 2023, fqad065, 1–13 https://doi.org/10.1093/llc/fqad065