2024/08/13【公告】賀本中心顧問曾蕾教授獲頒2024年資訊科學暨科技學會(ASIS&T)優異獎

資訊科學與科技領域代表性組織「資訊科學暨科技學會」(Association for Information Science and Technology,ASIS&T)宣布本中心顧問曾蕾教授獲頒今年度學會最高榮譽獎項——優異獎(Award of Merit),以表彰其個人對資訊科學領域的卓越成就與長期貢獻,頒獎儀式將於10月25至29日加拿大ASIS&T年會舉行。 曾蕾現為美國肯特州立大學(Kent State University)資訊學院教授,具美國匹茲堡大學(University of Pittsburgh)資訊科學學院博士學位,專精於知識組織系統、鏈結資料、後設資料、智慧資料與大數據、語意技術與數位人文領域。2016年曾以美國傅爾布萊特(Fulbright)學者身分至中研院進行訪問並參與研究,去年亦應邀至本中心舉辦2場數位人文與資料智能專題講座,分享芬蘭SAMPO數位人文語意網發展,及AI導入數位人文研究領域的國際研究個案,獲熱烈迴響。 她在資訊科學理論與實踐上的影響卓著,發表百餘篇研究論文、6本專書及逾200場國際會議演講。亦長期主持或參與國際圖書館協會聯盟(IFLA)、專門圖書館學會(SLA)、資訊科學暨科技學會(ASIS&T)、全球iSchools組織、美國國家資訊標準組織(NISO)、國際標準化組織(ISO)等事務。現為國際知識組織學會(ISKO)董事會理事、都柏林核心後設資料組織(DCMI)理事會成員和教育委員會主席。同時,她也對知識傳承不遺餘力,優異的教學表現受任教之肯特州立大學表揚與肯定。 ASIS&T前身為1937年成立的美國文獻學會(ADI),核心任務為推進資訊科學技術的研究和實踐。此次頒發的優異獎(Award of Merit)為終身成就獎項,評選標準包含對理論、學術與實踐的影響;卓越的領導力與長期參與,及對教育與指導的貢獻等三項基準。提名人Marjorie Hlava指出,曾蕾對於領域研究的貢獻不言而喻,尤其在標準界,其後設資料和控制詞彙方面的影響力更是廣泛而深遠。 ASIS&T官網公告Marcia Zeng to Receive the ASIS&T 2024 Award of Merit 延伸閱讀: 【活動報導】以智慧數據揭示未知,邁向數位人文新境界
閱讀全文... 0

2023/12/29【活動報導】以智慧數據揭示未知,邁向數位人文新境界

報導/盧履彥、張仲君、林慧菁、陳弘音、徐千禾 攝影/張倍瑄 近年來,隨著數位科技不斷進步,智慧數據成為數位人文研究的新亮點,為我們帶來了前所未有的新契機。在中央研究院,有歷史語言研究所運用明清時期重要史部書籍人名、地名、職官、時間等基本屬性的標記,將平面的文本資料結構化,以便學者利用統計分析工具,建構歷史事件輪廓或制度沿革演變;也如近代史研究所,在執行農林部《農業推廣委員會》、《農事司》及《農村經濟司》檔案數位化的同時,透過人名、地理名詞、關鍵詞、與圖資等資料的著錄,幫助學者鳥瞰民國時期農業經濟發展脈絡,總攬戰時上溯民國以及戰後的農業概況,勾勒臺灣、中國及近代東亞農業史系譜。 為了更進一步挖掘檔案與史料的潛力,2023年孟冬,數位文化中心特別邀請美國肯特州立大學(Kent State University)資訊學院曾蕾教授,透過「數位人文與資料智能專題講座」的分享,從理論與實務並重的角度,解析在人工智慧技術迅速崛起下,智慧數據在人文領域中的研究應用,發現其對研究方法、議題挖掘、以及跨學科合作的作用與影響。
揭示未知的未知 11月29日,曾蕾教授以「強化數位人文鏈結資料的潛力—芬蘭SAMPO數位人文語意入口網帶來的啟示」為題帶來第一場演講,藉由芬蘭逾20年語意網知識系統發展的歷程,展示利用「智慧數據」(smart data)輔助數位人文(Digital Humanities,DH)研究的典範。 芬蘭Sampo數位人文語意入口網站的發展鑒於2000年,當時芬蘭雖有許多獨立建置的文化資產資料庫,卻因缺乏共通規格與標準,造成資料無法共享、串連的困難。為了促成跨資料庫間檔案整合,而開始建置通用、共享的資料模組架構。在政府資金挹注下,由芬蘭赫爾辛基阿爾多大學(Aalto University)語意計算研究實驗室(Semantic Computing Research Group,SeCo)主導的Sampo語意網建置計畫於焉展開。 2002年至2004年間發展的第一代Sampo語意入口網,主要以達成資料發布、聚合、瀏覽等資源初步檢索為目標。其方法主要依據芬蘭國家本體服務規範(FinnONTO),進行博物館典藏資料在語意網中之資源分享與發布。 2014至2017年的第二階段,伴隨數位人文研究浪潮,主要運用資料分析工具架構數位人文研究系統,希望提供學者以互動方式解決研究問題的工具。技術開發上運用了以鏈結開放資料(Linked Open Data,LOD)驅動的資料庫搭配資料呈現工具,建構將分散式資料聚合呈現的知識圖譜(knowledge graph)。目前頗富盛名的二戰歷史「WarSampo入口網」即為此階段的重要成果。
WarSampo入口網 首頁 發展至第三階段,語意計算研究實驗室導入人工智慧(Artificial Intelligence,AI),以從數據中自動發現知識,進而分析、解決研究問題並詮釋其結果為主要目標。2020年發布之芬蘭人物傳「BiographySampo入口網」就屬此類。在關聯整合資料後,得以檢索出「未知的未知」(the unknown unknown)的知識網絡。 曾蕾教授指出由芬蘭Sampo數位人文語意入口網站三個階段的發展歷程,反映出在人工智能蓬勃發展下,數位人文研究不僅止於協助學者從基礎資料發布、聚合到資料分析及運用AI人工智慧等技術工作發掘更多知識。其中的關鍵是利用大數據進行「方法論的轉變」(methodological shift),以揭示「未知的未知」為目標,從而邁向知識發現。 從芬蘭Sampo入口網的發展,曾教授不斷強調建構國家級語意網超級基礎架構的重要性,活絡數據,讓檔案可以重複再利用、共享的鏈結資料基礎設施是達成數位人文研究的關鍵。進而創造「七星級」的鏈結資料服務(7-star linked data service),促使學者能進一步驗證資料並獲知資料創建的來龍去脈,以提升對所發布資料品質的信任度。 從數位化、數據化到數智化 12月1日上午舉辦的第二場講座,曾蕾教授以「深化提升數位人文研究的方法及研究成果分享—由研究個案觀察發展趨勢」為題,舉出數個近年國際間的實作發展範例,展示AI人工智慧導入數位人文研究的做法、優勢與挑戰,及將資料提升為「智慧數據」(Smart Data)的標準規範與趨勢。
「深化提升數位人文研究的方法及研究成果分享—由研究個案觀察發展趨勢」講座盛況 「智慧數據」是經由資料清理、轉換與分析以釋放其最大價值的數據類型,而數位人文研究領域中,資料多源自典藏、檔案、口述歷史資料、報告,無法直接以網路爬蟲獲取數據,因此如何找出暗藏歷史性價值的資料成為人工智慧運用的首要課題。曾蕾教授指出,目前除了大家耳熟能詳的ChatGPT生成式人工智慧(Generative AI)、大型語言模型(Large Language Model, LLM)外,還有許多可利用的人工智慧與機器學習(Machine Learning)工具,她分享了十來個可機器讀取的文字資源、半結構化數據、影像、音頻檔案、氣味、實體物件等資料生成可信「智慧數據」的國際實作案例,並說明其本質是由資料「數位化」(Digitization)、「數據化」(Datafication)進而轉變為「數智化」(Intellectualization)的過程。
「羅馬帝國在線硬幣」(Online Coins of the Roman Empire, OCRE)可查詢分析錢幣圖像,採用本體論建模形成知識庫,範圍擴展到世界各地古幣收藏單位的資料(圖片提供/曾蕾)
運用人工智慧工具輔助典藏照片簡介的文本挖掘、分類和語義標記(圖片提供/曾蕾) 然而人工智慧在數位人文研究的運用上,仍有諸多挑戰,尤其在無文字民族或大量群眾募知(Crowdsourcing)獲得的影像材料上,因缺乏「語境」(Context)條件,使這些體驗文化或無形文化資產無法以機器讀取,因此整合歷史、考古、人類學門人員參與並提供「語境」數據資料,成為提升AI識別及關連整合的重要關鍵。針對未來數位人文發展,曾蕾教授認為,我們確實需要擁抱AI技術以保護、重建人類文化遺產,只要遵循AI賦能的合理使用,與可信度、準確度、道德觀衡量並有效管理,將能對未來的學術研究發揮無窮的潛力。 曾蕾教授也呼籲利用國際既有、通用的知識本體模型設計建構數據資料,依循鏈結開放資料FAIR原則規範(FAIR Principles)發布,以提升資料的可蒐性(Findability)、可近用性(Accessibility)、互通性(Interoperability)及再利用性(Reusability)。而在提升資料公共參與度上,她提出公眾參與的三種模式,建議將資料發布於「維基數據」(Wikidata)等國際資料開放共作彙集平台,主動「走出去」藉以強化資料能見度、再利用性。同時期許透過異見融合,聚焦議題本質「是什麼」而非「為什麼」,從而揭示「未知的未知」(the Unknow-Unknow)。
德國國家經濟資訊中心ZBW將「20世紀新聞檔案」(PM20)資料發布於「維基數據」(Wikidata)後,平台提供眾多查詢問題以利使用者即時獲取答案,如「20世紀新聞檔案」中的經濟學家出生地分布圖與視覺化資料(圖片提供/曾蕾) 向深度推進、向廣度拓展 除了兩場對外講座分享,為了能更進一步探討圖像分析的技術發展與運用模式,數位文化中心也邀請曾蕾教授透過內部交流的形式,辦理「國際圖像互操作架構(IIIF)應用專題講座-數位文化中心工作坊」。
內部交流會上,數位文化中心陳弘音專案經理簡介目前圖像分析平台的規劃 在數位圖像分析和數據標準化的領域中,核心焦點是如何透過標準化的方法有效整合研究資料,從而創建出既能展示,又便於研究的靈活圖像資源。這不僅涉及技術層面的創新,也包括對數據共享和互操作性原則的深入理解,以確保圖像資源能夠在不同研究背景下被廣泛而有效地複用。 本中心近年來開始著手開發圖像分析平台,發展相關圖像分析技術,藉由這次難得的機會,除了展示目前正在建置的圖像平臺初步研發成果,更與曾蕾教授進行深入交流,探討國際圖像互操作架構(IIIF)在數位文化資產保存與學術研究中的創新應用與挑戰,從而為圖像分析平臺的未來發展方向提供寶貴的見解。 在本次工作坊中,曾蕾教授不僅提供了對IIIF技術的深入解析,也展示其在文化遺產數位化與學術研究中的廣泛應用。她闡述了IIIF在數位化手抄本修復、重組,以及分析大尺寸古代地圖等方面的能力;並延續性地介紹IIIF結合機器學習技術在識別古文書文字方面的應用,展示如何實現圖像與文本的深度融合。 這些創新應用的進展不僅提升了對歷史文獻的存取和理解,也為其數位保存和學術研究提供了新的方向。通過與曾蕾博士的交流及分享,專案團隊得以對國際趨勢有更深刻的理解,並藉以在平臺發展的階段進行相應的評估與調整,以期更加符合未來圖像研究的期待與需求。 善用智慧數據,邁向知識發現 當數位科技不斷顛覆認知,一路從搜尋,進展到智慧問答與互動,人工智慧正在滲入人文研究領域,讓傳統的人文研究產生實質的改變。這些發展同時也促進了跨學科合作,將人文學科與科技領域進行有機結合。例如,在語言學、社會學、心理學等領域,相關學者可以透過智慧數據的分析,發現言論模式、社會行為規律等,讓研究更為全面、深入。
講座中,數位文化中心陳淑君執行秘書與曾蕾教授合影 透過曾蕾教授的分享,我們見識到智慧數據的魅力與潛力,為學者提供更廣泛的資源,運用機器學習、自然語言處理等技術,讓學者迅速有效地分析大量資料,發現隱藏在檔案背後的脈絡,提出更具洞見的觀點。 在這個充滿機會的時代,本中心將致力推動智慧數據在人文領域的創建與應用,為人文研究注入更多活力,讓我們對歷史、社會、文化的認識與理解能更寬廣、更深刻。
閱讀全文... 0

2023/11/07 【活動預告】曾蕾教授「數位人文與資料智能專題講座」(11/29、12/1,開放報名至11/22)

數位人文與資料智能專題講座 Digital Humanities & Intelligence Data Lecture 本講座邀請美國肯特州立大學資訊學院曾蕾教授從理論與實務並重的角度,解析在人工智慧技術迅速發展下,數位人文研究面臨的機會與挑戰。兩場專題演講將啟發與會者思考如何運用數位科技,持續深化人文研究內涵,創造跨域融合的新視野。 主講人:曾蕾博士(美國肯特州立大學資訊學院教授) Dr. Marcia Lei Zeng (Professor of Information Science at Kent State University, USA) 講題一強化數位人文鏈結資料的潛力—芬蘭SAMPO數位人文語意入口網帶來的啟示 Enhancing the growth potential of DH Linked Data — Enlightenment from Finland′s SAMPO semantic portals for DH 日期:2023年11月29日(星期三)上午10~12時 地點:中央研究院歷史語言研究所研究大樓七樓704會議室 演講概要:以芬蘭的Sampo模型及二十餘語意入口網為例,展示在三代數位人文語意入口網開發中研究焦點的轉移。從第一代資料發布、聚合、探索,走向第二代採用資料分析工具以支援數位人文研究,邁向第三代自動化的知識發現與人工智慧運用,進而強化數位人文鏈結資料的潛力。 講題二深化提升數位人文研究的方法及研究成果分享—由研究個案觀察發展趨勢 Further improve DH research methods and share research results — Observing the trends through several examples 日期:2023年12月1日(星期五)上午10~12時 地點:中央研究院歷史語言研究所研究大樓七樓704會議室 演講概要:內容分為四部分,包括1、數位人文研究能否擁抱AI人工智慧;2、強化開放性文化遺產資源的品質和資料治理FAIR原則;3、考慮公眾參與的方式;4、兩個國際通用知識模型介紹。除說明這些研究方法的內涵與方式外,並以國際間既有實作案例,觀察發展趨勢。 講者簡介: 曾蕾博士現為美國肯特州立大學(Kent State University)資訊學院(School of Information)教授。擁有美國匹茲堡大學(University of Pittsburgh)資訊科學學院( School of Computing and Information)博士學位。研究與教學領域包括知識組織系統(含分類法、敘詞表、語義網絡、本體等語義工具)、鏈結資料(Linked Data)、後設資料、智慧資料與大數據、數位人文語義技術的應用、多語種資料庫品質分析與控制等。現任國際知識組織學會(ISKO)董事會理事,都柏林核心後設資料組織(DCMI)理事會成員和教育委員會主席等。2016年作為美國高級傅爾布萊特計畫學者在臺灣中研院進行數位人文研究。(更多請見:報名網址: 報名截止日期:2023年11月22日(星期三)止 主辦單位:中央研究院數位文化中心 備註: 1、本活動免費參加,演講以中文進行。 2、有發燒或呼吸道等症狀者,建議配戴口罩與會。 3、請勿錄影、錄音,或未經授權擅將演講內容及影像公開傳播。 聯絡人:林小姐,betty168@gate.sinica.edu.tw,02-26521885 分機:313
閱讀全文... 0

2023/03/01 【活動預告】秦健博士知識組織專題講座(3/27-3/28,開放報名至3/26)

知識組織專題講座 Lecture on Knowledge Organization ​主講人:秦健博士(美國雪城大學資訊學院教授) Dr. Jian Qin (Professor of Syracuse University School of Information Studies, U.S.A.) 主辦單位:中央研究院數位文化中心、中央研究院歷史語言研究所、國立臺灣大學圖書資訊學系 講題概覽: 講題一:本體論的基本原理/Fundamental Principles on Ontology 日期:2023年3月27日(星期一)10:00-12:00 地點:中央研究院歷史語言研究所研究大樓七樓704會議室 主持人:陳熙遠(中央研究院歷史語言研究所研究員暨數位文化中心召集人) 演講概要:本體論(ontology)及其發展的基本架構主要包括概念如實體(entity或稱class)、實體屬性(property)、實體之間的關係類型等。本講題首先提供一些背景,闡述為什麼要建立領域本體(domain ontologies)?構建本體和學者個人(我)研究有什麼關係(Why should I care about ontologies?)?最後並根據人文研究及其資料特點,綜覽介紹一些已成功應用的本體論結構和其構建方法。 講題二:本體論的設計方法/Methods for Designing an Ontological Model 日期:2023年3月27日(星期一)14:00-16:00 地點:中央研究院歷史語言研究所研究大樓七樓704會議室 主持人:陳淑君(中央研究院歷史語言研究所副研究員暨數位文化中心執行秘書) 演講概要:構建本體論的方法主要包含兩個路徑:1.利用已有的知識組織系統進行轉換;2.從零開始(build from scratch)。不論採用哪一個路徑,設計主要步驟都包括主題領域分析、概念轉換或提取、關係類型的界定、有效性的檢驗及尋求領域社群共識。演講過程中將藉由設計方法結合人文科學領域裡的實際例子來說明設計方法的使用,同時分享多年建本體過程中的經驗與教訓。 講題三:開放科學與開放資料:圖檔領域的契機/Open Science and Open Data: Opportunities for Libraries and Archives 日期:2023年3月28日(星期二)15:30-17:00 地點:國立臺灣大學圖書資訊學系一樓視聽教室 主持人:陳淑君(中央研究院歷史語言研究所副研究員暨數位文化中心執行秘書) 演講概要:開放科學與開放資料給圖書館與檔案館在典藏管理與研究的契機主要有兩方面:科學研究資料的管理與詮釋資料分析(Metadata Analytics)。本講題側重介紹科學研究資料管理的現階段發展、對圖書館的影響,以及講者近年來在Metadata Analytics方面的研究經驗。 講者簡介: 秦健為美國伊利諾大學香檳分校(University of Illinois at Urbana-Champaign)圖書資訊學博士,現為美國雪城大學(Syracuse University)資訊學院(School of Information Studies)教授。其主要研究範疇聚焦於詮釋資料、知識組織與知識本體建構與設計、資料管理及網路研究、科技傳播學等。(更多請見:https://ischool.syr.edu/jian-qin/) 備註: 演講以中文進行。 本活動免費參加,場次一與場次二對外採線上報名,報名網址:https://reurl.cc/MRAMOp。 演講全程請勿錄影、錄音,或未經授權擅將演講內容及影像公開傳播。 演講全程請佩戴口罩。 會場容納位置有限,報名者將優先入座。 場次一與場次二提供「公務人員學習時數」,每場次2小時認證,會後由主辦單位進行登錄。 場次一與場次二活動中場不提供午餐,如有需求者請自行處理。
閱讀全文... 0

2021/04/01 【上線公告】「COVID-19 的人文社會省思」專題網站英文版


 

 

「COVID-19 的人文社會省思」的中文網站日前已於今年1月26日上線,並在眾多國外讀者的企盼下,於4月1日新增英文介面,讀者可在首頁切換閱讀語言。

 

COVID-19疫情蔓延全球,中央研究院作為臺灣最高學術研究機構,投入許多研究能量。2020年2月院長廖俊智聯合國內學研單位,組成擁有13個子平臺的「COVID-19 合作平台」;同年10月的院區開放更以COVID-19為主題,全院各所配合主題舉辦線上/線下的研討會、講座、展示;「研之有物」、「中研院訊」、「中研講堂」也針對疫情做了相關回應。

 

與此同時,近代史研究所特聘研究員康豹召集院內19位人文社會學者,組織「COVID-19人文社會科學短期研究小額補助計畫」,在幾個月內撰寫淺顯易懂的科普文章,探討人權與防疫之間的權衡,剖析第一線醫護人員、居家檢疫者、滯留湖北武漢臺人的心境感受,審視此波疫情帶來的經濟波動、社會衝擊,並試圖自1918年的西班牙流感、19世紀的中國痲瘋、滿洲鼠疫等歷史經驗中,找到「過去做對了什麼、做錯了什麼」,反思現在又能做些什麽。

 

康豹表示,「全球遭遇的COVID-19危機,除了迫切需要科學出面解決,就人文學者的角度來說,還能將這個疾病理解為一種需要被撫平的社會文化現象。」

 

為擴大該計畫的影響力,更廣泛、即刻地回應當今的社會需求,本中心召集人陳熙遠帶領同仁們,架設「COVID-19 的人文社會省思」中英網站。網站以參與計畫學者們撰寫的19篇科普文章為基底,整理學者們在疫情期間進行的科普演講和延伸閱讀。為了增加互動感,也徵集由讀者投書的疫情故事並設計互動小遊戲,開啟和大眾對話的橋樑。

 

「COVID-19 的人文社會省思」中文網站上線3個多月以來,已有逾800位活躍讀者,超過8000次瀏覽量,相信在英文介面開放後,將能吸引更多國內外有興趣的讀者,向大家介紹臺灣防疫成功的經驗,展現中研院對臺灣社會議題的即時回應。

 

「COVID-19 的人文社會省思」網站收錄之專題文章,是依據網路頁面和網路特性編輯、節選的內容,完整的文章預計將以專書形式於今年端午節隆重推出。全書將以「歷史回顧」、「世界衝擊」、「本土因應」三大面向勾勒人文社會學者視野底下疫情的方方面面,帶領讀者從各種研究角度檢視此波疫情帶來的種種變化,並嘗試從過去的歷史事件中,找到可對應的處理方式。 

閱讀全文... 0

2020/11/05 【活動公告】34論文、26海報、1專題發表錄取 「第十一屆數位典藏與數位人文國際研討會」(DADH 2020)審查結果公布


 

「第十一屆數位典藏與數位人文國際研討會」(11th International Conference of Digital Archives and Digital Humanities, DADH)審查結果出爐,共有論文34篇、海報26篇,以及專題發表(Panel)1組,將透過線上視訊會議與全球數位人文領域研究學者共享!

 

本屆大會將於12月1日至4日舉辦,主題為「智慧資料×數位人文」(Smart Data × Digital Humanities),投稿相當踴躍,範圍涵蓋數位人文與智慧資料相關領域理論發展、資料管理與發布、處理技術及分析方法、基礎設備與系統,以及數位人文研究應用智慧資料案例等。經國內外審查委員審慎審核,錄取論文 34 篇、海報 26 篇,以及專題發表 1 組。

 

論文發表集結來自臺灣、中國、美國、英國、德國、韓國等6個國家的研究團隊,主題多元,涵蓋數位人文研究平台的分析與運用、鍊結資料與知識圖譜於數位博物館之運用、數位工具於數位人文內容之運用、檔案文本之探勘、數位人物傳記分析、數位資料庫之使用者查詢與分析、數位人文中的知識本體研究、網路宗教語言分析等趨勢研究,精彩可期。

 

大會共設置9個論文發表場次,主題涵蓋包括「方法論與主題模型分析」、「語意分析與應用」、「數位人文與工具使用」、「社會網絡與資料庫運用」、「思想與概念研究」、「文本及語料分析」、「數位人文下的視覺化與虛擬實境」、「數位人文與宗教語境」、「數位人文中的臺灣關注」等。

 

專題發表將於12月2日登場,主題為「數大便是美?──智慧數據在中國古代文史研究上的兩種途徑」。本場次企圖以3個文史研究個案,即〈歷史氣候現象之史料擷取與科學解析──數位人文技術發展與時空整合研究〉、〈歷代僧傳僧人遊方事件動機與結果的歷時性分析〉、〈魏晉南北朝周邊意象之數位人文研究:以外族人名為中心〉,證成遠讀與細讀、數據與文本互證的研究取徑,在側重大數據的潮流中,省思小數據的人文價值與詮釋可能。

 

海報方面,從古籍與拓片的數位化建置、臺灣檔案文獻數位典藏與加值應用,到簡牘字典的開發、漢籍自動化資訊擷取研究與系統開發,再到GIS平台於文學地圖製作之探析、庫柏文本分析軟體在文學研究之運用、生物多樣性數位內容的多元展現等,26篇前沿研究成果大公開!與會者除可透過海報瞭解研究內容,亦能觀摩短片親見各研究團隊展示其研究成果。 

 

相關連結

會議審查結果:https://dadh2020.ascdc.tw/#accepted-paper

會議議程:https://dadh2020.ascdc.tw/index.php#dadh-program

閱讀全文... 0

2020/10/13 【新聞稿】東亞最大規模文字圖像集成「歷史文字資料庫統合檢索系統」,於臺日兩地同步上線啟用!

由中央研究院歷史語言研究所、數位文化中心,與奈良文化財研究所、東京大學史料編纂所、國文學研究資料館、國立國語研究所、京都大學人文科學研究所等日本5大機構合作建置的「歷史文字資料庫統合檢索系統」於2020年10月13日正式啟用。

 

該系統整合了前述機構所藏源自中國與日本,橫跨紀元前至19世紀,涵蓋簡牘與紙本、文書與典籍、抄本與刻本等不同性質的文字圖像數位資源。使用者透過單一入口網就能即時跨國、跨機構查詢5個資料庫,約150萬件的高解析度文字圖像,且所有圖像均以創用CC條款釋出,開放免費下載,以進行加值利用。

 

近年來,開放資料(Open Data)概念的標準化,觸發了數位典藏的整體質變。為了探究以簡牘為主題的開放性資料庫架構,2019年起史語所與本中心共同合作,導入國際圖像互通架構(International Image Interoperability Framework, IIIF)規範,結合鏈結開放資料(Linked Open Data, LOD)等技術,開發「簡牘字典—史語所藏居延漢簡資料庫」。簡牘字典不僅發展出強大的圖像縮放瀏覽、提取單字字形、圖像比較、標註功能,改善簡牘研究的工具,也建構史語所藏漢簡圖像、後設資料的開放共享環境,成為發展跨國合作「歷史文字資料庫統合檢索系統」的立基。

 

本中心、史語所與奈文研等機構共同確立了文字圖像數位資源共享與流通的體制,並議定一致的IIIF 共通性應用程式介面規範。當多方共同遵循相同語法規範時,即可從彼此的資料庫中檢索出指定的單字圖像並進行再利用。

 

「歷史文字資料庫統合檢索系統」是文字圖像典藏機構間首次創新合作模式,這次系統的公開上線只是起點,未來將持續號召其他典藏機構加入,並嘗試深化技術發展的可能性。期待在文字圖像資源共享的理念下,突破時空的限制,再現東亞漢字文化圈的源流與歷史脈絡。

 

 

透過歷史文字資料庫統合檢索系統查詢,可即時呈現臺日5個典藏機構的單字圖像

 

相關連結:

開放性資料庫—簡牘字典(2020年「數位典藏與數位人文學研究計畫」數位成果展)

閱讀全文... 0
 
Copyright © 2009-Present Academia Sinica Center for Digital Cultures (ASCDC). All rights reserved. Best viewed in IE7+ or Mozilla 2.0+ with 1024*768 resolution . Designed by DayInFlying Group.