
會議時間:99年4月20日星期二下午2點至4點30分
會議地點:中央研究院人文社會科學館北棟1樓大會議室
主辦單位:TELDAP計畫辦公室 | 中央研究院資訊科技創新研究中心
成果國際化是數位典藏與數位學習國家型科技計畫的重要任務之一,為使外語使用者可以透過中英文詞彙對照的方式,以英文為媒介,找到相對應的中文詞彙,而檢索到符合需求的資料,本國家型計畫與美國蓋提研究中心(The Getty Research Center)合作,進行「藝術與建築索引典」 (Art and Architecture Thesaurus, AAT)的中文化工作(簡稱AAT-Taiwan),進而建構數位典藏多語詞彙庫。另一方面,中央研究院語言學研究所的詞彙網路組為中文語言資訊處理研究的需要,參考美國普林斯頓大學認知科學實驗室的詞彙網絡(Princeton WordNet),建置了「中文詞彙知識庫」中文詞彙網路(Chinese Wordnet)。

中文詞彙網絡CWN (Chinese WordNet)為中研院語言所、香港理工大學人文學院、台灣師範大學英語系、台大語言所和資工所共同發展,主題在於語言資源的建構、評估、與知識模型,即所謂專業領域知識模型的建立。謝教授強調他們先就中文詞義內容與詞義關係的發掘與分析,結合實際語料來進行驗證與舉例。並在語料庫尚平行進行詞義標記,以完整知識系統的建立,兼顧知識本體的完備規範與人類語言系統內部的完整知識。
中文詞彙網路計畫所採取的策略,是從語言學的角度來建立或分析詞彙結構。這是根據普林斯頓大學發展的WordNet,由心理學家、認知科學家還語言學者共同合作,所發展的詞彙網路計畫。其基本設計就是先把詞彙分出來,然後對每一個詞的詞意做分析,相同詞意的詞彙會放在一起當成一個集合,很多同義詞集合,就像是一個網路的節點,節點之間的聯繫透過詞彙語意關係來建構,其中關係類型就包括很多種。

0 意見:
Post a Comment