1.
相關研究經驗與成果
申請人近年來皆從事數位典藏與文獻數位化相關之研究,包括XML(eXtensible
Markup Language)技術探討、報紙新聞數位典藏、後設資料(Metadata)研究、電子出版、資訊組織、知識管理、模糊Metadata應用、電子資料交換等相關議題,近五年內所發表之學術論文包括期刊論文17篇、研討會論文12篇(詳見所附著作目錄)。其中,與本計畫較相關之研究肇始於1998年,由於體認到XML將在電子出版、電子商務、電子圖書館、電子資料交換、遠距教學等領域展現強大應用潛能,於是開始投入其相關領域之探討。
1999年發表"XML相關技術與Web出版趨勢之研究";2000年發表"基於XML之分散式模糊知識管理系統模式",提出結合XML與Fuzzy進行精確性與模糊性知識管理之概念。接著,在2001年發表"基於XML之網際網路資料交換雛形系統設計",透過系統實作方式,以XML為基礎建構一套於網際網路上之資料交換系統;2002年起,開始將XML技術應用至電子新聞的管理上,在"基於XML之新聞管理與出版系統設計"的研究中,以XML語法進行新聞資料庫之Metadata著錄及全文標示,並設計一套新聞管理與出版系統,以提升數位新聞「智慧化」程度,進而增進檢索精確度。
2003年發表"中文報業數位化技術與現況探討-聯合知識庫數位化經驗",藉由文獻探討和訪談調查等方式,對中文報業處理報紙新聞的數位化技術和現況進行瞭解,提供有關回溯報紙的數位化與管理技術供各界參考。同年,"模糊理論與標示語言在電子新聞管理系統之應用"則提出模糊後設資料(Fuzzy
Metadata)之概念,結合模糊理論與全文標示兩種不同的作法,達到提升新聞檢索系統回現率與精確率之目的。
2. 參與數位典藏計畫第一年成果
基於以上研究經驗與成果,我們於2003年底以「台灣棒球運動珍貴新聞檔案數位資料館之建置」為主題,向國科會提出數位典藏公開徵選計畫獲得通過,自2004年3月起開始執行,預計三年完成,目前已進入第一年第三季作業階段。
本計畫合作單位為聯合報,數位典藏之內容為聯合報自光復以來長期篩選、整理,與台灣棒球運動相關之報紙新聞專卷檔案,包括文字、照片,以及眾多經過專業加值整理的珍貴資料。
第一年執行至目前為止之成果如下:
(A)
文字(全年預計約20,000篇,每季平均約5,000篇):
*
文字輸入與校稿:全年約800萬字(每季平均約200萬字)
-
第一季(3-6月):已完成約6,500篇,約260萬字。
-
第二季(7-8月):已完成約3,500篇,約140萬字。
-
第三季(9-11月):按預定進度執行中。
*
標題建檔與校稿:全年約20,000則(每季平均5,000則)
-
第一季(3-6月):完成約6,500則。
-
第二季(7-8月):完成約3,500則。
-
第三季(9-11月):按預定進度執行中。
(B)
照片(全年預計約800張,平均每季約200張):
*
照片掃瞄
-
第一季(3-6月):完成300張。
-
第二季(7-8月):完成100張。
-
第三季(9-11月):按預定進度執行中。
*
圖說建檔
-
第一季(3-6月):完成300則。
-
第二季(7-8月):完成100則。
-
第三季(9-11月):按預定進度執行中。
(C)
Metadata資訊組織:目前初步採用與DC相容的Metadata格式,如下圖所示。希望能儘速與數位典藏聯合目錄接軌,未來擬再陸續加入與其他Metadata規格相容之設計,以提升其資料交換與傳遞能力。

圖
1 本計畫目前採用之Metadata格式(初步結果)
(D)
本計畫網站網址為http://ndap.dils.tku.edu.tw
或
http://baseball.dils.tku.edu.tw。在首頁點選「計畫成果」即可進入檢索系統,目前已完成初步實驗系統之開發與建置,提供全文檢索與加值檢索兩項功能。如下圖所示。

圖
2 本研究計畫網站首頁
(E)
本計畫至目前為止共產出三篇學術論文,分別是:(1)
2004年8月隨中華圖書資訊教育學會至大陸大連理工大學進行學術交流,於「2004年海峽兩岸圖書資訊學暨教育發展研討會」發表的「報紙新聞專卷的數位典藏與加值利用」;(2)
擬於2004年11月淡江大學主辦之「2004年現代資訊組織與檢索研討會」發表的「數位化新聞的資訊組織」;(3)
投稿至「數位典藏作業規劃與品質管理研討會」,目前尚在審查中的「提升體育新聞資訊品質之探討-以SportsML、NITF、NewsML整合為例」。此外,本計畫也定期參與內容發展公開徵選計畫辦公室所召開的工作進度執行報告會議,以及新聞主題小組所召開的小組討論會議。

圖
3
計畫主持人出席「2004年海峽兩岸圖書資訊學暨教育發展研討會」發表研究成果 |