研究方法、進行步驟及執行進度

1. 研究方法

        本計畫所採用之研究方法,理論與實務並重,包括:文獻分析與探討、資料收集與整理、資訊組織與規劃、系統分析與設計等。主要工作項目及進行步驟可分為:(1) 界定第三年資料內容;(2) 數位化類目表之改良;(3) 第三年資料數位化與Metadata轉換工作;(4) 第三期系統分析、設計與建置;(5) 台灣棒球維基館之建置與加值應用;(6) 系統評估與改善等。

2. 進行步驟與執行成果

        (1) 界定第三年資料內容

        本研究界定之資料範圍是由合作典藏單位(聯合報系)長期篩選、整理,與棒球運動相關之報紙新聞及圖片,估計總資料量文字資料有五萬篇,圖片資料有一千五百張(包含攝影原件及若干珍貴照片);第三年預計完成的資料有15,000篇文字報導及300張照片。有些資料因年代久遠,需動員一些人力進行歸納整理,擬請聯合報提供部分協助。

        (2) 數位化類目表之改良

        此批棒球運動新聞專卷資料量龐大,必須詳加分類方能有效利用。本計畫於第一年執行之初,首先便進行了資料結構分析,接著即規劃一個極盡詳細的類目表加以分類,此份類目表在本計畫執行過程中,扮演了數位典藏系統建構與網站規劃設計的重要依據。本計畫第一年所開發的數位典藏系統已依據此份預先規劃的分類表,完成如下圖左方之樹狀資訊組織瀏覽介面,使用者可以很方便的點選所感興趣的主題,以調閱相關專卷之棒球新聞。下圖右方是尚未數位化前堆積如山的專卷卷宗。相較之下左圖的數位化分類表搭配數位典藏資料庫系統,可顯著的提高專卷調閱效率。

5 數位化之棒球新聞專卷樹狀分類表

6 尚未數位化之棒球新聞專卷

        然而,這個原以專卷方式所設計之分類表,其原始目的乃為協助報社從業人員查詢資料,故分類細微,依不同主題、事件、人物 … 等歸納成「棒球人事」、「棒球比賽」、「棒球場地」、「職業棒球」、「職棒賭博」 … 等,共分為174類,組成樹狀資訊結構。若直接以此分類架構匯入數位典藏聯合目錄,將顯得過於複雜瑣碎,不利使用者進行分類檢索。因此自第二年起,我們開始依據數位典藏聯合目錄特性,分析、規劃、改良此類目表,使其更精簡、更便於使用。本年度將持續改進成更符合棒球新聞專屬之類目,以便於透過OAI-PMH「資料集」滿足聯合目錄「分類架構」之應用。為求類目清楚簡單,將捨棄起初為求詳盡完整採用主類目之下又再複分的樹狀結構,而改為單層類目,以免新聞類目過於繁多,歸屬不易,不便管理者分類和使用者查找的問題。本計畫預定之分類架構及其對應至數位典藏聯合目錄之整體架構如下圖所示。此外,亦將根據此簡易分類表,在原有系統中增設分類管理功能以便於管理者使用。

圖 7 重新規劃適合聯合目錄分類架構的類目表

        (3) 第三年資料數位化與Metadata轉換工作

        在典藏資料數位化方面,承接前兩年的成果,持續進行第三年的內容數位化工作。數位化過程除採取常用的處理方式如影像掃瞄、重新打、光學文字辨識等方式將資料數位化外,更重要的是要將數位化資料進行Metadata著錄,以便利用與管理。我們將持續評估各種可能作法之優劣,以便採行;也將基於現有的研究成果上,再開發各種不同格式的Metadata自動轉換模組。目前已經完成的是DC、DAC、RSS、NITF等Metadata格式的轉換。新年度我們將基於現有的基礎上,如表 2所示,繼續研究其他如NewsML、PRISM、SportsML、ProgramGuideML、EventsML和XMLNews等Metadata格式的轉換。

表 2 Metadata轉換對應表

         (4) 第三期系統分析、設計與建置

        本計畫前兩年依預定進度建置了台灣棒球報紙新聞數位典藏庫第一、二期系統,資料庫的設計皆依所規劃的類目做分類,便於引導使用者查詢、利用。系統採用三層式主從架構進行系統開發,所提供的功能則有:人性化的介面、欄位檢索功能、全文檢索功能、加值檢索功能、分類檢索功能、圖文整合功能、後台管理功能等。


        新年度計畫中,將完成總體系統之整合,如下圖所示。首先,繼續完成OAI-PMH分散檢索系統之開發,將「台灣棒球新聞數位典藏系統」轉化為基於OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)分散式檢索協定的資料提供者(Data Provider),以供遵循OAI-PMH協定的服務提供者(Service Provider)檢索利用;再與數位典藏聯合目錄的Service Provider進行連結測試,此部分完成後本系統與聯合目錄之間便不需再透過匯出匯入XML檔案的半自動化方式共享資料,而可直接透過OAI-PMH協定進行即時傳遞;此外,我們也將自行開發自己的Service Provider,直接對本系統的使用者提供服務。

        此外,也將基於OpenURL協定,開發符合此概念的開放檢索系統。下表為OpenURL之Meta-Tag與本計畫新聞資料庫內部Metadata初步對應結果,未來將持續進行分析與改善,並做為系統開發之依據。

表 3 OpenURL與內部Metadata對應分析(初步結果)

        (5) 台灣棒球維基館之建置與加值應用

        除持續進行第三期系統開發外,我們還擬結合現有開放原始碼的「內容管理系統」(Content Management Systems),如WiKi、Blog等,一方面藉以探討資訊架構(Information architecture)設計相關議題,如索引典、控制詞彙、分類、索引等實務應用;另一方面也能廣泛傳播或分享此批數位典藏資料,讓更多使用者能更方便的在一個共通的資訊共享平台上,閱讀到歷年來台灣棒球運動發展的珍貴資料。


        目前已著手利用維基協作系統(Wiki collaboration system)進行加值應用,名為「台灣棒球維基館」(網址:http://twbsball.dils.tku.edu.tw),現已略具雛形,如下圖所示。藉助Wiki易於分類、管理之特性,除將台灣棒球新聞以及所收集到的其他資料,整理成預定的「台灣棒球大事記」、「台灣棒球名人錄」之外,亦延伸出「台灣棒球發展史」、「台灣棒球影像館」 … 等附加資訊;此外,由於Wiki具備開放協作之精神,所以本系統也將開放給所有對台灣棒運發展有興趣的人士來參與編寫工作。然而,也因採開放協作模式,內容品質較難掌握,故此部分內容僅作為純學術研究之用,並不納入正式授權產出之數位化資產。至於維基系統所衍生的相關議題,如社群經營、系統安全性、內容品質管理 … 等,我們也將以本計畫為起點,作為未來持續研究的基礎。

 

 

 

  

9 台灣棒球維基館雛形系統(http://twbsball.dils.tku.edu.tw

 

 

        (6) 評估與改善      

        目前第二年的數位化工作已完成約百分之九十、系統建置則約百分之八十,符合原訂進度;第三年將陸續進行測試與評估,並依據測試結果進行系統改善及第三期系統建置。

3. 第二年預定進度 

 

工作項目 \ 月份

1

2

3

4

5

6

7

8

9

10

11

12

界定第三年擬進行數位化的資料內容(由聯合報協助)

#

#

   

 

 

 

 

 

 

 

 

數位化類目表之改良

 

#

#

#

#

 

 

 

 

 

 

 

第三期系統分析、設計與建置

#

 #

#

#

#

#

 #

 #

 #

 #

 #

 

第三年資料數位化與Metadata轉換工作

 

#

#

#

#

#

#

#

#

#

#

#

內容加值與應用

 

#

#

#

#

#

#

 

 

 

 

 

系統評估與改善

 

#

#

       

#

#

#

 

 

撰寫報告

               

#

#

#