預期完成之工作項目及成果

 

1. 預期完成之工作項目

        本計畫預計分三年完成,依序將聯合報系資料中心所典藏的棒球新聞專卷數位化及資料庫化,並進行系統開發與建置。總計約有文字資料五萬篇,圖片資料一千五百張。預期完成之工作項目如下:

  • 第一年:(目前按既定進度執行中)

  • 資料數位化工作:開始建立棒球資料庫,完成文字資料兩萬篇,圖片資料八百張之數位化與建檔;

  • 資訊組織規劃工作:依資料內容特性進行分析,規劃適合之資料結構與資訊組織架構、Metadata格式等,並依所規劃之方法對資料進行分類整理;

  • 系統建置工作:完成第一期系統開發,包括網站架設、網頁設計、資料庫建置、檢索程式開發、圖文整合功能、欄位檢索功能、後台管理功能等。

        第一年度計畫自933月至942月,至目前為止,上半年之工作進度如期完成,下半年之進度目前正進行中。此外,我們也初步探討了若干新聞Metadata格式,為下一年度的研究工作預作準備。

  • 第二年:(今年度預計工作項目)

  • 資料數位化工作:陸續進行棒球新聞專卷數位化與建檔,本年度將新增文字資料一萬五千篇,圖片資料四百張;

  • 資訊組織規劃工作:依據第一年所規劃之資訊組織架構及方法,繼續對相關資料進行分類整理;

  • Metadata研究工作:除針對國內數位化新聞專用的Metadata格式,如NewsML、NITF、SportsML、ProgramGuideML、EventsML、RSS、PRISM和XMLNews進行研究外,也將一併探討海峽兩岸中文新聞Metadata的發展,如NRMF、UdnML、XinhuaML、CNTF等。以作為在系統中陸續加入支援其他規格的設計依據,以提升系統之資料交換與傳遞能力。

        系統建置工作:除完成第二期系統功能開發,包括全文檢索、模糊檢索、語意檢索等外。擬結合RSS、OAI等現有的檢索協定和WiKi、Blog等通用的群組系統,以便傳播及分享數位典藏資料。程式將採一部份委外開發,一部份自行設計的方式進行,以培養研究生系統開發的經驗。

 

15 第二年擬建置之系統架構圖(初步規劃)

  • 第三年:(明年度預計工作項目)

  • 資料數位化工作:完成最後一萬五千篇文字資料,三百張圖片資料之數位化與建檔;

  • 資訊組織規劃工作:依據第一年所規劃之資訊組織架構及方法,繼續對相關資料進行分類整理;

  • 系統建置工作:完成第三期系統功能,包括分類檢索、加值應用等。

        期望經由本計畫的規劃與執行,能逐步建立一個「台灣棒球數位典藏庫」。

2. 參與人員預期可獲得之訓練

        本計畫範圍涵蓋數位化技術、Metadata研究、系統建置與整合、資訊組織與共享等層面,可供研究的主題相當豐富且多樣。主持人與兩位研究生助理在第一年度計畫的執行過程中,參與了若干相關研討會,共發表三篇論文,有助於增進專業能力與擴展研究視野。從本計畫第二年的規劃中,預期參與人員可獲得之訓練有:

(a)    瞭解新聞資料數位化的作業流程、技術與方法。

(b)    實地參與數位化新聞資料結構轉換及網路資訊的發佈與共享流程。

(c)    認識新聞專用的Metadata,結合網路資料庫存取協定之理論與實務。

(d)    協助進行部分程式的開發,對系統分析及系統發展可獲得紮實的訓練。

(e)    經由反覆的遭遇問題、分析問題、解決問題的過程,可培養獨立思考的能力。

(f)      藉由團隊的合作、研究、討論,可培養彼此互助的團隊精神。