研究方法、進行步驟及執行進度

  1. 研究方法與進行步驟
本計畫所採用之研究方法,理論與實務並重,包括:文獻分析與探討、資料收集與整理、資訊組織與規劃、系統分析與設計等。主要工作項目及進行步驟可分為:(1)界定與整理資料內容;(2)資料結構分析;(3)專卷類目表規劃;(4)典藏資料數位化;(5)系統分析、設計與建置;(6)評估與改善等。分項說明如下:

  (1) 界定與整理資料內容
本研究界定之資料範圍是由合作典藏單位(聯合報系)長期篩選、整理,與棒球運動相關之報紙新聞及圖片,估計文字資料有五萬篇,圖片資料有一千五百張(包含攝影原件及未見報的若干珍貴照片)。有些資料因年代久遠,需動員一些人力進行歸納整理。

  (2) 資料結構分析
對於此批資料,我們進行了初步的資料分析,基本上可以用樹狀結構表示,如下圖所示為概略的示意圖。

圖 1 結構示意圖

  (3) 專卷類目表規劃
  此批棒球運動新聞專卷資料量龐大,必須詳加分類方能有效利用,我們目前作法是規劃一個類目表加以分類整理。此份類目表可在未來計畫執行過程中,做為資料庫系統建構與網站規劃與設計的一個重要的參考依據。

  (4) 典藏資料數位化
在典藏資料數位化過程中,除了採取常用的處理方式如影像掃瞄、重新打字、光學文字辨識等方式將資料數位化外,更重要的是要將數位化資料進行Metadata著錄,以便利用與管理。我們將評估各種可能作法之優劣,以便採行,目前已經著手進行的是Dublin Core和VRA Core應用於新聞資料Metadata的初步分析工作,如表 2、表 3所示。對於其他各種不同格式的Metadata,也將在未來計畫執行中進行評估比較,以便採取較適合應用於此批特定議題的典藏資料者。
   此外,對於資料內容的加值描述,可採行XML方式進行全文的標示(Markup)。數位典藏計畫的「新聞主題小組」建議對於新聞媒體裡的新聞事件以5W1H加以分析,而在我們所採行的分析項目中,除了滿足5個W和1個H的基本要求外,另外加了1個P和1個R,以便更符合專卷製作的特殊需求:
  (a) 五個W係是Where、Who、When、What、Why:任何新聞構成之要素不外以上條件,故專卷議題的製作也不應脫離這些要素;
  (b) 一個H係是How:事件的形成往往會有伏筆或徵兆,因此,在進行專卷議題的製作時,都會將如何形成此事件的主因列出;
  (c) 一個P係是Procedure:事件的過程是整個專卷議題的主角,原則上描述得越詳細越好;在實務上除描述過程外,整個專卷還附有簡表,讓使用者可先由簡表中略知一二,再去找尋所要之資料。
  (d) 一個R係是Result:專卷的主要資料來源為歷年報紙,但有些報導往往因外界因素或版面問題而中斷,以致不了了之。專卷的加值處理必須記載整個事件的最終結果,因此遠比見諸報端的報導完整。
專卷中有許多額外加值的珍貴資料都是長期累積的成果,並未公開見報或出版,雖屬灰色文獻的範疇,卻往往比見諸報端者詳盡、完整,更具參考與利用價值。

  (5) 系統分析、設計與建置
本典藏計畫將以電子資料庫方式建置台灣棒球數位史料館,並以網頁引導使用者查尋資料庫內容。資料庫將適度的設計與規劃,以便能依類目做分類加值,便於利用;而引導網頁除依據視覺化設計原則美化外,也將顧慮到視礙者之資訊需求,依據官方所頒佈的「無障礙網頁設計規範」,引入可及性(Accessibility)設計理念,以便視障同胞也能順利使用。資料經如此加值後方能顯出其價值。
  系統所提供的功能初步規劃有:人性化的介面、欄位檢索功能、全文檢索功能、模糊檢索功能、語意檢索功能、分類檢索功能、圖文整合功能、後台管理功能等。預計採用三層式主從架構進行系統開發。

  (6) 評估與改善
在整體系統完成後,將進行測試與評估,再依據測試結果進行系統改善工作。