數(shù)字圖書館的建設(shè)發(fā)展原則
數(shù)字圖書館建設(shè)需要高昂的投資和海量的資源,故而針對數(shù)字圖書館的建設(shè)、實(shí)現(xiàn)、維護(hù)和發(fā)展,相關(guān)方都會有一些基本的考慮和遵循原則,這些原則不僅適用于將模擬對象轉(zhuǎn)換為數(shù)字形式,也適用于數(shù)字圖書館,遵循這些原則,并吸取從之而來的實(shí)踐經(jīng)驗(yàn),會使設(shè)計、建設(shè)和維護(hù)開發(fā)數(shù)字圖書館的工作受益。
數(shù)字圖書館發(fā)展原則
數(shù)字圖書館要適應(yīng)和迎合變革。持續(xù)變化的技術(shù)環(huán)境,對于數(shù)字圖書館項(xiàng)目來說是一個挑戰(zhàn)。紙質(zhì)文檔會被轉(zhuǎn)換成數(shù)字格式,隨著技術(shù)變革,當(dāng)市場不再支持相應(yīng)系統(tǒng)和格式時,該格式的數(shù)字化文檔就會逐漸被廢棄。如果在某特定程序中創(chuàng)建一個重要文檔,那么為了訪問附件則依賴這個特定程序,假設(shè)我們的目的是為后人保留重要信息,而未來技術(shù)的變革可能意味著普通用戶無法訪問這個文檔。
互聯(lián)網(wǎng)和Web使數(shù)字圖書館成為可能,數(shù)字圖書館設(shè)計者依賴現(xiàn)有的范例和工具,依然會導(dǎo)致不可預(yù)見的問題。比如用HTML創(chuàng)建Web站點(diǎn)便于訪問數(shù)字圖像和文檔,但是也會因?yàn)镠TML更改或被其他技術(shù)取代而過時。技術(shù)變革的速度超過管理者維護(hù)數(shù)字圖書館的能力,所以數(shù)字圖書館需要方法和計劃以應(yīng)對改變,保持對信息提供持久訪問的能力。
發(fā)展數(shù)字圖書館要切實(shí)了解“內(nèi)容”。對于用戶來說,內(nèi)容是數(shù)字圖書館中最值得關(guān)注的部分。創(chuàng)建者需要管理和決定數(shù)字圖書館的內(nèi)容,包括選擇要包含的對象,數(shù)字化模擬形式的項(xiàng)目,用標(biāo)準(zhǔn)語言(例如SGML)標(biāo)記項(xiàng)目,并分配元數(shù)據(jù),用以描述每個對象的內(nèi)容和其他屬性。
對于開發(fā)人員來說,在項(xiàng)目伊始確定元數(shù)據(jù)元素的性質(zhì)和數(shù)量非常重要。一些元數(shù)據(jù)元素描述了項(xiàng)目的內(nèi)容,包括標(biāo)題、創(chuàng)建者、發(fā)布日期和討論主題,其他元素可能被分配來管理集合,包括掃描狀態(tài)、質(zhì)量控制狀態(tài)和內(nèi)部注釋,以及數(shù)字對象的技術(shù)方面,例如文件格式和大小。
決定系統(tǒng)將要包括的基本概念單元或?qū)ο笸瑯又匾?,例如個人文檔、照片、視頻或?qū)嶒?yàn)記錄,它將影響到元數(shù)據(jù)被分配的級別,以及如何組織、訪問和歸檔這些資料。每個概念性對象分配它自己的唯一標(biāo)識符,將其與元數(shù)據(jù)記錄和集合中的其他對象連接起來。
數(shù)字圖書館建設(shè)團(tuán)隊,需要包容不同背景以及提供各種專業(yè)知識的成員。從多個領(lǐng)域獲得構(gòu)建系統(tǒng)的建議和幫助,才能建立更好的數(shù)字圖書館。
計算機(jī)科學(xué)和圖書館學(xué)是構(gòu)建系統(tǒng)最直接的兩個領(lǐng)域。計算機(jī)專家能夠領(lǐng)會和鑒別技術(shù)可行性和局限性,關(guān)心數(shù)字圖書館元數(shù)據(jù)標(biāo)準(zhǔn)在龐大互聯(lián)網(wǎng)信息空間中提供的語義互操作性;而圖書館員是信息資源的管理者,具有豐富的編目和索引經(jīng)驗(yàn),并認(rèn)識到這些概念對于信息檢索的重要性,而且他們了解用戶的信息需求,以及保存材料以繼續(xù)獲取和使用的問題。此外,能夠提供長期財政、材料和人力支持的組織和高層管理人員同樣重要。
設(shè)計“易用的系統(tǒng)”。由于Web的巨大優(yōu)點(diǎn),多數(shù)數(shù)字圖書館是通過網(wǎng)絡(luò)技術(shù)在互聯(lián)網(wǎng)Web上提供的。成功的Web站點(diǎn)設(shè)計包括許多因素,包括計算機(jī)和瀏覽器之間的技術(shù)差異,訪問速度和用戶之間的差異,Web導(dǎo)航偏好等。瀏覽器在顯示信息的方式上有所不同,即使它們使用相同的基本通信協(xié)議(如Http、Https)和標(biāo)準(zhǔn)標(biāo)記語言(比如HTML或XML)。由于用戶可能會更改默認(rèn)設(shè)置,所以最好創(chuàng)建盡可能簡單的接口,并避免服務(wù)器端對數(shù)據(jù)的精確顯示進(jìn)行控制。此外,開發(fā)面向數(shù)字圖書館的接口時,對于具有一定范圍的物理缺陷的用戶來說,可訪問性也是一個問題。
確保開放存取的原則。確保開放存取與可用性問題密切相關(guān),包括對數(shù)字圖書館內(nèi)容以及對數(shù)字圖書館本身的訪問。確保對內(nèi)容開放存取的一種方法是避免使用專有的軟硬件解決方案。許多用于創(chuàng)建數(shù)字圖像的收費(fèi)的軟件,同時允許軟件接口免費(fèi)使用,數(shù)字圖書館開發(fā)人員可以清楚地知道需要哪些軟件來查看這些圖像,就可以訪問這些內(nèi)容。為了確保持續(xù)可訪問性和使用,開放的非專有的系統(tǒng)是建設(shè)數(shù)字圖書館的首選。
數(shù)字版權(quán)意識。我國的版權(quán)法和著作權(quán)法保護(hù)數(shù)字知識產(chǎn)品,而開放獲取信息的可能威脅知識產(chǎn)權(quán)。數(shù)字信息基礎(chǔ)設(shè)施易于獲得大量的信息,但是信息的不當(dāng)復(fù)制和訪問控制存在不確定途徑的風(fēng)險。創(chuàng)建數(shù)字圖書館應(yīng)關(guān)注這個問題,并參與討論相關(guān)的解決方案,盡可能的建立管理程序以保護(hù)館藏。例如,在數(shù)字轉(zhuǎn)換項(xiàng)目中應(yīng)該得到實(shí)體版權(quán)所有者的許可??紤]個人隱私問題,當(dāng)重要的私人全部文件被數(shù)字化的時候,要根據(jù)捐贈者標(biāo)記出的敏感物品以及處置說明,仔細(xì)地跟蹤權(quán)限和隱私信息,確保這些信息不存在法律風(fēng)險。
系統(tǒng)盡可能自動化。建立數(shù)字圖書館需要系統(tǒng)創(chuàng)建者進(jìn)行大量的腦力勞動,構(gòu)建和使用自動化工具越多,就越能更好地利用寶貴的人力資源;這些工具使內(nèi)容專家能夠?qū)W⒂谥R任務(wù)(見圖1),只需使用元數(shù)據(jù)輸入系統(tǒng)向主數(shù)據(jù)庫一次添加元數(shù)據(jù),然后根據(jù)訪問用戶的需要從主數(shù)據(jù)庫提取和組合這些信息,以生成HTML頁面、搜索索引和報告。一次輸入數(shù)據(jù)可以節(jié)省人力和時間,降低錯誤率,并允許最大的靈活性。幾乎整個Web界面都是由數(shù)據(jù)庫生成的,只要必要就允許更新,同時能遵循最新的Web標(biāo)準(zhǔn)。系統(tǒng)進(jìn)行模塊化設(shè)計,現(xiàn)有模塊易于修改,易于為新功能添加新模塊。
采用并遵循標(biāo)準(zhǔn)。在系統(tǒng)構(gòu)建中使用標(biāo)準(zhǔn)使應(yīng)用程序易于擴(kuò)展、可互操作和可移植,這些特性對于數(shù)字圖書館的設(shè)計、實(shí)現(xiàn)和維護(hù)非常重要。使用標(biāo)準(zhǔn)對于需要大量工作的數(shù)字圖書館來說尤其重要,掃描、元數(shù)據(jù)輸入和文檔標(biāo)記,集合中所有涉及到需要評估和處理的單個項(xiàng)目,都是資源任務(wù)密集型的工作,最好需要“一次性完成”。遵循標(biāo)準(zhǔn)將使今后可能的數(shù)據(jù)遷移更加容易。另外,使用標(biāo)準(zhǔn)文件格式保存的信息,比用專有格式編碼的信息更容易訪問。
對于開發(fā)人員來說,使用標(biāo)準(zhǔn)更易于實(shí)現(xiàn)互操作性。通過使用標(biāo)準(zhǔn)通用的數(shù)據(jù)標(biāo)簽和Web技術(shù),發(fā)布數(shù)字圖書館的內(nèi)容,增加了其他Web搜索引擎訪問圖書館以及其中具體條目的機(jī)會。未來數(shù)字圖書館或許成為某個更寬泛的系統(tǒng)組成部分,那么開放的標(biāo)準(zhǔn)設(shè)計,將使未來的轉(zhuǎn)換和重組將更加平順。
保證質(zhì)量的原則。質(zhì)量度量可以應(yīng)用于創(chuàng)建一個數(shù)字圖書館所涉及的所有過程和結(jié)果。它們與選擇、元數(shù)據(jù)條目、圖像捕獲和系統(tǒng)的總體可用性有關(guān)。完整和正確的元數(shù)據(jù)會帶來許多好處;不完全或不正確的元數(shù)據(jù)影響整個數(shù)字圖書館的質(zhì)量。元數(shù)據(jù)在資源發(fā)現(xiàn)和集合管理方面都扮演著重要角色,如果主題代碼被隨意或不正確地應(yīng)用,那么根據(jù)這些代碼生成瀏覽層次結(jié)構(gòu)的嘗試可能會被阻止,訪問可能會更加困難。
轉(zhuǎn)換項(xiàng)目中掃描過程的指導(dǎo)方針,如果包括對被掃描圖像的外觀標(biāo)準(zhǔn),包括方向,分辨率,色調(diào),將會減少很多的潛在問題。一些質(zhì)量控制指標(biāo)可以自動化,有些則需要人工審查。數(shù)字圖書館項(xiàng)目應(yīng)定義并堅持實(shí)施質(zhì)量控制方法,確保質(zhì)量評估成為構(gòu)建和維護(hù)數(shù)字圖書館的重要組成部分。
內(nèi)容持久性的原則。對于數(shù)字圖書館而言,首先,是數(shù)字對象的“遷移策略”,它要求將數(shù)據(jù)從一個文件格式轉(zhuǎn)換為另一個文件格式,從一個軟件環(huán)境轉(zhuǎn)換為另一個軟件環(huán)境,或者從一個物理介質(zhì)轉(zhuǎn)移到另一個物理介質(zhì)。遷移意味著機(jī)構(gòu)強(qiáng)大持久的承諾和支持,不斷刷新其集合以跟上技術(shù)進(jìn)步的步伐。
其次是數(shù)字對象的保存和持久性,保存是指對象的技術(shù)壽命和質(zhì)量;持久性則是一個更廣泛的概念,包含了保存,也包括這個對象將來是否還會以其他形式存在。數(shù)字信息的持久性意味著存儲信息并保持其可訪問。
結(jié)語
遵循以上這些原則,以及從這些原則演變而來的實(shí)踐經(jīng)驗(yàn),使我們更有利地建設(shè)、維護(hù)和發(fā)展數(shù)字圖書館,保護(hù)高質(zhì)量有價值的信息資源,為用戶持續(xù)提供開放的訪問服務(wù)而努力。
欄目分類
- 為什么發(fā)表論文都不開雜志社的發(fā)票呢?
- 2021-2022年CSCD中國科學(xué)引文數(shù)據(jù)庫來源期刊列表-理科南大核心目錄完整版
- CSCD中國科學(xué)引文數(shù)據(jù)庫來源期刊列表(2023-2024年度)南大核心目錄
- 融媒體環(huán)境下地方新聞網(wǎng)站媒體的發(fā)展路徑
- 創(chuàng)新與繼承:70周年獻(xiàn)禮片“三杰”研究
- 人本導(dǎo)向下的城市更新規(guī)劃思路探索——以上海松江區(qū)中山街道老城區(qū)為例
- 預(yù)制裝配式地鐵車站施工技術(shù)
- 從框架理論看“中國學(xué)習(xí)的人”
- 互聯(lián)網(wǎng)環(huán)境下古都洛陽城市形象建構(gòu)與傳播探析
- 價值工程在房地產(chǎn)開發(fā)管理分工中應(yīng)用
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級黨報?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!