我國高校圖書館數據素養(yǎng)課程內容構建研究
E-science科研環(huán)境下,數據被視為獨立的科研成果,是科研產出的重要組成部分[1],科學研究變成了一個更加公開和更多參與的活動,研究者之間的協同合作成為必然趨勢。研究人員隨時面臨著數據管理計劃制定、數據引用、數據共享及數據復用等問題,亟須要提高他們的數據素養(yǎng)能力[2]。圖書館集資源、能力、服務經驗為一體,是提供數據管理服務和開展數據素養(yǎng)教育的最佳主體,能夠幫助研究人員應對科學數據管理及治理的挑戰(zhàn)。目前,國外高校圖書館已積極開展數據服務研究,開發(fā)建設數據管理和數據素養(yǎng)相關能力課程,在長期實踐中積累了豐富的研究經驗和實踐成果,但國內對于數據素養(yǎng)的教育仍處于起步階段,課程內容的構建上依然存在很大問題,亟須構建符合我國目前實踐發(fā)展及教育對象需求的數據素養(yǎng)課程內容。
1 數據信息素養(yǎng)的概念和內涵
隨著數據科學的興起,科研人員面臨著“數據洪水”的挑戰(zhàn),需要對眾多研究人員生成的科研數據信息進行查找、描述、組織、存儲、跟蹤及再利用[3]。這就對研究人員的數據素養(yǎng)提出了更高的要求。目前國內外學者對于數據素養(yǎng)的界定尚未得到統一。從數據管理角度來看,數據素養(yǎng)(Data Literacy)是指在數據采集、組織、管理、處理、分析、共享、協同、復用等方面的能力,以及在數據生產、管理和發(fā)布過程中的道德與行為規(guī)范[4]。隨著Data Curation/Digital Curation詞匯的出現,Qin和Ignazio[5]認為數據素養(yǎng)是“研究者在科研過程中收集、處理、操作、評估和利用數據的能力”。
在國內,孟祥保等[6]認為“科學數據素養(yǎng)”(Science Data Literacy)應該包含:具有“數據”意識,具備數據基本知識與技能,同時,在大數據時代能夠利用數據資源發(fā)現問題、分析問題與解決問題三個層次。張靜波[7]提出數據素養(yǎng)是一種對數據的理解、創(chuàng)造和使用的能力,是對媒介素養(yǎng)、信息素養(yǎng)等概念的延伸和補充。綜合各方的觀點,筆者認為可將數據素養(yǎng)這一術語作為在數字化科研背景下信息素養(yǎng)的應用,它是統計素養(yǎng)、信息素養(yǎng)、科學素養(yǎng)重新融合的新興技能。
2 圖書館開展數據素養(yǎng)課程的必要性
新的研究范式不僅是研究方法的改變,更是人類的思維方式的變化。數據素養(yǎng)教學成為提升素養(yǎng)能力的關鍵手段。在此背景下,圖書館開展數據素養(yǎng)課程將成為主要方式,本文從以下三個方面詳細論述推動我國圖書館開展數據素養(yǎng)課程建設的影響因素。
(1)新的研究方法改變了科學研究、出版商、圖書館的角色,圖書館已經從傳統意義上的關注學術交流“輸出”的服務,轉變?yōu)殛P注提供研究數據服務(RDS)[8],數據管理與治理逐漸成為圖書館員的新興技能。角色的變化及館員能力的完善,將使得圖書館成為數據素養(yǎng)課程開展的主要推動力。
(2)新的研究環(huán)境提供了大量可訪問和操控的數據,增強了研究人員發(fā)現問題及充分利用新的合作關系的能力。但也為研究人員帶來了數據管理與治理方面的挑戰(zhàn),亟須提升自身的數據素養(yǎng)能力。目前一些資助機構、期刊出版商及研究機構紛紛制定數據管理政策要求研究人員的數據管理行為,如美國國家科學基金會的“數據管理計劃”(Data Management Plan)[9]。但這些政策在研究人員的現有問題及挑戰(zhàn)上僅僅是一種指導,并不具有提升相關技能的教育作用,開展數據素養(yǎng)課程將成為提升研究人員需求的必要手段。
(3)為了充分應對新的研究范式的挑戰(zhàn),促進科學的發(fā)展。部分歐美國家將數據管理和利用提升到了戰(zhàn)略的高度,除了采用項目進行資金的支持和引導外,一些大學圖書館也相繼開展數據素養(yǎng)相關的教育活動。如康奈爾大學圖書館采用獨立課程的形式(課程網址:http://data.research.cornell.edu/content/data-management-planning),利用數據圖書館員與學科領域教師聯合的方式,提升自然科學領域研究生的數據管理、元數據和數據描述等方面的能力。而普渡大學圖書館則選用了系列研討會的形式(會議網址:http://muse.jhu.edu/book/42542),將圖書館員與特定項目團隊的研究人員聯合,以提升農業(yè)和生物工程學生的數據管理程序標準化的能力。明尼蘇達大學采用在線課程的方式開展數據素養(yǎng)教育活動(課程網址為:http://z.umn.edu/datamgmt),課程旨在培養(yǎng)學生的數據創(chuàng)建、記錄、共享和保存方面的能力。雖然各個高校數據信息素養(yǎng)教育活動開展的形式多種多樣,但各個大學圖書館已經將數據信息素養(yǎng)課程的開發(fā)和建設作為研究人員教育的主要關注點,國外數據信息素養(yǎng)教育大環(huán)境已經形成。
綜上所述,第四科研范式下,圖書館急需要適應角色變化發(fā)揮自身優(yōu)勢,構建適合我國實踐基礎的數據素養(yǎng)課程,以提升用戶日益增長的數據素養(yǎng)需求,促進科學研究發(fā)展。
3 數據素養(yǎng)課程內容構建的核心能力分析
3.1 數據素養(yǎng)核心能力發(fā)展概況
數據素養(yǎng)作為一種新興的素養(yǎng)技能,不僅與信息素養(yǎng)關系密切,同時處于學術交流和信息素養(yǎng)的交匯點[10],引起了大家的廣泛關注。專家們分別從不同的角度論述了數據素養(yǎng)的核心能力[11]。本文主要對JakeR.Carlson等人[12],Calzada Prado和Marzal[13]的相關觀點進行論述,以為數據素養(yǎng)課程內容的構建提供理論基礎。
3.1.1 2011年Carlson等人的數據素養(yǎng)核心能力
2011年普渡大學的Jake R.Carlson等人[12]最早提出了數據素養(yǎng)核心能力體系,他們根據調研地理信息學教師及學生的數據素養(yǎng)需求,采用ACRL的標準對訪談結果進行了過濾。最終將數據素養(yǎng)能力確定為八項核心能力,這個能力體系不僅切合用戶需求,同時也為后期數據素養(yǎng)能力構建奠定了基礎。這八項數據素養(yǎng)能力分別表示為:數據管理、數據的轉化與互操作(能處理由數據格式的變化而導致的數據丟失或損壞)、元數據、數據治理與重用、數據保護、數據分析、數據可視化和倫理(包括數據的引用)。
3.1.2 2013年Calzada Prado和Marzal的數據素養(yǎng)核心能力
Calzada Prado和Marzal[13]在前期數據素養(yǎng)核心能力列表的基礎上,進一步強調了綜合數據的觀點,提出不僅要注重自身數據源的綜合,同時也要注重與其他信息源的綜合。還特別提出了語境的重要性,認為如果數據與上下文分離或丟失,將使數據的重用變得困難甚至難以實現。最終,他們列舉了包含以下幾方面的數據素養(yǎng)能力框架:明確所生成或重用數據的數據生命周期,識別源數據的價值、類型、格式,明確何時需要數據,根據所需信息訪問適合的信息源,批判性的評估數據及其來源,確定和使用適當的研究方法,處理和分析數據,提供定量化的信息(如具體的數據、表格、圖表、報表等),將結果應用于學習、決策和問題的解決,在整個過程中進行計劃、組織和自我評估。
3.1.3 其他學者的數據素養(yǎng)核心技能
除了Carlson、Calzada Prado等人的相關觀點外,2013年Mandinach和Gummer[14]在分析了教育實踐現狀的基礎上,指出在實踐活動中正規(guī)數據素養(yǎng)課程的重要性。他們認為數據素養(yǎng)課程不僅能幫助教育工作者將數據轉化為信息,并最終轉化為可操作的知識,同時也能幫助學生在決策中有效地理解和使用數據。數據素養(yǎng)核心技能應該要重點突出數據驅動決策的作用,從而給出了包含:知道如何識別、收集、組織、分析、總結和確定數據的優(yōu)先級;如何制定假設、識別問題、解釋數據,以及確定、規(guī)劃、實施和監(jiān)督行動方案等幾方面的能力。同年,學者Giarlo[15]更加明確了數據管理與數據治理(data curation)在數據素養(yǎng)中的重要性,認為具備數據素養(yǎng)能力的研究生和研究人員必須對數據質量給予關注。在此基礎上,將數據可信、權威、可靠、易于理解發(fā)現與獲取,同時能保證數據的完整性等幾方面的能力融入數據素養(yǎng)核心能力框架。
3.2 我國數據素養(yǎng)課程核心能力框架構建
明確數據素養(yǎng)核心能力是課程內容構建的基礎與前提。2011年,由普渡大學圖書館牽頭、康奈爾、明尼蘇達和俄勒岡大學協同參與的數據信息素養(yǎng)項目[16](Data Information Literacy Projects,DIL)(https://muse.jbu.edu/book/42542)分析各個學校開展的具體教學實踐活動,最終給出基于數據生命周期的12項核心數據素養(yǎng)能力,我們以此建設數據素養(yǎng)課程內容構建的核心能力框架。表1列出了12項核心能力及相關的數據技能,分別是:數據發(fā)現和獲取、數據庫和數據格式、數據轉換和互操作性、數據處理和分析、數據可視化與表示、數據管理與組織、數據質量與記錄、元數據和數據描述、實踐規(guī)范、數據倫理與歸因、數據治理和重用、數據保存。
4 我國高校圖書館數據素養(yǎng)課程建設調查分析
隨著e-science科研環(huán)境的發(fā)展,國內高校圖書館均已認識到數據素養(yǎng)能力的重要性,紛紛開展相關素養(yǎng)教育活動。本文調研了36所“雙一流”高校圖書館關于數據素養(yǎng)的教學與培訓現狀,經過初步的篩選分析最終選定其中有代表性的12高校圖書館作為研究對象。從教學對象、教學途徑、教學內容三個角度分析目前國內數據素養(yǎng)教育情況,為后期數據素養(yǎng)課程內容的構建提供實踐基礎及理論依據。
4.1 教學對象
在12所高校圖書館開展的數據信息素養(yǎng)教學活動中,主要采用講座、培訓、在線課程的教育方式,并未明確指定教學對象,大多針對的是全校學生或高年級本科生及研究生。在數據信息素養(yǎng)教育的培養(yǎng)上不僅沒有明確的設定教學對象,同時對學生的專業(yè)差異關注度低。
4.2 教學途徑
根據調研顯示,目前國內圖書館在開展數據信息素養(yǎng)教學時,主要采用將數據信息素養(yǎng)部分技能融入傳統信息素養(yǎng)課程的傳統學分課程、短期培訓班、在線課程和講座幾種途徑(見表2)。其中講座是使用最廣泛的教學途徑,雖然它具有開展方式靈活、針對性強等優(yōu)勢,但所涉及的主題內容分散與學生自身課程體系關聯度低,教學成果難以評估。
4.3 教學內容
本文以12項數據信息素養(yǎng)的核心能力為基準,調研12所高校圖書館開展的數據信息素養(yǎng)教學中涉及的數據信息素養(yǎng)教學內容(見表3)。從教學內容來看,國內圖書館數據信息素養(yǎng)教育主要圍繞數據的發(fā)現與獲取、數據庫和數據格式、數據處理和分析、數據倫理與歸因等幾項內容展開。教學目標主要圍繞以下四個基點展開:數據意識、查找數據能力、數據使用、道德及倫理。數據意識是指明確需要何種類型的數據以及需求的數量;數據能力是指通過哪種途徑找到需要的數據,及獲取過程中相關的技巧及方法;數據利用是指對于獲取到的數據進行評價,并合理的分析使用數據的能力及相關技巧;道德及倫理包括了解引用的相關規(guī)范和標準,樹立學術誠信的意識。在整體的教學活動中,對于有關研究人員數據管理與組織的能力關注度不夠,如數據管理與組織、數據質量和記錄、元數據和數據描述、實踐規(guī)范、數據監(jiān)管和重用、數據保存等相關技能。
從以上調研得出,目前國內圖書館開始進行數據素養(yǎng)的課程建設。其中清華大學圖書館、北京大學圖書館、武漢大學圖書館、上海交通大學圖書館建設得較好。不僅出現了融合傳統學分課程的數據素養(yǎng)教學,課程內容已經涉及了數據素養(yǎng)核心技能中的6個方面,尤其是對于數據可視化及數據監(jiān)管與重用方面能力的關注。但總體來說圖書館的數據素養(yǎng)教育活動仍舊處于初級階段,依然存在著教學對象零散、不固定、學科針對性弱、長期獨立的課程缺乏等問題,其中在課程內容構建上問題最為突出。圖1列出了我國圖書館數據素養(yǎng)課程內容的大體情況,從圖中我們可以看出目前圖書館數據素養(yǎng)課程內容構建上并不存在完整的課程內容,多數選擇與信息素養(yǎng)能力融合構建。對于單純的數據素養(yǎng)能力的教授,只簡單涉及了數據轉化與操作、數據處理與分析、數據可視化和表示及數據監(jiān)管與重用四個方面的內容,其余如數據管理與組織、元數據與數據描述等重要的數據素養(yǎng)技能基本無人問津。
5 我國高校圖書館數據素養(yǎng)課程內容構建
從現有的課程建設經驗來看,目前我國數據素養(yǎng)課程建設存在的最大問題就是課程內容的零散與短缺。故本文主要從數據素養(yǎng)課程內容構建出發(fā),在已總結的12項核心能力框架基礎上提出了全新的課程內容體系,以期為我國圖書館后期數據素養(yǎng)課程建設提供參考與借鑒。本文將數據管理作為課程內容構建的牽引與核心,初步將數據素養(yǎng)課程內容分為4大部分,將12項核心能力融入其中??傮w來看,4部分呈現了一個完整的數據獲取、利用、保存、共享的生命周期,不僅課程體系完整,也能與學生的學習與科研周期融合。四部分及其對應的數據素養(yǎng)核心能力如圖2所示。
圖1 我國圖書館數據素養(yǎng)課程構建
圖2 數據素養(yǎng)課程四部分內容及涉及的核心能力
5.1 數據發(fā)現與獲取
作為四部分的開端,首先要幫助學生明確數據管理的概念,可以借用本學科領域中具體的實際例子進行說明,以幫助學生理解課程并能積極主動地參與到課程中。其次,本部分主要是對信息的收集與獲取,因為學生之前已經接受過良好的信息素養(yǎng)培訓,具備發(fā)現與獲取數據的能力,所以此部分主要是在此基礎上完善這些能力。在e-science環(huán)境下,大量數據涌現出來,為學生及研究人員的數據獲取提出了新的挑戰(zhàn)。這就要特別注意提升數據的評估能力,以保證所獲取數據的質量,同時,還要注意對記錄數據收集過程能力培養(yǎng),收集內容還應包括所收集數據的格式。此方面能力的提升,一方面可以保證所收集數據時刻與原始數據保持聯系,另一方面也可以通過明確的數據格式,以完成各種格式之間的轉化與互操作,防止數據的丟失,學生可以通過創(chuàng)建數據清單與分析文檔的方式完成記錄過程。
5.2 數據管理
數據管理部分可以視為數據素養(yǎng)課程內容的核心環(huán)節(jié),起到了承上啟下的作用。在這部分中,更加關注系統標準化的數據管理計劃的制定,在形式上可能包括對于命名系統和目錄結構的合理使用,在內容上除了包括必要的研究成果記錄以外,還可能包括在研究過程中各個階段的補充數據進行收集和歸檔管理??傊M量保證數據集的系統完整標準化,才能讓數據內容被其他數據集轉化與操作,以減少轉化過程中的數據丟失與重復,最終達到重用與共享的目的。在整個數據管理計劃階段中,學生可以適當地借用一些工具幫助完成研究活動,如一些數據處理與分析工具和可視化的軟件等,工具的使用一方面可以幫助學生從浩如煙海的數據中直接探尋所需要的信息、知識,另一方面也能將數據的內容更加清晰的呈現。在數據管理部分中,對于本領域相關元數據的使用也是關鍵內容,熟練使用元數據對數據集進行描述與組織,是保證數據的質量及研究成果重現的關鍵手段。但元數據使用時要特別注意對元數據標準的恰當標注,以輔他人理解。
5.3 數據利用與所有權
數據的訪問與所有權問題,對于學生使用及分享數據至關重要,所以在這部分中課程的內容著重關注向學生介紹共享數據時面臨的一些知識產權和訪問問題,以及本學科領域的規(guī)范與標準的運用,幫助學生在使用與發(fā)布數據時,能夠更好地維護數據相關者的權益,同時也能通過對自身數據的恰當描述幫助用戶訪問到數據,使數據在合理合法的范圍內被廣泛使用。
5.4 數據的保存與共享
數據保存是學生日常學習及科研中經常發(fā)生的活動,學生對其非常了解。但隨著科研環(huán)境的變化,對于數據的保存不再僅僅是傳統意義上的定義,它更多強調的是通過合理的保存,已達到共享與重用的目的。所以在此部分的課程內容中將更多關注對于數據共享與重用的認識了解,明確其優(yōu)勢及價值,積極正確的將數據共享給他人。對此,除了要掌握規(guī)范的命名方式、共享的不同標準(如資助者數據共享策略、本學科的規(guī)范或標準等)、正確的結構化格式引用等具體做法以外還要能對自己使用的數據共享的方法進行解釋說明,以保證他人能夠了解及運用。在保存上能夠解釋數據的潛在使用價值,以明確數據的保存期限,并找到符合數據主題的存儲機構進行存檔。
6 結語
在新的研究范式下,數據將成為21世紀經濟與科學發(fā)展的助推劑,對于數據的管理組織、共享重用將成為新一代研究人員的必備能力。本文將圖書館作為主體,通過開展數據素養(yǎng)課程來提升學生及研究人員能力,以應對新時代的挑戰(zhàn)。在課程內容構建上僅僅圍繞新的環(huán)境與需求提出包含數據發(fā)現獲取、數據管理、數據訪問與所有權、數據保存四大部分,全面提升學生及研究人員的數據素養(yǎng)能力。但本文提出的課程內容體系,僅僅是數據素養(yǎng)教學一般規(guī)律的體現,各個高校還應該結合自己的特色,構建符合自身情況和學科特色的數據素養(yǎng)課程內容,才能真正提升學生在新時代背景下的數據素養(yǎng)能力。
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經“絕種”了