學(xué)術(shù)圖書(shū)館科研數據管理體系研究論文
[摘要]分析了數據生命周期理論與模型,研究了學(xué)術(shù)圖書(shū)館科研數據管理的主要內容,構建了基于數據生命周期模型的學(xué)術(shù)圖書(shū)館科研數據管理體系,提出了基于數據生命周期的學(xué)術(shù)圖書(shū)館科研數據服務(wù)保障機制。
[關(guān)鍵詞]數據生命周期模型;學(xué)術(shù)圖書(shū)館;科研數據;管理體系
隨著(zhù)移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展,數字化資源以驚人的速度不斷增長(cháng)。根據IDC發(fā)布的全球數據研究報告,預計到2020年全球數據總量將超過(guò)40ZB。E-Science時(shí)代海量科研數據的產(chǎn)生與應用,迫切需要相關(guān)學(xué)術(shù)機構結合其特點(diǎn),通過(guò)數據采集、組織、存檔和研究,建立完善的管理機制,保障這些科研數據的合理利用。學(xué)術(shù)圖書(shū)館作為研究型文獻管理機構,長(cháng)期以來(lái)一直通過(guò)管理文獻資源的方式輔助科研活動(dòng),在助力科研創(chuàng )新方面也扮演著(zhù)重要角色。數據生命周期是從數據生成、加工、發(fā)布到利用的循環(huán)過(guò)程,表現了基于科研全過(guò)程的數據管理[1]。面對E-Science背景下科研范式的發(fā)展,以及用戶(hù)對科研數據組織、存儲和利用的新需求,學(xué)術(shù)圖書(shū)館積極探索科研數據管理內容,建設基于數據生命周期的科研數據管理體系,發(fā)揮在數據增值服務(wù)方面的作用,有助于提升科研數據服務(wù)能力。
1數據生命周期理論與模型分析
1.1數據生命周期理論概述生命周期的概念最早被應用于生物領(lǐng)域,此后經(jīng)過(guò)不斷演化被應用于多個(gè)領(lǐng)域。國外學(xué)者通過(guò)研究數據信息的生命周期,探討了數據生命周期的內涵,指出它代表一種數據在特定環(huán)境下,經(jīng)過(guò)加工、存儲和管理,實(shí)現資源發(fā)掘和利用的過(guò)程。具體而言,數據生命周期就是對數字化資源進(jìn)行加工處理和長(cháng)期保存,并在科研項目、決策制定中實(shí)現再利用的活動(dòng)[2]。通過(guò)總結各流派的相關(guān)理論,可知科研活動(dòng)是數據生命周期的來(lái)源,而一個(gè)完整的數據生命周期涉及到生成、加工、知識抽取等多個(gè)層次。從內容層面分析,數據生命周期包括數據初加工、再加工和獲取附加值等環(huán)節,涉及到基于數據加工的一系列知識抽取活動(dòng)。1.2數據生命周期的作用由于科研周期與數據生命周期存在關(guān)聯(lián),因此通過(guò)宏觀(guān)分析數據生命周期,就可以大致了解科研過(guò)程中科研人員的數據需求。E-Science時(shí)代科學(xué)研究與基礎信息設施的發(fā)展,逐漸向數據密集型方向轉變,科研創(chuàng )新更加依賴(lài)對科研數據的再利用。如何幫助科研人員提高科研數據利用率,促進(jìn)科研數據的開(kāi)放共享,是學(xué)術(shù)機構關(guān)注的問(wèn)題[3]。然而對于科研數據的研究與管理,涉及到不同利益主體之間的協(xié)調作用,是一個(gè)長(cháng)期而復雜的系統。數據生命周期為科研數據管理提供了基本框架,可以發(fā)現科研數據演變階段研究者的需求,描述復雜的數據管理和流通過(guò)程,明確不同利益相關(guān)者的關(guān)系。此外,數據生命周期來(lái)源于科研周期,在研究數據生命周期的基礎上構建模型,也可以準確映射科研活動(dòng)全過(guò)程。1.3數據生命周期模型數據生命周期為不同利益相關(guān)者提供了價(jià)值評估工具,也為科研數據服務(wù)實(shí)踐提供了途徑。為方便分析和利用,澳大利亞、英國等研究機構結合實(shí)踐經(jīng)驗,構建了多個(gè)數據生命周期理論模型,如DDI3.0模型、I2S2模型、DataONE模型等。常用的數據生命周期模型大致分為矩陣狀、鏈狀、環(huán)狀3種,在應用場(chǎng)景和構成要素方面存在差異[4]。其中DDI3.0為鏈狀模型,不同環(huán)節呈一定的次序排列。I2S2矩陣模型屬于數據生命周期模型的子集,也是對鏈狀模型的深化。美國國家科學(xué)基金(NSF)為滿(mǎn)足科研開(kāi)發(fā)需求,闡釋數據存儲和管理實(shí)踐中彼此間的關(guān)系,提出了首尾相接的環(huán)狀DataONE模型,體現了數據生命周期的循環(huán)過(guò)程(如圖1)。
2學(xué)術(shù)圖書(shū)館科研數據管理的主要內容
科研數據包含了科研活動(dòng)過(guò)程中產(chǎn)生的所有能夠存儲的數字資源,以及能夠轉換為數字形式的數據,如遙感勘測數據、仿真數據等。學(xué)術(shù)圖書(shū)館開(kāi)展科研數據管理,不僅能夠避免科研數據丟失,實(shí)現科研數據的長(cháng)期存儲和共享,也是滿(mǎn)足科研人員動(dòng)態(tài)信息需求和促進(jìn)圖書(shū)館發(fā)展的必要措施。2.1基礎設施建設目前學(xué)術(shù)圖書(shū)館獨立構建數據倉儲進(jìn)行科研數據管理的案例并不多見(jiàn),一方面與圖書(shū)館在資金、技術(shù)方面存在不足有關(guān)[5]。另外,面對E-Science時(shí)代學(xué)術(shù)資源開(kāi)放、共享的趨勢,圖書(shū)館領(lǐng)域更加推崇協(xié)同合作,營(yíng)造科研數據管理的硬件環(huán)境,采取資源互補、技術(shù)共享的方式共同建設機構倉儲。學(xué)術(shù)圖書(shū)館也可以與科研項目機構合作,借助外部設備和項目的支持,構建滿(mǎn)足不同學(xué)科需求的數據倉儲,使科研數據管理跨越單個(gè)機構的限制,幫助科研人員獲取更多有用資源。例如,澳洲國立大學(xué)圖書(shū)館與其他院校、機構知識庫合作,共同搭建科研數據管理的硬件環(huán)境,可以為大量科研項目提供數據存儲服務(wù)。2.2科研數據集成服務(wù)科研數據產(chǎn)生于數據生命周期的任意階段,與科研活動(dòng)、科學(xué)文獻等都存在關(guān)聯(lián),只有通過(guò)關(guān)聯(lián)分析發(fā)現內在規律,才能獲取更多有價(jià)值的信息。學(xué)術(shù)圖書(shū)館是科學(xué)文獻存儲中心,在數據集成方面具有豐富的經(jīng)驗。隨著(zhù)數字化技術(shù)的應用,很多學(xué)術(shù)圖書(shū)館已經(jīng)可以利用智能化工具,為科研人員提供數據關(guān)聯(lián)組織和個(gè)性化推薦服務(wù)?蒲袛祿鳛榫哂袠O大應用價(jià)值的信息,必然要求圖書(shū)館通過(guò)科研數據關(guān)聯(lián)集成,將某一類(lèi)型或某一領(lǐng)域的數據集和科學(xué)文獻結合起來(lái),幫助科研人員發(fā)現不同數據的潛在聯(lián)系,進(jìn)一步利用好各類(lèi)資源。此外,圖書(shū)館利用數據挖掘技術(shù)處理科學(xué)文獻,如學(xué)術(shù)專(zhuān)著(zhù)、會(huì )議紀要、發(fā)明專(zhuān)利等,以數據生命周期模型為紐帶,將原始數據與再生數據關(guān)聯(lián)起來(lái),實(shí)現多學(xué)科資源的匯聚,也方便科研人員迅速獲取有價(jià)值信息。2.3科研數據存儲服務(wù)在開(kāi)放獲取運動(dòng)的推動(dòng)下,很多國家對于信息機構的科研數據都要求開(kāi)放共享[6]。在這樣的背景下,學(xué)術(shù)圖書(shū)館作為長(cháng)期提供科研數據服務(wù)的場(chǎng)所,自然要求順應開(kāi)放獲取的發(fā)展趨勢。在西方一些發(fā)達國家,很多學(xué)術(shù)圖書(shū)館正在嘗試開(kāi)展科研數據開(kāi)放存儲服務(wù),而科研人員也樂(lè )于借助圖書(shū)館存儲科研信息或成果。在科研數據存檔方面,學(xué)術(shù)圖書(shū)館構建專(zhuān)門(mén)的機構知識庫,通過(guò)IR拓展的方式為科研數據管理提供支持,也可以建設科研數據檔案庫,引進(jìn)專(zhuān)門(mén)的軟硬件設施開(kāi)展科研數據服務(wù)。由于E-Science背景下科研人員的數據管理需求日益增長(cháng),學(xué)術(shù)圖書(shū)館必須盡快拓展科研數據存儲空間,并且通過(guò)尋求政府部門(mén)、基金會(huì )的支持,以解決新增業(yè)務(wù)帶來(lái)的成本增加等問(wèn)題。
3基于數據生命周期模型的學(xué)術(shù)圖書(shū)館科研數據管理體系構建
學(xué)術(shù)圖書(shū)館科研數據管理涉及多個(gè)環(huán)節和利益主體,具有動(dòng)態(tài)性和復雜性特征。筆者在分析國內外科研數據管理成果與掌握科研人員數據管理需求的基礎上,將人力資源、技術(shù)平臺、服務(wù)內容作為重點(diǎn),構建了基于數據生命周期模型的科研數據管理體系(見(jiàn)圖2)。3.1調研科研數據管理需求縱觀(guān)國內外圖書(shū)館科研數據管理體系的設計,均是建立在充分調研圖書(shū)館用戶(hù)科研數據管理需求的基礎上的。學(xué)術(shù)圖書(shū)館掌握科研人員的實(shí)際需求,是設計科研數據管理體系的出發(fā)點(diǎn),也是完善科研數據管理流程、保障科研數據管理效果的基礎。一方面,學(xué)術(shù)圖書(shū)館可以采用問(wèn)卷調查的形式,了解科研人員如何開(kāi)展數據存儲、備份,是否存在成熟的元數據等。問(wèn)卷調查適用于規模較大的需求分析,在調研準備階段需要做好宣傳工作,對問(wèn)卷的設計注重問(wèn)題的`選擇和答題時(shí)間控制,避免相同性質(zhì)的問(wèn)題重復出現,并做好問(wèn)卷整理、統計工作。另一方面,學(xué)術(shù)圖書(shū)館也可以采用直接訪(fǎng)談的方式,了解科研人員對科研數據管理的認識,并通過(guò)小組討論的形式分析科研數據管理的需求動(dòng)向。3.2建設完善的技術(shù)平臺技術(shù)平臺包括與科研數據管理相關(guān)的一系列軟硬件系統、存儲設備和服務(wù)器等,為學(xué)術(shù)圖書(shū)館開(kāi)展科研數據管理活動(dòng)提供了保障[7]。技術(shù)平臺的構建可以采取學(xué)術(shù)圖書(shū)館與其他機構共建的方式,如檔案館、科研單位等,發(fā)揮各自?xún)?yōu)勢,協(xié)作搜集與科研數據管理相關(guān)的工具、設備,整合不同類(lèi)型的數據資源,如資源鏈接、元數據標準等,解決整個(gè)數據生命周期中存在的技術(shù)難題,保障技術(shù)平臺的完整性、可靠性。例如,伊利諾伊大學(xué)與校外云服務(wù)公司共同構建科研數據存儲庫,可為科研人員提供數據保存服務(wù)。
共2頁(yè): 上一頁(yè)12下一頁(yè)
摘 要:學(xué)術(shù)圖書(shū)館也可以結合自身優(yōu)勢與發(fā)展需求,明確數據管理政策機制,自行購買(mǎi)或引進(jìn)專(zhuān)業(yè)化工具設備,解決數據信息安全控制問(wèn)題,通過(guò)網(wǎng)頁(yè)鏈接、社交平臺等整合資源,建設滿(mǎn)足科研人員需求的技術(shù)平臺。3.3人員配置與服
關(guān)鍵詞:圖書(shū)館學(xué)術(shù)論文
學(xué)術(shù)圖書(shū)館也可以結合自身優(yōu)勢與發(fā)展需求,明確數據管理政策機制,自行購買(mǎi)或引進(jìn)專(zhuān)業(yè)化工具設備,解決數據信息安全控制問(wèn)題,通過(guò)網(wǎng)頁(yè)鏈接、社交平臺等整合資源,建設滿(mǎn)足科研人員需求的技術(shù)平臺。3.3人員配置與服務(wù)內容學(xué)術(shù)圖書(shū)館人力資源的合理配置,通過(guò)設立專(zhuān)門(mén)的科研數據管理團隊,保障科研數據服務(wù)順利開(kāi)展。具體實(shí)踐中可以采取對外招聘的方式,吸引專(zhuān)業(yè)人才參與科研數據管理工作,也可以通過(guò)內部培訓的方式提高圖書(shū)館員的科研數據管理技能,彌補在科研數據管理方面的缺陷。同時(shí)要求圖書(shū)館員結合數據生命周期制定科研數據管理計劃,提供與科研數據管理密切相關(guān)的設施、工具和服務(wù)內容,具體包括數據引用、數據出版、數據加工等。開(kāi)展科研數據服務(wù)的方式包括參考咨詢(xún)、在線(xiàn)交流、教育培訓等,并要求服務(wù)人員做好數據備份和數據加密工作,避免出現知識版權糾紛,提升數據使用安全性。
4基于數據生命周期的學(xué)術(shù)圖書(shū)館科研數據服務(wù)保障機制
學(xué)術(shù)圖書(shū)館是科學(xué)研究與教學(xué)資源的聚集地,具備提供、存儲信息資源和促進(jìn)資源共享的職能。在充分利用科研數據收集、管理的相關(guān)成果提供服務(wù)的同時(shí),也應依據數據生命周期構建相應的保障機制,為科研數據管理與服務(wù)提供支撐。4.1規范數據管理政策學(xué)術(shù)圖書(shū)館作為科研數據管理服務(wù)機構,需要注重協(xié)調多方利益,明確不同主體的權責,并制定科學(xué)的數據管理規范,保障科研數據管理效率。在科研數據服務(wù)實(shí)踐中,圖書(shū)館應結合數據生命周期模型探索合適的數據管理政策,如開(kāi)放獲取政策、科研數據使用流程等,為科研數據管理工作提供依據,并規范研究人員的數據利用行為。謝菲爾德大學(xué)圖書(shū)館為促進(jìn)科研數據共享,發(fā)布了關(guān)于科研數據開(kāi)放獲取的政策,開(kāi)展了數據管理咨詢(xún)、數據管理培訓等服務(wù)。學(xué)術(shù)圖書(shū)館要想實(shí)現科研數據共享,需要結合不同類(lèi)型科研數據的特點(diǎn),采取學(xué)術(shù)交流、主題講座等方式,分析科研數據的開(kāi)放獲取條件,探索如何解決科研數據的存儲、再利用問(wèn)題,以及如何提升科研人員的共享意識等。4.2引入數據處理系統學(xué)術(shù)圖書(shū)館引入數據處理系統對原始科研數據進(jìn)行加工處理,實(shí)現數據價(jià)值擴展,是保障科研數據服務(wù)效果的必要方式。數據密集型科研活動(dòng)的完整生命周期包括數據采集、組織、管理、分析等環(huán)節,而科研數據管理涵蓋元數據構建、數據映射、語(yǔ)義描述等活動(dòng)。因此,對科研數據的加工處理,首先需要借助專(zhuān)業(yè)數據分析軟件研究外部數據集,為數據挖掘和語(yǔ)義描述奠定基礎,然后對原始數據進(jìn)行初加工與深加工。其中數據初加工的目的,就在于實(shí)現采集數據向長(cháng)期存儲與利用的過(guò)渡,再加工的目的在于研究外部數據集與已有數據的關(guān)系,通過(guò)添加語(yǔ)義注釋、數據融合等方式,實(shí)現數據補充和優(yōu)化,保障數據的完整性和可操作性。數據挖掘是科研數據管理和服務(wù)的基礎,未來(lái)學(xué)術(shù)圖書(shū)館在科研數據管理方面將引進(jìn)更多智能化工具,融合數據關(guān)聯(lián)分析更好地提升服務(wù)效率。4.3開(kāi)展科研數據素養教育開(kāi)展數據素養教育是推廣科研數據服務(wù)的基礎,學(xué)術(shù)圖書(shū)館應從科研生命周期出發(fā),聯(lián)合不同信息機構和組織,以圖書(shū)館為主導形成跨機構協(xié)同機制,共同開(kāi)展科研數據素養教育工作。例如,康奈爾大學(xué)圖書(shū)館通過(guò)多方合作,協(xié)同創(chuàng )建與實(shí)施數據管理計劃,并能夠提供數據生命周期任意階段的數據管理服務(wù)。同時(shí)學(xué)術(shù)圖書(shū)館應聯(lián)合科研機構、高校、信息化中心等,共同建設科研數據素養教育平臺,設計完善的功能模塊,推出優(yōu)質(zhì)科研數據教育資源,保障圖書(shū)館用戶(hù)獲取數據的高效、準確性。在科研數據素養教育課程設計方面,可以聘請專(zhuān)業(yè)教師參與平臺整體規劃,實(shí)現專(zhuān)業(yè)課程教學(xué)與科研數據素養教育融合,全面提升圖書(shū)館用戶(hù)的數據意識。
5結語(yǔ)
當前學(xué)術(shù)交流模式的變革和大數據的廣泛應用,使科學(xué)研究活動(dòng)呈現數據密集化的趨勢。隨著(zhù)國外圖書(shū)館相繼制定科研數據管理規范和共享政策,更是掀起世界范圍內科研數據研究的浪潮。學(xué)術(shù)圖書(shū)館作為科研項目的支持機構,應積極承擔科研數據管理任務(wù),構建支持數據驅動(dòng)的技術(shù)平臺,是應對全新科研環(huán)境的必然選擇。
參考文獻:
[1]劉桂鋒,盧章平,阮煉.美國高校圖書(shū)館研究數據管理服務(wù)內容研究[J].圖書(shū)館論壇,2015(8):137-144.
[2]徐坤,曹錦丹.高校圖書(shū)館參與科學(xué)數據管理研究[J].圖書(shū)館論壇,2014(5):92-98.
[3]陳麗君.約翰霍普金斯大學(xué)科學(xué)數據管理服務(wù)實(shí)踐與啟示[J].現代情報,2016(4):110-114.
[4]王秀華.澳大利亞國立大學(xué)圖書(shū)館數據管理服務(wù)及啟示[J].河南圖書(shū)館學(xué)刊,2015(4):95-98.
[5]武琳,林明春.牛津大學(xué)科學(xué)數據管理經(jīng)驗與啟示[J].圖書(shū)館學(xué)研究,2015(24):48-53.
[6]黃如花,賴(lài)彤.利益相關(guān)者視角下圖書(shū)館參與科學(xué)數據管理的分析[J].圖書(shū)情報工作,2016(3):21-25.
[7]熊文龍,李瑞婻.基于科學(xué)數據管理的圖書(shū)館數據服務(wù)研究[J].圖書(shū)情報工作,2014(22):48-53.
【學(xué)術(shù)圖書(shū)館科研數據管理體系研究論文】相關(guān)文章:
有關(guān)科研誠信的學(xué)術(shù)論文05-19
基于數據挖掘的數字圖書(shū)館檢索技術(shù)研究論文04-16
科技學(xué)科研究論文03-30
地鐵節能管理體系的研究論文06-29
施工庫存管理體系研究論文10-23