優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

用無參數(shù)指標Bcp識別睡美人文獻及其作者動態(tài)h指數(shù)變化規(guī)律

作者:李賀/解夢凡/袁翠敏/余璐來源:《中國圖書館學(xué)報》日期:2020-04-11人氣:1249

“睡美人”文獻是指論文發(fā)表之初未受到學(xué)術(shù)界廣泛關(guān)注或被抵制,一直處于低被引或零被引的狀況,之后由于各種原因被“王子”文獻喚醒,繼而被引頻次出現(xiàn)激增的文獻[1]。這些文獻之所以低被引或零被引,通常是因為其內(nèi)容具有變革性或超前性,遭到學(xué)術(shù)界和社會的忽略或抵制,形成了延遲承認的現(xiàn)象[2]。通常這些睡美人文獻大都代表著領(lǐng)域重大科學(xué)發(fā)現(xiàn)或轉(zhuǎn)折,因此研究睡美人文獻對促進學(xué)科發(fā)展具有重要意義。睡美人文獻由文獻內(nèi)容和作者兩部分構(gòu)成,本文通過代表作者影響力的h指數(shù)這一指標,研究睡美人文獻作者,發(fā)現(xiàn)睡美人文獻作者的動態(tài)h指數(shù)的變化規(guī)律及h指數(shù)特征,為睡美人作者的特征識別提供線索。

1 文獻綜述

1.1 睡美人文獻識別方法

20世紀六七十年代,學(xué)者開始通過引文曲線關(guān)注低被引或零被引文獻以及延遲承認現(xiàn)象[3]。早期對睡美人文獻的識別方法集中于曲線擬合[4],將論文引文曲線與數(shù)學(xué)公式或具體曲線類型進行擬合,人為觀察曲線走勢[5]。中期大多數(shù)學(xué)者利用人為參數(shù)指標界定睡美人文獻。Garfield通過對前期平均每年被引次數(shù)接近1且低被引時間大于5年的方法識別了5篇典型睡美人文獻[6]。2004年,荷蘭科學(xué)計量學(xué)者Raan提出了更加被普遍使用的識別標準,分別從睡眠深度、睡眠時長、喚醒強度三方面進行設(shè)定,睡眠時長一般大于等于5年,在文獻睡眠期間,睡眠深度即平均每年被引頻次介于0~2次之間,喚醒強度即被喚醒的前4年累計被引頻次一般應(yīng)大于20次[1]。后來學(xué)者們又利用平均值標準和四分位數(shù)標準限定睡美人文獻[7],也有將以上多種標準結(jié)合使用的方法[8]?;谶@些評判標準,李江和葉鷹兩位學(xué)者還提出了四條評判原則,即綜合考慮全部引文歷史,相同引文總量不同積累過程的文章應(yīng)弱化前期累積引文量的影響,睡美人的喚醒時間不應(yīng)隨時間而變化,以及避免睡眠期間或覺醒強度的任意閾值[9]。

近年來識別睡美人文獻多使用無參數(shù)指標,即綜合考慮文獻的相關(guān)引文數(shù)據(jù)來判定睡美人文獻。2013年Wang提出被引速率,即文獻被引頻次的累計增加速率[10];2015年Ke等人提出“美麗指數(shù)(B指數(shù))”以衡量睡美人文獻的“美麗程度”,即描述睡美人文獻三個相關(guān)參數(shù)的表現(xiàn)程度[11];2017年杜建提出Bcp指數(shù),以“年度被引次數(shù)累計百分比”重新計算睡眠深度、喚醒時間和喚醒強度[12];2018年葉鷹和Bornmann以及國內(nèi)學(xué)者張家榕等引入“引文角”概念測度睡美人文獻[13-4]。目前較為前沿的研究是將機器學(xué)習方法引入到睡美人文獻的識別中。2017年Dey等人利用機器學(xué)習的分類器方法,使用由文獻作者、出版地點、關(guān)鍵詞和每篇論文的引用情況等元數(shù)據(jù)所組成的特征集,識別計算機科學(xué)領(lǐng)域的睡美人文獻并總結(jié)其沉睡因素[15]。同年Ho等人利用心理學(xué)計算機檢索新方法從30多萬篇心理學(xué)文章中識別出三篇典型睡美人文獻及其王子文獻,分析心理學(xué)中睡美人文獻的細節(jié)特征[16-17]。

上述方法中,曲線擬合法由人為觀察決定,結(jié)果偏主觀,參數(shù)標準對識別睡美人文獻的沉睡期要求苛刻,相比于無參數(shù)標準公式計算的識別結(jié)果,沉睡期年均被引次數(shù)大于2次但也是低被引的文獻可能會被忽略。綜合考慮所有識別方法的優(yōu)劣特征,本文采用Bcp指數(shù)法計算Science、Nature和PNAS期刊中高被引文獻的“美麗程度”,并結(jié)合Bcp指數(shù)識別標準,依據(jù)計算結(jié)果識別出睡美人文獻,構(gòu)建睡美人文獻樣本,作為文獻特征研究的基礎(chǔ)。

本文旨在通過研究睡美人文獻的特征來完成后續(xù)的預(yù)測工作。但現(xiàn)有的對睡美人文獻的預(yù)測研究仍處在探索階段,集中于開發(fā)預(yù)測模型。潛在的睡美人文獻,現(xiàn)階段處于低被引狀態(tài),除了同行評議外,無法與普通低被引文獻區(qū)分開;但同行評議仍面臨多重問題,如工作量較大,或存在變革性、創(chuàng)造性的新思想和新發(fā)現(xiàn)繼續(xù)被抵制的可能性。因此,本文提出從文獻的創(chuàng)造者——即作者的角度出發(fā),研究發(fā)現(xiàn)睡美人文獻作者具有的共同特征,利用特征指標,識別現(xiàn)有低被引文獻的作者,進而實現(xiàn)對睡美人文獻的預(yù)測和挖掘。

1.2 動態(tài)h指數(shù)

h指數(shù)是2005年被美國加州大學(xué)圣地亞哥分校物理系Hirsch教授提出[18],作為評估科研人員成果與作者影響力的主要評價指標之一,其綜合考量學(xué)術(shù)產(chǎn)出數(shù)量與學(xué)術(shù)產(chǎn)出水平,客觀反映作者在某領(lǐng)域的被認可程度。h指數(shù)是指某一學(xué)者在一定期間內(nèi)所發(fā)表的論文至少有h篇的被引頻次不低于h次。關(guān)于h指數(shù)的改進也存在大量研究,但其計算相對復(fù)雜,且并未得到廣泛運用,因此本文仍以h指數(shù)作為作者影響力的評價指標。多數(shù)學(xué)者對h指數(shù)的研究更多地關(guān)注當時h指數(shù)的意義,忽略了h指數(shù)的時間動態(tài)變化趨勢。只有少數(shù)學(xué)者對動態(tài)指數(shù)有進一步研究。Rousseau和Ye利用R指數(shù)與有理數(shù)h指數(shù)基于連續(xù)時間變量的導(dǎo)函數(shù)的乘積定義了動態(tài)h指數(shù)[19];Egghe基于引文老化速率和Lotka指數(shù)提出了h指數(shù)的時間函數(shù)模型[20];張曉陽以分子生物學(xué)與遺傳學(xué)的14位高被引科學(xué)家為例,發(fā)現(xiàn)高被引科學(xué)家的h指數(shù)的線性成長規(guī)律,以及學(xué)術(shù)生涯結(jié)束后h指數(shù)的對數(shù)成長特征[21]。呂娜通過ESI平臺選定物理學(xué)領(lǐng)域篇均被引次數(shù)排名前5位的作者為研究對象,總結(jié)出3種h指數(shù)成長曲線類型[22],并提出作者貢獻程度與作者影響力即h指數(shù)的關(guān)系[23]。張琳等分別對國內(nèi)外8位高被引作者進行h指數(shù)趨勢監(jiān)測,指出團隊合作者之間h指數(shù)的相對變化規(guī)律[24]。

在睡美人文獻領(lǐng)域研究動態(tài)h指數(shù)還鮮有人涉及,本文從該角度探討睡美人文獻在作者影響力方面的特征及變化趨勢,深入了解睡美人文獻及其作者的內(nèi)在性質(zhì),有利于后期對睡美人文獻的甄別。

2 數(shù)據(jù)來源與研究方法

2.1 數(shù)據(jù)來源

睡美人文獻研究對象的前提是高被引文獻。本文挑選了Nature,Science,PNAS(Proceedings of the National Academy of Sciences of the United States of America)三大名刊,囊括了自然科學(xué)和社會科學(xué)兩大領(lǐng)域,研究主題覆蓋全面,同時杜建的博士論文對相關(guān)研究的統(tǒng)計結(jié)果也稱上述三本期刊是產(chǎn)出睡美人文獻最多的期刊[2]。本文通過Web of Science(WoS)平臺數(shù)據(jù)庫,以Science、Nature和PNAS雜志自1960年以來發(fā)表的論文的年度被引頻次為基礎(chǔ)數(shù)據(jù),文獻被引頻次下載日期為2018年3月5日,發(fā)表文獻數(shù)據(jù)統(tǒng)計截至2007年12月31日。為觀察文獻的年被引頻次變化趨勢,本文以10年為例,保證每篇文獻至少有10年的引文窗,由于2018年被引頻次數(shù)據(jù)不完整,因此將檢索時間條件設(shè)定為1960—2007年。檢索式為SO=(science OR nature OR PNAS),共得到有效統(tǒng)計數(shù)據(jù)270 639萬條。上述三本期刊的5年影響因子分別為38.062、43.769和10.414,取平均值30.748,即平均每年每篇文獻被引30.748次。以10年引文窗為例,取總被引頻次大于307次的文獻作為高被引文獻,共計23 414條,構(gòu)成本文的研究文獻列表。該文獻列表可使用WoS平臺提供的“創(chuàng)建引文報告”功能及下載功能,獲得每篇文獻自發(fā)表年起至檢索日期的歷年被引頻次,構(gòu)成本文的文獻引用數(shù)據(jù)庫。

計算h指數(shù)所需要的作者歷年的引用數(shù)據(jù)仍通過Web of Science平臺收集。在收集某一作者的文獻成果時,為了排除重名作者的文章,特添加“所屬機構(gòu)”限定,但由于該作者在學(xué)術(shù)生涯期間有可能更換工作單位,因此還要參考作者的研究方向,同時也可以通過文獻的其他合作者協(xié)同確定,因為他們的合作次數(shù)可能不止一次。綜上,本文采用“姓名+所屬機構(gòu)+研究方向+期刊領(lǐng)域”的檢索策略限定作者的查準率,為確保囊括作者所有成果,檢索時間設(shè)定為“所有年份”。利用WoS平臺提供的“創(chuàng)建引文報告”功能獲得作者的每篇文獻的歷年引文數(shù)據(jù),數(shù)據(jù)收集自該作者首篇文獻的發(fā)表年起。相較于前人的動態(tài)h指數(shù)研究,本文收集了更大規(guī)模的數(shù)據(jù),選取睡美人文獻數(shù)據(jù)庫中Bcp指數(shù)大于10的77篇文獻的129位作者,進行數(shù)據(jù)統(tǒng)計和分析,結(jié)果更具普適性。

2.2 研究方法

2.2.1 睡美人文獻識別及喚醒計算

本文通過對相關(guān)識別方法優(yōu)劣的對比分析,選取較為完善的無參數(shù)指標Bcp指數(shù)對數(shù)據(jù)進行睡美人文獻識別,用“年度被引次數(shù)累計百分比”重新計算睡眠深度、喚醒時間和喚醒強度。計算公式如下:

論文發(fā)表當年被引次數(shù)為,年度被引頻次累計百分比p∈[0,1],為文獻累計百分比達到最高點時的年齡,即該文獻的總生命周期,l為點縱坐標和點縱坐標的連線;任意t<,為年齡t的累積被引頻次百分比,為年齡t對應(yīng)連線上的點,對()求和,即為Bcp指數(shù)值。

借鑒B指數(shù)和Bcp指數(shù)對喚醒期的計算原理,累計被引百分比曲線各點向曲線起點與終點的連線即l作垂線,取使得垂線距離最大時的年齡t對應(yīng)的年份作為被喚醒年,對公式稍做修正,得到公式如下:t∈[0,],

2.2.2 無參數(shù)指標Bcp識別標準

現(xiàn)有的無參數(shù)指標均以計算指數(shù)大小為主要目的,比較指數(shù)之間的相對有效性,而指數(shù)的數(shù)值只能衡量睡美人的“美麗程度”,并不能給出確切的標準界定是否為睡美人文獻。因此若想使用無參數(shù)指標識別出睡美人文獻,對睡美人文獻進行總體分析,需要具體的閾值來劃定睡美人文獻的Bcp指數(shù)范圍。

本文結(jié)合參數(shù)指標和無參數(shù)指標設(shè)定關(guān)于Bcp指數(shù)的睡美人文獻識別標準,即按照普遍認可的Raan提出的參數(shù)標準,利用Bcp指數(shù)計算公式,計算得到滿足睡美人文獻定義的文獻Bcp指數(shù)閾值,即睡美人文獻的識別標準。假設(shè)有兩篇文獻恰好符合Raan提出的參數(shù)標準的上限和下限,設(shè)定沉睡期取最小值5年;沉睡期每年被引頻次為1~2次,分別取兩個數(shù)組{1,1,1,1,1}和{2,2,2,2,2}進行計算并求平均值;前4年累積被引頻次大于等于20次,則取前4年共20次,平均以每年5次累加,構(gòu)成年被引頻次矩陣兩篇文獻9年內(nèi)的總被引頻次為年被引頻次累加比例矩陣為,文獻年齡取整數(shù)t∈[0,8],為8。根據(jù)Bcp計算公式,得到Bcp指數(shù)向量(3.68 3.799 85),選定其平均值Bcp=3.739 925為最低“睡美人”文獻標準。

該標準兼顧無參數(shù)指標的高查全率和客觀性優(yōu)勢,避免參數(shù)指標對于沉睡期的嚴苛性和主觀性偏差,同時給出了使用無參數(shù)指標的判定標準,由于現(xiàn)有相關(guān)研究成果匱乏,此標準的理論依據(jù)較為薄弱,仍需進一步實踐驗證。

2.2.3 動態(tài)h指數(shù)

h指數(shù)會隨文章發(fā)表量和被引頻次的增長時刻發(fā)生變化,因此本文將動態(tài)h指數(shù)應(yīng)用于睡美人文獻的作者特征研究。而h指數(shù)及相關(guān)改進指數(shù)均以當前時間點定義計算方法,若想獲取歷年h指數(shù)需尊重h指數(shù)的原始定義,按照初始計算方法,以文獻篇數(shù)為單位,取h指數(shù)為整數(shù),而非連續(xù)有理數(shù),人工收集文獻歷年的總被引頻次,并逐年累加,得到截至每年年底的累計被引頻次,再對截至每年年底已發(fā)文獻按照被引頻次排序,進而可得到睡美人文獻作者的歷年h指數(shù)。

動態(tài)h指數(shù)計算方法如下:①檢索某一作者發(fā)表的所有文獻集合;②對于D集合中文獻(i=1…n),逐篇提取出版年并檢索形成其引證文獻集合;③對于C集合中的文獻(j=1…n),逐篇統(tǒng)計其出版年;④對于某一時間節(jié)點T,可以計算出該時間節(jié)點作者發(fā)表的文獻集合,從C集合中找出中每篇文獻的引證文獻并提取時間節(jié)點T之前的引證文獻集合及引證文獻數(shù)量;⑤將步驟④中集合中的文獻按照引證文獻數(shù)量由高到低進行排序,根據(jù)傳統(tǒng)h指數(shù)計算方式即可獲得該時間節(jié)點作者的h指數(shù)[22]。

由此,本文通過觀察睡美人文獻發(fā)表年的作者h指數(shù)值的共同特征、發(fā)表年到喚醒年間h指數(shù)的走勢、喚醒年h指數(shù)的變化,以及合作者之間的h指數(shù)比較與相互影響,歸納總結(jié)睡美人文獻作者的內(nèi)在特征與成長規(guī)律。

3 結(jié)果與討論

3.1 基于Bcp標準的睡美人文獻識別

以所收集的期刊高被引文獻為數(shù)據(jù)基礎(chǔ),利用Bcp指數(shù)的計算方法,將Bcp指數(shù)結(jié)果由大到小排序,結(jié)合無參數(shù)指標Bcp識別標準,進行最終的睡美人文獻識別。

通過計算,共有558篇滿足睡美人文獻標準,占總篇數(shù)的2.38%,而李江等人于2014年發(fā)表的A study of the “heartbeat spectra” for “sleeping beauties”一文中利用Van Raan的參數(shù)標準識別得到的比例為1.29%[25],由于文獻來源的不同、時間范圍的擴大以及Bcp指數(shù)對曲線整體趨勢的兼顧等多個因素,相比之下本文增多1%,也在一定程度上驗證了本文構(gòu)建的識別標準具有一定的科學(xué)性和可行性。本文計算得到的睡美人文獻比例與定義高被引文獻所采用的前1%的標準相比,是其2倍之多,可表明睡美人文獻不在少數(shù)。本文只對1960~2007年被認可的睡美人文獻進行統(tǒng)計分析,仍有大量正在沉睡的睡美人文獻等待“王子”的出現(xiàn),發(fā)揮其價值,推動社會發(fā)展和科技進步。因此,加強對睡美人文獻沉睡原因和喚醒機制的研究,對預(yù)測睡美人文獻、提前人為尋找“王子”來喚醒的“睡美人”,具有重要意義。

本文摘取Bcp指數(shù)大于10的77篇睡美人文獻在此展示,并構(gòu)成最終研究睡美人文獻作者的樣本數(shù)據(jù)庫,以備后續(xù)h指數(shù)研究使用。文獻結(jié)果數(shù)據(jù)見表1。

本文所識別的558篇睡美人文獻樣本涉及學(xué)科領(lǐng)域主要有醫(yī)學(xué)、生物科學(xué)、化學(xué)、物理學(xué)、心理學(xué)和海洋科學(xué)等[26],分布領(lǐng)域廣泛,其所蘊含的學(xué)術(shù)價值也不可估量。文獻作者的所屬機構(gòu)大多為美國、英國和加拿大等發(fā)達國家,其中美國以絕對優(yōu)勢領(lǐng)先于其他國家。其中Bcp指數(shù)最高的文章是來自Science雜志的美國學(xué)者Schoenfeld發(fā)表的Lysergic acid diethylamide-and mescaline-induced attenuation of the effect of punishment in the rat,Bcp指數(shù)為18.237。在1976年發(fā)表后的4至6年間,有兩次年被引頻次分別達到3和5(不排除自引的情況),從此之后沉睡深度一直保持在0~2之間,說明當時有很少數(shù)人關(guān)注過此研究,并未被廣泛傳播和認可,隨后進入深度睡眠時期,沉睡期長達40年之久,直到2016年才被喚醒,年度被引頻次達到118次,2017年被引頻次更是高達753次,說明在近兩年內(nèi)其成果才開始在學(xué)術(shù)界擴散且勢頭迅猛,得到廣泛認可,為生物學(xué)領(lǐng)域帶來革命性的轉(zhuǎn)折。

為了奠定所識別的睡美人文獻時間分布規(guī)律的研究基礎(chǔ),本文先通過圖1對睡美人文獻的總體時間分布進行描述。從期刊方面觀察,Science在1995年前為三本期刊中睡美人文獻出現(xiàn)概率最高的期刊,但其分化明顯,在1995年后鮮少再有睡美人文獻出現(xiàn)的高峰;Nature前25年緊隨Science之后,一直處于較高水平,僅在1986~1996的10年間表現(xiàn)平平,但在1996年后反增趨勢明顯,領(lǐng)先其他期刊2~3倍,整體上Nature與年度綜合的趨勢相吻合,也側(cè)面反映了Nature在其中的帶頭作用;PNAS的睡美人文獻數(shù)量相比前兩者一直處于起伏不定的低水平狀態(tài),對整體趨勢影響甚小。三者比較,不同期刊睡美人文獻出現(xiàn)頻率的高低可能與期刊影響因子存在正相關(guān)性[27]。從折線總體趨勢觀察,睡美人文獻的出現(xiàn)總體分布在1964~1984的20年間,其中有三個明顯的高峰期,第一個是1965年前后,增長和消減的速度都很快,均為一年內(nèi)變化,三本期刊分別出現(xiàn)了各自的波峰,與年度綜合曲線走勢相同;1970年為第二高峰,該波峰增長幅度略大于第一個高峰期,且持續(xù)時間較長,可達3~5年;第三個高峰為1977年,也是增長最強勢的一個,達到所有檢索時間的最高點,但也很快下降,緊接著1980年和1982年又反彈出現(xiàn)小波峰,隨后睡美人文獻的出現(xiàn)一直處于較低水平,相對前期而言僅有些許起伏。

圖1 期刊睡美人文獻時間分布圖

睡美人文獻出現(xiàn)的原因與社會發(fā)展的進程有關(guān)。第二次世界大戰(zhàn)結(jié)束后,發(fā)達國家經(jīng)過數(shù)年的休整,社會環(huán)境安定平穩(wěn),而各國為了恢復(fù)國力,開始迫切追求科技和經(jīng)濟的發(fā)展,加大對科技和經(jīng)濟的投入,在18世紀以來工業(yè)革命和電力革命的基礎(chǔ)之上,信息需求成了人類征服自然最迫切需要解決的問題[28],因此世界各國紛紛開始了第三次科技革命,這是一場信息控制技術(shù)的革命。主要以原子能、電子計算機、空間技術(shù)和生物工程的發(fā)明和應(yīng)用為標志,涉及信息技術(shù)、新能源技術(shù)、新材料技術(shù)、生物技術(shù)、空間技術(shù)和海洋技術(shù)等諸多領(lǐng)域,與睡美人文獻涉及的領(lǐng)域相吻合。20世紀中葉,尤其是1965~1975年,以重組DNA實驗的成功為標志,進入第三次科技革命的第三個10年,生物技術(shù)快速發(fā)展,人類開始控制遺傳和生命過程[28],思想先進的學(xué)者發(fā)表了一些比較前沿但不被認可的研究,也就是后來學(xué)術(shù)界所定義的睡美人文獻。之后隨著第三次科技革命成果的逐漸顯現(xiàn),各領(lǐng)域科技水平的提高和信息的爆炸式增長,人們對信息的使用需求和儲存技術(shù)的提升,使得文獻的曝光量增加[29],睡美人文獻逐漸被喚醒。

1990年后睡美人文獻相對前三個高峰期有所減少,對此Raan和Winnink給出了解釋:因科技專利的引用,大量的可能成為睡美人的文獻被提前喚醒[30],“專利王子”逐漸代替了“科學(xué)王子”的作用。此外,現(xiàn)代網(wǎng)絡(luò)與科技的發(fā)達,文獻的可獲取性逐漸提高[10],使得因文獻傳播問題而產(chǎn)生的睡美人文獻也相應(yīng)減少。

3.2 睡美人喚醒期識別

本文首先需要識別睡美人文獻的喚醒期,才能總結(jié)睡美人文獻的出版年和喚醒年兩大特殊節(jié)點的時間分布規(guī)律,并觀察文獻作者動態(tài)h指數(shù)的特殊節(jié)點特征及節(jié)點之間的成長規(guī)律。通過計算滿足標準的558篇睡美人文獻所得到的喚醒年份,如圖2所示。

圖2 睡美人文獻發(fā)表年和喚醒年的分布及文獻Bcp指數(shù)

右側(cè)色標圖例的顏色由淺到深代表Bcp指數(shù)的增加,圖中各圓點的顏色和大小均可表示Bcp指數(shù)的大小。由圖2觀察可見,睡美人文獻被喚醒主要分三個時期,1982~1995年為第一時期,喚醒了大量處于上文分析得到的睡美人發(fā)表年第三高峰的文章,文獻的Bcp指數(shù)偏小,僅介于4~8之間,原因推測為文獻的沉睡期都在10~15年,沉睡時間較短;1998~2006年為第二時期,集中喚醒了數(shù)量更大、沉睡期更久即發(fā)表年更早的文章,這批文獻主要集中在1965~1970年發(fā)表,即睡美人文獻發(fā)表的第一、二高峰,沉睡期大概在30年左右,圖中顏色偏紅色且直徑大的圓點大多分布在此區(qū)域,說明高質(zhì)量的睡美人文獻(即Bcp指數(shù)較大)基本集中在該時期;2000年至今為第三時期,相對前兩個時期喚醒數(shù)量大幅下降,文獻的發(fā)表年份也更晚,且Bcp指數(shù)大小不等。

從整體上看,滿足Bcp指數(shù)標準的睡美人文獻,其沉睡期基本都大于10年,1982年之后文章被大量喚醒,且先喚醒的是時間距離較近的文獻。又過了10多年,學(xué)者們的注意力轉(zhuǎn)移到更早的文獻,這也符合知識的涉獵規(guī)律,根據(jù)解釋水平理論,人們對時間距離、空間距離和社會距離較近的事物有具體形象的表征,表示為低解釋水平[31]。對于低解釋水平的事物人們更容易產(chǎn)生低解釋水平的行為,表現(xiàn)為關(guān)于自身的、近期的、簡單易行的行為,將該理論應(yīng)用于文獻的發(fā)現(xiàn)與挖掘,人們近期更易對低解釋水平的事物即時間距離較近的文獻產(chǎn)生搜索、瀏覽等行為,遠期才會去發(fā)現(xiàn)高解釋水平的事物即時間距離較遠的文獻。而且,知識的發(fā)展具有持續(xù)性[32],人們對當前知識的掌握與前不久的先進知識更易產(chǎn)生聯(lián)系,因此,時間距離較近的文獻首先被檢索發(fā)現(xiàn)。同時隨著科學(xué)技術(shù)和思想的進步,社會和學(xué)術(shù)界也逐漸認知到被忽略的變革性思想和技術(shù)的可行性,被發(fā)現(xiàn)的文獻隨即被認可,即被喚醒后成為睡美人文獻。需要說明的是,本文針對的是出現(xiàn)睡美人頻率較高的三本期刊的文獻,該規(guī)律對于其他期刊文獻的適用性還有待考證。

3.3 睡美人文獻作者動態(tài)h指數(shù)

為了研究睡美人文獻作者在特殊節(jié)點的影響力特征及其成長規(guī)律,本文通過h指數(shù)代表作者的影響力水平,觀察作者的動態(tài)h指數(shù)變化情況。

根據(jù)Web of Science平臺的作者數(shù)據(jù)計算得到每位作者的歷年h指數(shù),進行數(shù)據(jù)整理和篩選。為了使研究特征明顯突出,本文選取Bcp指數(shù)大于等于10的77篇睡美人文獻,按照每篇文獻作者貢獻度的排名順序,排名靠后的作者貢獻度較小,不具備研究價值,因此對于一篇文獻而言,最多抽取前4名作者,不足或等于4名的則全部納入分析范圍,共得到129名作者作為研究對象。對于h指數(shù)小于等于2的作者來說,其h指數(shù)浮動不超過1,自始至終幾乎無變化,這對觀察其h指數(shù)的動態(tài)變化和走勢基本毫無意義,因此本文決定篩除h指數(shù)小于等于2的作者,對其他116條數(shù)據(jù)進行分析,得到h指數(shù)變化趨勢圖(見圖3)。圖中每條曲線表示該作者從學(xué)術(shù)生涯開始至今的h指數(shù)的變化趨勢,“x”號標記出該作者在所發(fā)表的睡美人文獻發(fā)表年時的h指數(shù)值,“x”號集中分布的年份較為靠前,約1960~1980年之間,“*”標記出該作者在所發(fā)表的睡美人文獻被喚醒時的h指數(shù)值,“*”號集中分布在1990年之后。

從圖3中可以清晰地觀察到,睡美人文獻的作者在文獻發(fā)表時期的影響力基本都不超過5,而且從圖中h指數(shù)的起始點觀察,多數(shù)睡美人文獻的出現(xiàn)都發(fā)生在這些作者的學(xué)術(shù)生涯初期,基本不超過10年,因此可推測,這些作者當時的年齡都在20~30歲的青年階段。以上兩點結(jié)論也可以充分說明睡美人文獻在發(fā)表初期被忽略甚至被抵制的原因,這些作者進入研究領(lǐng)域時間較短,成果和被認可程度均處于較低水平,在學(xué)術(shù)領(lǐng)域不具有權(quán)威的發(fā)言權(quán)。由于“馬太效應(yīng)”的存在,使得他們的新發(fā)現(xiàn)并不能在第一時間吸引領(lǐng)域內(nèi)領(lǐng)軍人物的關(guān)注,或者支持他們觀點的學(xué)者人數(shù)較少,在他人選擇參考文獻時就被剔除[33],沒有這些權(quán)威的“伯樂”,學(xué)術(shù)“新秀”們自然會被埋沒。

從h指數(shù)值來看,根據(jù)美國科睿唯安(Clarivate)公布的“高被引科學(xué)家”名單及白皮書,查詢所有“高被引科學(xué)家”的h指數(shù),發(fā)現(xiàn)h指數(shù)大于40可認定為高被引作者[34]。截至2017年底,在116名睡美人文獻作者中有20%的人可被認為“高被引作者”,大部分作者的h指數(shù)均處于30左右及以下,屬正常影響力水平。出乎意想的是,個位數(shù)的h指數(shù)作者(包含h指數(shù)小于等于2的作者)也具有一定比例,常作為第三作者或第四作者出現(xiàn)。本文推斷,因作者年齡年輕化特征,多數(shù)作者在年輕時期攻讀學(xué)士、碩士或博士期間,參與指導(dǎo)教師相關(guān)研究,并在過程中做出一定貢獻,而學(xué)業(yè)順利完成后,可能選擇就職于其他行業(yè),沒有繼續(xù)進行更加深入的學(xué)術(shù)研究,使得一部分作者h指數(shù)較低。

3.3.1 動態(tài)h指數(shù)總體趨勢

從h指數(shù)曲線走勢看,總體睡美人文獻作者的h指數(shù)均呈線性增長趨勢,Burrell在2007年也根據(jù)大量數(shù)據(jù)證實了科學(xué)家h指數(shù)的線性增長特點[35],同時國內(nèi)學(xué)者張曉陽也提出分子生物學(xué)和遺傳學(xué)領(lǐng)域的高被引作者h指數(shù)呈線性成長規(guī)律[21]。本文在線性增長規(guī)律基礎(chǔ)上,發(fā)現(xiàn)了三個表現(xiàn)突出的成長速率,以傾斜角度30°、45°和60°最為明顯,h指數(shù)以每十年增加5、10、20的速度上升,分別在其h指數(shù)區(qū)間[10,20]、[25,35]、[50,60]時被喚醒。因此對于不同h指數(shù)成長速度的作者來說,均在其學(xué)術(shù)生涯的中期階段被喚醒,究其原因可能是彼時睡美人文獻作者找到了自己感興趣的領(lǐng)域,并已在該領(lǐng)域發(fā)展了一段時間,文獻的被認可度逐漸提升,同時也都具備了一定學(xué)術(shù)影響力,綜合其他因素,文章即被喚醒。

圖3 作者h指數(shù)走勢與分布圖

圖4列出了作者在文獻發(fā)表年和喚醒年之間h指數(shù)的成長幅度。依圖可見,喚醒年與發(fā)表年h指數(shù)之差為2~4的人數(shù)較多,推測原因主要是部分作者在求學(xué)之后并未從事科學(xué)研究,h指數(shù)受限于文獻發(fā)表數(shù)量,整體水平較低,數(shù)量上也具有一定比例,因此使得[2,4]區(qū)間人數(shù)偏多。正常情況下h指數(shù)的增幅分布較多的區(qū)間為[8,12],中位數(shù)為10,即睡美人文獻被喚醒時,作者h指數(shù)提升10的概率最大,該數(shù)值在所有增幅大小排列中屬偏小值,以其h指數(shù)判斷也鮮有高被引作者(h指數(shù)大于40可被認為是高被引作者),因此可知睡美人文獻的作者影響力水平并不需要達到該領(lǐng)域的最高標準,只需具有中等左右的水平即可被關(guān)注。作者學(xué)術(shù)影響力的提升,使其文章受到關(guān)注,進而被廣泛引用,可見作者影響力也是文章被發(fā)現(xiàn)和喚醒的原因之一,但并非重要因素或唯一因素,因為較低影響力水平的作者發(fā)表的睡美人文獻也將會被喚醒,對于睡美人文獻被喚醒的要素還需進一步研究。

圖4 喚醒年與發(fā)表年h指數(shù)之差

3.3.2 典型“睡美人作者”

在針對睡美人文獻作者進行研究時,發(fā)現(xiàn)了不同于線性增長的部分作者,本文稱之為典型“睡美人作者”,這些作者的h指數(shù)成長趨勢類似于睡美人文獻的被引趨勢,即前期h指數(shù)基本為持續(xù)低水平狀態(tài),在其發(fā)表的睡美人文獻被喚醒后h指數(shù)呈現(xiàn)迅速飛躍的現(xiàn)象,本文從中摘取了6個典型案例進行展示,見圖5。

圖5和圖6中藍色且變化較為平緩的曲線代表該作者的h指數(shù)的變化趨勢,黃色且起伏較大、變動頻繁的曲線代表該作者所發(fā)表的睡美人文獻的引文曲線,在兩條曲線中,“x”分別標記出該作者在睡美人文獻發(fā)表年時的h指數(shù)值及總被引頻次,“*”分別標記出該作者在睡美人文獻被喚醒時的h指數(shù)值及總被引頻次。

在每個坐標內(nèi),特意標明睡美人文獻喚醒年份,并給出該文獻引文曲線做對照。觀察兩條曲線的變化趨勢可知,其在時間分布上具有一致性,即在睡美人文獻被引頻次發(fā)生突變時,該作者的h指數(shù)也在該點之后發(fā)生激增現(xiàn)象。

該現(xiàn)象并非是簡單的線性成長,其成長過程主要分為兩階段,通常以睡美人文獻發(fā)表年為起點,睡美人文獻喚醒年為兩階段轉(zhuǎn)折點。第一階段是“被埋沒的作者”,h指數(shù)一直處于0~2區(qū)間,作者影響力水平很低;第二階段則是從轉(zhuǎn)折點至今的“飛躍期”,在轉(zhuǎn)折點后的1~5年期間,h指數(shù)的漲幅可達到前期的10倍,甚至更高。其主要原因還是在于作者文獻的被引情況。在作者發(fā)表睡美人文獻后,該文獻被引情況不佳,即使作者繼續(xù)發(fā)表更多的文章,但是受制于每篇文獻的被引頻次,該作者的h指數(shù)并沒有得到提升;在該文獻被喚醒之后,與該文獻相關(guān)的一系列文獻也將會被關(guān)注,因而該文獻作者的h指數(shù)曲線則會瞬間上升,這種情況符合睡美人文獻的被引規(guī)律,與睡美人文獻的引文曲線基本吻合。其中,圖5中(3)和(6)作者的h指數(shù)激增趨勢不明顯,因該作者的h指數(shù)相對引文的被引頻次數(shù)值較小,在同一坐標軸中顯示時,其趨勢被掩蓋,因此在圖6中分別畫出了作者h指數(shù)曲線和睡美人文獻的引文曲線,以此觀察可以確定(3)和(6)作者屬于典型的“睡美人作者”。(4)作者在喚醒年時的h指數(shù)沒有像其他文獻一樣恰好處在轉(zhuǎn)折點上,但也在h指數(shù)迅猛上升的初期,其原因可能是由于睡美人文獻在被喚醒前期,其被引頻次也有小幅度的累加,使得該作者的h指數(shù)也有所增加。由于其h指數(shù)的飆升是在睡美人文獻被喚醒之后,睡美人文獻被引頻次的增加才帶動了作者h指數(shù)的提升,說明在文獻被喚醒時,該作者還不具備一定的學(xué)術(shù)影響力水平,可推斷這一類作者的睡美人文獻被喚醒要素并非作者影響力的提升,對于此類睡美人文獻的喚醒要素還可進行更深層次的研究。

圖5 典型睡美人作者h指數(shù)與睡美人文獻引文曲線案例

圖6 (3)和(6)作者h指數(shù)與引文曲線

4 結(jié)論

本文針對睡美人文獻時間分布和睡美人文獻作者動態(tài)h指數(shù)進行研究,分別得出以下結(jié)論。

(1)以所收集的Web of Science平臺Science、Nature和PNAS期刊數(shù)據(jù)為基礎(chǔ),分析睡美人文獻識別及睡美人文獻時間分布規(guī)律,得到以下結(jié)論。①以Van Raan的參數(shù)標準和Bcp無參數(shù)指標的計算方法為理論依據(jù),構(gòu)建了睡美人文獻的Bcp無參數(shù)指標識別標準。②利用Bcp指數(shù)公式計算睡美人文獻的“美麗程度”,并根據(jù)Bcp無參數(shù)指標識別標準,識別出558篇睡美人文獻,比例約為總篇數(shù)的2.383%,該結(jié)果與李江等人識別的睡美人文獻比例比較吻合,可驗證所構(gòu)建的標準具有一定的可行性。③睡美人文獻的出版與喚醒時間分布規(guī)律具有階段性特征。1960—2007年之間睡美人文獻的出現(xiàn)分為三個階段,喚醒期分布也主要分為三個階段,并與出現(xiàn)的三個階段相互對應(yīng),但先后次序不同,“喚醒一期”先喚醒了“出現(xiàn)三期”的文章,后喚醒了“出現(xiàn)一期”和“出現(xiàn)二期”的文章。

(2)通過計算睡美人文獻作者的動態(tài)h指數(shù),研究分析睡美人文獻作者影響力特征及成長規(guī)律,得到以下結(jié)論。①多數(shù)睡美人文獻作者h指數(shù)成長規(guī)律總體呈線性趨勢,與高被引作者的h指數(shù)成長線性規(guī)律相同,且有三個成長斜率的表現(xiàn)最為突出,分別是傾斜角度為30°、45°和60°,在發(fā)表至喚醒的時間段內(nèi),作者h指數(shù)的成長幅度以8~12最為明顯,該增幅屬偏小值,作者影響力屬中等水平,可推斷作者影響力的提高是睡美人文獻喚醒的要素之一,但并非是睡美人文獻被喚醒的重要因素或唯一因素。②發(fā)現(xiàn)典型“睡美人作者”的特殊成長規(guī)律。研究發(fā)現(xiàn),部分作者的動態(tài)h指數(shù)成長曲線并非簡單的線性成長,而是與其發(fā)表的睡美人文獻的年度被引曲線的變化趨勢相吻合,呈現(xiàn)出前期h指數(shù)成長速度很低或一直處于0~2的水平,后期睡美人文獻的引文曲線與h指數(shù)同時得到飆升的變化規(guī)律。由于h指數(shù)的上升與文獻被喚醒同時發(fā)生,可推斷該類睡美人文獻的喚醒要素不包括作者影響力。

本文對數(shù)據(jù)的收集只限于1960—2007年,對于更早期的睡美人文獻未收錄在內(nèi),其睡美人作者h指數(shù)的變化規(guī)律也無法推測:另外對于無參數(shù)指標的識別標準,有待進一步尋找其他理論依據(jù)進行完善,對于不同睡美人文獻的喚醒要素還可進行深入研究。 

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請及時告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關(guān)注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言