摘要:為了分析科技論文作者選取關鍵詞的行為和態度,研究科技論文作者對關鍵詞檢索的習慣,探討優化關鍵詞的方法,筆者設計了一套關鍵詞選取方法調查問卷,涉及關鍵詞檢索習慣、選取方法、處理態度及期望等內容,并向《計算機系統應用》的作者發放200份調查問卷,收回有效問卷152份。結果顯示,作者更傾向于采用主題或關鍵詞檢索模式進行論文檢索,71.62%的作者重視關鍵詞的選取,76.97%的作者僅從題目和摘要中選取關鍵詞。73.65%的作者認為關鍵詞是為了體現文章內容及技術要點,79.73%的作者研究過熱點關鍵詞,89.19%的作者認為有效關鍵詞能提高文章顯示度,93.10%的作者愿意編輯部推薦關鍵詞。由于作者缺少有效的關鍵詞選取方法,導致他們心有余而力不足?萍计诳庉嫅趦灮P鍵詞方面進行深入研究并開展工作,與作者共同努力,使選取適當關鍵詞更規范、有效。
關鍵詞:科技期刊;行為分析;關鍵詞選取;文獻檢索;影響力;研究熱點;
Abstract:This paper aims to analyze the behavior and attitude of authors from scientific papers towards keyword selection,investigate the habit of authors in keyword retrieval,and explore the method of keyword optimization. We design a questionnaire about the keyword selection,including keyword retrieval habit,selection method,processing attitude,expectation,etc. Two hundred questionnaires are sent to the authors ofComputer Systems and Applications and 152 valid ones are retrieved. In comparison with other modes,authors are inclined to retrieve papers in the subject or keyword mode. 71.62% authors pay much attention to keyword selection.76.97% authors select keywords only from titles and abstracts.73.65% authors believe that keywords are set to reflect the article content and technical points. 79.73% authors have investigated hot keywords. 89.19% authors think that valid keywords can increase article display. 93.10% authors hope editorial boards to recommend keywords. Since authors are lack of effective method,they are powerless in keyword selection. Editors of scientific and technological journals should make in-depth studies in keyword optimization and make efforts together with authors to select more standard and valid keywords.
Keyword:scientific and technological journals; behavior selection; literature retrieval; impact; research hotspots;
隨著科學技術的不斷發展,國家對中文科技期刊的重視程度逐漸提高[1],每年都有大量的科研論文發表在中文期刊上。中國知網(CNKI)數據顯示,2019年發表的129萬篇科學技術專業領域論文中發文量最高的學科是“自動化技術、計算機技術”(87 673篇,6.79%)[2]。計算機類的論文如何在大量的文獻中脫穎而出,被更多的學者發現,除了文章質量和研究方向以外,規范、準確的關鍵詞標引也是需要關注的一個方面!犊茖W技術報告、學位論文和學術論文的編寫格式》[3](以下簡稱《編寫格式》)指出: “關鍵詞是為了文獻標引工作,從報告、論文中選取出來用以表示全文主題內容信息款目的單詞或術語。”關鍵詞是文章內容的濃縮,反映了文章的核心創新點。借由關鍵詞,讀者可迅速了解文章的主要內容。有效關鍵詞就是能夠準確表述文章主要內容,有效展示科研工作關鍵點的詞語。另外,從《編寫格式》可知,關鍵詞的設置是為了文獻標引工作,有助于讀者更精準、高效地檢索論文。熱點關鍵詞則是根據文章內容選擇領域研究熱點,有助于提高文章被檢索的概率,提升閱讀興趣的詞語。因此,選取有效且契合研究趨勢的熱點關鍵詞,在提高文章可讀性、提升顯示度方面的作用尤為重要。
然而,由于作者對關鍵詞標引作用的了解相對較少,期刊論文中關鍵詞的選用仍存在許多問題,針對此現象,許多學者進行了研究[4,5,6,7,8,9,10]。例如,張紅霞等[5]從信息傳播視角探討了學術論文關鍵詞標引的方法和策略,提出了關鍵詞標引的步驟:確定主題概念、主題概念轉換、關鍵詞審核修改;屈李純等[6]分析了科技論文關鍵詞不關鍵的原因,認為科技論文關鍵詞“不關鍵”的原因有關鍵詞標引缺少指導規范、作者對關鍵詞標引不熟悉以及期刊編輯“忽視”關鍵詞編校;伍錦花等[7]分析了科技論文中10個不能反映論文主題的無效關鍵詞,如“對策”“問題”“影響”,并給出了相應的原因和應對措施。
中國科學院軟件研究所期刊聯合編輯部承擔三刊一網工作,即《軟件學報》《計算機系統應用》《International Journal of Software and Informatics》和中國計算機期刊網。筆者在《計算機系統應用》日常編輯審稿工作中發現,作者在選取關鍵詞時存在重復選取、使用不規范、內容不全面、選取不準確等問題?萍计诳庉嬜鳛檎撐牡募庸ふ,有責任幫助作者完善文章內容,不斷提高出版質量,提升文章顯示度。從長遠來看,單從某篇文章出發來輔助作者修改關鍵詞不具有可行性,應找到文章中存在的共性問題,并了解作者需求,從編輯部和作者雙方面來考慮,既可以讓作者更清楚地了解關鍵詞標引的規范,又可簡化編校過程。為全面了解作者在關鍵詞選取方面的習慣和需求,筆者以《計算機系統應用》為研究樣本,在實務工作中圍繞關鍵詞提煉并設計了一套調查問卷,問卷內容包括關鍵詞檢索習慣、選取方法、處理態度及期望等內容,以期了解作者需求,掌握科技論文作者在關鍵詞處理方面的行為特征,為后續開展關鍵詞推薦和分析工作提供參考。
1 研究方法
1.1 問卷設計
筆者采用問卷星制作本次調查問卷。問卷共有11題,包括排序題和單選題,從檢索方法、關鍵詞選取方法、對關鍵詞的態度以及作者對編輯部推薦關鍵詞的看法等角度設計問卷,問卷的題目類別、詳細內容、題型和題目數量如表1所示。通過郵箱或官方微信公眾號共發放200份問卷,截至2022年7月15日,共收回有效答卷152份,答卷有效率為76%。
表1 調查問卷題型設計
1.2 分析工具
本文使用問卷星數據統計和分析功能進行數據分析。在作者檢索方法行為分析時,采用選項平均綜合得分來反映作者的排序情況,選項平均綜合得分的計算公式為
a=(Σp×w)/n,
式中:a為選項平均綜合得分;p為選項被選擇的頻數;w為選項的權值,由選項被排列的位置決定;n為本題填寫人次。例如,有3個選項參與排序,那么排在第1、2、3個位置的權值分別為3、2、1。如果一個題目共被填寫10次,選項A被選中并排在第1個位置5次,第2個位置2次,第3個位置3次,那么選項A的平均綜合得分=(5×3+2×2+3×1)/10=2.2分。由此可知,選項平均綜合得分的最大值為選項的個數。
2 結果分析與討論
2.1 結果分析
2.1.1 作者的檢索習慣
關鍵詞是為了方便論文檢索而設計的,因此調查作者的檢索習慣有利于從根本上了解讀者對關鍵詞的看法。表2為根據作者的檢索習慣統計得到的平均綜合得分情況?梢钥闯,選擇中文學術數據庫(如中國知網和萬方數據知識服務平臺)和學術搜索引擎(如百度學術和谷歌學術)進行檢索的平均綜合得分最高,分別為4.82和4.49,排名第3、4、5的分別為國際學術數據庫、國外學術出版機構和期刊官網。作者主要選擇主題和關鍵詞來檢索論文,使用期刊名和作者進行檢索的相對較少。在全稱和縮寫的使用上,使用中文全稱進行檢索的平均綜合得分最高,為4.14,其次為英文全稱,使用英文縮寫、中文全稱+英文縮寫、英文全稱+英文縮寫的比例依次減少。
表2 作者檢索習慣調研
綜上可知,大部分作者選擇中文學術數據庫和學術搜索引擎進行文獻檢索,檢索模式主要為主題和關鍵詞,并且多采用中文全稱或英文全稱進行檢索。
2.1.2 作者選取關鍵詞的方法
表3為作者選取關鍵詞的來源。76.97%的作者從題目和摘要中選取關鍵詞,11.18%從相關文章中選取,9.21%通過查詢相關學科術語詞表進行選擇,2.63%通過導師建議來選取關鍵詞。在數量方面,選取3~4個和5~6個關鍵詞的人數相近,分別為51.35%和48.65%。對于熱點關鍵詞的關注方面,有79.73%的作者表示考慮過研究熱點關鍵詞,但還有20.27%的作者未曾考慮過研究熱點關鍵詞。
表3 作者選取關鍵詞的來源
由此可知,題目和摘要是作者選取關鍵詞的主要來源,選取3~4個和5~6個關鍵詞的人數基本相當。另外,大部分作者在撰稿過程中考慮過研究熱點關鍵詞,但不能確認所選擇術語是否為當前研究熱點。
2.1.3 作者對關鍵詞的態度
針對作者對關鍵詞的重視情況,調研結果顯示,71.62%的作者表示重視關鍵詞的選取,會花費一定的精力去仔細考慮選取合適的關鍵詞;28.38%的作者認為關鍵詞只需要基本達到要求即可。至于有效關鍵詞是否有提高文章顯示度和影響力的作用,89.19%的作者認為是可以的,并且很需要關鍵詞來判斷研究興趣的相關度,9.45%的作者表示沒有考慮過這個問題,1.35%的作者不關注關鍵詞。另外,73.65%的作者認為關鍵詞最重要的作用是體現文章內容及技術關鍵點,12.16%的作者認為關鍵詞是為了引導讀者在閱讀前了解文章內容,14.19%的作者認為關鍵詞是為了方便檢索。93.1%的作者表示愿意編輯部向其推薦關鍵詞,說明作者渴望得到編輯部的支持。對于推薦的數量,以為1~2個為佳的比例為55.56%,認為3~4個比較合適的占25.93%,18.52%的作者對推薦關鍵詞的數量沒有要求。
由此可知,大部分作者重視關鍵詞的選取,并且認為有效關鍵詞能夠提升文章的影響力。另外,他們認為關鍵詞最大的作用是體現文章內容及技術關鍵點,引導讀者在閱讀前了解文章內容。90%以上的作者愿意編輯部推薦關鍵詞,55.56%的作者認為推薦關鍵詞的數量為1~2個較為合適。
2.2 討論
2.2.1 作者青睞的檢索網站較一致
根據調研結果可知,中文學術數據庫和學術搜索引擎的平均綜合得分最高。另外,從后臺詳細填寫數據也可以看出,把中文學術數據庫和學術搜索引擎作為第一檢索來源的人數分別為67人和62人,合計占比84.9%,說明大多數作者檢索論文時優先考慮中文學術數據庫和學術搜索引擎。這一方面是因為中文學術數據庫和學術搜索引擎收錄的論文數量多,文章類型全面,作者可下載到大部分自己感興趣的論文;另一方面是因為《計算機系統應用》是中文科技期刊,作者傾向于選擇中文學術數據庫進行參照學習。
2.2.2 主題和關鍵詞是最主要的檢索選項
調研結果顯示,作者主要通過主題和關鍵詞進行檢索,而通過期刊名和作者進行檢索的比例較少,這說明科技論文作者對主題和關鍵詞的關注黏性比對其他選項的黏性更大,他們更關注研究的主題和方向,而對某一期刊或作者關注度不高。這也側面提示編輯部在編校和專題策劃中要多關注文章主題和關鍵詞的選擇,從而提升文章的顯示度。
2.2.3 中英文全稱為作者的檢索首選
在關鍵詞的書寫上,中英文關鍵詞應盡量提供中英文全稱,從而讓更多的讀者檢索到該篇文章。例如,在CNKI數據庫檢索發現,以卷積神經網絡(convolutional neural network, CNN)為研究主題的文章,用“卷積神經網絡”為關鍵詞檢索,學術期刊和學位論文的文章數量為3.25萬,而以“CNN”為關鍵詞檢索出來的數量為1.13萬,前者檢索文章數量是后者的3倍左右。由此可見,以中英文全稱作為關鍵詞能讓文章更大程度被其他學者檢索到。
2.2.4 從題目和摘要中選取關鍵詞過于片面
結果顯示,作者主要從題目和摘要中選取關鍵詞,顯然這一方法是不全面的,因為關鍵詞是全文內容的濃縮,僅僅出自題目和摘要,可能會遺漏主題信息[11]。另外,值得一提的是,作者對于學科術語詞表的關注不夠,只有8.11%的作者在撰稿時會參考學科術語詞表,這表明作者對于關鍵詞的規范性缺少關注。需要注意的是,關鍵詞標引應嚴格遵守規范性、全面性、專指性和客觀公正性的原則[12,13],規范的關鍵詞不僅有利于讀者檢索,也有利于編輯部進行文獻主題信息挖掘[14]。
2.2.5 熱點關鍵詞值得關注
通過統計關鍵詞、主題詞、篇名詞等核心詞匯在某一類學術文獻中出現的頻次,可判別該學術領域的研究熱點、知識結構和發展趨勢[15,16]。雖然79.73%的作者都研究過熱點關鍵詞,但從實際效果來看,他們對熱點關鍵詞的了解不夠,導致選取的關鍵詞不夠“熱點”。編輯部作為文章的把關者,有能力也有方法總結熱點關鍵詞庫供作者選取,從而讓他們的文章達到更好的宣傳效果。
2.2.6 關鍵詞的檢索作用未引起作者的重視
調研結果顯示,85.81%的作者認為關鍵詞最重要的作用是體現文章內容及技術關鍵點,引導讀者在閱讀前了解文章內容,而這些內容在題目和摘要中已經能夠詳盡地體現,顯然這不是關鍵詞最重要的作用。如《編寫格式》所述,關鍵詞最重要的作用是文獻標引,便于讀者檢索。從結果來看,只有14.19%的作者意識到關鍵詞的檢索作用?梢,關鍵詞的設置目的和作者對關鍵詞的認知之間存在偏差。另外,從學者的檢索習慣來看,他們在檢索文章時大多采用關鍵詞進行檢索,而在撰寫文章時對關鍵詞的檢索作用反而重視不足,這也是編輯部需關注的一個矛盾點。
2.2.7 有效關鍵詞有助于提高文章影響力
有效關鍵詞,顧名思義,是對文章檢索和閱讀起有效作用的關鍵詞。編輯部可在關鍵詞的長度、書寫規范以及全稱、縮寫的使用等方面輔助作者修改關鍵詞,讓關鍵詞更有效。根據調研結果顯示,仍有10.8%的作者不了解也不關注有效關鍵詞的作用,這一點也是編輯部今后需關注的一個方面,即提升作者對有效關鍵詞的重視,以共同提升文章質量及顯示度。另外,值得注意的是,17.57%的作者認為有效關鍵詞可以提升文章影響力,但卻不重視關鍵詞的選取,說明科技論文作者的思想認識與實際行動之間是有差距的。從前文分析可知,這是因為作者缺少合適的關鍵詞選取方法,進而導致了他們心有余而力不足的狀態。
2.2.8 編輯部應設計適當方法為作者推薦合適的關鍵詞
調查結果顯示,93.10%的作者表示愿意編輯部向其推薦關鍵詞,表明了作者對編輯部的信任和期望。另外,編輯部根據長期的工作積累經驗,可以設計一個以規范化關鍵詞、推薦熱點關鍵詞為目的的方法。
3 結束語
通過調研期刊作者對關鍵詞的方法和態度來了解關鍵詞方面目前存在的問題。關鍵詞作為論文檢索的關鍵因素,其標引的規范性和全面性將直接影響文章的檢索顯示度。結果顯示,科技論文作者大多從中文學術數據庫通過主題或關鍵詞進行論文檢索;一般從題目和摘要中選擇3~6個關鍵詞,整體符合期刊關鍵詞數量要求;大多數作者重視關鍵詞的選取,也希望通過關鍵詞來判斷研究興趣的相關度,但由于方法和經驗有限,作者普遍希望編輯部能夠推薦合適的關鍵詞來提升文章的影響力。
在下一步的工作中,編輯部將進行2方面研究:一是研究關鍵詞對文章顯示度的量化作用;二是利用智能化數據分析工具,建立學科領域熱點關鍵詞庫,探索優化關鍵詞選取的途徑。
參考文獻
[1]國家新聞出版署中共中央宣傳部、教育部、科技部印發《關于推動學術期刊繁榮發展的意見》的通知[A/OL].(2021-06 -23)2022-0-15.https://www.nppa.gov.cn/nppa/contents/312/76209. shtml/
[2]中國科學技術協會.中國科技期刊發展藍支書(2021)[EB/OL].(2022-01-27)[2022 -08-15]. https://stm.castscs.org.cn/lpsxz/38714.jhtml
[3]科學技術報告、學位論文和學術論文的編寫格式: GB/T 7713- -1987[S].北京:中國標準出版社,1990
[4]張建蓉,陳燕.學術論文中關鍵詞標引的常見問題剖析[J]編輯學報,2003, 15(2):104
[5]張紅霞,冀倫文,賈麗紅,等.信息傳播視角下學術論文關鍵詞標引方法與策略[J]中國科技期刊研究, 2018,29(12):1213
[6]屈李純,霍振響.科技論文關鍵詞“不關鍵”原因探析[J].編輯學報, 2019,31(5):516
[7]伍錦花,陳燦華.科技論文10個無效關鍵詞計量學分析[J]編輯學報, 2020,32(4):403
[8]王昌度,熊云,徐金龍,等.科技期刊論文關鍵詞標引的問題與對策[J]編輯學報, 2003,15(5):349
[9]吳軍.新媒體時代期刊關鍵詞的應用探析[J].出版廣角, 2021(11):49
[10]張銀鳳,嵩,尹春霞,等.學術論文中關鍵詞的選取與常見問題分析[J]黃岡師范學院學報,2019,39(6):223
[11]楊珍珍.學術論文關鍵詞的選取[J].蘭州工業學院學報, 2018,25(5):122
[12]蔡益群.基于《中國分類主題詞表》電子版的學術論文關鍵詞標引[J].圖書情報導刊, 2018,3(6):1
[13]程智強,江洪濤.科技論文關鍵詞標引應琢磨的幾個問題[J]編輯學報, 2014,26(1):40
[14]邊釗,唐娉,閆珺.關鍵詞規范化對文獻主題信息挖掘的影響:以遙感領域為例[J].中國科技期刊研究, 2021,32(12):1535
[15]張勤.詞頻分析法在學科發展動態研究中的應用綜述[J]圖書情報知識, 2011(2):95
[16]池營營,安珍,周小潭.基于載文關鍵詞統計的《編輯學報》研究熱點分析[J].傳播與版權, 2019(1):87