全根先:学术论文中的关键词标引问题
这些年来,学术论文的关键词标引已成为学术成果发表的基本要求和学术期刊出版的规范要求,而关键词选用是否正确、精准也成为衡量编辑水平的一个重要标志。笔者从事编辑多年,是个人职业生涯的起点和重要阶段,于今参与编辑《纪念馆研究》杂志,深感学术论文关键词标引的重要性,且其方法并不为多数作者甚至编辑所掌握这一现实,有必要对其加以探讨。又由于笔者曾从事国家图书馆学位论文的标引工作多年,所经博硕士学位论文、博士后出站报告标引不下30万篇,自感有一定的心得体会,在此与大家分享。
关键词标引的必要性
学术论文的主题标引,是指在对学术论文内容进行分析的基础上,以一定的词表或标引规则为依据,将学术论文中具有检索识别意义的特征转换成相应的主题概念,并将其组织成表达信息资源内容特征的标识(主题词)的一个过程。主题标引是文献检索和利用的关键环节之一,有助于揭示文献的深度和读者的使用。学术论文的主题标引,包括叙词法和关键词法。所谓叙词,又称主题词,是指专门为文献标引或检索而从自然语言中挑选出来并加以规范化和处理的词语,并收入《汉语主题词表》《中国分类主题词表》等工具书中。所谓关键词,又称自由词,是指出现在文献的标题(篇名、章节名)以及摘要、正文中,对揭示文献主题内容具有实质意义的可以作为检索入口词的词语。在当下网络发达、检索便捷的情况下,主题词标引已经很少使用(但这并不意味着其不重要),关键词标引业已成为学术论文标引主流。
学术论文关键词标引是网络时代科研工作、情报检索的客观要求。学术论文往往是作者在具有某一学科基础理论和专门知识的基础上,追踪国内外学术研究的最新成果,进而对某一理论或实践问题进行研究所取得成果,具有较强的专业性和创新性。同时,根据2023年国家公布的重点学科相关信息,目前我国共有国家重点一级学科286个,二级学科677个。如此广泛的学科, 使学术论文的研究范围必然涉及到人文社会科学、自然科学、工程技术等各个领域,也决定了其研究课题的全面性和广泛性。随着经济与社会的发展、科学技术的不断创新,大量新学科、交叉学科不断涌现,使学术论文的研究领域继续向专深、宽广发展。所有这些,都对学术论文标引提出了更高的要求。
由于学术论文选题广泛、内容专深,新学科、新技术、新名词如井喷式大量涌现,各类主题词表等工具书中收录词汇概念滞后、专指度低等现象十分突出。虽然图书情报机构可采取主题词组配标引、上位词标引、靠词标引、增词标引等方法,对各类主题词表收词不足、专指性差等缺陷进行一定弥补,然而总有一些学术论文即便采用上述方法也难以达到理想的标引效果。例如,有关子宫肿瘤研究方面的学术论文,因子宫肿瘤包含了子宫肌瘤、子宫腺瘤、子宫肉瘤、子宫颈癌、葡萄胎、绒毛膜上皮癌等多种病情,单纯用传统的子宫肿瘤进行主题标引,显然无法满足标引深度、准确性要求。另一方面,在学术论文主题标引中,经常会遇到既无相应的专指词又无法用组配标引、上位词标引或靠词标引来表达的概念,在这种情况下,采用关键词标引势所必然。
长期以来,受控的主题语言(叙词、主题词)实际上只是图书情报人员所熟悉的专业语言,对于多数作者、编者、读者来说,由于没有经过这方面的专业训练,不熟悉情报检索语言,他们在检索某一主题文献时,只会用自己熟悉的词语去进行检索,不太可能采用规范的主题词来检索。例如,过去有关“扬州八怪”的研究文献,根据主题词法,一般标引为“画家”“江苏”“扬州”“清代”“传记”,而见不到“扬州八怪”这一最为简明的概念信息,相信也不会有多少人采用以上主题词加以组配进行文献检索。事实上,类似于“扬州八怪”这样的一些词汇,在专业领域或社会上已被广泛认同,进行关键词标引对于满足读者的文献检索需求是应有之举。
在人类文明史上,任何一种语言都不是一成不变的,它总是随着社会的发展、科技的进步而不断丰富发展。从某种意义上说,一部语言史就是一部社会发展史。以汉语为例,在汉语发展史上,近代以前汉语大规模地吸收外语来源的词共有三次:一次是战国时期,主要是匈奴、西域来源的词语;二是魏晋至陏唐时期,主要是梵语系统来源的佛教词语;三是明清时期,主要是来自西方语源的词语。其中,来自佛教的词语对汉语影响最大。日常使用的语言中,有许多来自佛教的词语,如“世界”“天道”“人道”“畜生”“报应”“烦恼”“解脱”“自觉”“觉悟”“导师”“正宗”“投机”“浩劫”“庄严”“一厢情愿”“自欺欺人”“一尘不染”“五体投地”,等等。近代以来,随着科学技术的发展、中西文化的交流交融,来自西方语源的新词成为汉语外来语的主流。随着计算机技术、互联网等高新技术的飞速发展和全球化浪潮席卷世界各地,新学科、交叉学科层出不穷,从社会生活中不断地汲取新鲜词汇、直接采用关键词标引已成为检索语言发展的大势所趋。
关键词标引的一些基本原则
在学术论文关键词标引中,一般可采取两种形式:一是作为主题词标引的补充,即在现有主题词表无法满足标引要求时,选用部分关键词作为主题词标引的补充和辅助手段,与主题词共同揭示学术论文的内容;一是直接采用关键词标引,但在选用关键词时,优先采用主题词表中的主题词或与主题词相近概念,即便使用关键词,也尽可能规范统一,便于同类文献的集中归类。关键词选取的数量取决于学术论文的主题内容。一般来说,单一主题学术论文选用3-5个关键词,多个主题学术论文可多于5个,不宜超过8个。现实生活中,许多作者、编辑由于不熟悉主题词,完全采用了关键词(自由词),导致关键词标引相当随意、检索价值不高等现象。为了便于大家理解和掌握关键词选用的一些基本原则,兹稍举几例,加以说明。
一是选择最通用、最专指的词加以标引。在学术论文主题标引中,如需采用关键词作为主题词标引的补充,宜选用对揭示学术论文主题内容最专指、最通用的词作为关键词,不得任意选用。此外,冠词、介词、连词、感叹词、代词、部分副词、部分形容词、部分名词、连系动词、情态动词、助动词等,一般均不能作关键词标引。特别是一些泛指性词语,诸如“理论”“报告”“试验”“学习”“研究”“技术”“原则”“问题”“机理”“规律”“影响”“性能”“机械”“动力”“压力”“材料”“气体”“系统”“历史”“资料”“疲劳”,等等,检索准确率低,应尽量避免或控制使用。
例1:《热休克蛋白47在大鼠脊髓损伤的表达及苦参素治疗大鼠脊髓损伤的研究》,可选用主题词:脊髓损伤,药物疗法,基因表达;关键词:热休克蛋白,苦参素。按:热休克蛋白(HSP) 是从细菌到哺乳动物中广泛存在的热应急蛋白质。当有机体暴露于高温时,就会由热激发合成此种蛋白,来保护有机体自身,有的文献称为“热应激蛋白”“热激蛋白”,因“热休克蛋白”用法最为常用,故用此词标引。
例2:《功能梯度材料相关的几个动静态问题分析及结构优化》,可选用主题词:复合材料,功能材料,材料力学,结构分析;关键词:功能梯度材料。按:“功能梯度材料”(functionally graded materials,简称FGM),又称“梯度功能材料”,其概念是日本学者新野正之与平井敏雄等于1986年提出的,是指一类组成结构和性能在材料厚度或长度方向连续或准连续变化的非均质复合材料。现有文献多用“功能梯度材料”一词,故采用此词作关键词标引。
例3:《公众影像史学的学科发展与思想渊源》,由于本文涉及学科属于历史学范畴,且均为学科交叉发展而成的新兴学科,可用关键词加以标引,但又须将其学科来源揭示出来,故可用以下概念标引:影像史学;口述史学;图像史学;公众史学;西方史学;同时,再以“民本”“人民史观”文中两个观点作为补充。
例4:《加强革命文物保护利用 推动中华民族现代文明建设》,可选用主题词:革命文物,文物保护;再选用关键词:中华民族现代文明。这里要注意的是:不用“中华民族”“中华文明”“现代文明”等概念,以增强关键词标引的专指性。根据文章内容,还可选用“红色文化”“革命纪念馆”两词补充,进一步指向论文所属研究领域。
在学术论文的关键词标引时,缩写、简称、分拆等情况经常出现。一般来说,不能随意使用缩写和简称。如果一个复合词分拆后能提供更多的检索入口时,可以考虑将其分拆成两个关键词,以增加检索途径。
例1:《严重急性呼吸道综合征(SARS)S蛋白重组腺病毒疫苗的构建及其免疫学研究》,可选择主题词:肺炎,基因工程疫苗,抗体,免疫学;可补充关键词:严重急性呼吸道综合征(SARS),非典型性肺炎。严重急性呼吸道综合征,又称非典型性肺炎,是由冠状病毒引起的一种呼吸系统传染性疾病,由世界卫生组织正式命名。这里采用“严重急性呼吸道综合征(SARS)”“非典型性肺炎”作为关键词标引;又,这里“非典型性肺炎”不宜缩写为“非典”,还有上文提到的“文物保护”,也不宜缩写为“文保”。
例2:《数字文化产业发展特性与文博行业数字化建设策略分析》,可选用主题词:数字技术,文化产业,博物馆,纪念馆;补充关键词:数字经济,文博行业,数字化建设。这里不选用“经济发展”“策略”等词语,因其专指性不强。
在学术论文关键词标引中,有时还会遇到希腊字母、数学符号、化学符号等计算机不能处理或容易混淆的词及符号,应尽量改写成计算机能处理和不易混淆的形式,如计算机字符比较完备,可以不作改写。
例1:《小麦抗盐突变体抗盐机理研究Na+、K+离子累积;质膜K+通道;液泡膜H+转运;mRNA差示分析;PSⅡ光化学效率》,可选用主题词:小麦,抗性育种,抗盐性,钠离子,钾离子,核糖核酸,光合系统;再用关键词:突变体。注意:这里将“Na+”“K+”分别以“钠离子”“钾离子”标出,而英文缩写PSⅡ则以“光合系统”中文名称标引。
在学术论文关键词标引时,如遇到用文中对揭示文献主题有重要意义的外文缩略语,一般应先将其翻译成中文,并将英文缩写著录在关键词括号内(也可不在关键词标引时解释,而在正文中说明)。
例1:《几种基于半导体涉及电荷转移的SERS及其增强机制研究》,可用选用主题词:半导体材料,纳米材料,氧化锌,二氧化钛;再选用关键词:电荷转移,表面增强拉曼散射(SERS)。注意:本文题名中的英文简写SERS,经译成中文,再作关键词标引。
例2:《利用AR、VR等技术手段 创新博物馆展陈形式》,可选用主题词:博物馆,数字技术,展览,陈列;再补充关键词:增强现实,虚拟现实。在这里,把AR(Augmented Reality)、VR(Virtual Reality)两个关键词直接译成中文标引。
在学术论文关键词标引时,凡涉及地点、机构、人物、历史事件、文献资料名称,以及产品名称、型号及技术参数、重要数据等,一般在主题词表中是查不到的,应根据其对揭示论文主题的重要性,直接作为关键词标引。
例1:《李德懋文学研究——兼与中国文学相比较》,可选用主题词:文学研究,中国文学,比较文学;补充关键词:李德懋,朝鲜文学。李德懋(1741-1793)是朝鲜历史上著名的文学家、诗人,也是本文的主要研究对象,故其名字虽非正式主题词,必须用关键词标引。
例2:《新中国成立前夕中国共产党接管改造新解放城市综述》,可选用主题词:中华人民共和国,中国共产党,城市,解放战争;根据文章内容补充关键词:接管改造,东北局。
总之,语言是一种十分复杂的社会文化现象,随着时代进步而不断丰富发展。只不过,有的新词出现不久,很快就得到大家认同,如“手机”“数字签名”“循环经济”等;有的新词则未必能得到社会广泛认可,诸如“佛系”“社牛”“内卷”“网抑云”“绝绝子”等。学术论文标引中如何恰当地吸收新词以适应时代发展,同时被吸收的新词又要经得起时间考验,不至于昙花一现,这是十分重要而又较难把握的一个问题。对于编辑来说,个人以为,在学术论文关键词标引时,还是宜采用主题词(叙词)加关键词(自由词)的形式为好,既使用了经过时间沉淀的相对稳定的专业词语,又较好地吸纳了现实生活不断涌现的鲜活语言,反映了日新月异的社会发展。
微信扫一扫|长按识别,进入读者交流群
|
|
|
|
|
|
|
|