论文献主题标引的质量控制

2007-06-22 03:21     字号:
 

周庆玲 (厦门图书馆 福建 361003)

 

图书馆的书目是人们获取与利用文献信息的主要工具。随着知识经济的迅猛发展,各种学科的渗透与交叉不断地产生出新的学科和新的知识领域,带来了文献内容的多样化,这就必然对图书馆书目数据的质量提出更高的要求。主题作为书目数据的重要检索途径,其标引是否达到正确、规范的质量要求,对书目数据库的利用具有重要的影响。因此,图书馆要为读者提供方便、快捷的文献检索服务,必然要加强文献主题标引的质量控制。

1 文献主题标引质量控制的重要性

在手工检索时代,主题检索在图书馆文献检索中的作用不甚突出。随着计算机及网络技术在图书馆的广泛应用,主题法作为一种组织网络信息资源的有效检索机制,其优点得以充分显示。它根据文献内容主题,以主题词表为依据对文献进行描述和揭示,将杂乱无序的文献转变为有序、规范的文献检索体系,具有专指、灵活和直接的特点。更为重要的是它利用词汇关系链来组织领域知识,能将某一主题概念的文献资料准确地、集中地、全面地提供给用户,达到较高的检索效率。因此,在信息量激增的今天,文献信息的主题检索越来越受到人们的重视。目前,我国图书馆大都使用《汉语主题词表》、《中国分类主题词表》对文献进行标引。主题词表是规范的标引工具,为图书馆的文献标引提供依据。然而,书目数据是由编目人员具体完成的,标引人员对文献的主题分析是否准确,赋予标识是否专指,标引深度是否适当,同类文献标引是否一致,都会影响读者的检全率和检准率。

首先,对文献主题分析和概念转换的准确程度,决定着文献的标引质量。试想,文献的主题分析和提炼出现误差,读者又怎能准确地查检到所需的文献信息?例如马克思著《哲学的贫困——答蒲鲁东先生的贫困的哲学》,标引为:“哲学——马克思著作”,但是根据原始文献分析,马克思在这本书中还重点批判了蒲鲁东的政治经济学观点,因此该书还有一个重要的学科主题概念“政治经济学”。

其次,赋予文献的检索标识与文献实际的主题概念的相符程度,对读者的检全率和检准率有较大的影响。专指度过低,不能对文献主题进行有效的区分和类聚,读者检索时难以获得较高的检准率;专指度过高,又可能造成相同主题文献的分散,读者检索时难以获得较高的检全率。

第三,文献的标引深度不适当,亦影响读者的检全率和检准率。标引深度不足,一些重要的主题可能被忽略,影响文献的检全率;标引深度过高,使用的主题词多了,主题词之间的虚假组配的可能性越大,从而增加误检率。

第四,标引人员对同一篇文献或相同主题的文献赋予检索标识的一致程度,对读者的检全率影响就更大了。例如《Internet基本知识》一书,有的图书馆标引成:“互连网络—基本知识”;有的图书馆则标引成:“因特网—基本知识”。又如《XP一点通》,有的图书馆标引成:“操作系统—XP”;有的图书馆则标引成:“窗口软件—基本知识”。

从以上分析可以看到,从文献主题分析到确定主题标识的整个主题标引工作过程,有众多的因素影响着主题标引的质量。因此,在进行主题标引时,必须强调质量的管理和监督。我们应该看到,主题标引的质量控制是推动信息和文献工作按科学技术规律发展的重要技术基础,是实现文献共享的前提条件,是与国际接轨的重要措施。没有高质量的书目数据,没有准确规范的文献主题标引,就谈不上文献信息资源共享。

2 当前文献主题标引存在的问题和产生的原因

目前,图书馆编制书目数据多采用套录数据与原始编目相结合的方式。套录的数据多源于权威的编目中心,数据质量有保证。但由于目前图书出版形式多样、发行渠道复杂、图书数据滞后等原因,套录数据的命中率不太高,大量新书仍需进行原始编目。而原始编目由各图书馆自己进行,稍不注意就容易出现一些质量误差。主题标引常出现的问题主要有:

2.1 主题标引深度不够,停留在浅标引水平。相对于手工检索系统,计算机检索系统的主题标引应适当加深标引深度。这既是充分发挥叙词语言优异性能的需要,又是充分利用计算机检索系统的存储、处理和检索能力,全面提高检索效率的需要。但许多图书馆不管文献内容复杂与否,都只对文献作整体标引,而且只概括揭示文献的基本主题内容,对于文献的从属主题、局部主题及隐含主题一般不予揭示,只用几个主题词组配标引。导致标引深度不足的主要原因,是对文献主题内容分析的不全面,也就是说遗漏了文献中论述

了并符合检索系统要求的主题概念,如有参考价值和检索价值的局部主题、隐含主题、次要主题等,从而造成漏标。例如《中国同盟会》,“同盟会”是显性主题,但是辛亥革命是同盟会所从事的革命活动中最为重要的部分,“辛亥革命”当是其隐性主题,如果只标同盟会,那其隐含的主题就漏标了。又如《医用胶的临床作用》一书,只标引其显性主题:“医用胶—临床应用”,而漏标其重要的隐含主题:“医用胶—副作用。”

2.2 选词不够专指。主题词的选词主要从学科体系入手,不同类型不同学科的文献主题标引时,主题构成因素和检索入口等都有所不同。《中国分类主题词表》中,与分类号对应的主题词(包括类名对应的主题词、注释对应的主题词、类目主题范围对应的主题词)往往有数个甚至数十个,在对文献进行主题标引时,首先要选用与主题概念的内涵、外延相符的专指词;若没有专指词再考虑组配标引、上位词或靠词标引,这是文献标引专指性规则的基本要求。而有的图书馆编目人员在选词标引时,违反了专指性规划。例如《二十一世纪大趋势》一书,标引成:“社会—分析—美国”;“社会—分析—世界”;词表里已有专指的主题词“社会分析”,用“社会—分析”进行组配标引违反了专指性原则。又如《当代生命伦理的困惑》,标引成:“生命科学—伦理学”,“伦理学”是上位词,用“伦理学”就不如用“医学伦理学”更专指。2.3 主题标引的不一致。〖HT〗标引的一致性主要是要求对同一文献或相同主题的文献赋予相同的检索标识。一致的主题标引可以使相同主题概念的文献集中在相同的检索标识之下,从而提高检索效率,保证读者在检索时能检全与检准。当前,国内绝大多数图书馆对文献的主题标引没有实行规范控制。如对于《中国分类主题词表》中收录的部分同义及近义主题词,像“应用软件”、“应用程序”等,在实际工作中如何取舍,需要统一规范。又如词间的“用”、“代”关系的选择,反复到馆的同一类图书,如计算机操作系统、计算机应用软件、开发软件类图书的标引,都没有统一的规定,使主题标引具有随意性、人为性,从而导致主题标引的不一致。

3 提高文献主题标引质量的对策

主题标引是一项环节多、技术性较强的工作,要提高主题标引质量,必须对主题标引的全过程进行科学的组织和有效的质量管理。如何做好文献标引的规范化,将文献主题标引质量控制在较高水平,尽可能达到正确、专指、适度、一致的要求,是值得我们认真研究的问题,应当从以下几个方面着手:

3.1 制定明确的标引细则。为了充分发挥计算机系统存储量大、检索快捷、能从更多途径查找文献信息的功能,实际工作中应结合本单位的专业特点、设备特点、检索用户的要求及文献的特点等因素,制定详细、明确的标引工作细则,作为标引质量控制的依据。其内容应包括:不同学科专业文献的标引深度;组配的级别;同义词、近义词的取舍;非控主题词标引的使用。对于反复到馆且标引方法多种多样的某类文献,如计算机类文献等,更应规定采用统一的标引方法。

3.2 严格执行标引基本规划。主题标引有整套的基本规则,在操作过程中应严格遵守。在执行标引规则时,应注意以下几个方面:

3.2.1 注意选词的精确性。在标引时,标引人员要精确地把握住专业词汇的内涵及相互关系,所选择的主题词要切题,充分表达文献主题概念的内涵和外延。有专指性的主题词就不选泛指性的主题词;组配标引要遵守概念组配的原则,防止产生歧义;边缘学科、新兴学科和交叉学科要根据具体情况慎重使用上位标引、挂靠标引或增词标引的方法。

3.2.2 注意标引的一致性。由于文献本身的复杂性、著者形式的多样化以及不同编目人员或同一编目人员在不同时间对文献处理的不一致,常出现检索点形式不同的情况。为避免这种现象的发生,就必须进行规范控制,保证书目数据中主题标引的一致性。例如对自控主

题词标引的应用要做到不能单独使用,只能作为补充标引使用。自控主题词中从文献题名、章节或内容中提取对文献起关键作用的名词术语,应选择词义清晰、概念明确的词不加规范,直接标引。

3.2.3 注意揭示的全面性。计算机存储量大,可在检索系统中经过逻辑运算,进行主题词的组配,达到专指性检索需求。因此,对具有较高研究价值的文献,应充分利用计算机的优势实行全面标引,把文献中全部有价值、符合检索系统要求的主题都给予揭示。具体标引时,应仔细、全面地阅读该文献,对文献中显性和隐性的主题应注意充分揭示。

3.3 建立质量检查制度。严格的审校制度是控制主题标引质量的重要环节,每个图书馆的编目部门都必须建立质量检查制度,通过自检、互检、专检等形式进行质量检查。其中,设置数据质检员严把审校关尤其重要。质检员对本馆书目数据库的质量负全责,专门对文献的标引结果进行审查与校核。通过审查与校核,发现标引中的差错并及时纠正,切实保证文献主题的标引质量。

3.4 提高文献标引人员的素质。文献主题标引工作是一种专业性和技术性较强的智力劳动,标引人员的素质对标引质量有直接影响,因此,要提高文献主题标引质量,必须提高标引人员的素质。首先,每个标引人员都必须掌握标引的基本知识,充分了解主题词表的体系结构,熟练运用相应的标引方法和规则。其次,标引人员要具备广博的学科知识和较专的相关学科知识,如具备一定的计算机知识和语文水平,同时对与编目工作有关的各个知识领域的研究对象、学科分支及新学科、新技术等,也要适当了解。标引人员只有具备上述知识,才能在具体的标引工作中正确把握文献的主题,选择恰当的主题词,把文献的

主题恰到好处地表达出来。

参考文献

1 藏国全.论网络信息组织.图书情报知识,2002(3) 

2 陈树年.中国分类主题词表标引手册.北京:北京图书馆出版社,1998

3 黄俊贵.文献编目工作.北京:北京图书馆出版社,2000

4 王幼珍.数据库质量的关键及其控制.图书馆论坛,1996(6) 

5 刘五一.对主题标引一致性的探讨.图书馆论坛,2000(1)

6 曹树金,罗春荣.信息组织的分类法与主题法.北京:北京图书馆出版社,2002

(收稿日期:2005-02-18。龚永年编发。)

附件下载

相关链接