|
-------------------------------------------------------------------------------------------------
文章主题: 书目数据库文献管理概述
发表时间: 2003年10月19日 01时00分
发表作者: 上海师范大学学报
发表内容:书目数据库文献管理概述
林雅萍 撰(上海师范大学图书馆)
《上海师范大学学报》(社科版),2002/04,119~124页
来源:青藤木屋
【内容提要】
近年来,图书情报系统发展主流模式正在逐步走向虚拟信息
服务系统。这种基于分布式网络化资源系统的核心是书目数
据库,而书目数据库的建设和使用的关键是:一、书目信息
资源管理;二、书目信息检索工具的统一;三、文献编目的
系统管理。因此,本文综合国内图情界有关学术成果,指出
中国图情系统亟需加强对书目数据库文献编目的系统管理,
以求细致分析编目数据流程、增加辅助标目工作功能、建立
和维护规范文档、仔细设计好书目规范数据库,加强文献编
目管理功能,进一步修改和完善文献编目管理系统,使文献
编目自动化程度得以进一步提高。
一、书目信息资源管理
从信息资源本身而言,信息资源的网络化带来的信息的
冗余,削弱了有效信息的提供能力。因此,在这种情况下,
如何做好书目信息资源的管理,是书目数据库文献管理的首
要任务。
信息资源管理过程的重要环节是信息组织,这是对所采
集的信息资源实施序化的过程。信息组织从逻辑上包括信息
的存贮,信息组织的相反过程是信息检索的管理。信息组织
将许多具体的信息依据一定的规则组成体系,以利人们查询
。信息检索则依据规则,从信息体系中寻找特定信息以满足
用户的需求。
作为信息资源管理活动,就其范围及性质而言,可以划
分为过程管理、网络管理和宏观调控管理3个层次;就其服
务面向而言, 可以划分为面向社会或市场提供信息资源及其
服务的法人型信息资源管理活动和面向社会组织内部提供信
息资源及其服务的依附型信息资源管理活动。信息管理还包
括对元数据的管理活动,元数据在图书管理、文件管理、网
络资源管理和企业知识管理等四类知识管理中的重要作用。
由于信息资源的网络化,对信息管理提出了更高要求。
即提供准确有序优化的信息产品,缓解信息噪声的压力,提
高信息服务的实际效率,是信息服务业必须面对的现实问题
。以此,信息资源网络化使信息服务业余现出新的发展趋势
:精品化趋势,专业化趋势,层次化趋势,个性化趋势。网
上信息的无序化呼唤着对其进行有效的管理。
书目数据库的信息组织,是通过对书目信息资源的组织
与检索的管理,以求书目信息的有序化和最优化。这包括,
书目信息组织方法与工具、信息检索方法与工具、新技术在
信息组织与检索中的应用,书目信息存贮的方法与技术等诸
多方面的管理。
书目信息资源管理的研究,则着重于各类书目信息的内
容特征与载体形式、信息的传播途径与获取方式、信息处理
与检索、网络环境下的信息资源开发与利用、网络环境下的
信息服务等。研究方向涉及较宽泛的研究领域,如图书馆学
、情报学、计算机技术、数据库和多媒体技术、网络和通讯
技术、信息加工和处理的理论与方法等。同时,还要研究信
息的收集、整理、加工、组织、存储和服务等。它涉及数据
库、计算机网络与通信、图书馆自动化、人工智能、机器翻
译、模式识别、多媒体等许多新技术。研究者以此认为,这
已经形成了信息资源管理学。
信息资源的管理活动中,虚拟图书馆是通过因特网组织
信息资源的一种有效而又经济的形式。它根据特定的学科领
域,选定因特网上与该领域有关的各种信息资源,包括与该
学科领域有关的研究机构、实验室、电子书籍、学术期刊、
会议论坛、电子布告牌、邮电列表、专家学者等的URLs(
即统一资源地址,包括Http、Gopher、Ftp、Usenet等),加
以鉴定、核实,排除“死链”,并对核实后的URLs进行合
理组织,使之能够提供检索、浏览和链接的信息集合。正是
由于虚拟图书馆对所搜集的相关信息进行了加工和再组织,
因而具有系统性和易用性的特点,能较好地满足该学科领域
的用户对特定信息的需求。
虚拟图书馆通常采用主题树和数据库这两种方式来组织
信息。主题树方式就是将虚拟图书馆所选定学科领域的所有
已获得的信息资源按照某种事先确定的概念体系结构,分门
别类逐层地加以组织,用户通过浏览的方式逐层加以选择,
层层遍历,直到找到所需要的信息线索(即相关站点链接)
,进而通过信息线索直接找到相应的网络信息资源。这种组
织方式的优点在于:简单易用,屏蔽了网络信息资源系统对
于用户的复杂性,提供了一种基于树型测览方式的浏览界面
;信息检索按照一定的体系结构,逐次查看,因而对于用户
而言,目的性强,查准率高。其缺点在于:体系的结构不能
过于复杂,每一类目录下细分的主题不宜过多,这无疑限制
了其所能容纳的因特网信息资源的数量。因而,这种组织方
式对于小型的虚拟图书馆而言是可行的,但如果虚拟图书馆
包括大量某一领域的因特网信息资源,这时就需采用数据库
方式来组织信息。
数据库方式就是将虚拟图书馆所包含的这一学科或领域
的所有已获得的因特网信息资源以固定的记录格式存储,并
提供一些检索入口,用户通过检索入口,就可以找到所需要
的信息线索(即相关站点链接),进而通过信息线索直接链
接到相应的网站。这种组织方式利用数据模型对信息进行规
范化处理,利用关系代数理论进行数据查询的优化,从而大
大提高了数据操作的灵活性,因而成为广泛的网络信息资源
组织方式。它对用户也提出了较高的要求,要求用户掌握一
定的检索技巧,包括关键词及其组配方法的选择等等,同时
,在数据库服务端,对于如何进行数据库的自动扩充,如何
提供良好的人机交互,也提出了较高的要求。
信息组织管理的最终任务与目标,随着对信息传递要求
的提高而变化。目前较为明确的提法如“数字化保存合作联
盟”(DigitalPreservation Consortium)所表述的那样, 其任
务是:“加强数字化技术在美国和其他国家的重要智力产品
的保存与获得方面的应用,提高数字技术利用的效益。”其
目标是:1跟踪检验数字化图像技术在保存与获得方面的
应用:(1)建立媒体保存的可转换性;(2)设计图书馆获
取特殊类型文件的方案;(3)保证数字化图像保存的长久
性;(4)研究符合智力识别技术的应用。2 定义与推进共
享的方法与标准:(1)发起建立关于数字化图像质量标准
的论坛;(2 )推广结构化文件(Document structure File)的
使用;(3)建立合适的目录控制标准;(4)遵守版权法;
(5)组织文献交换项目。3扩增以数字化图像保存为基础
的信息资源:(1 )鼓励服务机构对数字化图像保存技术的
使用;(2)对相关理论资源集中加以数字化图像转换;(3
)设立国际性的机构合作项目。4保持与发展获得数字化
图像文件的可信度与提供机制。
二、书目信息检索工具的统一
关于建设合理统一的书目信息检索模式和书目信息检索
工具,是书目数据库文献编目管理的又一重要任务。由于信
息环境改变,自然语言发展的趋势,对包括分类法在内的人
工检索语言带来冲击。在图书馆,分类法在搜索引擎、联机
目录或其他电子指南(electronic guides)中仍然发挥作用,
但对ISP或搜索引擎的信息组织方法却毫无办法。 因此,在
图书馆分类体系之外,在因特网环境中,传统的检索模式和
检索工具都起了重大的变化。
由于网络搜索引擎的出现,书目数据库的检索工具逐渐
分为两大类,一类是按分类索引的检索,另一类是按关键词
索引的检索,但这两类工具由于各有优缺点,已渐渐地相互
补充。对书目数据库而言,书目信息检索工具的统一是文献
分类计算机化的关键,这包括已经在我国图情界实践中的机
辅分类标引与自动分类标引系统研制、分类法机编化和机读
化、计算机分类检索、书次号自动配号系统、分类法数据
MARC格式等方面研究。
在书目数据库的检索中,无论是按分类索引的主题检索
,或是按关键词索引的关键词检索,都使得虚拟信息服务系
统中的分类法管理和统一问题凸现出来。为专家所关注的分
类工具的管理,主要包括了这些问题:“分类法在网络中可
以用于联机测览检索、非文本信息的组织、超文本系统的管
理,并可以作为网络信息组织的通用工具,促进分类主题一
体化的发展”,“应用于信息网络的分类法的主要特征:机
读化、国际通用性、兼容性、灵活性”。传统分类法在网络
信息环境下必须调整,要求其体系的一维性和语言的透明度
。其定位角色是:排架、过滤和评估网络信息、联机检索工
具、中介/转移语言、网络测览工具、专家系统的知识基础
等。
对于书目数据库分类系统的目标,司莉、俞君立、贺安
定在《我国文献分类计算机化的发展与近期目标研究》一文
中作了阐述。他们认为,21世纪前十年我国文献分类计算机
化发展的目标是:出版与推广分类法机读版、制定机读数据
分类标引规则、研究制定规范化的分类法机读格式、建立标
准化的分类规范文档、开发研制综合性自动分类标引与联机
检索及分类法管理系统、编制适用于网上信息组织与检索的
统一分类体系。文章提出这些目标和若干对策即是网络文献
分类体系管理的要素。
关于网络信息资源的分类组织的研究,目前主要集中在
三个方面:(1)关于搜索引擎及其分类体系问题。(2)关
于建立相对统一的搜索引擎的分类体系问题。(3 )关于依
据文献分类法建立的网络检索系统问题。
一些学者论证了文献分类法在网络环境下应用的可行性
,提出了相应的技术措施。如陈树年在《搜索引擎及网络信
息资源的分类组织》一文中,阐述了统一网上分类体系的意
义,构建网上分类体系的原则与技术,并提出了一个适用于
一般用户的综合性中文搜索引擎的“信息分类大纲”。如马
张华在《文献分类法在网络组织资源中的应用》一文中,归
纳与分析了依据文献分类法建立的网络检索系统的类型与特
点,并就网络分类检索系统中现有分类体系的完善、现代分
类技术的使用、网络分类系统的建立方式、标引自动化等问
题进行了研究。
将文献分类系统应用于网络资源组织,同时也是对传统
分类体系的一个挑战。与原有文献分类检索系统相比,处理
对象上,网络系统涉及到各种网络资源类型,数量大、种类
多、动态性强,对类目系统的要求更高;使用要求上,网络
系统面对的是广大终端用户,检索需求千差万别,并要求系
统有更强的易用性;技术环境上,网络系统是与各种计算机
网络的最新技术直接联系的,要求分类体系能适应技术发展
的需要。如何根据网络系统的特点和要求,对分类体系加以
完善,改进使用方法等,是建设网络分类检索系统中必须面
对的问题。
如同传统的文献检索系统一样,由于不同层次、领域、
地区的网络用户对检索存在着不同的要求,编制特点各异的
分类网络系统是必要的;但是网络空间与传统文献检索系统
在环境和技术上存在着不同,如何根据网络环境的技术特点
,在网络系统的建立过程中采用相应的编制方式,是一个有
待进一步探讨的问题。与传统的检索系统相比,网络检索系
统面对的信息资源环境更加开放,可以采用的检索方式更为
灵活,不仅其处理的资源对像是共有的,而且通过链接的方
式可以方便地进行相关站点之间的链接,各个检索系统之间
的协调十分便利。
因此有必要系统分析网络环境对分类检索系统编制的影
响,了解网络环境中各种可以更加合理地组织资源的编制形
式,探讨各种编制方式的技术、规范以及相关问题,包括其
中的知识产权问题。检索系统的建立也是一种智力劳动,应
当探讨各种编制方式在网络环境下使用的合理界限以及应注
意的问题。
对书目信息检索工具的统一,还应该包括对分类工作的
质量管理、分类标引方法与书次号等的管理。这指的是三个
方面的内容:分类质量失控的表现、分类质量失控的原因与
控制分类质量的措施。研究者列举的分类质量失控的表现归
纳起来主要有六种:一书多号,同类书异号,异书同号,同
一种书过粗标引或过细标引,对丛书的“集中和分散”处理
不当,新主题图书归类不准确等。产生分类质量失控的原因
主要有以下几点:(1)由于各数据库分类表使用本不同,
分类标引深度不一致;(2)单主题中多因素图书的分类规
则不统一;(3)文献分类法中某些类目的列类标准不清晰
;(4)未严格遵守分类标引规则等。
针对上述原因,研究者提出了以下控制分类质量的措施
:利用网上书目资源,共享分类标引成果;利用馆藏数据库
查重,严格遵守分类标引程序;利用计算机增加分类标引深
度;对论述单主题中多因素的着作,分类法编制机构应制定
出详尽而统一的分类规则;进一步完善分类人员的知识结构
;健全、完善分类工作制度。
目前,一些图书馆数据库采用的Z3950接口进行联机
联网编目、书目信息的检索,在一定程度上提高了文献资源
的共享效果,而另外一些文献管理机构由于受经济利益的驱
使,长期封闭本单位数据库。这使得一般用户无法享用信息
资源。这在一定程度上削弱了网络信息检索的社会效益。但
是,从技术上说,使得联机检索效益降低的原因,是书目数
据库的联机目前还局限在某一台或几台主机上的特定数据库
。而网络信息检索在检索空间方面比传统情报检索大大增加
,它可以检索所有在网络上的资源。
利用服务器的信息检索工具搜索数据库的信息已经成为
域网环境下数据库工作的新型网络信息检索工具。WWW 服
务器的信息检索模式就是以Internet网为媒介,利用网络信息
检索工具,探索所需书目数据信息的一种方法。WWW信息
检索空间是衡量信息检索工具的重要指标之一。 WWW服务
器的网络信息检索在这方面具有传统信息检索和Internet 基
本信息服务所不具备的优势。
网络信息检索对用户屏蔽了网络的各种物理差异,使用
户在使用这些服务时感受到明显的系统透明度。这里所指的
物理差异包括主机的硬件平台、操作系统等软件上的差异,
客户程序和服务程序版本上的差异,主机的地理位置,信息
的存储方式甚至是通信协议的差别(如WWW服务器客户程
序可以通过多种协议使用各种不同的信息资源)等。这一特
点对网络环境下的信息检索来说是十分关键的。
这一检索的不足是,检索的准确率有待进一步提高。网
络信息检索一般要通过信息的收集,整理,分类,索引从而
产生数据库以供检索,按照相关程度将找到的信息排出次序
,此数据库一般由WWW 服务器页题目、页标题所做的文摘
或摘录以及超文本链接点组成。所以它需要大量的人员收集
跟踪Internet网络上的WWW服务器、FTP、Gopher动态,对它
们进行处理,对每个网点加以注释,给出主题词或关键词,
以便于最终用户的检索。
三、文献编目的系统管理
书目数据库文献管理的另一方面的工作,就是要重视对
文献编目过程的系统管理,即加强对虚拟信息服务体系的资
源建设。
传统的图书馆馆藏建设也强调以满足用户需要为目标,
但它的基本视域是收集资源建立馆藏的过程(可称为
From─Store模式), 因此它更多地关注收集和占有资源,
更多地关心资源收集组织的规模与效率,其工作往往终止于
馆藏系统。传统馆藏建设的这些特点有其历史必然,但面临
网络化数字化信息环境,供应管理可能逐渐主导信息系统的
资源建设。
作为虚拟图书馆的信息服务系统,一般具有以下特点:
(1 )
多样化信息资源,包括数字化期刊、文摘索引数据库、书目
数据库、图书馆藏书、数字化文献库、Web网站等, 并有逐
步以数字化资源为主导的趋势;
(2)
分布式信息资源,而且资源提供者可能与服务提供者分离,
资源提供者包括出版商、文摘索引商、检索服务商、学术研
究机构或其他图书馆,服务提供者主要是图书馆或图书馆组
成的联合系统;
(3 )服务提供者对资源的使用提供保障;
(4 )每个服务提供者都面向一个分布的由多类用户组成的
用户群;
(5 )多个服务提供者组成联合系统合作购买数字化资源和
提供信息服务。这种体系逐渐成为网络环境下信息资源和服
务机制的重组与创新。
由于网络和数字信息的急剧发展,目前虚拟状态的图书
信息服务系统存在的问题,不是信息系统和信息资源的缺位
,而是信息资源的整合和信息提供手段合理,以及书目数据
库数据的存取,包括检索引擎统一问题。因此,有些信息管
理研究者提出了书目文献编目管理的理念是值得引起重视的
,比如,“虚拟信息服务体系的资源建设的供应管理理念”
(张晓林);“加强文献编目管理功能”(周升恒)等。
张晓林的《虚拟信息服务系统的供应管理理念》一文提
出了在新的系统环境下资源建设的新理念、新视角。认为虚
拟信息服务系统资源建设的核心理念是供应管理(Supply
Management)。 供应管理的基本视点是将资源提供给使用
者的全过程(即所谓From─Through─To 过程),是基于用
户和基于使用的资源建设。所谓Just─In─Time供应和虚拟
仓储就是这种理念的体现。
虚拟信息服务系统资源建设供应管理基本理念是:将信
息资源提供给使用者的全过程,是基于用户和使用的资源建
设。供应管理的目标不是占有资源,而是将用户所需信息在
用户需要的时候提供给用户;供应管理的实质不是建立“保
障性”的库存,而是建立有保障的供应链;供应管理的考核
不是库存数量或资源占有率,而是用户的需求保障率;供应
管理的生存取决于资源供应的经济性,即如何在保障对用户
的资源供给的同时减少资源浪费和资源建设成本。面临网络
化数字化信息环境,供应管理可能逐渐主导信息系统的资源
建设。
虚拟信息服务系统供应管理是一种集成化管理,涉及数
据信息供应管理各个方面,但是它的核心问题是怎样形成从
资源到用户高效率的供应链。对于书目数据库的管理者来说
,一个主要方面是建立对虚拟资源体系的联合着录控制。这
涉及到虚拟信息服务系统的书目数据的着录格式、分类标准
、信息检索模式、以及信息检索工具的统一等。这些都是书
目数据库的文献编目管理的主要任务。
具体操作过程中,关于中文图书编目的业务问题很多。
诸如,中文图书的书目数据的编制,还存在不少问题,主要
表现在以下三个方面:(1)着录规则执行不一致, 特别体
现在图书题名的识别导致着录方式的不统一;(2)由于编
目中缺乏规范控制过程, 导致标目的选取和标目形式的不
一致;(3)机读格式的理解和使用的不一致。 这些问题的
存在,严重影响了中文图书书目数据的质量,从而影响了书
目信息检索和使用以及书目资源的共享。
对此,周升恒认为,要从根本上解决这些问题,必须加
强基础业务建设。即:(1)制定一个完整的、 共同遵守的
《中文图书编目规则》。(2)使用统一的《中文图书机读
目录格式使用手册》。(3)在编目工作中实现规范控制过
程。建立自动化系统后,编目过程的重点逐渐转移到排检项
中标目的着录,即规范控制的过程。由于着录的工作量占整
个编目工作的比例正在逐渐减小。因此,规范工作,是今后
编目工作的中心内容和重要组成部分。随着编目工作的模式
和工作内容的变更,编目流程将发生变化,编目人员的业务
分工也更为明显,规范控制过程必须在编目工作中实现。
-----------------
【参考文献】
[1]
张晓林网络环境下的文献资源共享[A]世纪之交:图
书馆事业回顾与展望[C]北京:北京图书馆出版社,
19997。
[2]
张晓林,等网络化数字化基础上的学术信息交流体系及其
影响[J]图书馆,2000。
[3]
陈昭珍网络化的资源分享(学术讲座)[Z]第二届高
级图书馆员培训班,19997。
[4]
周升恒关于中文图书编目的几个业务问题[J]国家图书
馆研究馆员。
[5]
马张华文献分类法在网络资源组织中的应用[A]蓝帆
企业信息中心,论文集萃。
[6]
俞君立,吴礼志1999─2000年我国文献分类研究进展[J]
图书馆杂誌2001,124(8)。
[7]
俞君立,吴礼志关于文献分类标引方法的研究。
[8]
霍国庆论信息资源管理学,中国科学院文献情报中心 北京。
[9]
霍国庆信息资源管理的三个层次[J]中国图书馆学报,1996:(5)。
[10]
邱均平,刘霞信息资源网络化对信息服务业的影响分析[J]。
[11]
王忠红网络信息环境下的传统分类法图书情报工作,
1999(2):37─39。
[12]
数字化保存合作联盟任务与目标[J/OL]Digital
Preservation Consortium, Mission and Goals
http://www.ifla. org/documents/libraries/net/dpcl.txt
[13]
洪漪,梁树柏分类法在信息网络中的应用[J] 情报学报,1998(1):19─22。
[14]
李广健,张蕾网上搜索引擎的几个理论问题[J] 情报
科学,1999(7):365─368。
[15]
陈光祚论“图书情报虚拟图书馆”的建设[J] 中国图
书馆学报,2000(1):19─23。
来自61.217.195.54 |
|