台湾地区古籍书目数据库的建设及其特点

2008-01-23 04:42     字号:

 

毛建军 (南京大学中文系  江苏  210093)

  摘    对台湾地区古籍书目数据库建设情况进行较全面的调查和分析,并总结了台湾地区古籍书目数据库建设的特点。

  关键词 台湾地区  古籍数字化  古籍书目数据库 

  

古籍书目数据库是指在统一的机读目录格式下,按照相应的标准和规范进行加工,并最终以计算机网络方式向用户提供相关古籍数据资源检索的大型目录数据库。由于我国古籍的收藏分散在全国各图书收藏单位,这种状况严重阻碍了对古籍文献的充分利用。因此长期以来,编撰古籍书目成为广大古籍工作者的重要任务。古籍书目数据库的建设是古籍文献揭示的一次重大飞跃,古籍书目数据库的建立,为实现网络化服务和文献资源共享提供了条件。台湾地区计算机事业起步早于中国大陆,因此古籍书目数据库的建设也先于大陆地区。对台湾地区古籍书目数据库建设的研究,将有利于大陆地区古籍书目数据库建设的顺利实施。

1  台湾地区计算机与古籍整理的早期实践 

  台湾地区的古籍数字化资源建设是在台湾地区图书馆自动化的基础上发展起来的。1971年台湾“国科委”马志钦教授提议利用计算机做中文资料处理研究,不久几乎所有大学和电子研究机构都全力投入了这项极具潜力的领域。[11972年,台湾清华大学图书馆建立了计算机图书目录,开始了计算机用于图书编目的工作。[21984年台湾“中研院”史语所开始实施开发“史籍自动化系统”,该计划由毛汉光教授倡议,谢清俊、管束东主持开发。198471日《“中研院”古籍全文资料库发展概要》起草,标志着台湾地区古籍数字化的真正起步。[1]“中研院”古籍全文资料库的开发宗旨是:“为了中华文化的延续,务必要使古籍能活出现代风貌,不可任其在科技的洪流中式微没顶,而解决的方法,则是将古籍以电子媒体表达。”(《“中研院”古籍全文资料库发展概要》)在台湾地区,除了单位投资建设中文信息资料库外,部分个人也积极投入到这项极具挑战的工作中。

2 台湾地区古籍书目数据库的建设 

  台湾地区古籍书目数据库的编撰开始于上世纪80年代末。20世纪80年代初,台湾“中央图书馆”将馆藏善本制成机读目录,开启了台湾地区古籍书目数据库工作。其后,台北故宫博物院、台大图书馆、“中研院”傅斯年图书馆等单位也都积极参加进来,台湾“中研院”自上世纪80年代推动史籍自动化计划以来,也开发了大量的古籍书目数据库。随着计算机技术的发展以及机读编目实践的成熟,台湾地区古籍书目数据库的建设也逐步展开。

  1990年台湾“国家图书馆”编制成“台湾地区善本古籍联合目录”(数据量116034笔),向读者提供书名、作者、出版地、出版者、版本项以及主题检索服务。1998年,以“台湾地区善本古籍联合目录”为基础,由大陆及港澳、日本、美国、欧洲等地区图书馆提供若干测试数据,扩增为“中文古籍书目数据库”。目前总计收录55万余笔古籍书目资料。该数据库以Metadata格式表达,共有14个查询值可供读者检索,并提供繁、简体版查询接口。[3]  该图书馆编制的“台湾地区家谱联合目录数据库”也很有特色。数据库可供相关单位输入CMARCCNMARC以及USMARCMARC格式书目数据,以利查询、显示,兼提供著录及维护功能。将来拟进一步扩充系统,提供符合国际标准的Metadata书目数据输出功能,以利交换。台湾地区现藏中国家谱约14986种,藏量在中国家谱总数中占有相当的比重,该馆在2002年开始筹建“台湾地区家谱联合目录”,由各相关单位提供馆藏家谱数据。目前参与单位有“中

研院”民族所、“中研院”傅斯年图书馆、台北市文献会、“中央图书馆”台湾分馆、台湾省各姓渊源研究学会、宜兰县史馆、故宫博物院、“国史馆”、“国史馆”台湾文献馆、“国家图书馆”和万万斋。[4

“明人文集联合目录与篇目索引数据库”由台湾“国家图书馆”汉学研究中心研制,包括台北故宫博物院图书馆、台湾大学图书馆、“中研院”傅斯年图书馆、“国家图书馆”及汉学研究中心所藏明人文集的书目数据。“中央图书馆”台湾分馆开发的“台湾地区文献数据联合目录 ”(32113 笔)内容含台湾图书文献数据,凡古文书、古契、先贤遗著、士绅之文集、诗集、日记、账簿、族谱、家乘、祭祀公业资料等,包括“中央图书馆”、台湾省文献会、省立台中图书馆、“中研院”、台北市文献委员会、台湾师范大学图书馆、成功大学图书馆、傅斯年图书馆、台北市立图书馆等36个单位的文献数据。

  另外,台北故宫博物院开发建设了“家族谱牒文献数据库”和“善本古籍资料库”;台湾“中研院”也开发建设了“简帛金石数据库书目”、“生命医疗史研究室数据库检索”以及“中国大陆各省地方志书目查询系统”等特色专题书目数据库。

3 台湾地区古籍书目数据库建设的特点

3.1 突出数据库建设的长期性和计划性 

  古籍书目数据库的建设是一项长期性工作,因此数据库的建设也要有计划性。由于台湾地区的古籍收藏十分分散,参与古籍书目数据库建设的单位也很复杂,除了“中研院”、“国家图书馆”、台北故宫博物院、历史博物馆等古籍收藏主体单位外,台湾省文献会、“文建会”以及部分古籍收藏丰富的高校图书馆也参与古籍书目数据库的建设。早期台湾地区古籍书目数据库的建设都是各单位封闭性的研究和开发,1998年起台湾有关部门率先推动“数字博物馆项目先导计划”,开始了台湾地区古籍数字化的合作阶段。2000年台湾“中研院”受委托规划并实施“典藏数字化计划”,2001年“文建会”成立“文化数据库”领导机构。其中“典藏数字化计划”在数据库规模和社会影响方面最为突出。[5]由“国家图书馆”承担建设的“古籍联合目录数据库”是该计划较有特色的数据库。该数据库遵循“分别建库、集中检索”的建库方案,待各参与单位数据库完成后统一设置。数据库计划分为台湾地区、中国大陆地区、港澳地区、东北亚及东南亚地区、北美地区及欧洲地区。

3.2 注重数据库建设的交流与合作

台湾地区十分重视数据库建设的交流与合作。早在上个世纪80年代,台湾地区就参与了美国图书馆研究协会(简称RLG)实施的“中国古籍善本国际联合目录”计划,从中汲取了古籍书目数据库建设的实践经验。由于中国古籍的收藏主要集中在大陆地区,台湾地区十分重视与大陆地区的交流与合作。从20世纪90年代到21世纪初两岸共召开了有关古籍数字化的会议十余次。199310月台湾地区参与了由中国中文信息学会、国家古籍整理出版规划小组办公室主办、在北京召开的“海峡两岸中国古籍整理研究现代化技术研讨会”,并发起了“关于成立中华古籍整理研究现代化基金会”的倡议。[619964月由台湾“国家图书馆”汉学研究中心、全国高校古籍整理研究工作委员会联合主办,在台北召开了“两岸古籍整理学术研讨会”,两岸学者探讨了两岸未来古籍整理研究学术合作的可能性,协商了两岸古籍整理研究合作的模式。[7]进入21世纪,随着两岸古籍数字化研究的进展,有关古籍数字化的会议频频召开。“中文文献资源共建共享合作会议”就是以中文文献为核心,两岸四地及全球其他地域有关单位共同参与的合作开发数字化资源的会议,其中中文古籍合作开发是大家最为致力于合作的方向。目前会议已成功举办了4次。“中文文献资源共建共享合作会议”下有3个工作小组,其中“古籍联合目录数据库”工作小组由台湾“国家图书馆”负责,该项目旨在建立联合共享性的中文古籍书目数据库。为使“古籍联合目录数据库”合作建设工作顺利开展,“古籍联合目录数据库合作建置研讨会”已在台北成功举办了4次。

 

 

3.3 重视古籍书目数据库的兼容与整合

  台湾地区古籍书目数据库的兼容与整合包括两个方面:一是岛内数据的兼容与整合,二是与大陆地区书目数据库的兼容与整合。由于台湾地区古籍数字化建设实施的是长期计划,在数据库建设之初就已经联合各单位制定了统一的数据库标准。因此,台湾地区古籍书目数据库的兼容与整合主要是指与大陆地区的书目数据库的兼容与整合。古籍书目数据库的最终目的是向读者提供馆藏古籍书目的检索服务,所面向的使用者是两岸及全球的读者。由于两岸数据库标准的不一致,因此数据库标准的建立以及后设数据格式的建立就显得十分重要。台湾“国家图书馆”在实施“中文古籍书目数据库”过程中强烈呼吁“世界各地图书馆应提供书目数据集中置于‘中文古籍书目数据库’中,使之扩大为华文世界‘共有共享’的中文古籍联合目录”,并建议各馆自行建库,通过Z39.50Open URLHTTP等标准通讯协议整合检索,以实现资源共享。目前,两岸学者正在就建立“古籍联合目录数据库书目质量控制作业标准”、“数据库之维护”、“建文件标准”、“目录著录标准”等议题进行后续的讨论,以谋求古籍书目数据库的共通共享。[8]

参考文献

1  叶晓珍.电脑摇身,古籍一变——访“中研院”谈古籍全文检索系统[J.国文天地,1990(9):16-19.

2 程光.台湾数字图书馆的发展与启示[J.情报资料工作,2001(06):39-40,45.

3 中文古籍书目数据库简介.EB/OL.2006-08-15.http://nclcc.ncl.edu.tw/ttsweb/

rbookhtml/intr.htm.

4 台湾地区家谱联合目录数据库简介.EB/OL.2006-08-25.http://rarebook.ncl.

edu.tw/rbook.cgi/frameset4.htm.

5 罗凤珠.台湾地区中国古籍数字化的现况与展望[J.书目季刊,35(1):23-34.

6 劳飞.海峡两岸携手研讨:整理研究中国古籍如何运用现代化技术[J.语言文字应用,1994(1):71.

7鲍道.两岸古籍整理研究学术研讨会在台北召开[J.中国典籍与文化,1996(3):126-127,

118.

8 台湾“国家图书馆”特藏组.古籍联合目录数据库[EB/OL.(2006-08-15).http://www.

lib.hku.hk/ccrcd/1-7.ppt.

附表:台湾地区古籍书目数据库列表

数据库名称  开发单位  网址  备注与说明

台湾地区善本古籍联合目录。台湾“国家图书馆”。http://nclcc.ncl.edu.tw/ttscgi/

ttsweb?@0:0:1:/opc/catalog/rarecat@@0.09414726047048022116034笔;书名、作者、出版地、出版者、版本项、主题检索。

古籍影像检索系统。台湾“国家图书馆”。http://rarebook.ncl.edu.tw/rbook.cgi/

hypage.cgi?HYPAGE=home/rbook_home.htm。书目26619笔、图像书目8585笔;系统包括3个栏目:特藏珍品选介、善本资料查询、古籍影像检索。

中文古籍书目数据库。台湾“国家图书馆”。http://rarebook.ncl.edu.tw/rbook.cgi/

frameset4.htm55万余笔。

台湾地区家谱联合目录数据库。台湾“国家图书馆”。 http://rarebook.ncl.edu.tw/

rbook.cgi/frameset5.htm14986种;书名、编著者、收藏者、出版者、主题检索。

明人文集联合目录与篇目索引数据库。台湾“国家图书馆”汉学研究中心。http://ccs.ncl.edu.tw/data.html。包括台北故宫博物院图书馆、台湾大学图书馆、“中研院”傅斯年图书馆、“国家图书馆”及汉学研究中心所藏明人文集。

台湾文献数据联合目录。“中央图书馆”台湾分馆。http://192.192.13.178/cgi-bin/

gs/ugsweb.cgi?o=dunidir32113 笔;包括“中央图书馆”台湾分馆、台湾省文献会、省立台中图书馆、“中研院”、台北市文献委员会等36个单位的数据。

简帛金石数据库——书目。台湾“中研院”史语所。http://saturn.ihp.sinica.edu.tw/

~wenwu/search.htm。本系统采用中正大学信息研究所的GAIS系统。

生命医疗史研究室数据库检索。台湾“中研院”史语所。http://www.ihp.sinica.edu.tw/

%7Emedicine/book/search.htm。多项目查询、词组查询、排除字符及自然语言查询。

中国大陆各省地方志书目查询系统。台湾“中研院”。 http://gis2.sinica.edu.tw/

place/。本目录收录国内外所收藏之中国各代地方志。收录地方志之刊本时间起于宋元迄于2003年,并随时更新。

故宫博物院图书文献处数据库。台北故宫博物院。http://www.npm.gov.tw/tts/npmmeta/

dblist.htm。另有:宫中档及军机处档折件、清代文献档案总目、清代档案人名权威资料查询、清宫奏折档台湾史料等。

家族谱牒文献数据库。台北故宫博物院。http://npmhost.npm.gov.tw/ttscgi/ttsweb?

@0:0:1:phmetai::/tts/npmmeta/dblist.htm@@0.41568265284550104。族谱题名、编纂者、始迁祖、家族姓氏/地望、族谱来源检索。

善本古籍资料库。台北故宫博物院。http://npmhost.npm.gov.tw/tts/npmmeta/RB/RB.

Html。题名、著者、版本 、四部类目、卷次、朝代、元版宋版其他明版清版检索 。

 

  毛建军 南京大学中文系博士生。

 (收稿日期:2007-08-01。龚永年编发。)

附件下载

相关链接