高校图书馆大数据平台建设及服务提升初探

2016-01-04 03:44     字号:

高校图书馆大数据平台建设及服务提升初探

翁娇端(漳州职业技术学院图书馆  福建  63000)

 

   以大数据时代的发展趋势为切入点,结合当前高校图书馆的现状,研究大数据对高校图书馆管理及文化影响,提出建立大数据平台及实现云端共享的可能性,探讨高校图书馆在新环境下发挥“第三空间”属性及功能提升的对策。

关键词  大数据  高校图书馆  平台建设  第三空间

 

从麦肯锡《大数据:创新、竞争和生产力的下一个前沿》报告到《大数据时代:生活、工作与思维的大变革》[1]的问世,大数据的概念、技术都得到巨大的发展,人们用它来描述和定义信息爆炸时代产生的海量数据时代来临。2013年甚至被人们称为“大数据元年”。随着大数据理论研究的深入和大数据时代的来临,高校图书馆也开始探寻新的发展方向。在web2.0数字技术的发展中,高校图书馆勇敢地承担着先行者的角色,立足资源整合,加强新技术应用,使读者获取的知识更加全面,文化的传播更加顺畅。在大数据时代,高校图书馆应如何定位发展,如何借助新技术进一步创新服务方式,丰富读者体验,已成为当今高校图书馆工作者思考的重要问题。

1 大数据时代对高校图书馆的影响

“大数据”能够帮助人们更加经济、便捷地从高频率的、不同结构和类型的、海量但可计算的数据中获取价值,并将之应用于实际中。加工、整合、处理、挖掘,是大数据的工作流程。高校是一个充满着数据的场所,学生的学习需求、教师的科研倾向、社会各行各业的发展预期及技术需求等,都能够形成一组组的数据。但这些数据多数并未得到研究者的关注,或者只是少数研究者对单一领域、短时期内的数据进行研究。大数据时代的到来,将会改变高校内数据使用及研究的状况,而这种改变首先将给高校图书馆带来巨大的影响与变化。

1.1 图书馆管理的意识数据化、观念云端化

大数据时代中,图书馆人首先会受到观念上的冲击。大数据所带来的“数据化”的存储意识和“云端化”应用观念将会对传统意义上的图书馆在载体、功能上产生巨大的影响。每一个行为所产生的数据化信息,都要被存储起来,以备数据挖掘时使用;每一处人际交互或信息处理的位置,都有加入“云端”的可能性。在这样的意识与观念之下,图书馆人将会获得一个全新的观察视野、思考方式及工作模式。高校图书馆的数字化建设不再固步自封于传统的馆内数字化,而是将服务拓展到云端,通过云端的强大信息处理能力,有针对性地获取广泛读者的信息需求、兴趣爱好等数据,以指引图书馆建设与发展。

1.2 图书馆载体的信息数据化、属性双重化

在大数据背景下,图书馆作为知识存储的载体功能,将进一步演化为超越多媒体的数据载体功能。馆藏数据库的建设要与周边数据库、云端数据库对接,形成巨大的云端信息平台;用户所需要的内容不只有借阅纸本、光盘的途径,还可以通过电子化的信息传输获得信息;用户所需要的信息也不仅仅局限在静态化的数据或材料,而是能够通过大数据的监控、统计、挖掘等,得到所需的动态化信息、衍生化信息等。在此基础上,图书馆的物质属性将发生变化,“传输”变少,“存储”变大;而其精神属性将会被进一步放大,即图书馆将成为“第三空间”——一个更有利于平等交流、精神互动的开放平台,图书馆也因此拥有了双重属性。

1.3 图书馆核心竞争力的提升

传统图书馆主要通过采购纸本及数字资源丰富自身馆藏,该时期图书馆的核心竞争力与其所掌握的资金成正比,资金越多,图书馆就能够购买更多的资源供读者利用,图书馆始终扮演被动服务角色。在大数据时代,人们对信息的要求更加苛刻,不仅希望用最快方式获取正确信息,筛除错误信息,而且更希望这些信息能够第一时间转换为知识成果。在这种情况下,图书馆如果能够为读者提供针对性的服务,将能极大地提高资源的利用效率,节约读者时间。大数据时代的数据处理,不仅数据的数量是关键,数据的处理方法更为重要。图书馆进行大数据处理的时候,应加强方法研究,根据读者特点和研究方向,缩小处理范围,提高处理效率,从交错繁杂的数据中获取知识供读者利用。这种效率的提高,代表着图书馆服务的进步,是图书馆核心竞争力提升的直观体现。

伴随着大数据对高校图书馆管理及图书馆文化影响的逐步深化,高校图书馆在服务范围、方式、手段、模式等方面都将发生巨大的变化,数据分析、数据挖掘、数据增值等大数据服务的内容,将会主导并决定着高校图书馆功能的提升。科技是一把双刃剑,合理利用将能有效提升图书馆的作用及影响力,否则图书馆将面临被边缘化的危险。

2 高校图书馆大数据平台建设的可能性探索及策略

目前国内图书馆界对大数据的研究大多处于理论研究层面,陆静对2003—2013年间我国图书馆界大数据领域的研究进行了统计分析后认为:我国图书馆界重在对大数据的理论介绍,而忽视了大数据在图书馆的应用实践研究[2]。可喜的是,清华大学图书馆、北京大学图书馆等一些科研实力较强的高校图书馆,逐渐开始了大数据实践,例如清华大学图书馆以海量多来源数据为基础,在数据集成、数据挖掘、元数据汇集、基于时间轴进行趋势分析、建立以学者为中心的知识关联网络等方面进行努力,变革图书馆服务模式,促进知识的传播与再利用。[3]

为了顺应时代的发展,图书馆必须拓宽发展思路,创新服务模式,改善服务项目,从而发挥其保存人类文化遗产、开发信息资源、参与社会教育等基本职能。因此,高校图书馆在功能上的提升,首先就要求实现大数据平台的建设。

2.1 基于云计算的高校图书馆大数据平台建设

虽然随着信息技术的不断发展,数据的存储与运算成本大幅下降,但是面对庞大的数据量,传统数据存储与处理设备的采购成本依旧高昂,难以被大多数高校图书馆所接受。云计算的出现很好地缓解了图书馆的压力,云计算以动态、可拓展的资源,高达每秒10万亿次的运算能力,能完全满足图书馆大数据处理要求,因此高校图书馆大数据平台建设应当与云计算同时推进。

以云计算作为高校图书馆大数据服务平台,一方面,将图书馆从数据存储及处理的资源瓶颈中解脱出来,节约了图书馆有限的资源采购经费,图书馆有更多精力投入到读者需求分析、大数据筛选、趋势分析等服务中,加速推进图书馆大数据应用。另一方面,云计算为图书馆提供了庞大的数据来源。云计算应用已经全面普及,用户遍及各类型的机构和个人用户,这些用户产生的数据,是图书馆大数据平台不可或缺的宝贵资源。一个较为典型的应用案例是OCLC(Online Computer Library Center,Inc)的WorldCat Local云服务。2009 年,OCLC 宣布实施将图书馆管理服务推向Web级的战略,推出了OCLC WorldCat Local和OCLC WorldCat.org,其涵盖了全球1万个主要的图书馆联合目录,包括1.8亿种信息资源,400多语种15 亿个馆藏信息,标示了全球收藏每一种信息的图书馆名称。[4]不仅如此,WorldCat Local还具备元数据检索、全文解析、知识发现、社交网络等功能,通过大量数据的处理分析,为读者提供个性化服务,让读者能够最快获取到所需资源。WorldCat Local标志着OCLC的服务方式,由传统的封闭式发展为一种开发、平等、共建、共享的服务模式。

基于云计算的服务平台,不论从在效益上还是处理能力上,都能够较好满足大数据处理要求,应成为未来图书馆大数据平台建设的主要方向。

2.2 高校图书馆大数据服务功能定位及发展

大数据时代下,高校图书馆面对海量数据,应制定符合自身发展需要的大数据服务战略,借助云计算技术减少数据处理开支,提高数据利用效率,提升服务质量。高校图书馆在数据获取、数据应用、数据增值上应有自身发展定位。

首先在数据获取上,一方面,高校图书馆应重视本馆基础馆藏数据收集与利用,包括对文献管理数据库、读者数据库、光盘数据库、数字化资源数据库等数据进行有效整合,面向读者提供简单化、统一的检索平台,降低读者获取资源的门槛;另一方面,应增加数据共享,通过与其他数据源(周边或同类高校图书馆)的数据交互,实现一定区域的数据合作,尽可能多地为读者提供海量数据资源选择。

其次在数据应用上,高校图书馆应详细分析其服务对象的信息需求,制定出有针对性的大数据服务战略,将有限的资源用在最有价值的地方。面对海量的数据,图书馆不应一味扩充存储容量,以容量评估图书馆成就,而应采用减法思维,及时摒弃不需要、不实用的数据,提高数据的利用效率。在大数据时代,读者的信息需求是多元的,多变的,图书馆在扩充数据量以备读者使用的同时,更应当注重方法研究。图书馆应将有价值的数据及其采集、处理方法保留起来,形成可通用模版,以提高数据再次检索和利用效率,供不同读者重复使用。

最后在数据增值上,高校图书馆的数据增值服务表现在两个方面:一是数据挖掘的服务,既利用本身的数据资源及团队,为有数据需要的客户提供数据收集、数据分析、参考咨询等服务;二是客户端开发及推广,也就是在现有电子图书馆的基础上,开发出更富于个性化、人性化、便利性的数据查询、数据使用客户端。通过信息增值,加强图书馆与用户的联系,关联用户、图书馆、信息服务机构、第三方面资源等,从而实现地更好服务高校用户的目标。

2.3 图书馆大数据共建与共享

百度技术委员会理事长陈尚义透露,“百度每天处理的数据量将近100个PB,1PB就等于100万个G,相当于5000个国家图书馆的信息量的总和”[5]。单一高校图书馆是无法实现如此大规模的数据处理的,但是通过联合及整合,高校图书馆能够实现大数据平台建设。要构建高校图书馆的大数据平台,必须将之放大到整个高校,甚至是基于信息互联的高校园区、高校联盟、产学研联合机构等。通过前期策划及规划,对覆盖范围内的优质信息内容进行归整,纳入到数据采集范围内,并通过前沿科技——以信息通讯技术为代表的辅助手段,建立起具有逻辑性的自动化、智能化处理方式,从而实现有效信息的采集、存储和分析挖掘。

云计算环境下的大数据平台主张数据的共建与共享,扩大资源共有总量,满足更多读者的需求。多元的载体、交互的数据库,能够使信息的应用渠道变得多元,既可以满足校内的需求——教师科研、师资教研、学生学习、拓展知识的需要,又能够满足校外的需求——基于服务区域经济发展的服务项目和领先行业领域的科研等。共享化的云计算服务,将使数据处理速度加快,最大限度地发挥图书馆文献信息资源效率,为更多的读者提供优质的大数据服务。

目前,国内一些图书馆文献管理系统开始重视图书馆资源间的共享。例如广州图创公司研发的Interlib 图书馆集群管理系统,通过Internet网络、校园网、城域网将图书馆联合起来,组成一个区域性的虚拟图书馆群,通过开放的多层结构达到与国内外其他图书馆的资源共享与协作,在真正意义上实现图书馆群的资源管理和业务协作[6]

3 高校图书馆的属性发展及第三空间功能提升

从图书馆出现至今,图书馆的属性总是随着时代发生变化,从最初的知识存储空间到知识传播、信息互动空间,再到大数据时代,高校图书馆所具有的双重性质——仓库与聚会场所。图书馆功能属性的变化,要求高校图书馆人要更有效地了解自身,挖掘潜力,发挥图书馆的功能。大数据时代,高校图书馆将成为高校“第三空间”的重要组成。“第三空间”这个概念最早由美国社会学家Ray Oldenburg提出,是指家庭环境(宿舍区)、职场环境(教学区)之外的其他空间的组成,具有平等包容、自由开放、休闲便利的语境和人文关怀、温情呵护的属性。大数据时代的高校图书馆,不再是藏书库和自习室,更多第三空间的功能需要进一步发掘。

3.1 泛在知识环境与深度学习功能的提升

在大数据服务的支持下,图书馆将具备更深层次的数据服务能力,能够为读者提供一个泛在化的学习环境。不论是在图书馆书架旁还是在独立的阅读空间,读者都能够享受到图书馆提供的数据资源服务。对读者而言,他们可以随时通过终端设备接入图书馆服务,获取图书馆提供的海量数据资源,在图书馆中的学习活动犹如在咖啡馆中一样轻松自如。而对于图书馆,则可以及时获取读者的信息需求,分析读者属性、喜好及学习方向,筛选出合适的资源供读者使用,为读者的深度学习和研究提供数据支持。

3.2 兴趣交互功能的提升

图书馆大数据的处理,离不开对读者的分析与研究,只有了解读者,才能够有针对性地进行数据采集、处理和利用。借助于WEB、人工智能、RFID、LBS(基于位置的服务)、上下文感知等技术,图书馆能够与读者进行数据交互,随时了解读者动态,及时满足读者需求。清华大学推出的机器人小图,能够在与读者的互动过程中进行学习,在无人干预的情况下为读者进行服务;北京大学图书馆推出了“馆内通”手机APP,能够及时了解进馆读者在图书馆各角落的动态信息,为图书馆服务的改善提供数据支持。这些服务的开展都离不开大数据的支持,它让图书馆变得更加智能,读者在图书馆空间中的体验更加丰富有趣。

3.3 数据应用功能的提升

图书馆文化作为人类文化之集大成者,是人类不断探索自然规律和社会规律的结晶。在当今时代,图书馆文化的实用因素将进一步加强,透过大数据的应用,将会把越来越多的用户吸引到图书馆平台上来。而图书馆的功能也会呈现多元化,索引功能、推荐功能、整合功能、挖掘功能等这些以前图书馆人想做而未做的事,想做而少做的事,将被一一实现;与之伴随的数据信息的移动化服务、信息资源的多媒体同步、信息检索的便捷人性化等特点,也会融入到文化及服务之中。

3.4 移动媒体功能的提升

在“2014年腾讯网媒体高峰论坛”上,腾讯科技与中国人民大学新闻学院新媒体研究所共同发布了移动媒体趋势报告《中国网络媒体的未来2014》,报告中指出,2014年6月,中国手机上网比例首次超过了PC机,手机网民规模超过八成[7]。在移动互联网环境下,读者对信息的内容品质要求更高,信息偏好更具个性化。在此趋势下,移动媒体能否抓住用户心理,保持用户黏性,将决定其成败。

“在我们可以预见的未来,无论是产品还是服务,都将为每一个消费者量身打造,信息世界正在变得越来越聪明和智能,似乎比我们还了解自己想要的是什么。”[8]手机APP“今日头条”便是一个成功的案例:在如今各种信息塞满互联网的情况下,该软件能够跟踪用户习惯,主动学习用户兴趣爱好,从庞杂的网络资源中筛选出用户感兴趣的个性化内容,主动推送给用户,以满足用户的信息需求。《中国网络媒体的未来2014》报告指出,未来移动媒体的创新公式是:内容服务创新+形式创新+场景元素创新+社交元素创新。在大数据时代,图书馆作为文化传播的媒介,同样需要重视移动媒介的研究。未来的图书馆也将能够适配读者的场景、情境的个性化需求,从服务内容上和服务形式上不断满足读者需求。

综上所述,大数据背景下,高校图书馆要更有效地发挥作用,必须加强大数据平台建设,通过大数据平台以及云端共享的实现,推动图书馆功能上不断完善,尤其是在“第三空间”功能上的提升。但是,作为一个新兴的事物,大数据平台建设需要从软件及硬件两个方面着手,高校图书馆的投入、建设、实施、发挥作用也是一个长期的过程,需要更多的高校图书馆研究者及从业者去研究并实践,不断解决实践过程中出现的新问题。

参考文献

1 维克托·迈尔-舍恩伯格,肯尼思·库克耶. 盛杨燕,周涛译.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2012.

2 陆静,我国图书馆界大数据研究评述与展望[J].图书馆杂志,2014(1):20-25.

3 邓景康.大数据环境下清华大学图书馆的实践[N].数字时代周刊,2013-08-29.

4 谢原.图书馆联盟云计算服务平台的设计与实现——以吉林省图书馆联盟云服务平台建设为例[J]. 情报科学,2012(12):1854-1857.

5 陈尚义.百度的大数据挑战[EB/OL].http://www.csdn.net/article.html.2012-05-25.

6 图创软件.图书馆集群系统[EB/OL].http://www.interlib.com.cn/tcsoft/web.html.

7 腾讯科技,中国人民大学新闻学院新媒体研究所.中国网络媒体的未来2014[EB/OL]. [2014-11-12].http://tech.qq.com/a/20141112/049143.htm.

8 苏萌,柏林森,周涛.个性化:商业的未来[M].北京:机械工业出版社,2012.

9 江云,李凤兰.大数据在我国图书馆的应用及推进研究[J].图书馆工作与研究,2014(6):35-41.

10 孙杨.OCLC WorldCat Local发展综述[J].山东图书馆学刊,2011(5):46-54.

    注:本文系漳州职业技术学院科研计划资助项目“后示范性高职院校图书馆服务模式创新性研究”(项目编号:zzy1443)研究成果之一。

 

翁娇端  女,漳州职业技术学院图书馆馆员。

收稿日期:2015-01-26。龚永年编发。)

 

附件下载

相关链接