大数据时代公共图书馆服务创新浅析

2016-12-28 09:07     字号:

  (福建省图书馆  福州  350000

 

摘 要 大数据时代的来临,对信息服务行业产生了极大的冲击,同时也带来了很大的机遇。这种数据革命对公共图书馆数字服务影响尤其巨大,本文就公共图书馆如何在大数据背景下创新服务进行分析探讨。

关键词 大数据  公共图书馆  数字图书馆  服务创新

 

1 引言

大数据是近年来最热门的信息技术概念之一。随着信息社会的快速发展,互联网化程度的不断加深,各领域累积的数据量不断增大,类型不断增多,全球数据呈现井喷式增长,已大大超越了传统数据处理能力的范围。于是,在宽带化、互联网、物联网、社交网络、云计算的催生下,大数据产业应运而生。20122月,《华尔街日报》文章《科技变革即将引领新的经济繁荣》称:“我们再次处于三场宏大技术变革的开端,它们分别是大数据、智能制造和无线网络革命。”

2 大数据概述

“数据化”是人类社会发展的必然趋势,而“大数据” 则是观察、理解与分析现在及未来社会的重要手段。当代社会高速发展,科技发达,信息流通,人与人之间的交流越来越紧密,生活日益便捷,大数据时代就这样悄然到来。在这种背景下,无论学术界、商界还是政府,各个领域的决策行为都将更多地基于数据和分析而非经验和直觉,“大数据”的预测能力已在各行业中崭露头角。

最先提出大数据时代”概念的是全球知名咨询公司麦肯锡。麦肯锡称:“数据已经渗透到当今每一个行业和业务职能领域,成为生产的重要因素。人们对于海量数据挖掘运用,预示着新的生产力增长和消费者盈余的到来。”其实,在物理、生物、生态环境、军事、经济、通信等行业内,大数据都存在已久,随着近年来互联网信息产业的迅猛发展,它才逐渐进入人们的视野。

2012年以后,“大数据”一词得到普及,人们开始用它来描述定义信息爆炸所产生的海量数据。进入2014年,大数据从媒体的炒作概念逐渐落地,实现产业化。大数据服务商大量涌现,在中国市场上展开了激烈的竞争。从“中国大数据服务商综合服务水平TOP100排行榜”中,我们已经可以隐约看出中国“大数据云图”的雏形。

国内最大的B2C机构淘宝网,早已将大数据转化成了生产力,利用大数据技术实现了创新服务。譬如:根据用户的消费记录推出“年度个性账单”,根据浏览记录推出“猜你喜欢”,根据用户信用记录推出“信用支付”等。

在有“中国硅谷”之称的北京中关村,大数据产业已被纳入《中关村战略性新兴产业集群创新引领工程(20132015年)》,此后中关村陆续展开云运营和大数据示范应用、云计算应用支撑平台建设、虚拟化平台建设、数据存储、数据挖掘和分析等技术的行业应用。20121213日,首个“中关村大数据日”诞生,中关村示范区接连成立大数据产业联盟,发布3支产业投资基金,支持中国大数据产业的发展。

国内资深IT人士、大数据研究专家谢文认为,大数据时代的经济学、政治学、社会学和许多科学门类会发生巨大的甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。

2.1大数据的定义

大数据,指的是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是一种海量、高增长率和多样化的信息资产。牛津大学互联网研究所教授维克托·迈尔·舍恩伯格在他所编写的《大数据时代》一书中指出:“大数据不采用随机样本调查这样的捷径,而是所有数据都进行分析处理。”

2.2 大数据的特点

一是数据体量巨大。大数据采集、存储和计算的起始计量至少在1P1000T)以上;二是类型和来源多样化。大数据包括图片音频视频地理位置信息及网络日志等多种类型,处理多类型数据需要有更高的数据处理能力。三是大数据价值密度相对较低。物联网中的信息流无处不在,如何迅速对海量数据进行“提纯”,是大数据实现产业化的一大挑战。四是获取速度快,处理效率高。这是大数据与传统数据挖掘最显著的区别。

2.3大数据的现状

伴随数字信息环境的高速发展,数据成本也不断在下降,这促使了数据量的急剧增长。一项由IDC进行的基础研究表明:自2002年人类社会进入“数字时代”之后,全球数据量呈几何级数增长,到2020年,全球数据量预计将高达35亿GB

当今社会,大数据应用的优势日益彰显,它所涉及的领域也日渐庞大。电子商务O2O、物流配送等利用大数据进行发展的领域不断地开展新的业务,创新商业模式。大数据概念对于消费者行为的预判、产品销售量的预测、营销范围的确定以及存货的补给已经得到全面的改进与优化。

哈佛大学社会学教授加里·金表示:“这将是一场革命,庞大的数据资源使所有领域开始量化进程,无论学术界商界还是政府,所有领域都将开始这种进程”管理和分析大数据,对于研究用户、评估服务质量、开发新业务、建设新资源等方面都产生了巨大的效益。

3 大数据时代公共图书馆的服务创新

在数字图书馆日渐完善的今天,图书馆数据规模快速增长,虽然还远未达到大数据标准,但这些数据在图书馆服务创新实践中已具有很重要的意义,这些数据被称为图书馆“大数据”。现有的技术架构和路线已无法处理如此庞大的数据,对于图书馆而言,如果采集到的巨大信息流得不到有效处理,那么这些数据就无法发挥作用,它的存在也将变得毫无意义。因此,大数据对图书馆的数据处理能力提出了新的挑战,也为图书馆服务创新提供了前所未有的空间与潜力。

图书馆服务创新的关键之处,在于大数据技术支撑下的理念革新。大数据备受关注的同时,人们开始意识到:数据除了本身所具有的意义和价值之外,更重要的是提供了一种新的思维方式,即发现数据、分析数据、挖掘数据价值的“大数据”理念。图书馆在长期工作中积累了庞大的数据,并且目前工作中仍在不断产生新的数据,包括馆藏知识数据、书目数据、用户数据、工作数据等,图书馆应当运用大数据理念,充分挖掘大数据价值,开发和利用大数据。这不仅能够拓展工作,促进公共图书馆服务创新的实现,也将继续推动大数据研究。

3.1馆藏资源大数据化

公共图书馆最大的优势就是资源的庞大及丰富,资源覆盖面广,学科丰富,知识层次多。其中包含纸质资源、电子资源、网络资源、多媒体资源等各种形式的馆藏资源,这些资源是公共图书馆开展服务创新的基础。互联网时代,人们获取信息的方式和渠道更加多样化、开放化,图书馆传统的被动提供文献资料的服务方式已不能满足读者的需求,现代图书馆更应该侧重于发展信息组织、信息集成、信息融会、信息发现、信息创造等信息服务,用大数据思维来处理图书馆信息资源。

虽然通过科学的分类方法和特定的标识符号,馆藏资源已被初步归纳为一个有序的信息资源体系,但数字服务不仅仅是对数字资源存储的整序,更重要的是要对内容进行融合、分析和提取。通过分析各信息资源相互之间的连接点,整合资源,形成知识串,从中找出和用户需求相匹配的信息并及时提供给用户,这才是图书馆服务创新的目的和意义。因此,开展数字服务创新的关键环节在于从现有馆藏资源中寻找关联、揭示规律并发现新的知识。

目前各图书馆馆藏资源的数据量已十分巨大,包括古籍文献、特藏文献、多媒体数字资源、电子期刊、学位论文资源、专题数据库在内的各种资源数量庞大,类型繁多,早已具备大数据特征。如何运用大数据思维和技术来存储、管理这些资源,并对各部资源相互融合、集成,从而实现数据整合,是实现馆藏大数据化的第一步。这对于馆藏资源的深度挖掘、分析、研究和利用,有着极其重要的作用,它同时决定了大数据背景下的图书馆服务创新的精细程度。

美国政府积极推动的大数据计划已覆盖到了图书馆界,美国图书馆协会主席萨莉·菲尔德曼在接受《高等教育纪事报》采访时表示:“哈佛大学正在将所有馆藏的判例法文献数字化,并向世界开放。信息技术正在以前所未有的力度重新定义美国大学图书馆的角色。”以美国国家医学图书馆为例,该馆目前已开展整合生物学及临床信息项目,通过软件整合、挖掘数据,再通过开源共享,使全球50多个组织可同时使用。该项目利用了大数据对于资源整合和共享的优势,实现了生物学和临床信息资源的共享。

目前国内图书馆“大数据”技术仅限于口号,缺乏具体实践内容。原因在于许多图书馆对大数据理念缺乏认知,对大数据服务缺乏理解,在实际工作中也没有运用大数据思维看待馆藏资源,使得信息资源挖掘和整理的成果远未达到读者所需。随着信息技术的不断发展,馆藏资源的迅速增加,公共图书馆运用大数据理念、大数据思维和大数据技术进行服务创新已迫在眉睫。

3.2构建大数据服务平台

构建大数据服务平台的前提和条件是数据总量和流量的迅速增加。随着数字图书馆建设的日趋完善,使用数字图书馆的用户越来越多,浏览和检索的频次也越来越高。以北大移动图书馆为例,自201171日正式开通起,到2013131日为止,一年半的时间内注册用户达到17729人,移动平台访问量高达1477504次。同时各种新媒体平台及客户端的开放也使流量急剧增长,以上种种因素催生了大数据服务平台的诞生。

从用户的终端设备来看,由以往的电脑逐渐扩展到了智能手机、平板电脑、阅读器等移动终端设备。同时,由于读者使用的终端设备众多,各个设备型号、配置、系统均不相同,开发一款无需安装客户端的使用终端,势必使读者的使用过程更加方便快捷。以福建省图书馆目前依托微信平台建立的手机图书馆为例,无论何种配置、何种系统,都无需安装繁琐的客户端,只要关注公众号,绑定读者证,即可办理借阅、查询、活动预约等业务。此外,在该平台上还能够浏览数字资源,参与活动报名、抽奖等,功能丰富、操作界面简洁易用、清晰明了。依托微信的强大平台,省去了巨大的建设成本,也降低了用户的使用门槛,极大地方便了读者。自从2014年初开通至今,累积关注人数已达到30742人次,所推送信息最高阅读人数达到12874人次,分享人数达到1522人次。

但在目前的数字服务实践中,还存在一些不够完善的体验,例如为了获取不同的数字资源,读者需要登不同的数据库,进入不同的检索入口;获取音频、视频等多媒体资源,则需要进入不同的专题资源库。在数字图书馆建设的过程中,这种入口不断增多,若能将图书馆的馆藏目录、数据库和搜索引擎等集成到同一个检索框架内,真正实现大数据背景下的集资源整合、检索、浏览、维护、链接为一体的“一站式”检索平台,那将是现代图书馆数字化建设中最具有竞争力的体现。

3.3 管理分析用户数据

用户资源是公共图书馆最重要的战略资源之一。用户数据的搜集是图书馆大数据服务创新的前战,也是大数据服务分析的基础,对用户数据的管理和研究则是图书馆服务创新的关键所在。

由于公共图书馆长期从事传统服务的惯性,许多图书馆专注于资源建设和技术开发等方面,却忽视了对用户需求的分析。图书馆的信息服务是基于用户需求的服务,需要从用户类型、特征、年龄段、职业、兴趣热点等方面对读者的需求展开研究,这样才能针对不同的读者群体甚至个人提供不同的个性化信息服务。

用户数据的搜集渠道主要来源于后台。公共图书馆在自动化过程中产生并记录了大量的业务相关数据,例如用户访问时间、地点、内容、次数和频率等等。区别于传统数据搜集方式的是:大数据理念利用了全部数据,无偏见地关注每个细节,研究数据的方方面面。

但仅仅拥有大数据是不够的,特别是在数据价值密度较低的情况下,数据成倍增长的同时也不可避免地带来大量垃圾数据。如果不对大数据进行有效的管理和分析,那么大数据就无法真正发挥作用,这是学术界和各行业共同面临的问题,也是大数据从上层构建到底层实现的关键。因此,获得海量用户数据以后,需要进行数据质量的强化和分析,对垃圾信息进行清洗过滤。只有成功地管理数据,筛选出智能、实用的数据,才能真正掌握各类用户群的需求特点,进而有针对性地为他们提供所需的个性化信息服务。

在图书馆实际服务中,数据来源于读者到馆时间、次数、活动上座率、文献借阅率、借还记录、流通记录等。这些数据一方面反映了读者使用图书馆资源的情况,另一方面也反映出读者的关注热点、阅读倾向、需求变化和供求状况。图书馆可以从用户的浏览记录了解其阅读喜好;根据用户的点击记录了解其关注点和兴趣点;从检索结果为0”的数据中查缺补漏;从检索频次最高的资源中发现时事热点等。对借还数据和流通数据的整理和分析,还可作为图书馆新书采购和资源建设的重要参考依据,从而有效地利用购书经费和建设经费,有针对性地改善文献服务、开展阅读活动等。

在大数据服务实践中,上海图书馆已走在前列。该馆在大厅内设立了一块巨大的“上海市中心图书馆即时数据展示屏”,以时间为横轴,每5分钟刷新一次,实时滚动更新到馆人数、书籍借还状态、轮播正被借出的书籍封面图等。该系统基于对后台数据的挖掘和分析,将数据信息用可视化的方式展现,使读者对于热门读物和图书流通状态一目了然,同时也是图书馆合理安排工作量的可靠依据。

3.4开展大数据智能化服务

图书馆移动门户除了短信订阅、APP推送、检索、预约、查询、续借等传统服务之外,还应该有能够充分发挥图书馆信息服务功能和用户需求的智能化服务。

3.4.1参考咨询。传统的参考咨询服务建立在书籍、文献、数据库、资源库等现有的馆藏资源上,需要具备专业知识并熟练使用检索工具的服务人员来开展工作。在大数据背景下,读者可以将咨询课题置于大数据检索系统内,系统将自动采集关键词,利用大数据分析技术,不仅可以在很短的时间内筛选出所需要的数据信息,还极大拓展了信息资源的获取渠道。在满足读者快速、全面的参考咨询需求的同时,也深化了公共图书馆参考咨询的内涵,提高了工作效率,提升了服务水平。

2012年底,中国国家图书馆推出了一项自主研发的检索系统——“文津搜索”。区别于以往的基于传统数据库技术构建的资源体系,“文津搜索”整合了馆藏资源、自建数据库及部分购买资源,引用Hadoop基础架构及NoSQL数据库等大数据技术,平均每分钟可进行10万次高效检索,最高可满足每秒1万次的检索请求。“文津搜索”向全世界网络用户开放使用,实现了资源的“一站式”检索。它的成功上线,率先实现了大数据技术在数字图书馆服务中的应用,为全国图书馆数字服务树立了新的标杆。

3.4.2信息推送。以往的推送服务是一种同质化的信息传播,是网站或平台以自身业务为出发点进行推送,并未考虑到用户的个体需求,同时也不具有预见性。而在大数据背景之下,用户的多层次需求被摆到了第一位。以目前中国领先的互联网公司腾讯开发的专业移动APP推送平台“腾讯信鸽”为例,该平台基于自身拥有的海量数据及强大的处理技术,能够对用户进行最精准有效的推送。例如:对用户的终端设备进行分类,根据版本号、地理位置信息等分别打上云标签,可以按照版本号进行推送,还可以按照地理位置进行推送。此外,该平台还借助了大数据的预测能力,预测出潜在的流失用户,为开发平台留出提前干预的时间,针对不活跃用户定向推送,以达到挽回用户、增加用户黏着度的效果。同时,它还可预测并定义潜在的付费用户、高消费潜力用户,将消费信息转递给相关用户,使平台实现盈利的目的。

  在公共图书馆的数字服务中,用户可以订阅推送内容,包括标题、关键词、摘要和内容等,网站再按照订阅将相关内容同步推送到读者的首页、客户端或移动设备,使读者不用频繁登陆网站来查看。图书馆甚至可以进行智能化推送,因为读者的任何检索、浏览、点击行为都会被记录到后台数据库中,具体到某篇文章,精确到每个词组,利用大数据技术分析读者行为,就可以得到读者的兴趣变化曲线,预判读者需求,从而为图书馆网站的更新和推送服务提供依据。

4结语

大数据的视角从数据表面深入到了数据内核,因此能够更加准确地对用户进行分析和研究。利用大数据不仅能够及时发现问题,还能够感知并提供消费者所需要的服务,精准开发用户喜欢的新功能、新资源、新业务等。大数据下的图书馆数字服务,并不是大数据技术的滥用,而是各馆结合各自的馆藏特色资源,合理运用大数据技术和移动技术,进行数据挖掘和数据处理的一项技术创新。大数据时代的图书馆数字化建设需要一支人员稳定、技术能力强的服务队伍,各个图书馆需要结合实际工作,通过多种方式来建设自己的专业化服务队伍,真正实现大数据下数字化服务的创新。

未来图书馆的数字服务,是让用户能够更加简洁、方便和快速地获取图书馆服务的重要窗口和主要途径,如何在大数据背景之下开展数字服务,创新移动服务,真正服务好读者,是值得我们认真思考的问题。

参考文献

1 大数据.百度百科[EB/OL]. http://baike.baidu.com/item/大数据/1356941.

2 段春乐.大数据技术在图书馆中的应用[J].黑龙江科技信息,2015(18).

3 容春琳.公共图书馆应用大数据的策略研究[J].图书馆建设,2013(7).

4 张红英.论大数据时代图书馆面临的挑战及应对措施[J].价值工程,2015(27).

5 .大数据在图书馆建设中的作用及发展趋势[J].贵图学苑,2015(2).

 

    女,福建省图书馆助理馆员。

(收稿日期:2016-08-22。龚永年编发。)

附件下载

相关链接