大数据时代图书馆界与图书出版界的合作共赢

2016-12-28 09:05     字号:

 (南平实验小学图书馆 福建  353000)

 

   在大数据时代,需要图书馆界与图书出版界在人才、数据上实现更加深入的交流,共同建设大数据共享平台;同时加强图书的版权保护,转换图书营销方式,实现双方的合作共赢。

关键词  大数据  图书馆 出版事业 交流与合作

 

关于大数据的定义众说纷坛,至今仍然没有业界认可的标准定义。但是顾名思义,大数据就是数量庞大的数据。2011年5月,全球知名咨询公司麦肯锡最早提出了“大数据”(Big data)这一概念,他们认为,“大数据”是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集。[1]美国将大数据提升为国家战略,宣告着大数据时代的到来。在大数据时代,图书馆界面临着前所未有的危机与挑战。图书馆界只有立足行业基础,不断加强与外界的合作,与时俱进,才能冲破困局,迎来图书馆界的新时代。而图书馆界与图书出版界的合作,不失为一个互利共赢、突破困境的良方。

1 大数据时代图书馆界面临的危机

1.1 数字图书对传统图书的冲击

现代图书在载体形式不同的基础上,大致可以分为数字图书和纸质图书两大类。纸质图书拥有悠久的历史,经历过漫长的时间考验,而数字图书却是近十年间才兴起的通过网络进行传播的新载体图书。两种类型的图书相对应地也推出传统出版和数字出版两种出版方式。出乎意料的是,作为后起之秀的数字图书,居然在短短几年间就已经威胁到传统纸质图书的生存,固守传统纸质图书的图书馆可谓是举步维艰。

数字图书,在一般人看来就是如今在网络上盛行的电子图书的出版,也就是图书的数字化出版。然而,这一看法仍然是狭义的。真正广义上的数字出版还包括网络游戏、手机出版和网络广告,只要是利用二进制技术手段对出版的整个环节进行操作,都属于数字出版的范畴,其中包括原创作品的数字化、编辑加工的数字化、印刷复制的数字化、发行销售数字化和阅读消费数字化等。版权、发行、支付平台和最后具体的服务模式,都是数字出版。[2]作为数字出版中最为人熟知的产物电子图书,与传统的纸质图书不同,没有华丽的包装与悠久的历史,却在近几年崭露头角,使得固守传统纸质图书的图书馆措手不及。究其原因,电子图书有便携、环保及廉价等优势,这几点都是传统图书望尘莫及的。但是传统阅读习惯使纸质图书依然具有竞争力,图书馆也在随着时代的进步不断完善图书借阅服务,使其继续吸引读者的眼球。但是无论如何,数字图书的出现已经给图书馆带来了强烈的冲击。

数字出版代表着出版界的未来和方向,这是新闻出版界的共识。[3]然而不少图书馆仍然没有看到数字出版代替传统出版的必然性,一味贬低数字图书。如果图书馆界固守传统,不加强与外界尤其是图书出版界的交流合作,那将很难适应大数据时代电子出版物迅速普及的现实环境。唯有加强合作,重视数字出版与数字出版物,更好地满足广大读者的需要,图书馆界才能突破低迷不景气状态,迎来新生。

1.2 从数字化到数据化的图书

数字图书馆的兴起引发了图书数字化的革命,但是如今图书数字化事业依旧处在瓶颈期,随着云计算、物联网等一系列新兴信息技术的出现,简单的数字化已经无法满足读者的需求,大数据时代的到来,使图书又要开始从内容数字化到内容数据化的转变。尽管只有一字之差,数据化与数字化却有着本质上的区别,数据化绝不只是把一本书扫描成机读格式,而是更高程度、更高水平的对图书内容进行抓取。

对于图书馆界来说,政府每年都会向各级各类图书馆拨发大笔资金用于图书馆建设,现代图书馆不仅拥有高雅的外观,内部基础设施建设亦走在时代前列,拥有大量数据资源以及专业人才。但是,由于缺少大数据方面的基本知识与技术,使大部分馆员每日都重复着“上架——借书——还书——上架”的单调过程,图书馆的数字化进程缓慢。

对于图书出版界来说,面对新的时代,必须将一本图书中的信息,通过大数据分析系统进行过滤,得到其中最精华、最具代表性的信息,在最短的时间内满足读者需求;而读者也可以据此判断是否需要精读乃至购买这本书。由于“大数据”这个概念是近几年才被提出,现有的大数据分析系统并不完善,存在着一定缺陷,不能很好地完成图书的大数据分析。同时,由于缺乏专门领域的大数据分析人才,图书出版界仅凭自身能力很难分析出读者对某一本图书是否有需求以及喜好程度,从而有针对性地调整图书的供求关系。

正如《大数据时代》一书所述:“出版社在电子书领域的开发,只是把书籍内容作为核心价值,而没有把书籍看做一种数据并纳入自己的商业模式中,因此,他们没有做到把书籍的数据价值挖掘出来,也不允许别人这样做。他们没有看到数据化的需求,也意识不到书籍数据化的潜力。”[4]正是由于图书馆界与图书出版界忽略了大数据的重要性,导致现在传统图书与数字图书的矛盾愈发严重。

2 大数据时代图书馆界与图书出版界的合作

高技术设施使图书馆能够游刃有余地进行管理运营,数据资源的积累能够成为建设大数据共享平台的基础。目前,图书出版界拥有图书的版权,却缺乏配套的图书售后服务;图书馆作为购买图书最大的用户,与图书出版界的关系十分密切。二者合作,互利互惠,可谓势在必行。

2.1人才培养

大数据是一门建立在人才基础上的技术。大数据时代,图书出版界提高自身竞争力、创造高效益的关键,在于人才的培养。如今的图书出版界对员工的专业要求主要是根据其出版分工来确定的,比如出版文艺类书籍需要招收文学专业员工,出版古籍则主要招收古代汉语专业员工。有针对性地招收相关专业员工的确可以在某种程度上节约时间、提高效率,但是面对技术上的挑战,图书出版界需要的是能够对图书进行数据化的新型专业复合人才。新型人才必须能掌握计算机技术和大数据知识,具有较高的信息分析和信息处理能力,能够打破大数据与图书出版之间的障碍,为传统图书出版体制注入生机。图书馆作为读者阅读图书的最大平台,是最贴近读者、最了解读者需求的机构。同时图书馆拥有专门的专业技术人才队伍。数据的生成、收集、分类、整理、传输等一系列流程本来就是图书馆的基本工作,图书馆员在数据化方面拥有的经验和水平是其他行业所不具备的。图书出版界培养专业数据化人才需要耗费的时间、精力太大,现有人员也不能直接投入数据化工作进程,如能得到图书馆界的帮助,能够很好地弥补自身大数据人才不足的情况,同时通过人才交流也能使图书馆培养的数据化人才尽早成熟。图书数据化是图书馆学研究的主要课题之一,图书馆界与图书馆出版界加强合作,能够获得更多有用的数据,更好地完成从图书数字化到数据化的转变。

2.2 数据分析

现阶段,由于技术、资金等方面的不足,图书数据化工作不可能在短时间内完成,但是图书出版界仍然能够通过与图书馆的合作获得有价值的数据。图书馆多年来通过借阅系统已经积累了很大一部分读者数据,通过这些数据,能够分析读者的喜好,实现图书个性化借阅。上海图书馆在图书借阅数据运用上已经取得一定成功,如2013年初,上海图书馆分析2012年的图书借阅数据,将“大众版”及“个人版”的个性化年度阅读账单——“我的悦读2012”分别发送到读者邮箱;读者可以通过“大众版”了解图书馆整体借阅情况,通过“个人版”掌握自己上一年度借阅情况以及获得图书馆根据读者个人偏好提供的借阅参考书目。上海图书馆的行动是在大数据时代下图书数据化实现的较好尝试,也为图书出版界提供了很好的参考。如果图书出版界能够获得图书馆积累的读者借阅数据,无疑能给现有陈旧的出版体制带来新的生机。图书出版界与图书馆本就同源,加强双方合作可谓有百利而无一害。

2.3 共建大数据资源共享平台

大数据无法脱离其他技术而存在,可以说大数据与物联网技术、云计算技术都有密切的联系。图书出版界既不是先进技术的掌控者,也不是高新设备的拥有者;同时,图书出版界所掌握的庞大数据,不仅仅只有结构化数据,还有大量半结构化和非结构化数据。事实上,如果无法与图书馆界合作,那么这些数据对于图书出版界来说也只是鸡肋罢了。而图书馆界为了获得更多的发展机会,必须与其他行业(尤其是图书出版界)加强合作,共同打造大数据资源共享平台。

从大数据研究的现状来看,大数据计划中最为重要的一环就是大数据的处理分析工具,大数据资源共享平台的建设也同样迫切需要成熟的大数据处理分析工具协助。然而,传统的数据处理分析工具已经无法满足大数据时代的信息需求,必然需要新的工具和技术来对大数据进行处理和分析;而当代先进技术大部分掌握在互联网公司和各类运营商手中。近年来有不少大数据处理分析系统出现,Hadoop、Pentaho BI平台、RapidMiner、Storm、Apache Drill、HPCC(高性能计算与通信)都是其中的佼佼者。[5]走在时代前沿的Google(谷歌)就为大数据的分析处理作出了极大的贡献,大数据处理分析系统中的Hadoop原本来自于Google一款名为MapReduce的编程模型包, Google正是依赖Hadoop成为网络世界的佼佼者;Apache Drill也是为了实现Google's Dremel才诞生的。[6]因此,想要建设属于图书馆的大数据资源共享平台,还需要向类似Google的最新技术掌握者寻求技术上的支持。

在大数据资源共享平台建设过程中,物联网技术大有用武之地。如出版方将出售给图书馆的图书中装上智能识别芯片,用户能够通过扫描芯片登陆大数据共享平台,以获取该书相关的数据资料。同时,图书馆采购拥有芯片的书籍,或在图书加工时安装智能识别芯片,读者就可以通过芯片实现图书的自动感应式借阅,不再需要图书馆员代劳,借此减少图书馆人力资源的消耗,使图书馆员的工作转向参考咨询等深层次服务和图书数字化等技术性工作。同时图书馆也可以通过大数据资源共享平台,为借阅者提供图书的相关信息,用高水平的服务来提高图书馆的核心竞争力。这个方案一旦顺利实现,将大大减少由于平台建设导致的有关信息安全和版权保护方面的问题,也为物联网与大数据及其他新技术的接轨提供参考。建设大数据资源共享平台,图书出版界提供相应的图书数据,图书馆提供扩展性资料并对相应图书进行数据化处理,技术支持与平台维护由技术服务商负责,不同行业的合作,实现了多方互利共赢。

2.4 加强大数据时代的版权保护

对于图书出版界和图书馆界来说,图书的版权保护一直以来都是业界研究的重点,自从电子图书出现后,图书版权保护和利用之间的矛盾更是凸显出来。传统的图书出版机构大部分只拥有图书出版的版权,而数字版权大多还掌握在作者手中,这一点再次显示了出版机构对数据的不重视,这种不重视使出版界在大数据时代举步维艰。

在大数据时代,图书出版机构不仅需要拿到纸质图书的出版权,还要拿到图书的数字版权及数据版权。数据化的图书可以为提供读者更好的服务,但是部分读者在获得数据时,可能会对这些数据进行不合理的传播和使用,从而侵犯到图书的版权。在这种情况下,如何保护图书出版机构对数据的所有权,以及图书数据化带来的知识产权问题,成为图书馆界与图书出版界共同研究的重点。

大数据所引发的深层次版权保护问题的确是一大难题,但也正如美国知名知识产权律师事务所NDQ的雷戈里·诺瓦克所说:“事实上,如果知识专利运用得当,每个企业都应该也必须构建属于自己的专利组合策略,这样才不至于在出现知识产权危机与摩擦时临时应对,不至于付出相当大的损失。”[7]既然版权保护及知识产权问题出现了危机,那么图书馆界就要学会迎难而上,利用危机,与图书出版界互相扶持,互相帮助。一旦数据化版权市场及知识产权市场得以建成,图书出版界就能够从中获得巨大的收益,加快完成顺应大数据时代图书出版的体制转型,图书馆界一直以来的困扰也将不复存在。

2.5 图书馆与新的图书营销方式

大数据时代给图书出版界带来巨大的冲击,也导致图书营销环节需要开始重新构建。传统的市场营销通过科学的手段探知目标消费人群并把握其需求,从而对市场做出预测,通过大众媒体进行传播,最终帮助企业(广告主)进行符合市场需求的大规模生产,满足受众的各种消费需求。[8]大数据时代,读者的偏好、需求、各类信息都是作为数据被存储在互联网中,任何人都能够轻易获得。因此大数据时代营销方式的重中之重,就在于各类图书与读者以及数据之间千丝万缕的联系所形成的庞大关系网。

大数据资源共享平台的建设,使图书出版界通过图书馆界的协助,把即将出版的有关图书信息发布至平台,图书馆可以在最段的时间内掌握相关信息,选择要购买的图书。出版方将图书优先发送给图书馆,图书馆的读者可以在借阅之后提供购买意愿、用户喜好等一系列反馈,出版方借此获得消费者的需求信息,决定图书出版的数量,提高营销的精准度。读者从图书馆借阅图书以后,根据喜好的不同,注定读者对图书的出版有不同的要求,个性化出版也不失为大数据时代图书营销的好手段。出版方通过读者反馈的数据或者读者对出版的特殊要求,从图书封面、字体、排版等方面满足读者的需求。考虑到实际情况,由于图书的个性化定制成本过高,短时间无法顺利实现,但是出版方可先行在电子图书出版上实行个性化定制这一策略,为部分读者提供属于他们自己的电子图书。唯有充分利用数据,挖掘数据的核心价值,让图书馆在图书流通的所有环节中都起到作用,才能实现图书馆资源利用最大化,最大程度提高图书产业的竞争力。

3 结语

大数据技术的迅猛发展,将会给图书馆界带来革命性、创造性的机遇,同时也带来强烈的冲击。纵观未来,更多更好的大数据挖掘、分析、处理工具将会应运而出,但是图书馆界是否能追上时代的脚步?拿破仑曾说:“我最大的敌人就是我自己。”在大数据时代,危机不仅仅是外界带来的,更大的挑战在于自身跟不上时代导致的恶果与故步自封的愚昧。凡事不破不立,唯有敢于自我批评,正视自己的不足,加强与图书出版界的交流合作,才能更好地迎接时代的挑战。同时,应对大数据技术的发展,图书馆界应始终保持清醒的态度,不急不躁,把握好自身定位,稳步发展。追求短期的利益无疑是鼠目寸光之举,盲目追求发展而忽视自身情况亦是不可取的,唯有树立正确的数据观,实现多方合作,争取互利共赢,才能面对危机顺利实现变革,迎来真正的“大图书时代”。

参考文献

1 Michael Chui,Brad Brown,James Manyika.Big data:The next frontier for innovation,

  competition,andproductivity[J/OL].(2011-05-01)[2014-08-07]http://www.mckinsey.com/

  insights/business_technology/big_data_the_next_frontier_for_innovation.

2 吴赟.产业重构时代的出版与阅读——大数据背景下出版界应深度思考的五个关键命题[J].出版广

  角,2013(12):32.

3 姚永春.出版企业掘金大数据的两个层面[J].出版广角,2014(2):29-30.

4 苗卉.大数据时代编辑理念的更新[J].出版广角,2013(7):82.

5 中国大数据.大数据处理分析的六大最好工具[EB/OL].(2014-04-11)[2014-08-07].

   http://www.csdn.net/article/2014-04-11/2819267-cloud-bigdata.

6 CADE METZEMAIL. Google后Hadoop时代的新“三驾马车”——Caffeine、Pregel、Dremel [EB/OL].

  (2012-08-20)[2014-08-07].http://www.csdn.net/article/2012-08-20/2808870 .

7 天极网.NDQ律所解读知识产权,助中国企业海外发展[EB/OL].[2014-8-7](2014-5-10).

   http://oa.yesky.com/haocai/95/37143095.shtml

8 张秋瑰.大数据背景下的图书出版营销创新[J].出版科学,2014(1):73.

 

   女,福建省南平实验小学图书馆助理馆员。

(收稿日期:2016-06-07。龚永年编发。)

附件下载

相关链接