图书馆学论文

您当前的位置:学术堂 > 图书档案学论文 > 图书馆学论文 >

“大数据出版”对图书馆知识服务的影响研究

来源:学术堂 作者:姚老师
发布于:2015-10-13 共5435字
摘要

  2009 年, "大数据" 作为一种新的专业术语开始引起出版界和图书馆界学者们的广泛关注。 2011 年麦肯锡在 《大数据: 创新、 竞争和生产力的下一个前沿领域》 一文中首次提出 "大数据" 概念[1], 目前业界只对"大数据" 的认识达成共识 , 即 "大数据" 不仅代表海量, 复杂化、 多样化、 极具价值也是其属性。"大数据出版" 是在 "大数据" 的基础上发展演变而来的又一个新词。 当前, 有关 "大数据出版" 的研究还处于起步阶段。

  出版业与图书馆是密切联系的, 图书馆是社会上最大的出版物收藏机构和服务机构, 也是出版业的终端大客户, 出版业的任何变化都能给图书馆带来巨大的影响, 图书馆只有利用出版业发生或者将要发生的趋势进行战略性创新, 才能驾驭发展为自己创造未来[2]. 在信息技术日新月异的今天, 图书馆的服务已经开始转向面向知识内容和解决方案, 知识服务已成为图书馆界的热门话题。 所谓知识服务就是从各种显性和隐性知识资源中按照用户的需要有针对性地提炼知识, 并用来解决用户问题的高级阶段的信息服务过程。

  出版界通过 "大数据出版" 来提高现有产品的能力和价值, 为读者创造了持续性创新的出版发行环境。 如果此时图书馆仍然只关注自身原有知识服务, 而忽视了环境和读者的变化, 终将背离读者的需求。 本文拟从"大数据出版" 的角度入手, 分析其对图书馆知识服务带来的机遇和挑战。

  一、 "大数据出版"的概念和意义

  "大数据出版 " 是一个新词, 尚无确切定义。 美国学者舍恩伯格在 《大数据时代》 一书中提及 "数字出版" 和 "大数据出版" 的差异时, 提及 "大数据出版"是通过技术手段将出版内容转化为计算机可以检索和运算的信息, 并将这些信息集成一个大数据库, 实现文本的挖掘和分析[3]; 王明亮指出 "大数据出版" 是出版者真正理解海量文献数据, 深入挖掘各种用户和读者研究和学习的需求, 通过出版为读者提供知识服务的过程[4];张振宇、 周莉在 《"大数据出版" 的理念、 方法及发展路径》 一文中首次明确给出了 "大数据出版" 的概念,即 "大数据出版" 就是将海量的出版物转化为可制表分析的量化形式, 并通过建立数据库使信息产生相关关系的过程[5].

  综上, 本文认为,"大数据出版" 是一种全新的出版观念和手段, 出版者将海量出版物通过技术手段转化为可分析的量化数据, 并集成数据库实现信息关联, 出版者通过挖掘分析实现信息增值, 通过出版发行为读者提供知识服务的过程。 从 "大数据出版" 出版的定义可以看出, "大数据出版" 的出现必须具备一些要素: (1) 资源基础。 目前大数据时代海量的出版物资源已经为 "大数据出版" 提供了资源基础, 使出版商对历史出版资源的收集和存储变成可能。(2) 大数据挖掘技术。 出版界人才荟萃, 有目的有组织地收集数据, 通过联机分析和相关关系分析等分析手段不再成为困扰出版界的难题。

  "大数据出版" 的现实意义包括:(1) 实现了信息增值。 数字出版、 网络出版、 按需出版等出版模式对于信息传播方式来说都是变革和进步, 但它们只解决了海量文献内容的发现, 将文献资源变成了 "信息孤岛", 这些 "信息孤岛" 独立于互联网大数据这一虚拟社会之外, 无法关联起来, 内容得不到发掘和利用。 而 "大数据出版" 则致力于数据的挖掘和运算, 力图实现信息增值, 这也是 "大数据出版" 的核心价值。 (2) 激活了原有出版资源。 出版界已经积累了海量的出版资源, 在"大数据出版" 之前, 这些出版资源以实物或者数字化形式等各种存在形式或者被遗忘或者变成 "信息孤岛".

  "大数据出版 " 通过将这些出版资源进行大数据采集 ,建立专题数据库, 对数据库进行联机分析和相关关系分析, 使得每一条数据及数据关系都变得有意义, 实现每个数据自身价值。(3) 改变了出版观念。 "大数据出版"环境下, 出版产品不再是出版发行的终端成果, 每一条数据和每一条数据关系都将成为出版产品, 而出版产品又将成为新的大数据采集和存储对象参与到动态的统计和运算中, 出版变成一个循环过程。 在这个过程中, 出版商将挣脱版权资源等传统核心竞争力的束缚, 转变为对知识服务的追逐。

  总之,"大数据出版" 是出版界的革命, 也是出版发行发展的必然趋势, 自此出版商开始通过知识服务提升自身竞争力。 在这样的出版发行环境下, 信息的生产、传播和服务方式已经发生了巨大变化, 图书馆作为出版物的采集和储存机构以及为读者提供知识服务的机构,尤其是以服务教学和科研为主要任务的高校图书馆, 势必将直面这一革命带来的机遇和挑战。

  二、 "大数据出版"给图书馆知识服务带来的机遇和挑战

  张晓林对图书馆知识服务进行了详细阐述, 强调知识服务是以目标驱动的服务, 目的是解决用户问题, 核心是要对资源进行不断的组织和分析, 最终通过知识增值实现问题解决。[6]

  在大数据时代, 科研人员获取资源的途径越来越广, 对传统图书馆服务的依赖越来越弱,图书馆面临被边缘化的风险, 于是知识服务成为图书馆服务的生力军。 对于图书馆来讲, 知识服务要建立在本馆馆藏的基础上, 知识服务的效果取决于馆员对知识的挖掘和服务方式等多种因素。 因此,"大数据出版" 对图书馆知识服务的挑战和机遇主要体现在对图书馆资源建设和服务效率的影响上。

  首先, "大数据出版" 带来丰富的学术出版物, 便于改善图书馆资源建设格局。 馆藏资源是图书馆赖以生存的生命和支柱, 然而馆藏质量取决于出版发行的质量。 目前现有出版资源偏离用户需求, 造成出版有效供给严重不足。 如高校图书馆馆藏资源是服务教学和科研的基础, 以学术型图书采购为主, 但从历年出版发行的情况看, 研究型出版物仅占一半左右, 这使得图书馆在出版物数量猛增的今天出现无书可选的尴尬, 不得不采购其他出版资源以保证馆藏数量。"大数据出版" 不仅激活了原有出版资源还催生了新的出版资源, 这些都极大地丰富了出版资源。 尤其是 "大数据出版" 通过多维分析, 按照用户的需求从不同角度对历史出版物中的相关主题进行统计与运算, 从而产生新的专题出版物。 往往同一数据从不同的角度与不同的数据相关联分析就能形成不同的专题出版物。 这些出版物能够满足不同研究主题的需要, 符合图书馆资源建设的宗旨, 扩大了图书馆馆藏范围, 提高了学术型出版物的采购效率, 将改善图书馆目前资源建设的格局, 提高馆藏资源的质量。

  但是,"大数据出版" 使出版资源鱼龙混杂, 采购者要甄别其价值慎重选择。 如果将一个个出版物当做是一条条数据的话, 它们本身就具备很高的价值。 每条数据与其他一条或者几条数据运算就能够生成不同出版物,由此 "大数据出版" 催生的出版物将以 n 次方的数量诞生。 大数据时代, 图书馆要面对海量的出版资源, "大数据出版" 将海量出版资源又一次无限扩大, 在这些出版资源中鱼龙混杂, 并非每一种出版资源都能服务于图书馆的馆藏。 图书馆馆藏的建设要根据服务对象的学科分布、 研究特点、 发展趋势来取舍 "大数据出版" 产生的出版资源, 这无疑增加了采购者的工作量和甄选难度, 很容易造成误选或者漏选。

  其次,"大数据出版" 实现了信息增值, 提高了图书馆知识服务效率。"大数据出版" 贯穿着知识服务, 与图书馆知识服务有着异曲同工之处, 都是面向用户解决问题的知识增值, 但是服务既有重叠也有交叉,"大数据出版" 从出版的角度面对用户的问题, 这类用户不仅包括图书馆服务对象还包括更多的大众读者, 服务的终端是出版资源。"大数据出版" 出版商已经对历史出版资源进行了专题数据挖掘, 形成了以不同主题形式出现的出版物。 从知识服务的角度看, 面对用户问题的解决,出版商已经帮助图书馆完成了一部分知识服务工作,把图书馆从海量的数据组织、 分析、 挖掘中解放出来了。 图书馆在对馆藏资源进行知识挖掘时, 可以借助于 "大数据出版" 的成果, 在已有的基础上进行下一步服务。

  但是, "大数据出版" 提升了图书馆知识服务的门槛, 对图书馆知识服务提出了更高的要求。 美国 Ithaka研究所发布的 《图书馆调查 2010》 显示, 读者对图书馆作为信息门户的认同逐渐下降, 图书馆教学支持和科研支持服务尚未得到认可, 这种情况下出版与传播模式的任何变化都可能使图书馆的地位变得岌岌可危[7]. 知识增值服务已经不再是图书馆知识服务的强项,"大数据出版" 也提供这些服务。 如果此时图书馆还满足于数据分析和挖掘, 而不与时俱进另辟新径, 从图书馆与出版界提供知识服务的差异化入手, 为知识服务注入新的内容和方式, 图书馆知识服务就面临危机了。

  由此可见,"大数据出版" 这一出版界的新变革引起了图书馆的巨变, 使图书馆在充当资源建设者、 组织者、 提供者的角色方面面临了空前的机遇和挑战。 图书馆知识服务不能再局限于数据分析和挖掘, 应该向更加深入的特色知识挖掘和更加开放的服务平台方向发展。

  三、面对"大数据出版",图书馆知识服务何去何从
  
  "大数据出版" 既丰富了出版资源, 又使出版资源泛滥; 既完成了部分知识服务的内容, 提高了图书馆知识服务的效率, 又迫使图书馆知识服务向差异化方向发展。 图书馆知识服务要利用自身的优势, 比如馆藏资源本身已经具备很高的学术价值、 便于对服务对象的深入挖掘等, 才能使图书馆知识服务在 "大数据出版" 环境下生存和发展。 具体措施有三点:

  第一, 图书馆需要实施基于 "大数据出版" 的读者决策采购模式, 降低图书馆服务对象与出版商之间的信息不对称, 提高馆藏质量。 馆藏资源是图书馆知识服务的基础,"大数据出版" 给馆藏质量带来了挑战, 继续沿用传统采购模式势必将造成馆藏数量剧增但质量不一定高。 而读者决策采购是一种以读者为主导的资源建设新模式, 使读者从资源建设的接受者和终端转变为发起者与首端。"大数据出版" 环境下这种采购模式避免了图书馆在采购时迷失在浩瀚的出版资源中, 减少了图书馆服务的终端读者与出版商之间的信息不对称造成的效率低下。"大数据出版" 环境下的出版商面向大众读者, 只能将大众读者进行粗略划分来确定读者问题所在, 无法将对象细化定位到图书馆服务的对象。 读者决策采购减少了出版商对服务对象的调研, 图书馆也能够摆脱海量甄选的劳动, 把出版商和图书馆从重复劳动中解脱出来,也保证了馆藏确实适合读者需求, 为图书馆开展知识服务奠定良好的馆藏基础。

  第二, 图书馆要从 "大数据出版" 与图书馆知识服务差异化入手, 提升图书馆知识服务竞争力。"大数据出版" 提供的知识服务与图书馆知识服务相比缺乏对图书馆用户的即时交互服务。 张晓林在 2012 年就指出图书馆要构建嵌入科研一线、 虚实结合的协同知识服务机制[8]. 构建开放、 交互、 动态问题驱动、 创造驱动的即时交互平台将成为图书馆知识服务的发展方向。 对于这个平台需要从虚实两个方面构建: (1) 对于实体平台构建方面, 图书馆不仅可以利用现有的空间服务, 还可以拓展空间服务。 现有的可以作为即时交互实体平台的空间除了阅览室、 教学用讨论室外, 图书馆还可以借助会议室等场所组织专题讨论, 在这些活动中, 图书馆不仅是组织者还可以充当参与者, 对于熟悉某学科的学科馆员不仅可以参与讨论还可以给予建设性意见或者根据讨论结果继续提高后续服务, 如提供相关图书或者大数据挖掘服务等。 (2) 对于虚拟空间构建方面, 图书馆之前利用微博、 学科 Blog、 Email、 在线咨询、 BBS、 QQ 等手段实现与用户的交互, 但是在微信成为主流的今天,通过微信等新技术手段实现即时交互将成为趋势。 截至2014 年 8 月, 全国有 199 个 出版社注册了微信公众账号, 134 个得到了认证, 还有 200 家左右高校开通了微信公众账号, 这就为图书馆通过微信等平台搭建虚拟即时交互平台提供了技术支持。 图书馆通过微信提供即时交互时, 不仅支持一对一、 一对多以及其他人员之间的即时交互, 还要在即时交互的同时增加围绕馆藏的各种数据挖掘和分析以及推送服务, 保证用户能够在这一平台上找到解决问题的方案。

  第三, 图书馆知识服务竞争力的提升离不开专业的综合型人才队伍建设。 "大数据出版" 对于从业者在数学、 统计学、 数据分析、 自然语言处理方面的要求越来越高, 图书馆知识服务不仅要求馆员具备这些能力, 还要具备一定的知识结构和技能素养, 能够组织讨论、 实现即时有效的交互、 理清知识结构等。 单个馆员已经无法完成这一复杂工作, 图书馆急需建设一支知识服务团队。 这个团队的组员不仅要有很强的计算机操作能力,能够运用技术手段分析数据, 还要有图书情报专业素养, 擅长检索和发现, 掌握大数据环境下的数据挖掘、数据组织等大数据知识与技能, 并具备协作能力, 能够在即时交互平台上开展服务。 对于这支人才队伍的建设需要从几方面入手: (1) 现有人才培训。 图书馆通过聘请专门的数据专家长期为图书馆人才队伍进行数据处理方面的培训; 馆员可以去有大数据教学的高校进行学习, 如北京航空航天大学计算机学院、 软件学院拥有大数据专业工程硕士培养项目, 国外如伊利诺伊州立大学等也开设了大数据的相关课程和研究方向, 亚利桑那州立大学已围绕元数据等主题开设了数字馆藏课, 图书馆均可安排馆员前去学习。 (2) 人才引进。 "大数据出版"环境下基于图书馆知识服务的需要, 在引进人才方面图书馆要慎重。 引进的人才不仅需要有一定的学科背景,最好具备很强的数据分析能力, 能够对 "大数据出版"产生的出版资源从更小的主题进行挖掘, 最好具有大数据处理行业和某一学科的从业经验。

  参考文献:
  [1] Big data: The next frontier for innovation, competition,and productivi-Ty [EB/OL] . (2012-08-01) .
  [2][6][7]张晓林.颠覆数字图书馆的大趋势[J] .中国图书馆学报, 2011 (5): 4-12.
  [3]维克托·迈尔-舍恩伯格,等.大数据时代[M] .杭州:浙江人民出版社, 2013: 109-110.

相关内容推荐
相关标签:
返回:图书馆学论文