图书馆学论文

您当前的位置:学术堂 > 图书档案学论文 > 图书馆学论文 >

信息组织在大数据背景下的挑战与对策

来源: 图书情报知识 作者:赵一鸣;马费成
发布于:2017-06-28 共10858字
  [摘要]为了深度剖析大数据环境给信息组织带来的影响,首先指出信息组织应该在大数据资源的分类、记录与描述、浓缩与约减,定位、选择、评估与管理,交换与共享等方面发挥作用。进而剖析了在发挥这些作用的过程中将面临的困难和挑战,包括:信息组织的作用极易被忽视,信息组织的学科边界逐渐模糊,信息组织的自动化和智能化水平不足,信息描述标准的建立存在困难,现有信息组织的工具与方法体系难以适应大数据组织的任务。基于以上认识,对信息组织发展趋势和任务的判断是:打造精品工程、凸显信息组织在大数据环境中的地位和作用,依托大数据技术、提高信息组织的自动化水平和效率,借助存量语义资源、对大数据进行语义化组织,面向大数据源头、建立新型的数据表示方式与体系,在数据开放环境下、致力于数据的互联和整合。
  
  [关键词]大数据环境 信息组织 数据描述 数据互联 数据整合。
  
  [Abstract]This paper firstly indicate tha,under the big data environment,information organization should play roles in thebelow aspects:classifying,recording,describing,concentrating big data,navigating,selecting,evaluating and managingbig data,as well as exchanging and sharing big data.Information organization will face many problems and challenges in theprocess of dealing with big data.The problems and challenges include:the role of information organization can easily be ig-nored,the disciplinary boundaries of information organization is gradually blurring,both automation and intelligence level ofinformation organization are insufficient,existing tools and methodologies are not enabled information organization to handlethe tasks of processing big data.Based on the above understandings,in the future,trends and tasks of information organiza-tion can be summarized as the following five aspects:(1)Building quality projects of information organization to highlight theimportance of it in the big data environment.(2)Improving the automation and efficiency level of information organization withbig data techniques.(3)Organizing big data semantically with the help of the stock of semantic resources.(4)Establishing new-type data representation mode.(5)Promoting the interconnection and integration of data under the background of the open-datamovement.
  
  [Key words]The big data environment Information organization Data description Interconnection of data Integration ofdata.
  
  1引言。
  
  数据与信息是重要的生产要素和战略资产[1],已在全球形成共识。然而,失去控制和无组织的数据和信息却不能很好地发挥战略资产的作用[2].信息组织是对文献、数据等信息资源对象进行分类、标引、描述、揭示,使之有序化、系统化的过程,其目的恰好是将无序的、分散的数据和信息整理成有序的信息资源,保证用户的有效获取和利用。因此,信息组织对于大数据资源的管理与利用具有重要作用。
  
  同时,当前的大数据环境给信息组织带来了巨大的影响。正确地识别这些影响,对于凝练信息组织的研究方向、使其适应当前的发展环境、与国家的重大需求对接、为国家大数据战略的实施提供智力支持,具有非常重大的意义。
  
  本文将通过回顾信息组织在传统环境下的职能和作用,提出信息组织在大数据环境中应该发挥的作用,以及在发挥这些作用的过程中将面临的困难和挑战,针对这些困难和挑战,明确信息组织在大数据环境下的发展趋势以及需要承担的具体任务。
  
  2信息组织在大数据环境中应发挥的作用。
  
  海量、异构、动态变化的数据使得信息组织的任务变得更为复杂,具体体现在数据本身的复杂性、计算的复杂性和信息系统的复杂性等方面[3].这也是大数据处理任务面临的普遍问题,有赖于大数据存储、大数据计算、大数据挖掘与分析等基础性技术的突破和迭代。从信息组织的角度来说,我们并不期望它解决大数据的所有问题,但至少应该在数据的分类、描述、约减、评估、交换共享等方面发挥重要作用。
  
  总的来说,信息组织应该在以下几个方面发挥作用:
  
  (1)大数据资源的分类。分类是人们认识事物、区分事物以及分析问题的基本方法,也是人类思维的基本形式。作为信息组织的基础性方法,分类法用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列,将知识按照学科门类加以集中,便于用户浏览检索[4,5].分类法最初用于图书馆文献信息资源的分类排架、建立分类检索系统,在网络环境下又衍生出网络主题分类目录、各类网站的自编分类体系、大众分类法等形式。
  
  在大数据环境下,分类的方法应该发挥更重要的作用,以电子商务大数据为例,在数据生成的过程中,信息就是按照一定的门类(比如网站自编的商品分类体系)被采集的。当前,还需要建立多维度的大数据分类(分级)体系,比如根据大数据序化的程度进行分级,分为序化程度高、序化程度一般、序化程度低三种,选择判断出当前急需进行序化、能够进行序化的大数据类型,针对序化程度高的数据,研究重心在于整合和互联,针对序化程度低的数据,研究重心在于描述和揭示。
  
  在信息组织的研究和实践中,必须根据不同的大数据类型采取相应的策略,并决定数据描述和揭示的详细程度以及深入程度。比如根据数据处理方式,大数据可分为适合于批处理的大数据与适合于流式计算的大数据,信息组织应主要着眼于可存储、可进行批处理的大数据类型。根据处理响应时间,大数据可分为需要实时/准实时计算的大数据与非实时计算的大数据,根据响应时间的要求不同,信息组织介入的方式应有所区别。根据数据价值、数据分布状况、数据类型等指标决定信息组织的深度,对于价值密度极其稀疏的大数据,往往只需要进行浅层的组织与序化,对于分布式存储的数据,重点要实现数据划分和互操作,对于流式数据,则需要在数据生成之前,就建立好数据描述和表示的标准。
  
原文出处:赵一鸣,马费成. 大数据环境对信息组织的影响[J]. 图书情报知识,2017,(01):4-10.
相关内容推荐
相关标签:
返回:图书馆学论文