信息组织在大数据背景下的挑战与对策
来源: 图书情报知识 作者:赵一鸣;马费成
发布于:2017-06-28 共10858字
[摘要]为了深度剖析大数据环境给信息组织带来的影响,首先指出信息组织应该在大数据资源的分类、记录与描述、浓缩与约减,定位、选择、评估与管理,交换与共享等方面发挥作用。进而剖析了在发挥这些作用的过程中将面临的困难和挑战,包括:信息组织的作用极易被忽视,信息组织的学科边界逐渐模糊,信息组织的自动化和智能化水平不足,信息描述标准的建立存在困难,现有信息组织的工具与方法体系难以适应大数据组织的任务。基于以上认识,对信息组织发展趋势和任务的判断是:打造精品工程、凸显信息组织在大数据环境中的地位和作用,依托大数据技术、提高信息组织的自动化水平和效率,借助存量语义资源、对大数据进行语义化组织,面向大数据源头、建立新型的数据表示方式与体系,在数据开放环境下、致力于数据的互联和整合。
[关键词]大数据环境 信息组织 数据描述 数据互联 数据整合。
[Abstract]This paper firstly indicate tha,under the big data environment,information organization should play roles in thebelow aspects:classifying,recording,describing,concentrating big data,navigating,selecting,evaluating and managingbig data,as well as exchanging and sharing big data.Information organization will face many problems and challenges in theprocess of dealing with big data.The problems and challenges include:the role of information organization can easily be ig-nored,the disciplinary boundaries of information organization is gradually blurring,both automation and intelligence level ofinformation organization are insufficient,existing tools and methodologies are not enabled information organization to handlethe tasks of processing big data.Based on the above understandings,in the future,trends and tasks of information organiza-tion can be summarized as the following five aspects:(1)Building quality projects of information organization to highlight theimportance of it in the big data environment.(2)Improving the automation and efficiency level of information organization withbig data techniques.(3)Organizing big data semantically with the help of the stock of semantic resources.(4)Establishing new-type data representation mode.(5)Promoting the interconnection and integration of data under the background of the open-datamovement.
[Key words]The big data environment Information organization Data description Interconnection of data Integration ofdata.
1引言。
数据与信息是重要的生产要素和战略资产[1],已在全球形成共识。然而,失去控制和无组织的数据和信息却不能很好地发挥战略资产的作用[2].信息组织是对文献、数据等信息资源对象进行分类、标引、描述、揭示,使之有序化、系统化的过程,其目的恰好是将无序的、分散的数据和信息整理成有序的信息资源,保证用户的有效获取和利用。因此,信息组织对于大数据资源的管理与利用具有重要作用。
同时,当前的大数据环境给信息组织带来了巨大的影响。正确地识别这些影响,对于凝练信息组织的研究方向、使其适应当前的发展环境、与国家的重大需求对接、为国家大数据战略的实施提供智力支持,具有非常重大的意义。
本文将通过回顾信息组织在传统环境下的职能和作用,提出信息组织在大数据环境中应该发挥的作用,以及在发挥这些作用的过程中将面临的困难和挑战,针对这些困难和挑战,明确信息组织在大数据环境下的发展趋势以及需要承担的具体任务。
2信息组织在大数据环境中应发挥的作用。
海量、异构、动态变化的数据使得信息组织的任务变得更为复杂,具体体现在数据本身的复杂性、计算的复杂性和信息系统的复杂性等方面[3].这也是大数据处理任务面临的普遍问题,有赖于大数据存储、大数据计算、大数据挖掘与分析等基础性技术的突破和迭代。从信息组织的角度来说,我们并不期望它解决大数据的所有问题,但至少应该在数据的分类、描述、约减、评估、交换共享等方面发挥重要作用。
总的来说,信息组织应该在以下几个方面发挥作用:
(1)大数据资源的分类。分类是人们认识事物、区分事物以及分析问题的基本方法,也是人类思维的基本形式。作为信息组织的基础性方法,分类法用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列,将知识按照学科门类加以集中,便于用户浏览检索[4,5].分类法最初用于图书馆文献信息资源的分类排架、建立分类检索系统,在网络环境下又衍生出网络主题分类目录、各类网站的自编分类体系、大众分类法等形式。
在大数据环境下,分类的方法应该发挥更重要的作用,以电子商务大数据为例,在数据生成的过程中,信息就是按照一定的门类(比如网站自编的商品分类体系)被采集的。当前,还需要建立多维度的大数据分类(分级)体系,比如根据大数据序化的程度进行分级,分为序化程度高、序化程度一般、序化程度低三种,选择判断出当前急需进行序化、能够进行序化的大数据类型,针对序化程度高的数据,研究重心在于整合和互联,针对序化程度低的数据,研究重心在于描述和揭示。
在信息组织的研究和实践中,必须根据不同的大数据类型采取相应的策略,并决定数据描述和揭示的详细程度以及深入程度。比如根据数据处理方式,大数据可分为适合于批处理的大数据与适合于流式计算的大数据,信息组织应主要着眼于可存储、可进行批处理的大数据类型。根据处理响应时间,大数据可分为需要实时/准实时计算的大数据与非实时计算的大数据,根据响应时间的要求不同,信息组织介入的方式应有所区别。根据数据价值、数据分布状况、数据类型等指标决定信息组织的深度,对于价值密度极其稀疏的大数据,往往只需要进行浅层的组织与序化,对于分布式存储的数据,重点要实现数据划分和互操作,对于流式数据,则需要在数据生成之前,就建立好数据描述和表示的标准。
原文出处:赵一鸣,马费成. 大数据环境对信息组织的影响[J]. 图书情报知识,2017,(01):4-10.
相关内容推荐
-
图书馆应用大数据策略分析
0引言随着网络信息技术的不断发展,互联网信息数量及种类激增,面对规模大、形式多样的数据,如何收集并分析出有价值的信息成为各行业研究的重点,大数据概念也因此而产生并进入人们的视野,可以说大数据的运用使人类的工作、生活和思维发生了极大的变化,...
-
大数据背景下图书馆服务问题与解决措施
大数据时代提高图书馆的服务读者质量, 还要从读者的信息需要出发, 构建完善的线上线下互动机制, 实现传统的服务方式与大数据环境的有机结合, 从而更好的满足读者的阅读需要, 提高图书馆资源供给质量。...
-
我国图书馆推进大数据的思考
1引言大数据,作为1行业近几年兴起的热词和新技术,正以它独有的魔力影响着我们的生活和思维方式。然而,国内绝大多数图书馆对大数据的反应并不积极。数据即资产、数据即服务,数据背后蕴藏着的价值可想而知。图书馆作为文献信息中心,有着海量的数据资源,...
-
高校图书馆运用学习分析技术的决策模型
在大数据背景下,满足用户多样化和个性化的需求是衡量图书馆服务质量的重要标准。个性化服务系统是对当前各种自动化服务系统的升级改版,需要重点解决两个方面的问题:一是数据信息的收集方法,需要实现密切跟踪用户学习动态过程,及时收集用户数据,并建立...
-
大数据背景下的图书馆服务革新措施
大数据,是继移动互联网及云计算之后又一次革命性的创举。随着半结构与非结构化数据等概念的产生,相关的企业及政府的相关部门也都发现了大数据当中包含的核心价值,图书馆作为现今社会上规模最大的公益性信息资源供给机构,随着信息资源建设步调的逐步加快...
-
-
大数据环境下大学图书馆舆情信息服务的创新
图书馆舆情信息服务是指信息服务部门按照用户需求,通过对大量信息进行汇集、分类、筛选、整合、提炼等技术处理,形成反映社会舆情、网络舆论总体态势,并提出有效对策建议,为普通用户、专家领导、政府机构、智库管理者提供决策参考的信息产品的过程。...
-
大数据时代高校图书馆的发展转型思路
网络化、数字化和智能化为高校图书馆转型提供了全新的社会背景和技术手段,高校图书馆面临着深度变革。大数据环境下,高校图书馆资源建设、读者服务与管理形态的基础发生了本质的变化,但就目前高校图书馆实际运行模式而言,远远没有达到与环境变化相匹配。...
-
大学图书馆非结构化大数据管理的依据和D-SFSD
1、图书馆非结构化大数据的独特性图书馆作为记录、储存、传播与应用人类文明与数据的机构,其需要处理的数据正在呈几何级数增长,尤其伴随着网络社区、交互式通信、用户服务等技术的成熟发展,结构化与半结构化的数据在逐渐增多,数据呈现数量多、种类繁、...
-
大数据下图书馆流通服务改进研究
随着网络技术的发展, 图书馆对流通服务模式进行创新是不可避免的发展趋势, 对于图书馆而言, 这种创新不仅是其有效实现服务模式转型的机遇, 也是一个巨大的挑战。...
相关标签: