摘要:随着科学技术以及互联网的发展,数据逐渐朝着爆发方面发展,数据信息数量急剧增加,为了给广大用户提出更合理的幅度,人们开始重视大数据。大数据技术实际上是一种数据挖掘、预测分析、人工智能、统计分析语言处理以及存储数据的综合技术,形成了数据工程新研究领域。可视化技术是大数据分析的重要形式,大数据可视化技术主要是在数据自动分析功能的前提下,利用人们挖掘数据过程中对于可视化技术的分析和认知能力,充分融合人类自身和机器的各自特征,依据交互技术,辅助人们可以更加直观的进行数据分析。
关键词:大数据; 可视化; 信息时代;
作者简介: 路晶(1983-),女,汉族,河北保定人,讲师,四川大学硕士,主要研究方向:民航计算机、大数据。;
1、大数据可视化分析的基本概念
随着科学技术的进步,社会逐渐朝着数字化、新信息的方向发展,物联网、互联网以及云计算发展十分迅速,导致社会充满数据,因此,使得数据成为了新的信息资源,需要人们进行适当的利用,以此来满足人们的实际生产生活要求。基于此,导致呈现指数形成增长,并且变的更加复杂化,使得大数据区别与传统的数,增加了内涵。可视分析实际是一种融合了信息可视化、科学可视化、数据挖掘、人机交互、信息论、认知科学等方面的新方向学科。可视化分析实际上是一种能够利用交互式可视化界面来对复杂数据进行分析的技术,可视化基本流程为数据、知识、循环数据,主要包括可视化技术以及自动化分析技术。大数据可视化技术实际上是一种利用自动化分析进行数据挖掘的时候,在使用能够进行分析的人机交互界面和能够进行信息可视化的界面来融入自身的认知能力和计算机的计算能力,从而可以有效地得到观察大数据的能力[1].
2、大数据可视化分析
2.1 文本可视化
作为大数据时期文本可视化数据的一个典型文本信息,实际上也是最主要的互联网数据信息,与此同时,也是物联网通过一定的传感器收集到的信息类型,在正常的工作和学习以及日常生活中人们使用最多的就是文本形式的电子文档。文本可视化可以在一定程度上直观的体现文本主要优势和特点,例如,逻辑结构、动态演化规律以及主体聚类等。最基本和典型的文本可视化就是标签云,依据词频来合理的把关键词进行排序和归类,然后利用一定的颜色、大小等属性来进行文本可视化。现阶段,最主要的就是利用字体大小展现的关键词使用在互联网中主题热度的识别。随着关键词数量的不断增加,如果不能合理的进行设计阀值,就会出现重复覆盖以及局部密集的问题,这样就需要提供一定的交换窗口来操作[2].
2.2 网络可视化
在大数据分析中最常见的关系就是网络关联,例如,社交网络和互联网。实际上层次结构在一定程度上属于一种比较特殊的网络信息。依据连接拓扑和网络节点之间的关系,可以非常直观的体现出网络中隐藏的关系。例如节点,实际上是进行网络可视化的重要内容之一。怎样在大规模边和节点的网络中利用有限空间进行一定的可视化,是现阶段大数据研究的重要和难点。除了能够可视化静态拓扑关系,还具有相应的动态流动演化性,所以对动态网络进行一定的可视化也是不容忽视的内容。随着网络中边和节点数目的增多,很容易出现覆盖、重叠以及聚集等问题,不能很好的进行可视化,影响效果。因此处理大规模可视化的主要方式就是图简化。可以分成两类,一类是利用多尺度和层次聚类进行交互,把大规模数据变化为具有一定层次的树结构,然后利用多尺度进行不同的可视化。另一种是对边进行适当的聚集,保证具有清晰的可视化效果。这些都是简化的主要方式,也可以看出引入交互技术,是可视化技术未来发展过程中必不可少的方式[3].
2.3 时空数据可视化
时空数据主要是指具有一定时间标签和地理位置的数据。移动终端与传感器发展非常迅速,因此,使得时空数据逐渐成为大数据发展过程中典型的数据类型。充分结合地理制图学以及数据可视化技术,分析和研究空间和时间对于可视化表征之间的关系,能够很好的展示空间和时间以及规律模式。大数据时代发展模式下,时空数据具有实时性和高维性,同时这也是数据可视化的重点。为了能够更好的体现信息随着空间和时间位置发生一定的变化,一般可以利用信息对象来逐渐实现数据可视化。流式地图是最典型的可视化方式,充分融合地图和时间事件流。为了可以打破二维数据的局限性,出现了时空立体方,是利用三维模式来展现空间、时间、事件[4].
2.4 多维数据可视化
多维数据可视化实际上就是说拥有很多个维度的数据变量,在数据仓库以及数据库中具有广泛的应用,例如,商业智能系统、企业信息系统。进行多维数据的主要目的就是不断发现多维数据的模式和规律,合理展示不同纬度之间存在的关系。多维数据可视化具有多种方式,主要包括基于图标、基于图结构、几何图形、基于层次结构、基于像素、混合方式。近年来,随着大数据的不断发展,几何图形是研究多维数据可视化的重点。最常用的多维数据可视化的方式就是散点图,二维散点图可以适当利用多维度中的两个维度综合的体现映射到两条轴上,利用不同的图形在二维平面内合理反映维度信息。例如,可以利用不同颜色、形状等来表示一定的离线或者连续性。投影是从多维度方面来体现可视化的一种方式。能够很好的体现出维度的属性值的分布情况,还可以体现多维度之间的关系[5].
3、结语
总而言之,作为大数据分析的重要方式,可视化分析可以有效的弥补计算机自动化分析过程中出现的不足和缺陷。大数据可视化分析可以很好的融合计算机的分析能力和人们对信息的感知能力,在依据数据挖掘前提下进行的数据分析。
第4章大数据技术在学生成绩分析中的应用。通过第一章的文献总结,我们了解到我国已经有一部分高校利用大数据技术对教育数据进行了分析,其中包括学生行为的分析、学生成绩的分析、远程教育资源的分析和在线系统中师生的交互数据进行分析,得到了一些有价...
2016年流行一个术语叫做数据主义,数据主义认为整个世界由数据流构成,数据每天以指数级增长,电话、飞机、网购、出行都是一个新的数据。数据将会有越来越重要的作用,同时人的地位慢慢开始下降。未来人的价值取决于对数据流的分析解读能力,因此分析技术在...
数据的可视化展示对于数据分析与挖掘至关重要, Tableau强大的可视化分析功能令数据分析快速、明确, 使获取“互联网+政务服务”数据信息变得更轻松。...
通过文献调研分析现有科研管理系统的基础上,提出一个基于Web的高校科研信息处理系统的开发方案,系统从结构上可以分为科研门户网站和科研业务管理系统两大部分,拟采用Java EE技术、Spring框架技术、Oracle作为系统后台数据管理软件实现该系统。...
随着我国大数据技术在智能交通管理中的应用, 传统交通管理模式已经无法适应交通行业发展, 新的大数据思维、云计算能力的实现, 大大提升了交通运输能力, 缓解交通运输压力, 实现了交通行业智能化、信息化、自动化和集成化发展。...
大数据和云计算进行有机的融合,才能发挥出它们更大的优势,才能创造出更大的价值。...
第1章绪论。1.1论文研究的背景和意义。大数据概述。(1)概念。随着计算机技术的迅猛发展,计算机与人们的日常生产和生活都已经变得密不可分。人们可以通过计算机进行数据的收集和存储,但是最近这几年,这些数据呈现出了几何数量级别的增长。图1....
第5章总结和展望随着信息技术的快速发展,教育大数据的规模也急剧增长,而其中蕴含的价值也不断增高,如何更好的利用教育大数据必将是众多研究学者的目标,面对海量的数据,大数据技术将是完美的解决方案,大数技术与教育数据的结合必将是未来的一个发展...
信息网络时代的到来,为行业多元化发展提供数据支撑,依托于信息的高效率整合、智能化运算等,可进一步为企业在相关战略落实过程中提供基础保障,规范企业发展,以提高企业在市场中的竞争力。...
摘要如今数据爆炸时代已经来临,传统的数据处理技术已经不能满足海量数据的处理需求。随着信息技术的发展,以Hadoop为首的众多大数据处理技术已经广泛应用到互联网、商业、医学、金融业以及工业等行业,而在教育中的应用确很少。因此本文应用Hadoop集...