2. 信息可视化及文献检索可视化相关概述
2.1 信息可视化概念
随着信息全球化时代的到来,地理、文化和语言之间的隔阂越来越小,人们整天需要面对大量的信息和各种形式的数字媒介,海量的信息使得人们在选择时很难抉择,这大大加重了人们的日常生活负担,降低了工作的效率,使人对生活产生疲惫感,这时候人们非常希望有一种新的视觉交流方式来帮助大家处理和分享信息。
因此现在视觉设计的重点就在于如何使用户能够容易的接受信息、快速理解信息中的内容从而做出相应的决策,于是由多学科交叉的“信息可视化”设计学科应运而生。
大量文献资料中对信息可视化技术都有不同的描述,下面简单介绍几种比较着名、具有代表性的描述:信息可视化就是将广泛存在的非具体数据以一种能够满足人机交互的方式表达出来,使得信息接收人员能够方便的分析数据、从而找出数据之间的规律、最终完成对信息的处理。信息可视化最终就是通过有意义的图形将数据表达出来,进而能够观察数据、理解信息内容,最终做出决策。或者将信息可视化描述为人们为了满足对各种事物的认知,通过借助现代网络科学技术,进行的一种复杂信息交叉、非空间的、非数据性的信息视觉再现。
本篇文章则是通过将信息可视化归纳为一种依赖高新网络技术,利用各种科学的研究、计算理论,进而将虚拟的信息、不具体的数据及隐藏在其深处的数据关系以一种大家容易接受、理解的图形图像进行分析展现的过程。信息可视化以挖掘、找出数据信息中的结构关系和隐藏属性为主要任务,以各种抽象信息之间的关系为研究对象[21],显示结果主要针对于对易用性要求极高的各个能力层次、背景和需求的用户。
2.2 信息可视化模型
信息可视化参考模型一般采用如图 2.1 所示模型:
从上面的信息可视化模型中,我们可以发现,用户要想最终理解和使用数据,就要经历各种信息数据的传递、反馈等数据的变化过程。信息的使用者,可以通过传递过程中信息的变动、更正等这些调整对数据进行的可操作的控制。用户可以通过信息视觉化技术将原始基础性的数据通过数据变换转化成数据列表;进而通过可视映射将上述数据列表转化成一种可见的一种结构视图;然后通过视图变换将上述结构视图转化成真正意义上的可见的、可理解的显示模式。通过此模型,我们就会发现:要想最终解决信息可视化相关问题就要有针对性的去处理该信息传递过程的各个节点,进而保证对的信息可视化。
2.3 信息可视化技术
2.3.1 信息可视化的方法
通常来讲信息可视化过程中,我们一般依据信息源自身特性进行有选择性的信息可视化方式。根据信息源自身特性,我们将可视化方式大致分为七大类,分别是:一维、二维、三维、多维、时序、层次、网状的信息可是化方式,下面就逐条对上述其中四种可视化方法进行一定层度的概括解释。
1、一维信息可视化
简单意义上讲我们所知的直线关联性的消息,数据、高级程序、文字等都可以认为是一维信息的代表。而一维信息可视化就是通过解决查询事件的特定特质,进而通过现有的字体大小、文字颜色、文字种类以及常见的信息视图去表达信息的可视化。通过运用此项技术,能够从很大程度上帮组信息检索客户最大程度的理解认识这些一维信息,进而找到合理有效的方法处理相关一维问题。
2、二维信息可视化
二维信息可以理解成事件本身由两个重要的属性构成,而事件本身的组成则是由上述属性之间的相互匹配、作用而一同出现的现象,即双属性数据集合。研究二维信息可视化的最主要问题是确定两种属性的相互关系和作用,进而确保客户通过二维信息可视化界面找到数据之间的关系、规律,从而更好依据显示问题找到解决方案,进而更加高效的选择、过滤、计算相关数据之间的联系。
3、多维信息可视化
多维信息可以理解成事件本身由多个重要的元素构成,而事件本身的组成则是由构成元素之间的相互匹配、作用而一同出现的现象,即多元素数据集合。但是由于人们对事物认知程度的局限性,还不能够过多的了解、描述多维度信息,只能停留在人们常说、常见的二维、三维的环境中,现实中我们发现多维信息则可以看作是不同类型之间的二维、三维等环境的多种自由组合,还是最终可以通过上述简单维度信息处理多维度信息;故而通过什么方式方法去降解多维度信息的同时,又能保证在这一实践过程中,信息质量不发生偏颇是文章的研究重点。在信息检索结果的可视化中,其关键词包括文章作者、文章发表刊物名称、引用、发表时间等多个相互关联的元素,在视图中同时要保证使其在一个可以被人们直接看到的、尺寸限制的提示性界面中显现,还要使搜索结果合情合理、具有信息关联性,这种复杂的信息可视化就可以看成信息多维可视化。
4、网状信息可视化
网状信息,顾名思义,是指与其他任意数量的节点之间有着联系从而形成类似网状的信息。他们之间没有更多的内在联系、组织架构,更多的则是点与点之间的直接联系,进而体现点与点之间关联的多种特性,其可视化就是将这种点对点联系的内容进行再现、可见的一种方式[22].
2.3.2 信息可视化映射技术
人们为了解决多维信息的降维问题,也就是对所见信息进行降维处理,通过多年的理论实践研究,发明了新型的信息可视化映射技术,其中今年来被人们广泛应用的就是潜意识语言理解分析、网络路径查询、信息多维尺度方式等,本文重点对寻径网络加以介绍,具体内容如下:
PFNET 这项可视化技术最早被各界使用[23].该技术以数据本身的特有经验属性,然后针对相似或者迥异的事件之间的关系进行评价,进而利用很成熟的理论知识、原理构架一个具有特殊种类的网状模型。它通过对事件的理解、分析,进而形成自己特有的网络表现方式[24],然后由该技术进行理解分析,进而实现不同事件之间进行分层归纳。
PFNET 拓扑模型主要由 q、r 进行表示,进而可以表达成一种基于两种元素的组建函数模型 PFNET(r,q)。因素 r 的具体含义是:明氏度量,该参数就是用来计量路线的实际长度[25];因素 q 的具体含义是:事件自身各种约束因素被考虑情况下的最低成本耗费线路。路径和链接 K 权重比例关系由 , …… 最终决定,即分别代表每一个单独链接所代表的 K 值大小。
PFNET 方式能够简单直观的展现事件之间的各种内在关联,这种模型就是人们能够主动认知的一种认识模型。尽管这种数据理解方式所要求的事件本身节点数量的限制,但是由于信息搜索可视化自身的因素就不多,进而理论上能够满足构建需求。
2.3.3 信息可视化显示技术
通过对文献进行检索再对检索结果进行聚类分析,最后将处理的数据计算机上进行可视化展现,其中展现的方式多种多样,下面重点介绍以下几种信息可视化显示技术:
1、整体+细节技术(Overview + Detail)
着名教授 Card 根据自己的实际理论研究,将整体+细节技术进行解释:人们通过同时使用整体视图、细节视图去勾勒整个事件关联信息源;整体视图能够保证事件信息的整体空间性,能够迅速找到分类,并且通过整体内部大致含义找到信息细节方面的导航信息,进而充当信息细节的关键控制部件;细节视图就是在选定特殊信息的情况下,进一步满足信息更为详尽情况、显示更多信息的内在细节,通过对整体视图的一种点击操作来完成。整体、细节的最终外在窗口能够显示同一个信息环境包括的多个可视化视图;一部分用来显示信息详尽细节性的空间视图,可以变成缩小化的信息窗;另一部分能够整体展现信息的,即为信息整体窗。
整体+细节技术视图的优势就是:使用客户通过利用整体视图能够整体把控、理解整个消息在传播过程中的位置,进而找到信息之间的大致联系,并提供与事件自身有关的内在消息,比如通过该种方式能够在信息检索过程中,直接查看与信息相关联的文献的整个文章构架,给用户以信息的可控性。信息的细节视图就可以根据信息的细节进行文献等的最终定位 ,从而保证快速、高效获取信息。
整体+细节技术视图的劣势就是:真正使用的客户需要在两者之间不断的切换、重新构建、重新建立映射关系,进而很大程度上造成客户使用过程中一部分时间、经历用在了信息之间切换、匹配过程的等待中,延长信息检索所用时间。
2、Focus+Context
着名研究学者 Card 认为,人类在理解认知整个信息的过程中,要求以整体的可视化方式呈现,同时又能够探究局部的信息内容,进而进行局部信息的处理[27].
该种对信息进行处理的技术主要包括:整体+细节技术及 Focus+Context 技术。
Focus+Context 技术的理论研究最早受鱼眼视图的影响而产生。在某一固定位置,某一像素进行一定量的位置移动,而这种移动的过程中出现越靠近事物中心点,像素实际的偏移值越大,即人们常说的鱼眼现象。这一现象就会导致越靠近事件中心,其真实值域就会被扩大化;越偏离事件中心,其真实值域就会越来越小。而最新研究成果:Focus+Context 技术就可以保证客户通过察看聚焦中心的一个微小的数据的同时;又能够最大程度的展现事件的整体完整区域。Focus+Context 信息可视化技术既能保证整体信息可见的同时,显示一定的细节信息。
这种信息可视化技术通过使事件信息范围尽量扩大化,同时保证信息焦点的细节化,保证两种信息互相结合,且一直随着客户自己信息需求的变化而改变。这种技术出现的必要因素包括三类:一、客户需求的实际信息既包括整体范围的广泛信息,又包括少数细节性信息;二、客户需求的整体信息与细节信息中所包含的信息内容量是不同的;三、两种信息能偶最终柔和在一个信息载体下,同时在同一窗口下进行体现。该技术研究领域的关键点就是保证事件中心信息足量显示的情况下,采用什么方式方法最终完成更大化的信息范围,同时又能够保证两者之间的一种完美转换。
3、平移+缩放技术(Panning +Zooming)
在 20 世纪 90 年代,Furnas 和 Bederson 等率先对可缩放用户界面进行研究,并且将其定义为:利用平移与缩放技术显示信息,在显示空间里使用比例尺来作为交互手段的可视化操作界面。平移和缩放技术有以下特性:首先在交互方面,用户可以利用平移和缩放直接作用于信息空间。其次,将比例尺的大小作为显示信息的组织手段,信息的显示结果取决于用户所使用的比例尺层次。各种信息的缩放,并不仅限于单纯的视觉外观尺寸,同时包含了文字所表达的语义内容的缩放。随着比例尺的大小变化,空间对象的内容详细程度会随其几何尺寸而变化。
ZUI 最大的弱点在于用户在平移与缩放的交互过程中,则需要时刻谨记那些无法看到的信息所在的位置,因为 ZUI 并不能在大型信息空间中提供足够的上下文位置信息。
4、双曲树(Hyperbolic Tree)
Lamping 和 Rao 等研究人员研究了一种可以应用于大型层次结构的整体+细节技术,这种新型关键理论被称为基于双曲几何的双曲树。该理论最大的优点就是将空间中被广泛聚焦的内容进行显现,同时又能保证整体结构的体现。本理论通过一种有规律性的函数将上述关联性描述在一个曲面上,然后通过一种规定的映射函数关系,将其显现在固定位置。其中使用鱼眼技术来实现整体和细节之间的过度。
Hyperbolic Tree 理论的优势:通过信息交互的方式能够很好的结局结构树中整体和细节相互之间的稳定过渡。不足之处:当把需要显示的特定节点移动到屏幕显示的中心时,这个节点的父节点就会被移动到周围其他节点附近,这样就很难发现它们之间的父子关系,同样也很难分析同一节点的不同父亲节点之间的相互关系。
2.4 文献检索可视化
2.4.1 信息可视化与文献检索
文件信息检索的环境就是将各种文献资料、各种情报信息、各种发问、各种着作等文件检索模式,通过可视化信息技术内部的一种转化关系,将上述不存在可见性质的信息以图形、图片的方式,依靠电脑屏幕等二维或者三维载体的可视化界面按规定要求呈现出来。也就是说,浩瀚的信息数据及其之间的某种关联比作是一种信息存在环境,该环境下包括相当数量的文件着作,他们之间通过各种引用关系而相互的关联存在。但是由于数据之间具有复杂、多变性,他们之间客观存在的种种关系却是不可见的,然而我们可以通过这种可视化技术来规律性的呈现上述特性。
不管信息具体呈现的方式、方法有什么不同,其最终目的都是通过可视化技术所产生的视觉工具向人们传播各式各样的、无形的、抽象的信息。人们获得对事物认知的一贯方式就是借用信息浏览,因此我们可将文献检索看成:人们为了获得某一类特殊的信息,最终通过查找、搜索等方式完成可用信息的搜索工作。而这种获取信息过程,可以认为是先对信息进行内部结构分析然后再次呈现出来的可视化过程。
可视化与信息检索存在着相互影响和促进的关系。信息检索和信息可视化在各自领域的研究进展和技术发展都对对方的发展有很大的影响。对于任务分析的研究和对用户的研究在信息检索与信息可视化关系中起到了桥梁的左右。信息可视化的空间显示与立体查询特性为信息检索的实现提供了理论上的帮助,并且信息可视化提供对信息的认识优势也在一定程度上改善着信息检索的方式。
信息可视化和信息检索之间存在着相互影响、相互发展、相互作用的关系,促使了检索可视化的出现。检索可视化技术是人们客观性的将事物内在的各种抽象的数据关系、语义含义转化成一种能够借助外界可见事物进行呈现的一种先进信息检索方式。因此它可以通过各种外在事物的大小、尺寸、形态等可见信息进行展示,进而实现客户对信息检索内容的理解,提高信息检索的各方面功能。
2.4.2 信息检索模型
信息检索就是客户通过利用可视化形式的信息检索系统,主动选择、匹配在数据库中能够满足客户所需信息的一种方式[31].经过多年的理论研究,现在有三个着名的模型广泛应用于现代化的信息检索中,因此简单介绍各种理论模型及其工作原理。
1、文献向量的构造定义文献 ,使其可以用 t 维向量的形式表示出来:
从对检索结果的处理中,我们可以看出,向量空间模型有以下特点:在算法方面,使用分部匹配方法,完成了对多值相关性的计算;在对词的计算方面,使用加权处理的方式,优化了检索效果;在结果输出方面,使用降序输出,方便了对显示结果数量的控制。
2.4.3 文献检索可视化的特点
文献检索所具备的突出的优势,能够从根本上减少人们获取信息时面对的各种困难,进一步增强人们获取、识别信息的能力,帮助人们扩展自己的认知度。正是由于这种新技术的大胆改革、大胆创新,从而保证了信息检索可视化技术得到长足的发展和进步,得到广大研究学者的青睐。对比传统意义上的信息检索方式,该种独特的、高技术的可视化信息检索就有自己独特的优势,具体如下:
一、信息的可视化完成了信息整体外在可见性,它将大量的抽象性数据、文献资料及他们之间的一种内在无形的联系转变成一种能够肉眼识别、能够被人类感知的一种技术,形象的描述了信息空间;二、可视化技术满足人们对信息交互式查询,人们与信息的各种交互方式都能在可视化空间中得到实现;三、它的出现最大程度满足人们认识、理解、使用海量信息的需求,进而通过利用这种手段达到快速、高效的处理各种信息的能力。四、它的出现开辟了信息检索的新型方式方法,在数据处理过程中将大量虚拟的数据信息、文献资料等转化成一种能够直接被人们理解、接受的一种可视化形式的信息载体。五、这种新技术的出现最大程度的满足了客户的使用需求,且拓展了信息的检索模式,为帮助人们分析信息提供了独特的方法,并且保证了对海量信息进行检索的便利和易操作性。六、该种技术方式为未来的新型的可视化方式出现开辟了空间,逐渐成为了人们分析信息最有利的工具。
2.4.4 可视化检索的优势
随着社会的不断发展,信息的来源渠道日趋广泛,信息的数量与日俱增。多种信息交织在一起导致了人们对于对自己有用信息的获取收到了干扰,在当前大数据的环境下,人们对于有效信息的获取给予了更多的关注。据统计数据表明,当前人们对于信息的获取有70%靠视觉来获得,对于听觉系统来说只占到20%,触觉上来说对于信息的掌握上面仅剩10%[32].因此,对于信息的获取主要的方式还是依赖于视觉的信息获取,近年来 ,可视化信息检索已经受到了业界专家的推荐和认可。
比如微软公司推出的Bing搜索引擎,其很多方面就是基于该种理念来实现的。
信息的可视化检索具有很多优点,具体如下所述:
首先,其在检索结果的信息传递与理解上做到了更加直观的特点。可视化检索的结果以更加直观的图形或图像进行显示,对于信息检索人员来说既提高了效率又对信息的认识更加深入,印象更加深刻,提高用户检索的积极性。
其次,该技术在用户信息检索中的交互性更好。与检索人员进行思想上的交互,达到对于检索深层次的沟通,通过提供更加有好的交互界面,实现了人们对于有效信息的获取。
最后,可视化检索对于人们工作效率的提升将起到极大的帮助作用。随着全球大数据热潮的到来,人们对数据更加敏感,对信息的获取整合要求能力更高。通过采用可视化的检索手段,使得人们在工作中可以通过多种方式进行自由检索。
因此,可视化检索优势在有效信息的获取上面发挥了巨大的作用,它在人们的视觉信息的获取上面将起到极大的辅助作用。我们有理由相信,可视化信息检索是未来发展的趋势,在人们的未来生活中将发挥巨大的作用。
2.5 本章小结
本文研究的文献检索可视化是以信息可视化技术为基础的,因此本章主要对本文所涉及的信息可视化理论,信息可视化模型、信息可视化的映射技术、信息可视化的显示技术以及检索可视化、文献检索模型及文献检索可视化的特点、优势等可视化理论与技术做了详细介绍,为论文的后续工作奠定了理论与技术基础。