计算机网络论文

您当前的位置:学术堂 > 计算机论文 > 计算机网络论文 >

从节点属性角度对教师科研项目合作网络可视化分析

来源:学术堂 作者:姚老师
发布于:2014-11-19 共5048字
论文摘要

  合作研究对于信息获取、思想交流、知识创新有重要的意义,是科学研究的重要模式。学者对科研合作网络进行了大量的探讨和研究。随着可视化技术的发展,社会网络可视化已成为分析科研合作网络的重要手段。通过对合作网络中的节点之间的联系进行可视化建模,将科研合作网络数据以图形化方式展示出来,不仅可以科学高效地协助用户清晰地认识合作网络的内部结构,同时也有助于挖掘隐藏在网络内部的有价值信息。目前已开发出的多款社会网络可视化软件,如 UCINET,Pajek,NWB等都能用于科研合作网络的可视分析。然而当前绝大多数网络可视分析虽然能较好地揭示网络结构,却往往忽略了节点本身的背景信息 (如属性) 。实际上社会网络不仅仅是一系列匿名的节点和连线,同时还应包含行动者的社会属性和他们的关系。Breiger 指出作为行动者社会层次的属性信息通常有重要的社会影响。因此分析社会网络不仅要关注所呈现出来的网络模式,同时也应关注隐藏在属性中的社会结构。比如在学者合作网络中,一个学者的所在单位信息包含学院、学校和国家 3 个不同的层次,如果能从不同的社会层级 (从个体,到跨部门,到国际合作)来分析学者行为,将有助于深入理解学者的合作行为以及影响力的分析。针对目前社会网络可视化难以支持节点属性挖掘的问题,本文提出一种从节点属性角度对社会网络进行可视分析的方法,该方法能在展示单个节点间相互关联关系的同时,展示单个节点与其所属群体和其他群体间的层次关系,以及不同群体间的关联和从属关系,侧重于对节点本身的属性信息和群体间的从属关系进行挖掘。笔者以某学院教师科研项目合作网络为例进行分析,从多尺度和跨尺度对教师的科研合作进行了展示,弥补了以往可视分析只注重网络结构特性的不足,为更深入全面地了解合作网络提供了帮助。

  1、 相关工作

  图形可视化正在成为了解不断扩大的社会交流协作网络的重要手段。由于这样的网络有着更大、更复杂的链接和结构,传统的直线图和力引导布局不能有效地揭示关系和结构,这便导致许多新可视化技术的产生,如层次聚类和连线集束方法。

  1. 1 层次可视化的相关研究

  在当前的层次可视化研究中常见的是类似于树根的有根树结构,这种方法是使用与计算机拓扑网络结构相类似的直线连接和层次布局来表示一个层次网络; 也有将节点的聚类根据其层次情况按照不同的深度排列在一个圆形整体中的气球布局; 还有使用基于空间填充设计技术的树形层级图,这种方法通过将矩阵中的方块按照不同的权重和从属关系进行嵌套处理来表示层次关系。层次聚类图则是融合以上层次可视化方法,同时引入可视化交互技术的一种可视化方式,因为它拥有总览、缩放以及筛选的功能。该技术假定一个或多个项被当作一个整体节点在可视化图形中输出,然后构建节点的分层或聚类集群,为这些分层或聚类集群分配一定的显示空间,这种可视化方法与当前的力引导布局对节点的位置计算所不同的是,该方法直接使用节点本身的属性信息来进行节点位置的定位,既保留了原始数据中节点的分层结构属性,又避免了力引导布局所需要的大量计算。

  1. 2 连线集束的相关研究

  节点之间使用直线连接是一种常用的关系表示方法,但随着数据量的增大,这种方法会由于连线交叉的增多而迅速导致视觉上的混乱。Fekete 等为了减少直线的交叉提出使用弧线连接来尽可能避免直线的交叉,而 Kauf-mann 等为了避免连线的交叉将聚类的方法应用到可视化研究中,将位置相近的连线捆绑成束以减少可视化图形中线的数量,避免密集的连线对可视化图形可读性的影响。D. Holten 融合以上方法的优点提出将边缘汇聚技术应用到预先定义过层次的复合可视化图形中,针对的是既包含层次关系又包含连接关系的网络数据。在树形结构中直接添加网络关系连线会使树结构的可读性受到极大的影响,为了解决可视化画面杂乱的问题,这种既可以显示节点的层次属性,同时借由可视化交互技术,通过点击缩放可以展示层次属性的细节,使不同层次的信息能够按照用户的需求进行信息的约减及扩展的连线集束的可视化方法被提出,较好地满足了将网络信息和层次属性相融合的需求。该方法使用阶层式的方式来显示节点的树形结构,并且通过一定的聚类和集束来减少连线交叉所形成的间隙,通过使用相近连线共享同一个路径而两端散开的连线方式,减少了在大数据的显示中由于连线的交叉而带来的视觉上的混乱。

  2、 数据模型

  通常社会网络是用图模型 G = { V,E} 来表示的。

  其中 V 代表所有节点的集合,而 E 代表所有边 (关联)的集合。本文在这个基本的图模型上进行扩展来包含节点的属性信息。每个节点具有多个属性,例如一个学者的社会属性的隶属关系可以在国家、地区、学校、学院、系等多层面进行描述。所以定义有多个层级属性的社会网络为N = { VN,EN} ,其中 VN为所有社会行动者 (节点) 的集合,而 EN为所有社会关系 (边) 的集合,每个节点有m 个属性,属性之间是有层次关系的。属性之间的层次关系定义为树结构 Ti = (VTi,ETi) ,其中 VTi表示来源于第 i个属性的树的节点,ETi是树形结构的边,表示属性的父子关系。为了分析社会网络和社会层次属性信息,使用TreeNet图模型,一个由树形结构和网络两个子图所构成的复合图。一个 TreeNet 图模型 TrNi 可以写成: TrNi =(Ti,N,ρ) ,其中 ρ 是一个网络节点在树结构中叶节点的映射,ρ(nTi)→nN,nTi∈VTiL,nN∈VN,VTiL是 Ti 树形结构里的叶节点,该模型被用于整合具有不同层次属性的社会网络。

  3、 案例分析

  以武汉大学信息管理学院教师科研合作网络为例进行可视分析。该数据集包括 72 名教师以及 141 个项目,这些项目分别为该学院在 2006—2012 年获批的国家自然科学、国家社会科学和教育部 3 类项目。节点属性有两层,学院和系,具体来说为 1 个学院,5 个系,分别是图书馆系、信息管理科学系、档案与政务信息系、出版系、信息系统与电子商务系。针对该学院科研合作网络的构建是以教师为节点,教师的合作关系作为边。这是一个无向有权重的社会网络,任意两名教师同时参与的项目数作为这两个节点之间边的权重。整个网络的边权重总和为 364。与以往分析整个网络结构特性不同的是,从节点属性角度来分析学院科研合作网络,具体来说,从多尺度和跨尺度的角度来揭示合作模式。比如针对科研管理人员来说,不仅需要知道整体的教师合作次数,更关注系与系之间的合作模式有何不同,哪两个系合作最为频繁哪些教师跨系合作多,是连接不同系的科研人员。为此笔者利用 EXTRAVIS构建了一个合作网络可视化系统,通过交互界面实现多尺度和跨尺度分析,为科研管理人员提供快速、易理解的评估和更有效的交流手段。多尺度体现在个人与个人、系与系合作模式展现,跨尺度体现在个人跨系合作模式展示。

  3. 1 系与系合作关系的可视化分析

  图 1 是基于节点属性信息和节点关联信息而生成的各系间的项目合作总图。左侧菜单可以对数据模型中的 ρ 进行调整,这样可以选择是否对关系连线进行汇聚,而右边则通过列表的形式对系内和跨系合作的数量情况进行宏观展示。连线的粗细表示项目合作次数的多少,而连线中标注的数字则量化地描述了合作次数的多少,从图 1 可以清楚地看到每个系与其他系的合作次数,提示信息管理系与电子商务系是合作最多的两个系。在此基础上很容易得到以系为单位的合作情况 (如表 1 所示) ,可以发现信息管理科学系是与其他系发生合作次数最多的系,其总数达到了 80 次,其次是信息系统与电子商务系 58 次,出版系 36次及档案与政务信息系 32 次,图书馆系 28 次。

 论文摘要
论文摘要

  在图 1 的基础上进行扩展,点击系所属信息片使其展开而得到了图 2 的合作关系详细视图。通过展开每一个系节点,能够得到包含每个系教师详情信息的系合作关系详图,从中可以看到两级节点,第一级是系,第二级是个人。详图除了进一步显示信息管理系与电子商务系间最为密切的合作关系外,还显示了全部参与合作的二级节点(教师) 的情况,从整体上显示了系内和系间存在的合作关系。图 2 提示信息管理科学系中教师间合作关系连线最为密集,内部合作有 63 次,其次为电子商务系 30 次。

  论文摘要

  3. 2 个人在系内及跨系合作关系可视化

  为了解个人在系内以及跨系的合作情况,可以将整个系的节点进行缩放以观察个人跨系合作情况,以 “LuoLin” (以下简称 “LL”) 节点为实例,展示跨系合作次数视图并进行分析。在图 3 中可以发现 “LL”节点属于信息管理科学系,“LL”跨系合作涉及的系有 4 个,分别是电子商务系、出版系、图书馆系、档案与政务信息系。

  论文摘要

  如果需要进一步了解个人究竟与哪些个人进行跨系合作,可以通过可视化交互式技术将所有与 “LL”节点有联系的节点都通过附加标注的方式在图 4 中进行展示,通过由指向性而展开的附加标引,提示与 “LL”节点有联系的相关节点和具体的节点信息及数量。

  论文摘要

  从图 4 可以看出,与 “LL”节点有合作的系内节点共有 7 个,系跨系节点有 4 个,与 “LL”节点有合作关系的节点以文字的形式在画面上纵向排列,可以读出节点数共有 11 个,它们分别是 “LP”、 “ZYF”、 “XLF”、“LG”、“ZXJ”、“ZXG”、“YL”、“TXQ”、“LW”、“LQ”、“MFC”,且在右边的信息分列栏中,高亮的位置 (计算机显示) 同样可以辅助用户读取与 “LL”节点有关联关系的节点位置。由此可见层级式边缘集束模型对同层级间数据的可视化也有着良好的信息传递效果,图 4 中的数据可以概括成为表 2 的 “LL”节点个人与系合作情况表,“LL”节点共与 5 个系中的 11 个节点有过 12 次合作。

论文摘要

  若按照系整体的角度对跨系合作数进行统计,信息管理科学系最多,有 80 次合作,而最少的图书馆系也有 28次,由此可以发现跨系合作非常频繁,有的系跨系合作次数甚至与系内合作次数相当,同时有的节点还成为跨系合作中的桥梁,如 “LL”、“HRH”等均与所有系有过合作。

  这说明在目前的科研合作中跨系交流现象十分明显,实际上科研合作并没有受到组织结构的影响。

  4、 分析

  目前针对科研合作网络的研究大体可分为 3 类。第一类是针对机构内部成员合著情况的研究,如 Perianes-Rodríguez 通过对大学内合著分析来识别研究小组,并对其进行可视分析。欧阳霞探讨了 EAMOLA 成员的科研合著行为,分析了合著网络结构、密度、核心作者分析,以及项目实施前后合著网络结构变化分析。第二类是针对某一领域的作者以及机构合著情况分析,如邱均平和王菲菲通过构建国内竞争情报领域作者的合作关系网络,分析作者的外在合作关系,同时辅以作者关键词耦合分析挖掘该领域内潜在的合作团体。Arif 等学者研究了印度计算机领域研究机构的成员合著网络。李长玲等人对我国图书情报学研究机构的合作网络进行了可视分析。第三类是针对期刊的合著研究,如李亮和朱庆华选择了 《情报学报》的合著作者为对象,对国内情报学领域的合著网络进行了实证研究,评价了学者在合著网络中的地位,发现了合著网络中联系紧密的团体。孟微和庞景安以 《情报理论与实践》合著网络为例,对其中有代表性的子网络进行了具体的分析。余丰民、杨江明以 《图书情报工作》为研究对象,除了对作者合著进行分析外,进一步对机构合著和区域合著现象进行了研究,以评价某种刊物的作者、地区和机构的合著水平和能力。虽然研究对象不同,但以上这些研究的方法基本相同,大都采用科学计量方法和社会网络分析法,通过统计文献数目、合作情况和高频词,挖掘出该领域的重点研究主题以及核心人物。但在合著网络可视化方面存在层次属性被忽略、关系信息展示不充分等问题。因此只能进行单尺度 (个体—个体) 的关联分析,无法实现多尺度(机构—机构、地区—地区、国家—国家) 和跨尺度 (个人—机构、个人—地区、机构—地区、机构—国家) 的关联分析,因此很难回答哪些机构合作最多,哪些地区合作最多,哪个学者跨机构、跨地区合作最多,哪个机构跨地区、跨国家合作最多等问题。而本文提出的合作网络可视化方法通过交互界面提供快速,可缩放、多尺度和跨尺度可视界面,能够很好地弥补之前的不足,协助用户轻松地获取对复杂合作网络的更深层理解。

  5、 结束语

  目前的科研合作网络可视化通常以节点连接图和邻接矩阵为主要方法,仅注重节点的分布和边的排列,忽略了节点的属性信息。为此,本文提出了从节点属性角度对科研合作网络进行可视分析的方法,并以武汉大学信息管理学院项目合作网络为例,对该网络进行了多尺度和跨尺度的可视分析,弥补了传统的社会网络可视化方法在表现层次属性可视化方面上的不足。

  该方法不仅具有易读性的优势,而且具有极好的可扩展性,能够满足多层数据的可视缩放。在本文中节点的属性层次仅考虑了两层,数据集相对简单,在下一步的研究中,将扩大数据集到学校范围以探测学院间的合作模式。另外将融合文献计量学方法对大量关联数据及属性数据进行整序和排列,以提供更多的分析功能。

相关内容推荐
相关标签:
返回:计算机网络论文