图书馆管理论文

您当前的位置:学术堂 > 图书档案学论文 > 图书馆管理论文 >

基于关联数据的数字图书馆动态服务组合模型

来源:学术堂 作者:陈老师
发布于:2016-09-30 共7693字
  本篇论文快速导航:

展开更多

  第四章 基于关联数据的数字图书馆动态服务组合模型
  
  第一节 动态服务组合概述
  
  一、动态服务组合的概念
  
  动态服务组合,即动态的 Web 服务①②(Web Service),是一种基于超文本传输协议的服务,它是一种具有自包含和自描述特点的模块化应用形式,它既可以提供简单的请求又可以进行复杂的业务处理功能。这种动态服务组合是主要以 SOAP为基础的通信协议,它通过 WSDL 进行服务描述,然后从而通过 UDDI 来进行发现和获得需要的元数据来进行服务。Web 服务就是一个通过向外部试图进行访问的个人或组织提供一个可以通过 Web 来进行调试的应用端访问接口来运行的这样形式的应用程序。也就是说,可以编译程序来试图调用 Web 服务程序。可以将调用这个 Web 服务的应用程序叫做客户。其他的应用就能够发现并调用所部署的服务当 Web 服务被部署时。
  
  二、动态服务组合的技术
  
  按照绑定的时间来分,组合起来的 Web 服务技术可以分为静态服务和动态服务两种服务组合。从服务自动化的程度划分,Web 服务的组成方法可以分为自动、手动、半自动这三种。自动 Web 服务组合是一种利用空间状态搜索问题的自动化的方法的组合,当用户要想取得需要的初始状态和动态相结合的服务的限制,只要在使用时向服务组合提供目标状态就可以。手动方法是通过人工的方式查找服务来提供的服务组合。半自动方法则是用户自己选择一个的已存在服务模板,系统根据服务模板的数据字段,判断出用户需求,从而提取出用户的请求,然后系统根据要求从服务数据库找到匹配的服务来描述模板。
  
  三、动态服务组合的应用
  
  目前提出的各种服务组合方法因为考虑的侧重点不同,可以有多种划分方法。
  
  根据他们具体动态服务时的组成方式不同,可以具体分为三个类别的动态服务组合方法,分别是基于人工智能规划的自动服务组合方法,基于工作流的服务组合方法,语义驱动的服务组合方法。
  
  首先,基于人工智能规划方法是由不同的工作流组成的服务来运行的。这种方法是在进行服务前先考虑到服务的可能组成问题来事先设计好工作流程,然后当系统运行时,它就可以根据设计好的流程自动进行规划并解决问题。如果一套服务的重点是请求服务给定初始状态和欲达到目标状态,那么服务就能够根据设定好的流程从而实现从初始状态到目标状态的自动演化路径。
  
  其次是基于工作流的服务组合方法①②③:这种方法主要是通过将用户要求的信息服务转化成一系列的工作流来对待的,其运行过程中运用了 WSFL、BPEL4WS等集中基于工作流的编码语言进行对工作流原有编码的扩展。这是该方法最常用的扩展方式。它是一种通过将工作流的运作分部成活动式的协调引擎或者服务组合来运行的建模方法。在这种方法中,会运用抽象信息服务来代替具体的信息服务以建立标准的工作流的具体模板。当工作的的设计者设计工作流的动态服务时,会先将每个具体的活动的数据转化映射成抽象的服务数据来确保能够实现最终的工作目的,然后把这些抽象的服务数据与已经设定好的特定的服务数据进行匹配和绑定,最终实现工作流的运作。这种方法的关键在于如何将要准备进行配对的服务数据抽象化和具体化,已达到能够为具体的服务数据匹配到合适的获取服务数据,以达到为最终目标匹配最好的服务数据的目的。这种工作流的服务方法一般是采用半自动化来操作运行的,通过人工来认为的确定哪些服务数据可以陪陪出最好的工作流,从而进行具体的优质服务。因为这样可以确保最后绑定的 Web服务数据是当前能够提供的最好的服务数据,而且是可以使用的服务数据,这样就可以避免不必要的损失,提高工作效率。
  
  最后一种方法是语义驱动的服务组合方法:这种方法的特点主要强调的是Web服务的自描述特点。这种方法的基本运行思路是利用 Web 服务来描述出具体服务请求的相关数据,然后通过对数据的解析来添加服务可以使用到的语义数据,然后利用相关的计算机系统运行相关的推理计算程序,最后匹配出可以自动生成的组合方案①②③。这种方法是使用 OWL-S(Ontology Web Language for Services,Web服务的本体语言)这种方式来描述④⑤匹配服务数据的能力、数据服务工作的具体过程和数据服务访问的具体细节的。这中予以驱动模式下的服务组合方法,是由服务数据的配置文件、服务的构建模型和服务的组合流程图三部分组成⑥。服务的构架模型是为了首先定义出 Web 数据服务组合的内部具体流程;服务数据的配置文件包括了(I,O,P,E)端口以及服务的 QoS 语义,这一步既要满足计算机程序推理的需求,也可以最终根据服务数据与服务数据之间的详细的语义数据描述,创造出数据服务组合的流程图;数据服务组合流程图是一个经过考虑各种情况之后仔细修葺过的状态图。
  
  从上述描述中,我们可以看出,这三种方法都具有各自的特点,但是,基于工作流的服务组合方法在运行过程中,需要人员的参与以实现部分问题的人工解决,这就导致了这种方法不是完全的自动化,而利用人工也会导致服务组合的过程中效率低下;而基于人工智能理论的自动服务组合方法,虽然自动化程度高,运行速度快,但是由于方法较为复杂,所以用户使用起来不是很方便,较难完成对需要进行形式化转化的服务的操作;最后,基于本体的自动服务组合方法则是在综合了上面两种方法后⑦,形成的一种有效的服务方法,它可以快速有效的解决各种软件集成过程中的语义数据异构化的问题。因为它的运行过程是通过对服务数据进行基于本体的语义数据的具体描述,然后根据服务数据的语义数据的关联关系来最终进行动态服务组合的。如果想要进行基于本体的动态服务组合,首先需要建立的是服务领域数据的本体信息资源库,然后利用领域数据的本体信息资源库中的信息数据对服务进行详细的数据描述。但是目前的技术和人力仍然没有达到可以描述所有系统服务平台的能力,所以要进行基于本体的动态数据服务组合就缺乏适合于所有系统服务平台的服务数据描述的本体数据资源库。而且目前对于各种服务的描述数据也大都属于功能性描述数据,虽然有却又不够详细,根本无法进行综合的既考虑到系统的功能性数据需求,也能考虑到功能性之外的数据需求来进行综合化的动态服务的组合。所以在基于本体的自动服务的描述数据中加入描述本服务功能之外的其他服务信息数据,将是未来服务组合的发展的一个重要的方向。
  
  第二节 基于关联数据的图书馆动态服务组合模型的设计
  
  一、模型的核心理念
  
  人们对于信息的认知是指人们最终为了获取期望知识或解决问题,来对信息进行判断和理解。在网络信息环境飞速发展的当下,人们对于信息数据的需求层次日益提高,人们对于最终获取的信息数据的组织形式的要求也由原来的“广、快、精、准”标准向“深、动、精、细”层次转变。
  
  从前文我们可以知道,现在关联数据在数字图书馆中已经有了云服务、知识服务和信息服务等方面的应用。同时也知道动态 Web 服务组合可以将基于语义的信息数据与基于语用的信息数据相结合,在既能保持原有的意义的信息数据的基础上,依据用户的实际对于信息数据的需求情况来动态的及时的增、删、改用户需求的信息数据,及时更新、维护数据形态设置,稳中求动,使最终呈现给用户的网络信息数据的组织形式更加符合用户的需求①②。
  
  那我们就可以将关联数据已经在数字图书馆中的应用与动态 Web 服务组合技术相结合,组合产生出数字图书馆服务新模型,即基于关联数据的数字图书馆动态服务组合模型。首先这个模型是以关联数据在数字图书馆中的应用为基础的,即是以云服务、知识服务和信息服务为基础的。其次利用动态服务组合技术将关联数据在数字图书馆现可提供的服务进行动态组合来进行服务。
  
  二、模型预实现的功能
  
  在数字图书馆以用户为中心建立相关的数字图书馆服务平台的基本原则的基础上,综合考虑经济,效率,易用性,可扩展性,以及其他因素,通过动态服务组合技术的使用,关联数据的资源整合集成库收藏的各类数字化信息资源和数据资源,并最终在图书馆服务平台,实施关联数据的图书馆联盟。在动态服务组合模式下,数字图书馆管理和服务主要是提供给用户可以通过互联网,图书馆并不需要投入大量的人力,物力和财力,购买图书馆的基础设施和数字资源,但不需要图书馆系统维护,升级和管理人员,专业技术人员只需要图书馆使用数字图书馆的终端连接到外部网络,日常的图书馆资源管理、编目、检索、借阅,并通过网络提供所需的库的用户服务。
  
  当用户运用数字图书馆进行信息检索以及其他活动时,数字图书馆利用动态Web 服务技术,为用户提供相应的动态服务,基于用户语义的动态关联,为用户推送相关的信息数据服务,从而让用户获取更加丰富全面的信息数据服务,进而提升图书馆的使用价值。
  
  第三节 基于关联数据的数字图书馆动态服务组合模型架构
  

  在基于关联数据的动态 Web 服务组合技术的良好环境下,数字图书馆的建设主要包括数字化信息资源、动态 Web 技术、用户语义分析、操作界面以及应用信息系统等,根据目前动态服务组合技术的特征、关联数据技术的应用现状以及构建数字图书馆的实际需求状况,可以把基于关联数据的图书馆动态服务组合平台划分为四个部分:即数据层,管理层,业务层以及用户界面,其构建模型如图 4-1所示。
  
  一、数据层
  
  用基于关联数据的云服务来提供数据的数据层是整个服务的基础。
  
  首先,数据层是数字图书馆关联数据处理平台,是图书馆动态服务组合服务与图书馆关联数据之间的转换机制,负责将数据资源以关联数据的形式经过动态Web 服务技术处理后,在图书馆关联数据管理平台之间转换、流通、移动、集成以及存储,基于关联数据的数字图书馆动态服务平台各个层次中的任何数据资源,可以通过图书馆关联数据管理平台进行描述、搜索、调度,最后以关联数据的形式发布,当然,这个过程是可逆的。在关联数据管理平台中获取的任何数据资源,可以通过转换为关联数据格式的资源,存储在数字图书馆动态服务平台的集成服务器上,随时可以调用、分配、利用、浏览和发布①②。
  
  而这个模型中的数据层需要的关联数据资源则是来自于基于关联数据的数字图书馆云服务平台,它可以为数字层提供海量已经经过数据关联化处理的数据,云平台的优势是可以存储的数据要远比其他数据库要多,那这个模型的数字层便变得比比其他模型数据层更加强大,它的优势不只是可以提供关联化的数据,它能够提供的数据也要更丰富更全面,为最终的信息服务结果提供强大的数据基础。
  
  二、管理层
  
  管理层,是利用基于关联数据的知识服务来提供的,它是基于关联数据的图书馆动态 Web 服务组合平台的核心组成部分,是图书馆动态服务平台的基础设旋层,基于关联数据的数据层和应用平台层中间,负责管理整体协调,资源分配合理的基础上的各种方面的需求。首先,管理层的基本职责是负责提供远程进程管理,进行数据的存储访问,资源的分配和部署,进行用户的登录和身份验证,保证整个服务过程安全性,进行服务质量的管理。当知识组织应用程序进行运行时,所需要的资源包括包装相关的服务和分布式计算资源的管理,监控和维护。该层提供核心服务,包括数字图书馆信息数据的分布式计算集群,并对这些数据的运行进行并行编程和对开发环境提供的额外服务。基于关联数据的知识服务对运行过程中的海量的分布式结构化数据进行存储管理。并建立大量的分布式文件系统,动态服务组合运行工作程序计算系统,并且能够通过对动态 Web 服务组合服务平台的数据进行部署,已达到传输的数据能够在最终的数字图书馆使用中得到控制、分配和获取。
  
  在管理层应用基于关联数据的知识服务后,除了起到对整个服务流程的管理,可以对整个系统流通过程中的数据进行知识管理,不光可以使系统运行更加流畅,还可以是数据组织更加有序,为最终的信息服务结果更加组织条理。
  
  三、业务层
  
  业务层是整个数字图书馆动态服务平台服务开展的基础,也是图书馆动态服务平台的核心部分,它是以基于关联数据的信息服务为基础的,信息服务有包括信息检索服务和信息扩展发现服务。它通过集成各种数字图书馆的应用程序数据、业务管理系统数据以及各种 Web 服务器数据集,在集成整合之后,通过基于关联数据的信息服务的方式在数字图书馆动态 Web 服务平台上为数字图书馆用户提供所需的功能和服务。业务层的具体操作系统包括:图书馆的用户管理系统、虚拟参考咨询系统、电子资源管理系统、知识管理系统和信息检索系统等。该层可以提供用户登陆数字图书馆动态 Web 服务平台的网站入口,经过授权的用户可以根据访问密匙登陆网站连入到动态 Web 服务平台中来。这里的用户授权可以是动态Web 服务平台用户按照自己的需要来租用部分或全部服务的授权的,通过授权的用户即可以登入统一的界面和操作平台,获得所需的服务,包括所有基于关联数据图书馆的信息服务能提供的所有服务,如馆际互借、代检代查、联机参考咨询、知识服务、云 ILS 等①②③。
  
  四、用户界面
  
  用户界面,也就是整个基于关联数据的数字图书馆动态服务组合平台的最顶层,也是用户使用该服务能接触到的最直观的部分。用户界面在为用户提供数字图书馆的一系列已有功能的基础上,同时根据用户的使用情况,反向推送用户信息到业务层、管理层、数据层,然后根据一层层的反馈机制,利用动态服务组合技术,从已关联数据的数字图书馆中,获取用户正在进行的活动的相关联数据,然后通过正向通过流程向用户推送信息,从而达到动态服务的效果。
  
  第四节 基于关联数据的数字图书馆动态服务组合的实现
  
  一、运行机制
  
  基于关联数据的数字图书馆动态 Web 服务组合平台的有效服务机制主要包括3 种:(1)数据信息资源的采集机制,基于关联数据的图书馆动态服务组合平台,可以使信息资源整合成一个统一的、集中的服务平台,通过收集相关的图书馆动态服务组合平台的基础上,产生出一个数字资源的有效采集机制,用户可以通过动态服务平台统一的自动搜索提交用户在界面查询系统的才需求提交到动态服务平台,各种分布式数据库资源,需要存储大量信息资源不重复,以保持同步的信息资源。(2)数据信息资源的组织与管理机制,这个机制是基于关联数据的数字图书馆动态 Web 服务组合平台的主要部分,该机制涉及的主要应用技术包含数据库虚拟技术,其他个别资源的虚拟化,运行在服务器系统中的其他节点上组件的协同与保存。基于关联数据的图书馆动态服务组合平台,通过管理和部署数据库中的数据信息,为用户提供大量的有实用价值的原始数据,然后对数据进行结构化或者是半结构化,然后随数据进行存储、处理、共享、管理、挖掘、搜索和分析等处理方式,最终提供智能化数据服务。这种数字资源的组织和管理机制,一方面可以通过自动负载工作管理分配的工作量;另一方面,可以随时增加计算能力。(3)用户的服务机制。基于关联数据的图书馆动态服务组合平台,包含网络操作系统和动态服务技术服务,动态 Web 服务组合技术利用虚拟化技术提供必要的 Web 服务程序以维持一个特定的操作系统和应用程序集合的运行。当用户通过动态 Web 服务组合平台中的统一搜索界面提交查询时,服务器将立即模拟 HTTP协议,提交享用的条件给动态服务组合平台,向数字图书馆的关联数据库集群请求服务信息数据的列表,然后将服务器返回分类数字信息资源的 HTML 文档下载页,将挖掘、提取和检索到的信息数据资源完整地整合到用户的信息需求中去。
  
  目前的基于关联数据的动态服务组合平台的运行机制都是相互依存、共同进行运作的。数字资源采集机制是整个服务运行的基础,它负责采集查找用户需求信息的数据,通过管理层对数据库集群进行数字信息数据资源的搜索,然后将获取的数据与用户需求相匹配。数字资源的组织与管理机制和动态 Web 技术的结合应用书数字图书馆动态服务组合平台运行机制的主要部分,将通过采集机制获得的信息数据资源进行任务调度和分配管理,并负责信息数据资源的安全管理,用户管理等。用户的服务机制,是用户调度资源分配的资源组织与管理机制,通过Web 界面最终呈现给用户的完整性的信息数据资源,经过数字资源的收集机制,组织和管理机制,用户服务机制,最终共同构建成一个统一的整体服务机制。它们共同存在并发挥作用,共同贡献自己的力量,以维持正常运转和稳定的动态服务组合平台的基础上相关联的资源库。
  
  二、服务流程
  
  基于关联数据的图书馆动态 Web 服务组合平台用户在数字图书馆动态服务组合平台上获取所需要的数字化数据资源,其主要流程可概括为数据资源描述、数据资源动态分析、数据资源匹配、数据资源管理及关联数据发布等五个步骤。
  
  1、数据资源描述
  
  数据资源描述,是图书馆关联数据处理平台的基础,也是重要的第一步。首先,图书馆用户向基于关联数据的动态服务组合平台请求所需的资源,该平台接受用户发来的请求,返回 Web 页面形式为用户提供服务,图书馆动态服务组合平台可以实现“随时访问、动态分配”的用户访问,同时,能够与数字图书馆用户共享平台中的网络流量与计算能力,它是基于用户的请求动态驱动的,所获取的数据资源以一定的格式(RDF 格式)进行资源描述,进行后期发布或直接把数据资源存入数字图书馆云服务平台①。
  
  2、数字资源动态分析
  
  当用户使用数字图书馆进行活动时,用户的请求被接收后,基于关联数据的数字图书馆动态服务组合平台在对用户的请求进行动态分析的同时,关联数据库也会根据通过动态服务组合技术对用户请求的分析对数据库的资源进行动态分析,对数据源进行编辑。
  
  3、数据资源匹配
  
  数据资源转换,是在数据资源进过描述之后,将编辑过的数据源转换为用户所需求的数据资源格式。在基于关联数据的图书馆动态服务组合平台对数据资源进行描述后,通过数据资源发现与关联数据发布两种方案,从数字图书馆各个节点的数据平台中所提供的信息资源中匹配请求的数据资源。数字图书馆动态服务组合平台针对数据的多功能负载进行优化,并保证数据的安全性和完整性。
  
  4、数据资源调度
  
  数据资源的管理与调度工作,也是一项长期且必不可少的内容。数字图书馆动态服务组合平台中的全部信息数据资源都是经过规范化、RDF 格式化处理过的,平台也将匹配到的信息资源的名称进行数据资源预置。这种类似记录器功能的信息资源预置可以对数据资源的存取与并发控制进行保证,通过记录当前所有用户的请求的数据资源,确保用户所需要的数据资源全部可以随时获取和利用,通过动态服务组合平台可以实现用户所获取的数据资源随时下行到用户,随时调度,能够有效地保证平台的稳定性和可靠性①。
  
  5、关联数据发布
  
  关联数据发布,将平台转换后的数据资源以关联数据的形式(RDF 三元组)发布到语义网中,供其他用户浏览及使用。数字图书馆将按照关联数据的基本规则在知识库创建自己本身的关联数据,并实现与外部信息资源库的链接,以期保证所有任务的顺利完成。在经过一系列的程序数据处理之后,数字图书馆将按照一定的规律将处理后的关联数据发布在动态服务组合的平台上。然后数字图书馆的动态服务平台对数字图书馆提供的关联数据加以评估和判断,为所要执行的任务从当前信息资源库和历史数据库中调用信息。
  
  在整个动态服务的过程中,基于关联数据的数字图书馆动态服务组合平台中的图书馆关联数据处理平台,起着非常关键的重要作用。负责数据资源获取、数据资源发现与匹配、数据资源的调度与管理,以及关联数据的发布,这些一系列的过程构成了基于关联数据的图书馆动态服务的主要过程。
返回本篇论文导航
相关内容推荐
相关标签:
返回:图书馆管理论文