4 铁路工程施工成本控制的知识推理
知识推理是问题求解的主要手段,其前提条件就是完成知识的获取与表示。
4.1 基于 Jena 的铁路工程施工成本控制的规则推理
4.1.1 Jena 的框架结构及本体子系统
1、Jena 的框架结构
Jena 是一个源自于惠普语义网项目研发的开放资源,是一个基于 Java 的语义网开发工具,为应用程序的开发人员提供了一系列对本体进行操作的 Java 接口,提供了针对基于 RDF 或 OWL 的应用程序的开发环境,可以用来创建一个 Java 的框架结构以便于语义网相关的应用系统的开发。Jena 的各个组成部分(各个子系统)在对语义网项目的相关开发中扮演各自不同的角色,起着不可替换的作用[52]. 其中我们结合本文内容简单介绍 Jena 的本体子系统部分。
2、Jena 的本体子系统
在铁路工程施工成本控制本体构建完成之后,就形成了铁路工程施工成本控制领域知识的概念集合,该本体为知识的共享及应用提供了基础,可供铁路工程领域内的管理人员利用。
本体子系统(Ontology Subsystem)是 Jena 面对处理本体数据而开发的,是 Jena框架中重要的一员,它提供的 API 不仅是针对处理各种 OWL 本体数据,更是可以用来处理 RDF 数据,比如创建模型、导入子模型、设置属性值或将本体的表示输出等[55].
4.1.2 Jena 创建铁路工程施工成本控制实例
前面第三章中完成铁路工程施工成本控制本体的构建,但只是定义了一个铁路工程施工成本控制本体各种概念的框架,而相应的实例却并未建立,这些实例的构建需要获取到施工成本控制事件的各种数据,比如:线路长度、路基坡度、偏差等级等,并将这些数据作为属性值存到本体中,我们在程序中使用 Jena 的本体 API 操作本体、构建实例、存入属性值构建一个偏差事件类的实例,为后面的诊断及措施推理做准备。
构建一个偏差事件类(Overruns-event)的实例主要是三个步骤:首先事件数据的获取,实例数据的收集;然后根据类创建一个空实例,最后进行属性值的确定。
构建施工成本控制本体实例需要的各种数据,通过实时监测,数据由施工人员进行输入,实验中我们使用 stuts 框架编程并调用 Jena API 完成数据的收集和处理,最后进行页面数据收集并创建的本体实例。
根据第三章铁路工程施工成本控制本体类的分类及属性定义,我们以事件背景类为例,进行简单实例构建。事件背景类中的属性有铁路名称、参建单位、铁路等级、线路长度、工程量、施工工序等信息,其中对象属性参建单位的属性值有施工单位、设计单位、供应商、政府相关部门等,我们将实例信息全部输入;对于数据属性铁路等级、线路长度及工程量等,则将现场数据进行收集整理,完成实例建立。
将初始属性值为空,我们需要完成最后的规则推理获取到相应的值,这个值也正是我们系统的需求结果,并作为最后的控制措施建议输出页面反馈给系统使用者。
4.1.3 Jena 推理机制
Jena 作为面向语义 web 的应用开发包,包含的内容比较全面,它为 RDF、RDFS、OWL 提供了程序开发环境。我们将利用 Jena 简单有效性,对铁路工程施工成本控制本体的 OWL 描述语言进行相应的规则推理。
本文采用 Jena2.6 对本体进行解析,Jena 自带的存储接口即可直接进行 RDF文件的处理,可进行 OWL 和 RDF 等多种语言的解析,我们将铁路工程施工成本控制知识本体导入,进行相应的解析。该解析过程的主要作用有:通过本体接口和推理机可以在已建立的铁路工程施工成本控制本体中获取所需信息;同时 Jena可通过自身的查询引擎进行本体的查询。Jena 的主要组成部分主要有:OWL/RDF应用程序接口、基于 Jena 的文档解析器和本体的语义推理系统。
Jena 系统中有专门用于推理的子系统,可进行相应的规则推理,能调取 RDF、OWL 等语言,完成相应的规则推理过程,我们可利用其本身的规则完成简单的铁路工程施工成本控制知识的推理,如相应的类与子类间的传递关系等。
这里用 Jena 辅助实现基于本体的铁路工程施工成本控制知识的语义检索。如图 4.1 所示,构建的铁路工程施工成本控制本体输出为 owl 文件的形式,然后通过文档解析器将 owl 模型持久性的存储在相应的数据库中;再通过 owl 接口创建包含推理机制的模型对象 owlMedel,结合本体子系统和推理机子系统生成具有语义推理能力的 ontMdoel,经过查询解析器在本体库中根据语义找到要查询的内容,再去实例库搜索相关信息,从而实现语义检索的目标[24].
4.1.4 基于 Jena 的铁路工程施工成本控制的规则推理
运用 Jena 进行规则推理,在进行简单的规则推理之外,我们必须根据领域本体的自身特征完成其规则集的建立,之后再进行相应的规则推理。Jena 本身自带有一系列的推理规则[56],这些规则主要针对本体自身特点,用于检查不同类之间的关系、概念的可满足性以及属性的传递、互逆、不相交的关系等,例如下面的规则:
但是由于各领域知识本身所具有的特点及其关系,简单的通用规则是不能满足领域知识要求的,在铁路工程施工成本控制系统中,为了完成诊断任务,确定偏差等级、造成偏差的概率等,需要大量的、复杂的、表达专业领域知识的推理规则并以此创建出特定的推理机以满足诊疗推理的任务需求。值得注意的是,推理规则的构建一定是在相应的领域本体模型的约束下完成的,有了相应的本体后才能完成规则的构建。我们对铁路工程施工成本控制领域知识的进行推理规则的制定,表 4.1 展示部分铁路工程施工成本控制推理规则。
在铁路工程施工成本控制系统中就前期的诊断进行规则定义:
诊断规则,主要用来判断偏差等级,危险级别,考虑是否停工、采取何种措施等。诊断规则建立的依据是:第 3.2.1 节关于偏差等级的确定依据。其规则编辑代码部分展示如下:
规则说明:
事件 e,其实时监测的偏差显示,偏差范围达到或超过 ,则:可以判断该偏差事件为 I 级偏差。
通过 Jena 中,基于铁路工程施工成本控制本体的规则的定义,完成该本体的推理机制,可完成对于偏差等级的确定等简单的规则推理,为之后进行措施案例推理提供基础。
4.2 基于本体的铁路工程施工成本控制措施案例推理研究
4.2.1 铁路工程施工成本控制措施
文章 3.2.1 中指出了铁路工程施工成本控制措施的相关理论。我们将铁路工程施工成本的控制措施分为组织措施、经济措施、技术措施及合同措施,在此我们不再赘述各措施的含义,通过对各资料的研究及专家学者的意见,我们将部分施工成本控制措施进行列举,详见表 4.2.在实际现场施工中,有许多铁路工程施工成本控制控制措施,同时根据实际的需要及新技术、新方案等的出现,施工成本控制人员可不断的相处新的更为有效的控制措施,来提高施工成本的控制水平。
同时多个措施建议的结合处理可提高控制效率,使得施工成本控制取得最优效果。在铁路工程施工成本控制本体的构建过程中,我们已经将控制措施进行了类的定义。
4.2.2 基于本体的案例推理
案例推理技术(CBR)目前已经成为人工智能领域里应用最为成功、最为广泛的一个子领域,该方法能运用历史案例的经验来解决新的案例问题,为经验的二次利用和共享提供了可行性。目前案例推理技术也广泛应用于工程项目建设中,起到很好的作用。但是目前的案例推理技术,一定程度上受到一些限制,比如知识获取困难、可扩展性、可重构性较差,而且案例推理对人工智能领域里最重要的学习能力支持较弱,而与此同时本体对知识的表达和规则推理则有着很好的支持并且本体具有可重用、可进化和可共享等优势,可以从语义的层次上来描述应用系统的概念模型,这对知识密集型系统的开发非常有利[57].因此,本体能在一定程度上弥补案例推理的不足,并且可以使用规则推理来实现 CBR 系统中的某些操作,更重要的地方在于使用本体的规则推理可以作为案例推理知识的来源,将案例库和本体库相结合,会使案例推理更加高效和准确。
本体在案例检索适配的过程起着同样重要的作用。过去的 CBR 系统必须包含一定的匹配规则来实现案例适配,但是 CBR 并且没有统一规范的适配规则,而基于本体的适配方法从语义关系层次进行适配就能显现出明显的优势[58].如图 4.2描述了基于本体的案例推理技术的流程图。第三章已经完成知识获取及知识存取的过程,接下来,将重点介绍铁路工程施工成本控制案例推理的过程。
4.2.3 铁路工程施工成本控制的案例推理
1、案例检索
第三章中我们已完成铁路工程施工成本控制案例的知识表示过程,这是案例检索的基础。在案例知识表示的基础上,我们进行案例推理工作。案例检索是基于检索条件即问题描述部分,从案例库中检索出尽可能一致或相似的源案例的过程[59].案例检索主要是进行相似度匹配,完成目标案例与源案例的相似度计算,得出目标案例与各源案例的相似度,找到相似度最高的源案例,调取该案例的控制措施,结合现场实际,做出最合理的控制措施,从而实现铁路工程施工成本控制过程[60].
(1)相似度算法
案例之间的相似度计算方法有很多,如最近邻算法、、模糊方法、粗糙集算法等,不同的算法在不同的领域有所侧重,其中最直接也最通用的就是最近邻算法[58].本文结合铁路工程施工成本控制领域知识及相应的特点,采用最近邻算法来衡量案例间的相似度,通过计算,达到案例见的距离,依此来确定输出结果的精确度和可靠性。假设某铁路工程施工成本控制案例根据知识表示后具有m 个属性,可表示为
由上述公式可以得出,要进行案例相似度的确定必须要进行属性权重jw 和相似度 ( ,)iSIM P Q 的确定,下面将介绍两者各自的求解方法。
(2)措施案例属性权重的确定
铁路工程施工成本控制本体的各个特征属性是不等价的,各个属性特征在对施工成本控制的影响中存在一定的差异性,因此其各自的重要程度是不同的,我们要通过属性权重来进行衡量。由于铁路工程施工成本控制知识的模糊性,我们将采用层次分析法来确定铁路工程施工成本纠偏措施案例的属性权重。
将各属性之间两两相互比较,就各属性在铁路工程施工成本控制事件中的影响程度的不同,进行各因素的权重的确定,得到案例间的属性权重矩阵 R.
(3)措施案例属性相似度的计算
铁路工程施工成本控制案例库中包含了各种各样的偏差情况,每种偏差发生时的特征属性又存在差异,各属性特征的表现方式也有所不同。根据各特征属性的特点,将属性划分为数据属性、符号属性及模糊型属性 3 种类型,针对三种类型,分别采用以下相似度计算算法。
(1)数据属性
采用加权的海明距离反函数的方法进行具体数据属性间的相似度计算,如式(4-4):
式中:
A代表相应隶属函数与横坐标所围的面积;iiq ?c为模糊集iq和ic的交集;iiq ?c为模糊集iq和ic的并集。
【算例 4.1】面给出铁路工程施工成本控制案例相似度计算的算例。
表4.3铁路工程施工成本控制目标案例 6和 5个历史源案例的部分属性及各自的属性值,下面计算目标案例 6 与各自的相似度。在此我们假设各属性间权重是相等的,只进行相似度的计算。
(1)确定数属性计算
“控制措施量大小”是上述数字型属性,可采用式(4-4)计算相似度。则关于 “控制措施量大小”这一属性,案例的相似度为:
通过对上述案例的计算分析可得,铁路工程施工成本控制目标案例 6 与 5 个源案例的相似度不同,其中与案例 1 的相似度最大,为 0.734,说明案例 1 与偏差事件 6 最为相似。这时我们调取案例 1 的施工成本控制措施方案,结合偏差事件 6的具体现场情况,采取相应的控制措施,以减少施工成本,提高项目效益。
2、案例的重用
案例重用是用搜索到的最相似案例的经验来解决当前问题的方法。实现经验的共享,更好地实现决策及辅助效果。
由于铁路工程施工成本控制知识的单一性,很大程度上,我们很难找到完全一致的相似案例,又根据其经验性,我们可进行案例的修改,已完成案例的重用。
案例推理的应用就是要实现知识的重用与共享。
3、案例的修正
案例修正是指当通过案例重用过程得到的案例解决措施不符合实际情况时,需要进行措施修正的过程。通过案例修正的过程,可保证目标案例与源案例的更大相似性,满足其匹配要求,可获得更为合理的措施建议。
铁路工程施工成本控制案例库在建立过程中,我们就应针对性的进行案例的整理,将其有效知识规范化、公式化的表示,为以后进行案例匹配和案例重用做好基础。我们可邀请有关专家和经验丰富的施工成本控制管理人员进行案例库的修正和改进,利用他们的知识和经验来进行资料的整理和搜集,使案例更具规范化,提高案例匹配效率,得到更规范合理的建议。
4、案例的保存
案例保存是指将铁路工程施工成本控制案例进行整理,以新的案例的形式存储到案例库中。对于要搜集整理加以保存的案例不只是成功的案例,失败的案例也可以加以整理,作为借鉴进行整理归档。
案例保存的过程中,由于存在大量的案例且有些案例会具有相似性,或是不成熟案例,这些被我们称为冗余案例,冗余案例的存在将影响案例检测的有效性所以在案例保存过程中,我们要进行案例的维护。
案例的维护主要是对案例进行删减和修正的过程,通过删减无效冗杂的案例,保留并修正新增案例的过程,来提高铁路工程施工成本控制案例检索的效率。
4.3 本章小结
本章通过 Jena 实现规则推理,运用 Jena 对第三章建立的铁路工程施工本体库进行操作,基于本体库,建立铁路工程施工本体实例,并结合铁路工程施工成本控制领域的知识进行简单的规则推理。同时运用案例推理技术,进行铁路工程施工成本控制措施的推理,通过相似度匹配完成案例的检索,得到最相似案例,调取其措施,为新入手的成本控制管理者提供合理的建议,实现科学经验的有效共享。