第 4 章 林地小班数据质量检查方法实例验证
4.1 系统研发背景和目标
4.1.1 系统研发背景
省级林业部门林地年度更新调查工作的目的是为了形成林地保护利用规划“一张图”,通过定期进行林地情况的调查分析,获取林地覆盖情况和资源利用等信息,为资源管理、林地监管等提供数据支持,是国家和地方政府制定林地宏观决策和管理的技术致支持。通过进行林地定期调查试点工作,探索新的技术路线,解决林地变更调查工作中的核心技术难点,形成科学实用的林地变更调查技术方案,建立省与地方上下联动、职责明确、高效运转的林地变更调查工作机制,最终构建省级林业监管部门林地变更调查工作的组织关系和技术路线。此项目的设计首先保证完成全国林地年度变更调查的国家任务,然后重点突出县级用户的使用特点,建立符合县级林业部门需求的森林资源数据库,完善森林信息采集、更新的技术手段,把矢量数据编辑、检查、修改等操作模块强化处理,同时满足县级用户检校数据质量、输出成果数据和报表制作等要求,适合县级用户的操作流程及要求,突出整个系统的合理化、操作简易化、人性化的特色。
本文研究区域选取了娄烦县林地资源调查数据为研究目标,选取面积近 12 万公顷、3 万块小班数量级的林地小班数据为实验数据,按照预先设计的地林地数据质量检查流程方法,将业务需求进行功能模块划分,然后通过合理的软件设计实现各功能模块,最终通过实践应用以验证数据质量检查规则库建库实用性和规则化数据质量检查方法的可行性。
4.1.2 系统实验目标
该系统的研制主要满足县级林业用户完成数据源合并、数据质检和成果数据入库等工作要求。本系统设计了一种多源数据集成的数据库方案,实现对多源数据的无缝集成、高效访问机制,重点进行空间数据编辑设计及实现,同时完成对林地小班数据的数据质检操作,满足成果输出和统计报表的导出等功能。最终形成功能强大、操作方便、数据编辑简洁、高效数据质量检查机制、制图出图统一灵活的县级林地资源信息管理系统。
本文设计县级森林资源信息管理系统的目标主要有一下几个方面:
(1)本系统以美国 ESRI 公司提供的 GIS 开发平台为开发组件、以个人地理数据库(。mdb)为数据库服务开发出一套面向县级林业用户的林业资源数据管理系统。该系统以林地小班为主要用户对象,提供丰富的系统功能满足灵活高效、自动化地分析和处理县级林业单位的业务数据及其日常业务生产任务,可以实现生产部门生产完成的林业二类调查数据(林地小班数据)到 ArcGIS 平台下数据格式的转换,建立便捷的小班数据质检环境,完成批次数据的合并、数据编辑和数据质量检查,最终生成标准的林业二类调查成果并以标准格式上报,基本实现对林地更新业务的自动化、向导式的分析处理和标准结果数据成果输出,满足林业部门日常业务需求。
(2)将本文所设计的林地小班数据质量检查方法应用于本系统的数据质检模块中,通过实际应用验证方法的可行性。
(3)将 GIS 应用到特定的专业领域内,实现 GIS 与林业的结合,利用 GIS 在数据维护、结果统计等方面的技术优势,解决特定领域内的问题。通过 GIS 手段为林业领域提供技术支持和问题解决方案,本文将 GIS 数据质量检查方法应用于林业领域解决其林地数据质量检查的问题,为 GIS 与林业领域的结合提供一种新尝试。
(4)通过设计数据质检规则库解决了以往数据质检软件中质检规则与程序代码高度耦合的问题,将质检规则脱离于程序代码,实现用户定制化的数据质检操作,提高了质检软件的灵活性,扩大其适用性。为质检软件的设计提供了一种新的思路。
4.2 系统整体架构
4.2.1 项目研发路线
本实验系统的建设过程符合了软件工程规范,采用生命周期法进行整个系统的开发过程控制和建设[38]
.在研发过程中,根据实际工作需要,系统的部分功能采用快速原型法,对系统功能首先进行功能模块划分设计,满足县级用户的业务需求的基础上完成功能原型的设计。其他的功能采用自顶向下的结构化分析与设计方法,分层次逐步实现,本项目的研发技术路线[39]-[42]
如图 4-1 所示:
4.2.2 系统结构
以面向对象技术设计了该实验系统,将业务需求中的项目基本操作、业务数据编辑、数据质量检查、规则库维护、结果数据输出和系统设置等多个功能模块进行组织,采用“高内聚、低耦合”的形式完成系统的设计与实现,系统功能结构图[43]-[46]
如图 4-2:
4.3 系统的设计与实现
本系统基于 Windows 操作系统实现,利用 ArcGIS 提供的 GIS 开发平台,采用“松耦合”的形式将各模块组织形成形成森林资源数据管理系统,最终系统设计实现如下图所示:
4.3.1 系统实现环境
操作系统平台:Windows7 旗舰版 64 位操作系统;开发环境: Microsoft Visual Studio 2010、ESRIArcEngine10.0;开发语言:C#;数据库:Access.
4.3.2 林地小班数据质量检查
以某林地资源统计管理系统为例,基于林地矢量小班数据的检查规则完成了系统用小班数据质量检查规则数据库,同时根据数据显示要求构建了小班数据可视化表达符号库,实现了自动化林地小班数据的质量检查控制,并通过数据质量检查规则数据库实现了矢量小班数据的高效自动化的质量检查和错误小班统计和批量化错误修正。通过规则验证后过滤显示错误小班数据,同时有错误数据信息统计表,通过统计表实现错误数据的查询定位操作,可以批量化修正错误数据和单个错误数据查询定位操作,系统的设计实现有效减少了最终成果数据的质检返工率,可以提高业务工作中数据质检效率,系统实现如图 4-3.经过某县级单位一段时间的试用,通过比较发现通过构建小班质检规则库和可视化表达符号库使得林地矢量小班数据质量检查效率更高,改变了传统作业中自动化程度低、以人工检查为主的质检现状,人工交互工作简单易行,保证了半自动化人机交互式数据质检工作的顺利进行,同时也保证了林地成果数据特别是林地小班属性数据的质量,并实现多批次数据成果的一体化质量控制作业,证明了此方法在林地数据质量检查工作中具有重要的借鉴意义。
4.3.3 林地资源成果数据统计输出
林地资源成果数据需要经过森林资源信息管理系统的数据合并生产并最终经验证通过成果数据质检要求,此时的资源成果数据才达到进行资源信息统计输出的要求,此时按林业领域对数据的要求,需要完成多种林地面积统计报表和的制作固定配图样式的林统专题地图。为满足林地资源成果数据的制作与输出,系统中根据成果数据生产和提交要求定义完成了成果数据预定义库。林地资源成果数据统计输出预定义库中主要包括两部分成果数据统计和制作的预定义命令,主要有:
(1)林地面积统计报表
通过在预定义库中预先定义好资源数据统计项和报表输出格式,在系统中通过编写一定量的软件代码读取预定义库中的统计项和输出格式然后完成林地资源数据的统计和固定文件格式的林地面积统计报表的输出。
(2)林统专题地图
本文系统是基于 ArcGIS 平台进行的针对林业领域的二次开发,本文中的数据格式和专题图制作都遵循 ESRI 的数据和显示要求,故可以通过提前配图确定成果林统专题地图的地图样式,然后将图层样式文件进行保存,在系统中通过调用固定的样式文件来进行最终成果专题地图的制作,保证了最终成果数据的一致性。
4.4 功能模块设计
4.4.1 图形显示及操作模块
图形显示模块主要实现了林地矢量数据的符号化显示和设置操作,可以在地图上添加显示多个数据图层,提供了图层显示效果设置功能,通过图层符号化显示设置实现行政底图数据和林地小班数据图层的叠加显示。本模块实现了多种数据类型(如 Shapefile、Personal Geodatabase、Raster 等)文件的读取与显示、打开关闭图层、调整图层顺序、图层符号化、新建任务、打开任务、保存任务、浏览数据等业务操作的准备工作,同时提供了小班数据合并、数据入库等数据准备工作,为系统运行和业务工作做好准备。
4.4.2 小班数据质量检查模块
小班数据质量检查部分主要是基于数据质量检查规则库进行小班数据质量的检测,过滤发现存在错误的林地小班数据,然后通过软件批量式更正和人工交互操作实现对小班数据的半自动化处理。本模块主要是基于小班数据质量检查规则库进行小班数据质量的检查,主要检查内容有:数据格式、数据完整性与正确性检查、属性项检查、属性值检查、图属逻辑一致性检查等。数据格式和完整性检查主要有是否符合系统数据格式,数据量是否满足系统运行要求、数据名称是否正确等;属性精度又包括小班图层数据中属性项是否全面、现有小班数据属性值是否存在空值、属性填写长度是否符合要求、枚举属性是否正确等方面;逻辑一致性主要有小班位于错误行政界内、林地小班编号重复等。
小班数据质量检查规则库表中记录了用于数据质检的所有规则,包括:数据图层之间的叠置分析关系、表内属性项限制关系、属性值填写限制要求等,是用户预先自定义完成的要素和要素之间规则关系的机器语言式的表达。在执行数据质量检查前需要依据数据实际情况从规则表中选出适合的质检规则,调整其规则检查顺序后形成一次数据质量检查方案,然后通过软件执行该方案即可实现对待检数据进行数据质量检查操作。通过执行质检方案筛选出存在数据质量问题的小班数据,错误小班记录依据规则记录中定义的符号化方案进行地图显示,满足人眼判断的要求,辅助完成人工交互式的错误数据处理操作。同时提供便捷的交互环境,以满足错误定位、交互核对、编辑修改等生产需求,错误小班数据经编辑后依此多次执行数据质检方案进行数据质量检查以得到符合林业成果要求的林地成果数据。
(1)空间拓扑位置检查
本系统是基于 ArcGIS 平台进行的 GIS 二次开发,ArcEngine 接口提供了空间几何图形常用的拓扑运算,包括交集、包含和并集等,这些拓扑运算在 ITopologicalOperator接口中进行了定义。该接口在 GIS 开发中的使用是非常广泛的,GIS 系统中能够体现GIS 优势的拓扑分析、缓冲区分析、图形裁剪等、图形合并等操作都需要使用此接口[47].在本系统中同样应用到了拓扑分析和缓冲区分析,通过 GIS 平台的几何运算查询过滤出不符合林地小班分布规律的小班数据,拓扑计算如图 4-11 所示:
(2)属性数据质量检查
本系统中林地小班数据质量检查操作应首先从修改质检规则开始,根据现有数据图层将将质检规则进行图层定义和规则二次确认,在质检规则正确无误的前提下挑选待检查规则记录以制定形成数据质检方案,然后依据质检方案完成一次数据质量检查操作,最终给出本次质检结果,用于错误数据的定位与编辑修改。
4.4.3 成果数据制作输出模块
系统开发的最终目标便是从原始的林地资源数据中获得最终林地成果数据,故系统中的成果输出模块是整个系统的核心,成果数据经过数据移植、林地小班合并更新、数据质量检查及编辑后可得到成果数据,将最终的成果数据通过地图符号化表达和成果统计报表制作输出成最终林业领域所需的成果专题地图和结果报表。
4.4.4 系统规则库维护模块
系统所用的规则库包含多种规则库,主要有小班数据质量检查规则库、图层可视化表达符号库、成果输出规则库三种规则库。其中,(1)小班数据质量检查规则库表中存放有所有用于数据质检操作的规则,满足图层与图层、单个图层内空间数据和属性数据以及不同图层间属性数据的质量检查规则要求,正确完善的规则表是系统进行小班数据质量检查的根本;(2)图层可视化表达符号库中规定了各图层在地图上进行表达的符号样式,通过修改和设定符号样式可以实现图层显示的美观,为小班数据编辑提供的基础;(3)成果输出规则库记录了专题图预定义样式文件的位置和报表统计输出要求及格式。通过修改专题图样式表可以定义新的专题图样式,保证了批次作业成果的统一性。
结果统计规则表定义了小班结果统计报表计算的依据以及 Excel 文件输出的格式问题,通过修改规则表中的统计规则可以生成新的成果统计报表,满足了林业用户复杂多变的成果要求。规则库维护模块可以实现对规则库中的规则进行修改、编辑的操作,用户可以根据具体需求在各类规则库中进行规则记录表的新增删除操作以及规则表内行记录的添加、删除、修改等操作,实现用户定制化的过程控制和结果数据制作,实现了用户化的系统操作。
4.5 本章小结
基于上文所述的林地小班数据质量检查流程方法,通过设计实现了县级森林资源信息管理系统。本章首先介绍了系统研发背景和实验目标,参照常用 GIS 软件的开发流程探索适用于林业 GIS 项目的技术研发路线,通过将 GIS 与林业恰当的应用解决林业领域的问题;将业务要求通过模块划分成多个功能点,通过各功能点的实现建成用于县级林业部门进行森林资源信息管理的业务系统;本章的最后详细介绍了各功能模块的功能和各模块的最终实现效果。本章通过系统开发实践以某县级森林资源数据为实验数据验证了本文所设计的小班数据质量检查流程方法的合理性和数据质量检查规则库建立的可行性。将本系统应用到实际生产中可以有效减轻林业生产部门的人工工作量,提高其工作效率。同时,本系统的设计实现过程对于新型数据质检系统的实现具有一定的借鉴意义。