林业论文

您当前的位置:学术堂 > 农学论文 > 林业论文 >

空间数据质量控制分析

来源:学术堂 作者:陈老师
发布于:2016-12-01 共6031字
  本篇论文快速导航:

展开更多

  第 2 章 空间数据质量控制分析
  
  2.1 空间数据质量分析
  
  空间数据记录了地球上空间实体的位置、形态等空间位置信息同时也包括了其时空关系、分布特性等多方面定性的信息,是数字地球的基础信息。空间数据按照数据类型可分为矢量数据和栅格数据,栅格数据又可分为影像数据和格网数据[18],本文所讨论的空间数据特指矢量数据。由空间数据的定义可将 GIS 矢量数据可分为空间几何数据和非空间属性数据两部分。空间数据作为 GIS 系统的关键核心,限制着 GIS 系统运行应用的广度和深度,是 GIS 发挥其强大空间统计分析能力的体现。
  
  2.1.1 GIS 数据误差来源
  
  GIS 数据生产的流程[19]基本如图 2-1 所示,从数据的获取、数据产生到最终获取成果数据,数据质量影响因素存在于整个数据生产过程中的各阶段、各方面,在这样背景下必将产生数据的不确定性。为控制数据误差传递应从数据误差源、传播过程的各环节入手,分阶段和分层次用相应的措施方法加以控制。通常情况下,GIS 数据的误差来源主要可分为以下 4 种:
  
  (1) 数据源误差:空间原始数据的获取主要包括传统测绘手段获取的外业测量数据、无人机航飞数据、卫星遥感数据以及街景采集车等新兴数据采集手段。由于数据采集人员的专业水准、工作态度、采集仪器精度等原因,导致空间原始数据存在数据源的不确定性。
  
  (2) 数据转换误差:在原始数据准备好之后,为利用软件或人工进行数据生产操作,需要利用某种数据计算方法进行数据结构、格式的变换或数据计算等数据操作,但是由于算法模型本身的局限性将引入数据转换误差。
  
  (3) 数据生产误差:为得到我们需要的成果数据,需要对源数据进行拓扑分析、叠置分析、数据计算、栅格矢量化等一系列操作,数据生产的过程中引入各种误差伴随原有数据误差进行着误差的传播,最终引起 GIS 数据分析处理的不确定性。
  
  (4) 数据存储误差:经过各种数据处理后得到我们最终需求的成果数据,最终以电子格式存储、纸质 CD 等介质形式进行最终存储,以满足后续 GIS 统计分析使用的需求。然而数据存储过程中由于人为或自然不可为等原因,出现数据存储混乱、丢失数据源信息或配套数据等原因导致出现数据完整性的损失。
  
  2.1.2 空间数据质量控制
  
  GIS 在不断发展中,李德仁院士提出如何建立 GIS 的质量模型和处理数据的不确定性,数据的精度和系统回答问题的可信度,即如何衡量 GIS 中的精确数据和不确定数据、定量数据与定性数据,如何评价 GIS 解决问题的综合能力、统计分析结果的准确度和可靠性等成为 GIS 发展必须面临的问题[20].再这样的时代背景下,国内外研究学者开始对数据不确定性以及由此产生的数据质量控制技术进行进一步研究。
  
  GIS 的理论与技术广泛应用于社会各行业、 各部门,如城市交通、智能导航、城市规划建设、建筑房地产、土地管理、地理国情监测、资源开发、环境保护乃至整个公共领域。随着 GIS 广泛应用到各行各业, GIS 应用的重要性也越来越凸现出来,人们也开始认识到空间数据对于整个社会的进步和经济的发展的重要意义。在这样的时代背影下,人们利用现有新技术方法快速获取空间数据并加以应用,与此同时更关注如何获取高质量的空间数据。
  
  根据 GIS 空间数据具体表现,可见 GIS 矢量数据主要有 8 个基本特征:精度、准确度、不确定、相容性、逻辑一致性、现势性、完整性、数据说明[21].空间数据质量是指数据满足应用的实用性和满足用户使用要求的特性,故研究讨论空间数据质量可以从数据精度、准确度、不确定性、相容性、逻辑一致性、完整性和现势性等 GIS 数据基本特征的各方面来考虑,数据质量问题应该在数据生产整个生命周期的各个阶段都加以控制。
  
  2.1.2.1 空间数据质量检查研究
  
  空间数据质量可由数据质量元素来描述,数据质量的非定量元素和定量元素两部分几乎包含了所有描述数据质量的内容。其中,数据质量的非定量元素提供概括性的、定性的数据质量内容,用于描述无法量化的质量标准内容。数据质量定量元素提供的是可以量化的质量内容,用于描述数据满足预先设定的质量标准要求及指标的程度[22].
  
  2.1.2.2 数据质量元素
  
  空间数据质量元素可以归纳为下面几种[23]:数据说明情况、数据完整性、空间几何数据、属性数据精度、逻辑一致性等,具体数据质量子元素见下表 2-1:
  
  2.1.3 数据质量检查常用方法
  
  空间数据质量检查主要是为了保证空间数据质量避免数据误差的传递,提高 GIS 数据应用的精度和准确度。目前,数据质量检查方法主要有以下几种[24]-[26]:
  
  (1)传统手工检查法
  
  主要是通过人工目视法或是图形比对法,将电子化数据与原始数据源进行比较,发现数据中存在的错误。目视法检查主要是通过人眼识别数据和原始数据源之间的不同;图形法是将图形数据与原始数据源进行叠加比较,逐个检查数据上图形和属性与数据源之间的差异。
  
  手工检查方法操作方法简单,可以有效的检查空间数据的位置误差,但是此种检查方法受人工影响较大,工作效率低下,无法满足现在大数据量的任务,同时人工检查方法无法保证属性数据的精度。
  
  (2)数据生产控制法
  
  数据误差存在误差积累与传播,所在在数据生产过程中,时刻注意数据质量问题,利用生产软件自身的显示和查询功能,保证数据生产过程中的数据质量。生产控制法只能应用与数据生产过程当中,无法满足成果数据的质量检查,存在很大局限性。
  
  (3)数据抽查方法
  
  依据一定的选取规则和抽查比例,从待检查的全部数据中选取一定量的数据,进行数据质量的检查和评价。
  
  此种检查方法没有对全部待检数据进行质量检验,抽样数据满足要求也无法保证全部数据都不存在质量问题,故该方法多用于对成果数据质量的评判。
  
  (4)元数据检查法
  
  通过读取数据的元数据信息,依据元数据的内容来判断数据范围、内容、说明的完整性等,依此进行数据质量的评判。只有具备完善元数据信息的待检数据才能应用元数据检查法,故该方法并不具有通用性。
  
  (5)软件检查法
  
  分析待检查数据的检查内容和数据中存在的普遍性规律,利用数据图形与属性关系和分布规律通过编写代码利用计算机程序进行检查的方法,待检数据中违背数据规律、存在逻辑关系矛盾的数据即为问题数据。
  
  软件检查法对于错误数据定位准确,速度快,但是其技术难度大,对数据人员的技术水平要求较高,并且软件具有特殊性,无法满足通用性。
  
  2.2 林地矢量数据分析
  
  2.2.1 林地小班数据
  
  我国于 1986 年颁布的《森林法实施细则》中规定:“森林资源包括林地以及林区内的野生动物和植物”.森林是陆地生态系统的主体,森林资源的重要组成部分是林地及林木资源。
  
  从上世纪 70 年代开始,我国现行森林资源调查管理制度基本上是依据《森林法》和《森林法实施条例》规定进行管理[27].森林资源管理的数据主要有三类:基本情况数据、森林资源调查数据和专业调查数据。森林资源二类调查调查是以国营林业局、林场、县为单位进行,也可称为森林资源规划设计,其目的是服务于森林资源管理,通过二类调查获取森林资源调查数据为制定森林经营方案和林业规划设计等提供了数据支持和理论依据。森林资源统计和经营管理的最基本单位是林地小班(林业 GIS 中将林学和生物学特性基本相同、与周围森林地段明显差异的面状区域作为基础划分,称为林地小班)。森林资源信息系统建设中一项重要的工作就是科学划分林地小班,这样不仅能保证森林资源调查的准确性,而且还能更好的服务林业经营管理活动。林地小班作为森林资源管理的基本单位,在空间上是用矢量面状区域来表示的。
  
  2.2.2 林地小班的划分
  
  森林资源是一种动态变化的资源,具有再生性和自然增长的特性,故各类资源数据的边界是模糊不能准确界定的,为准确描述资源数据状态,适应林地数据的时空变化性,同时又能满足 GIS 对林地资源数据统计分析的要求,对林地小班进行区划分割应把握以下几个原则[28]:
  
  (1)小班所在的林班界和面积不能变动。(2)根据小班面积规程进行林地小班划分:过伐林区成片天然林:3 公顷,次生林区成片天然林为 1 公顷,人工林、未成林造林地为 0.1 公顷,无林地等其它地类,0.5 公顷,等。(3)面积小于规定的最小面积的林地小班并入临近属性相似的小班。(4)按面积由小到大逐级进行小班合并,直到大于规程所规定的最小小班面积。(5)依据最小距离合并相邻小班,不同权属的小班不合并。
  
  根据林业分类经营的思想,根据行政区划的不同森林资源具有特定的权属,按照森林分类区划的要求,森林资源实行行政 4 级划分体系,按照县-乡(镇)-村(林班)-小班的小班划分方式既方便又实用。第一步根据省、县、乡镇、村等行政区划范围将所有的森林、林地、林木以行政界线进行行政划分,形成基础林班;第二步按主导功能不同,基础林班又划分为生态公益林和商品林两大类别,再按不同的经营目的将有林地、疏林地和灌木林地划分为 5 大林种。在此基础上每个林种再继续分为若干个亚林种,生态公益林又可细分为防护林、特种用途林等 2 个林种;商品林可分为用材林、经济林和薪炭林 3 个林种[29].第三步针对不同的调查的因子依据森林类别制定技术标准与要求,在有所侧重的基础上再将森林资源数据逐级划分为合适的林地小班数据。在林业领域内通过“3S”技术的应用,为数字林业建设打下良好基础,使得林业能够更好地满足当前社会对林业生态效益的迫切追求。将 GIS 空间矢量数据按照小班划分原则划分成林地小班区划,具体的小班划分流程见图 2-3:
  
  2.3 林地小班数据质量检查分析
  
  2.3.1 林地数据误差来源
  
  2.3.1.1 林地数据生产流程
  
  我国从六十年代开始在林业领域应用“3S”技术,将遥感技术、数理统计抽样等相关技术应用于森林资源调查。例如,利用多个时期的遥感资料,通过比对遥感资料发现森林资源的变化、掌握森林变化规律;通过判读航空像片中的森林蓄积量与地面实测森林蓄积量的关系;利用航空像片对森林资源进行分层抽样调查,依据对森林类型的判断进行资源数据的分层抽样估测,减轻工作量提高了资源调查效率,并取得比较满意的估测精度等。将航空遥感技术与抽样技术相结合用于林业生产管理,是现在林业的一个优势方面,目前森林资源二类调查工作的数据生产流程[55]如下图 2-4:
  
  森林资源调查数据从遥感数据源为起始进行整个加工生产的过程,通过完成遥感数据的拼接和转换后进行栅格矢量化,最终进行矢量化数据的数据编辑操作,进行数据质量检查保证成果数据满足林业资源应用要求。森林具有随时间生长、资源分布分散、资源再生性等特点,加之自然界和人为干预的影响导致林地资源数据一直在发生着此消彼长的变化,故林地数据在具有一般 GIS 数据特征之外还具有一些区别于其他数据的特征,如数据类型复杂多变、区域分布性、时域性等。
  
  2.3.1.2 林地小班数据误差
  
  森林资源数据生产应用的过程中误差主要可划分为以下几种类型:
  
  (1)数据源误差;数据源误差是指在数据采集或收集整理的过程中使用的源数据本身的误差,主要包括调查人员的人为误差、环境温度的影响、仪器精度误差等方面因素。原始数据的质量直接影响着从数据源到成果数据各阶段数据的质量问题。
  
  (2)数据组织误差;数据组织的误差主要是指数据在数据组织设计时由于组织方式的不同而产生的误差。由于森林资源数据项种类繁多、复杂多变的特性,使用不同的数据组织规则和方法,对数据的存取的有效性和使用的高效性就存在不同程度的影响。
  
  (3)数据处理误差;数据处理误差是指是在数据编辑处理过程中,栅格数据和矢量数据互相转化,进行数字化过程和林地属性数据录入与数据预处理时而产生的误差;由于森林资源数据具有种类繁多、随时间消长的特性,人为在属性调查数据录入过程中不可避免的将引入数据填写误差。
  
  (4)数据应用误差;数据应用误差是指数据在软件系统或者用户使用中,由于不当的数据使用方式或错误的处理过程而产生的误差。在数据的使用过程中对于同一种数据来说,不同用户具有不同的数据评判标准,对相同数据的内容的解释和理解也将不同。
  
  本文讨论的林地小班数据特指森林资源调查数据的中间成果数据,已经完成栅格转矢量和矢量数据的基本编辑操作,论文中林地小班数据质量主要考虑数据处理误差和数据应用误差两部分,不考虑数据生产前期引入的误差,默认森林资源数据不存在错误。
  
  由于森林自身的特点,森林资源在自然界中表现为随机分布的特点,致使其属性数据具有了种类繁多、数据量大等问题。森林资源信息既有空间定位的要求,又有属性信息存储的要求。林地小班数据通过斑块分割和人工属性录入无法保证小班数据的唯一性和正确性,参考 GIS 数据质量可将小班数据质量主要分为以下几个方面[30]:
  
  (1)空间几何数据误差
  
  空间数据误差产生来源广种类多,从森林资源数据的收集、属性录入、数据加工都可能产生误差。空间数据误差主要有小班划分重叠、小班斑块面积超限、小班边界超限等。
  
  (2)属性数据误差
  
  由于应用矢量数据进行森林资源实体信息的录入保存,需要对空间实体进行取舍、抽象和离散,在矢量数据定义上表现为数据分层展现和属性字段定义等。在空间实体取舍和抽象的过程中产生数据的丢失和抽象表达,由此产生林地小班属性数据误差。林业原始属性数据通常是通过林业外业勘测调查的形式获取,故最终成果数据中的属性数据精度将直接受到原始的外业调查精准度的影响。属性数据误差主要来自原始数据源误差、数学模型误差、属性定义误差等。
  
  (3)图属逻辑一致性
  
  属性数据与数据的空间位置关系紧密相关,空间位置决定了林地小班属性数据,同时森林的自然增长性也决定了属性数据与林地数据的时域性的相关。
  
  2.3.2 林地小班数据质量检查内容
  
  在林业 GIS 中,林业应用多是基于空间数据的属性数据完成相关的统计分析和浏览检索操作,这就决定了林业 GIS 数据质量检查应侧重于属性质量检查,而且由于空间数据和属性数据密不可分的特性又决定林业数据的质量检查不仅要着重检查属性数据质量,与此同时仍需根据小班数据的特性结合几何空间数据和小班属性数据的关系综合进行小班数据的质量检查和控制。可将小班数据质量检查分为几何拓扑关系质量检查、属性质量检查和图属逻辑一致性质量检查三部分。
  
  针对林地小班数据特有的地域全覆盖性、行政等级划分严格和属性组合复杂等特性,结合测绘基础数据的数据特征、矢量数据质量检查的内容和方面,可将小班数据质量检查分为几何位置检查和属性信息检查两大部分,主要是完成数据说明情况、数据的完备、空间几何精度、属性数据精度、逻辑一致性等几部分数据质量检查。
  
  2.4 本章小结
  
  本章首先分析了 GIS 空间数据误差的来源、类型,详细陈述了数据质量控制中的数据质量元素类型,说明了了空间数据质量在各行业领域内具有重要地位,体现出对空间数据质量检查研究的必然。然后列举了目前数据质量检查常用的检查方法,通过分析比较出了各方法间的优势和劣势。其次结合林业 GIS 的特性分析了森林资源数据与 GIS空间数据的不同之处和林地数据可能的误差来源。本章最后指出了林地小班数据质量检查的多个方面,为下文进行林地小班数据质量检查方法流程设计奠定了基础。下一章将参考数据质量检查常用方法,针对林地小班数据质量检查方面设计一种适用于林地矢量数据进行数据质量检查的方法流程。
返回本篇论文导航
相关内容推荐
相关标签:
返回:林业论文