一、引言及基本理论
水文学以研究地球上水体的起源、分布以及其循环运动变化规律等为基本内容的一门学科;在整个水文系统中,其输入一般有降水,污染物等等,流域或区域作为一个整体的演变系统,流域或区域出口的径流,污物扩散等作为输出。从整个水文系统来看,它是一个开放的巨大的复杂的系统,而且由于整个系统的运动规律影响因素多,而且其物理机理也非常复杂,导致整个水文系统具有不确定的特性。而水文系统中存在的种种不确定性主要表现在随机性、模糊性等方面。
在多元统计分析当中,聚类分析是其中的一个分支;它就是对一个没有在类别上进行标记区分的集合或者是样本,将它划分成为按照所选的某种规则进行标记区分的若干个子集或者类,尽量使样本或者集合中相似的元素或子集划分到同一类别当中,而尽可能的将其中不相似的元素或子集划分到不同的类别中。但是,伴随着社会的进步发展,人类的认知领域也在不断的拓展,其中,人们发现在现实世界中并不存在非常严格的界限来区分很多的事物或现象,他们在性态和类属方面存在着某种统一性或者说中介性,他们不是简单的"非此即彼"的关系,而是带有"亦此亦彼"的性质,我们将这种情况下的分类称为软分类,在这种情况下,简单的聚类分析已不能满足人们的需求。
1965年Zadeh[1]针对事物广泛存在的模糊性提出了模糊集合理论(Fuzzy Set Theory),人们开始尝试用这种方法来处理聚类问题,而且取得了较大的成功,并将这种用模糊集合理论处理聚类问题的方法称为模糊聚类分析。
通过对样本或集合的模糊聚类分析,不仅可以得到各样本或子集分别从属于各个类别的隶属度,又能够得到各个样本类属之间所具有的中介性。通过模糊聚类分析,得到了样本在不同类别中的不确定性描述,所得到的结论也更能够对现实世界进行客观的反映。所以模糊聚类分析成为了聚类分析研究的主流,也成为了近年来不断发展的一个研究热点[2].而模糊聚类分析也为了对水文学中的不确定问题进行处理的重要的工具。
二、发展概况
自从1965年Zadeh提出模糊集合理论以来,该理论得到了长足的发展,而且理论的本身的内容也得到充实和完善;而模糊聚类分析作为模糊集合理论在应用实践方面的重要领域之一,也在基础理论研究上获得了很大的进展,并且在实际工程的应用过程中取得了很好的成绩。而且模糊c均值法作为模糊聚类分析中的一种算法,由于其本身强大的实用性和理解上的通俗易懂性,使得模糊c均值法得到广泛应用,并迅速成为了对聚类问题进行研究的重要方向。下面对模糊c均值聚类的理论与算法的进展作简要的概括[3]:
(1)算法收敛性的改进:由Cannon在1986年提出的近似模糊c均值聚类法即AFCM法,使得模糊c均值算法的收敛速度得到了大大提高。
(2)目标函数的修改:Trauwaert等人在1991年,根据最大相关性的原则,将模糊聚类算法中的目标函数进行了修改。
(3)目标函数在距离公式方面的改进:距离公式的改进能够使得算法聚类的数据类型的范围扩大。基于目标函数的聚类算法中,大部分情况下都会采用欧氏距离。而Gusatafson[4]
在1978年,将协方差引入到了目标函数的距离公式的表达式中,提出了基于协方差的模糊聚类算法,从而使得在进行模糊聚类分析时,数据聚类的效果得到明显提高。
三、方法分类
从方法的实现上来看,进行聚类分析的方法一般可分为以下几种李晓伟重庆交通大学 重庆 400016类型[5]:基于谱系的聚类方法、基于等价关系的聚类方法、基于图论的聚类方法和基于目标函数的聚类方法。聚类方法可认为是将包含在样本集中的所有可能划分成为子集的并将子集按某种规则进行分类的处理数据的方法。如要得到理想的聚类结果,必须在采用聚类方法和选取聚类准则的时候进行谨慎的比选论证。但是,由于上述的前三种方法不适用于处理数据量比较大的情况,并且它们在实时性要求较高的场合不能满足使用要求,因此在进行实际问题分析的时候应用不是很广泛,目前,有关这三种聚类方法的研究已经逐渐减少了。而基于目标函数的聚类法则是将问题归结为一个非线性规划的问题,并且带有约束条件,通过采用以优化进行求解的方式获得样本数据集的最优模糊划分和聚类。这种聚类分析的方法在设计过程方面操作比较简单,而且所能解决的问题的范围方面也更加广泛,还可以将所处理的问题转化为有关优化的问题从而借助数学的非线性规划的理论进行求解。由于算法可以运用计算机将整个求解过程实现,所以这种方法的实用性很强。
数据聚类分析一般包括四个过程:(l)模式表示;(2)模式相似性的定义;(3)聚类算法的设计;(4)聚类有效性评价。
GIS的中文全称叫做地理信息系统,这项技术在应用的过程中主要是以计算机技术和软件技术为重要的基础,对计算机系统当中所存储的信息和数据予以分析和处理,同时还应该在这一过程中将信息应用在所需的领域。当前GIS技术已经在很多领域都得到了十分广泛的...
城市化进程中显露出诸多城市诟病, 城市的可持续发展开始逐渐被人们关注, 出现了“田园城市”、“智能城市”等概念。在我国, 生态水文学作为一门新兴交叉学科, 在基础理论、生态水文过程机理、区域生态环境和资源管理分配等方面均取得了一些研究成果。...
水文科学是地球科学的重要部分,重点研究水的运动规律和时空分布,并应用于地球水资源的开发利用和保护的实际工作中。水资源的合理开发和利用、开发与保护相结合、防治水旱灾害等工作都要以水文科技所研究的水文规律为根据,因此水文科技的发展与进步对我国...
引言在水文行业中,水文缆道是流量测验的主要测验设备,与其它测验设施设备相比,在抢测洪峰、安全保障、节省人力、操作方便、改善劳动条件等方面有突出的优点。但是水文缆道测深一直是缆道流量测验中的技术瓶颈。目前,水文缆道测深基本采用湿绳测绳法,利...
0引言径流时间序列突变分析是变化环境下水文分析计算的基础,是当前一个热点前沿问题.由于全球气候变化和人类活动的影响,流域下垫面发生了变化,水文系统循环时空范围与尺度发生了改变,造成了径流时间序列的时空变异,带来了一系列诸如水文极值事件、洪涝灾害...
以辽宁省基础水文数据库为依托, 选取544个雨量站、64个水文站为代表站, 系统分析辽宁省暴雨洪水空间特征。结果表明:辽宁省最大24 h雨量、暴雨日数、大暴雨日数均呈东南向西北递减趋势, 特大暴雨日数集中于辽宁东南部及辽河流域一带。...
天然河流中的边滩广泛存在于弯道的凸岸、连续弯道过渡段及卡口河段的两侧,是典型的河流地貌类型,一般由泥沙大量淤积形成[1].一方面,边滩是许多鱼类产卵和栖息之地、建设用沙来源之地、城镇居民的休闲场所及城市滨江工程建设用地;另一方面,边滩的存在缩...
1引言洪水作为一种十分普遍的自然灾害,频繁地对人类生命和财产造成巨大损害,如1998年长江特大洪水使整个长江流域都遭受了严重的破坏。随着当前人口数量的增加、森林植被的砍伐以及城市化建设等所致的土地利用方式改变,其如何影响洪水频率和洪灾程度是当...
前言各行业各系统均有GIS系统应用,在各项经济建设中做出了突出贡献,而GIS在我国水文水资源领域中的应用更加广泛。GIS全称是地理信息系统,主要内容就是通过计算机技术、软件技术为内核,对地理空间相关数据进行描述、分析、采集和存储的计算机系统。...
一个工程的建设中,首先要做的工作就是对地质的勘查,工程的实施需对地质问题有全面的了解。工程地质勘查中,水文地质问题是一个最为重要且关键的问题。水文地质主要勘查的是地下水的分布和形成规律、地下水的物理性质和化学成分、地下水资源及其合理利用、...