电力论文

您当前的位置:学术堂 > 水利论文 > 电力论文 >

对电力设备状态大数据分析

来源:高电压技术 作者:江秀臣,盛戈皞
发布于:2018-10-29 共19160字

  摘 要:随着智能电网的发展和电网规模的迅速增长, 及时、准确地掌握电力设备运行状态面临巨大的问题和挑战。近年来, 电力信息化日臻完善, 电力设备状态监测、生产管理、运行调度、环境气象等数据逐步实现集成共享, 大数据技术为电力设备状态评估和故障诊断提供了全新的解决思路和技术手段。结合大数据技术及数据挖掘分析方法在电力设备状态评估中应用的现状, 说明了电力设备状态大数据分析的内涵、目的、数据特征和基本架构, 阐述了电力设备状态大数据集成、转换、清洗、分布式存储和处理、高效挖掘以及数据驱动的设备状态分析模型等关键技术。通过分析电力设备状态评估的总体需求, 总结和探讨了大数据技术在电力设备状态评价、异常检测、故障预测、智能诊断等典型业务场景中应用的方法和效果, 提出了研究和应用中面临的主要问题, 并对相关技术的发展趋势进行了展望。

  关键词:大数据; 电力设备; 状态评估; 故障诊断; 状态监测; 数据挖掘; 异常检测; 故障预测;
  
  Abstract:With the development of smart grid and the rapid expansion of power grid scale, it is very difficult to grasp the operational state of power equipment timely and accurately.In recent years, the informationization of electric power has reached a high level.Data from condition monitoring system, power production management system, operation dispatching system, and environmental meteorology system are gradually integrated and shared.Big data technologies provide new technical methods and tools for power equipment condition assessment and fault diagnosis.We put forward the connotation, purpose, data characteristics, and basic framework for big data analysis of power equipment condition, in consideration of the status quo of big data technology and data mining analysis in power equipment condition assessment.The key techniques of big data integration, conversion, cleaning, distributed storage and processing, data mining with high efficiency, and data-driven analysis model for power equipment condition assessment are comprehensively elaborated.According to the total demand analysis of power equipment condition assessment, the methods and effects of big data techniques in application scenarios such as condition evaluation, anomaly detection, fault prediction and intelligent diagnosis are summarized and discussed.Finally, the major problems in research and application are proposed, and the development trend of the relative technologies is prospected.

  Keyword:big data analysis; power equipment; condition assessment; fault diagnosis; condition monitoring; data mining; anomaly detection; fault prediction;
 

电力

 

  0引言

  电力设备是构成电网的基础元件, 设备故障会严重影响电网的安全稳定运行, 造成巨大的经济损失。根据行业统计分析, 由于设备运行环境复杂恶劣、设备质量潜在缺陷等问题长期存在, 设备故障一直是引起电网停电事故的主要源头。全面、及时、准确掌握电力设备运行状态是保障设备安全运行的首要问题和难点, 也是电力设备智能化的主要技术瓶颈[1]。近年来, 电网规模迅速增长, 安全可靠供电的要求也越来越高, 设备状态准确评估和状态检修面临更大的挑战, 主要问题表现在:

  1) 传统的状态评估主要采用基于理论分析、计算仿真和试验测试等手段建立的因果关系物理模型, 然而设备故障影响因素众多、机理复杂, 难以建立完善、精确的状态评估物理模型。

  2) 现有方法主要基于单一或少数状态参量以及统一的诊断标准, 参数和阈值的确定主要基于大量实验数据的统计分析和主观经验, 分析结果片面, 无法全面反映故障演变与表现特征之间的客观规律, 统一标准的固定阈值判定方法也难以保证对不同设备的适用性。

  3) 电力设备的故障诊断很大程度上依赖专家分析, 近年来状态检测数据爆发式增长加上与设备状态密切相关的电网运行、气象环境等信息数据量巨大, 人工进行诊断分析的效率很低。

  4) 电力设备状态相关信息分散于各业务应用系统, 数据结构复杂多样、数据接口各不相同、平台间数据通信困难、交互性差, 导致信息与资源分散, 异构性严重, 横向共享和纵向贯通困难, 而且数据质量参差不齐, 数据集成和融合分析的难度较大, 影响设备状态评估诊断的效果和效率。

  随着智能电网的建设与发展, 电力设备状态监测、生产管理、运行调度、环境气象等数据逐步在统一的信息平台上的集成共享, 推动电力设备状态评价、诊断和预测向基于全景状态的综合分析方向发展。然而, 影响电力设备运行状态的因素众多, 爆发式增长的状态监测数据加上与设备的状态密切相关的电网运行、气象环境等信息数据量巨大, 现有方法难以对这些数据进行融合分析, 这种背景下, 大数据分析技术提供了一种全新的解决思路和技术手段。

  近年来, 现代通信信息技术的快速发展引发了数据迅猛增长, 面向数据挖掘、机器学习和知识发现的大数据分析和处理技术得到广泛的关注, 成为推动行业技术进步和科学发展的重要手段[2]。由于大数据对经济、社会和科研的巨大价值, 美国、英国、日本和欧盟等世界主要发达国家和地区纷纷给予高度关注, 将大数据技术的研究和应用提升到国家战略层面, 投入大量人力和财力进行研究[3]。谷歌、亚马逊、微软、IBM和Facebook等国际著名IT企业也将大数据技术列入重点发展计划。国内相关的研究起步稍晚, 但呈现蓬勃发展的态势, 以百度、腾讯、阿里巴巴、科大讯飞为代表的企业已将大数据技术成功应用于电子商务、金融、智能交通、公共管理、语音识别等领域。2015年9月, 国务院发布了《促进大数据发展行动纲要》, 为推动我国大数据技术和产业进一步快速发展提供了有力支撑。

  电力行业大数据的应用涉及整个电力系统在大数据时代下发展理念、管理体制和技术路线等方面的重大变革, 是下一代智能化电力系统在大数据时代下价值形态的跃升[4]。近年来, 电力大数据基础技术及其应用的研究逐步开展, 并在智能配用电、电力系统仿真、电网安全分析、电力负荷预测等方面取得一定的应用成效[5,6,7,8,9,10,11]。为了更好地掌握电网设备运行状态, 提高设备运行风险管控水平, 国家科技部、国家自然科学基金、国家电网公司和南方电网公司等单位2015年以来陆续立项开展了大数据分析技术在电力设备状态评估方面的研究和应用, 取得了阶段性的研究进展, 成为电力大数据的重要应用领域。

  本文结合大数据技术及数据挖掘分析方法在设备状态评估中应用的现状, 阐述电力设备状态大数据分析的内涵和目的、数据来源和特征、基本框架以及涉及的关键技术问题, 总结和探讨大数据技术在电力设备状态评估中的典型应用场景和应用效果, 并提出研究和应用中面临的挑战以及未来的发展趋势。

  1 电力设备状态大数据分析概述

  1.1 内涵和目的

  电力设备状态大数据分析主要利用日渐完善的电力信息化平台获取大量设备状态、电网运行和环境气象等电力设备状态相关数据, 基于统计分析、关联分析、机器学习等大数据挖掘方法进行融合分析和深度挖掘, 从数据内在规律分析的角度发掘出对电力设备状态评估、诊断和预测有价值的知识, 建立多源数据驱动的电力设备状态评估模型, 实现电力设备个性化的状态评价、异常状态的快速检测、状态变化的准确预测以及故障的智能诊断, 全面、及时、准确地掌握电力设备健康状态, 为设备智能运检和电网优化运行提供辅助决策依据。电力设备状态大数据分析是传统数据挖掘技术的提升和变革[5], 核心优势是从全量数据中提取客观规律, 不需要建立复杂的物理数学模型, 主要应用价值体现在:

  1) 从数据分析的角度揭示电力设备状态、电网运行和气象环境参量之间的关联关系和内在变化规律, 捕捉设备早期故障的先兆信息, 追溯故障发展过程, 预测故障发生的概率, 从而及时发现、快速诊断和消除故障隐患, 保障电力设备运行安全。

  2) 利用多维统计分析、关联分析、机器学习等方法获得不同条件、不同维度电力设备状态变化的个性化规律, 实现多维度、差异化的全方位分析, 大幅提高电力设备状态评价和预测的准确性。

  3) 推动新一代信息技术与设备运维检修的深度融合, 实现多源海量数据的快速分析、主动预测预警和故障智能研判, 提升设备状态评估的效率和智能化水平。

  1.2 数据来源和特征

  电力设备状态大数据分析所需要的数据主要包括:设备台账、技术参数、巡检和试验数据、带电检测和在线监测数据、电网运行数据、故障和缺陷记录、气象信息等, 涵盖能够直接和间接反映电力设备状态的信息。根据电力设备状态信息的更新频率, 可以将上述不同来源的状态信息划分为3大类:静态数据、动态数据、准动态数据。静态数据主要包括设备台帐、技术参数、投运前试验数据、地理位置等;动态数据通常按分钟、小时或天为周期更新, 是反映设备状态变化的关键数据, 主要包括运行数据、巡视记录、带电检测数据、在线监测数据、环境气象等;准动态数据通常按月或年定期或不定期更新, 主要包括检修试验数据、缺陷/故障/隐患记录、检修记录等。

  电力设备状态数据具备典型大数据特征, 传统的数据处理和分析技术无法满足要求, 主要体现在:1) 数据来源多。数据分散于各业务应用系统, 主要来源包括设备状态监测系统、生产管理系统 (统 (production management system, PMS) 、能量管理系统 (energy management system, EMS) 、地理信息系统 (geographic information system, GIS) 、天气预报系统、雷电定位系统、山火/覆冰预警系统等, 各系统相对独立、分散部署, 数据模型、格式和接口各不相同;2) 数据体量大、增长快。电力设备类型多、数量庞大, 与设备状态密切相关的智能巡检、在线监测、带电检测等设备状态信息以及电网运行、环境气象等信息数据量巨大且飞速增长;3) 数据类型异构多样。电力设备状态信息除了通常的结构化数据以外、还包括大量非结构化数据和半结构化数据, 如红外图像、视频、局部放电图谱、检测波形、试验报告文本等, 各类数据的采集频率和生命周期各不相同;4) 数据关联复杂。各类设备状态互相影响, 在时间和空间上存在着复杂的关联关系。

  1.3 基本架构

  电力设备状态大数据分析的参考基本架构如图1所示。首先, 利用跨平台多源异构数据获取技术从电力系统内部多个信息系统中获得在线监测、带电试验、停电试验、人工巡检、电网运行、环境气象等设备状态数据。然后, 对异构数据进行规范化转换和清洗, 利用统一的电力设备状态全景信息模型和分布式处理技术实现大数据的分布式存储、快速检索和实时处理。在此基础上, 基于内存计算框架和并行化计算技术建立设备状态数据高效挖掘和耦合分析的大数据挖掘分析平台。结合电力设备状态评估的主要业务场景和分析模型, 基于该平台对大量设备状态实时数据和历史数据进行关联关系和内在规律的分析, 实现电力设备异常检测、动态评价、状态预测和故障诊断等功能。最后, 利用多维度、多角度的可视化技术展示综合评估诊断结果和分析过程, 为设备运维检修、电网调度运行和资产管理等业务提供优化决策支持。

  2 电力设备状态大数据分析的关键技术

  大数据技术主要包括数据预处理、数据存储与检索、数据分析和可视化展示等重要技术。结合图1电力设备状态大数据分析的总体架构, 除了建立大数据分析平台的通用技术外, 电力设备状态大数据分析涉及的关键技术还包括:多源异构设备状态数据的集成和预处理、面向设备状态大数据的分布式存储和处理、数据高效挖掘和并行化计算以及数据驱动的设备状态分析模型等。

  2.1 多源异构设备状态数据集成和预处理技术

  2.1.1 多源数据集成和规范化转换

  电力设备状态大数据分析平台一方面需要从PMS、EMS、设备状态监测系统、气象信息系统等多个内部系统中获取相关数据, 另一方面通过物联网、移动互联等技术, 收集无人机巡线、机器人巡检、移动巡检、智能穿戴等外部实时检测信息, 形成设备全景信息库, 为电网运行、设备状态、气象环境等多源信息的展示和融合分析提供数据支撑。依据数据完整性、可用性和安全性等要求, 可以采用企业服务总线 (enterprise service bus, ESB) 、Webservice、数据中心数据库共享、安全文件传输等数据接口方式, 从各类电网业务系统中抽取数据, 解决跨平台数据库高效访问、数据文件高速并发读取、数据安全传输与同步等问题。

  2.1.2 非结构化数据转换

  通过人工巡检、在线监测、智能巡检等方式采集的大量红外热像、视频图像、紫外成像、局部放电图谱、频响和波形曲线等目前大都以非结构化的形式存储和处理, 这些非结构化数据可以有效地发现电力设备外观、环境、局部过热、局部放电等主要缺陷, 为设备状态评估诊断提供重要依据。此外, 大量的试验文档、巡检文档、检修工单、故障缺陷案例报告等以非结构化文本的形式存储, 也是设备状态评估和预测的重要参考信息。需要利用图像处理、文本挖掘等技术实现设备状态检测图形、图像、文本数据的特征提取和结构化转换[12], 为数据的统计分析和知识挖掘提供支持。

  图1 电力设备状态大数据分析的基本架构Fig.1 Basis framework of big data analysis for power equipment condition

  2.1.3 状态数据质量评估和数据清洗

  数据质量是是保证数据挖掘分析效果的前提条件。电力设备状态信息相关数据具有来源多、信息异构、数量庞大、属性繁多等特点, 存在数据不完整、冗余、冲突、遗漏、错误等问题, 尤其是设备状态监测系统可靠性不高, 传感器的短时失效、测量值错误、通讯端口异常、设备系统扰动等情况时有发生, 监测数据中不可避免的存在各类无效的异常值, 影响设备状态分析和评估的结果。

  电力设备状态数据清洗是数据预处理必不可少的环节, 也是保证设备状态大数据分析效果的关键技术。数据清洗的主要方法是通过统计分布、聚类、关联分析、时间序列分析以及机器学习等手段进行数据质量的检验、离群点识别、缺失值填充、噪声平滑等, 剔除无用的错误数据, 填补关键的缺失数据, 确保数据的有效性、一致性、完整性[13,14,15], 满足设备状态数据挖掘分析的要求。特别要注意的是数据本身的异常应该与设备状态异常变化有效区分, 以免造成设备状态异常的漏判或误判[16]。

  2.2 面向设备状态大数据的分布式存储和处理技术

  考虑到系统的成熟性和先进性, 目前一般采用Hadoop平台作为电力设备状态大数据存储、处理和云计算平台, 但考虑到电力设备状态数据自身的特点和状态分析的性能需求, Hadoop平台在应用时仍存在很大的优化空间[17,18,19,20]。

  2.2.1 设备状态数据高效存储技术:

  传统的设备状态数据存储多采用关系型数据库或以关系数据库为基础的并行数据库, 在海量数据装载以及查询时性能下降明显, 不能很好地适应设备状态大数据分析的应用需求。面向电力设备状态大数据的存储系统需要满足结构化和非结构化相结合、可靠性高、容量大、存储速度快等要求, 一般采用主流的分布式文件存储和分布式No SQL列存储数据库 (Hbase或HDFS) 。为了提高访问的性能, 需要针对电力设备状态数据的特点优化存储策略, 加快数据处理速度, 如:考虑设备状态数据相关性和时空属性的分布式存储算法, 按照设备主属性、时间戳和相关系数使具有相关性的数据在集群中聚集;对Hadoop平台的数据划分策略、调整数据块尺寸以及集群网络拓扑规划进行优化等[18]。

  2.2.2 设备状态数据快速检索技术

  大数据分布式存储并没有完全解决数据高效检索问题, 尤其是面对电力设备状态分析复杂、灵活多条件时空查询的需求, 单一行键查询难以满足需要。为提高设备状态评估数据检索和分析的效率, 针对设备状态数据查询业务虽然频繁发生, 但其类型相对固定的特点, 可采用多数据源并行连接的查询方法和二级索引技术, 设计复合行键结构, 在查询的性能以及业务的灵活性之间进行平衡。该技术基于增量索引和动态索引的数据检索方法, 资源利用率高、稳定性高、容错性高, 能够较好地满足设备状态大数据快速、灵活查询的需要[19]。

  2.2.3 设备状态数据处理技术

  大数据计算处理技术主要包括内存计算技术 (如Spark) 、即席查询技术 (如Impala) 、实时流处理技术 (如Storm) 和并行批处理技术 (如Map-reduce) 等[20]。实时流处理技术特点是处理速度快, 可以简单、高效、可靠地处理大量的数据流, 但是无法精确反映数据的全貌。批处理技术可以实现数据自动分隔、任务均衡、并行处理和结果融合。设备状态大数据分析可以根据业务特点和对处理时间的要求综合应用不同的处理技术:设备状态评价和故障诊断分析等需要处理数据库中海量历史数据的场景, 可采用并行批处理技术;设备异常状态快速检出以及视频监控图像识别等需要实时处理传感网络监测数据等场景, 可采用实时流处理技术和内存计算技术。

  2.3 面向设备状态评估的大数据挖掘分析算法与并行化技术

  数据挖掘分析的研究方式不同于基于数学模型的传统研究方式, 大量数据可以不依赖模型和假设, 只要数据间有相互关系, 经过分析计算就可以获得传统方法发现不了的新模式、新知识甚至新规律。数据分析的主要方法分为3类:1) 统计分析, 包括传统统计分布模型、时间序列分析、多元统计分析以及新兴的高维随机矩阵分析方法等;2) 挖掘分析, 包括关联规则挖掘、聚类、分类和异常检测等;3) 机器学习, 根据学习模式分为监督学习, 无监督学习和强化学习, 根据学习方法分为传统机器学习和基于多层神经网络的深度学习, 另外, 还包括迁移学习、主动学习和演化学习等类型。

  由于大数据具有海量、复杂多样、变化快等特性, 当数据量增大到一定规模的时候, 传统数据挖掘分析算法很多不再适用, 需要利用并行计算模型加快数据的处理速度。因此, 不少科研机构以及高校都积极致力于高性能的大规模数据集挖掘算法的研究[21,22], 利用不同的技术对传统的数据挖掘算法进行了修改、优化, 使其能够通过大数据存储架构的Map Reduce并行计算模型加快计算速度, 以适应大数据背景下的数据高效挖掘和融合分析要求。主要的思路是利用经典的数据统计和挖掘算法 (包括回归分析、关联分析、分类、聚类、时间序列分析等) 构建大数据挖掘平台, 将建模过程与Spark内存计算框架相结合, 由多个分布式节点并行地进行计算, 提高挖掘分析速度。

  考虑到每种数据挖掘分析算法都有其应用特点, 在电力设备大数据分析的应用中, 需要针对具体的业务场景采用一种或多种算法。

  2.4 多源数据驱动的电力设备状态分析模型

  电力设备状态大数据分析的核心是充分利用设备状态、电网运行和环境气象等多源、海量数据进行深度融合分析和机器学习, 提高设备状态评价、故障诊断和预测的实时性和准确性。根据应用场景, 可以构建3类分析模型:1) 通过多维统计分析、聚类、关联分析、回归分析、时间序列分析等大数据挖掘手段分析各类状态数据的关联关系及变化规律, 构建历史知识模型;2) 通过大量数据的多维统计和挖掘分析, 建立基于数据驱动的状态评价、故障诊断和预测模型;3) 利用大量样本数据进行智能学习, 对现有状态评价和故障诊断物理和数学模型进行修正、补充和完善。

  3 电力设备状态大数据分析的典型应用

  3.1 总体需求分析

  电力设备的状态变化和突发故障是在高压电场、热、机械力以及运行工况、气象环境等多种因素的作用下发生的, 要及时和准确地发现设备在运行中产生的潜伏性故障是十分困难的, 必须多角度综合分析不同特征参量值及其变化趋势, 来提高设备状态评价、诊断和预测的准确性。而电力设备的状态变化和故障演变规律蕴含在带电检测、在线监测、巡检试验以及运行工况、环境气候、电网运行等众多状态信息中, 随着智能电网的建设和不断发展, 设备检测手段的不断丰富, 电网运行和设备检测产生的数据量呈指数级增长, 逐渐构成了当今信息学界所关注的大数据, 充分利用这些数据需要相应的大数据分析技术作为支撑。

  3.2 典型应用场景

  3.2.1 面向设备状态评估的历史知识库

  对设备状态相关的状态监测、带电检测、试验、气象、运行以及设备缺陷和故障记录等海量历史数据进行多维度统计分析和关联规则挖掘, 从电压等级、设备厂家、设备类型、运行年限、安装地区等多个层面和多个维度揭示设备状态变化的统计分布规律、设备缺陷和故障的发生规律及设备状态的关联变化规则, 形成基于海量数据挖掘分析的历史知识库, 为设备家族性缺陷分析、状态评价、故障诊断和预测提供支撑, 也可以为状态检修辅助决策提供科学依据。

  3.2.2 设备状态异常的快速检测

  电力设备在实际运行过程中会受到过负荷、过电压、突发短路、恶劣气象、绝缘劣化等不良工况和事件的影响使设备状态发生异常变化, 这些异常运行状态如不及时发现并采取措施, 会导致设备故障并造成巨大的经济损失。从不断更新的大量设备状态数据中快速发现状态异常变化的信号, 是设备状态大数据分析的重要优势之一。

  设备异常或故障类型很多, 但故障样本很少, 反映故障发展过程数据变化的样本更少, 很难利用少量数据样本建立准确的异常检测模型、设定异常检测判断参数和阈值。大数据分析可以改变传统固定阈值的检测方法, 基于海量的正常状态数据建立数据分析模型, 利用纵向 (时间) 和横向 (不同参数、不同设备) 状态数据的相关关系变化判断设备状态是否发生异常, 及时地发现潜在故障隐患。目前, 一些研究采用聚类分析、状态转移概率和时间序列分析等方法进行状态信息数据流挖掘实现设备状态异常的快速检测, 取得了一定的效果[23,24,25], 基于高维随机矩阵、高维数据统计分析等方法建立多维状态的大数据分析模型, 利用高维统计指标综合评估设备状态变化, 也展现了良好的应用前景[25,26]。

  3.2.3 设备状态的多维度和差异化评价

  由于电力设备的分布性和电网的复杂性, 要对电力设备进行全面和准确的状态评价, 需要考虑电网运行、设备状态以及气象环境等不同来源的数据信息, 同时结合设备当前和历史状态变化进行综合分析。近年来, 考虑多参量的设备状态评价方法受到较多的关注, 主要利用预防性试验、带电检测、在线监测的数据结合故障记录、家族缺陷等对设备整体健康状态进行分析, 采用的方法包括累积扣分法、几何平均法、健康指数法等简单数学方法以及模糊理论、神经网络、贝叶斯网络、证据推理、物元理论、层次分析等智能评价方法[27,28,29]。但现有方法主要基于某个时间断面的数据对设备状态进行评价, 大数据的主要优势是通过融合分析实时和历史数据, 实现多维度、差异化评价。

  在多维度评价方面, 基于电力设备物理模型特征参量的内在联系结合主成分分析法、关联分析法等数据挖掘分析方法, 确定与设备关键性能相关的特征参量及其与设备关键性能状态间的耦合关系, 建立不同部件、不同性能对应的关键特征参量集, 形成电力设备多维度状态评价的指标体系[30]。

  在差异化评价方面, 传统的设备状态评价大都采用统一标准的计算模型参数、权重和阈值, 难以保证对不同类型、不同地区设备的普遍适用性。大数据技术通过对大量设备状态历史数据、变化趋势以及缺陷和故障记录进行多维度统计分析和关联分析, 获得数据的统计分布规律、相关关系和演变趋势, 从而对不同设备类型、不同地区、不同厂家、甚至不同时间段的评价模型参数、权重和阈值进行修正和完善, 实现设备状态的差异化评价[31,32,33,34]。其中, 各状态量的关联度、权重以及差异化阈值的确定是设备状态大数据评价的核心。

  3.2.4 设备状态变化和故障预测

  设备状态预测是从现有的状态数据出发寻找规律, 利用这些规律对未来状态或无法观测的状态进行预测。传统的设备状态预测主要利用单一或少数参量的统计分析模型 (如回归分析、时间序列分析等) 或智能学习模型 (如神经网络、支持向量机等) 外推未来的时间序列及变化趋势[35,36], 未考虑众多相关因素的影响。大数据分析技术可以挖掘设备状态参数与电网运行、环境气象等众多相关因素的关联关系, 基于关联规则优化和修正多参量预测模型, 使预测结果具备自修正和自适应能力, 提高预测的精度[37,38,39]。

  设备故障预测是状态预测重要环节, 主要通过分析电力设备故障的演变规律和设备故障特征参量与故障间的关联关系, 结合多参量预测模型和故障诊断模型, 实现电力设备的故障发生概率、故障类型和故障部位的实时预测。目前的研究主要采用贝叶斯网络、Apriori等算法挖掘故障特征参量的关联关系, 进而利用马尔科夫模型、时间序列相似性故障匹配等方法实现不同时间尺度的故障预测[40,41,42]。

  3.2.5 设备故障智能诊断

  对已发生故障或存在征兆的潜伏性故障进行故障性质、严重程度、发展趋势的准确判断, 有利于运维人员制定针对性检修策略, 防止设备状态进一步恶化。传统的故障诊断方法主要基于温度分布、局部放电、油中气体以及其它电气试验等检测参量, 采用横向比较、纵向比较、比值编码等数值分析方法进行判断[1]。由于设备故障机理复杂、故障类型和现场干扰的种类繁多, 简单数值分析的诊断方法准确率不高, 许多情况下需要多个专家进行综合分析确诊, 诊断效率很低, 且容易受到不同专家主观经验的影响。随着人工智能及机器学习算法的快速发展, 神经网络、支持向量机、模糊推理、贝叶斯网络、故障树、随机森林等智能方法在电力设备故障诊断中得到不少应用, 取得较好的成效[43,44,45,46]。基于一定规则综合利用多种智能算法、建立故障诊断相关性矩阵等融合分析方法, 可以有效提高诊断的准确性[47,48]。

  近年来, 带电检测、在线监测、智能巡检技术大量推广应用, 采集了海量的状态检测数据。利用大数据分析平台和人工智能技术可以对海量数据样本进行自动学习实现故障智能诊断, 达到甚至超过多个专家分析会诊的能力。基于大数据样本智能学习需要构建足够数量的缺陷、故障和现场干扰样本数据库, 一方面通过深度学习等先进的机器学习手段建立设备故障智能诊断模型, 另一方面可以通过大数据匹配和关联算法搜索相似的缺陷或故障案例, 为设备故障分析提供参考。另外, 利用智能学习算法对海量的状态检测图像和声音进行设备故障的自动辨识也是颇具应用价值的关键技术。目前深度信念网络、深度卷积网络等深度学习方法已在局部放电、油中气体故障诊断以及红外图像处理等方面取得了研究和应用进展[49,50]。

  4 面临的挑战和发展趋势

  4.1 面临的挑战

  目前, 大数据分析技术在电力设备状态评估中的应用已经在我国电网公司逐步开展。国家电网公司在电网运检智能化分析管控平台上利用大数据分析技术对设备状态进行多维度评价和故障预警;山东、上海、浙江、广州、宁夏等电网公司也陆续开发了基于大数据分析的电力设备状态评估系统, 取得了初步的应用成效。大数据技术为突破设备状态评估的瓶颈提供了全新的思路和手段, 但要完全满足智能电网的要求, 推动电力设备智能运检模式的变革, 在管理上和技术上还有不少难题需要解决, 面临的挑战主要包括:

  1) 设备状态数据来源涉及多个业务部门、数据结构和种类繁多、时间尺度跨度大, 全面获取设备状态数据, 尤其设备全寿命周期的历史数据难度较大, 数据集成和规范化转换、数据质量的提升以及非结构化数据的有效利用仍需要大量的协同工作和技术攻关。

  2) 与设备状态相关的电网运行、气象环境数据量较大, 但反映设备核心状态变化的试验测试和带电检测数据间隔时间长、数据量较小。需要解决在线监测的可靠性和经济性以及带电检测效率的问题, 推动在线监测和高效带电检测技术的广泛应用。

  3) 取得突破的机器学习对训练样本往往有数量上的要求, 而设备异常和故障样本的数据相对较少, 使机器学习的效果受到制约。如何将设备状态评估的专家经验融入机器学习、将知识分析与数据挖掘相结合, 实现专家知识的共享和传承是需要解决的重要问题。

  4) 电力设备状态大数据分析需要电气工程、计算机、信息和数学等专业的深度融合, 交叉学科人才的缺乏是影响技术发展和应用的重要因素。

  4.2 发展趋势

  设备状态大数据分析的发展趋势主要体现在以下几个方面:

  1) 设备状态全面感知, 提高设备状态监测的信息化水平。

  随着智能传感器、物联网和移动互联技术的发展, 高可靠、低成本的分布式智能传感网络以及传感元件与本体一体化设计的智能设备将在未来电网中广泛应用, 为设备状态的大数据分析提供更全面、更完备的基础数据。

  2) 大数据挖掘分析技术与业务需求深度融合。为设备状态分析提供更强劲的动力引擎。

  数据挖掘分析的技术发展趋势是分布式实时处理实现大规模数据的深度分析和实时挖掘, 以及数据挖掘过程可视化使知识发现的过程更易于理解。将最新的数据挖掘分析方法与设备状态评估业务需求深度交叉融合, 开发出针对电力行业甚至电力设备状态大数据分析应用的数据挖掘分析工具和开发环境, 可在多源异构数据高效处理、设备状态数据清洗和自动修复、设备状态变化规律深层次发掘等方面发挥重要作用。

  3) 大数据和人工智能技术紧密结合, 提高设备状态分析的智能化水平。

  近几年以深度学习为代表的人工智能技术取得飞速的进展, 尤其在语义识别、语音识别、图像识别等方面的分析效率和准确度已经远超过人类专家。2017年9月, 国务院发布了《新一代人工智能发展规划》, 进一步推动了人工智能技术在我国的发展和应用。电力设备状态评估将在大数据分析的基础上, 实现数据驱动、领域知识和人工智能的有效结合, 在异常状态快速甄别、状态检测图像自动处理、故障预测等方面取得突破性的进展。

  5 结论

  1) 电力设备状态评估和故障诊断是大数据技术在电力系统的重要应用领域, 可以为智能电网背景下设备状态检修、全寿命周期管理和智能调度等环节提供智能决策支持。

  2) 除了建立大数据分析平台的通用技术外, 电力设备状态大数据分析的关键技术要结合设备状态数据的特征和应用业务的需求, 实现多源异构数据的集成、转换、清洗、存储、处理和数据挖掘。

  3) 目前大数据在电力设备状态评估中的研究和应用还处于起步和探索阶段, 初步的研究表明:大数据分析可以有效提高电力设备状态评估的准确性, 在提炼历史知识、个性化评价、异常快速检测、故障智能诊断和状态预测等应用场景方面展现了良好的效果, 应用前景广阔。

  4) 设备状态大数据分析在数据集成、数据质量、样本数量等方面面临一些挑战, 未来突破的关键是设备状态数据的全面获取以及数据挖掘分析与业务需求的深度融合, 大数据结合人工智能技术的应用将是重要的发展方向。

  参考文献
  [1]朱德恒, 严璋, 谈克雄, 等.电气设备状态监测与故障诊断技术[M].北京:中国电力出版社, 2009.ZHU Deheng, YAN Zhang, TAN Kexiong, et al.Condition monitoring and fault diagnosis technology of electric apparatus[M].Beijing, China:China Electric Power Press, 2009.
  [2]王星.大数据分析:方法与应用[M].北京:清华大学出版社, 2013.WANG Xing.Big data analysis:method and application[M].Beijing, China:Tsinghua University Press, 2013.
  [3]李国杰, 程学旗.大数据研究:未来科技及经济社会发展的重大战略领域—大数据的研究现状与科学思考[J].中国科学院院刊, 2012 (6) :647-657.LI Guojie, CHENG Xueqi.Big data research:a major strategic area for future development in science, technology, economy and society—research status and scientific thinking of big data[J].Bulletin of the Chinese Academy of Sciences, 2012 (6) :647-657.
  [4]中国电机工程学会信息化专委会.中国电力大数据发展白皮书 (2013) [R].北京:中国电机工程学会信息化专委会, 2013.Chinese Society for Electrical Engineering Informatization Committee.Chinese electric power big data development white paper (2013) [R].Beijing, China:Chinese Society for Electrical Engineering, 2013.
  [5]费思源.大数据技术在配电网中的应用综述[J].中国电机工程学报, 2018, 38 (1) :85-96.FEI Siyuan.Overview of application of big data technology in power distribution system[J].Proceedings of the CSEE, 2018, 38 (1) :85-96.
  [6]张东霞, 苗新, 刘丽平, 等.智能电网大数据技术发展研究[J].中国电机工程学报, 2015, 35 (1) :2-12.ZHANG Dongxia, MIAO Xin, LIU Liping, et al.Research on development strategy for smart grid big[J].Proceedings of the CSEE, 2015, 35 (1) :2-12.
  [7]王继业, 季知祥, 史梦洁, 等.智能配用电大数据需求分析与应用研究[J].中国电机工程学报, 2015, 35 (8) :1829-1836.WANG Jiye, JI Zhixiang, SHI Mengjie, et al.Scenario analysis and application research on big data in smart power distribution and consumption systems, scenario analysis and application research on big data in smart power distribution and consum8ption systems[J].Proceedings of the CSEE, 2015, 35 (8) :1829-1836.
  [8]HE X, AI Q, QIU R C, et al.A big data architecture design for smart grids based on random matrix theory[J].IEEE Transactions on Smart Grid, 2017, 8 (2) :674-686.
  [9]魏大千, 王波, 刘涤尘, 等.基于时序数据相关性挖掘的WAMS/SCADA数据融合方法[J].高电压技术, 2016, 42 (1) :315-320.WEI Daqian, WANG Bo, LIU Dichen, et al.WAMS/SCADA data fusion method based on time-series data correlation mining[J].High Voltage Engineering, 2016, 42 (1) :315-320.
  [10]黄彦浩, 于之虹, 谢昶, 等.电力大数据技术与电力系统仿真计算结合问题研究[J].中国电机工程学报, 2015, 35 (1) :13-22.HUANG Yanhao, YU Zhihong, XIE Chang, et al.Study on the application of electric power big data technology in power system simulation[J].Proceedings of the CSEE, 2015, 35 (1) :13-22.
  [11]张素香, 赵丙镇, 王风雨, 等.海量数据下的电力负荷短期预测[J].中国电机工程学报, 2015, 35 (1) :37-42.ZHANG Suxiang, ZHAO Bingzhen, WANG Fengyu, et al.Short-term power load forecasting based on bigdata[J].Proceedings of the CSEE, 2015, 35 (1) :37-42.
  [12]曹靖, 陈陆燊, 邱剑, 等.基于语义框架的电网缺陷文本挖掘技术及其应用[J].电网技术, 2017, 41 (2) :637-643.CAO Jing, CHEN Lushen, QIU Jian, et al.Semantic framework-based defect text mining technique and application in power grid[J].Power System Technology, 2017, 41 (2) :637-643.
  [13]严英杰, 盛戈皞, 陈玉峰, 等.基于时间序列分析的输变电设备状态大数据清洗方法[J].电力系统自动化, 2015, 39 (7) :92-96.YAN Yingjie, SHENG Gehao, CHEN Yufeng, et al.Big data cleaning method for power equipment state data based on time series analysis[J].Automation of Electric Power Systems, 2015, 39 (7) :92-96.
  [14]齐波, 张鹏, 荣智海, 等.基于数据驱动和多判据融合的油色谱监测传感器有效性评估方法[J].电网技术, 2017, 41 (11) :3662-3669.QI Bo, ZHANG Peng, RONG Zhihai, et al.Validity assessment method of DGA sensors based on data driven and multiple criterion integration[J].Power System Technology, 2017, 41 (11) :3662-3669.
  [15]代杰杰, 宋辉, 杨祎, 等.基于栈式降噪自编码器的输变电设备状态数据清洗方法[J].电力系统自动化, 2017, 41 (12) :224-230.DAI Jiejie, SONG Hui, YANG Yi, et al.Status data of power transmission and transformation equipment cleaning method based on stacked denoising autoencoders[J].Automation of Electric Power Systems, 2017, 41 (12) :224-230.
  [16]林峻, 严英杰, 盛戈皞, 等.考虑时间序列关联的变压器在线监测数据清洗[J].电网技术, 2017, 41 (11) :3733-3740.LIN Jun, YAN Yingjie, SHENG Gehao, et al.Online monitoring data cleaning of transformer considering time series correlation[J].Power System Technology, 2017, 41 (11) :3733-3740.
  [17]王有元, 蔡亚楠, 王灿, 等.基于云平台的变电站设备智能诊断系统[J].高电压技术, 2015, 41 (12) :3895-3901.WANG Youyuan, CAI Yanan, WANG Can, et al.Intelligent diagnosis system for substation equipment based on cloud platform[J].High Voltage Engineering, 2015, 41 (12) :3895-3901.
  [18]宋亚齐, 周国亮, 朱永利, 等.云平台下输变电设备状态监测大数据存储优化与并行处理[J].中国电机工程学报, 2015, 35 (2) :255-267.SONG Yaqi, ZHOU Guoliang, ZHU Yongli, et al.Storage optimization and parallel processing of condition monitoring big data of transmission and transforming equipment based on cloud platform[J].Proceedings of the CSEE, 2015, 35 (2) :255-267.
  [19]王德文, 李静芳.变电设备状态监测大数据的查询优化方法[J].电力系统自动化, 2017, 41 (2) :165-172.WANG Dewen, LI Jingfang.Optima query method of big data for status monitoring of substation equipment[J].Automation of Electric Power Systems, 2017, 41 (2) :165-172.
  [20]宋亚齐, 周国亮, 朱永利, 等.智能电网大数据处理技术现状与挑战[J].电网技术, 2013, 37 (4) :927-935.SONG Yaqi, ZHOU Guoliang, ZHU Yongli, et al.Present status and challenges of big data processing in smart grid[J].Power System Technology, 2013, 37 (4) :927-935.
  [21]骆涛.面向大数据处理的并行计算模型及性能优化[D].合肥:中国科学技术大学, 2015.LUO Tao.Parallel computational model and performance optimization on big data[D].Hefei, China:University of Science and Technology of China, 2015.
  [22]周斌.基于Hadoop的海量工程数据关联规划挖掘方法研究[D].北京:北京交通大学, 2016.ZHOU Bin.Research on association rule mining methods of massive engineering data based on Hadoop[D].Beijing, China:Beijing Jiaotong University, 2016.
  [23]严英杰, 盛戈皞, 刘亚东, 等.基于滑动窗口和聚类算法的变压器状态异常检测[J].高电压技术, 2016, 42 (12) :4020-4025.YAN Yingjie, SHENG Gehao, LIU Yadong, et al.Anomalous state detection of power transformer based on algorithm sliding windows and clustering[J].High Voltage Engineering, 2016, 42 (12) :4020-4025.
  [24]严英杰, 盛戈皞, 陈玉峰, 等.基于大数据分析的输变电设备状态数据异常检测方法[J].中国电机工程学报, 2015, 35 (1) :52-59.YAN Yingjie, SHENG Gehao, CHEN Yufeng, et al.An method for anomaly detection of state information of power equipment based on big data analysis[J].Proceedings of the CSEE, 2015, 35 (1) :52-59.
  [25]高树国, 王学磊, 李庆民, 等.基于MCD稳健统计分析的变压器油色谱异常值检测及分布特性[J].高电压技术, 2014, 40 (11) :3477-3482.GAO Shuguo, WANG Xuelei, LI Qingmin, et al.Outliers detection and distribution characteristics of the transformer DGA data based on MCD robust statistics[J].High Voltage Engineering, 2014, 40 (11) :3477-3482.
  [26]严英杰, 盛戈皞, 陈玉峰, 等.基于高维随机矩阵大数据分析模型的输变电设备关键性能评估方法[J].中国电机工程学报, 2016, 36 (2) :435-445.YAN Yingjie, SHENG Gehao, CHEN Yufeng, et al.The key state assessment method of power transmission equipment using big data analyzing model based on large dimensional random matrix[J].Proceedings of the CSEE, 2016, 36 (2) :435-445.
  [27]朱承治, 郭创新, 孙旻, 等.基于改进证据推理的变压器状态评估研究[J].高电压技术, 2008, 34 (11) :2332-2337.ZHU Chengzhi, GUO Chuangxin, SUN Min, et al.Power transformer condition assessment based on improved evidential reasoning[J].High Voltage Engineering, 2008, 34 (11) :2332-2337.
  [28]邹仁华, 王毅超, 邓元婧, 等.基于变权综合理论和模糊综合评价的多结果输出输电线路运行状态评价方法[J].高电压技术, 2017, 43 (4) :1289-1295.ZOU Renhua, WANG Yichao, DENG Yuanjing, et al.Condition assessment method for transmission line with multiple outputs based on variable weight principle and fuzzy comprehensive evaluation[J].High Voltage Engineering, 2017, 43 (4) :1289-1295.
  [29]廖瑞金, 张镱议, 黄飞龙, 等.基于可拓分析法的电力变压器本体绝缘状态评估[J].高电压技术, 2012, 38 (3) :521-526.LIAO Ruijin, ZHANG Yiyi, HUANG Feilong, et al.Power transformer condition assessment strategy using matter element analysis[J].High Voltage Engineering, 2012, 38 (3) :521-526.
  [30]严英杰, 盛戈皞, 陈玉峰, 等.基于关联规则和主成分分析的输电线路状态评价关键参数体系的构建[J].高电压技术, 2015, 41 (7) :2308-2314.YAN Yingjie, SHENG Gehao, CHEN Yufeng, et al.Establishment of key parameter system for condition evaluation of transmission line based on association rules and principal component analysis[J].High Voltage Engineering, 2015, 41 (7) :2308-2314.
  [31]齐波, 张鹏, 徐茹枝, 等.基于分布模型的变压器差异化预警值计算方法[J].高电压技术, 2016, 42 (7) :2290-2298.QI Bo, ZHANG Peng, XU Ruzhi, et al.Calculation method on differentiated warning value of power transformerbased on distribution model[J].High Voltage Engineering, 2016, 42 (7) :2290-2298.
  [32]熊俊.高压套管介质损耗及电容现场测量值分布特性[J].高压电器, 2016, 52 (6) :69-77.XIONG Jun.Distribution characteristics of dielectric loss and capacity increment measurements of transformer bushings[J].High Voltage Apparatus, 2016, 52 (6) :69-77.
  [33]MA H, SAHA T K, EKANAYAKE C.Statistical learning techniques and their applications for condition assessment of power transformer[J].IEEE Transactions on Dielectrics and Electrical Insulation, 2012, 19 (2) :481-489.
  [34]王有元, 袁园, 李剑, 等.变压器油纸绝缘可靠性的威布尔混合评估模型[J].高电压技术, 2010, 36 (4) :842-848.WANG Youyuan, YUAN Yuan, LI Jian, et al.Weibull mixed evaluation model for reliability of oil-paper insulation in transformer[J].High Voltage Engineering, 2010, 36 (4) :842-848.
  [35]FEI S W, SUN Y.Forecasting dissolved gases content in power transformer oil based on support vector machine with genetic algorithm[J].Electric Power System Research, 2008, 78 (3) :507-514.
  [36]卞建鹏, 廖瑞金, 杨丽君.应用弱化缓冲算子与最小二乘支持向量机的变压器油中溶解气体浓度预测[J].电网技术, 2012, 36 (2) :195-199.BIAN Jianpeng, LIAO Ruijin, YANG Lijun.Concentration prediction of gases dissolved in transformer oil based on weakening buffer operator and least square support vector machine[J].Power System Technology, 2012, 36 (2) :195-199.
  [37]SHENG G H, HOU H J, JIANG X C, et al.A novel association rule mining method of big data for power transformers state parameters based on probabilistic graph model[J].IEEE Transactions on Smart Grid, 2018, 9 (2) :695-702.
  [38]杨越文, 侯慧娟, 杨祎, 等.基于贝叶斯模型的输电线路运行参量关联规则挖掘及预测方法[J].电网技术, 2017, 41 (11) :3648-3654.YANG Yuewen, HOU Huijuan, YANG Yi, et al.Association rule mining and prediction method for transmission line operation state based on Bayesian model[J].Power System Technology, 2017, 41 (11) :3648-3654.
  [39]代杰杰, 宋辉, 杨祎, 等.基于深度信念网络的变压器油中溶解气体浓度预测方法[J].电网技术, 2017, 41 (8) :2737-2742.DAI Jiejie, SONG Hui, YANG Yi, et al.Concentration prediction of dissolved gases in transformer oil based on deep belief networks[J].Power System Technology, 2017, 41 (8) :2737-2742.
  [40]周湶, 孙超, 安文斗, 等.基于云推理及加权隐式半Markov模型的变压器故障预测[J].高电压技术, 2015, 41 (7) :2268-2275.ZHOU Quan, SUN Chao, AN Wendou, et al.Transformer failure prediction based on cloud reasoning and weighted implicit semi-Markov model[J].High Voltage Engineering, 2015, 41 (7) :2268-2275.
  [41]郑茂然, 余江, 陈宏山, 等.基于大数据的输电线路故障预警模型设计[J].南方电网技术, 2017, 11 (4) :1-8.ZHENG Maoran, YU Jiang, CHEN Hongshan, et al.Design of fault warning model of transmission line based on big data[J].Southern Power System Technology, 2017, 11 (4) :1-8.
  [42]吴广宁, 倪雪松, 宋臻杰, 等.基于改进灰色组合模型的变电设备故障率预测[J].高电压技术, 2017, 43 (7) :2249-2255.WU Guangning, NI Xuesong, SONG Zhenjie, et al.Prediction for substation equipment failure rate based on improved grey combination model[J].High Voltage Engineering, 2017, 43 (7) :2249-2255.
  [43]唐勇波, 桂卫华, 彭涛, 等.PCA和KICA特征提取的变压器故障诊断模型[J].高电压技术, 2014, 40 (2) :557-563.TANG Yongbo, GUI Weihua, PENG Tao, et al.Transformer fault diagnosis model based on PCA and KICA feature extraction[J].High Voltage Engineering, 2014, 40 (2) :557-563.
  [44]吴广宁, 袁海满, 宋臻杰, 等.基于粗糙集与多类支持向量机的电力变压器故障诊断[J].高电压技术, 2017, 43 (11) :3668-3674.WU Guangning, YUAN Haiman, SONG Zhenjie, et al.Fault diagnosis for power transformer based on rough set and multi-class support vector machine[J].High Voltage Engineering, 2017, 43 (11) :3668-3674.
  [45]陶新民, 李震, 刘福荣, 等基于精简集支持向量机的电力设备故障检测方法[J].高电压技术, 2016, 42 (10) :3199-3206.TAO Xinmin, LI Zhen, LIU Furong, et al.Fault detection method for power transformer based on SVM using reduced vector set[J].High Voltage Engineering, 2016, 42 (10) :3199-3206.
  [46]白翠粉, 高文胜, 金雷.基于3层贝叶斯网络的变压器综合故障诊断[J].高电压技术, 2013, 39 (2) :330-335.BAI Cuifen, GAO Wensheng, JIN Lei.Integrated diagnosis of trans-former faults based on three-layer Bayesian network[J].High Voltage Engineering, 2013, 39 (2) :330-335.
  [47]陈伟根, 刘娟, 曹敏.基于信息融合的变压器内部故障诊断方法[J].高电压技术, 2015, 41 (11) :3797-3803.CHEN Weigen, LIU Juan, CAO Min.Diagnosis method of internal fault for transformers based on information fusion[J].High Voltage Engineering, 2015, 43 (11) :3797-3803.
  [48]胡军, 尹立群, 李振, 等.基于大数据挖掘技术的输变电设备故障诊断方法[J].高电压技术, 2017, 43 (11) :3690-3697.HU Jun, YIN Liqun, LI Zhen, et al.Fault diagnosis method of transmission and transformation equipment based on big data mining technology[J].High Voltage Engineering, 2017, 43 (11) :3690-3697.
  [49]DAI J J, SONG H, SHENG G, et al.Dissolved gas analysis of insulating oil for power transformer fault diagnosis with deep belief network[J].IEEE Transactions on Dielectrics and Electrical Insulation, 2017, 24 (5) :2828-2835.
  [50]张新伯, 唐炬, 潘成, 等.用于局部放电模式识别的深度置信网络方法[J].电网技术, 2016, 40 (10) :3733-3740.ZHANG Xinbo, TANG Ju, PAN Cheng, et al.Research of partial discharge recognition based on deep belief nets[J].Power System Technology, 2016, 40 (10) :3733-3740.

作者单位:
原文出处:江秀臣,盛戈皞.电力设备状态大数据分析的研究和应用[J].高电压技术,2018,44(04):1041-1050.
相关内容推荐
相关标签:
返回:电力论文