当前时间: 风电控制领域的卓越解决方案
登陆论坛邮箱内网
公司新闻
基于支持向量的风机健康状态分析与预测研究

 作者  杨滨源

(成都阜特科技股份有限公司,成都 611731)
 
摘要:健康状态分析作为一种新的分析方法,是检测性能退化程度的重要手段,也为高可靠性产品的寿命预测提供了新的途径。然而,使用传统的健康状态分析方法对风机进行性能退化分析,会面临试验难度大、成本高等问题。风机在线监测中产生了大量的振动数据,激增的数据中蕴含着重要的风机性能退化信息和知识,亟需进一步挖掘和分析。本文以风机大数据为对象,综合统计学习及数据挖掘相关理论和技术,提出了基于支持向量数据描述的健康状态分析方法,通过对监测数据的有效预处理,状态特征提取和健康状态模型训练等步骤后,对风机性能进行退化分析和趋势预测分析。最后以山东某风电场的风机进行健康状态分析实例,分析结果与现场检测一致。
 
关键词:风机;大数据;健康状态;数据挖掘;时间序列;预测
 
 
Research on health status analysis and prediction of wind turbine based on support vector
 
Author: YANG Bin-yuan
(Chengdu Forward Technology Co., Ltd. Chengdu 611731, China)
 
Abstract: As a new analysis method, health status analysis is an important means of detecting the degree of degradation of performance, and also provides a new way for life prediction of high reliability products. However, using the traditional health analysis method to analyze the performance degradation of the wind turbine will be difficult and costly. A large amount of vibration data is generated in the on-line monitoring of wind turbine, and the significant performance degradation information and knowledge of wind turbine are urgently needed to be further excavated and analyzed. Based on wind turbine data and the related theories and techniques of statistical learning and data mining, a health analysis method based on support vector data description is proposed, after through the effective pretreatment of the monitoring data, the extraction of the state features and the training of the health state model, carring out wind turbine performance degradation analysis and trend prediction analysis. Finally, a case study of health analysis of a wind turbine in a wind farm in Shandong is given, and the results are in good agreement with field tests.
 
Key words: Wind turbine; Big data; Health status; Data mining; Time series; Prediction

 
作者简介: 杨滨源(1990-),男,工程师,主要从事风电机组状态监测与故障诊断研究,E-mail: orient@sc-forward.com
 
 
0、引言
 
    当前风能作为清洁能源在改善中国能源结构方面发挥着越来越重要的作用,但随之而来的风电场安全性和经济效益问题也逐渐引起关注。因此,对风机进行健康状态监测和性能退化分析就显得尤为重要[1]。目前,国内外不少学者对风机的故障诊断开展了许多研究。文献[2]采用K邻近度异常检测技术,将非平稳的时域信号转化为平稳或准平稳的频域信号,提取故障特征、挖掘故障信息、实现故障预警。文献[3]提出一种基于支持向量机,融合了风速、发电机转速以及相关振动的时频参数等多源信息的直驱风电机组故障诊断方法。文献[4]基于LabVIEW开发环境和NI CompactDAQ平台开发的风机齿轮箱健康状态监测系统,通过采取多种时频域方法对振动信号进行对比分析,可以快速、准确地确定故障的类型。文献[5]讨论了一种风电SCADA数据的预处理方法,提出了一种基于最小二乘法的风机健康系数计算方法,讨论了相应设备的健康状态监测标准。综上所述,利用风机监测大数据进行风机健康状态及性能退化分析和预测的研究工作还比较少,也不是很成熟。
 
    目前风电监测的振动数据动辄十余处, 而且每处的振动信号又可以进行各种时域、频域分析,运行工况又复杂多变,造成故障决策过程头绪繁多,很难对风机健康状态进行有效的分析以及给出明确的结论[6]。为了解决这个问题,并考虑风机监测数据总量大,数据复杂程度高,本文提出基于支持向量数据描述的风机健康状态分析方法,该方法建立高级分析模型,能够高效地从风机监测大数据去粗取精,运用领域知识,精确地分析这些核心数据,发现隐藏的性能退化信息。
 
 
1、风机健康状态分析
 
    运用大数据相关技术处理风机监测大数据,以进一步对风机的性能退化进行分析,与传统方法的角度不同,本文策略从数据挖掘的角度提出一种基于支持向量数据描述的风机健康状态分析方法。该方法在支持向量数据描述等知识的基础上给出了性能退化相关定义,在通过对监测数据的有效预处理,状态特征提取和健康状态模型训练等步骤后,最终使用训练的模型对风机性能进行退化分析,并进一步地进行趋势预测分析。
 
1.1、算法框架
    基于支持向量数据描述的健康状态分析方法主要有5个步骤,其算法框架如图1-1所示。
 
1.jpg 
图1-1 基于支持向量数据描述健康状态分析框架
 
    步骤1:选取风机关键监测通道数据,使用中值替代区间序列的方法降低数据中噪声,并生成新数据集;
 
    步骤2:针对新数据集计算各通道数据间的灰关联度,选取灰关联度之和较小的通道数据集合,进而剔除新数据集中的冗余信息;
 
    步骤3:对步骤2所得通道集合中每个通道数据按时间段序列计算样本熵作为这个通道该段时间内的状态特征,进而得到每个通道状态特征序列。将每个序列值进行标准化,组成状态特征样本向量;
 
    步骤4:选取风机健康运行情况下状态特征向量集,使用支持向量数据描述方法训练模型,得到健康状态知识库,即健康状态模型;
 
    步骤5:针对待测数据集中由步骤2所选取的通道数据集合,使用步骤3提取特征向量组成待测特征向量集。根据步骤4的模型,计算出性能退化度并预测分析。
 
    上述步骤中,数据预处理部分主要针对风机监测数据量大和信息复杂的问题,综合考虑到其监测数据缓变及样本熵较少依赖于序列长度的特点[7],步骤1中的中值替换的方法不仅减少了数据量,同时能降低数据中噪声。步骤2中使用灰关联分析的目的在于减少所选监测通道中的冗余通道数据,进一步降低后期分析的复杂度及计算量。
 
1.2、灰关联分析
    灰关联分析是一种基于灰色系统理论的分析方法,其基本思想是根据因素之间发展趋势的相似或相异程度来确定序列之间联系的紧密性[8]。
 
    引入参考数列与比较数列,且设参考数列为2.jpg,比较数列3.jpg;对参考序列和比较序列分别进行无量纲化处理,采用4.jpg获取;
 
    通过5.jpg计算灰关联系数;
 
    则QQ图片20171102140239.jpgQQ图片20171102140330.jpg的灰关联度QQ图片20171102140344.jpg通过6.jpg计算获取;
 
    式中,7.jpg反映了某一时候两序列的贴近程度,8.jpg为灰色分辨系数。9.jpg反映两序列整体相关程度,其值越接近1,说明相关性越好,即两序列的相关程度越高,各因素之间发展趋势越相似。
 
1.3、基于样本熵的特征提取
    熵(Entropy)是对信息进行定量描述,熵的变小即表示系统或事物不确定性的减少[9]。样本熵具有抗噪声和干扰能力强,较少地依赖于时间序列长度的优点,这些特点可以很好的适应大样本监测数据中风机关键部件状态特征的描述。
    对于一观察时间序列10.jpg,计算样本熵步骤如下:
 
  (1)对时间序列 10.jpg 重构m维相空间;
 
  (2)定义两个不同向量对应元素间的最大差值为两向量的距离;
 
  (3)设置相似容限11.jpg,其中12.jpg为X的标准差,对于任意向量13.jpg,统计14.jpg的个数,同时计算统计的个数与距离总数N-m的比值19.jpg20.jpg
 
  (4)对所有的18.jpg进行平均,记为 19.jpg :20.jpg
 
  (5)将维数增加1,即m+1,重复步骤(1):(4),得到21.jpg22.jpg
 
  (6)当N足够大时,此序列的样本熵QQ图片20171102142442.jpg估计值为:23.jpg
 
1.4、支持向量数据描述
    支持向量数据描述[10]是借鉴支持向量机的思想提出的一种基于边界思想的单值分类方法,其思想是通过在特征空间中找出一个包围目标样本点的超球体让目标样本点尽可能的被包围在超球体中,非目标样本点尽可能的不被包含。此处令超球体球心a和半径R,目标样本 10.jpg ,目标样本点均在超球体内部,其限制条件为:24.jpg
 
    允许在超球面内部包含非目标样本数据,为容忍少部分分布在超球体之外样本点,引入松弛QQ图片20171102161314.jpg,进而得到结构风险最小化问题。其本质为凸二次规划问题,方程中惩罚系数C起到控制对错分样本的作用,从而实现错分样本数和球体大小即算法复杂度之间的折衷,其模型如下:25.jpg
 
    在超球的边界由少数被称为支持向量决定,采用拉格朗日乘数法解决该优化问题,并用核函数替代点积运算实现由低维空间到高维空间的映射[11],可以由边界上的一支持向量到中心a计算得到超球体的半径R。对于给定的新样本,计算与中心a的距离,若距离不大于半径 R,则被判断为目标样本。
 
    支持向量描述具有只需要一种类别样本作为学习样本的优点,而健康状态分析本身淡化了对模式的区分。用健康状态样本点作为学习样本,将待测样本点随时间逐渐远离健康状态的过程即视为退化过程。
 
1.5、健康状态分析
    状态特征向量与健康状态模型球心a的距离(用dec表示)与半径R的差值(deg = dec -R)定义为性能退化度,性能退化度 deg 由0逐步增加的过程对应该性能退化过程。由于退化度不可能为负,规定 dec - R<0时,deg = 0。健康状态分析原理示意图如图1-2所示。
 
QQ图片20171102150541.jpg 
图1-2 健康状态分析原理示意图
 
    使用风机监测部件健康状态下的监测数据,训练所得健康状态模型,将待测状态特征与健康状态超球体球心距离超过半径作为性能退化度指标,能够对风机监测部件性能的退化进行客观描述。
 
1.6、性能预测分析
    风机监测数据具有强波动性特点,采用非等间隔灰色预测法[12]对状态特征进行健康状态预测分析。非等间隔灰色预测法流程示意图如图1-3所示。
 
QQ图片20171102150513.jpg 
图1-3 非等间隔灰色预测法流程示意图
 
    风机监测数据计算的状态特征序列中,以固定周期随机抽取一个运行状态特征,得到一组新的非等间隔时间序列的方式抽取多组非等间隔时间序列,进一步地,用平均弱化缓冲方法对时间序列进行处理,使平均弱化缓冲算子作用于单调增长序列时数据膨胀,可弱化缓冲序列的增长速度,使其比原始序列的增长速度减缓;对于单调衰减序列,在弱化缓冲算子作用下数据萎缩,以达到淡化或消除随机因素对时间序列的影响效果。最后,计算预测序列与实际序列的关联度,多组预测值中选择关联度最大一组预测值作为预测结果。
 
 
2、实例分析
 
2.1、计算状态特征
    以山东某风电场对风机进行状态监测为例,风机上布置了8个振动信号监测通道,各监测点主要监测传动链主轴轴向振动、传动链主轴径向振动、齿轮箱中部径向振动、传动链高速轴径向振动、发电机输入轴径向振动、发电机输出轴径向振动、机舱横向振动和机舱纵向振动情况。实例选择某风机健康状态下风机各通道振动数据的状态特征作为训练数据,并选择2015年5月30日至2016年4月30之间按时间序列抽选的82组振动数据进行分析。
 
    经过数据预处理和灰关联分析,选取灰关联度之和较小的通道数据集合包括动链主轴径向振动、齿轮箱中部径向振动、传动链高速轴径向振动和发电机输出轴径向振动。计算发电机输入轴径向通道振动数据有效值、峰值和状态特征样本熵结果如图2-1所示:
 
image067.jpg 
图2-1(a)测试数据序列有效值
 
image069.jpg
图2-1(b)测试数据序列峰值
 
image071.jpg
图2-1(c)测试数据序列样本熵
 
    通过图2-1常用特征和样本熵比较,发现样本熵相似性较小,区分度较好。且从风机实际历史运行情况看来,振动数据的样本熵特征能够区分健康及异常状态,特别是对长期的异常状况反映能力优于工程领域常用的特征指标,可作为健康状况的度量。
 
2.2、健康状态分析及结果验证
    根据性能退化度计算模型,计算全部待测状态特征的退化度,并且以选择的82组振动数据中前70组样本熵数据为时间序列,训练样本熵非等间隔灰色预测模型,预测71-82组样本熵,并根据预测值计算退化度。结果如图2-2 所示。
 
image073.jpg 
图2-2 退化度整体分析
 
    由图2-2可知,分析结果中退化度并非稳定变化的值,在短期内出现了波动现象,这主要是由支持向量数据描述识别的准确率和参数周期性等因素造成的,但仍能从总体上反应风机性能退化的过程。图2-2中前10 组数据的退化度均值总体低于后半部分,特别是曲线在第10组(时间为2015年6月14日)附近发生了明显突变,且此后维持在较高水平,此时该性能发生了不可逆的退化现象,由此推断此时风机已进入故障隐患状态。同时,使用非等间隔灰色预测模型在风机状态特征样本熵波动强烈的情况下,预测值与实际值比较吻合,能保证预测效果的质量。
 
    该风场业主后期对该风机开盖检查,确定发电机输入端轴承内环滚到严重磨损,已无法使用。现场反馈该轴承故障图片如下:
 
image075.jpg
 
 
3、结束语
   
    针对风机监测数据量大、数据密集和数据波动性强等特点,提出基于支持向量数据描述健康状态分析方法。方案给出了状态特征、健康状态模型及退化度的定义,并给出了相应的具体处理策略,能够对监测通道状态对应退化过程进行定量分析。同时,针对风机监测数据状态特征序列,采用非等间隔灰色预测法对各通道监测数据的状态特征进行有效预测,进一步地预测分析相应风机部件性能退化趋势情况。健康状态分析作为新的研究方向,本文为高可靠、长寿命风机的可靠性研究提供了新的思路和方法,具有重要的研究意义。
 
 
参考文献:
[1] 汪光阳,周义莲. 风机振动故障诊断综述[J],安徽工业大学学报,2006,23(1).
[2] 顾煜炯,宋磊,徐天金等. 变工况条件下的风电机组齿轮箱故障预警方法[J].中国机械工程,2014(10) :1346-1351.
[3] 安学利,赵明浩,蒋东翔等. 基于支持向量机和多源信息的直驱风力发电机组故障诊断[J]. 电网技术,2011,35(4) :117-122.
[4] 王建国,孙小明,王少锋等. 基于LabVIEW的风电机组齿轮箱健康状态监测系统设计[J],测控技术,2017, 36(3).
[5] 吕跃刚,吴子晗,陈敏娜. 基于风机健康系数的风电设备状态监测方法[J],可再生能源,2015, 33(7).
[6] 刘文艺. 风电机组振动监测与故障诊断研究[D],重庆大学,2010.
[7] Richman J S, Moorman J R. Physiological time-series analysis using approximate entropy and sample entropy[J]. American Journal of Physiology-Heart and Circulatory Physiology, 2000, 278(6) : H2039-H2049.
[8] 董海鹰,李晓楠,姚军. 基于粗糙集和灰关联分析的750 kV变电站故障诊断[J],高电压技术,2015, 41(10).
[9] Bekenstein J D. Black holes and entropy[J]. Physical Review D, 1973, 7(8): 2333-2346.
[10] Tax D M J, Duin R P W. Outliers and data descriptions[C]//Proceedings of the 7th Annual Conference of the Advanced School for Computing and Imaging. 2001: 234-241.
[11] Vapnik V. The nature of statistical learning theory[M].  springer, 2000.
[12] USIAK A,LI Wenyan.Virtual models for prediction of wind turbine parameters[J].IEEE Trans on Energy Conversion,2010,25(1): 245-252.