内蒙古工业大年夜学的研究人员提出风电机组异常数据的在线清洗方法_数据_机组
准确可信的数据采集与监视掌握系统(Super- visory Control And Data Acquisition, SCADA)运行数据是风电机组发电性能预测、故障预测与康健管理等事情的根本。然而,由于机组运行环境恶劣,很多现场采集的数据质量较差,特殊是因弃风限电、工况颠簸等缘故原由导致的数据非常问题尤为突出。高比例非常数据对运行数据的真实规律、特色参量的干系性关系等信息的挖掘与运用影响极大,因此风电机组数据洗濯事情至关主要。
风电机组数据洗濯方法紧张从特色空间的间隔、概率和密度等角度界定非常值。但是目前的研究多以风功率数据为洗濯工具,紧张研究机组发电性能预测,而数据洗濯方法在机组康健状态预测中的运用研究目前仍较少。
在风电机组整机性能预测与康健状态评估的运用中,有关研究指出,模型剖析法如神经网络更适宜于非常检测,而高斯稠浊模型、主身分剖析及其改进算法等概率统计方法对机组性能退化的预测适应性更好。
然而,概率统计方法对数据质量哀求较高,数据洗濯的运用方向不同时,洗濯工具、须要洗濯的非常数据以及洗濯方法均会有所差别,因此有必要对风电机组康健状态预测中的非常数据洗濯事情进行针对性研究。
首先,选择运行数据中可反响机组性能退化的关键特色参量构成洗濯工具,如风速-功率、转速-功率数据,而轴温、油温等参量作为机组康健状态预测与故障检测的主要特色依据,剔除个中的非常点反而可能造成故障信息丢失,不能轻易洗濯。其次,确定待洗濯的非常数据,包括堆积点与离群点。
离群点可能反响了工况变革,在基于模型剖析法预测发电性能或故障时可以不洗濯,但离群点分散性较大,对其进行合理洗濯将有利于基于概率统计方法预测机组的康健状态。
此外,不同机组的运行数据存在采样周期不同、概率分布特色呈差异化等特点,随着机组性能的逐渐退化,数据分布特色更趋繁芜,这些都对数据洗濯方法的通用性、精度、运算效率、稳定性以及工程适用性提出了较高哀求。因此,有必要针对风电机组康健状态预测深入研究运行数据关键特色参量的选择,以及堆积点和离群点的在线洗濯方法。
目前,可用于办理运行数据特色参量选择的方法有Relief、互信息、随机森林与邻域粗糙集 等。个中,Relief和互信息基于干系性度量,属于过滤法,具有快速高效、独立于预测模型的优点,但Relief为有监督法,而SCADA数据每每没有分类标签;随机森林属于封装法,可与邻域粗糙集运用于负荷预测或故障识别中对特色集的寻优与约简。
因此,基于互信息选择与机组运行状态干系性强的关键特色参量有利于大略、快速地确定洗濯工具,并利用Copula函数无需假设数据的分布形态即可描述其实际分布规律的特点,办理互信息打算中联合概率密度函数估计难的问题。
为担保数据洗濯方法的识别精度与运算效率,联合考虑关键特色参量的概率分布、时序特色与密度分布:利用单一Copula建立风速-功率、转速-功率等多元特色参量的置信等效功率区间,办理传统概率统计方法在样本分布不均、非常值较多时识别精度低的问题,同时避免采取稠浊Copula,确保算法的运算效率;仅考虑置信边界外的可疑数据,结合其时序特色和密度分布依次洗濯堆积点与离群点,办理DBSCAN算法无法在线洗濯[10-11]的问题;进一步基于Copula仿照实际非常数据,办理数据洗濯模型定量剖析的问题。
基于上述研究背景,内蒙古工业大学的研究职员针对风电机组康健状态预测中非常数据的在线洗濯进行研究。剖析风电机组性能退化过程中的数据特色,在此根本上,提出基于履历Copula-互信息(Empirical Copula-based Mutual Information, ECMI)法选择关键特色参量,并基于Copula结合非常值的时序特色与密度分布建立数据洗濯模型(Copula-based data cleaning model combining Time-series Features and Density Distribution, Copula-TFDD),对堆积点和离群点等范例非常数据进行在线识别。
图1 Copula-TFDD数据洗濯模型流程
科研职员通过研究得出如下结论:
1)提出基于ECMI的特色参量选择方法。选择反响风电机组整机性能的关键特色参量构成洗濯工具,对实测风速-功率、转速-功率数据中的堆积点和离群点等范例非常数据进行洗濯。
2)基于风电机组实测运行数据的概率分布、时序特色与密度分布提出Copula-TFDD数据洗濯模型。该方法可以对具有不同采样周期和差异化概率分布的运行数据实现在线洗濯,且能有效提升机组康健状态预测的性能。
3)基于Copula给出了人工仿照符合实际非常数据分布特色的数据集的方法。通过对Copula- TFDD的精度、运算效率和稳定性的定量剖析,验证了该数据洗濯方法的工程运用性较强。
本文编自2021年第10期《电工技能学报》,论文标题为“风电机组康健状态预测中非常数据在线洗濯”,作者为马然、栗文义、齐咏生。
本文系作者个人观点,不代表本站立场,转载请注明出处!