时序加权密度峰值聚类算法及用电负荷特性分类模型 您所在的位置:网站首页 统计学rho 时序加权密度峰值聚类算法及用电负荷特性分类模型

时序加权密度峰值聚类算法及用电负荷特性分类模型

2023-03-28 11:40| 来源: 网络整理| 查看: 265

近年来,随着中国主动配电网技术的快速发展,居民用电需求连年持续增长,通过大量用户的电力负荷数据分析用户负荷特性的重要性就日益显现出来. 进行用户负荷特性分析[1]有助于供电企业或机构掌握用户的用电行为习惯,从而进一步优化配电网调度策略,提升服务质量. 而负荷曲线作为用电特征最直观的反映,通过对其进行聚类分析,供电企业或机构可以将用户群进行分类,使电力资源分配更加精准,对于其进行负荷预测、需求侧管理以及改进电价定价机制都有重要意义[2].

目前对于电力负荷曲线进行分类的方法主要集中于机器学习算法,而机器学习算法主要包括无监督学习算法和有监督学习算法两方面. 在现实条件下企业或机构通常并不能提前预知用户电力负荷曲线的特征或分布情况,所以无监督学习算法在这个问题中具有较为广泛的应用. 常用的无监督学习算法主要有模糊C均值聚类算法、K-means算法、K近邻算法和谱聚类算法等. 文献[3]提出了一种灰狼算法优化的模糊C均值聚类算法. 文献[4]提出了一种经过密度参数方法对K-means算法进行改进过的负荷分类模型. 文献[5]提出了一种基于分段聚合近似方法结合K-means算法的负荷曲线聚类模型. 文献[6]提出了一种结合加权欧式距离K-means算法和KNN算法的负荷识别模型. 文献[7]提出了一种基于簇间重叠关系的谱聚类算法. 文献[8]基于GMM和SVM的非侵入式负荷识别算法.

在传统的无监督学习算法中,K-means算法的原理是将点聚类到邻近的簇中,这导致了其无法处理非球面形状的簇,且聚类结果容易受到初始聚类中心的影响. 而K-近邻算法计算量较大且距离选择方式不确定. 基于这些传统无监督学习算法的缺点, Rodriguez 等[9]提出了一种密度峰值快速搜索算法(Clustering by Fast Search and Find of Density Peaks, CFSFDP),该算法可以自动检测簇数量,不需要反复迭代运算,相较于K-means算法和KNN算法具有更高的效率.

电力负荷曲线通常都是时间序列数据,有较强的时间相关性,不同用户的用电行为可能会受到当日时间点、天气等短期因素或者季节等长期因素的影响,用电行为改变可能会直接影响到其负荷曲线的形态,普通的聚类算法因为不能考虑到这些问题而导致聚类可能发生错误. 针对时间序列数据的聚类问题,文献[10]提出了两种基于奇异值改进的K-means算法和DBSCAN算法的时间序列数据聚类算法. 文献[11]提出了一种基于局部加权动态时间扭曲改进的K-近邻聚类算法. 文献[12]提出了一种时间序列增量模糊聚类方法.

与其他聚类算法一样,CFSFDP算法也无法应用在动态时间序列数据的处理. 针对CFSFDP算法存在的这个问题,本文在CFSFDP算法的基础之上,提出了一种基于CFSFDP的时序加权密度峰值聚类模型,原始负荷曲线经过T-CFSFDP模型聚类后,相较CFSFDP可以得到更好的效果,并且使CFSFDP算法也具有了一定的处理动态数据的能力.



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有