专利基于数据时序特性和电器间状态关联性的数据生成方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111215373.7 (22)申请日 2021.10.19 (71)申请人杭州电子科技大学地址 310018 浙江省杭州市下沙高教园区2 号大街 (72)发明人罗平　邓晋宇　樊星驰　孙博宇　孔亚广　 (74)专利代理机构杭州君度专利代理事务所 (特殊普通合伙) 33240 代理人杨舟涛 (51)Int.Cl. G06F 30/27(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01)G06F 111/10(2020.01) (54)发明名称基于数据时序特性和电器间状态关联性的数据生成方法 (57)摘要本发明公开了一种基于数据时序特性和电器间状态关联性的数据生成方法。本发明为减少数据采集过程存在的噪声问题，结合电力负荷数据的特性利用负荷数据的均值和格拉布斯检测法对噪声数据进行清洗。从以下两个改进对抗生成网络： 1.增加生成器的学习任务。 2.创建降维和复原网络辅助改进后的对抗生成网络工作。其次修改网络输入数据的格式，使对抗生成网络纵向学习各电器间的相关联工作状态。最后对生成器中超参数进行优化，进一步提升生成器的性能，从而提升生成数据的质量。权利要求书3页说明书7页 CN 114091323 A 2022.02.25 CN 114091323 A 1.基于数据时序特性和电器间状态关联性的数据生成方法，其特征在于，包括以下步骤：步骤一：首先搭建平台对电器进行低频采样，获取有功功率数据和总有功功率数据，并对有功功率数据进行预处理；步骤二：建立电器模型；对预处理后的功率数据进行归一化处理，使其值缩放至[0,1]；因此为充分捕捉电器间隐藏的相关性，创建一个滚动窗口；电器i给定时间长度为T的有功功率序列为P(i)， i∈[1， m]，其中m为电器的数量；将所有电器的P(i)拼成一个m ×T的矩阵P，矩阵P如下式所示：步骤三：构建对抗生成网络模型；一是最小化真实数据和生成数据概率分布间的差异；二则最小化以下两个条件概率分布间的差异： 1)当前时刻之前真实数据已知的条件下，当前时刻真实数据服从的条件概率分布； 2)当前时刻之前生成数据已知的条件下，当前时刻生成数据服从的条件概率分布；因此定义如下两个表达式：其中xdata为真实数据概率分布，为生成器生成数据的概率分布,P1:T表示1‑T时间内电器的有功功率序列， J( ·)为计算J ‑S散度， J‑S散度用于衡量两个概率分布的相似度；整个GAN由四个子网络构成，分别如下：降维网络e( ·)：输入为高维的真实数据序列P1:T＝[P1,P2,…,PT]，其中P～xdata(P)；输出为降维后的数据h1： T＝[h1， h2，…， hT]；降维网络将原本的高维数据输出到隐空间进行后续运算,其中h1:T＝e(P1:T)，在考虑时序特性的情况下ht＝e(ht‑1,Pt)；降维网络包含各一个输入、输出层和三个隐藏层，考虑RNN过去在处理时序数据中优异表现，区别于一般 GAN网络中使用的多层感知器模型，将每个隐藏层替换成24个GRU单元，激活函数为leaky ‑Relu，优化器选择Adam；复原网络r( ·)：输入为h1： T＝[h1， h2，…， hT],输出为其中该运算在隐空间内进行，运算完毕将输出到原本的高维数据空间；复原网络的结构、激活函数和优化器选择与降维网络相同，并与降维网络共用一个损失函数即重构损失函数LR；其中表示分布函数xdata(P)的期望； LR用于计算真实数据经过降维和复原后的损失，目标使得LR接近于0；生成器g(·)：输入为随机噪声z～xnoise(z)，其中生成器直接在隐空间中实现运算，输权　利　要　求　书 1/3 页 2 CN 114091323 A 2出低维生成数据其中生成器的结构、激活函数和优化器同降维网络；改进后的生成器区别于一般的生成器，在考虑时序特性的前提下，生成器不仅学习真实数据的概率分布即xdata(P)，且学习当前时刻之前的真实数据已知时，当前时刻的真实数据服从的条件分布xdata(Pt|P1:t‑1)，因此各时刻由于生成器中增加了时序特性的学习，仅靠对抗器中0 ‑1反馈不足以激励生成器捕捉该条件分布，因此对生成器单独建立一个时序信息损失函数LT，通过LT的数值反馈来监督生成器对数据时序特性的学习情况；其中LT用于计算真实数据所服从的条件概率分布xdata(Pt|P1:t‑1)和生成器学习的条件概率分布之间的差异；对抗器d(·)：对抗器的本质为0 ‑1鉴别器，将上述生成器的输出和降维网络的输出 h1:T同时输入对抗器进行0 ‑1博弈；对抗器的输出为其中当对抗器判定本次读取的数据为真实数据时接近于1，否则接近于0；对抗器的结构、激活函数和优化器选择与降维网络相同；对生成器和对抗器共同建立一个生成对抗损失函数LV；对抗损失函数LV需同时衡量对抗器和生成器的性能，因此最优的结果为生成器生成对抗器无法区别于真实数据的生成数据；此时LV逐渐收敛于 0.5；步骤四：优化生成器超参数对已经训练完毕的生成器中超参数进行优化；对其他三个子网络手动调整超参数即可；选用树结构Par zen算法对超参数Ir和R进行优化；其他超参数则根据模型损失值的变化情况手动调参；构造一个关于超参数的向量v＝(R,Ir)，且超参数优化的目标函数为：其中f(v)＝y为需最小化的目标，为生成器网络输出的生成数据和真实数据的归一化均方根误差； v*为最佳超参数组合， χ为超参数的搜索空间；树结构Parzen算法并非直接对式(6)进行求解，而是最大化预期改进指标，即EI指标的定义为：式中y*是根据D＝{(v1,y1),(v2,y2),…,(vQ,yQ)}中y的中位数来确定，其中vQ表示第Q组超参数， yQ表示f(vQ)； F(y|v)是未知的，但其中， F(v|y)为给定归一化均方根误差下v的概率； l(v)和g(v)是服从高斯混合模型的概率密度函数；令γ＝F(y＜y*)，由式(7)和F(v)＝F(v|y)F(y)贝叶斯公式可得： F(v)＝γl(v)+(1 ‑γ)g(v) (9)权　利　要　求　书 2/3 页 3 CN 114091323 A 3

专利 基于数据时序特性和电器间状态关联性的数据生成方法

专利基于数据时序特性和电器间状态关联性的数据生成方法