(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111215373.7
(22)申请日 2021.10.19
(71)申请人 杭州电子科技大 学
地址 310018 浙江省杭州市下沙高教园区2
号大街
(72)发明人 罗平 邓晋宇 樊星驰 孙博宇
孔亚广
(74)专利代理 机构 杭州君度专利代理事务所
(特殊普通 合伙) 33240
代理人 杨舟涛
(51)Int.Cl.
G06F 30/27(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06K 9/62(2022.01)G06F 111/10(2020.01)
(54)发明名称
基于数据时序特性和电器间状态关联性的
数据生成方法
(57)摘要
本发明公开了一种基于数据时序特性和电
器间状态关联性的数据生 成方法。 本发明为减少
数据采集过程存在的噪声问题, 结合电力负荷数
据的特性利用负荷数据的均值和格拉布斯检测
法对噪声数据进行清洗。 从以下两个改进对抗生
成网络: 1.增加生成器的学习任务。 2.创建降维
和复原网络辅助改进后的对抗生成 网络工作。 其
次修改网络输入 数据的格式, 使对抗生成网络纵
向学习各电器间的相关联工作状态。 最后对生成
器中超参数进行优化, 进一步提升生成器的性
能, 从而提升生成数据的质量。
权利要求书3页 说明书7页
CN 114091323 A
2022.02.25
CN 114091323 A
1.基于数据时序特性和电器间状态关联性的数据生成方法, 其特征在于, 包括以下步
骤:
步骤一: 首先搭建平台对电器进行低频采样, 获取有功功率数据和总 有功功率数据, 并
对有功功率数据进行 预处理;
步骤二: 建立电器模型;
对预处理后的功率数据进行归一化处理, 使其值缩放至[0,1]; 因此为充分捕捉电器间
隐藏的相关性, 创建一个滚动窗口; 电器i给定时间长度为T的有功功率序列为P(i), i∈[1,
m], 其中m为电器的数量; 将所有电器的P(i)拼成一个m ×T的矩阵P, 矩阵P如下式所示:
步骤三: 构建对抗 生成网络模型;
一是最小化真实数据和生成数据概率分布间的差异; 二则最小化以下两个条件概率分
布间的差异: 1)当前时刻之前真实数据已知的条件下, 当前时刻真实数据服从的条件概率
分布; 2)当前时刻之前生 成数据已知的条件下, 当前时刻生 成数据服从的条件概率分布; 因
此定义如下两个表达式:
其中xdata为真实数据概率分布,
为生成器生成数据的概率分布,P1:T表示1‑T时间内
电器的有功功率序列, J( ·)为计算J ‑S散度, J‑S散度用于衡量两个概率分布的相似度; 整
个GAN由四个子网络构成, 分别如下:
降维网络e( ·): 输入为高维的真实数据序列P1:T=[P1,P2,…,PT], 其中P~xdata(P); 输
出为降维后的数据h1: T=[h1, h2,…, hT]; 降维网络将原本的高维数据输出到隐空间进行后
续运算,其 中h1:T=e(P1:T), 在考虑时序特性的情况下ht=e(ht‑1,Pt); 降维网络包含各一个
输入、 输出层和三个隐藏层, 考虑RNN过去在处理 时序数据中优异表现, 区别于一般 GAN网络
中使用的多层感知器模型, 将每个隐藏层替换成24个GRU单元, 激活函数为leaky ‑Relu, 优
化器选择Adam;
复原网络r( ·): 输入为h1: T=[h1, h2,…, hT],输出为
其中
该
运算在隐空间内进行, 运算完毕将
输出到原本的高维数据空间; 复原网络的结构、 激活
函数和优化器选择与降维网络相同, 并与降维网络共用一个损失函数即重构损失函数LR;
其中
表示分布函数xdata(P)的期望; LR用于计算真实数据经过降维和复原后的
损失, 目标使得LR接近于0;
生成器g(·): 输入为随机噪声z~xnoise(z), 其中生成器直接在隐空间中实现运算, 输权 利 要 求 书 1/3 页
2
CN 114091323 A
2出低维生成数据
其中
生成器的结构、 激活函数和优化器同降维网络; 改进
后的生成器区别于一般的生成器, 在考虑时序特性的前提下, 生成器不仅学习真实数据的
概率分布 即xdata(P), 且学习当前时刻之前的真实数据已知时, 当前时刻的真实数据服从的
条件分布xdata(Pt|P1:t‑1), 因此各时刻
由于生成器中增加了时序特性的学习,
仅靠对抗器中0 ‑1反馈不足以激励生成器捕捉该条件分布, 因此对生成器单独建立一个时
序信息损失函数LT, 通过LT的数值反馈来 监督生成器对数据时序特性的学习情况;
其中LT用于计算真实数据所服从的条件概率分布xdata(Pt|P1:t‑1)和生成器学习的条件
概率分布
之间的差异;
对抗器d(·): 对抗器的本质为0 ‑1鉴别器, 将上述生成器的输出
和降维网络的输出
h1:T同时输入对抗器进行0 ‑1博弈; 对抗器的输出为
其中
当对抗器
判定本次读取的数据为真实数据时
接近于1, 否则接近于0; 对抗器的结构、 激活函数和优
化器选择与降维网络相同; 对生成器和对抗器共同建立 一个生成对抗损失函数LV;
对抗损失函数LV需同时衡量对抗器和生成器的性能, 因此最优的结果为生成器生成对
抗器无法区别于真实数据的生成数据; 此时LV逐渐收敛于 0.5;
步骤四: 优化 生成器超参数
对已经训练完毕的生成器中超参数进行优化; 对其他三个子网络手动调整超参数即
可;
选用树结构Par zen算法对超参数Ir和R进行优 化; 其他超 参数则根据模型损失值的变化
情况手动调参;
构造一个关于超参数的向量v=(R,Ir), 且超参数优化的目标函数为:
其中f(v)=y为需最小化的目标, 为生成器网络输出的生成数据和真实数据的归一化
均方根误差; v*为最佳超参数组合, χ为超参数的搜索空间; 树结构Parzen算法并非直接对
式(6)进行求 解, 而是最大化预期改进指标, 即EI指标的定义 为:
式中y*是根据D={(v1,y1),(v2,y2),…,(vQ,yQ)}中y的中位数来确定, 其中vQ表示第Q组
超参数, yQ表示f(vQ); F(y|v)是 未知的, 但
其中, F(v|y)为给定归一化均方根误差下v的概率; l(v)和g(v)是服从高斯混合模型的
概率密度函数;
令γ=F(y<y*), 由式(7)和F(v)=F(v|y)F(y)贝叶斯公式可 得:
F(v)=γl(v)+(1 ‑γ)g(v) (9)权 利 要 求 书 2/3 页
3
CN 114091323 A
3
专利 基于数据时序特性和电器间状态关联性的数据生成方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:45:05上传分享