(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111180509.5
(22)申请日 2021.10.1 1
(71)申请人 清华大学
地址 100084 北京市海淀区清华园1号
申请人 国网重庆市电力公司
国家电网有限公司
(72)发明人 胡伟 陈涛 吴迎霞 蒋振宇
赵科 蒋望 史成钢 张同尊
古济铭 万朝辉
(74)专利代理 机构 北京清亦华知识产权代理事
务所(普通 合伙) 11201
代理人 吴婷
(51)Int.Cl.
G06F 30/27(2020.01)
G06K 9/62(2022.01)G06Q 50/06(2012.01)
(54)发明名称
电力系统运行数据建模与特征选择方法、 装
置、 电子设备和存 储介质
(57)摘要
本申请属于电力系统运行和控制技术领域,
具体而言涉及一种电力系统运行数据建模与特
征选择方法、 装置、 电子设备和存储介质。 对历史
运行数据预处理过程和原始系统物理仿真建模;
对建模后系统的并行仿真和批量数据结果标注
过程; 基于统计方法和特征关联度的过滤法第一
阶段特征选择初筛过程; 基于旋转森 林的第二阶
段特征选择精细筛选过程, 最终获得特征数量
少、 特征冗余度低以及特征关键信息密度高的电
力系统运行数据特征子集。 本申请能够提取电力
系统运行数据框架下的关键特征, 能够充分满足
电力系统安全 稳定分析的精度与速度要求。 本方
法有效提高电力系统运行数据的标准处理能力
和分析利用效率, 而 且易于实施。
权利要求书3页 说明书10页 附图2页
CN 114021425 A
2022.02.08
CN 114021425 A
1.一种电力系统运行 数据建模与特 征选择方法, 其特 征在于, 包括:
根据历史运行 数据对电力系统建模, 得到 仿真软件 模型工程文件;
对建模后的 电力系统进行批量并行仿真, 得到包含建模后电力系统的原始特征S的数
据样本;
对原始特征S集合进行第一阶段的筛 选, 得到包 含有效特 征子集S1的数据样本;
采用旋转森林算法, 对包含有效特征子集S1的数据样本进行第二阶段特征选择, 获得
建模后电力系统运行 数据的特 征子集S2。
2.根据权利要求1所述的电力系统运行数据建模与 特征选择方法, 其特征在于, 所述根
据历史运行 数据对电力系统建模, 得到 仿真软件 模型工程文件, 包括:
(1)对电力系统的历史运行 数据进行 数据清洗、 缺失值 填充和特 征的标准 化处理;
(2)根据步骤(1)的数据, 得到以电力系统电压、 电流、 功角和潮流所确定的电力系统的
基本运行状态;
(3)根据步骤(2)的电力系 统的基本运行状态, 设定电力系 统的发电机、 负荷和线路参
数, 以综合稳定 仿真软件格式构建一个仿真电力系统;
(4)将步骤(3)的仿真电力系统的运行点设置为与 步骤(2)的电力系统相接近的运行状
态, 得到仿真软件 模型工程文件。
3.根据权利要求1所述的电力系统运行数据建模与 特征选择方法, 其特征在于, 所述对
建模后的电力系统进 行批量并行仿 真, 得到包含建模后电力系统的原始特征S的数据样 本,
包括:
(1)采用Python编程语言编写外部调用仿真软件 的方法, 对所述仿真软件模型工程文
件中仿真电力系统进 行单次仿 真运行和仿 真结果输出, 将Python编程语 言编写的可运行的
程序文件保存;
(2)利用P ython编程语言的多线程模块, 对步骤(1)的可运行的程序文件进行多线程调
用, 在与仿 真电力系统运行点相接近的运行状态按照实际电力系统的运行方式波动随机取
值, 得到仿真运行 数据; 并将仿真运行 数据保存在数据文件夹中;
(3)对步骤(2)的仿真运行数据进行缺失值和异常值处理, 以功角标准为评价指标, 若
处理后的仿 真运行数据在暂态扰动下保持电力系统安全稳定, 则对仿 真运行数据打上标签
1, 表示为稳定样本, 若处理后的仿真运行数据在暂态扰动下不能保持电力系统安全稳定,
则对仿真运行 数据打上 标签0, 表示 为不稳定样本;
(4)将步骤(3)打上 标签的数据样本中的仿真运行 数据记为原 始特征集合S。
4.根据权利要求1所述的电力系统运行数据建模与 特征选择方法, 其特征在于, 所述对
原始特征集合S进行第一阶段的筛 选, 得到包 含有效特 征子集S1的数据样本, 包括:
(1)对所述原 始特征集合S的数据样本进行Mi n‑Max归一化处理;
(2)对归一化处理后的原始特征集合S进行方差和标准差计算, 按照标准差排序, 将标
准差较低的10%的特 征删除, 得到特 征集合S’;
(3)利用下式, 计算所述特 征集合S’中任一特 征X与Y的相关系数r:
权 利 要 求 书 1/3 页
2
CN 114021425 A
2其中, Y为所述表示仿真运行状态是否稳定的标签, 取值为标签0/1, Cov(X,Y)为X与Y的
协方差, Var[X]为X的方差, Var[Y]为Y的方差;
将特征集合S’中相关系数r的绝对值小于 0.1的特征X进行剔除, 得到特 征集合S”;
(4)利用下式, 计算所述特 征集合S”中任一特 征X与Y的业 务理解能力IV值
其中, Y为所述表示仿真运行状态是否稳定的标签, 取值为标签0/1, X和Y的概率分布分
别记为P(X)和Q(Y);
将特征集合S ”中IV值排序, 将IV值较低的10%的特征删除, 得到基于统计方法和特征
关联度的过 滤法第一阶段 特征选择初筛特 征子集S1。
5.根据权利要求1所述的电力系统运行数据建模与 特征选择方法, 其特征在于, 采用旋
转森林算法, 对包含有效特征子集S1的数据样本进行第二阶段特征选择, 获得建模后电力
系统运行 数据的特 征子集S2, 包括:
(1)设定a=[a1, a2 …, an]表示初筛特征子集S1中的n个样本, 用N ×n的矩阵A表示一个
有N条数据记录的训练样 本集; b=[b1, b2, …, bn]表示与训练样本集A对应的仿真运行状态
是否稳定的标签, 标签取值 为0/1; 用D1, D2 …, DL表示L个基分类器;
(2)构建一个旋转森林模型, 对所述训练样本集A进行集成学习, 步骤如下:
(2‑1)对训练样本集A进行75% 的有放回bagging重采样, 产生一个训练样本集A的样本
子集Ai, 样本 子集Ai中包 含k个观测样本;
(2‑2)利用下式, 求初始 矩阵Ai的k ×k阶相关系数矩阵Ri:
其中, Ri[m,n]为相关系数矩阵Ri第m行第n列的元素, Ai[m]为样本子集Ai矩阵的第m个
样本, Ai[n ]为样本子集Ai矩阵的第n个样本, Cov(Ai[m],Ai[n])样本子集Ai矩阵的第m个样
本和第n个样本的协方差, Var(Ai[m])样本子集Ai矩阵的第m个样本的方差, Var(Ai[n])样
本子集Ai矩阵的第n个样本的方差;
(2‑3)计算相关系数矩阵Ri的k个特征值λ, 按照特征值λ的大小对特征值进行排序, 得
到λ1≥λ2≥…≥λk, 将与各特征值相对应的一组长度为1且相互正交的特征向量, 记为α1,
α2,…, αk;
(2‑4)设定一个累计贡献率 μ, 利用下式, 得到排序后的特征值λ1≥λ2≥…≥λk中满足下
式的q个特 征值:
其中, q取最小正整数, 累计贡献率μ表示原始特征集合S对原有文件信息量的解释能
力, 将符合上式累计贡献率 μ的特征值记为主成分, 得到样 本子集Ai的q个主成分, 并得到与
q个特征值 λ1, λ2…λq相对应的特 征向量α1, α2,…, αq;
(2‑5)利用下式, 分别计算与所述q个主成分相对应的主成分矩阵Z中的各 元素Z1:
权 利 要 求 书 2/3 页
3
CN 114021425 A
3
专利 电力系统运行数据建模与特征选择方法、装置、电子设备和存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:46:02上传分享