(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111004446.8
(22)申请日 2021.08.3 0
(71)申请人 浙江工业大 学
地址 310014 浙江省杭州市拱 墅区潮王路
18号
(72)发明人 陈博 傅金波 沈怡俊 王颖
黄大建 刘涛 张文安
(74)专利代理 机构 杭州天正专利事务所有限公
司 33201
代理人 王兵
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/06(2012.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
G06N 20/00(2019.01)
G06F 30/27(2020.01)
(54)发明名称
一种多数据模型融合的光伏发电功率预测
方法和系统
(57)摘要
一种多数据模型融合的光伏发电功率预测
方法, 包括: 步骤1: 数据预处理, 采用局部离群因
子(LOF)算法检测、 剔除异常值; 采用多层感知机
回归算法填补缺失数据; 步骤2: 特征选择, 通过
特征选择从多个特征中选出具有代表 性的特征,
减少不相关的特征信息; 步骤3: 训练子模型, 将
数据分为训练集、 验证集与测试集, 在训练集中
训练支持向量机回归、 多元线性回归、 贝叶斯岭
回归模型, 并在验证集对训练得到的模 型进行验
证, 分别选出最佳的模型作为子模型; 步骤4: 多
数据模型融合预测, 用训练得到的各最佳子模型
对测试集中数据进行预测, 并用Q ‑learning算法
融合各子模 型的预测结果。 本发 明还包括实施一
种多数据模型融合的光伏发电功率预测方法的
系统。
权利要求书3页 说明书8页 附图3页
CN 113919545 A
2022.01.11
CN 113919545 A
1.一种多数据模型融合的光伏发电功率预测方法, 包括以下步骤:
步骤1: 数据预处 理:
步骤1‑1: 采用局部离群因子(LOF)算法检测、 剔除异常值; 通过计算每个功率点的离群
因子来评估其离群的程度, 首先计算每个功率点与其他功率点的欧氏距离, 设k∈N+, 功率
点为xi, 功率点xi与距离其最近的第k个点
之间的距离记作dk(xi), 则功率点xi到与其k距
离邻域内所有功率 点的可达距离为:
dr(xi,xio)=max{dk(xio),d(xi,xio)} (1)
式中,
表示xi的k距离邻域内的一个功率 点;
表示xi与
间的欧氏距离;
再计算每 个功率点的局部可达密度, 数 学公式表述 为:
最后计算功率 点的离群因子, 数 学公式表述 为:
若功率点的局部离群因子接近1, 说明功率点与其邻域差异较小, 视为正常点; 若功率
点的局部离群因子远大于1, 说明功率点与其邻域差异较大, 视为离群点; 通过该算法检测
并剔除光伏发电功率中的异常值;
步骤1‑2: 采用多层感知机回归算法填补缺失数据; 将光伏发电功率未缺失与缺失的数
据分别作为训练集与测试集, 采用多层感知机回归算法在训练集中进行训练, 然后用训练
得到的模 型对测试集进 行预测, 最后用预测结果填补缺 失数据; 多层感知机模型由输入层、
隐藏层与输出层构成, 从输入层到隐藏层, 再到 输出层的每 个节点的数 学公式表述 为:
xij=g(WiXi‑1+bi‑1) (4)
式中xij第i层j第个神经元的值, Wi表示第i‑1层到第i层中第j个神经元的权值向量;
Xi‑1表示第i‑1层全部神经元值的向量; bi‑1表示第i‑1层的偏置项; g表示激活函数, 采用
ReLU函数作为激活函数;
多层感知机回归算法的损失函数, 数 学公式表述 为:
式中,
表示多层感知机回归算法的输出值; yi表示真实值, 多层感知机回归算法使损
失函数值收敛时停止计算;
步骤2: 特征选择; 通过特征选择从多个特征中选出具有代表性的特征, 减少不相关的
特征信息, 可以降低模型的学习的难度, 提高训练的效率; 本发明采用距离相关系 数法, 判
断各特征与发电功率的相关性, 选取与发电功率相关性大 的特征; 将瞬时辐 射、 散射辐 射、
法直辐射、 气温、 气 压、 湿度和背板温度作为特征, 光伏发电功 率作为标签, 计算各特征与标
签的皮尔森相关系数与距离相关系数, 其数 学公式表述 为:权 利 要 求 书 1/3 页
2
CN 113919545 A
2式中, x表示某 特征, y表示发电功率, v2(x,x)表示特征距离方; v2(y,y)表示发电功率距
离方差; v2(x,y)表示特 征与发电功率距离协方差;
通过计算得到各特征与光伏发电功率的之间的距离相关系数D(x,y)∈[0,1], 其越靠
近1, 表示所选特征与标签与发电功 率相关性越强; 越靠近0, 则表 示所选的特征与发电功 率
相关性越弱;
步骤3: 训练子模型; 将数据分为训练集、 验证集与测试集, 在训练集中训练支持向量机
回归(SVR)、 多元线性回归(MLR)、 贝叶斯岭回归(B RR)模型, 并在验证集对训练得到的模型
进行验证, 分别选出最佳的模型作为子模型;
支持向量机回归(SVR)是一种基于风 险最小化准则, 用来解决回归拟合问题的机器学
习方法, 该算法的原理是在高维空间中进 行线性回归, 找到一个最优超平面, 使得样本点离
该超平面的总偏差最小, 其数 学公式表述 为:
式中, ω表示权值向量,
表示核函数, b表示偏置;
多元线性回归(MLR)通过建立因变量与其多个自变量的之间的数学模型, 进行分析, 含
个自变量的多元线性回归 模型数学公式表述 为:
y=β0+β1x1+...+βmxm+ ε (8)
式中, β0, β1,... βm表示回归系 数; y表示因变量; x0,x1,...xm表示自变量; ε表示 随机误
差;
贝叶斯岭回归(BRR)是一种基于贝叶斯理论的回归算法, 其在估计过程中引 入L2正则
项, 因此称为贝叶斯岭回归; 贝叶斯线性回归的数 学公式表述 为:
式中, m表示样 本空间的维度; ω表示参数向量; x表示输入向量;
表示x的非线性函
数;
步骤4: 多数据模型融合预测; 用训练得到的各最佳子模型对测试集中数据进行预测,
并用Q‑learning算法融合各子模 型的预测结果; 融合过程可表 示为一个马尔科夫决策过程
{S,A,R}, S表示状态集合, A表示动作集合, R表示奖励函数, 其中状态与动作均为一组权值
ω1,ω2,...,ωn, 记t时刻状态ωs1,ωs2,...,ωsn为
记t时刻动作ωa1,ωa2,...,ωan为
奖励函数为费希尔信息, 其 能够反映参数估计的准确度, 费希尔信息越大, 表示参数估
计的准确度越高, 费希尔信息的计算过程如下;
首先获得模型 预测值的数 学表达式:
Mi=M0+ΔMi (10)权 利 要 求 书 2/3 页
3
CN 113919545 A
3
专利 一种多数据模型融合的光伏发电功率预测方法和系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:54:44上传分享