全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111004446.8 (22)申请日 2021.08.3 0 (71)申请人 浙江工业大 学 地址 310014 浙江省杭州市拱 墅区潮王路 18号 (72)发明人 陈博 傅金波 沈怡俊 王颖  黄大建 刘涛 张文安  (74)专利代理 机构 杭州天正专利事务所有限公 司 33201 代理人 王兵 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06N 20/00(2019.01) G06F 30/27(2020.01) (54)发明名称 一种多数据模型融合的光伏发电功率预测 方法和系统 (57)摘要 一种多数据模型融合的光伏发电功率预测 方法, 包括: 步骤1: 数据预处理, 采用局部离群因 子(LOF)算法检测、 剔除异常值; 采用多层感知机 回归算法填补缺失数据; 步骤2: 特征选择, 通过 特征选择从多个特征中选出具有代表 性的特征, 减少不相关的特征信息; 步骤3: 训练子模型, 将 数据分为训练集、 验证集与测试集, 在训练集中 训练支持向量机回归、 多元线性回归、 贝叶斯岭 回归模型, 并在验证集对训练得到的模 型进行验 证, 分别选出最佳的模型作为子模型; 步骤4: 多 数据模型融合预测, 用训练得到的各最佳子模型 对测试集中数据进行预测, 并用Q ‑learning算法 融合各子模 型的预测结果。 本发 明还包括实施一 种多数据模型融合的光伏发电功率预测方法的 系统。 权利要求书3页 说明书8页 附图3页 CN 113919545 A 2022.01.11 CN 113919545 A 1.一种多数据模型融合的光伏发电功率预测方法, 包括以下步骤: 步骤1: 数据预处 理: 步骤1‑1: 采用局部离群因子(LOF)算法检测、 剔除异常值; 通过计算每个功率点的离群 因子来评估其离群的程度, 首先计算每个功率点与其他功率点的欧氏距离, 设k∈N+, 功率 点为xi, 功率点xi与距离其最近的第k个点 之间的距离记作dk(xi), 则功率点xi到与其k距 离邻域内所有功率 点的可达距离为: dr(xi,xio)=max{dk(xio),d(xi,xio)}    (1) 式中, 表示xi的k距离邻域内的一个功率 点; 表示xi与 间的欧氏距离; 再计算每 个功率点的局部可达密度, 数 学公式表述 为: 最后计算功率 点的离群因子, 数 学公式表述 为: 若功率点的局部离群因子接近1, 说明功率点与其邻域差异较小, 视为正常点; 若功率 点的局部离群因子远大于1, 说明功率点与其邻域差异较大, 视为离群点; 通过该算法检测 并剔除光伏发电功率中的异常值; 步骤1‑2: 采用多层感知机回归算法填补缺失数据; 将光伏发电功率未缺失与缺失的数 据分别作为训练集与测试集, 采用多层感知机回归算法在训练集中进行训练, 然后用训练 得到的模 型对测试集进 行预测, 最后用预测结果填补缺 失数据; 多层感知机模型由输入层、 隐藏层与输出层构成, 从输入层到隐藏层, 再到 输出层的每 个节点的数 学公式表述 为: xij=g(WiXi‑1+bi‑1)    (4) 式中xij第i层j第个神经元的值, Wi表示第i‑1层到第i层中第j个神经元的权值向量; Xi‑1表示第i‑1层全部神经元值的向量; bi‑1表示第i‑1层的偏置项; g表示激活函数, 采用 ReLU函数作为激活函数; 多层感知机回归算法的损失函数, 数 学公式表述 为: 式中, 表示多层感知机回归算法的输出值; yi表示真实值, 多层感知机回归算法使损 失函数值收敛时停止计算; 步骤2: 特征选择; 通过特征选择从多个特征中选出具有代表性的特征, 减少不相关的 特征信息, 可以降低模型的学习的难度, 提高训练的效率; 本发明采用距离相关系 数法, 判 断各特征与发电功率的相关性, 选取与发电功率相关性大 的特征; 将瞬时辐 射、 散射辐 射、 法直辐射、 气温、 气 压、 湿度和背板温度作为特征, 光伏发电功 率作为标签, 计算各特征与标 签的皮尔森相关系数与距离相关系数, 其数 学公式表述 为:权 利 要 求 书 1/3 页 2 CN 113919545 A 2式中, x表示某 特征, y表示发电功率, v2(x,x)表示特征距离方; v2(y,y)表示发电功率距 离方差; v2(x,y)表示特 征与发电功率距离协方差; 通过计算得到各特征与光伏发电功率的之间的距离相关系数D(x,y)∈[0,1], 其越靠 近1, 表示所选特征与标签与发电功 率相关性越强; 越靠近0, 则表 示所选的特征与发电功 率 相关性越弱; 步骤3: 训练子模型; 将数据分为训练集、 验证集与测试集, 在训练集中训练支持向量机 回归(SVR)、 多元线性回归(MLR)、 贝叶斯岭回归(B RR)模型, 并在验证集对训练得到的模型 进行验证, 分别选出最佳的模型作为子模型; 支持向量机回归(SVR)是一种基于风 险最小化准则, 用来解决回归拟合问题的机器学 习方法, 该算法的原理是在高维空间中进 行线性回归, 找到一个最优超平面, 使得样本点离 该超平面的总偏差最小, 其数 学公式表述 为: 式中, ω表示权值向量, 表示核函数, b表示偏置; 多元线性回归(MLR)通过建立因变量与其多个自变量的之间的数学模型, 进行分析, 含 个自变量的多元线性回归 模型数学公式表述 为: y=β0+β1x1+...+βmxm+ ε    (8) 式中, β0, β1,... βm表示回归系 数; y表示因变量; x0,x1,...xm表示自变量; ε表示 随机误 差; 贝叶斯岭回归(BRR)是一种基于贝叶斯理论的回归算法, 其在估计过程中引 入L2正则 项, 因此称为贝叶斯岭回归; 贝叶斯线性回归的数 学公式表述 为: 式中, m表示样 本空间的维度; ω表示参数向量; x表示输入向量; 表示x的非线性函 数; 步骤4: 多数据模型融合预测; 用训练得到的各最佳子模型对测试集中数据进行预测, 并用Q‑learning算法融合各子模 型的预测结果; 融合过程可表 示为一个马尔科夫决策过程 {S,A,R}, S表示状态集合, A表示动作集合, R表示奖励函数, 其中状态与动作均为一组权值 ω1,ω2,...,ωn, 记t时刻状态ωs1,ωs2,...,ωsn为 记t时刻动作ωa1,ωa2,...,ωan为 奖励函数为费希尔信息, 其 能够反映参数估计的准确度, 费希尔信息越大, 表示参数估 计的准确度越高, 费希尔信息的计算过程如下; 首先获得模型 预测值的数 学表达式: Mi=M0+ΔMi    (10)权 利 要 求 书 2/3 页 3 CN 113919545 A 3

.PDF文档 专利 一种多数据模型融合的光伏发电功率预测方法和系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多数据模型融合的光伏发电功率预测方法和系统 第 1 页 专利 一种多数据模型融合的光伏发电功率预测方法和系统 第 2 页 专利 一种多数据模型融合的光伏发电功率预测方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:54:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。