专利一种多数据模型融合的光伏发电功率预测方法和系统

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111004446.8 (22)申请日 2021.08.3 0 (71)申请人浙江工业大学地址 310014 浙江省杭州市拱墅区潮王路 18号 (72)发明人陈博　傅金波　沈怡俊　王颖　黄大建　刘涛　张文安　 (74)专利代理机构杭州天正专利事务所有限公司 33201 代理人王兵 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06N 20/00(2019.01) G06F 30/27(2020.01) (54)发明名称一种多数据模型融合的光伏发电功率预测方法和系统 (57)摘要一种多数据模型融合的光伏发电功率预测方法，包括：步骤1：数据预处理，采用局部离群因子(LOF)算法检测、剔除异常值；采用多层感知机回归算法填补缺失数据；步骤2：特征选择，通过特征选择从多个特征中选出具有代表性的特征，减少不相关的特征信息；步骤3：训练子模型，将数据分为训练集、验证集与测试集，在训练集中训练支持向量机回归、多元线性回归、贝叶斯岭回归模型，并在验证集对训练得到的模型进行验证，分别选出最佳的模型作为子模型；步骤4：多数据模型融合预测，用训练得到的各最佳子模型对测试集中数据进行预测，并用Q ‑learning算法融合各子模型的预测结果。本发明还包括实施一种多数据模型融合的光伏发电功率预测方法的系统。权利要求书3页说明书8页附图3页 CN 113919545 A 2022.01.11 CN 113919545 A 1.一种多数据模型融合的光伏发电功率预测方法，包括以下步骤：步骤1：数据预处理：步骤1‑1：采用局部离群因子(LOF)算法检测、剔除异常值；通过计算每个功率点的离群因子来评估其离群的程度，首先计算每个功率点与其他功率点的欧氏距离，设k∈N+，功率点为xi，功率点xi与距离其最近的第k个点之间的距离记作dk(xi)，则功率点xi到与其k距离邻域内所有功率点的可达距离为： dr(xi,xio)＝max{dk(xio),d(xi,xio)} (1) 式中，表示xi的k距离邻域内的一个功率点；表示xi与间的欧氏距离；再计算每个功率点的局部可达密度，数学公式表述为：最后计算功率点的离群因子，数学公式表述为：若功率点的局部离群因子接近1，说明功率点与其邻域差异较小，视为正常点；若功率点的局部离群因子远大于1，说明功率点与其邻域差异较大，视为离群点；通过该算法检测并剔除光伏发电功率中的异常值；步骤1‑2：采用多层感知机回归算法填补缺失数据；将光伏发电功率未缺失与缺失的数据分别作为训练集与测试集，采用多层感知机回归算法在训练集中进行训练，然后用训练得到的模型对测试集进行预测，最后用预测结果填补缺失数据；多层感知机模型由输入层、隐藏层与输出层构成，从输入层到隐藏层，再到输出层的每个节点的数学公式表述为： xij＝g(WiXi‑1+bi‑1) (4) 式中xij第i层j第个神经元的值， Wi表示第i‑1层到第i层中第j个神经元的权值向量； Xi‑1表示第i‑1层全部神经元值的向量； bi‑1表示第i‑1层的偏置项； g表示激活函数，采用 ReLU函数作为激活函数；多层感知机回归算法的损失函数，数学公式表述为：式中，表示多层感知机回归算法的输出值； yi表示真实值，多层感知机回归算法使损失函数值收敛时停止计算；步骤2：特征选择；通过特征选择从多个特征中选出具有代表性的特征，减少不相关的特征信息，可以降低模型的学习的难度，提高训练的效率；本发明采用距离相关系数法，判断各特征与发电功率的相关性，选取与发电功率相关性大的特征；将瞬时辐射、散射辐射、法直辐射、气温、气压、湿度和背板温度作为特征，光伏发电功率作为标签，计算各特征与标签的皮尔森相关系数与距离相关系数，其数学公式表述为：权　利　要　求　书 1/3 页 2 CN 113919545 A 2式中， x表示某特征， y表示发电功率， v2(x,x)表示特征距离方； v2(y,y)表示发电功率距离方差； v2(x,y)表示特征与发电功率距离协方差；通过计算得到各特征与光伏发电功率的之间的距离相关系数D(x,y)∈[0,1]，其越靠近1，表示所选特征与标签与发电功率相关性越强；越靠近0，则表示所选的特征与发电功率相关性越弱；步骤3：训练子模型；将数据分为训练集、验证集与测试集，在训练集中训练支持向量机回归(SVR)、多元线性回归(MLR)、贝叶斯岭回归(B RR)模型，并在验证集对训练得到的模型进行验证，分别选出最佳的模型作为子模型；支持向量机回归(SVR)是一种基于风险最小化准则，用来解决回归拟合问题的机器学习方法，该算法的原理是在高维空间中进行线性回归，找到一个最优超平面，使得样本点离该超平面的总偏差最小，其数学公式表述为：式中， ω表示权值向量，表示核函数， b表示偏置；多元线性回归(MLR)通过建立因变量与其多个自变量的之间的数学模型，进行分析，含个自变量的多元线性回归模型数学公式表述为： y＝β0+β1x1+...+βmxm+ ε (8) 式中， β0, β1,... βm表示回归系数； y表示因变量； x0,x1,...xm表示自变量； ε表示随机误差；贝叶斯岭回归(BRR)是一种基于贝叶斯理论的回归算法，其在估计过程中引入L2正则项，因此称为贝叶斯岭回归；贝叶斯线性回归的数学公式表述为：式中， m表示样本空间的维度； ω表示参数向量； x表示输入向量；表示x的非线性函数；步骤4：多数据模型融合预测；用训练得到的各最佳子模型对测试集中数据进行预测，并用Q‑learning算法融合各子模型的预测结果；融合过程可表示为一个马尔科夫决策过程 {S,A,R}， S表示状态集合， A表示动作集合， R表示奖励函数，其中状态与动作均为一组权值 ω1,ω2,...,ωn，记t时刻状态ωs1,ωs2,...,ωsn为记t时刻动作ωa1,ωa2,...,ωan为奖励函数为费希尔信息，其能够反映参数估计的准确度，费希尔信息越大，表示参数估计的准确度越高，费希尔信息的计算过程如下；首先获得模型预测值的数学表达式： Mi＝M0+ΔMi (10)权　利　要　求　书 2/3 页 3 CN 113919545 A 3

专利 一种多数据模型融合的光伏发电功率预测方法和系统

专利一种多数据模型融合的光伏发电功率预测方法和系统