专利一种基于密度峰值聚类的多模型时空建模方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111430131.X (22)申请日 2021.11.29 (71)申请人武汉数字化设计与制造创新中心有限公司地址 430000 湖北省武汉市东湖新技术开发区里沟南路8号武汉智能装备园研发大楼5楼 (72)发明人范亚军　陶波　龚泽宇　赵兴炜　 (74)专利代理机构武汉知产时代知识产权代理有限公司 42 238 代理人王佩 (51)Int.Cl. G06F 30/27(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于密度峰值聚类的多模型时空建模方法 (57)摘要本发明提供一种基于密度峰值聚类的多模型时空建模方法，方法包括：利用DPC聚类算法将时空变量划分为若干局部子空间，其每个子空间代表原始系统局部时空特征；采用KL方法学习相应的局部空间基函数；通过ELM建立所有局部时间系数模型，并利用获得的局部空间基函数和相应的时间系数模型来重构局部时空模型；通过 LASSO回归计算相应子模型的权重，对各局部时空模型进行加权求和得到的集成模型来逼近原系统。本发明提供的有益效果是：建立了一个数据驱动的分布参数系统热过程温度预测模型，能够有效解决由于系统复杂导致难以精确建模问题，相比目前其它的方法，本发明建立的模型除了可以提高建模精度，还更加适用于具有大范围、多工况的非线性分布参数系统。权利要求书5页说明书12页附图6页 CN 114266191 A 2022.04.01 CN 114266191 A 1.一种基于密度峰值聚类的多模型时空建模方法，其特征在于： S101：利用离散控制系统收集分布参数系统热过程中的历史时空数据作为数据集；所述数据集包括系统输入变量和温度分布数据其中， N为样本数， m为输入变量数， n 为输出变量数， R为实数集； S102：对所述数据集进行预处理，各变量标准化处理后得到新的数据集均值为0，方差为1，预处理后的新的数据集输入变量为u∈RN×m，输出变量为时空变量数据Y∈RN×n； S103：采用DPC聚类算法将预处理后的时空变量数据划分为多个不同的子空间{Y1(Si, t),…,YK(Si,t)}，其中， K为子空间个数，所述子空间代表原系统的局部特征；所述预处理后的时空变量数据即为的预处理后的温度分布数据Y，定义为{Y(Si,t)|i＝1,...,L； t＝1, 2,...,N； S∈Ω}，其中， L为预处理后的时空变量数据在空间方向的数据点个数， S表示时空数据的位置， Si表示第i个时空数据点的空间位置， Ω为坐标空间； S104：利用KL方法对DPC聚类算法划分的各个子空间时空数据学习相应的局部空间基函数 S105：将划分的各个子空间时空变量数据投影到通过步骤S104学习到所述局部空间基函数上，从而得到对应的子空间低维时序数据 S106：使用ELM方法构建各个低维空间的未知时序动态特性，即各个子空间输入变量uk (t)与低维时序数据之间的关系模型； S107：根据所述关系模型预测各个子空间低维时序数据输出将所述各个子空间的低维时序数据输出与空间基函数进行时空合成得到的各个子空间局部时空预测输出 S108：利用LASS O回归计算相应局部时空模型的权重，对各局部时空模型进行加权求和得到的集成模型来逼近原系统，即全局时空预测输出 S109：将全局的时空预测输出进行反归一化处理，得到温度预测值并对时空模型的性能进行评价。 2.如权利要求1所述的一种基于密度峰值聚类的多模型时空建模方法，其特征在于：步骤S102中，所述标准化具体为：其中， μu、 μY为原始数据的均值， σu、 σY 为原始数据的标准差。 3.如权利要求1所述的一种基于密度峰值聚类的多模型时空建模方法，其特征在于：步骤S103中采用DPC聚类算法将预处理后的时空变量数据划分为多个不同的子空间，具体过程为： S201：数据矩阵为{Y(Si,t)|i＝1,...,L； t＝1,2,...,N； S∈Ω}，按初始化参数截断距离dc表示为式(1)： dc＝sda[round(n ×(n‑1)×p)] (1)权　利　要　求　书 1/5 页 2 CN 114266191 A 2式(1)中， n 为样本数， round表示四舍五入， p为调节参数，在1％～ 2％之间取值； S202：计算数据矩阵中任意两个数据点之间的距离，得到距离矩阵； S203：根据截断距离dc，通过式(2)或者式(3)中任意一个计算式计算任意数据点的局部密度ρi：式(2)、 (3)中， dij＝dist(xi,xj)为数据点xi和xj之间的欧式距离； S204：通过式(4)计算任意数据点的距离 δi： S205：以ρi为横轴，以δi为纵轴，画出ρ ‑δ 决策图； S206：利用ρ ‑δ 决策图，将ρi和 δi都相对较高的点标记为簇中心，将ρi相对较低但是δi相对较高的点标记为噪声点； S207：将剩余点进行分配，分配时将每个剩余点分配到它最近邻且密度比其大的数据点所在的簇； S208：返回多模型子空间{Y1(Si,t),…YK(Si,t)}， K为子空间个数。 4.如权利要求1所述的一种基于密度峰值聚类的多模型时空建模方法，其特征在于：步骤S104中利用KL方法对DP C聚类算法划分的各个子空间时空数据学习相应的局部空间基函数，具体过程为： S301：对于每一个子空间Yk(Si,t0,k＝1, …,K解耦成空间基函数和相应的时间系数的内积形式，如式(5)：式(5)中，为无限维空间基函数，为无限维时间系数； S302：将式(5)截断简化为如式(6)：式(6)中，是Yk(S,t)的n阶近似项； S303：根据空间基函数的正交性质，采用KL方法设计最小化目标函数，所述最小化目标函数如式(7)：权　利　要　求　书 2/5 页 3 CN 114266191 A 3

专利 一种基于密度峰值聚类的多模型时空建模方法

专利一种基于密度峰值聚类的多模型时空建模方法