(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111430131.X
(22)申请日 2021.11.29
(71)申请人 武汉数字化设计与制造创新中心有
限公司
地址 430000 湖北省武汉市东湖新 技术开
发区里沟南路8号武汉智能装备园研
发大楼5楼
(72)发明人 范亚军 陶波 龚泽宇 赵兴炜
(74)专利代理 机构 武汉知产时代知识产权代理
有限公司 42 238
代理人 王佩
(51)Int.Cl.
G06F 30/27(2020.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种基于密度峰值聚类的多模型时空建模
方法
(57)摘要
本发明提供一种基于密度峰值聚类的多模
型时空建模 方法, 方法包括: 利用DPC聚类算法将
时空变量划分为若干局部子空间, 其每个子空间
代表原始系统局部时空特征; 采用KL方法学习相
应的局部空间基函数; 通过ELM建立所有局部时
间系数模型, 并利用获得的局部空间基函数和相
应的时间系数模型来重构局部时空模型; 通过
LASSO回归计算相应子模型的权重, 对各局部时
空模型进行加权求和得到的集成模型来逼近原
系统。 本发明提供的有益效果是: 建立了一个数
据驱动的分布 参数系统热过程 温度预测模型, 能
够有效解决由于系统复杂导致难以精确建模问
题, 相比目前其它的方法, 本发明建立的模型除
了可以提高建模精度, 还更加适用于具有大范
围、 多工况的非线性分布参数系统。
权利要求书5页 说明书12页 附图6页
CN 114266191 A
2022.04.01
CN 114266191 A
1.一种基于密度峰值聚类的多模型时空建模方法, 其特 征在于:
S101: 利用离散控制系统收集分布参数系统热过程中的历史时空数据作为数据集; 所
述数据集包括系统输入变量
和温度分布数据
其中, N为样本数, m为输入
变量数, n 为输出变量数, R为实数集;
S102: 对所述数据集进行预处理, 各变量标准化处理后得到新的数据集均值为0, 方差
为1, 预处 理后的新的数据集输入变量 为u∈RN×m, 输出变量 为时空变量数据Y∈RN×n;
S103: 采用DPC聚类算法将预处理后的时空变量数据划分为多个不同的子空间{Y1(Si,
t),…,YK(Si,t)}, 其中, K为子空间个数, 所述子空间代表原系统的局部特征; 所述预处理后
的时空变量数据即为的预处理后的温度分布数据Y, 定义为{Y(Si,t)|i=1,...,L; t=1,
2,...,N; S∈Ω}, 其中, L为预处理后的时空变量数据在空间方向的数据点个数, S表 示时空
数据的位置, Si表示第i个时空数据点的空间位置, Ω为 坐标空间;
S104: 利用KL方法对DPC聚类算法划分的各个子空间时空数据学习相应的局部空间基
函数
S105: 将划分的各个子空间时空变量数据投影到通过步骤S104学习到所述局部空间基
函数上, 从而得到对应的子空间低维时序数据
S106: 使用ELM方法构建各个低维空间的未知时序动态特性, 即各个子空间输入变量uk
(t)与低维时序数据
之间的关系模型;
S107: 根据所述关系模型预测各个子空间低维时序数据输出
将所述各个子空间
的低维时序数据输出
与空间基函数
进行时空合 成得到的各个子空间局部时
空预测输出
S108: 利用LASS O回归计算相应局部时空模型的权重, 对各局部时空模型进行加权求和
得到的集成模型来逼近原系统, 即全局时空预测输出
S109: 将全局的时空预测输出进行反归一化处理, 得到温度预测值并对时空模型的性
能进行评价。
2.如权利要求1所述的一种基于密度峰值聚类的多模型时空建模方法, 其特征在于: 步
骤S102中, 所述标准化具体为:
其中, μu、 μY为原始数据的均值, σu、 σY
为原始数据的标准差 。
3.如权利要求1所述的一种基于密度峰值聚类的多模型时空建模方法, 其特征在于: 步
骤S103中采用DPC聚类算法将预处理后的时空变量数据划分为多个不同的子空间, 具体过
程为:
S201: 数据矩阵为{Y(Si,t)|i=1,...,L; t=1,2,...,N; S∈Ω}, 按初始化参数截断距
离dc表示为式(1):
dc=sda[round(n ×(n‑1)×p)] (1)权 利 要 求 书 1/5 页
2
CN 114266191 A
2式(1)中, n 为样本数, round表示四舍五入, p为调节参数, 在1%~ 2%之间取值;
S202: 计算数据矩阵中任意两个数据点之间的距离, 得到距离矩阵;
S203: 根据截断距 离dc, 通过式(2)或者式(3)中任 意一个计算式计算任 意数据点的局部
密度ρi:
式(2)、 (3)中, dij=dist(xi,xj)为数据点xi和xj之间的欧式距离;
S204: 通过式(4)计算任意数据点的距离 δi:
S205: 以ρi为横轴, 以δi为纵轴, 画出ρ ‑δ 决策图;
S206: 利用ρ ‑δ 决策图, 将ρi和 δi都相对较高的点标记为簇中心, 将ρi相对较低但是δi相
对较高的点标记为噪声点;
S207: 将剩余点进行分配, 分配时将每个剩余点分配到它最近邻且密度比其大的数据
点所在的簇;
S208: 返回多模型子空间{Y1(Si,t),…YK(Si,t)}, K为子空间个数。
4.如权利要求1所述的一种基于密度峰值聚类的多模型时空建模方法, 其特征在于: 步
骤S104中利用KL方法对DP C聚类算法划分的各个子空间时空数据学习相应的局部空间基函
数, 具体过程 为:
S301: 对于每一个子空间Yk(Si,t0,k=1, …,K解耦成空间基函数
和相应的时
间系数
的内积形式, 如式(5):
式(5)中,
为无限维空间基函数,
为无限维时间系数;
S302: 将式(5)截断简化 为如式(6):
式(6)中,
是Yk(S,t)的n阶近似项;
S303: 根据空间基函数
的正交性质, 采用KL方法设计最小化目标函数, 所述最
小化目标函数如式(7):权 利 要 求 书 2/5 页
3
CN 114266191 A
3
专利 一种基于密度峰值聚类的多模型时空建模方法
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 22:25:41上传分享