(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211046944.3
(22)申请日 2022.08.30
(71)申请人 南京信易达 计算技术有限公司
地址 210000 江苏省南京市中国(江苏)自
由贸易试验区南 京片区研创园团结路
99号孵鹰大厦1947室
(72)发明人 王玲
(74)专利代理 机构 北京卓岚智财知识产权代理
有限公司 1 1624
专利代理师 蒋真
(51)Int.Cl.
G06F 9/50(2006.01)
G06F 17/11(2006.01)
G06F 17/18(2006.01)
G06N 3/06(2006.01)
(54)发明名称
全栈式高性能计算集群管理与数据分析系
统及方法
(57)摘要
本发明公开了全栈式高性能计算集群管理
与数据分析系统; 包括基础层, 所述基础层与数
据接入层通 讯连接, 所述数据接入层上通讯连接
有集群管 理层, 所述集群管 理层与云服务器通讯
连接; 全栈式高性能计算集群管 理与数据分析系
统的方法, 包括有以下步骤: S1、 基础层实现对数
据信息进行获取和传输; S2、 数据接入层实现对
数据信息进行传输; S3、 集群管理层中实现对数
据信息进行计算处理; S4、 云服务器层实现对数
据进行存储; 本发明通过集群管 理层实现对节点
进行管理控制, 并且边缘云计算通过数据分析模
块实现对数据信息进行计算处理, 提高系统的计
算处理能力, 减少数据处 理的负载能力。
权利要求书3页 说明书7页 附图1页
CN 115454624 A
2022.12.09
CN 115454624 A
1.全栈式高性能计算集群管理与数据分析系统, 包括基础层, 其特征在于: 所述基础层
与数据接入层通讯连接, 所述数据接入层上通讯连接有集群管理层, 所述集群管理层与云
服务器通讯连接, 所述基础层用于实现对数据信息采集和输入, 所述数据接入层用于实现
对数据信息进 行传输, 所述集群管理层用于实现对节点进 行管理和对数据信息进 行计算处
理, 所述云服 务器层用于实现对数据信息进行存 储和管理;
所述集群管理层中包括有父站节点设备, 所述父站节点设备中包括有若干子站节点设
备, 所述父站节点设备通过父子节点集群通知相互与若干所述子站节点设备通讯连接, 所
述集群管理层中还设有若干边缘云计算, 若干所述边缘云计算分别与若干所述子站节点设
备通讯连接, 若干所述边缘云计算用于实现对若干所述子站节点设备的数据信息进行计算
处理, 所述集群管理层中还包括有数据分析模块, 所述数据分析模块中包括有数据管理和
数据模型, 所述数据管 理用于实现对 数据信息进 行分割传输、 清洗、 运算、 分析和可视化, 所
述数据模型用于实现对数据信息进行机理建模、 大数据建模和知识图谱的生成, 所述数据
分析模块是处于所述边缘云计算中的, 实现对数据信息进行处理, 所述清洗用于实现对数
据进行错误识别, 包括检查数据一致性, 处理无效值和缺 失值, 所述运算用于实现对数据信
息进行计算处理, 提高数据信息的明朗性, 所述分析是通过统计分析方法对收集来的大量
数据进行分析, 将它们加以汇总和理解并消 化, 所述可视化是用于实现对数据信息进行显
示, 便于进 行观看, 所述数据模 型是通过所述机理建模、 所述大数据建模和所述知识图谱实
现对数据信息进行建模计算处理, 并且生成可信图谱, 所述父子节点集群通知通过在
zookeeper服务器端的znode叫/APP1SERV ERS, 所述父站节点设备设置成APP1SERVERS, 所述
子站节点设备在连接创建的时候, 在所述父站节点设备上创建/APP1SERVERS/SERVER1报
文, 且在所述子站节点设备断开的时候, 其对应的节点就会消失, 然后集群中的所述父站节
点设备将断开的所述子站节点设备发送给其他的所述子站节点设备, 然后取得最新节点报
文, 所述子站节点设备在 进行报文上传的时候, 采用的是所述子站节 点设备的IP地址, 防止
报文重复。
2.根据权利要求1所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述基础层中包括有数据采集设备和数据输入设备, 所述数据采集设备用于实现对设备的数
据信息进行实时采集, 所述数据输入设备用于实现对数据信息进行输入, 或者是将大数据
信息进行输入。
3.根据权利要求2所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述数据接入层中包括有网络基站和接口模组, 所述网络基站用于实现建立数据传输的网络
通道, 所述接口模组中包括有数据传输接口和外网连接接口, 所述数据传输接口用于实现
对所述数据采集设备和所述数据输入设备进 行连接, 所述外网连接接口用于实现对外网数
据或者进行 连接传输 。
4.根据权利要求3所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述网络基站中包括有 数据服务器、 数据网关、 数据防火墙, 所述数据服务器用于实现对数据
信息进行连接传输、 响应服务请求和数据存储, 所述数据网关用于实现对所述基础层和所
述集群管理层 进行网络互联, 使用在不同的通信协 议、 数据格式或语言, 甚至体系结构 完全
不同的两种系统之 间之间进行连接, 所述数据防火墙用于保护数据信息在传输时候的安全
性。权 利 要 求 书 1/3 页
2
CN 115454624 A
25.根据权利要求1所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述云服务器中包括有云数据 处理和云服务接口, 所述云数据 处理中包括有数据信息存储、
数据信息备份和标签分类, 所述云服 务接口中包括有弹性网卡和安全防护。
6.根据权利要求5所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述数据信息存储和所述数据信息备份用于实现对数据型进 行存储, 以及在 存储之前实现对
数据信息进行备份, 且采用快照方式进行备份处理, 且快照备份文件与源文件进行比较后
进行存储, 所述标签 分类用于数据信息在传输过来的时候, 携带地址IP 便于进行识别分别,
所述弹性网卡中包括有私有IP和EIP, 所述 安全防护采用的是防火墙。
7.根据权利要求1所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述数据模型中采用的是回归模型和预测模型, 所述回归模型和所述预测模 型分别至少涉及
到多元回归分析和BP神经网络, 所述回归模型和所述预测模 型用于实现对数据信息进行预
测计算。
8.根据权利要求7所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述多元回归分析的算法如下:
设因变量为Y, 影响因变量的k个自变量分别为X1, X2, ...Xn, 假设每一个自变量对因变
量Y的影响都是线性的, 也就是说, 在其他自变量不变的情 况下, Y的均值随着自变量Xi的变
化均匀变化, 公式如下:
Y=β0+β1X1+β2X2+…+βkXk+ ε,
公式称为总体回归 模型, 把β0、 β1、 β2、…βk称为回归参数,
对上述公式进行两边取期望得公式为:
E(Y|X1,X2,…Xk)=β0+β1X1+β2X2+…βkXk;
式子称为总体回归方程, E(Y|X1,X2,…Xk)表示在给定自变量Xi的条件下观察值Y的条件
均值, 总体参数β0、 β1、 β2…βk往往是未知的, 我们需要根据样本观察值给出总体参数的相应
的估计值
此时:
式子称为样本回归方程,
也就是E(Y|X1,X2,…Xk)的点估计值。
9.根据权利要求7所述的全栈式高性 能计算集群管理与 数据分析系统, 其特征在于: 所
述BP神经网络的算法如下:
设输入的神经元为X1, X2, ...Xj, 输入常为对系统模型关键影响的自变量, W1、 W2、…、 Wj
为连接权值调节各个输入量的占重比, 选取最便捷的线性加权求和可得neti神经元净输
入, 公式如下:
θi表示该神经元的阈值, 将Netin与 θj进行比较, 然后通过激活函数处理以产生神经元的
输出,
yj=f(Netin‑θj),
简化, 设第一个输入永远值 为θ, 权值 为‑1, 则得到公式:权 利 要 求 书 2/3 页
3
CN 115454624 A
3
专利 全栈式高性能计算集群管理与数据分析系统及方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 13:12:02上传分享