(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111656956.3
(22)申请日 2021.12.31
(71)申请人 广东泰迪智能科技股份有限公司
地址 510520 广东省广州市高新 技术产业
开发区开泰大道3 6号1栋212房
(72)发明人 张良均 徐圣兵 王宏刚 王振友
施兴 张敏 赵云龙 刘名军
张尚佳 周东平 杨惠
(74)专利代理 机构 南京普睿益思知识产权代理
事务所(普通 合伙) 32475
代理人 张丽丽
(51)Int.Cl.
G06F 16/27(2019.01)
G06F 16/23(2019.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种中央空调的缺失数据预处 理方法
(57)摘要
本发明涉及空调数据处理技术领域, 且公开
了一种中央空调的缺失数据预处理方法, 包括以
下步骤: S1: 数据采集, 在中央空调上安装的传感
器采集数据, 把得到的动态数据整合并建立中央
空调云端初始学习数据库; S2: 获取含缺失数据
学习样本; S3: 缺失值初 始化; S4: 无缺样本重构;
S5: 静态缺失数据填补; S6: 在云端建立动态无缺
训练数据集。 本发明既能适应边缘端的计算, 能
保证实时计算, 也能根据云端 服务满足大数据计
算量大的需求, 能利用共享特征, 填补单个缺失
特征数据, 适应中央空调数据存储量大的需求,
并提供云端完整无缺数据的计算工作, 为边缘端
的动态缺失数据填补提供 数据与知识 支撑。
权利要求书2页 说明书4页 附图2页
CN 114328742 A
2022.04.12
CN 114328742 A
1.一种中央空调的缺失数据预处 理方法, 其特 征在于, 包括以下步骤:
S1: 数据采集, 在中央空调上安装的传感器采集数据, 把得到的动态数据整合并建立中
央空调云端初始学习数据库;
S2: 获取含缺失数据学习样本, 按采集时间依序抽取样本量为l, 特征数为d的数据集X
=(xij)d×l, 其中xij表示第j(j =1,L,l)个样本的第i(i=1,L,d)个传感器采集特征数据, xj
表示X的j(j=1,L,l)列, xi.表示X的i(i =1,L,q)行。
缺失标记 矩阵: Γ=(γij)q×l, 其中
无缺标记 矩阵: Π=( πij)q×l, 其中
另外记
S3: 缺失值初始化, 对第i(i=1,L,d)个特征对应的所有缺失值从区间[αi, βi]随机选取
填补, 形成无缺数据X ′=(x′ij)d×l;
S4: 无缺样本重构, 输入xj(j=1,L,l), 利用自动编码器算法训练重构更新X ′=
(x′ij)d×l=Z′, 并保存训练所得权重参数θ=(W,b)和 θ ′=(W′,b′), 其中y=fθ(x)=Wx+b, z
=gθ′(y)=W′y+b′, 自动编码器学习的损失函数为 l2(x,z)=| |x‑z||2;
S5: 静态缺失数据 填补, 利用X=X ·Π+X′·Γ, 其中X·Π和X′·Γ表示矩阵的对应元
素相乘, 完成缺失数据的填补;
S6: 在云端建立动态无缺训练数据集, 按时间顺序获取样本x1,x2,L,xl,xl+1,xl+2,L,
xl+m, 组成多任务学习模型训练数据集, S6中包括数据识别模块, 数据识别模块识别时间数
据并进行排列;
S7: 多任务模型学习数据模型构造, 依据选(x1,x2,L,xl), (x2,x3,L,xl+1),…, (xm,xm+1,
L,xl+m‑1)作为特征输入数据, 对应标签数据为xl+1,xl+2,L,xl+m;
S8: 模型学习, 利用多任务前馈神经网络算法训练得对应特征的预测模型fi(X; θ )(i=
1,L,d);
S9: 获取对象x, 边 缘端获取有缺失特 征数据的对象x;
S10: 更新X, 用最近时间段内无缺数据更新X;
S11: 动态缺失数据填补, 利用fi(X; θ )(i=1,L,d)填补x的第i个缺失特征数据, 以动态
缺失数据的填补。
2.根据权利要求1所述的一种中央空调的缺失数据 预处理方法, 其特征在于, 所述S1中
传感器包括温度传感器、 湿度传感器、 压力传感器, 在采集数据时进行全天候采集。
3.根据权利要求1所述的一种中央空调的缺失数据 预处理方法, 其特征在于, 所述S4中
包括训练模块, 自动编码器算法在计算时首先输入x, 然后加权θ激活, 然后反向加权θ ’z=
gθ′(y), 然后训练θ和 θ ’, 最后输出θ和 θ ’和z。
4.根据权利要求1所述的一种中央空调的缺失数据 预处理方法, 其特征在于, 所述S5 中
的完成缺失数据填补后进行记录, 并进行统计。
5.根据权利要求1所述的一种中央空调的缺失数据 预处理方法, 其特征在于, 所述S8中权 利 要 求 书 1/2 页
2
CN 114328742 A
2包括模型学习模块, 多任务前馈神经网络算法在训练 时首先输入特征1、 特征L、 特征d, 特征
1、 特征L、 特征d分别进入输入层, 然后进入隐藏层, 然后进入输出层, 然后进入隐藏层和 输
出层时进行交 互, 最后输出 特征1、 特征L、 特征d。
6.根据权利要求5所述的一种中央空调的缺失数据 预处理方法, 其特征在于, 所述S9中
包括数据获取模块, 数据获取模块与模型 学习模块相连接 。权 利 要 求 书 2/2 页
3
CN 114328742 A
3
专利 一种中央空调的缺失数据预处理方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:46:37上传分享