全网唯一标准王
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210958323.6 (22)申请日 2022.08.11 (65)同一申请的已公布的文献号 申请公布号 CN 115062008 A (43)申请公布日 2022.09.16 (73)专利权人 华能能源交通产业控股有限公司 地址 100031 北京市西城区复兴门南大街 丙二号天银大厦C段西区4- 6层 (72)发明人 马晓燕 王强 陈竞翔 朱亮  徐磊  (74)专利代理 机构 北京华创智道知识产权代理 事务所(普通 合伙) 11888 专利代理师 彭随丽 (51)Int.Cl. G06F 16/215(2019.01)G06F 16/245(2019.01) G06Q 10/08(2012.01) (56)对比文件 CN 106202240 A,2016.12.07 CN 105279287 A,2016.01.27 US 2018089 233 A1,2018.0 3.29 审查员 谢小诗 (54)发明名称 一种物资数据清洗方法、 装置、 电子设备及 存储介质 (57)摘要 本发明涉及物资数据技术领域, 具体而言, 涉及一种物资数据清洗方法、 装置、 电子设备及 存储介质。 物资数据清洗方法包括: 获取多条物 资原始数据; 将物资原始数据进行筛选处理, 获 得含有物资原始数据的多个第一处理数据组; 基 于匹配规则, 将第一处理数据组 内的多个物资的 已记录属性值设置成同一属性值, 获得多个第二 处理数据组; 基于匹配规则, 将多个第二处理数 据组之间的多个物资的已记录属性值设置成同 一属性值, 获得第三处理数据组; 将第三处理数 据组进行归一处理并设置物料编码 。 这样就解决 了现有物资管理系统中物资编码一物多码的问 题。 本发明还提供一种物资数据清洗装置、 一种 电子设备和一种计算机可读存 储介质。 权利要求书3页 说明书10页 附图5页 CN 115062008 B 2022.11.22 CN 115062008 B 1.一种物资数据清洗方法, 其特 征在于, 所述物资数据清洗方法包括: 步骤S11, 获取多条物资原始数据, 其中, 每条所述物资原始数据包括一种物资的已记 录属性值; 步骤S12, 将所述物资原始数据进行筛选处理, 获得含有所述物资原始数据的多个第一 处理数据组; 其中, 每一个所述第一处理数据组含有所述已记录属 性值属于同一范围或相 同的多个所述物资的所述物资原 始数据; 步骤S13, 基于匹配规则, 将所述第一处理数据组内的多个所述物资的所述已记录属性 值设置成同一属性 值, 获得多个第二处 理数据组; 包括以下一种或多种的组合: 将所述已记录属性值进行大写字母和小写字母之间进行转换设置成同一属性值, 获得 多个第二处 理数据组; 将所述已记录属性值中不同计量单位的数值进行转换设置成同一属性值, 获得多个第 二处理数据组; 将同一所述已记录属性值在国内不同地域的不同表达形式转换为同一表达形式, 获得 多个第二处 理数据组; 将同一所述已记录属性值在不同时间的不同表达形式转换为同一表达形式, 获得多个 第二处理数据组; 将同一所述已记录属性值国外语言翻译的不同表达形式转换为同一表达形式, 获得多 个第二处 理数据组; 步骤S14, 基于所述匹配规则, 将多个所述第二处理数据组之间的多个所述物资的所述 已记录属性 值设置成所述同一属性 值, 获得第三处 理数据组; 步骤S15, 将所述第三处理数据组中所述属性值数量和内容均相同的所述物资设置同 一物资编 码, 并将所述属性值设置为所述物资编码的所述物资的特征; 或, 将所述第三处理 数据组中一种所述物资的全部所述属 性值内容与另一所述物资部分所述属 性值内容相同 的所述物资设置同一所述物资编码, 并将所述属性值数量最多的所述物资的所述属性值设 置为所述物资编码的所述物资的所述特 征。 2.根据权利要求1所述的一种物资数据清洗方法, 其特 征在于, 所述步骤S12, 将所述物资原 始数据进行 所述筛选处理包括: 步骤S121, 调取 所述物资原 始数据中的单个所述已记录属性 值; 步骤S122, 基于不同所述物资的单个所述已记录属性值属于同一范围或相同, 将所述 物资原始数据分配在同一所述第一处 理数据组。 3.根据权利要求2所述的一种物资数据清洗方法, 其特 征在于, 所述已记录属性值包括以下一种或多种的组合: 所述物资的名称、 所述物资的型号、 所 述物资的存储仓库、 所述物资的入库时间、 所述物资的供给地; 其中, 所述物资的所述供给 地包括国内供 给地和国外供 给地。 4.根据权利要求1所述的一种物资数据清洗方法, 其特 征在于, 所述基于所述匹配规则, 将多个所述第 二处理数据组之间的多个所述物资的所述已记 录属性值设置成所述同一属性 值, 获得第三处 理数据组, 包括以下一种或多种的组合: 将所述已记录属性值进行大写字母和小写字母之间进行转换设置成同一属性值, 获得 第三处理数据组;权 利 要 求 书 1/3 页 2 CN 115062008 B 2将所述已记录属性值中不同计量单位的数值进行转换设置成同一属性值, 获得第 三处 理数据组; 将同一所述已记录属性值在国内不同地域的不同表达形式转换为同一表达形式, 获得 第三处理数据组; 将同一所述已记录属性值在不同时间的不同表达形式转换为同一表达形式, 获得第 三 处理数据组; 将同一所述已记录属性值不同语言翻译的不同表达形式转换为同一表达形式, 获得第 三处理数据组。 5.根据权利要求1~4中任一所述的一种物资数据清洗方法, 其特 征在于, 所述物资数据清洗方法还 包括: 步骤S16, 将设置了所述物资编码的所述物资的所述属性值的类别与物资模型中所述 物资的属性项进行匹配, 获得全属性值的所述物资编码和缺属性值的所述物资编 码; 其中, 所述物资模型包括多种类别所述物资的全部所述属性项。 6.根据权利要求5所述的一种物资数据清洗方法, 其特 征在于, 所述物资数据清洗方法还 包括: 步骤S17, 将所述 缺属性值的所述物资编码的所述物资数据设置成所述物资原 始数据。 7.一种物资数据清洗装置, 其特 征在于, 所述物资数据清洗装置包括: 采集模块, 用于获取多条物资原始数据, 其中, 每条所述物资原始数据包括一种物资的 已记录属性 值; 筛选处理模块, 用于将所述物资原始数据进行筛选处理, 获得含有所述物资原始数据 的多个第一处理数据组; 其中, 每一个所述第一处理数据组含有所述已记录属 性值属于同 一范围或相同的多个所述物资的所述物资原 始数据; 第一匹配模块, 基于匹配规则, 用于将所述第一处理数据组内的多个所述物资的所述 已记录属性 值设置成同一属性 值, 获得多个第二处 理数据组; 包括以下一种或多种的组合: 将所述已记录属性值进行大写字母和小写字母之间进行转换设置成同一属性值, 获得 多个第二处 理数据组; 将所述已记录属性值中不同计量单位的数值进行转换设置成同一属性值, 获得多个第 二处理数据组; 将同一所述已记录属性值在国内不同地域的不同表达形式转换为同一表达形式, 获得 多个第二处 理数据组; 将同一所述已记录属性值在不同时间的不同表达形式转换为同一表达形式, 获得多个 第二处理数据组; 将同一所述已记录属性值国外语言翻译的不同表达形式转换为同一表达形式, 获得多 个第二处 理数据组; 第二匹配模块, 基于所述匹配规则, 用于将多个所述第二处理数据组之间的多个所述 物资的所述已记录属性 值设置成所述同一属性 值, 获得第三处 理数据组; 数据归一模块, 用于将所述第 三处理数据组中所述属性值数量和内容均相同的所述物 资设置同一物资编码, 并将所述属性值设置为所述物资编 码的所述物资的特征; 或, 用于将 所述第三处理数据组中一种所述物资的全部所述属 性值内容与另一所述物资部分所述属权 利 要 求 书 2/3 页 3 CN 115062008 B 3

.PDF文档 专利 一种物资数据清洗方法、装置、电子设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种物资数据清洗方法、装置、电子设备及存储介质 第 1 页 专利 一种物资数据清洗方法、装置、电子设备及存储介质 第 2 页 专利 一种物资数据清洗方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:23:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。