全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210463588.9 (22)申请日 2022.04.28 (71)申请人 北京合思信息技 术有限公司 地址 100000 北京市海淀区丹棱 街1号院1 号楼22层2201室 (72)发明人 马春荃 俞德明 王秘  (74)专利代理 机构 北京知果之信知识产权代理 有限公司 1 1541 专利代理师 高科 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/29(2019.01) G06K 9/62(2022.01) G06Q 50/12(2012.01) (54)发明名称 酒店信息数据处 理方法及装置 (57)摘要 本公开实施例公开了一种酒店信息数据处 理方法及装置, 包括将每个渠道 提供的酒店信息 数据标准化后, 将预设渠道对应的标准化后的数 据作为第一酒店信息数据, 其中, 所述标准化的 过程包括提取 酒店信息数据中位置信息、 和酒店 信息数据中的身份信息; 遍历其他渠道提供的第 二酒店信息数据, 以针对每一条第二酒店信息数 据确定与其最相似的第一酒店信息数据, 其中, 该条第二酒店信息数据与所述最相似的第一酒 店信息数据合并为一条, 最终得到酒店信息数据 列表; 如果接收到用户端发送的酒店信息数据查 询请求后, 从合并后的酒店信息数据中确定与该 请求相匹配的目标酒店信息数据。 降低了酒店信 息的重复率, 提高了查询效率。 权利要求书2页 说明书9页 附图2页 CN 114860771 A 2022.08.05 CN 114860771 A 1.一种酒店信息数据处 理方法, 其特 征在于, 包括: 对每个渠道提供的酒店信 息数据标准化后, 将预设渠道对应的标准化后的数据作为第 一酒店信息数据, 其中, 所述标准化的过程包括提取酒店信息数据中的位置信息、 和酒店信 息数据中的身份信息; 遍历其他渠道提供的第 二酒店信 息数据, 以针对每一条第 二酒店信 息数据确定与其最 相似的第一酒店信息数据, 其中, 该条第二酒店信息数据与所述最相似的第一酒店信息数 据合并为 一条; 和/或, 如果接收到用户端发送的酒店信 息数据查询请求后, 从合并后的酒店信 息数据 中确定与该请求相匹配的目标酒店信息数据, 其中, 所述 目标酒店信息数据在用户端可通 过列表的形式进行展示。 2.根据权利要求1所述的酒店信 息数据处理方法, 其特征在于, 针对每一条第 二酒店信 息数据从数据库中确定与其 最相似的第一酒店信息数据包括: 将第二酒店信 息数据输入至预先建立的用于酒店信 息数据合并的模型, 以输出得到与 每一条第二酒店信息数据最相似的第一酒店信息数据; 其中, 所述模型分别基于第 一酒店信 息数据的身份信 息与第二酒店信 息数据的身份信 息的相似度、 第一酒店信息数据的位置信息与第二酒店信息数据的位置信息之间的距离, 确定与每一条第二酒店信息数据最相似的第一酒店信息数据。 3.根据权利要求2所述的酒店信息数据处 理方法, 其特 征在于, 模型包括: 计算第一酒店信息数据的名称信息与第二酒店信息数据的名称信息的相似度, 其中, 所述相似度用于确定是否存在与第二酒店信息数据相同的第一酒店信息数据; 和/或, 如果存在, 则对第一酒店信息数据的其他身份信息、 与第一酒店信息数据相同 的第二酒店信息数据的其他身份信息进行相似度计算, 以确定是否仍存在与第二 酒店信息 数据相同的第一酒店信息数据; 和/或, 如果仍存在与第 二酒店信 息数据相同的第 一酒店信 息数据, 则基于位置信 息确 定与第二酒店信息数据相似的第一酒店信息数据。 4.根据权利要求3所述的酒店信息数据处 理方法, 其特 征在于, 方法还 包括: 获取多渠道 的酒店信息数据作为样本数据, 以将所述样本数据输入至所述模型中, 得 到合并后的酒店信息数据; 调整基于其他身份信 息进行相似度计算的步骤、 与基于位置信 息确定与第 二酒店信 息 数据相似的第一酒店信息数据的步骤的优先级, 以得到所述模型的不同输出 结果; 基于所述 不同输出 结果的合并错 误率, 确定最优 模型。 5.根据权利要求2所述的酒店信 息数据处理方法, 其特征在于, 计算第 一酒店信 息数据 的身份信息与第二酒店信息数据的身份信息的相似度包括: 计算第一酒店信 息数据的身份信 息与第二酒店信 息数据的身份信 息的语义相似度、 以 及词序相似度。 6.根据权利要求2所述的酒店信 息数据处理方法, 其特征在于, 计算第 一酒店信 息数据 的位置信息与第二酒店信息数据的位置信息的距离包括: 基于第一酒店信息数据的经纬位置、 第二酒店信息数据的经纬位置, 利用半正矢公式 确定第一酒店与第二酒店之 间距离, 其中, 将经线和纬线视为近似垂 直的两条线, 并基于此权 利 要 求 书 1/2 页 2 CN 114860771 A 2计算第一酒店和第二酒店之间距离 。 7.一种酒店信息数据合并装置, 其特 征在于, 包括: 标准化单元, 被配置成对每个渠道提供的酒店信息数据标准化后, 将预设渠道对应的 标准化后的数据作为第一酒店信息数据, 其中, 所述标准化的过程包括提取酒店信息数据 中位置信息、 和酒店信息数据中的身份信息; 数据合并单元, 被配置成遍历其他渠道提供的第二酒店信息数据, 以针对每一条第二 酒店信息数据确定与其最相似的第一酒店信息数据, 其中, 该条第二酒店信息数据与所述 最相似的第一酒店信息数据合并为 一条; 和/或, 响应单元, 被配置成如果接收到用户端发送 的酒店信息数据查询请求后, 从合 并后的酒店信息数据中确定与该请求相匹配的目标酒店信息数据, 其中, 所述目标酒店信 息数据在用户端可通过列表的形式进行展示。 8.根据权利要求7所述的酒店信 息数据合并装置, 其特征在于, 针对每一条第 二酒店信 息数据从数据库中确定与其 最相似的第一酒店信息数据包括: 将第二酒店信 息数据输入至预先建立的用于酒店信 息数据合并的模型, 以输出得到与 每一条第二酒店信息数据最相似的第一酒店信息数据; 其中, 所述模型分别基于第 一酒店信 息数据的身份信 息与第二酒店信 息数据的身份信 息的相似度、 第一酒店信息数据的位置信息与第二酒店信息数据的位置信息的距离, 确定 与每一条第二酒店信息数据最相似的第一酒店信息数据。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使所述计算机执行权利要求1 ‑7任意一项所述的酒店信息数据 处 理方法。 10.一种电子设备, 其特征在于, 包括: 至少一个处理器; 以及与 所述至少一个处理器通 信连接的存储器; 其中, 所述存储器存储有 可被所述至少一个处理器执行的计算机程序, 所 述计算机程序被所述至少一个处理器执行, 以使所述至少一个处理器执行权利要求1 ‑7任 意一项所述的酒店信息数据处 理方法。权 利 要 求 书 2/2 页 3 CN 114860771 A 3

.PDF文档 专利 酒店信息数据处理方法及装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 酒店信息数据处理方法及装置 第 1 页 专利 酒店信息数据处理方法及装置 第 2 页 专利 酒店信息数据处理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:16:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。