全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111648113.9 (22)申请日 2021.12.3 0 (71)申请人 贝壳找房网 (北京) 信息技 术有限公 司 地址 101520 北京市密云区经济开发区兴 盛南路8号开发区办公楼501室-1834 (经济开发区集中办公区) (72)发明人 付奥  (74)专利代理 机构 北京润平知识产权代理有限 公司 11283 代理人 高英英 (51)Int.Cl. G06F 30/13(2020.01) G06F 30/20(2020.01) G06Q 50/08(2012.01)G06F 17/15(2006.01) (54)发明名称 用于构造特征工程计算拓扑图的方法和装 置 (57)摘要 本发明实施例提供一种用 于构造特征工程 计算拓扑图的方法和装置, 属于计算机技术领 域。 该方法包括: 根据所述特征工程的配置文件 中算子函数之间的前后依赖顺序的倒序遍历所 述配置文件中的算子函数确定特征依赖链表以 构造所述特征工程计算拓扑图, 其中, 一个所述 算子函数对应至少一个特征, 任一特征的特征信 息包括该特征、 依赖特征及所述算子函数, 所述 特征工程计算拓扑图包括特征依赖链表, 一个所 述特征依赖链表针对进行特征工程计算时一组 具有计算依赖关系的所述特征或没有对应的所 述计算依赖关系的单个所述特征。 藉此, 实现了 提升在线特 征工程性能。 权利要求书2页 说明书11页 附图3页 CN 114329718 A 2022.04.12 CN 114329718 A 1.一种用于构造特 征工程计算拓扑图的方法, 其特 征在于, 该 方法包括: 根据所述特征工程的配置文件中算子函数之间的前后依赖顺序的倒序遍历所述配置 文件中的算子函数确定特征依赖链表以构造所述特征工程计算拓扑图, 其中, 一个所述算 子函数对应至少一个特征, 任一特征的特征信息包括该特征、 依赖特征及所述算子函数, 所 述特征工程计算拓扑图包括特征依赖链表, 一个所述特征依赖链表针对进 行特征工程计算 时一组具有计算依赖关系的所述特征或没有对应的所述计算依赖关系的单个所述特征, 一 组具有计算依赖关系的所述特征对应的所述特征依赖链表包括所述特征的所述特征信息 并描述所述计算依赖关系, 没有对应的所述计算依赖关系的单个所述特征对应的所述特征 依赖链表包括所述特 征的所述特 征信息。 2.根据权利要求1所述的方法, 其特征在于, 在遍历任一所述算子函数时, 执行以下操 作: 针对该算子函数对应的任一所述特征, 根据该特征的特征信息, 确定该特征对应的特 征依赖链表, 将该特征的特征信息匹配到所确定的特征依赖链表并在所确定的特征依赖链 表中有相邻特 征的情况 下描述与相邻特 征的所述计算依赖关系; 在该算子函数对应的所有所述特征的所述特征信息均匹配到所述特征依赖链表的情 况下, 判断是否所述配置文件中的所有所述 算子函数均被遍历; 以及 在所述配置文件中的所有所述算子函数并未全部被遍历的情况下, 根据 所述倒序确定 该算子函数的下一所述 算子函数以遍历该 下一所述 算子函数。 3.根据权利要求2所述的方法, 其特征在于, 针对该算子函数对应的任一所述特征, 根 据该特征的特征信息确定该特征对应的特征依赖链表, 将该特征的特征信息匹配到所确定 的特征依赖链表并在所确定的特征依赖链表中有相邻特征的情况下描述与相邻特征的所 述计算依赖关系, 包括: 判断该特征是否是需要输入到深度学习模型中的必要特 征; 以及 响应于该特征是所述必要特征, 针对该特征构造一个新的所述特征依赖链表并将该特 征的所述特 征信息放在所构造的特 征依赖链 表的起始 节点; 和/或 响应于该特征不是所述必要特征, 找到已有的所述特征依赖链表中尾部节点的所述特 征信息中包括的所述依赖特征与该特征相同的所述特征依赖链表, 并在跟随所找到的特征 依赖链表的尾部节点的位置增加一节点, 将该特征的所述特征信息放在所增加的节点处并 描述所增 加的节点及与所增 加的节点相邻的节点之间的计算依赖关系。 4.根据权利要求3所述的方法, 其特征在于, 响应于该特征不是所述必要特征, 该方法 还包括: 将预设必要特征列表中包括的与所找到的特征依赖链表的尾部节点之间的指向关系 更新为至所增 加的节点的指向关系。 5.根据权利要求3所述的方法, 其特 征在于, 针对该算子函数对应的任一所述特 征, 所述判断该特征是否是需要输入到深度学习 模型中的必要特征包括: 将该特征与 预设 必要特征列表中包括的所述必要特 征进行比对以判断该 特征是否是所述必要特 征; 和/或 响应于该特征不是所述必要特征, 找到已有的所述特征依赖链表中尾部节点的所述特 征信息中包括的所述依赖特 征与该特征相同的所述特 征依赖链 表包括: 根据所述预设必要特征列表中包括的与已有的所述特征依赖链表的尾部节点之间的权 利 要 求 书 1/2 页 2 CN 114329718 A 2指向关系, 获取已有的所述特 征依赖链 表尾部的所述特 征信息; 以及 将所获取的特征信息中的所述依赖特征与该特征进行比较, 其中, 与该特征相同的依 赖特征对应的所述特征依赖链表即为已有的所述特征依赖链表中尾部的所述特征信息中 包括的所述依赖特 征与该特征相同的所述特 征依赖链 表。 6.一种用于构造特 征工程计算拓扑图的装置, 其特 征在于, 该装置包括: 遍历模块, 用于根据 所述特征工程的配置文件中算子函数之间的前后依赖顺序的倒序 遍历所述配置文件中的算子函数确定特征依赖链表以构造所述特征工程计算拓扑图, 其 中, 一个所述算子函数对应至少一个特征, 任一特征的特征信息包括该特征、 依赖特征及所 述算子函数, 所述特征工程计算拓扑图包括特征依赖链表, 一个所述特征依赖链表针对进 行特征工程计算时一组具有计算依赖关系的所述特征或没有对应的所述计算依赖关系的 单个所述特征, 一组具有计算依赖 关系的所述特征对应的所述特征依赖链表包括所述特征 的所述特征信息并描述所述计算依赖关系, 没有对应的所述计算依赖 关系的单个所述特征 对应的所述特 征依赖链 表包括所述特 征的所述特 征信息。 7.一种特征工程计算方法, 其特征在于, 该特征工程计算方法按照根据权利要求1 ‑5中 任一项所述的方法构造的特 征工程计算拓扑图进行计算。 8.一种机器可读存储介质, 其特征在于, 该机器可读存储介质上存储有指令, 该指令用 于使得机器执 行权利要求1 ‑5中任一项所述的方法。 9.一种处理器, 其特征在于, 用于运行程序, 其中, 所述程序被运行时用于执行权利要 求1‑5任一项所述的方法。 10.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 该计算机程序/指令被 处理器执行时实现权利要求1 ‑5中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114329718 A 3

.PDF文档 专利 用于构造特征工程计算拓扑图的方法和装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于构造特征工程计算拓扑图的方法和装置 第 1 页 专利 用于构造特征工程计算拓扑图的方法和装置 第 2 页 专利 用于构造特征工程计算拓扑图的方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:24:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。