说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211487214.7 (22)申请日 2022.11.25 (71)申请人 北京红棉小 冰科技有限公司 地址 100080 北京市海淀区北四环西路67 号6层608房间 (72)发明人 陈杰 (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 王治东 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种模型训练方法及装置 (57)摘要 本发明提供一种模型训练方法及装置, 可以 从数据记录日志中, 提取出第一数量的匹配行为 记录数据; 其中, 各匹配行为记录数据均包括相 对应的待匹配数据和标注有样本类别标识的至 少一条反馈数据, 样本类别标识包括正样本标识 和负样本标识; 按照同一匹配行为记录数据中正 样本匹配度高于负样本匹配度的训练目标, 利用 各匹配行为记录数据对数据匹配模 型进行训练; 其中, 正样 本匹配度为标注有 正样本标识的反馈 数据与待匹配数据的匹配度, 负样 本匹配度为标 注有负样本标识的反馈数据与待匹配数据的匹 配度。 本发 明可以优化对数据匹配模 型的训练效 果, 使得数据匹配模型可以匹配到以及向用户展 示更能满足用户实际需求或更感兴趣的数据。 权利要求书2页 说明书14页 附图4页 CN 115545121 A 2022.12.30 CN 115545121 A 1.一种模型训练方法, 其特 征在于, 包括: 从数据记录日志中, 提取出第 一数量的待用于对数据匹配模型进行训练 的匹配行为记 录数据; 其中, 各所述匹配行为记录数据均包括相对应的待匹配数据和标注有样本类别标 识的至少一条反馈数据, 所述样本类别标识包括 正样本标识和负 样本标识; 按照同一所述匹配行为记录数据中正样本匹配度高于负样本匹配度的训练目标, 利用 各所述匹配行为记录数据对所述数据匹配模型进行训练; 其中, 所述正样本匹配度为标注 有所述正样本标识的所述反馈数据与所述待匹配数据的匹配度, 所述负样本匹配度为标注 有所述负 样本标识的所述反馈数据与所述待匹配数据的匹配度。 2.根据权利要求1所述的模型训练方法, 其特征在于, 所述数据匹配模型为数据搜索模 型或数据推荐模型。 3.根据权利要求1所述的模型训练方法, 其特征在于, 所述按照同一所述匹配行为记录 数据中正样本匹配度高于负样本匹配度的训练目标, 利用各所述匹配行为记录数据对所述 数据匹配模型进行训练, 包括: 分别确定各 所述匹配行为记录数据的对比损失; 基于各所述匹配行为记录数据的对比损失, 确定综合对比损失; 基于所述综合对比损失, 更新所述数据匹配模型的模型参数。 4.根据权利要求3所述的模型训练方法, 其特征在于, 所述分别确定各所述匹配行为记 录数据的对比损失, 包括: 基于交叉熵计算方式, 计算出 各所述匹配行为记录数据的对比损失。 5.根据权利要求3所述的模型训练方法, 其特征在于, 所述基于各所述匹配行为记录数 据的对比损失, 确定综合对比损失, 包括: 将各所述匹配行为记录数据的对比损失输入到综合对比损失确定模型中, 获得所述综 合对比损失确定模型输出的所述综合对比损失; 其中, 所述综合对比损失确定模型用于在获得各所述匹配行为记录数据的对比损失 后, 计算出各所述匹配行为记录数据的对比损失的和 值, 将所述和值除以反馈数据总 数量 所获得的值确定为所述 综合对比损失, 所述反馈数据总数量为所有所述匹配行为记录数据 中反馈数据的总数量。 6.根据权利要求4所述的模型训练方法, 其特征在于, 当所述数据匹配模型为排序模型 时, 确定所述待匹配数据与所述反馈数据的匹配度, 包括: 将所述待 匹配数据和所述反馈数据输入到第 一特征提取网络, 获得所述第 一特征提取 网络输出的目标向量距离; 将所述目标向量距离确定为所述待匹配数据与所述反馈数据的匹配度; 其中, 所述目标向量距离是由所述第一特征提取网络通过以下步骤生成: 分别从已输 入的所述待匹配数据和所述反馈数据中提取出第一特征向量和 第二特征向量, 计算出所述 第一特征向量和所述第二特征向量的向量距离, 将计算出的向量距离确定为所述目标向量 距离。 7.根据权利要求4所述的模型训练方法, 其特征在于, 当所述数据匹配模型为召回模型 时, 确定所述待匹配数据与所述反馈数据的匹配度, 包括: 利用第二特 征提取网络, 从所述待匹配数据中提取 出第三特 征向量;权 利 要 求 书 1/2 页 2 CN 115545121 A 2利用第三特 征提取网络, 从所述反馈数据提取 出第四特 征向量; 将所述第三特征向量与所述第四特征向量的向量距离确定为所述待匹配数据与所述 反馈数据的匹配度。 8.根据权利要求1所述的模型训练方法, 其特征在于, 所述第 一数量的所述匹配行为记 录数据中包括标注有正样本标识的所述反馈数据和/或标注有负样本标识的所述反馈数 据。 9.根据权利要求1所述的模型训练方法, 其特征在于, 在所述按照同一所述匹配行为记 录数据中正样本匹配度高于负样本匹配度的训练目标, 利用各所述匹配行为记录数据对所 述数据匹配模型进行训练之前, 所述模型训练方法还 包括: 在所述第一数量的所述匹配行为记录数据中, 将 非目标匹配行为记录数据中的至少一 个所述反馈数据, 设置为所述目标匹配行为记录数据中标注有负样本标识的所述反馈数 据。 10.一种模型训练装置, 其特 征在于, 包括: 提取 单元和训练单 元; 其中: 所述提取单元, 用于从数据记录日志中, 提取出第一数量的待用于对数据匹配模型进 行训练的匹配行为记录数据; 其中, 各所述匹配行为记录数据均包括相对应的待匹配数据 和标注有样本类别标识的至少一条反馈数据, 所述样本类别标识包括正样本标识和负样本 标识; 所述训练单元, 用于按照同一所述匹配行为记录数据中正样本匹配度高于负样本匹配 度的训练目标, 利用各所述匹配行为记录数据对所述数据匹配模型进 行训练; 其中, 所述正 样本匹配度为标注有 所述正样本标识的所述反馈数据与所述待匹配数据的匹配度, 所述负 样本匹配度为标注有所述负 样本标识的所述反馈数据与所述待匹配数据的匹配度。权 利 要 求 书 2/2 页 3 CN 115545121 A 3
专利 一种模型训练方法及装置
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-18 22:23:44
上传分享
举报
下载
原文档
(569.8 KB)
分享
友情链接
GB-T 37024-2018 信息安全技术 物联网感知层网关安全技术要求.pdf
安全村文集 第2辑 .pdf
NY-T 2236-2012 植物新品种特异性、一致性和稳定性测试指南 番茄.pdf
GB-T 41680-2022 起重机 抗震设计通则.pdf
GB-T 17639-2023 土工合成材料 长丝纺粘针刺非织造土工布.pdf
DB42-T 2040.1-2023 大球盖菇生产技术系列规程 第1部分:桑枝大球盖菇 湖北省.pdf
GB-T 24479-2023 火灾情况下的电梯特性.pdf
TB-T 3556-2020 铁路桥梁用结构钢.pdf
GB-T 32918.4-2016 信息安全技术 SM2椭圆曲线公钥密码算法 第4部分:公钥加密算法.pdf
SY-T 5329-2022 碎屑岩油藏注水水质指标技术要求及分析方法.pdf
T-CEC 446.4—2022 电力用锂电池直流电源系统 第4部分:间歇充电式直流电源设备.pdf
华泰 信创 研究框架.pdf
DB52-T 1636.4-2021 机关事务云 第4部分:机关后勤管理数据 贵州省.pdf
GB-T 2102-2022 钢管的验收、包装、标志和质量证明书.pdf
DB33-T 2487-2022 公共数据安全体系建设指南 浙江省.pdf
T-CIECCPA 039—2023 垃圾焚烧电力碳足迹量化与评价方法.pdf
T-CFA 0201031—2018 金属切削机床球墨铸铁件 技术条件.pdf
GB-T 22576.4-2021 医学实验室 质量和能力的要求 第4部分:临床化学检验领域的要求.pdf
DB21-T 3728.2—2023 信息技术 初级职业技能人员能力评价要求 第2部分:软件开发 辽宁省.pdf
GB-T 19345.2-2017 非晶纳米晶合金 第2部分:铁基纳米晶软磁合金带材.pdf
交流群
-->
1
/
21
评价文档
赞助2元 点击下载(569.8 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。