全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111677508.1 (22)申请日 2021.12.31 (71)申请人 清华大学 地址 100084 北京市海淀区清华园1号 (72)发明人 朱文武 王鑫 秦一鉴  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 代理人 苟冬梅 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于图价值网络的神经网络架构搜索方法 (57)摘要 本申请提供了一种基于图价值网络的神经 网络架构搜索方法, 涉及神经网络架构搜索技术 领域, 旨在提供一种学习已搜索过的架构, 以推 理得到其他网络架构的神经网络架构搜索方法。 所述方法包括: 获取神经细胞的当前架构; 以图 价值网络为价值函数, 以所述神经细胞的当前架 构为状态, 以改变所述神经细胞的当前架构的多 种规定行为为动作, 进行强化学习训练, 得到目 标神经细胞的架构; 将多个相同的所述目标神经 细胞的架构进行堆叠, 得到神经网络的架构。 权利要求书2页 说明书8页 附图2页 CN 114358251 A 2022.04.15 CN 114358251 A 1.一种基于图价 值网络的神经网络架构搜索方法, 其特 征在于, 所述方法包括: 获取神经细胞的当前架构; 以图价值网络为价值函数, 以所述神经细胞的当前架构为状态, 以改变所述神经细胞 的当前架构的多种规定行为 为动作, 进行强化学习训练, 得到目标神经细胞的架构; 将多个相同的所述目标神经细胞的架构进行堆叠, 得到神经网络的架构。 2.根据权利要求1所述的方法, 其特征在于, 以图价值网络为价值函数, 以所述神经细 胞的当前架构为状态, 以改变所述神经细胞 的当前架构的多种规定行为为动作, 进行强化 学习训练, 得到目标神经细胞的架构, 包括: 步骤1: 对所述神经细胞的当前架构执行多种规定行为, 得到所述神经细胞的多个搜索 架构; 步骤2: 获取 所述图价 值网络对所述神经细胞的多个搜索架构的评分; 步骤3: 以所述神经细胞的多个搜索架构中评分最高的架构, 更新所述神经细胞的当前 架构; 重复步骤1 ‑3, 在满足预设条件时, 停止更新所述神经细胞的当前架构, 将最后一次更 新的当前架构作为所述目标神经细胞的架构。 3.根据权利要求2所述的方法, 其特征在于, 所述预设条件包括: 所述神经细胞上一次 更新后的架构为被执 行终止动作后的架构; 和/或 所述图价值网络对所述神经细胞的多个搜索架构的评分, 低于所述图价值网络对所述 神经细胞的上一次更新后的架构的评分。 4.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 获取神经细胞的多个样本架构; 将所述多个样本架构作为预设图价值网络的输入, 对所述预设图价值网络进行训练, 所述预设图价值网络输出所述多个样本架构的预测评分, 其中, 所述损失函数是根据每个 样本架构的预测评分和超网络的评分确定的; 当所述损 失函数收敛到最小值时, 结束对所述预设图价值网络的训练, 得到所述图价 值网络; 获取所述图价 值网络对所述神经细胞的多个搜索架构的评分, 包括: 将所述神经细胞的多个搜索架构输入所述图价值网络, 得到所述图价值网络输出的所 述神经细胞的多个搜索架构的评分。 5.根据权利要求4所述的方法, 其特征在于, 将所述神经细胞的多个搜索架构输入所述 图价值网络, 得到所述图价 值网络输出的所述神经细胞的多个搜索架构的评分, 包括: 将所述神经细胞的多个搜索架构建模为对应的多个有向图; 将所述多个有向图输入所述图价 值网络的卷积层, 得到所述多个有向图的特 征; 将所述多个有向图的特征依次输入所述图价值网络的全连接层和激活层, 得到所述多 个有向图的价 值; 将所述多个有向图的价值, 作为所述图价值网络输出的所述神经细胞的多个搜索架构 对应的评分。 6.根据权利要求5所述的方法, 其特征在于, 所述神经细胞包括具有连接关系的多个 块; 将所述神经细胞的多个搜索架构建模为对应的多个有向图, 包括:权 利 要 求 书 1/2 页 2 CN 114358251 A 2将所述神经细胞中的块建模为有向图中的点, 且以独热编码表征 所述块的操作类型; 将所述块之间的连接关系建模为有向图中的边; 将所述神经细胞的输入建模为有向图中的源; 将所述神经细胞的输出建模为有向图中的汇。 7.根据权利要求1所述的方法, 其特征在于, 所述神经细胞包括具有连接关系的多个 块, 所述块接收任意数量个输入, 所述输入包括同一个神经细胞中排序在前的块的输出, 和/或排序在前的多个神经细胞的输出; 连接所述多个块的输出, 得到所述神经细胞的输出。 8.根据权利要求7 所述的方法, 其特 征在于, 在连接所述多个块的输出之前, 包括: 获取所述多个块中每 个块的输入; 针对所述每个块, 将块的输入相加, 执行预设操作, 得到所述块的输出, 其中, 所述预设 操作为卷积、 池化和直接连接中的任一 者。 9.根据权利要求1所述的方法, 其特征在于, 所述改变所述神经细胞的当前架构的多种 规定行为包括: 更改块的操作类型、 增 加连接关系 、 删除连接关系 、 终止动作。权 利 要 求 书 2/2 页 3 CN 114358251 A 3

.PDF文档 专利 基于图价值网络的神经网络架构搜索方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于图价值网络的神经网络架构搜索方法 第 1 页 专利 基于图价值网络的神经网络架构搜索方法 第 2 页 专利 基于图价值网络的神经网络架构搜索方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:50:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。