全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210925635.7 (22)申请日 2022.08.03 (71)申请人 石河子大 学 地址 832003 新疆维吾尔自治区石河子市 北四路221号 (72)发明人 李阳 晁雪薇 聂晶 杨悦  刘亚婕  (74)专利代理 机构 北京鼎佳达知识产权代理事 务所(普通 合伙) 11348 专利代理师 刘铁生 孟阿妮 (51)Int.Cl. G06V 10/762(2022.01) G06V 10/82(2022.01) G06V 10/98(2022.01) G06V 10/40(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种高信息质量图像数据集的构建方法 (57)摘要 本发明为一种高信息质 量图像数据集的构 建方法。 一种高信息质量图像数据集的构建方 法, 包括以下步骤: (1)将数据集划分为池数据集 和测试集, 选 取所述的池 数据集中的10%作为初 始标记数据集, 剩余的数据作为待选数据集; 将 所述的初始标记数据集和待选数据集分别输入 特征提取网络, 进行特征提取; (2)计算所述的初 始标记数据集中图像类内信息丰富度; (3)计算 所述的待选数据集中图像的类间信息重叠度; (4)将类间信息重叠度高的图像和所述的初始标 记数据集用于构建高信息质量图像数据集。 本发 明所述的一种高信息质量图像数据集的构建方 法, 从图像高维特征特性进行分析, 为后续的待 评价图像类间信息重叠度度量方法提供了重要 参考。 权利要求书2页 说明书7页 附图1页 CN 115272734 A 2022.11.01 CN 115272734 A 1.一种高信息质量图像数据集的构建方法, 其特 征在于, 包括以下步骤: (1)提取图像特 征: 将数据集划分为池数据集和测试集, 选取所述的池数据集中的10%作为初始标记数据 集, 剩余的数据作为待选数据集; 将所述的初始标记数据集和待选数据集分别输入特 征提取网络, 进行 特征提取; (2)计算所述的初始标记数据集中图像 类内信息 丰富度; (3)计算所述的待选数据集中图像的类间信息 重叠度; (4)将类间信 息重叠度高的图像和所述的初始标记数据集用于构建高信息质量图像数 据集。 2.根据权利要求1所述的构建方法, 其特 征在于, 所述的步骤(1)中, 按照5:1的比例将数据集划分为池数据集和 测试集。 3.根据权利要求1所述的构建方法, 其特 征在于, 所述的步骤(1)中的特征提取网络, 特征提取主干网络选择ResNet ‑18, 利用初始标记 数据集和 测试集对主干网络进行优化, 得到特 征提取网络 。 4.根据权利要求1所述的构建方法, 其特 征在于, 所述的步骤(1)中, 进行512维的特 征提取。 5.根据权利要求1所述的构建方法, 其特 征在于, 所述的步骤(2)中, 计算初始标记数据集图像类内信息丰富度的方法为: 先计算初始标 记数据集中各类图像原型, 再计算图像特征到该类图像原型距离的均值后, 得到数据集图 像各类内信息 丰富度。 6.根据权利要求5所述的构建方法, 其特 征在于, 所述的步骤(2)中, 计算初始标记数据集中, 各类图像原型采用以下公式: 其中, pi为第i类图像原型, 为第i类第k个图像特 征, ni为第i类图像数量。 7.根据权利要求6所述的构建方法, 其特 征在于, 所述的步骤(2)中, 计算图像特 征到该类图像原型距离的均值 采用以下公式: 所述的步骤(2)中, 数据集图像各类内信息 丰富度INFI采用以下公式: 8.根据权利要求1所述的构建方法, 其特 征在于, 所述的步骤(3)中, 计算待选数据集中图像的类间信息重叠度的方法为: 先算待选数据 集中图像到每一类原型 的距离, 再确定待选数据集中图像在各个类间的重叠情况后, 得到 待选数据集中图像的类间信息 重叠度。 9.根据权利要求8所述的构建方法, 其特 征在于, 所述的步骤(3)中, 计算待选数据集中图像到每一类原型的距离采用以下公式:权 利 要 求 书 1/2 页 2 CN 115272734 A 2其中, 表示第j类的第q个图像, 表示它的高维特征, 表示该图像到 第i类图像原型的距离 。 10.根据权利要求9所述的构建方法, 其特 征在于, 所述的步骤(3)中, 确定待选数据集中图像在各个类间的重叠情况 采用以下 公式: 得到待选数据集中图像的类间信息 重叠度 采用以下公式: 其中, nl为数据集内图像 类别数目。权 利 要 求 书 2/2 页 3 CN 115272734 A 3

.PDF文档 专利 一种高信息质量图像数据集的构建方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种高信息质量图像数据集的构建方法 第 1 页 专利 一种高信息质量图像数据集的构建方法 第 2 页 专利 一种高信息质量图像数据集的构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:57:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。