(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210300296.3
(22)申请日 2022.03.25
(71)申请人 电子科技大 学
地址 611731 四川省成 都市高新 (西) 区西
源大道2006号
(72)发明人 伍瑞卿 莫晨曦 陈岳涛 杨欣仪
李晓婵 曾海霖 陈伟 顾庆水
(74)专利代理 机构 四川力久律师事务所 512 21
专利代理师 韩洋
(51)Int.Cl.
G06V 10/26(2022.01)
G06F 17/16(2006.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06V 10/56(2022.01)
G06V 10/762(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于颜色转换的答题卡图像分割方法
(57)摘要
本发明涉及图像处理技术领域, 具体涉及一
种基于颜色转换的答题卡图像分割方法, 包括提
取答题卡图像中每个像素点处的RGB颜色作为样
本; 首先, 采用K ‑means聚类算法对样本进行聚
类, 得到样 本的白色、 黑 色与主颜色特征; 基于主
颜色特征计算主颜色特征与预设的目标颜色之
间的颜色转换矩阵; 最后, 通过颜色转换矩阵计
算得到统一彩色图像, 采用U ‑Net语义分割网络
模型进行训练得到实验结果图。 本发 明通过颜色
转换算法, 减少了样本图像的颜色种类, 优化了
学习模型的参数, 提高了小模型的预测结果质
量。
权利要求书1页 说明书7页 附图5页
CN 114863095 A
2022.08.05
CN 114863095 A
1.一种基于颜色转换的答题卡图像分割方法, 其特 征在于, 包括:
S1, 对答题卡图像进行聚类, 得到主颜色特 征;
S2, 对所述主颜色特 征与目标颜色进行计算, 得到颜色转换矩阵;
S3, 通过所述颜色转换矩阵对所述 答题卡图像进行转换, 得到统一彩色图像;
S4, 对所述统一彩色图像进行分割网络模型训练。
2.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法, 其特征在于, 步骤
S2中所述 目标颜色, 通过选取一张预定的答题卡图像, 对其进行聚类得到的主颜色特征作
为目标颜色。
3.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法, 其特征在于, 所述
聚类可以采用K ‑means聚类算法。
4.根据权利要求3所述的一种基于颜色转换的答题卡图像分割方法, 其特征在于, 所述
K‑means聚类算法的簇数 K=3, 得到 3个聚类中心Ci, i=1,2,3。
5.根据权利要求4所述的一种基于颜色转换的答题卡图像分割方法, 其特征在于, 采用
L2范数计 算所述聚类中心的范数‖Ci‖, 对所述 范数‖Ci‖进行大小排序, 满足如下范数大小关
系不等式:
‖ Cwhite‖ >‖ Cchrom‖ >‖ Cblack‖
其中, Cwhite代表白色、 Cblack代表黑色、 Cchrom代表主颜色。
6.根据权利要求5所述的一种基于颜色转换的答题卡图像分割方法, 其特征在于, 步骤
S2中, 结合所述范 数大小关系不 等式, 计算得到所述颜色转换矩阵为:
其中, P为3 ×3的线性转换矩阵, 等式右边为广义逆矩阵, (Rref,Gref,Bref)为目标颜色,
(Ri,Gi,Bi)为待转换答题卡图像的主颜色特 征。
7.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法, 其特征在于, 步骤
S4中, 所述网络模型采用U ‑Net语义分割网络模型进行训练。
8.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法, 其特征在于, 通过
计算颜色转换矩阵P的逆矩阵P‑1, 将转换后的统一彩色图像转换为 答题卡图像。
9.一种使用权利要求1 ‑8之一所述的基于颜色转换的答题卡图像分割方法的装置, 其
特征在于, 包括主颜色特 征获取单元、 颜色转换 单元以及分割单 元, 其中:
所述主颜色特 征获取单元, 被配置为对答题卡图像进行聚类获取主颜色特 征;
所述颜色转换单元, 被配置为基于主颜色特征与目标颜色计算颜色转换矩阵, 通过颜
色转换矩阵对答题卡图像的每 个像素的颜色进行转换, 得到统一彩色图像;
所述分割单 元, 被配置为对统一彩色图像进行分割网络模型训练。权 利 要 求 书 1/1 页
2
CN 114863095 A
2一种基于颜色转换的答题卡图像分割方 法
技术领域
[0001]本发明涉及 一种图像处理技术领域, 特别是一种基于颜色转换的答题卡图像分割
方法。
背景技术
[0002]具有规范格式的答题卡被广泛应用于现代各类考试, 以提高计算机自动阅卷的效
率。 当前, 很多阅卷系统扫描或者采集答题卡的图像, 并使用数字图像处理算法和深度学习
网络完成作答信息的定位、 分割和识别。 填涂信息的分割和检测是智能图像处理的关键环
节之一, 为后续的定位、 识别与分析提供了重要基础, 其结果的质量对后续环节产生较大的
影响。
[0003]深度学习模型逐步应用于答题卡图像的处理, 实现对关键信息 的检测、 分割和识
别, 但是答题卡的样 式多样、 颜色种类较多, 低分辨下扫描过程还会引入颜色失真, 样本分
布不平衡, 这些不利因素都会增 加深度学习模型的复杂性和出现欠拟合、 过拟合的问题。
[0004]由于答题卡采用多种版式和多种色彩, 标识多种至关重要的信息, 因此, 答题卡本
质上是一类彩色文档图像, 图像包含白色底、 黑色的标号、 彩色的填涂指示符号和表格线,
以及灰黑色的填涂块。 其中彩色部分主 要分为红色、 绿色、 蓝色等 不同色系风格。
[0005]在计算机阅卷系统中, 受制于存储传输要求的限制, 答题卡图像分辨率不高, 图像
中的字符、 填涂框等目标的尺寸约为20 ×10像素左右。 为了更好满足检测、 分割和识别, 兼
顾实时处理等要求, 图像处理算法和深度学习网络适宜采用轻量级结构模型, 模型参数不
宜过多。 但是在研究过程中, 发现由于训练样 本中包含了不同色彩系的答题卡图像, 而且存
在不同的颜色分布不均匀和失真等问题, 导致训练结果在某些色彩的答题卡图像上出现了
一些问题。
[0006]以选用U‑Net网络模型作为分割算法为例, 当网络足够深且学习能力强时, 得到的
语义分割结果很好, 但这往往使得模型需要 大量的参数, 以及更长的训练 时间和预测时间。
当网络深度不足时, 出现欠拟合的问题, 导致字符分割的结果出现不完整, 质量大大降低,
特别是答题卡中由细线构成的表单, 其颜色多种多样。
[0007]在实际的使用中通常期望训练好的模型能够在更短的时间内得到更好的预测结
果, 且能够应对更多表单颜色的答题 卡图像样 本的分割, 同时, 由于无法保证训练样本覆盖
所有的表单颜色, 即使训练好的模型的泛化能力也受到 了挑战。
发明内容
[0008]本发明的目的在于: 针对现有技术存在的答题卡图像颜色多样性、 训练模型泛化
能力不足带来的问题, 提供一种基于颜色转换 的答题卡图像分割方法, 将答题卡图像中的
色彩自适应地转换为预设的色彩, 简化了深度神经网络模型, 同时, 颜色转换算法具有自适
应的能力, 使得训练好的模型 具有了更强的泛化能力。
[0009]为了实现上述目的, 本发明采用的技 术方案为:说 明 书 1/7 页
3
CN 114863095 A
3
专利 一种基于颜色转换的答题卡图像分割方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:33:01上传分享