专利一种基于颜色转换的答题卡图像分割方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210300296.3 (22)申请日 2022.03.25 (71)申请人电子科技大学地址 611731 四川省成都市高新（西）区西源大道2006号 (72)发明人伍瑞卿　莫晨曦　陈岳涛　杨欣仪　李晓婵　曾海霖　陈伟　顾庆水　 (74)专利代理机构四川力久律师事务所 512 21 专利代理师韩洋 (51)Int.Cl. G06V 10/26(2022.01) G06F 17/16(2006.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01)G06V 10/56(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) (54)发明名称一种基于颜色转换的答题卡图像分割方法 (57)摘要本发明涉及图像处理技术领域，具体涉及一种基于颜色转换的答题卡图像分割方法，包括提取答题卡图像中每个像素点处的RGB颜色作为样本；首先，采用K ‑means聚类算法对样本进行聚类，得到样本的白色、黑色与主颜色特征；基于主颜色特征计算主颜色特征与预设的目标颜色之间的颜色转换矩阵；最后，通过颜色转换矩阵计算得到统一彩色图像，采用U ‑Net语义分割网络模型进行训练得到实验结果图。本发明通过颜色转换算法，减少了样本图像的颜色种类，优化了学习模型的参数，提高了小模型的预测结果质量。权利要求书1页说明书7页附图5页 CN 114863095 A 2022.08.05 CN 114863095 A 1.一种基于颜色转换的答题卡图像分割方法，其特征在于，包括： S1，对答题卡图像进行聚类，得到主颜色特征； S2，对所述主颜色特征与目标颜色进行计算，得到颜色转换矩阵； S3，通过所述颜色转换矩阵对所述答题卡图像进行转换，得到统一彩色图像； S4，对所述统一彩色图像进行分割网络模型训练。 2.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法，其特征在于，步骤 S2中所述目标颜色，通过选取一张预定的答题卡图像，对其进行聚类得到的主颜色特征作为目标颜色。 3.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法，其特征在于，所述聚类可以采用K ‑means聚类算法。 4.根据权利要求3所述的一种基于颜色转换的答题卡图像分割方法，其特征在于，所述 K‑means聚类算法的簇数 K＝3，得到 3个聚类中心Ci， i＝1,2,3。 5.根据权利要求4所述的一种基于颜色转换的答题卡图像分割方法，其特征在于，采用 L2范数计算所述聚类中心的范数‖Ci‖，对所述范数‖Ci‖进行大小排序，满足如下范数大小关系不等式： ‖ Cwhite‖ >‖ Cchrom‖ >‖ Cblack‖ 其中， Cwhite代表白色、 Cblack代表黑色、 Cchrom代表主颜色。 6.根据权利要求5所述的一种基于颜色转换的答题卡图像分割方法，其特征在于，步骤 S2中，结合所述范数大小关系不等式，计算得到所述颜色转换矩阵为：其中， P为3 ×3的线性转换矩阵，等式右边为广义逆矩阵， (Rref,Gref,Bref)为目标颜色， (Ri,Gi,Bi)为待转换答题卡图像的主颜色特征。 7.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法，其特征在于，步骤 S4中，所述网络模型采用U ‑Net语义分割网络模型进行训练。 8.根据权利要求1所述的一种基于颜色转换的答题卡图像分割方法，其特征在于，通过计算颜色转换矩阵P的逆矩阵P‑1，将转换后的统一彩色图像转换为答题卡图像。 9.一种使用权利要求1 ‑8之一所述的基于颜色转换的答题卡图像分割方法的装置，其特征在于，包括主颜色特征获取单元、颜色转换单元以及分割单元，其中：所述主颜色特征获取单元，被配置为对答题卡图像进行聚类获取主颜色特征；所述颜色转换单元，被配置为基于主颜色特征与目标颜色计算颜色转换矩阵，通过颜色转换矩阵对答题卡图像的每个像素的颜色进行转换，得到统一彩色图像；所述分割单元，被配置为对统一彩色图像进行分割网络模型训练。权　利　要　求　书 1/1 页 2 CN 114863095 A 2一种基于颜色转换的答题卡图像分割方法技术领域 [0001]本发明涉及一种图像处理技术领域，特别是一种基于颜色转换的答题卡图像分割方法。背景技术 [0002]具有规范格式的答题卡被广泛应用于现代各类考试，以提高计算机自动阅卷的效率。当前，很多阅卷系统扫描或者采集答题卡的图像，并使用数字图像处理算法和深度学习网络完成作答信息的定位、分割和识别。填涂信息的分割和检测是智能图像处理的关键环节之一，为后续的定位、识别与分析提供了重要基础，其结果的质量对后续环节产生较大的影响。 [0003]深度学习模型逐步应用于答题卡图像的处理，实现对关键信息的检测、分割和识别，但是答题卡的样式多样、颜色种类较多，低分辨下扫描过程还会引入颜色失真，样本分布不平衡，这些不利因素都会增加深度学习模型的复杂性和出现欠拟合、过拟合的问题。 [0004]由于答题卡采用多种版式和多种色彩，标识多种至关重要的信息，因此，答题卡本质上是一类彩色文档图像，图像包含白色底、黑色的标号、彩色的填涂指示符号和表格线，以及灰黑色的填涂块。其中彩色部分主要分为红色、绿色、蓝色等不同色系风格。 [0005]在计算机阅卷系统中，受制于存储传输要求的限制，答题卡图像分辨率不高，图像中的字符、填涂框等目标的尺寸约为20 ×10像素左右。为了更好满足检测、分割和识别，兼顾实时处理等要求，图像处理算法和深度学习网络适宜采用轻量级结构模型，模型参数不宜过多。但是在研究过程中，发现由于训练样本中包含了不同色彩系的答题卡图像，而且存在不同的颜色分布不均匀和失真等问题，导致训练结果在某些色彩的答题卡图像上出现了一些问题。 [0006]以选用U‑Net网络模型作为分割算法为例，当网络足够深且学习能力强时，得到的语义分割结果很好，但这往往使得模型需要大量的参数，以及更长的训练时间和预测时间。当网络深度不足时，出现欠拟合的问题，导致字符分割的结果出现不完整，质量大大降低，特别是答题卡中由细线构成的表单，其颜色多种多样。 [0007]在实际的使用中通常期望训练好的模型能够在更短的时间内得到更好的预测结果，且能够应对更多表单颜色的答题卡图像样本的分割，同时，由于无法保证训练样本覆盖所有的表单颜色，即使训练好的模型的泛化能力也受到了挑战。发明内容 [0008]本发明的目的在于：针对现有技术存在的答题卡图像颜色多样性、训练模型泛化能力不足带来的问题，提供一种基于颜色转换的答题卡图像分割方法，将答题卡图像中的色彩自适应地转换为预设的色彩，简化了深度神经网络模型，同时，颜色转换算法具有自适应的能力，使得训练好的模型具有了更强的泛化能力。 [0009]为了实现上述目的，本发明采用的技术方案为：说　明　书 1/7 页 3 CN 114863095 A 3

专利 一种基于颜色转换的答题卡图像分割方法

专利一种基于颜色转换的答题卡图像分割方法