![视觉大数据智能分析算法实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/579/47216579/b_47216579.jpg)
上QQ阅读APP看书,第一时间看更新
1.2 答题卡预处理
本案例选择某实际考试的答题复印/扫描图作为实验对象,重点对选择题的答题区域做图像增强处理,提高目标内容的对比度。
如图1-1所示,答题区域集中在试卷头部的网格区域,并且呈现黑白文字图的特点,因此我们可以采用基本的图像灰度化、图像二值化及图像反色来进行预处理,提高区域对比度,关键代码如下所示。
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P22_3432.jpg?sign=1739974073-s4up14F3okOiUpBdPMqAjknLST62C7aT-0-e67a9ce942b2e4d439b31aab0b3767cb)
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P23_3436.jpg?sign=1739974073-CPB2o3AuqGcYm8zYakMzWT8iohbpxpbI-0-5b4496ae3e015c6e62eaa2eba4e85fb4)
图1-1 答题卡图像示例
程序首先通过imread用于读取指定路径的图像得到数字图像矩阵,rgb2gray用于将RGB图转换为灰度图矩阵;然后通过graythresh用于计算灰度图的otsu阈值,im2bw用于进行二值化变换并反色;最后采用形态学水平闭合操作突出答题区域并通过bwareafilt提取最大面积的连通区域,经imwrite函数写到指定的图像文件。运行后,得到的结果如图1-2所示。
如图1-2所示,通过预处理得到了对比度增强的二值化图,突出了答案区域的文本内容,可以发现答案区域呈现出了网格划分、数字题号、字母答案的特点,并且每个题的答案是单选的A、B、C、D之一,可考虑通过图像分割及模板匹配等方案进行答案定位及识别。
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P24_4659.jpg?sign=1739974073-lqa3Ehvs6e1NauEnF3z9vIyBMXd3dueS-0-b94d7e44f889ef87452c3b7303d3298d)
图1-2 答题卡图像预处理