手机拍照文本图像质量评估方法
技术领域
本发明涉及一种手机拍照图像处理技术领域,尤其是指一种手机拍照文本图像质量评估方法。
背景技术
随着智能手机的普及,其拍照装置越来越广泛地作为获取信息的重要手段,日常生活和工作中包括对文档、屏幕以及PPT投影等的拍照保存。由于手机处理能力和网络传输能力的大幅度提高,以及拍照资料的日益增多,对拍摄的文档进行自动处理的需求日渐突出,其中最重要的就是对拍照文档自动识别,提取文本信息。而要保证对拍照文档的正确识别,首先要确定所拍摄的文档图像是清晰的。如果不能及时对手机拍照的图像质量作出判断,以便及时提醒用户是否需要立即重新拍照,就可能拍下一堆不能自动识别的文档图片。甚至有可能因为不能及时发现图像质量问题,使用户失去再次拍摄相关文档的机会。
现有的图像质量评估方法主要通过图像特征的提取和处理来进行判断,例如: 201310279205.3号中国发明专利申请公开的一种无参考型模糊图像质量评价方法,其主要是针对边缘特征进行分析处理及判断,201310123536.8号中国发明专利申请所公开的一种基于奇异值分解无参考模糊图像质量评价方法和201310123322.0号中国发明专利申请所公开的一种基于自动调焦原理无参考噪声图像质量评价方法主要是从奇异值分解角度进行分析处理再作判断,而201310421710.7号中国发明专利申请所公开的一种基于信息熵特征的无参考图像质量评价方法则是从信息熵特征角度来进行分析和判断。
目前的图像质量评估方法存在算法复杂、计算量大的特点,并且主要是根据图像特征的计算、从图像是否受光照影响以及是否存在焦距模糊两方面进行判定,这种方法具有两大缺陷:1)因计算复杂不适合在手机上用作图像质量判断;2)通过部分图像特征判断图像质量好坏,不能直接决定OCR的识别效果,在实际测试中发现不少被判为图像质量不好的图像的文本也能被正确识别,也有被认为图像质量好的图像的文本识别率却很低的情况。
发明内容
本发明实施例所要解决的技术问题在于,提供一种手机拍照文本图像质量评估方法,能更加简捷地对手机拍照识别的图像质量进行有效评价。
为了解决上述技术问题,本发明采用如下技术方案:一种手机拍照文本图像质量评估方法,其包括以下步骤:
OCR采样识别步骤,对手机拍照文件进行采样,随机抽取nSample份图像分块,每一份图像分块即作为一个采样区域进行OCR识别,获得采样区域内每一个识别字符的置信度;
计算置信度步骤,根据OCR采样识别获得的每一个识别字符的置信度计算出该手机拍照文件的置信度;以及
图像质量评价步骤,根据计算出来的手机拍照文件的置信度从预存的图像质量-置信度查询表获得图像质量数值后在手机界面上显示出来。
进一步地,OCR采样识别步骤中,先对手机拍照所得的图像进行灰度化和二值化处理,再按照采样面积在图像中随机抽取nSample份图像分块。
进一步地,所述二值化处理利用高反差二值化的原理,其首先对原图进行复制获得复制图,并将原图依次经高斯模糊处理、反色处理和不透明度处理所获得的图像与复制图进行线性光叠加处理,获得高反差图。
进一步地,在进行OCR识别之前,先对每一采样区域的边界字符进行预处理,以消除采样过程中产生的不完整字符对OCR识别的影响。
进一步地,所述预处理是利用连通域算法直接去除边界处周边一圈的字符。
进一步地,所述计算置信度步骤具体又包括:
首先,对于每一个采样区域中所有字符进行置信度相加并求均值的方法得出该采样区域的置信度ci;
然后,采取各采样区域置信度ci加权和的方式计算整个拍照图像的置信度C,其计算公式如下:
其中,c i、x i分别表示第i个采样区域的置信度和加权系数,而所述加权系数x i是对每一个采样区域计算出的字符密度进行归一化处理,按照以下公式计算而得:
其中,p i表示第i个采样区域的字符密度,其按照以下公式计算而得:
。
进一步地,所述图像质量-置信度查询表是利用所述计算置信度步骤的计算文本置信度的具体方法针对所选择的OCR识别软件进行大量手机拍照图像的测试,对测试结果进行汇总后而得出的置信度和图像质量的对应关系表,所述图像质量是指通过对照拍照图像,统计使用所选择的OCR识别软件识别的字符中识别正确的字符所占的比例。
进一步地,图像质量评价步骤中,图像质量评价步骤中,当图像的置信度大于或等于置信度-图像质量关系曲线的拐点值时,判定图像质量较好,否则,判定图像质量较差,所述拐点采用二阶导数方法确定。
进一步地,图像质量评价步骤中,在手机界面上显示的还有图像质量好坏的判定结果。
进一步地,所述图像质量数值和图像质量好坏的判定结果以弹出框方式在手机界面上显示出来。
本发明实施例有益效果是:通过分析采样区域和图像的置信度,以置信度为依据可以快速确定和判断图像质量高低好坏,并能更加直观、形象地反映出所拍照的文本图像的质量好坏,有助于用户快速了解拍照文本的图像质量,以确定是否需要重新拍摄。
附图说明
图1是本发明手机拍照文本图像质量评估方法的流程图。
图2是本发明手机拍照文本图像质量评估方法的OCR采样识别步骤中的高反差二值化处理的流程图。
图3是本发明手机拍照文本图像质量评估方法的图像质量-置信度对应关系图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本申请作进一步详细说明。
请参考图1,本发明提供一种手机拍照文本图像质量评估方法,其包括如下步骤:
OCR采样识别步骤,对手机拍照文件进行OCR采样识别;
计算置信度步骤,根据OCR采样识别的结果计算出该手机拍照文件的置信度;以及
图像质量评价步骤,根据计算出来的置信度从预存的图像质量-置信度查询表获得图像质量数值后在手机界面上显示出来。
其中,OCR采样识别步骤中,首先对手机拍照所得的图像进行灰度化和二值化处理,而后利用面积采样进行OCR识别。
其中,所述二值化处理可以利用高反差二值化的原理,图2示出了高反差二值化处理的流程图,其首先对原图进行复制获得复制图,并将原图依次经高斯模糊处理、反色处理和不透明度处理所获得的图像与复制图进行线性光叠加处理,获得高反差图。由于高反差中使用了高斯模糊和线性光叠加的原理,对拍照图像中存在的微弱光照变化具有平滑滤波的作用,从而使经过高反差后进行二值化能够得到较好的二值化效果。
而面积采样识别时,设拍照图像的长为Width,宽为Height,长和宽的单位均为像素,则图像的面积为Height*Width,采样面积SampleArea为:
(公式1)
以上公式(1)中的nBlock为拍照图像分块数,现有的主流手机像素及其图像分块数的对应关系如下表:
表1 手机像素与图像分块数对应表
手机像素 | 300万 | 500万 | 800万 | 1000万 |
图像分块数 | 64 | 100 | 144 | 196 |
按照上面的采样面积在图像中随机抽取nSample份图像分块,每一份图像分块即作为一个采样区域进行后续OCR识别。
在进行OCR识别之前,需要对每一采样区域的边界字符进行预处理,以消除采样过程中产生的不完整字符对OCR识别的影响,具体实施时,可利用连通域算法直接去除边界处周边一圈的字符,从而可有效简化预处理的过程。
对于每一采样区域可利用现有的各种OCR识别软件进行文本识别,OCR识别软件在识别时记录一个重要的信息,即该识别字符的置信度,也就是识别的正确率估值。OCR识别软件可以采用常见的各种商用的软件,例如ABBYY公司的Fine Reader软件或国产的汉王OCR软件等,也还可以选择开源的、比较简单的OCR识别软件,只要该软件识别性能稳定,即可作为图像质量判定的处理工具。
所述计算置信度步骤中,首先,对于每一个采样区域中所有字符进行置信度相加并求均值的方法得出该采样区域的置信度ci:
(公式2)
上式中S i为某一采样区域中第i个字符的置信度。
而对于整个拍照图像的置信度则采取各采样区域加权和的方式计算,具体计算过程如下:
首先,计算采样区域的字符密度,公式如下:
(公式3)
通过计算字符密度,可有助于使得字符密度较大的采样区域(也就是包含字符信息多)在置信度计算中权重较大,反之则较小,具体将通过后文中提到的加权系数进行表征。
然后,对每一个采样区域计算出的字符密度进行归一化处理得出加权系数,公式如下:
(公式4)
以上公式(4)中x i、p i分别表示第i个采样区域的加权系数和字符密度。
最后,图像文本识别的置信度C通过以下公式(5)计算而得:
(公式5)
以上公式(5)中,C表示拍照的文本图像的置信度,c i、x i分别表示第i个采样区域的置信度和加权系数。
所述图像质量评价步骤中,根据计算获得拍照的文本图像的置信度从预存的图像质量-置信度查询表中查得图像质量数值,并将该图像质量数值通过手机界面上显示出来,具体可以设计成以弹出框显示给用户。
所述图像质量-置信度查询表是利用以上计算置信度步骤中所述的计算文本置信度的方法针对所选择的OCR识别软件进行大量手机拍照图像的测试,所述图像质量是指通过对照拍照图像,统计使用所选择的OCR识别软件识别的字符中识别正确的字符所占的比例。
对测试结果进行汇总,可得出如图2所示的曲线图,并根据置信度和图像质量的对应关系而获得图像质量-置信度查询表,预先存入手机。针对每一个OCR识别软件均设置一个图像质量-置信度查询表,以下表2及表3分别给出了汉王识别软件和Fine Reader识别软件所对应的图像质量-置信度查询表:
表2 汉王OCR识别软件的图像质量-置信度查询表
置信度 | 0 | 10% | 20% | 30% | 40% | 50% | 60% | 70% | 80% | 90% | 100% |
图像质量 | 0 | 0.12 | 0.31 | 0.53 | 0.69 | 0.82 | 0.91 | 0.96 | 0.99 | 0.99 | 1 |
表3 Fine Reader识别软件图像质量-置信度查询表
置信度 | 0 | 10% | 20% | 30% | 40% | 50% | 60% | 70% | 80% | 90% | 100% |
图像质量 | 0 | 0.11 | 0.27 | 0.53 | 0.68 | 0.81 | 0.90 | 0.95 | 0.98 | 0.99 | 1 |
借助于上述图像质量-置信度查询表,可以通过图像置信度简明、快速地查询对应的图像质量。
手机界面显示的信息也还可以进一步包括图像质量好坏的判定结果,而图像质量好坏的判定标准也是预先定义的,通常是依据图3所示的曲线的走势,主要是根据曲线上的拐点确定,对手机拍照图像质量好坏进行定义,所述拐点采用二阶导数方法确定。以汉王OCR识别软件为例,可以定义:当图像的置信度大于或等于70%时,判定图像质量较好,否则,判定图像质量较差。
以上所述是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。