CN112532884A - 识别方法、装置及电子设备 - Google Patents
识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112532884A CN112532884A CN202011361267.5A CN202011361267A CN112532884A CN 112532884 A CN112532884 A CN 112532884A CN 202011361267 A CN202011361267 A CN 202011361267A CN 112532884 A CN112532884 A CN 112532884A
- Authority
- CN
- China
- Prior art keywords
- image
- identification
- recognition result
- content
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/141—Image acquisition using multiple overlapping images; Image stitching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/71—Circuitry for evaluating the brightness variation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/73—Circuitry for compensating brightness variation in the scene by influencing the exposure time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/75—Circuitry for compensating brightness variation in the scene by influencing optical camera components
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Studio Devices (AREA)
Abstract
本申请公开了一种识别方法、装置及电子设备,属于通信技术领域。该识别方法包括:在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;根据调整后的所述拍摄参数,采集第二图像;对目标图像进行识别,得到对应的识别结果;其中,所述目标图像包括所述第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。这样在采集到的第一图像中包括反光区域的情况下,可以通过调整拍摄参数,消除或者减少反光区域对应的特征信息的反光,以便采集对应的第二图像,进而降低图像识别过程中反光区域对识别结果的影响,提升识别结果的准确度。
Description
技术领域
本申请属于通信技术领域,具体涉及一种识别方法、装置及电子设备。
背景技术
目前,在将写一些印刷物等实体文档转化为电子文档的过程中,一般采用扫描识别的方式,以提高文档的转化效率。然而,在一些特殊的扫描场景下,被扫描文档的扫描图像会存在反光区域,导致在对扫描图像进行识别的过程中,会由于反光区域的存在,导致识别结果也存在不清楚的部分。
可见,在图像存在反光区域的情况下,图像的内容识别存在识别效果差的问题。
发明内容
本申请实施例的目的是提供一种识别方法、装置及电子设备,能够解决在图像存在反光区域的情况下,图像的内容识别存在识别效果差的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种识别方法,包括:
在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;
根据调整后的所述拍摄参数,采集第二图像;
对目标图像进行识别,得到对应的识别结果;
其中,所述目标图像包括所述第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。
第二方面,本申请实施例提供了一种识别装置,包括:
调整模块,用于在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;
采集模块,用于根据调整后的所述拍摄参数,采集第二图像;
识别模块,用于对目标图像进行识别,得到对应的识别结果;
其中,所述目标图像包括所述第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
在本申请实施例中,在采集到的第一图像中包括反光区域的情况下,可以通过调整拍摄参数,消除或者减少反光区域对应的特征信息的反光,以便采集对应的第二图像,进而降低图像的识别过程中反光区域对识别结果的影响,提升识别结果的准确度。
附图说明
图1是本申请一实施例提供的识别方法的流程图;
图2a是本申请实施例提供的操作示意图之一;
图2b是本申请实施例提供的操作示意图之二;
图2c是本申请实施例提供的操作示意图之三;
图3是本申请实施例一实施例提供的识别装置的结构图;
图4是本申请实施例一实施例提供的电子设备的结构图;
图5是本申请实施例另一实施例提供的电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的识别方法进行详细地说明。
参见图1,图1是本申请一实施例提供的识别方法的流程图,本申请实施例提供的识别方法可以应用于包括摄像头的电子设备,如图1所示,该识别方法包括以下步骤:
步骤101、在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数。
该步骤中,拍摄参数包括光圈、焦点中的至少一项,即可以通过调整摄像头的光圈、焦点的方式消除或者减少反光,以便采集对应的图像。
其中,在对目标对象进行扫描识别的过程中,可以先采集目标对象的图像,然后识别图像的内容;若在识别图像的内容的过程中,识别到图像中存在反光区域,则执行步骤101,以便采集对应的图像。
一个实施例中,目标对象可以是文档,也可以是图片。
比如,在目标对象为文档的情况下,在对文档进行扫描的识别的过程中,可以先采集文档的扫描图像;在采集到文档的扫描图像后,可以通过提取文字区域特征的方式,对扫描图像进行识别。其中,文字区域特征包括扫描图像的纹理、色差、光线、前后色差对比特征等。
而且,在提取文字区域特征的过程中,可以扫描图像的轮廓曲度最大或者轮廓特征的地方抽取关键的特征信息,以便判断扫描图像是否存在反光区域或曲面区域。
进一步的,可以通过收集用户确认的有反光的照片作为参照物,并通过提取扫描图像的关键特征信息,并将提取的关键特征信息与参照物同处关键特征信息进行比对。其中,标准化关键特征信息分别形成参照物特征向量a和待定照片特征向量b,计算关键特征信息向量a与b的相似度;例如,相似度可以取为a和b的二范数,如果相似度在一定阈值范围内则判断扫描图像存在反光区域。
在确定扫描图像存在反光区域的情况下,则可以通过调整摄像头的拍摄参数,以减少或者消除文档的反光,以便采集对应的图像。
步骤102、根据调整后的所述拍摄参数,采集第二图像。
该步骤中,第二图像可以与反光区域关联的图像,即通过调整拍摄参数的方式,减少或消除反光区域对应的特征信息的反光,以便采集对应的第二图像。
比如,第一图像的反光区域对应的图像特征为特征A,则可以通过调整拍摄参数的方式减少或者消除目标对象的特征A的反光,以使采集到的第二图像中的特征A对应的图像区域没有反光。
步骤103、对目标图像进行识别,得到对应的识别结果。
该步骤中,目标图像包括第二图像,或者,目标图像根据第一图像和第二图像得到。
其中,针对目标图像包括第二图像的情况下,即第二图像可以是目标对象的整体扫描图像,且第二图像中未存在反光区域,因此可以通过对第二图像进行识别,以得到目标对象对应的识别结果。
进一步的,针对目标图像包括第一图像和第二图像的情况下,即第二图像仅是目标对象的局部扫描图像,甚至第二图像可以仅是第一图像中与反光区域关联的图像特征对应的图像;则可以分别识别第一图像的内容,以及第二图像的内容,并基于识别到的内容进行合成处理,以得到目标对象对应的识别结果。
另外,针对目标对象根据第一图像和第二图像得到的情况,可以先将第一图像和第二图像进行融合,以得到目标图像,然后对目标图像进行识别,以得到对应的识别结果。
这样在采集到的第一图像中包括反光区域的情况下,可以通过调整拍摄参数,消除或者减少反光区域对应的特征信息的反光,以便采集对应的第二图像,进而降低图像识别过程中反光区域对识别结果的影响,提升识别结果的准确度。
需要说明的是,目标对象还可以包括其他扫描图像。
可选的,其他扫描图像中包括存在曲面区域的扫描图像,则可以对包括曲面区域的扫描图像进行平铺处理,以便对包括曲面区域的扫描图像进行识别;或者,其他扫描图像中包括存在模糊区域的扫描图像,则可以对包括模糊区域的扫描图像进行去模糊化处理,以便对包括模糊区域的扫描图像进行识别。这样可以提升其他扫描图像的识别结果的准确度。
这样,在获取目标对象的识别结果的过程中,可以将目标图像对应的识别结果与目标对象的其他扫描图像对应的识别结果进行合并处理,以便得到目标对象的识别结果。
其中,在目标图像对应的识别结果与目标对象的其他扫描图像对应的识别结果进行合并处理中,可以基于图像间的共有区域的识别内容作为合并的衔接位置,以提升合并处理的准确度,进而提升识别结果的准确度。
可选的,所述目标图像包括所述第一图像和所述第二图像,所述对目标图像进行识别,得到对应的识别结果,包括:
对所述第一图像进行识别,得到第一识别结果;
对所述第二图像进行识别,得到第二识别结果;
基于所述第一识别结果和所述第二识别结果确定所述第一图像和所述第二图像的公共区域的识别内容;
基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到所述目标图像对应的识别结果。
本实施方式中,可以将公共区域的识别内容,作为第一识别结果和第二识别结果的衔接内容,以提升合并处理的准确度,进而提升识别结果的准确度。
比如,在目标对象为文档的情况下,在对第一图像进行识别的过程中,可以识别第一图像中的字符信息,还可以记录每个字符的位置信息,以得到第一识别结果;相应的,也可以识别第二图像中的字符信息,以及记录每个字符的位置信息,以得到第二识别结果。
进一步可选的,所述基于所述第一识别结果和所述第二识别结果确定所述第一图像和所述第二图像的公共区域的识别内容,包括:获取所述第一识别结果中第一字符的字符信息和位置信息;获取所述第二识别结果中第二字符的字符信息和位置信息;在所述第一字符的字符信息和位置信息与所述第二字符的字符信息和位置信息均相同的情况下,将所述第一字符或者所述第二字符作为所述第一图像和所述第二图像的公共区域的识别内容。
一个实施例中,可以通过计算字符的行数和坐标信息,确定字符的位置信息。
另一个实施例中,可以记录每个字符上下左右四个方形分布的字符信息,每个方向可以记录一个或者多个字符,具体数量可以根据实际需求进行调整,以尽量保证每个字符周围相邻的字符分布的唯一性,从而保证字符的位置信息的准确性。
这样可以提升第一图像和第二图像的公共区域的识别内容的准确度,进而提升合并处理的准确度。
可选的,所述基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到所述目标图像对应的识别结果,包括:
基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到合并识别结果;
获取与所述第一识别结果关联的第一内容,以及与所述第二识别结果关联的第二内容;
基于所述第一内容和所述第二内容,对所述合并识别结果进行校验,得到所述目标图像对应的识别结果。
本实施方式中,对于识别到的识别结果,可以通过在线搜索功能,获取与识别结果关联的内容,即获取与识别结果相似度高的内容,并将其对合并识别结果进行校验,避免识别结果的缺少,以进一步提升识别结果的准确度。
比如,在识别的结果有明显的错误,或者因为拍摄的瑕疵问题导致文档部分内容缺失没法识别的情况下,可以将检索获取到的第一内容、第二内容,对合并识别结果进行补充或替换,提升合并识别结果的完整性。
可选的,所述根据调整后的所述拍摄参数,采集第二图像之后,所述对目标图像进行识别,得到对应的识别结果之前,所述方法还包括:
在所述第二图像中包括曲面区域的情况下,对所述第二图像进行平铺处理;
其中,所述目标图像包括平铺处理后的所述第二图像,或者,所述目标图像根据所述第一图像和平铺处理后的所述第二图像得到。
本实施方式中,针对第二图像存在曲面区域的情况下,可以对第二图像进行平铺处理,以降低曲面区域对第二图像的识别结果的影响。
在进行平铺处理的过程中,可以通过计算曲面区域的曲面特征,并在平铺过程中保持对应信息变换过去,以便得到平铺处理后的图像特征。
另外,在第二图像中还包括模糊区域的情况下,还可以对第二图像中的模糊区域进行去模糊化处理,以降低模糊区域对识别结果的影响。
其中,图像模糊一般有两种情况,一种是图像本身由于拍摄原因导致模糊,另一种是图像放大后比较模糊。本申请中,模糊区域的成因主要是由于拍摄原因导致的模糊;针对由于拍摄原因形成的模糊区域,可以通过平滑和强化的方式进行去模糊化处理。
在本申请的一实施方式中,针对目标对象为曲面的情况,用户可以选择拍摄策略,以降低曲面对目标对象的识别结果的影响。其中,下述实施方式中,目标对象为文档。
如图2a所示,在对包括曲面的目标对象21的识别过程中,可以选择拍摄角度的顺序,从左至右采集目标对象的扫描图像;比如,可以先采集目标对象的左侧部分的内容,并得到第一扫描图像22,如图2b所示;然后采集目标对象的右侧部分的内容,并得到第二扫描图像23,如图2c所示。
然后,可以分别对第一扫描图像22和第二扫描图像23进行识别,并提取文字信息;在识别提取文字信息的过程中,若是第一扫描图像22和第二扫描图像23中的任一个存在反光区域的情况下,则执行步骤101至103,以消除反光区域对识别结果的影响。
在本申请的另一实施方式中,可以对目标对象的某个部位进行拍摄识别,或者将目标对象按照区域位置自动划分为多个对象,并对每个对象单独进行判断识别。而且,对于采集到的目标对象的扫描图像,可以通过对扫描图像进行识别提取,并将扫描图像中的清晰区域识别出来,对于不清晰的区域进行标记。
针对识别到的清晰区域的识别信息可以先存进行存储;对不清晰的区域进行标记并编号;然后,对不清晰的区域进行重新拍摄,以便获取其对应的清晰的图像;在重新拍摄的过程中,可以基于用户的输入操作选取拍摄区域,也可以基于标记编号自动选取拍摄区域。
其中,若不清晰的区域为反光区域,则对反光区域对应的图像特征进行重新拍摄,并拍摄没有反光的图像;若不清晰的区域为曲面区域,则对曲面区域进行平铺处理,以降低曲面区域对识别结果的影响;若不清晰的区域为模糊区域,则可以对模糊区域进行去模糊化处理,以降低模糊区域对识别结果的影响。
另外,在获取到不清晰区域的清晰图像后,通过识别其内容,并可以基于其对应的标记编号与之前存储的清晰区域进行合并拼接处理,以获得目标对象的识别结果,达到提升识别结果的准确度的目的。
在本申请的又一实施方式中,在第一图像中存在反光区域的情况下,可以通过调整摄像头的拍摄参数,比如设置不同的光圈、焦点等参数,并可以拍摄多张图像存储起来,尽量使每处文字区域至少都有一张没反光的图像,以获取没有反光的第二图像。
而且,如果对拍摄的图像的去反光处理的效果不满意,还可以重新拍摄,直到获取到用户满意的去反光的图像。
本申请实施例的拍摄方法,通过在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;根据调整后的所述拍摄参数,采集第二图像;对目标图像进行识别,得到对应的识别结果;其中,所述目标图像包括第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。这样在采集到的第一图像中包括反光区域的情况下,可以通过调整拍摄参数,消除或者减少反光区域对应的特征信息的反光,以便采集对应的第二图像,进而降低图像识别过程中反光区域对识别结果的影响,提升识别结果的准确度。
需要说明的是,本申请实施例提供的识别方法,执行主体可以为识别装置,或者该识别装置中的用于执行识别方法的控制模块。本申请实施例中以识别装置执行识别方法为例,说明本申请实施例提供的识别装置。
参见图3,图3是本申请一实施例提供的识别装置的结构图,如图3所示,该识别装置300包括:
调整模块301,用于在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;
采集模块302,用于根据调整后的所述拍摄参数,采集第二图像;
识别模块303,用于对目标图像进行识别,得到对应的识别结果;
其中,所述目标图像包括所述第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。
可选的,所述目标图像包括所述第一图像和所述第二图像,所述识别模块303包括:
第一识别单元,用于对所述第一图像进行识别,得到第一识别结果;
第二识别单元,用于对所述第二图像进行识别,得到第二识别结果;
确定单元,用于基于所述第一识别结果和所述第二识别结果确定所述第一图像和所述第二图像的公共区域的识别内容;
合并单元,用于基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到所述目标图像对应的识别结果。
可选的,所述确定单元包括:
第一获取子单元,用于获取所述第一识别结果中第一字符的字符信息和位置信息;
第二获取子单元,用于获取所述第二识别结果中第二字符的字符信息和位置信息;
确定子单元,用于在所述第一字符的字符信息和位置信息与所述第二字符的字符信息和位置信息均相同的情况下,将所述第一字符或者所述第二字符作为所述第一图像和所述第二图像的公共区域的识别内容。
可选的,所述合并单元包括:
合并子单元,用于基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到合并识别结果;
第三获取子单元,用于获取与所述第一识别结果关联的第一内容,以及与所述第二识别结果关联的第二内容;
校验子单元,用于基于所述第一内容和所述第二内容,对所述合并识别结果进行校验,得到所述目标图像对应的识别结果。
可选的,所述识别装置300还包括:
平铺模块,用于在所述第二图像中包括曲面区域的情况下,对所述第二图像进行平铺处理;
其中,所述目标图像包括平铺处理后的所述第二图像,或者,所述目标图像根据所述第一图像和平铺处理后的所述第二图像得到。
本申请实施例中的识别装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为网络附属存储器(Network AttachedStorage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的识别装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的识别装置能够实现图1的方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选的,如图4所示,本申请实施例还提供一种电子设备400,包括处理器401,存储器402,存储在存储器402上并可在所述处理器401上运行的程序或指令,该程序或指令被处理器401执行时实现上述识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
参见图5,图5是本申请一实施例提供的电子设备的结构图,如图5所示,该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、以及处理器510等部件。
本领域技术人员可以理解,电子设备500还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器510,用于在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;输入单元504,用于根据调整后的所述拍摄参数,采集第二图像;处理器510,用于对目标图像进行识别,得到对应的识别结果;其中,所述目标图像包括所述第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。
可选的,所述目标图像包括所述第一图像和所述第二图像,处理器510,用于对所述第一图像进行识别,得到第一识别结果;处理器510,用于对所述第二图像进行识别,得到第二识别结果;处理器510,用于基于所述第一识别结果和所述第二识别结果确定所述第一图像和所述第二图像的公共区域的识别内容;处理器510,用于基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到所述目标图像对应的识别结果。
可选的,处理器510,用于获取所述第一识别结果中第一字符的字符信息和位置信息;处理器510,用于获取所述第二识别结果中第二字符的字符信息和位置信息;处理器510,用于在所述第一字符的字符信息和位置信息与所述第二字符的字符信息和位置信息均相同的情况下,将所述第一字符或者所述第二字符作为所述第一图像和所述第二图像的公共区域的识别内容。
可选的,处理器510,用于基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到合并识别结果;处理器510,用于获取与所述第一识别结果关联的第一内容,以及与所述第二识别结果关联的第二内容;处理器510,用于基于所述第一内容和所述第二内容,对所述合并识别结果进行校验,得到所述目标图像对应的识别结果。
可选的,处理器510,用于在所述第二图像中包括曲面区域的情况下,对所述第二图像进行平铺处理;其中,所述目标图像包括平铺处理后的所述第二图像,或者,所述目标图像根据所述第一图像和平铺处理后的所述第二图像得到。
应理解的是,本申请实施例中,输入单元504可以包括图形处理器(GraphicsProcessing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元506可包括显示面板5061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板5061。用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器509可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (12)
1.一种识别方法,其特征在于,包括:
在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;
根据调整后的所述拍摄参数,采集第二图像;
对目标图像进行识别,得到对应的识别结果;
其中,所述目标图像包括所述第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。
2.根据权利要求1所述的方法,其特征在于,所述目标图像包括所述第一图像和所述第二图像,所述对目标图像进行识别,得到对应的识别结果,包括:
对所述第一图像进行识别,得到第一识别结果;
对所述第二图像进行识别,得到第二识别结果;
基于所述第一识别结果和所述第二识别结果确定所述第一图像和所述第二图像的公共区域的识别内容;
基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到所述目标图像对应的识别结果。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一识别结果和所述第二识别结果确定所述第一图像和所述第二图像的公共区域的识别内容,包括:
获取所述第一识别结果中第一字符的字符信息和位置信息;
获取所述第二识别结果中第二字符的字符信息和位置信息;
在所述第一字符的字符信息和位置信息与所述第二字符的字符信息和位置信息均相同的情况下,将所述第一字符或者所述第二字符作为所述第一图像和所述第二图像的公共区域的识别内容。
4.根据权利要求2所述的方法,其特征在于,所述基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到所述目标图像对应的识别结果,包括:
基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到合并识别结果;
获取与所述第一识别结果关联的第一内容,以及与所述第二识别结果关联的第二内容;
基于所述第一内容和所述第二内容,对所述合并识别结果进行校验,得到所述目标图像对应的识别结果。
5.根据权利要求1所述的方法,其特征在于,所述根据调整后的所述拍摄参数,采集第二图像之后,所述对目标图像进行识别,得到对应的识别结果之前,所述方法还包括:
在所述第二图像中包括曲面区域的情况下,对所述第二图像进行平铺处理;
其中,所述目标图像包括平铺处理后的所述第二图像,或者,所述目标图像根据所述第一图像和平铺处理后的所述第二图像得到。
6.一种识别装置,其特征在于,包括:
调整模块,用于在采集到的第一图像中包括反光区域的情况下,调整摄像头的拍摄参数,所述拍摄参数包括光圈、焦点中的至少一项;
采集模块,用于根据调整后的所述拍摄参数,采集第二图像;
识别模块,用于对目标图像进行识别,得到对应的识别结果;
其中,所述目标图像包括所述第二图像,或者,所述目标图像根据所述第一图像和所述第二图像得到。
7.根据权利要求6所述的识别装置,其特征在于,所述目标图像包括所述第一图像和所述第二图像,所述识别模块包括:
第一识别单元,用于对所述第一图像进行识别,得到第一识别结果;
第二识别单元,用于对所述第二图像进行识别,得到第二识别结果;
确定单元,用于基于所述第一识别结果和所述第二识别结果确定所述第一图像和所述第二图像的公共区域的识别内容;
合并单元,用于基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到所述目标图像对应的识别结果。
8.根据权利要求7所述的识别装置,其特征在于,所述确定单元包括:
第一获取子单元,用于获取所述第一识别结果中第一字符的字符信息和位置信息;
第二获取子单元,用于获取所述第二识别结果中第二字符的字符信息和位置信息;
确定子单元,用于在所述第一字符的字符信息和位置信息与所述第二字符的字符信息和位置信息均相同的情况下,将所述第一字符或者所述第二字符作为所述第一图像和所述第二图像的公共区域的识别内容。
9.根据权利要求7所述的识别装置,其特征在于,所述合并单元包括:
合并子单元,用于基于所述公共区域的识别内容,将所述第一识别结果和所述第二识别结果进行合并处理,得到合并识别结果;
第三获取子单元,用于获取与所述第一识别结果关联的第一内容,以及与所述第二识别结果关联的第二内容;
校验子单元,用于基于所述第一内容和所述第二内容,对所述合并识别结果进行校验,得到所述目标图像对应的识别结果。
10.根据权利要求6所述的识别装置,其特征在于,所述识别装置还包括:
平铺模块,用于在所述第二图像中包括曲面区域的情况下,对所述第二图像进行平铺处理;
其中,所述目标图像包括平铺处理后的所述第二图像,或者,所述目标图像根据所述第一图像和平铺处理后的所述第二图像得到。
11.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的识别方法的步骤。
12.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的识别方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011361267.5A CN112532884B (zh) | 2020-11-27 | 2020-11-27 | 识别方法、装置及电子设备 |
PCT/CN2021/132368 WO2022111461A1 (zh) | 2020-11-27 | 2021-11-23 | 识别方法、装置及电子设备 |
US18/203,049 US20230306765A1 (en) | 2020-11-27 | 2023-05-29 | Recognition method and apparatus, and electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011361267.5A CN112532884B (zh) | 2020-11-27 | 2020-11-27 | 识别方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112532884A true CN112532884A (zh) | 2021-03-19 |
CN112532884B CN112532884B (zh) | 2022-10-14 |
Family
ID=74994215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011361267.5A Active CN112532884B (zh) | 2020-11-27 | 2020-11-27 | 识别方法、装置及电子设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230306765A1 (zh) |
CN (1) | CN112532884B (zh) |
WO (1) | WO2022111461A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113194253A (zh) * | 2021-04-28 | 2021-07-30 | 维沃移动通信有限公司 | 去除图像反光的拍摄方法、装置和电子设备 |
WO2022111461A1 (zh) * | 2020-11-27 | 2022-06-02 | 维沃移动通信有限公司 | 识别方法、装置及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005295313A (ja) * | 2004-04-01 | 2005-10-20 | Sharp Corp | コード読取装置、電子機器、パラメータの調整方法及びパラメータ調整プログラム |
CN101882308A (zh) * | 2010-07-02 | 2010-11-10 | 上海交通大学 | 提高图像拼接精度和稳定性的方法 |
CN102354363A (zh) * | 2011-09-15 | 2012-02-15 | 西北工业大学 | 高反光柱面金属上的二维条码图像识别方法 |
CN105411523A (zh) * | 2015-12-07 | 2016-03-23 | 温州医科大学眼视光器械有限公司 | 一种角膜图像处理方法 |
CN107292820A (zh) * | 2017-05-11 | 2017-10-24 | 厦门中控智慧信息技术有限公司 | 图像拼接方法及装置 |
CN108399540A (zh) * | 2018-01-19 | 2018-08-14 | 广东小天才科技有限公司 | 基于移动终端的扫码支付方法、装置、终端及存储介质 |
CN109598515A (zh) * | 2018-11-29 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 一种支付方法、支付装置及终端设备 |
CN111510623A (zh) * | 2020-04-02 | 2020-08-07 | 维沃移动通信有限公司 | 拍摄方法及电子设备 |
CN111681160A (zh) * | 2020-05-28 | 2020-09-18 | 深圳市无虚科技有限公司 | 曲面图像的还原方法、装置、设备及可读存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4599920B2 (ja) * | 2003-09-02 | 2010-12-15 | セイコーエプソン株式会社 | 画像生成装置、および画像生成方法 |
US7762466B2 (en) * | 2008-12-18 | 2010-07-27 | Symbol Technologies, Inc. | Two position zoom lens assembly for an imaging-based bar code reader |
US9342724B2 (en) * | 2014-09-10 | 2016-05-17 | Honeywell International, Inc. | Variable depth of field barcode scanner |
CN108629220A (zh) * | 2018-03-23 | 2018-10-09 | 阿里巴巴集团控股有限公司 | 一种二维码识读方法、装置及设备 |
CN108763998B (zh) * | 2018-04-17 | 2021-05-07 | 维沃移动通信有限公司 | 条形码识别方法以及终端设备 |
CN109257540B (zh) * | 2018-11-05 | 2021-06-18 | 浙江舜宇光学有限公司 | 多摄镜头组的摄影校正方法及摄影装置 |
CN110008943B (zh) * | 2019-02-11 | 2023-10-13 | 创新先进技术有限公司 | 一种图像处理方法及装置、一种计算设备及存储介质 |
CN112532884B (zh) * | 2020-11-27 | 2022-10-14 | 维沃移动通信有限公司 | 识别方法、装置及电子设备 |
-
2020
- 2020-11-27 CN CN202011361267.5A patent/CN112532884B/zh active Active
-
2021
- 2021-11-23 WO PCT/CN2021/132368 patent/WO2022111461A1/zh active Application Filing
-
2023
- 2023-05-29 US US18/203,049 patent/US20230306765A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005295313A (ja) * | 2004-04-01 | 2005-10-20 | Sharp Corp | コード読取装置、電子機器、パラメータの調整方法及びパラメータ調整プログラム |
CN101882308A (zh) * | 2010-07-02 | 2010-11-10 | 上海交通大学 | 提高图像拼接精度和稳定性的方法 |
CN102354363A (zh) * | 2011-09-15 | 2012-02-15 | 西北工业大学 | 高反光柱面金属上的二维条码图像识别方法 |
CN105411523A (zh) * | 2015-12-07 | 2016-03-23 | 温州医科大学眼视光器械有限公司 | 一种角膜图像处理方法 |
CN107292820A (zh) * | 2017-05-11 | 2017-10-24 | 厦门中控智慧信息技术有限公司 | 图像拼接方法及装置 |
CN108399540A (zh) * | 2018-01-19 | 2018-08-14 | 广东小天才科技有限公司 | 基于移动终端的扫码支付方法、装置、终端及存储介质 |
CN109598515A (zh) * | 2018-11-29 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 一种支付方法、支付装置及终端设备 |
CN111510623A (zh) * | 2020-04-02 | 2020-08-07 | 维沃移动通信有限公司 | 拍摄方法及电子设备 |
CN111681160A (zh) * | 2020-05-28 | 2020-09-18 | 深圳市无虚科技有限公司 | 曲面图像的还原方法、装置、设备及可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022111461A1 (zh) * | 2020-11-27 | 2022-06-02 | 维沃移动通信有限公司 | 识别方法、装置及电子设备 |
CN113194253A (zh) * | 2021-04-28 | 2021-07-30 | 维沃移动通信有限公司 | 去除图像反光的拍摄方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2022111461A1 (zh) | 2022-06-02 |
CN112532884B (zh) | 2022-10-14 |
US20230306765A1 (en) | 2023-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20110311100A1 (en) | Method, Apparatus and Computer Program Product for Providing Object Tracking Using Template Switching and Feature Adaptation | |
US20230306765A1 (en) | Recognition method and apparatus, and electronic device | |
CN110008997B (zh) | 图像纹理相似度识别方法、装置及计算机可读存储介质 | |
CN104239909A (zh) | 一种图像的识别方法和装置 | |
US20180352186A1 (en) | Method for estimating a timestamp in a video stream and method of augmenting a video stream with information | |
CN111290684B (zh) | 图像显示方法、图像显示装置及终端设备 | |
CN103198311A (zh) | 基于拍摄的图像来识别字符的方法及装置 | |
CN112651953B (zh) | 图片相似度计算方法、装置、计算机设备及存储介质 | |
CN112396050B (zh) | 图像的处理方法、设备以及存储介质 | |
CN113688820A (zh) | 频闪条带信息识别方法、装置和电子设备 | |
CN113194253A (zh) | 去除图像反光的拍摄方法、装置和电子设备 | |
CN114494751A (zh) | 证照信息识别方法、装置、设备及介质 | |
CN113225451B (zh) | 图像处理方法、装置和电子设备 | |
CN113486738A (zh) | 指纹识别方法、装置、电子设备和可读存储介质 | |
CN113128244A (zh) | 扫描方法、装置及电子设备 | |
CN111274602B (zh) | 一种图像特征信息替换方法、装置、设备及介质 | |
JP2006323779A (ja) | 画像処理方法、画像処理装置 | |
JP6669390B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN110619597A (zh) | 一种半透明水印去除方法、装置、电子设备及存储介质 | |
CN112749769B (zh) | 图形码检测方法、装置、计算机设备及存储介质 | |
CN114565777A (zh) | 数据处理方法和装置 | |
WO2017219562A1 (zh) | 一种二维码生成方法及装置 | |
CN114125226A (zh) | 图像拍摄方法、装置、电子设备和可读存储介质 | |
CN112637588A (zh) | 检测摄像头污损的方法、装置和电子设备 | |
CN112150486A (zh) | 图像处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |