CN112686959B - 待识别图像的矫正方法及装置 - Google Patents

待识别图像的矫正方法及装置 Download PDF

Info

Publication number
CN112686959B
CN112686959B CN201910995611.7A CN201910995611A CN112686959B CN 112686959 B CN112686959 B CN 112686959B CN 201910995611 A CN201910995611 A CN 201910995611A CN 112686959 B CN112686959 B CN 112686959B
Authority
CN
China
Prior art keywords
image
identified
parameters
determining
view
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910995611.7A
Other languages
English (en)
Other versions
CN112686959A (zh
Inventor
李刚
王海飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Cainiao Smart Logistics Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cainiao Smart Logistics Holding Ltd filed Critical Cainiao Smart Logistics Holding Ltd
Priority to CN201910995611.7A priority Critical patent/CN112686959B/zh
Publication of CN112686959A publication Critical patent/CN112686959A/zh
Application granted granted Critical
Publication of CN112686959B publication Critical patent/CN112686959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Character Input (AREA)

Abstract

本申请公开了一种待识别图像的矫正方法、装置、计算机设备及可读存储介质。所述方法包括:获取待识别图像;从待识别图像中,确定标定图像;根据标定图像,确定转换参数;根据转换参数,将待识别图像转换为正视图。本申请实施例利用待识别图像中的标定图像,对拍摄待识别图像的拍摄设备进行标定,得到转换参数,并利用转换参数,将待识别图像转换为正视图,使得后续在对该正视图中的文字进行光学字符识别操作,以及对正视图中图形编码区域进行识别操作的过程中,降低了识别误差。

Description

待识别图像的矫正方法及装置
技术领域
本申请涉及图像处理技术领域,具体涉及待识别图像的矫正方法、装置、计算机设备及可读存储介质。
背景技术
随着电子商务的迅猛发展,在很多场景下,需要对待识别图像进行识别,从而获取其中的信息。例如,在快递分拣和配送流程中,快递员能够对包裹上贴附的待识别图像,进行快速并准确的光学字符识别(OCR,Optical Character Recognition),是保证包裹在分拣和配送系统中高效流转的先决条件。
现有的方法,为了获取待识别图像中准确的信息,通常采用方式为:在光学字符识别终端生成操作指导信息,以提示用户主动将光学字符识别终端(比如扫码枪)的识别口尽量正对待识别图像,实现对待识别图像的光学字符识别。
但是,现有的方法中,在光学字符识别终端额外生成操作指导信息,会增加对待识别图像的光学字符识别操作的繁琐度,提高了用户操作成本。
申请内容
本申请实施例提供了一种待识别图像的矫正方法,以解决提示用户将光学字符识别终端的识别口尽量正对待识别图像导致的识别待识别图像过程中的操作繁琐的问题。
相应的,本申请实施例还提供了一种待识别图像的矫正装置,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种待识别图像的矫正方法,所述的方法包括:
获取待识别图像;
从所述待识别图像中,确定标定图像;
根据所述标定图像,确定转换参数;
根据所述转换参数,将所述待识别图像转换为正视图。
本申请实施例还公开了一种待识别图像的矫正装置,所述装置包括:
获取模块,用于获取待识别图像;
第一确定模块,用于从所述待识别图像中,确定标定图像;
第二确定模块,用于根据所述标定图像,确定转换参数;
转换模块,用于根据所述转换参数,将所述待识别图像转换为正视图。
本申请实施例还公开了一种计算机设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例中一个或多个所述的待识别图像的矫正方法。
本申请实施例还公开了一个或多个机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例中一个或多个所述的待识别图像的矫正方法。
与现有技术相比,本申请实施例包括以下优点:
在本申请实施例中,包括:获取待识别图像;从待识别图像中,确定标定图像;根据标定图像,确定转换参数;根据转换参数,将待识别图像转换为正视图。本申请实施例利用待识别图像中的标定图像,对拍摄待识别图像的拍摄设备进行标定,得到转换参数,并利用转换参数,将待识别图像转换为正视图,使得后续在对该正视图中的文字进行光学字符识别操作,以及对正视图中图形编码区域进行扫码识别操作,可以不需要用户将光学字符识别终端尽量正对待识别图像也能提高识别准确率,降低用户的操作繁琐程度,降低了光学字符识别终端在未正对待识别图像的情况下的识别误差。
附图说明
通过阅读下文可选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出可选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请提供的一种待识别图像的矫正方法的系统架构图;
图2示出了根据本申请实施例提供的一种待识别图像的实际场景图;
图3示出了根据本申请实施例提供的另一种待识别图像的实际场景图;
图4示出了根据本申请实施例的一种待识别图像的矫正方法的步骤流程图;
图5示出了根据本申请实施例的一种待识别图像的矫正方法的具体步骤流程图;
图6示出了根据本申请实施例提供的另一种待识别图像的实际场景图;
图7示出了根据本申请实施例提供的另一种待识别图像的实际场景图;
图8示出了根据本申请实施例提供的另一种待识别图像的实际场景图;
图9示出了根据本申请实施例的另一种待识别图像的矫正方法的具体步骤流程图;
图10示出了根据本申请实施例提供的一种标准棋盘格图像;
图11示出了根据本申请实施例提供的一种快递面单的图像;
图12示出了根据本申请实施例提供的另一种快递面单的图像;
图13示出了根据本申请实施例提供的另一种快递面单的图像;
图14示出了根据本申请实施例的一种待识别图像的矫正装置的结构框图;
图15示出了可被用于实现本公开中所述的各个实施例的示例性系统。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,其示出了本申请实施例的一种实现架构图,其至少可以包括:
拍摄设备10、图像处理设备20和待识别物30。
其中,拍摄设备10可以为移动终端摄像头、灰度拍摄设备、普通摄像头等用于拍摄图像的设备,当拍摄设备10对待识别物30拍摄完成后,可以将拍摄完成的待识别图像传输至图像处理设备20进行处理。
图像处理设备20可以基于计算机视觉算法,对拍摄设备10发送的图像进行处理,需要说明的是,在一些情况下,图像处理设备20可以与拍摄设备10集成设置为一体,如,当拍摄设备10为移动终端摄像头时,图像处理设备20可以为移动终端中的图像处理器。在一些情况下,图像处理设备20可以与拍摄设备10相互独立设置,如,当拍摄设备10为移动终端摄像头时,图像处理设备20可以为具有图像处理功能的服务器。
待识别物30可以是快递行业在运送货物的过程中用以记录发件人、收件人以及产品重量、价格等相关信息的单据,也可以为其他能够用于拍摄的单据,如电影票、汽车票等。对于快递面单,目前快递行业多采用条码快递单,以保证快递行业的连续数据输出,便于管理,条码快递单贴附于快递包裹表面,且具有用于记录包裹信息的图形编码区域,图形编码区域可以作为对拍摄设备进行拍摄设备标定的标定图像。另外,待识别物30也可以包括标定图像,标定图像可以为图形编码区域,也可以为其他标定图案。
在本申请实施例中,针对于拍摄设备10拍摄待识别物30时的三维场景,由于拍摄设备10很难做到在每次拍摄待识别物30时,都将镜头完全与待识别物30保持水平,这样就会使得在拍摄设备10拍摄得到如图2所示的待识别图像40,该待识别图像40为非正视图,其中的文字和图形编码区域存在倾斜畸变,导致在对该待识别图像40中的文字进行光学字符识别操作,以及对该待识别图像40中的图形编码区域进行扫码识别操作时,存在较大的识别误差。
另外,图形编码区域中可以记录有条形码、二维码、标准棋盘格等编码,其中,条形码(barcode)是将宽度不等,长度相同的多个黑条和空白,按照一定的编码规则排列,形成总长和总宽固定的图形编码区域。条形码用以表达一组信息的图形标识符,常见的条形码是由反射率相差很大的黑条和白条排成的平行线图案,易于被识别。
在本申请实施例中,可以利用具有固定长宽、以及固定内部排列规则的图形编码区域,对拍摄设备10进行拍摄设备标定,得到转换参数,并利用转换参数,将存在倾斜畸变的待识别图像40,转换为如图3所示的正视图50。在得到待识别图像40对应的正视图50后,对该正视图50中文字进行光学字符识别操作,以及对该正视图50中图形编码区域进行识别操作时,降低了识别误差。
具体的,拍摄设备10对待识别物30进行拍摄,相当于将现实中三维的待识别物30映射到二维的待识别图像中的过程,对拍摄设备10进行拍摄设备标定,其原理为在图像测量过程以及机器视觉应用中,为确定空间拍摄物体表面某点的三维几何位置与其在二维图像中对应点位之间的相互关系,根据该相互关系,可以建立拍摄设备成像的几何模型,这些几何模型的参数可以为转换参数,例如,转换参数可以包括:内参数、外参数、畸变参数、根据内参数、外参数求得的单应矩阵参数等。在大多数条件下,这些参数必须通过实验与计算才能得到,这个求解参数的过程就称之为拍摄设备标定。
在本申请实施例的一种实现方式中,参照图2,假设标定图像401包括标准棋盘格图像4013,标准棋盘格图像4013包括黑白相间的多个矩形方阵,其中,方阵与方阵之间相交的点为角点,而不与标准棋盘格图像4013的外边缘重合的角点为内角点,图2示出的标准棋盘格图像4013中,具有54个内角点,采用标准棋盘格进行拍摄设备标定的方式通常也称作张正友标定法。在图像处理设备20获取到包括标准棋盘格图像4013的待识别图像40时,可以将标准棋盘格图像4013中的54个内角点的坐标进行提取,并导入到拍摄设备成像的几何模型中,经过将54个内角点的三维位置映射到图像的二维位置的过程,最终拍摄设备成像的几何模型可以输出转换参数。
在本申请实施例的另一种实现方式中,参照图2,假设标定图像401包括条形码区域4012,条形码区域4012包括黑白相间的多个长度相同的黑色矩形方阵,其中,多个黑色矩形方阵按照一定的编码规则排列,形成总长和总宽固定的图形编码区域,图2示出的条形码区域4012,具有固定的长度和宽度。在图像处理设备20获取到包括条形码区域4012的待识别图像40时,可以将条形码区域4012中的四个顶点的初始坐标进行提取,并根据条形码区域4012固定的长度和宽度,计算出在正视图视角下,条形码区域4012中四个顶点的正视图坐标,根据将四个顶点的初始坐标转换为正视图坐标的转换关系,可以得到转换参数。
在本申请实施例中,通过获取待识别图像;从待识别图像中,确定标定图像;根据标定图像,确定转换参数;根据转换参数,将待识别图像转换为正视图。本申请实施例利用待识别图像中的标定图像,对拍摄待识别图像的拍摄设备进行标定,得到转换参数,并利用转换参数,将待识别图像转换为正视图,使得后续在对该正视图中的文字进行光学字符识别操作,以及对正视图中图形编码区域进行识别操作,可以不需要用户将光学字符识别终端尽量正对待识别图像也能提高识别准确率,降低用户的操作繁琐程度,降低了光学字符识别终端在未正对待识别图像的情况下的识别误差。
参照图4,示出了根据本申请实施例的一种待识别图像的矫正方法实施例的流程图,该方法具体可以包括以下步骤:
步骤101,获取待识别图像。
在本申请实施例中,参照图1,拍摄设备10可以为移动终端摄像头、灰度拍摄设备、普通摄像头等用于拍摄图像的设备,当拍摄设备10对待识别物30进行拍摄后,可以将拍摄完成的待识别图像传输至图像处理设备20进行处理。
步骤102,从所述待识别图像中,确定标定图像。
在本申请实施例中,待识别图像中标定图像包括的条形码区域、二维码区域、标准棋盘格图像等图形编码,都包括黑白相间的矩形色块,且矩形色块之间按照预设规则进行排布,所有矩形色块组合形成固定长度和固定宽度的标定图像。
因此,基于标定图像中黑白色块的规律性排布方式,可以建立对应的深度学习模型,该深度学习模型用于以待识别图像为输入,以待识别图像中的标定图像的区域为输出。
步骤103,根据所述标定图像,确定转换参数。
在本申请实施例的一种实现方式中,参照图2,假设标定图像401包括标准棋盘格图像4013,标准棋盘格图像4013包括黑白相间的多个矩形方阵,其中,方阵与方阵之间相交的点为角点,而不与标准棋盘格图像4013的外边缘重合的角点为内角点,图2示出的标准棋盘格图像4013中,具有54个内角点,采用标准棋盘格进行拍摄设备标定的方式通常也称作张正友标定法。在图像处理设备20获取到包括标准棋盘格图像4013的待识别图像40时,可以将标准棋盘格图像4013中的54个内角点的坐标进行提取,并导入到拍摄设备成像的几何模型中,经过将54个内角点的三维位置映射到图像的二维位置的过程,最终拍摄设备成像的几何模型可以输出转换参数。
在本申请实施例的另一种实现方式中,参照图2,假设标定图像401包括条形码区域4012,条形码区域4012包括黑白相间的多个长度相同的黑色矩形方阵,其中,多个黑色矩形方阵按照一定的编码规则排列,形成总长和总宽固定的图形编码区域,图2示出的条形码区域4012,具有固定的长度和宽度。在图像处理设备20获取到包括条形码区域4012的待识别图像40时,可以将条形码区域4012中的四个顶点的初始坐标进行提取,并根据条形码区域4012固定的长度和宽度,计算出在正视图视角下,条形码区域4012中四个顶点的正视图坐标,根据将四个顶点的初始坐标转换为正视图坐标的转换关系,可以得到转换参数。
步骤104,根据所述转换参数,将所述待识别图像转换为正视图。
在该步骤中,在得到转换参数之后,可以将转换参数与待识别图像中各个像素点的坐标进行叠加,得到正视图视角下各个像素点的新坐标,从而根据这些像素点的新坐标,得到正视图。
在具体实现中,可以通过开源计算机视觉库(opencv,Open Source ComputerVision Library)中相关的获取转换参数的代码实现转换参数的获取,以及通过开源计算机视觉库中相关的正视图转换的代码实现将待识别图像转换为正视图,另外,上述过程还可以通过由MATLAB(矩阵实验室)软件中的calibration工具进行实现,本申请对此不做限定。
综上所述,本申请实施例提供的一种待识别图像的矫正方法,包括:获取待识别图像;从待识别图像中,确定标定图像;根据标定图像,确定转换参数;根据转换参数,将待识别图像转换为正视图。本申请实施例利用待识别图像中的标定图像,对拍摄待识别图像的拍摄设备进行标定,得到转换参数,并利用转换参数,将待识别图像转换为正视图,使得后续在对该正视图中的文字进行光学字符识别操作,以及对正视图中图形编码区域进行扫码识别操作,可以不需要用户将光学字符识别终端尽量正对待识别图像也能提高识别准确率,降低用户的操作繁琐程度,降低了光学字符识别终端在未正对待识别图像的情况下的识别误差。
参照图5,示出了根据本申请实施例的一种待识别图像的矫正方法实施例的具体流程图,该方法具体可以包括以下步骤:
步骤201,获取待识别图像。
该步骤具体可以参照上述步骤101,此处不再赘述。
步骤202,从所述待识别图像中,确定标定图像。
该步骤具体可以参照上述步骤102,此处不再赘述。
可选的,参照图6,待识别图像40包括待识别物30的图像区域,待识别物30的角点设置有识别标记403,步骤202具体可以包括:
子步骤2021,确定所述待识别图像中的识别标记。
在本申请实施例中,由于待识别物30的四个角点设置了较易识别的识别标记403,因此,在获取到待识别图像40之后,可以从待识别图像40中确定识别标记403。其中识别标记403可以为任一形状,且具有能够显著与背景进行区分的某种颜色的图形、图案或者特殊符号,比如图6中的设定大小的黑色的圆点,“э”等,本申请实施例不对其加以限制。
子步骤2022,根据所述识别标记,确定所述待识别图像中待识别物的图像区域。
在本申请实施例中,确定了待识别图像40中的识别标记403之后,可以根据识别标记403的分布位置,按照待识别物的具体形状,以识别标记403为角点,确定待识别物的图像区域。由于识别标记预先划定了待识别图像所在区域,比如图6中的四个圆点划定了待识别物30所在的矩形区域,因此可以通过识别标记快速找到待识别图像,降低了待识别图像的识别复杂度。
子步骤2023,从所述待识别物的图像区域中,确定标定图像。
在该步骤后,在确定了待识别物的图像区域之后,进一步确定待识别物的图像区域中的标定图像,由于排除了待识别物所处环境的干扰,因此降低了标定图像的识别复杂度。
需要说明的是,在标定图像的四个角点,也可以设置对应的识别标记,以降低标定图像所处区域的识别复杂度。其中,对于标定图像为标准二维码的情况下,由于标准二维码中已经存在识别标记,因此不需要增加额外的识别标记。
可选的,待识别物包括:快递面单、待识别票据。
可选的,待识别票据包括交通工具票、电影票、旅游团体票中的任意一种。
在本申请实施例中,待识别物可以是快递行业在运送货物的过程中用以记录发件人、收件人以及产品重量、价格等相关信息的快递面单,快递面单贴附在快递包裹表面。
另外,待识别物也可以为其他能够用于拍摄的待识别票据,如电影票、汽车票、团体旅游票等。
例如,在一种场景下,用户需持有电影票入场观看电影,则待识别物可以为电影票,电影票中具有二维码或条形码,通过对电影票进行拍摄,然后基于本申请实施例对拍摄后的图像进行校正,再对校正后的图像进行OCR识别,从而可以获取相应的电影场次信息,后续可以进行电影票验证等操作。
在另一种场景下,用户需持有交通工具票进入交通工具,则待识别物可以为交通工具票,交通工具票中具有二维码或条形码,通过对交通工具票进行拍摄,然后基于本申请实施例对拍摄后的图像进行校正,再对校正后的图像进行OCR识别,从而可以获取相应的车次信息,后续可以进行车次验证等操作。
在另一种场景下,针对团体旅行场景,每个参团成员都具有一张团体旅游票,团体旅游票中具有二维码或条形码,导游需要手持拍摄设备,对各个成员持有的团体旅游票进行拍摄,然后基于上述过程对拍摄后的图像进行校正,再对校正后的图像进行OCR识别,根据识别结果生成列表,方便导游对旅游团队进行管理。当然,在实际应用中,导游可以使用其移动终端,比如手机、平板电脑等,对团体旅游票进行拍摄。该移动终端中可以预先针对旅游团的成员建立一个成员表格,导游使用移动终端拍摄旅游团成员手里的团体旅游票后,然后基于本申请实施例对拍摄后得到的图像进行校正,然后,再对校正后的图像进行OCR识别得到识别结果,然后将识别结果填到上述表格中相应成员的栏目中,方便导游基于该表格管理团队成员,旅游行程等。当然,还可以基于成员表格中未填入识别结果的栏目,提示导游哪些成员的团队旅游票还未拍摄,进一步方便导游对未团队成员的管理。
步骤203,根据所述标定图像,确定单应矩阵参数。
在本申请实施例中,可以从标定图像中确定一些特征点的初始坐标,并根据标定图像中黑白色块的规律性排布方式。计算得到这些特征点在正视图视角下的正视图坐标,利用将特征点的初始坐标转换为正视图坐标的转换关系,可以得到转换参数。
可选的,所述标定图像包括图形编码区域,步骤203具体可以包括:
可选的,图形编码区域包括二维码、条形码其中至少一项。
子步骤2031,获取所述图形编码区域的四个第一顶点坐标。
在本申请实施例中,参照图7,标定图像401包括的图形编码区域可以为条形码区域4012,条形码区域4012包括黑白相间的多个长度相同的黑色矩形方阵,其中,多个黑色矩形方阵按照一定的编码规则排列,形成总长和总宽固定的图形编码区域,图7示出的条形码区域4012,具有固定的长度和宽度。在图像处理设备20获取到包括条形码区域4012的待识别图像40时,可以将条形码区域4012中的四个顶点的初始坐标进行提取。
子步骤2032,根据所述四个第一顶点坐标,及所述图形编码区域的预设长度和预设宽度,确定所述图形编码区域的正视图中,对应所述四个第一顶点坐标的四个第二顶点坐标。
在该步骤中,进一步参照图7,假设通过子步骤2031,提取得到了图形编码区域中的四个第一顶点坐标:左上位置第一顶点坐标(566,358);左下位置第一顶点坐标(498,402);右上位置第一顶点坐标(844,703);右下位置第一顶点坐标(773,749)。并进一步参照图3,假设在正视图下,图条形码区域5012的预设长度为443,预设宽度为89。则根据正视图视角下图条形码区域5012的固定长宽,可以计算出正视图视角下图形编码区域5012中的四个第二顶点坐标:左上位置第二顶点坐标(566,358);左下位置第二顶点坐标(566,439);右上位置第二顶点坐标(1009,358);右下位置第二顶点坐标(1009,439)。需要说明的是,本申请实施例中,正视图视角下标准棋盘格图像5013和二维码区域5011的四个顶点坐标的确定方式可以参照上述图形编码区域5012的描述,本申请实施例对此不作限定。
需要说明的是,还可以取图形编码区域的每条边的预设比例处的坐标作为四个第一顶点坐标,并计算这四个坐标在正视图视角下的正视图坐标,本申请实施例对此不作限定。
子步骤2033,根据所述四个第一顶点坐标和所述四个第二顶点坐标,确定所述转换参数。
可选的,子步骤2033还可以通过根据所述四个第一顶点坐标和所述四个第二顶点坐标,确定所述单应矩阵参数的方式进行实现。
在本申请实施例中,进一步参照上述子步骤2032中提供的示例,可以根据得到的四个第一顶点坐标和四个第二顶点坐标,确定单应矩阵参数。
具体的,一个单应矩阵(Homography matrix)H为大小3×3的矩阵,单应矩阵H可以满足将给定的一个点P1=[x1,y1、w1]T,变为一个新的点P2=[x2,y2,w2T=H×P1。由于这些点都为齐次坐标,则待识别图像和正视图上的两个对应点分别是
进一步的,如果给定一个单应矩阵H={hij},给该单应矩阵H的元素乘以同一个数a,得到的新的单应矩阵aH和H的作用相同,因为新的单应矩阵aH无非是将齐次坐标P1变成了齐次坐标aP2,aP2和P2对应在图像上的点相同,所以一个单应矩阵H中只有8个自由元素,可以将右下角的元素h33=1来实现归一化。
因为单应矩阵H中有8个自由元素,所以存在8个未知数,需要8个方程来进行求解,在本申请实施例中,之所以四个第一顶点坐标和对应的四个第二顶点坐标能够求解,是因为一对坐标点能够提供两个方程,假设图形上的两个点[x1,y1]T和[x2,y2]T,他们的齐次坐标分别为[x1,y1,1]T和[x2,y2,1]T,将两个齐次坐标代入P2=[x2,y2,w2]T=H×P1的公式中,可以得到:
将x2和y2的表达式重新组合,可以得到等价的矩阵Vu=v;
其中,
u=[h11 h12 h13 h21 h22 h23 h31 h32]T
v=[x2 y2]T
针对本申请实施例中的四组坐标,可以将该方程组累加到8行,并求解得到唯一解,该唯一解为单应矩阵H。
在本申请实施例中,根据子步骤2032提供的示例中的四个第一顶点坐标和对应的四个第二顶点坐标以及上述方程组,可以求得单应矩阵H为:
需要说明的是,参照图2,本申请实施例还可以通过标准棋盘格图像4013或二维码区域4011,实现对单应矩阵参数的求解,本申请实施例对此不作限定。
步骤204,根据所述单应矩阵参数,将所述待识别图像转换为正视图。
该步骤中,将单应矩阵参数应用至图7所示的待识别图像,可以得到如图8所示的正视图。
步骤205,对所述正视图进行识别,获得识别信息。
在本发明实施例中,在得到了待识别图像对应的正视图之后,可以对该正视图进行识别,获得识别信息,由于正视图中的文字和图形编码区域几乎不存在倾斜畸变,使得对该正视图中文字进行光学字符识别操作,以及对该正视图中图形编码区域进行扫码识别操作时,降低了识别误差。
例如,在用户持有电影票入场观看电影的场景下,通过对电影票的正视图进行拍摄,可以得到的识别信息包括:电影名称、场次、观影厅标识等信息。然后可以基于上述信息对电影票进行校验。
在用户持有交通工具票进入交通工具的场景下,通过对交通工具票的正视图进行拍摄,可以得到的识别信息包括:座位号、乘客姓名、乘客证件号、发车时间、目的地等信息。然后可以基于上述信息对交通工具票进行校验。
在用户持有团体旅行票旅游的场景下,导游可以手持拍摄设备,比如移动终端,对各个成员持有的团体旅游票进行拍摄,可以得到的识别信息包括:旅行的当前进度,乘客姓名、乘客证件号、未完成的景点、已完成的景点等信息。然后可以将上述识别信息行程按团体成员形成列表,在导游的移动终端中展示,从而可以供导游更方便地利用上述信息,管理旅游团队的人员和事情。
综上所述,本申请实施例提供的一种待识别图像的矫正方法,包括:获取待识别图像;从待识别图像中,确定标定图像;根据标定图像,确定转换参数;根据转换参数,将待识别图像转换为正视图。本申请实施例利用待识别图像中的标定图像,对拍摄待识别图像的拍摄设备进行标定,得到转换参数,并利用转换参数,将待识别图像转换为正视图,使得后续在对该正视图中的文字进行光学字符识别操作,以及对正视图中图形编码区域进行扫码识别操作,可以不需要用户将光学字符识别终端尽量正对待识别图像也能提高识别准确率,降低用户的操作繁琐程度,降低了光学字符识别终端在未正对待识别图像的情况下的识别误差。
参照图9,示出了根据本申请实施例的一种待识别图像的矫正方法实施例的具体流程图,该方法具体可以包括以下步骤:
步骤301,获取待识别图像。
该步骤具体可以参照上述步骤101,此处不再赘述。
步骤302,从所述待识别图像中,确定标定图像。
该步骤具体可以参照上述步骤102,此处不再赘述。
步骤303,根据所述标定图像,确定单应矩阵参数和修正参数。
可选的,修正参数包括:拍摄所述待识别图像的摄像机的内参数、外参数和畸变参数。单应矩阵参数包括:根据所述内参数和所述外参数确定的单应矩阵。
在本申请实施例中,由于拍摄设备的镜头为多个表面是弧形结构的透镜组装而成,且在装配镜头时会产生一定的装配误差,因此在拍摄过程中会产生镜头畸变,镜头畸变实际上是光学透镜固有的透视失真的总称,也就是因为透视原因造成的失真,如广角镜头和鱼眼镜头都会使得拍摄出的照片中存在较大的画面畸变。
镜头的装配误差可以理解为畸变参数,由于畸变参数的存在,使得通过拍摄设备拍摄得到的待识别图像的四个顶角处存在畸变偏差。
另外,内参数是指与拍摄设备自身特性相关的参数,比如拍摄设备的焦距、像素大小等;外参数是指拍摄设备在世界坐标系中的参数,比如拍摄设备的位置、旋转方向等。
在本申请实施例的一种实现方式中,标定图像包括预设棋盘格图像,步骤303具体可以包括:
子步骤3031,在所述标准棋盘格图像中,确定预设数量的内角点,以及所述内角点的当前坐标。
在该步骤中,参照图2,假设标定图像401包括标准棋盘格图像4013,标准棋盘格图像4013包括黑白相间的多个矩形方阵,其中,进一步参照图10,标准棋盘格图像401中,方阵与方阵之间相交的点为角点,而不与标准棋盘格图像4013的外边缘重合的角点为内角点,图2示出的标准棋盘格图像4013中,可以提取得到54个内角点的坐标。
子步骤3032,根据所述内角点的当前坐标和预设的成像几何模型,确定所述转换参数。
可选的,子步骤3032还可以通过根据所述内角点的当前坐标和预设的成像几何模型,确定所述拍摄所述待识别图像的摄像机的内参数、外参数和畸变参数,并根据所述内参数和所述外参数确定所述单应矩阵的方式进行实现。
在本申请实施例中,进行拍摄设备标定的目的是求出拍摄设备的内参数、外参数,以及畸变参数,拍摄设备成像的几何模型如下:
其中,(X,Y,Z)表示空间某点的世界坐标,(u,v)表示该点的图像坐标,将坐标为(X,Y,Z)的点映射到投影平面上坐标为(u,v)的点的过程称作投影变换,s表示缩放系数,通常是1,(fx,fy)分别表示拍摄设备的横向和纵向焦距,(cx,cy)表示焦平面的图像中心点,(fx,fy)、(cx,cy)所在的矩阵通常叫做内参数矩阵,拍摄设备内参数是与拍摄设备自身特性相关的参数,比如拍摄设备的焦距、像素大小等,而[R T]表示从世界坐标系到拍摄设备坐标系的变换矩阵,通常叫做外参数矩阵,拍摄设备的外参数是拍摄设备在世界坐标系中的参数,如拍摄设备的位置,旋转方向等。
具体的,世界坐标系是客观三维世界的坐标系,也称客观坐标系。因为拍摄设备安放在三维空间中,我们需要世界坐标系这个基准坐标系来描述数码拍摄设备的位置,并且用它来描述安放在此三维环境中的其它任何物体的位置,用(X,Y,Z)表示其坐标值。
拍摄设备坐标系(光心坐标系):以拍摄设备的光心为坐标原点,X轴和Y轴分别平行于图像坐标系的X轴和Y轴,拍摄设备的光轴为Z轴,用(Xc,Yc,Zc)表示其坐标值。
图像坐标系:以焦平面的中心为坐标原点,X轴和Y轴分别平行于图像平面的两条垂直边,用(cx,cy)表示其坐标值。图像坐标系是用物理单位(例如毫米)表示像素在图像中的位置。
像素坐标系:以焦平面的左上角顶点为原点,X轴和Y轴分别平行于图像坐标系的X轴和Y轴,用(u,v)表示其坐标值。拍摄设备采集的图像首先是形成标准电信号的形式,然后再通过模数转换变换为数字图像。每幅图像的存储形式是M×N的数组,M行N列的图像中的每一个元素的数值代表的是图像点的灰度。这样的每个元素叫像素,像素坐标系就是以像素为单位的图像坐标系。
在本申请实施例中,拍摄设备成像的几何模型是通过这几个坐标系之间的对应关系建立的,在图像处理设备获取到待识别图像时,可以将标准棋盘格图像中的54个内角点的世界坐标(X1,Y1,Z1)、(X2,Y2,Z2)…(X54,Y54,Z54),以及图像坐标(u1,v1)、(u2,v2)…(u54,v54)进行提取,并导入到拍摄设备成像的几何模型(公式1)中,即可输出理想无畸变情况下的内参数以及外参数。需要说明的是,将标定图案50的54个内角点导入带畸变校准的拍摄设备成像的几何模型,则可以获取拍摄设备的内参数、外参数。
需要说明的是,理想摄像头的针孔模型,拍摄的图像基于内参数和外参数的图像处理过程,不会产生径向畸变和切向畸变,但是实际应用中由于摄像头的针孔的限制,拍摄的图像基于内参数和外参数的图像处理后,还是会产生径向畸变和切向畸变,因此,本申请实施例还会基于带畸变校准的拍摄设备成像几何模型,对畸变参数进行校准,比如假设带畸变校准的拍摄设备成像几何模型中径向畸变参数k1、k2、k3、k4、k5、k6为,切向畸变参数为p1、p2,则基于上述54个内角点代入上述带畸变校准的拍摄设备成像几何模型,确定出上述径向畸变参数和切向畸变参数。
其中带畸变校准的拍摄设备成像几何模型的大致模型为:假设(X,Y,Z)表示空间某点的世界坐标,[R T]表示外参数矩阵,(x,y,z)表示变换后的目标坐标,则目标坐标由[RT]对(X,Y,Z)进行变换获得;k1,k2,k3,k4,k5和k6表示拍摄设备的径向畸变参数,p1和p2表示拍摄设备的切向畸变参数(该切向畸变参数仅在拍摄设备10的镜头为鱼眼镜头的情况下存在),x'、y'为理想的无畸变的图像像素坐标或者点坐标,x”、y”是带透镜畸变参数的图像像素或点坐标,则x'为x与z的比值,y'为y与z的比值,x”由x'、y'与径向畸变参数k1,k2,k3,k4,k5和k6、以及切向畸变参数p1和p2(假设p1和p2存在的话,不存在则不计算)基于第一关系确定,y”由x'、y'与径向畸变参数k1,k2,k3,k4,k5和k6、以及切向畸变参数p1和p2(假设p1和p2存在的话,不存在则不计算)基于第二关系确定。
假设(u,v)是像素坐标,其中u由x、fx与cx计算得到,v由y、fy与cy计算得到。可以理解,(x',y')是指通过针孔模型求出来的理想点的位置,(x”,y”)是其真实位置,所以要通过畸变模型获得(x”,y”)的值,但是在实际应用时,(x”,y”)通常是已知的,即我们通过拍摄设备获得了带畸变的标定图像中54个内角点的图像坐标,但是我们需要反算回去得到(x',y'),即这54个内角点不存在畸变情况下的坐标,通过上述带畸变校准的拍摄设备成像几何模型进行拟合计算求解的过程中,可得到拍摄设备的畸变参数,在具体实现中,OpenCV提供了相应的函数接口,可以直接使用去获取畸变参数。
在具体实现中,可以通过开源计算机视觉库(opencv,Open Source ComputerVision Library)中相关的获取内外参数矩阵的代码实现,另外,还可以通过由MATLAB(矩阵实验室)软件中的calibration工具进行实现,本申请对此不做限定。
需要说明的是,参照图2,本申请实施例还可以通过条形码区域4012或二维码区域4011,实现对单应矩阵参数和所述修正参数的求解,本申请实施例对此不作限定。
步骤304,根据所述单应矩阵参数和所述修正参数,将所述待识别图像转换为正视图。
可选的,步骤304具体可以包括:
子步骤3041,利用所述修正参数对所述待识别图像进行修正,得到对应的消畸图像;
在求解得到修正参数之后,可以利用修正参数中的畸变参数,将畸变参数带入上述带畸变校准的拍摄设备成像几何模型,同时将待识别图像中所有像素点的图像坐标(x”1,y”1)、(x”2,y”2)…(x”n,y”n)输入该模型,即可输出消除畸变的像素点的图像坐标(x'1,y'1)、(x'2,y'2)…(x'n,y'n),并根据消除畸变的像素点的图像坐标构建得到消畸图像。
子步骤3042,利用所述单应矩阵参数,将所述消畸图像转换为正视图。
在该步骤中,得到消畸图像后,进一步进行将消畸图像转化为正视图的操作,此时引入单应矩阵还原公式,单应矩阵还原公式包括:
其中,(x,y)表示还原前的像素坐标,(x’,y’)表示还原后的像素坐标,s表示缩放系数,通常是1,单应矩阵H是一个3x3的数值矩阵,单应矩阵H表示的是两视图的对极约束,和三维场景的结构无关,只依赖于拍摄设备的内参数以及外参数,需要拍摄设备的位置有旋转和平移。单应矩阵H有两部分组成:用于定位观察的物体平面的物理变换和使用拍摄设备的内参矩阵的投影。一个标定点可以得到两个方程,而整个模型有9个参数8个自由度,也就是只需要求解8个参数,因此至少需要4个点,才能解出一个单应矩阵H,一般标定图像上的内角点比较多,其目的是为了优化单应矩阵H。
在本申请实施例中,假定在利用拍摄设备成像的几何模型求解标定参数时,拍摄设备没有畸变。因此对于标定图像,我们可以得到一个前面描述的单应性矩阵H,大小为3×3。将H写成列向量的形式,即H=[h1 h2 h3]=sM[R,T],每个h是3×1向量,单应性矩阵H是由拍摄设备的外参数矩阵[R,Y]和内参数矩阵M组成。
因此,在通过拍摄设备成像的几何模型输出外参数矩阵[R,Y]和内参数矩阵M之后,可以将外参数矩阵[R,Y]和内参数矩阵M带入H=[h1 h2 h3]=sM[R,T],从而求解出单应性矩阵H。
最终,根据单应矩阵还原公式,将消畸图像中所有的像素点的图像坐标(x1,y1)、(x2,y2)…(xn,yn)输入该公式,即可输出转换后的像素点的图像坐标(x'1,y'1)、(x'2,y'2)…(x'n,y'n),并根据转换后的像素点的图像坐标构建得到如图3所示的正视图50。
步骤305,对所述正视图进行识别,获得识别信息。
该步骤具体可以参照上述步骤205,此处不再赘述。
可选的,步骤305具体可以包括:
子步骤3051、根据预设的标定图像与所述正视图的待识别字段区域之间的对应关系,确定所述正视图中的目标待识别字段区域。
子步骤3052、对所述目标待识别字段区域进行识别,获得所述识别信息。
参照图1,待识别物30的尺寸固定,且待识别物30中可以包括具有待识别字段的待识别字段区域60,通过对待识别字段区域60进行ORC识别,可以得到待识别字段的内容。例如,图1示出的快递面单30中,目标待识别字段区域可以包括收件人相关信息、发件人相关信息等。
在本申请实施例中,进一步参照图3,图像处理设备20中可以预置有标定图像与待识别字段区域之间的对应关系,在对正视图50进行识别的情况下,当识别到其中的标定图像501时,可以直接根据该对应关系,确定出正视图50中的目标待识别字段区域601进行识别,对于其他区域则不用进行识别,从而降低识别工作的工作量。
例如,针对正视图视角的快递面单图像。
在一种情况下,参照图11,在快递面单图像70中,假设正视图视角下的标定图像501设置在目标待识别字段区域601的左边,则图像处理设备20中可以预先建立有标定图像501与目标待识别字段区域601之间的相对位置对应关系。使得在对快递面单图像70进行识别的情况下,当识别到其中的标定图像501时,可以直接根据该对应关系,确定出正视图50中的目标待识别字段区域601进行识别。
在另一种情况下,参照图12,在快递面单图像70中,假设正视图视角下的标定图像501设置在目标待识别字段区域601的内部,且标定图像501具体设置在收件人与收件人内容之间,则图像处理设备20中可以预先建立有标定图像501与目标待识别字段区域601之间的相对位置对应关系。使得在对快递面单图像70进行识别的情况下,当识别到其中的标定图像501时,可以直接根据该对应关系,确定出正视图50中的目标待识别字段区域601进行识别。
在一种情况下,参照图13,在快递面单图像70中,假设正视图视角下的标定图像501设置在目标待识别字段区域601的内部,且标定图像501具体围绕设置在收件人四周,则图像处理设备20中可以预先建立有标定图像501与目标待识别字段区域601之间的相对位置对应关系。使得在对快递面单图像70进行识别的情况下,当识别到其中的标定图像501时,可以直接根据该对应关系,确定出正视图50中的目标待识别字段区域601进行识别。
综上所述,本申请实施例提供的一种待识别图像的矫正方法,包括:获取待识别图像;从待识别图像中,确定标定图像;根据标定图像,确定转换参数;根据转换参数,将待识别图像转换为正视图。本申请实施例利用待识别图像中的标定图像,对拍摄待识别图像的拍摄设备进行标定,得到转换参数,并利用转换参数,将待识别图像转换为正视图,使得后续在对该正视图中的文字进行光学字符识别操作,以及对正视图中图形编码区域进行扫码识别操作的过程中,降低了识别误差。
参照图14,示出了根据本申请实施例的一种待识别图像的矫正装置实施例的结构框图,该装置具体可以包括:
获取模块401,用于获取待识别图像;
第一确定模块402,用于从所述待识别图像中,确定标定图像;
可选的,所述待识别图像包括待识别物的图像区域,所述待识别物的角点设置有识别标记;所述第一确定模块402,还用于:
确定所述待识别图像中的识别标记;
根据所述识别标记,确定所述待识别图像中待识别物的图像区域;
从所述待识别物的图像区域中,确定标定图像。
可选的,所述待识别物包括:快递面单、待识别票据。
可选的,所述待识别票据包括交通工具票、电影票、旅游团体票中的任意一种。
第二确定模块403,用于根据所述标定图像,确定转换参数;
可选的,第二确定模块403,包括:
第一确定子模块,用于根据所述标定图像,确定单应矩阵参数;
第二确定子模块,用于根据所述标定图像,确定单应矩阵参数和修正参数;
可选的,所述标定图像包括图形编码区域,第二确定模块403,还包括:
第一选取子模块,用于获取所述图形编码区域的四个第一顶点坐标;
第一计算子模块,用于根据所述四个第一顶点坐标,及所述图形编码区域的预设长度和预设宽度,确定所述图形编码区域的正视图中,对应所述四个第一顶点坐标的四个第二顶点坐标;
第三确定子模块,用于根据所述四个第一顶点坐标和所述四个第二顶点坐标,确定所述转换参数。
可选的,第三确定子模块具体用于根据所述四个第一顶点坐标和所述四个第二顶点坐标,确定所述单应矩阵参数。
可选的,所述图形编码区域包括二维码、条形码其中至少一项。
可选的,所述标定图像包括预设棋盘格图像,第二确定模块403,还包括:
第二选取子模块,用于在所述标准棋盘格图像中,确定预设数量的内角点,以及所述内角点的当前坐标;
第四确定子模块,用于根据所述内角点的当前坐标和预设的成像几何模型,确定所述转换参数。
可选的,所述修正参数包括:拍摄所述待识别图像的摄像机的内参数、外参数和畸变参数;所述单应矩阵参数包括:根据所述内参数和所述外参数确定的单应矩阵;所述第四确定子模块具体用于根据所述内角点的当前坐标和所述预设的成像几何模型,确定所述拍摄所述待识别图像的摄像机的内参数、外参数和畸变参数;
根据所述内参数和所述外参数确定所述单应矩阵。
转换模块404,用于根据所述转换参数,将所述待识别图像转换为正视图。
可选的,转换模块404,包括:
第一转换子模块,用于根据所述单应矩阵参数,将所述待识别图像转换为正视图。
第二转换子模块,用于根据所述单应矩阵参数和所述修正参数,将所述待识别图像转换为正视图。
可选的,第二转换子模块具体用于利用所述修正参数对所述待识别图像进行修正,得到对应的消畸图像;
利用所述单应矩阵参数,将所述消畸图像转换为正视图。
可选的,所述装置还包括:
识别模块,用于对所述正视图进行识别,获得识别信息。
可选的,所述识别模块,还用于
根据预设的标定图像与所述正视图的待识别字段区域之间的对应关系,确定所述正视图中的目标待识别字段区域;
对所述目标待识别字段区域进行识别,获得所述识别信息。
综上所述,本申请实施例提供的一种待识别图像的矫正装置,包括:获取待识别图像;从待识别图像中,确定标定图像;根据标定图像,确定转换参数;根据转换参数,将待识别图像转换为正视图。本申请实施例利用待识别图像中的标定图像,对拍摄待识别图像的拍摄设备进行标定,得到转换参数,并利用转换参数,将待识别图像转换为正视图,使得后续在对该正视图中的文字进行光学字符识别操作,以及对正视图中图形编码区域进行扫码识别操作,可以不需要用户将光学字符识别终端尽量正对待识别图像也能提高识别准确率,降低用户的操作繁琐程度,降低了光学字符识别终端在未正对待识别图像的情况下的识别误差。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的系统。图15示意性地示出了可被用于实现本公开中所述的各个实施例的示例性系统(或装置)1600。
对于一个实施例,图15示出了示例性系统1600,该系统具有一个或多个处理器1602、被耦合到(一个或多个)处理器1602中的至少一个的系统控制模块(芯片组)1604、被耦合到系统控制模块1604的系统存储器1606、被耦合到系统控制模块1604的非易失性存储器(NVM)/存储设备1608、被耦合到系统控制模块1604的一个或多个输入/输出设备1610,以及被耦合到系统控制模块1606的网络接口1612。
处理器1602可包括一个或多个单核或多核处理器,处理器1602可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,系统1600能够作为本申请实施例中所述的浏览器。
在一些实施例中,系统1600可包括具有指令的一个或多个确定机可读介质(例如,系统存储器1606或NVM/存储设备1608)以及与该一个或多个确定机可读介质相合并被配置为执行指令以实现模块从而执行本公开中所述的动作的一个或多个处理器1602。
对于一个实施例,系统控制模块1604可包括任意适当的接口控制器,以向(一个或多个)处理器1602中的至少一个和/或与系统控制模块1604通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块1604可包括存储器控制器模块,以向系统存储器1606提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
系统存储器1606可被用于例如为系统1600加载和存储数据和/或指令。对于一个实施例,系统存储器1606可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器1606可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块1604可包括一个或多个输入/输出控制器,以向NVM/存储设备1608及(一个或多个)输入/输出设备1610提供接口。
例如,NVM/存储设备1608可被用于存储数据和/或指令。NVM/存储设备1608可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备1608可包括在物理上作为系统1600被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备1608可通过网络经由(一个或多个)输入/输出设备1610进行访问。
(一个或多个)输入/输出设备1610可为系统1600提供接口以与任意其他适当的设备通信,输入/输出设备1610可以包括通信组件、音频组件、传感器组件等。网络接口1612可为系统1600提供接口以通过一个或多个网络通信,系统1600可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1602中的至少一个可与系统控制模块1604的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1602中的至少一个可与系统控制模块1604的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器1602中的至少一个可与系统控制模块1604的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1602中的至少一个可与系统控制模块1604的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统1600可以但不限于是:浏览器、工作站、台式确定设备或移动确定设备(例如,膝上型确定设备、手持确定设备、平板电脑、上网本等)。在各个实施例中,系统1600可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统1600包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,如果显示器包括触摸面板,显示屏可以被实现为触屏显示器,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在终端设备时,可以使得该终端设备执行本申请实施例中各方法步骤的指令(instructions)。
在一个示例中提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的确定机程序,其特征在于,所述处理器执行所述确定机程序时实现如本申请实施例的方法。
在一个示例中还提供了一种确定机可读存储介质,其上存储有确定机程序,其特征在于,该程序被处理器执行时实现如本申请实施例的一个或多个的方法。
虽然某些实施例是以说明和描述为目的的,各种各样的替代、和/或、等效的实施方案、或确定来达到同样目的实施例示出和描述的实现,不脱离本申请的实施范围。本申请旨在覆盖本文讨论的实施例的任何修改或变化。因此,显然本文描述的实施例仅由权利要求和它们的等同物来限定。

Claims (17)

1.一种待识别图像的矫正方法,其特征在于,包括:
获取待识别图像;所述待识别图像包括待识别物的图像区域,所述待识别物的图像区域内部包括标定图像,所述标定图像为在正视的情况下具有固定长宽、以及固定内部排列规则的图形编码区域,所述图形编码区域包括条形码、二维码、标准棋盘格中的至少一种;
从所述待识别图像中,确定所述标定图像;
根据所述标定图像,确定转换参数;
根据所述转换参数,将所述待识别图像转换为正视图。
2.根据权利要求1所述的方法,其特征在于,所述根据所述标定图像,确定转换参数,包括:
根据所述标定图像,确定单应矩阵参数;
根据所述转换参数,将所述待识别图像转换为正视图包括:
根据所述单应矩阵参数,将所述待识别图像转换为正视图。
3.根据权利要求1所述的方法,其特征在于,所述根据所述标定图像,确定转换参数,包括:
根据所述标定图像,确定单应矩阵参数和修正参数;
根据所述转换参数,将所述待识别图像转换为正视图包括:
根据所述单应矩阵参数和所述修正参数,将所述待识别图像转换为正视图。
4.根据权利要求3所述的方法,其特征在于,所述根据所述单应矩阵参数和所述修正参数,将所述待识别图像转换为正视图,包括:
利用所述修正参数对所述待识别图像进行修正,得到对应的消畸图像;
利用所述单应矩阵参数,将所述消畸图像转换为正视图。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述标定图像包括图形编码区域,所述根据所述标定图像,确定转换参数,包括:
获取所述图形编码区域的四个第一顶点坐标;
根据所述四个第一顶点坐标,及所述图形编码区域的预设长度和预设宽度,确定所述图形编码区域的正视图中,对应所述四个第一顶点坐标的四个第二顶点坐标;
根据所述四个第一顶点坐标和所述四个第二顶点坐标,确定所述转换参数。
6.根据权利要求5所述的方法,其特征在于,所述图形编码区域包括二维码、条形码其中至少一项。
7.根据权利要求5所述的方法,其特征在于,所述转换参数为单应矩阵参数,所述根据所述四个第一顶点坐标和所述四个第二顶点坐标,确定所述转换参数,包括:
根据所述四个第一顶点坐标和所述四个第二顶点坐标,确定所述单应矩阵参数。
8.根据权利要求3-4任一项所述的方法,其特征在于,所述标定图像包括预设棋盘格图像,所述根据所述标定图像,确定转换参数,包括:
在所述标准棋盘格图像中,确定预设数量的内角点,以及所述内角点的当前坐标;
根据所述内角点的当前坐标和预设的成像几何模型,确定所述转换参数。
9.根据权利要求8所述的方法,其特征在于,所述修正参数包括:拍摄所述待识别图像的摄像机的内参数、外参数和畸变参数;
所述单应矩阵参数包括:根据所述内参数和所述外参数确定的单应矩阵;
所述根据所述内角点的当前坐标和预设的成像几何模型,确定所述转换参数,包括:
根据所述内角点的当前坐标和所述预设的成像几何模型,确定所述拍摄所述待识别图像的摄像机的内参数、外参数和畸变参数;
根据所述内参数和所述外参数确定所述单应矩阵。
10.根据权利要求1所述的方法,其特征在于,在根据所述转换参数,将所述待识别图像转换为正视图之后,还包括:
对所述正视图进行识别,获得识别信息。
11.根据权利要求10所述的方法,其特征在于,所述对所述正视图进行识别,获得识别信息,包括:
根据预设的标定图像与所述正视图的待识别字段区域之间的对应关系,确定所述正视图中的目标待识别字段区域;
对所述目标待识别字段区域进行识别,获得所述识别信息。
12.根据权利要求1所述的方法,其特征在于,所述待识别物的角点设置有识别标记;
所述从所述待识别图像中,确定标定图像,包括:
确定所述待识别图像中的识别标记;
根据所述识别标记,确定所述待识别图像中待识别物的图像区域;
从所述待识别物的图像区域中,确定标定图像。
13.根据权利要求12所述的方法,其特征在于,所述待识别物包括:快递面单、待识别票据。
14.根据权利要求13所述的方法,其特征在于,所述待识别票据包括交通工具票、电影票、旅游团体票中的任意一种。
15.一种待识别图像的矫正装置,其特征在于,包括:
获取模块,用于获取待识别图像;所述待识别图像包括待识别物的图像区域,所述待识别物的图像区域内部包括标定图像,所述标定图像为在正视的情况下具有固定长宽、以及固定内部排列规则的图形编码区域,所述图形编码区域包括条形码、二维码、标准棋盘格中的至少一种;
第一确定模块,用于从所述待识别图像中,确定所述标定图像;
第二确定模块,用于根据所述标定图像,确定转换参数;
转换模块,用于根据所述转换参数,将所述待识别图像转换为正视图。
16.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-14一个或多个的方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-14一个或多个的方法。
CN201910995611.7A 2019-10-18 2019-10-18 待识别图像的矫正方法及装置 Active CN112686959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910995611.7A CN112686959B (zh) 2019-10-18 2019-10-18 待识别图像的矫正方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910995611.7A CN112686959B (zh) 2019-10-18 2019-10-18 待识别图像的矫正方法及装置

Publications (2)

Publication Number Publication Date
CN112686959A CN112686959A (zh) 2021-04-20
CN112686959B true CN112686959B (zh) 2024-06-11

Family

ID=75445030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910995611.7A Active CN112686959B (zh) 2019-10-18 2019-10-18 待识别图像的矫正方法及装置

Country Status (1)

Country Link
CN (1) CN112686959B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100506B (zh) * 2022-06-27 2024-05-24 平安银行股份有限公司 双录场景下矫正屏幕的图像方法、服务器及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102944236A (zh) * 2012-11-20 2013-02-27 无锡普智联科高新技术有限公司 基于多个二维码读码器的移动机器人定位系统及方法
CN107424126A (zh) * 2017-05-26 2017-12-01 广州视源电子科技股份有限公司 图像校正方法、装置、设备、系统及摄像设备和显示设备
CN107748887A (zh) * 2017-09-30 2018-03-02 五邑大学 一种基于显性与隐性线段检测的平面文档图像透视矫正方法
CN107766855A (zh) * 2017-10-25 2018-03-06 南京阿凡达机器人科技有限公司 基于机器视觉的棋子定位方法、系统、存储介质及机器人
CN107895142A (zh) * 2017-10-26 2018-04-10 湖南考神信息科技有限责任公司 一种基于视觉标记的试卷试题内容自动分割方法及系统
CN107944324A (zh) * 2017-11-16 2018-04-20 凌云光技术集团有限责任公司 一种二维码畸变校正方法及装置
CN108710876A (zh) * 2018-04-20 2018-10-26 江苏理工学院 一种基于机器视觉的电池表面标识缺陷检测方法及系统
CN109459032A (zh) * 2018-12-04 2019-03-12 北京艾瑞思机器人技术有限公司 移动机器人定位方法、导航方法和网格地图建立方法
CN109685000A (zh) * 2018-12-21 2019-04-26 广州小鹏汽车科技有限公司 一种基于视觉的车位检测方法及装置
WO2019105044A1 (zh) * 2017-11-28 2019-06-06 东莞市普灵思智能电子有限公司 一种镜头畸变矫正和特征提取的方法及系统
CN110046529A (zh) * 2018-12-11 2019-07-23 阿里巴巴集团控股有限公司 二维码识别方法、装置及设备
CN110059702A (zh) * 2019-03-29 2019-07-26 北京奇艺世纪科技有限公司 一种物体轮廓识别方法及装置
CN110287913A (zh) * 2019-06-28 2019-09-27 京东数字科技控股有限公司 图像矫正提示方法和装置、用户终端和存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102944236A (zh) * 2012-11-20 2013-02-27 无锡普智联科高新技术有限公司 基于多个二维码读码器的移动机器人定位系统及方法
CN107424126A (zh) * 2017-05-26 2017-12-01 广州视源电子科技股份有限公司 图像校正方法、装置、设备、系统及摄像设备和显示设备
CN107748887A (zh) * 2017-09-30 2018-03-02 五邑大学 一种基于显性与隐性线段检测的平面文档图像透视矫正方法
WO2019080229A1 (zh) * 2017-10-25 2019-05-02 南京阿凡达机器人科技有限公司 基于机器视觉的棋子定位方法、系统、存储介质及机器人
CN107766855A (zh) * 2017-10-25 2018-03-06 南京阿凡达机器人科技有限公司 基于机器视觉的棋子定位方法、系统、存储介质及机器人
CN107895142A (zh) * 2017-10-26 2018-04-10 湖南考神信息科技有限责任公司 一种基于视觉标记的试卷试题内容自动分割方法及系统
CN107944324A (zh) * 2017-11-16 2018-04-20 凌云光技术集团有限责任公司 一种二维码畸变校正方法及装置
WO2019105044A1 (zh) * 2017-11-28 2019-06-06 东莞市普灵思智能电子有限公司 一种镜头畸变矫正和特征提取的方法及系统
CN108710876A (zh) * 2018-04-20 2018-10-26 江苏理工学院 一种基于机器视觉的电池表面标识缺陷检测方法及系统
CN109459032A (zh) * 2018-12-04 2019-03-12 北京艾瑞思机器人技术有限公司 移动机器人定位方法、导航方法和网格地图建立方法
CN110046529A (zh) * 2018-12-11 2019-07-23 阿里巴巴集团控股有限公司 二维码识别方法、装置及设备
CN109685000A (zh) * 2018-12-21 2019-04-26 广州小鹏汽车科技有限公司 一种基于视觉的车位检测方法及装置
CN110059702A (zh) * 2019-03-29 2019-07-26 北京奇艺世纪科技有限公司 一种物体轮廓识别方法及装置
CN110287913A (zh) * 2019-06-28 2019-09-27 京东数字科技控股有限公司 图像矫正提示方法和装置、用户终端和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Inclinometer Assembly Error Calibration and Horizontal Image Correction in Photoelectric Measurement Systems;Xiaofang Kong 等;《sensors》;第18卷(第1期);1-20 *
基于二维码识别的门禁系统的研究;郑龙华;《中国优秀硕士学位论文全文数据库信息科技辑》(第03期);I138-7393 *
基于机器视觉的在线贴标系统的研究;黄建军;《中国优秀硕士学位论文全文数据库信息科技辑》(第04期);I138-888 *

Also Published As

Publication number Publication date
CN112686959A (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN110809786B (zh) 校准装置、校准图表、图表图案生成装置和校准方法
CN109754426B (zh) 一种用于摄像标定参数验证的方法、系统和装置
US9451132B2 (en) System for capturing a document in an image signal
Abraham et al. Fish-eye-stereo calibration and epipolar rectification
US10319111B2 (en) Image projection device for 3D measurement and calibration method for calibration of camera and projector
JP5783885B2 (ja) 情報提示装置、その方法及びそのプログラム
KR102170182B1 (ko) 패턴 프로젝션을 이용한 왜곡 보정 및 정렬 시스템, 이를 이용한 방법
US8554012B2 (en) Image processing apparatus and image processing method for correcting distortion in photographed image
US10198661B2 (en) System for determining alignment of a user-marked document and method thereof
KR20190021342A (ko) 개선된 카메라 캘리브레이션 시스템, 타겟 및 프로세스
CN104994367B (zh) 一种图像矫正方法以及摄像头
CN111872544B (zh) 激光出光指示点的标定方法、装置和振镜同轴视觉系统
CN113841384B (zh) 校准装置,用于校准的图表和校准方法
WO2014045508A1 (ja) 検査装置、検査方法、および検査プログラム
CN112686959B (zh) 待识别图像的矫正方法及装置
JP2011155412A (ja) 投影システムおよび投影システムにおける歪み修正方法
CN112950528A (zh) 证件姿态确定方法、模型训练方法、装置、服务器及介质
US9319666B1 (en) Detecting control points for camera calibration
EP3216005B1 (en) Image processing device and method for geometric calibration of images
CN116524022B (zh) 偏移数据计算方法、图像融合方法、装置及电子设备
CN112614231A (zh) 信息显示方法与信息显示系统
US20180061135A1 (en) Image display apparatus and image display method
Liang et al. An integrated camera parameters calibration approach for robotic monocular vision guidance
CN110874820B (zh) 一种物料仿真形变数据获取方法及装置
CN113850100A (zh) 一种校正二维码的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant