CN110659607A - 数据核对方法、装置、系统及计算设备 - Google Patents

数据核对方法、装置、系统及计算设备 Download PDF

Info

Publication number
CN110659607A
CN110659607A CN201910901550.3A CN201910901550A CN110659607A CN 110659607 A CN110659607 A CN 110659607A CN 201910901550 A CN201910901550 A CN 201910901550A CN 110659607 A CN110659607 A CN 110659607A
Authority
CN
China
Prior art keywords
image
item
data
displaying
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910901550.3A
Other languages
English (en)
Inventor
尉野
何宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Vehicle Home Data Information Technology Co Ltd
Original Assignee
Tianjin Vehicle Home Data Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Vehicle Home Data Information Technology Co Ltd filed Critical Tianjin Vehicle Home Data Information Technology Co Ltd
Priority to CN201910901550.3A priority Critical patent/CN110659607A/zh
Publication of CN110659607A publication Critical patent/CN110659607A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种数据核对方法,包括:采集对象图像,对象包括多个条目;对对象图像进行图像文本识别,得到各条目的文本内容;经由数据核对界面显示识别得到的各条目及其文本内容;经由数据核对界面接收用户针对条目的点击操作;以及响应于点击操作,经由数据核对界面显示对象图像中条目对应区域的图像,以便用户核对条目的文本内容。本发明实施例还公开了相应的数据核对装置、系统、计算设备及存储介质。

Description

数据核对方法、装置、系统及计算设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据核对方法、装置、系统及计算设备。
背景技术
近几年来,图片识别技术有了长足的发展。其中,发票识别、行驶证识别等等票据和证件的识别技术在日常生活中被广泛应用,这些技术有效地帮助人们降低了手工输入的繁琐程度。然而当前图片识别技术的精准程度还不够高,因此,需要用户对识别得到的结果进行核对,以便对错误之处进行修改。
目前的核对方法通常是将识别得到的结果罗列出来,由用户逐一核对识别结果与实物票据中的条目是否一致。这种方法需要用户自行在实物票据中寻找对应条目的位置,这样用户的视觉焦点会在显示识别结果的屏幕和实物票据之间来回移动,很容易感到疲惫,易用性差,用户体验不好。
因此,期望提供一种更为先进的数据核对方案。
发明内容
为此,本发明实施例提供一种数据核对方法、装置、系统及计算设备,以力图解决或至少缓解上面存在的问题。
根据本发明实施例的一个方面,提供了一种数据核对方法,包括:采集对象图像,对象包括多个条目;对对象图像进行图像文本识别,得到各条目的文本内容;经由数据核对界面显示识别得到的各条目及其文本内容;经由数据核对界面接收用户针对条目的点击操作;以及响应于点击操作,经由数据核对界面显示对象图像中条目对应区域的图像,以便用户核对条目的文本内容。
可选地,在根据本发明实施例的方法中,数据核对界面包括图像显示窗口,并经由图像显示窗口显示对象图像的至少一部分,经由数据核对界面显示对象图像中条目对应区域的图像的步骤包括:在图像显示区域中显示条目对应区域的图像。
可选地,在根据本发明实施例的方法中,还包括:对对象图像进行图像文本识别,得到各条目对应区域的坐标。
可选地,在根据本发明实施例的方法中,经由数据核对界面显示对象图像中条目对应区域的图像的步骤包括:基于条目对应区域的坐标、对象图像的大小和图像显示窗口的大小,计算条目对应区域的图像的显示配置信息;按照显示配置信息在图像显示窗口中显示条目对应区域的图像。
可选地,在根据本发明实施例的方法中,显示配置信息包括缩放比例和偏移量,按照显示配置信息在图像显示窗口中显示条目对应区域的图像的步骤包括:对对象图像按照缩放比例进行缩放;对对象图像按照偏移量进行位移。
可选地,在根据本发明实施例的方法中,计算条目对应区域的图像的显示配置信息的步骤包括:基于条目对应区域的坐标,确定条目对应区域的图像的大小;基于条目对应区域的图像的大小和图像显示窗口的大小,计算缩放比例。
可选地,在根据本发明实施例的方法中,计算条目对应区域的图像的显示配置信息的步骤包括:基于条目对应区域的坐标,确定条目对应区域的图像的中心点;计算图像的中心点相对于对象图像的大小的相对坐标;计算图像显示窗口与屏幕侧边的距离;基于相对坐标、图像显示窗口的大小、距离和缩放比例,计算偏移量。
可选地,在根据本发明实施例的方法中,计算条目对应区域的图像的显示配置信息的步骤包括:在缩放比例大于预定数值的情况下,令缩放比例为预定数值。
可选地,在根据本发明实施例的方法中,显示配置信息还包括动画效果标记,计算条目对应区域的图像的显示配置信息的步骤包括:配置动画效果标记,以便进行缩放和位移时具有动画效果。
可选地,在根据本发明实施例的方法中,条目对应区域的图像在图像显示窗口中居中显示。
可选地,在根据本发明实施例的方法中,对对象图像进行图像文本识别的步骤包括:将对象图像发送至服务器,以便服务器对对象图像进行图像文本识别。
可选地,在根据本发明实施例的方法中,对对象图像进行图像文本识别的步骤包括:接收服务器返回的各条目的文本内容以及各条目对应区域的坐标。
可选地,在根据本发明实施例的方法中,服务器返回的数据为JSON格式。
可选地,在根据本发明实施例的方法中,还包括:接收服务器返回的验证结果,验证结果指示对象图像是否包括对象和/或对象是否有效。
可选地,在根据本发明实施例的方法中,对象包括票据和卡证。
根据本发明实施例的另一个方面,提供了一种数据核对装置,包括:图像采集单元,适于采集对象图像,对象包括多个条目;图像识别单元,适于对对象图像进行图像文本识别,得到各条目的文本内容;数据显示单元,适于经由数据核对界面显示识别得到的各条目及其文本内容;还适于响应于用户针对条目的点击操作,经由数据核对界面显示对象图像中条目对应区域的图像,以便用户核对条目的文本内容;以及操作接收单元,适于经由数据核对界面接收用户针对条目的点击操作。
根据本发明实施例的另一个方面,提供了一种数据核对系统,包括:根据本发明实施例的数据核对装置;以及服务器,适于接收数据核对装置发送的对象图像,对对象图像进行图像文本识别,并返回识别得到的各条目的文本内容。
根据本发明实施例的另一个方面,提供了一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,该一个或多个程序包括用于执行根据本发明实施例的数据核对方法的指令。
根据本发明实施例的还有一个方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,该指令当被计算设备执行时,使得计算设备执行根据本发明实施例的数据核对方法。
根据本发明实施例的数据核对方案,可以在用户点击条目时自动放大显示该条目对应的区域的图像,便于用户进行核对。这样,减少了视觉焦点移动以及手势交互,降低了操作复杂性,提高了用户体验。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的数据核对系统100的示意图;
图2示出了根据本发明一个实施例的计算设备200的示意图;
图3示出了根据本发明一个实施例的数据核对方法300的流程图;
图4示出了根据本发明一个实施例的数据核对界面400的示意图;以及
图5示出了根据本发明一个实施例的数据核对装置500的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的数据核对系统100的示意图。数据核对系统100可以帮助用户对经过图像识别技术识别得到的票据、卡证等对象中各条目的文本内容进行核对。
如图1所示,数据核对系统100可以包括服务器120和数据核对装置500。在其他实施方式中,数据核对系统100可以包括不同的和/或附加的模块。
数据核对装置500可以接收用户的输入,并经由网络140与服务器120进行通信,例如发送采集的图像和接收服务器识别出来的与图像相关的文本内容等。其中,网络140可以包括有线和/或无线通信路径,诸如但不仅限于,因特网、局域网、卫星路径、光纤路径、电缆路径,或任何其他合适的有线或无线通信路径或这样的路径的组合。
根据本发明的实施方式,上述数据核对系统100中的各部件(装置、服务器等)均可以通过如下所述的计算设备200来实现。
图2示出了根据本发明一个实施例的计算设备200的示意图。如图2所示,在基本的配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。
取决于期望的配置,处理器204可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。
取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据224。在一些实施方式中,应用222可以布置为在操作系统上由一个或多个处理器204利用程序数据224执行指令。
计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置202经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个A/V端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个I/O端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备200可以实现为服务器,例如数据库服务器、应用程序服务器和WEB服务器等,也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。当然,计算设备200也可以实现为小尺寸便携(或者移动)电子设备的至少一部分。
在根据本发明的实施例中,计算设备200可以实现为数据核对装置500,并被配置为执行根据本发明实施例的数据核对方法300。其中,计算设备200的应用222中包含执行根据本发明实施例的数据核对方法300的多条指令,而程序数据224还可以存储数据核对系统100的配置数据等内容。
图3示出了根据本发明一个实施例的数据核对方法300的流程图。该数据核对方法300可以在数据核对装置500中执行。
如图3所示,数据核对方法300始于步骤S310。在步骤S310中,可以采集对象图像。对象是指那些需要电子化的实物票据、卡证等等,例如发票、银行卡、行驶证。对象通常包括多个条目,例如发票可以包括发票代码、发票号码、开票日期等等条目。在一些实施例中,对象图像可以经由诸如摄像头之类的图像采集单元来采集。
而后,在步骤S320中,可以对采集到的对象图像进行图像文本识别(OCR),得到对象所包括的各条目的文本内容和各条目对应区域的坐标。本领域技术人员应当理解,本发明实施例可以采用任何图像文本识别技术来对对象图像进行识别。条目对应区域通常为矩形,坐标包括该矩形的左上角和右下角的坐标。
以下为条目的文本内容和对应区域的坐标的一个示例:
Figure BDA0002211985350000071
其中,title为条目的名称,content为条目的文本内容,upperleftx、upperlefty为条目对应区域的左上角坐标,lowerrightx、lowerrighty为右下角坐标。
根据本发明的一个实施方式,在进行图像文本识别之前,还可以对该对象图像进行预处理,例如裁剪掉除对象之外的其他部分、将歪斜的图像摆正、对图像进行锐化等等。
此外,还可以对对象图像包括的对象进行验证,例如验证发票图像是否包括发票,发票图像包括的发票是否为有效等等。具体地,可以将对象标识(例如发票号码)发送至相应的验证平台进行验证。如果不包括对象、或者验证为无效,可以提示用户。如果包括对象且验证为有效,则可以继续步骤S330。
应当指出的是,虽然这里的图像预处理、文本识别、对象验证等步骤均在数据核对装置500中执行,但也可以在服务器120中执行。数据核对装置500可以将采集的对象图像发送至服务器120,服务器120对对象图像进行预处理、文本识别和对象验证之后,将预处理后的图像、识别得到的各条目的文本内容及对应区域的坐标、和验证结果返回至数据核对装置500。服务器返回的数据通常为JSON格式。
在步骤S330中,经由数据核对界面显示识别得到的各条目及其文本内容,同时,还经由数据核对界面上的图像显示窗口显示(预处理后的)对象图像的至少一部分。图像显示窗口通常可以为矩形,其大小由系统预先配置好。
图4示出了根据本发明一个实施例的数据核对界面的示意图。其中,对象图像为发票图像,界面下方列出了发票所包含的条目(发票代码和发票号码),界面上方为图像显示窗口,用于显示发票图像的一部分,即如图4所示的发票代码和/或发票号码对应区域的图像。
而后,可以在步骤S340中,经由该数据核对界面接收用户针对条目的点击操作,例如用户对发票代码这一条目的点击操作。
而后,在步骤S350中,响应于该点击操作,经由数据核对界面显示对象图像中用户所点击的条目对应区域的图像,以便用户核对该条目的文本内容。其中,可以在图像显示窗口中以居中形式显示条目对应区域的图像。
在一些实施例中,可以基于条目对应区域的坐标、对象图像的大小和图像显示窗口的大小,计算条目对应区域的图像的显示配置信息,并按照该显示配置信息在图像显示窗口中显示条目对应区域的图像。这里,对象图像的大小可以是经过预处理后的对象图像的大小。
具体地,显示配置信息可以包括缩放比例。根据本发明的实施方式,可以基于条目对应区域的坐标,确定条目对应区域的图像的大小,再基于条目对应区域的图像的大小和图像显示窗口的大小,计算缩放比例。例如,可以基于以下公式计算:
scaleToZoom=windowWidth/itemWidth;
itemWidth=lowerrightx-upperleftx;
其中,scaleToZoom为缩放比例,windowWidth为图像显示窗口的宽度,itemWidth为条目对应区域的宽度,lowerrightx为条目对应区域的右下角的横轴坐标,upperleftx为条目对应区域的左上角的横轴坐标。
得到缩放比例之后,还可以判断缩放比例是否大于预定数值(通常为3)。如果缩放比例大于预定数值,则令缩放比例等于该预定数值,避免缩放比例过大而导致显示不清楚,影响核对。
显示配置信息可以包括偏移量。根据本发明的实施方式,可以先基于条目对应区域的坐标,确定条目对应区域的图像的中心点。再计算条目对应区域的图像的中心点相对于对象图像大小的相对坐标,接着计算图像显示窗口与显示图像显示窗口的屏幕侧边的距离,最后基于相对坐标、图像显示窗口的大小、到屏幕侧边的距离和缩放比例,计算偏移量。例如,可以基于以下公式计算:
centerx=(upperleftx+lowerrightx)/2;
centery=(upperlefty+lowerrighty)/2;
centerPercentage_x=centerx/imageWidth;
centerPercentage_y=centery/imageHeight;
gap=(ScreenWidth-windowWidth)/2;
Figure BDA0002211985350000092
Figure BDA0002211985350000091
其中,centerx为中心点center的横轴坐标,centery为中心点center的纵轴坐标,lowerrightx、lowerrighty为条目对应区域的右下角的横轴坐标和纵轴坐标,upperleftx和upperlefty为条目对应区域的左上角的横轴坐标和纵轴坐标。centerPercentage_x为中心点相对于对象图像大小的相对坐标中的横轴相对坐标,centerPercentage_y为为中心点相对于对象图像大小的相对坐标中的纵轴相对坐标,imageWidth为对象图像的宽度,imageHeight为对象图像的高度,gap为图像显示窗口到屏幕侧边的距离,ScreenWidth为屏幕宽度。offsetX为偏移量中的横轴偏移量,offsetY为偏移量中的纵轴偏移量。
在得到缩放比例和偏移量之后,可以按照该缩放比例进行缩放,按照该偏移量进行位移,以便显示条目对应区域的图像。通常地,在iOS操作系统中,可以调用UIScrollView中的相应方法(例如,setZoomScale方法和setContentOffset方法)来进行缩放和位移。
此外,根据本发明的一个实施方式,显示配置信息还包括动画效果标记(animated标记),可以配置动画效果标记,以便进行缩放和位移时具有动画效果。例如,可以将该标记配置为真(true)。这样,缩放和位移时可以显得更平滑自然。
图5示出了根据本发明一个实施例的数据核对装置500。如图5所示,数据核对装置500可以包括图像采集单元510、图像识别单元520、数据显示单元530和操作接收单元540。
图像采集单元510适于采集对象图像,其中,对象包括多个条目。图像识别单元520耦接到图像采集单元510,适于对对象图像进行图像文本识别,得到各条目的文本内容。数据显示单元530与图像识别单元520相耦接,适于经由数据核对界面显示识别得到的各条目及其文本内容。操作接收单元与数据显示单元530相耦接,适于经由数据核对界面接收用户针对条目的点击操作。数据显示单元530还适于响应于用户针对条目的点击操作,经由数据核对界面显示对象图像中条目对应区域的图像,以便用户核对条目的文本内容。
可替换地,数据核对装置500还可以包括替换图片识别单元的通信单元(图5未示出)。通信单元可以将采集的对象图像发送至服务器120,并接收服务器120返回的各条目的文本内容、各条目对应区域的坐标、和验证结果。
关于数据核对装置500中各单元的详细处理逻辑和实施过程可以参见前文结合图1-图4对数据核对系统100的相关描述,此处不再赘述。
综上所述,根据本发明实施例的数据核对方案,可以在用户点击条目时自动放大显示该条目对应的区域的图像,便于用户进行核对。这样,减少了视觉焦点移动以及手势交互,降低了操作复杂性,提高了用户体验。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明实施例的方法和设备,或者本发明实施例的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被机器执行时,该机器变成实践本发明实施例的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的程序代码中的指令,执行本发明实施例的方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明实施例的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明实施例的内容,并且上面对特定语言所做的描述是为了披露本发明实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明实施例的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明实施例的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明实施例要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明实施例的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本发明还可以包括:A7、如A5所述的方法,其中,所述计算所述条目对应区域的图像的显示配置信息的步骤包括:基于所述条目对应区域的坐标,确定所述条目对应区域的图像的中心点;计算所述图像的中心点相对于所述对象图像的大小的相对坐标;计算所述图像显示窗口与所述屏幕侧边的距离;基于所述相对坐标、所述图像显示窗口的大小、所述距离和所述缩放比例,计算所述偏移量。A8、如A6所述的方法,其中,所述计算所述条目对应区域的图像的显示配置信息的步骤包括:在所述缩放比例大于预定数值的情况下,令所述缩放比例为所述预定数值。A9、如A5所述的方法,其中,所述显示配置信息还包括动画效果标记,计算所述条目对应区域的图像的显示配置信息的步骤包括:配置所述动画效果标记,以便进行缩放和位移时具有动画效果。A10、如A2所述的方法,其中,所述条目对应区域的图像在所述图像显示窗口中居中显示。A11、如A1所述的方法,其中,所述对所述对象图像进行图像文本识别的步骤包括:将所述对象图像发送至服务器,以便所述服务器对所述对象图像进行图像文本识别。A12、如A11所述的方法,其中,所述对所述对象图像进行图像文本识别的步骤包括:接收所述服务器返回的各条目的文本内容以及各条目对应区域的坐标。A13、如A12所述的方法,其中,所述服务器返回的数据为JSON格式。A14、如A11所述的方法,其中,还包括:接收所述服务器返回的验证结果,所述验证结果指示所述对象图像是否包括对象和/或所述对象是否有效。A15、如A14所述的方法,其中,所述对象包括票据和卡证。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所描述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明实施例的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,上述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行上述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施上述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所描述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明实施例,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明实施例的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明实施例的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明实施例的范围,对本发明实施例所做的公开是说明性的而非限制性的,本发明实施例的范围由所附权利要求书限定。

Claims (10)

1.一种数据核对方法,包括:
采集对象图像,所述对象包括多个条目;
对所述对象图像进行图像文本识别,得到各条目的文本内容;
经由数据核对界面显示识别得到的各条目及其文本内容;
经由所述数据核对界面接收用户针对所述条目的点击操作;以及
响应于所述点击操作,经由所述数据核对界面显示所述对象图像中所述条目对应区域的图像,以便用户核对所述条目的文本内容。
2.如权利要求1所述的方法,其中,所述数据核对界面包括图像显示窗口,并经由所述图像显示窗口显示所述对象图像的至少一部分,所述经由所述数据核对界面显示所述对象图像中所述条目对应区域的图像的步骤包括:
在所述图像显示区域中显示所述条目对应区域的图像。
3.如权利要求2所述的方法,其中,还包括:
对所述对象图像进行图像文本识别,得到各条目对应区域的坐标。
4.如权利要求3所述的方法,其中,所述经由所述数据核对界面显示所述对象图像中所述条目对应区域的图像的步骤包括:
基于所述条目对应区域的坐标、所述对象图像的大小和所述图像显示窗口的大小,计算所述条目对应区域的图像的显示配置信息;
按照所述显示配置信息在所述图像显示窗口中显示所述条目对应区域的图像。
5.如权利要求4所述的方法,其中,所述显示配置信息包括缩放比例和偏移量,按照所述显示配置信息在所述图像显示窗口中显示所述条目对应区域的图像的步骤包括:
对所述对象图像按照所述缩放比例进行缩放;
对所述对象图像按照所述偏移量进行位移。
6.如权利要求5所述的方法,其中,所述计算所述条目对应区域的图像的显示配置信息的步骤包括:
基于所述条目对应区域的坐标,确定所述条目对应区域的图像的大小;
基于所述条目对应区域的图像的大小和所述图像显示窗口的大小,计算所述缩放比例。
7.一种数据核对装置,包括:
图像采集单元,适于采集对象图像,所述对象包括多个条目;
图像识别单元,适于对所述对象图像进行图像文本识别,得到各条目的文本内容;
数据显示单元,适于经由数据核对界面显示识别得到的各条目及其文本内容;还适于响应于用户针对所述条目的点击操作,经由所述数据核对界面显示所述对象图像中所述条目对应区域的图像,以便所述用户核对所述条目的文本内容;以及
操作接收单元,适于经由所述数据核对界面接收用户针对所述条目的点击操作。
8.一种数据核对系统,包括:
如权利要求16所述的数据核对装置;以及
服务器,适于接收数据核对装置发送的对象图像,对所述对象图像进行图像文本识别,并返回识别得到的各条目的文本内容。
9.一种计算设备,包括:
一个或多个处理器;存储器;
和一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-6所述的数据核对方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-6所述的数据核对方法中的任一方法。
CN201910901550.3A 2019-09-23 2019-09-23 数据核对方法、装置、系统及计算设备 Pending CN110659607A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910901550.3A CN110659607A (zh) 2019-09-23 2019-09-23 数据核对方法、装置、系统及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910901550.3A CN110659607A (zh) 2019-09-23 2019-09-23 数据核对方法、装置、系统及计算设备

Publications (1)

Publication Number Publication Date
CN110659607A true CN110659607A (zh) 2020-01-07

Family

ID=69039177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910901550.3A Pending CN110659607A (zh) 2019-09-23 2019-09-23 数据核对方法、装置、系统及计算设备

Country Status (1)

Country Link
CN (1) CN110659607A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962786A (ja) * 1995-08-28 1997-03-07 Oki Electric Ind Co Ltd 文字認識装置
CN202584267U (zh) * 2012-06-12 2012-12-05 丰豪盈彩(北京)科技有限公司 应用于移动终端的票据自动识别系统
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN109726710A (zh) * 2018-12-27 2019-05-07 平安科技(深圳)有限公司 发票信息采集方法、电子装置及可读存储介质
WO2019101066A1 (zh) * 2017-11-21 2019-05-31 众安信息技术服务有限公司 一种基于图像的文本录入方法
CN109840519A (zh) * 2019-01-25 2019-06-04 青岛盈智科技有限公司 一种自适应的智能单据识别录入装置及其使用方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962786A (ja) * 1995-08-28 1997-03-07 Oki Electric Ind Co Ltd 文字認識装置
CN202584267U (zh) * 2012-06-12 2012-12-05 丰豪盈彩(北京)科技有限公司 应用于移动终端的票据自动识别系统
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
WO2019101066A1 (zh) * 2017-11-21 2019-05-31 众安信息技术服务有限公司 一种基于图像的文本录入方法
CN109726710A (zh) * 2018-12-27 2019-05-07 平安科技(深圳)有限公司 发票信息采集方法、电子装置及可读存储介质
CN109840519A (zh) * 2019-01-25 2019-06-04 青岛盈智科技有限公司 一种自适应的智能单据识别录入装置及其使用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
毛艳喜: "海关卡口集装箱箱号自动识别系统设计与开发", 《天津市电子工业协会2017年年会》 *

Similar Documents

Publication Publication Date Title
CN107798299B (zh) 票据信息识别方法、电子装置及可读存储介质
CN105474235B (zh) 比较使用连续扫描提取的卡数据
KR101723709B1 (ko) 이미지 기반 금융 처리
CN111489487B (zh) 票据识别方法、装置、设备和存储介质
US10176370B2 (en) Field verification of documents
US20140036099A1 (en) Automated Scanning
CN108898142B (zh) 一种手写公式的识别方法及计算设备
WO2019138074A1 (en) Data extraction pipeline
US10140691B2 (en) Correcting perspective distortion in double-page spread images
CN109858373A (zh) 一种基于深度学习的发票识别验真方法及系统
US11574492B2 (en) Efficient location and identification of documents in images
CN111931771B (zh) 票据内容识别方法、装置、介质及电子设备
EP3017399B1 (en) Payment card ocr with relaxed alignment
CN110070491A (zh) 银行卡图片矫正方法、装置、设备及存储介质
CN112487859A (zh) 信息处理装置、信息处理方法和计算机可读介质
Arslan End to end invoice processing application based on key fields extraction
US10896339B2 (en) Detecting magnetic ink character recognition codes
CN114495146A (zh) 图像文本检测方法、装置、计算机设备及存储介质
US20140279642A1 (en) Systems and methods for enrollment and identity management using mobile imaging
CN110659607A (zh) 数据核对方法、装置、系统及计算设备
US20230132261A1 (en) Unified framework for analysis and recognition of identity documents
US20220277167A1 (en) Real-time documentation verification using artificial intelligence and machine learning
US11687886B2 (en) Method and device for identifying number of bills and multiple bill areas in image
Koo et al. Robust skew estimation using straight lines in document images
JP2009032109A (ja) 文書画像検索方法、文書画像登録方法、そのプログラムおよび装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200107