CN101739441A - 一种图像信息录入的方法以及系统 - Google Patents

一种图像信息录入的方法以及系统 Download PDF

Info

Publication number
CN101739441A
CN101739441A CN200910204555A CN200910204555A CN101739441A CN 101739441 A CN101739441 A CN 101739441A CN 200910204555 A CN200910204555 A CN 200910204555A CN 200910204555 A CN200910204555 A CN 200910204555A CN 101739441 A CN101739441 A CN 101739441A
Authority
CN
China
Prior art keywords
typing
image
element information
image slices
slices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910204555A
Other languages
English (en)
Other versions
CN101739441B (zh
Inventor
李线纲
李保仓
李建忠
唐啸
吴加齐
向晖
姜俊
高珊珊
谭永伟
王春江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN2009102045557A priority Critical patent/CN101739441B/zh
Publication of CN101739441A publication Critical patent/CN101739441A/zh
Application granted granted Critical
Publication of CN101739441B publication Critical patent/CN101739441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Character Input (AREA)

Abstract

本发明提供了一种图像信息录入的方法,包括:根据预先定义的图像模板库识别待录入图像的类别;根据识别出的所述待录入图像的类别确定该待录入图像的图像模板;根据所述图像模板对所述待录入图像进行切分,切分后生成图像切片;分别给所述图像切片分配切片属性;根据所述切片属性选择相应的录入方式对所述图像切片的要素信息进行录入;将所述录入的要素信息组装为所述待录入图像的完整图像信息。相应地,本发明还提供了一种图像信息录入的系统。通过预先定义图像模板,并根据图像模板对待录入图像进行切分,有效避免了人工录入人员或人工校验员直接获取完整的原始图像,使个人隐私或敏感信息得到了保护,提高了图像数据采集的安全性和保密性。

Description

一种图像信息录入的方法以及系统
技术领域
本发明涉及计算机图像处理领域,尤其涉及纸质图像信息的数字化处理。
背景技术
随着计算机技术的发展,为了便于备份与存档,通常将原有的纸质文件作数字化处理,即将纸质文件通过扫描或录入等手段存储到存储介质中。由于直接扫描纸质图像生成的图片文件不易查询和检索,所以需要将纸质图像转化为便于查询和检索的图像信息的电子数据,以数据文件的形式存储在数据库中。这就需要从图像中采集所需的各个要素数据并将其存储下来,例如,从银行转账支票的纸质图像中采集账号信息、转账金额等要素数据。
目前,在各种金融业核心业务运营中,图像数据采集技术方案主要是采用光学字符识别(Optical Character Recognition,OCR)和人工录入识别相结合的方式。纸质图像通过图像识别软件进行OCR方式识别,得到图像中需要录入的图像要素信息,例如身份证号码、姓名等,由于OCR方式识别出来的图像信息存在一定误差,所以还需要结合人工识别对OCR方式识别出来的数据与原图像进行对比,从而找出错误数据并修正,也可以直接通过人工录入而得到正确数据,最后将校验过的经OCR方式和人工录入方式识别出来的正确图像信息数据组合成图像的完整信息数据,以供后续的查询、检索等处理。
由于图像信息的采集都需要扫描最初的纸质图像,而完整的纸质图像包含了客户的大量个人隐私和敏感信息,例如身份证号码或姓名等。在人工录入时,人工录入人员通常直接调阅完整图像,然后对照图像进行人工录入,这样使得人工录入人员可以获得上述个人隐私或敏感信息,因而有可能造成个人隐私或敏感信息外泄。同样,在OCR方式识别后进行人工校验时,人工校验人员可以查看完整图像,也存在个人隐私或敏感信息外泄的风险。因此,在图像信息采集过程中提高图像调阅和访问的安全性是非常重要的。
发明内容
本发明的目的在于提供一种图像信息录入的方法以及系统,以解决人工操作人员能获取完整待录入图像以造成个人隐私或敏感信息外泄的问题,从而降低重要数据外泄的风险。
为了解决上述问题,本发明提供了一种图像信息录入的方法,该方法包括:
根据预先定义的图像模板库识别待录入图像的类别;
根据识别出的所述待录入图像的类别确定该待录入图像的图像模板;
根据所述图像模板对所述待录入图像进行切分,切分后生成图像切片;
分别给所述图像切片分配切片属性;
根据所述切片属性选择相应的录入方式对所述图像切片的要素信息进行录入;
将所述录入的要素信息组装为所述待录入图像的完整图像信息。
相应地,本发明还提供了一种图像信息录入系统,该系统包括:
图像模板库,用于存储预先定义的图像模板;
图像识别模块,用于根据所述图像模板库识别待录入图像的类别,并根据识别出的所述待录入图像的类别确定该待录入图像的图像模板;
图像切分模块,用于实现如下功能:根据所述图像识别模块确定的所述待录入图像的图像模板对所述待录入图像进行切分,切分后生成图像切片,并分别给所述图像切片分配切片属性;
录入模块,用于获取所述图像切片,并根据所述切片属性选择对应的录入方式对所述图像切片的要素信息进行录入;
组装模块,用于将所述录入的要素信息组装为所述待录入图像的完整图像信息。
本发明提供的一种图像信息的录入方法以及系统,通过预先定义图像模板,并根据所述图像模板对待录入图像进行切分处理,对切分得到的图像切片进行录入,这样,人工录入人员或人工校验员只能获取部分图像切片,而无法获取完整的原始图像,从而使个人隐私或敏感信息得到了保护,提高了图像数据采集的安全性和保密性。
附图说明
图1是根据本发明的图像信息录入方法的一种实施方式的流程图;
图2是图1中的步骤S103的具体流程图;
图3是根据本发明的图像信息录入系统的一种实施方式的结构示意图;
图4示出了图3中的图像切分模块33和录入模块34的内部结构。
具体实施方式
为使本发明的实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明作详细描述。
请参阅图1,图1是根据本发明的图像信息录入方法的一种实施方式的流程图,该方法包括:
步骤S101,根据预先定义的图像模板库识别待录入图像的类别;
步骤S102,根据识别出的所述待录入图像的类别确定该图像的图像模板;
具体地,所述待录入图像是指纸质图像的实物原件,需要说明的是,为了方便进行对比,上述纸质图像的实物原件可以通过电子扫描手段转变成电子扫描件,以便进行图像模板识别。
所述图像模板包括图像模板名称、图像特征值等,其中:
所述图像模板名称表明该图像模板对应的纸质图像的实物类型,例如转账支票图像模板对应了纸质转账支票的实物原件,而身份证图像模板对应了身份证的实物原件;
所述图像特征值是指一类图像的显著几何特征或几何特征的组合,以身份证实物原件的扫描件为例,该扫描件为矩形并且具有特定的长宽比,则这种几何特征就是身份证实物原件的图像特征值。当然不仅限于上述图像特征值,在预先定义图像模板的时候,还可以增加更多的图像特征值以使识别更加精确。
所述图像模板库就是上述各种图像模板的集合,步骤S101到步骤S102的过程中,首先获取待录入图像的扫描件,再调用图像模板与所述扫描件进行图像特征值的对比,如果图像特征值相符则可以确定该待录入图像的图像模板,同时根据图像模板名称确定该待录入图像的类别。
步骤S103,根据所述图像模板对所述待录入图像进行切分,切分后生成图像切片,具体请参阅图2;
具体地,所述图像模板还包括图像要素,用于确定图像中需要拆分的图像要素。以身份证的图像模板为例,该图像模板规定了姓名、性别、住址为图像要素,经切分后生成“姓名”切片、“性别”切片和“住址”切片,每个切片上有完整的要素信息,以供人工识别录入或者OCR录入。
可选地,由于在实际业务中,待录入图像的种类繁多且待录入图像的扫描件的成像质量不一,因为没有预先定义某一类图像模板或者待录入图像的扫描件模糊而不易识别等原因,步骤S101中可能出现根据预先定义的图像模板库未识别出待录入图像的类别的情况,如果出现这种情况,本实施例还包括:
将所述待录入图像进行人工切分,切分后生成图像切片,然后转到步骤S104执行。
可选地,步骤S101中根据预先定义的图像模板库已经识别出待录入图像的类别,但是不排除存在识别误差,如果出现识别误差,在步骤S103中根据所述图像模板对所述待录入图像进行切分,切分后生成图像切片,则得到的这些图像切片是识别误差造成的错误图像切片,如果出现这种情况,本实施例也可以包括:
将所述待录入图像进行人工切分,切分后生成图像切片,然后转到步骤S104执行。
步骤S104,分别给所述图像切片分配切片属性;
具体地,图像切片具有不同的切片属性,包括:是否进行OCR方式识别、OCR方式识别后是否需要确认、录入方式(包括是否需要多次录入)、录入内容的类型(如汉字、数字等)、权限属性(用于确定接收该图像切片进行人工录入或识别的用户角色)等,这些图像切片的切片属性保存在图像模板库中,并可以根据需要进行定义、升级或调整。在所述待录入图像被切分生成图像切片后,将所述切片属性赋予生成的图像切片。
步骤S105,根据所述切片属性选择相应的录入方式对所述图像切片的要素信息进行录入;
具体地,根据步骤S104所述的内容,图像切片的切片属性决定了该图像切片以何种录入方式进行录入,例如,某一图像切片的切片属性是需要进行OCR方式识别,则将该图像切片发送给具有OCR功能的模块进行识别。
步骤S106,将所述录入的要素信息组装为所述待录入图像的完整图像信息。
具体地,用户在扫描某一待录入图像的时,可以为该待录入图像分配一个唯一的流水号,该流水号对应所述待录入图像当前进行的图像信息录入业务,并且该流水号不可重复。在步骤S103、S104中,待录入图像的扫描件被切分并生成图像切片,同时将所述流水号作为切片属性之一赋予所述图像切片,在步骤S105中,对所述图像切片的要素信息进行录入,同时也将上述流水号赋予所述要素信息;在步骤S106中,将流水号相同的要素信息组装为完整图像信息。
请参阅图2,图2是图1中的步骤S103的具体流程图,包括:
步骤S1031,根据所述图像模板为所述图像建立平面坐标系;
具体地,由于图2示出的实施例是图1所示的步骤S103的说明,因此所述图像模板是指图1示出的实施例中的图像模板,所述图像是指图1示出的实施例中的待录入图像。在步骤S1031中,为待录入图像建立平面坐标系,则该图像上每一点都可以用坐标表示。
步骤S1032,确定需要切分的要素信息以及该要素信息在图像上的坐标;
具体地,根据该待录入图像的图像模板,可以确定需要切分的要素信息在该图像上的位置,由于已经建立了平面坐标系,所以可以唯一确定该要素信息在平面坐标系中的坐标以及坐标区域,例如根据身份证图像模板,可以确定“姓名”要素信息在平面坐标系中的坐标区域是一个以(0,0)、(0,1)、(1,0)、(1,1)四个点为顶点的矩形。需要说明的是,要素信息的坐标区域也可以人工确定该坐标区域的面积大小,需要遵循的规则是该坐标区域必须包含完整的需要录入或进行OCR方式识别的某一要素信息,同时不能覆盖其他需要录入的要素信息所在的区域。
步骤S1033,根据所述坐标对所述要素信息进行切分,切分后生成所述图像切片;
具体地,例如在步骤S1032中确定了“姓名”要素信息的坐标区域为一个矩形,并且已知该矩形的四个顶点分别为:(0,0)、(0,1)、(1,0)、(1,1),则根据该确定的坐标对待录入图像切分,切分后生成的“姓名”切片的形状就是该坐标区域确定的矩形。
以上是步骤S103的具体说明。
此外,需要说明的是,步骤S105可以包括以下三种录入方式之一或任意组合:
根据所述切片属性选择光学字符识别方式对所述要素信息进行录入;
根据所述切片属性选择人工识别方式对所述要素信息进行录入;
根据所述切片属性选择多次录入方式对所述要素信息进行录入。
下面分别对上述三种录入过程进行说明:
第一种,根据所述切片属性选择光学字符识别方式对所述要素信息进行录入;
选择光学字符识别方式对所述要素信息进行录入是指使用OCR技术识别图像切片上的要素信息(例如中文字符、数字等),例如,可使用现有的OCR软件来实现。
可选地,由于OCR录入存在一定的误差率,所以在根据所述切片属性选择光学字符识别方式对所述要素信息进行录入后,该方法还包括如下步骤:
将使用光学字符识别方式录入的要素信息和所述图像切片发送给用户,以供用户对比确认所述要素信息是否录入正确;
用户获得图像切片和该图像切片的OCR方式识别的数据,通过人工对比,确认所述OCR方式识别的数据是否与图像切片上的信息相符并判断录入是否正确,可选地,如果OCR录入不正确,用户可以反馈人工对比后输入的正确数据。
使用光学字符识别方式录入图像切片的优点是速度快,耗时短,减轻了人工的工作量。
第二种,根据所述切片属性选择人工识别方式对所述要素信息进行录入;
该录入过程包括:根据所述切片属性随机地将所述图像切片分配给用户,并保存用户人工识别后输入的要素信息。
其中,所述切片属性包括权限属性,用于确定接收该图像切片进行人工录入的用户角色。所述用户使用用户号登录,登录后录入系统根据用户号确定该登录用户的角色(也可以在用户登录时自动分配角色)。由于登录用户的角色已经确定,根据所述图像切片的权限属性将该图像切片直接发送给角色一致相符的用户。该发送过程自动匹配执行,不需要用户发出请求去获取图像切片。可以将所述图像切片随机命名,每次发送的时候从图像切片列表中随机选择一个图像切片,这样就实现随机将所述图像切片分配给用户。最后,保存用户对所述图像切片进行识别后输入要素信息(如中文字符、数字等)。
可选地,可以定义所述用户角色和权限属性,使一个用户只能获得特定权限属性的图像切片。例如,对身份证的图像切片而言,将“身份证号码”切片的权限属性定义为只与某一特定类的用户角色对应,则该用户角色对应的用户只能获得“身份证号码”切片。
可选地,在根据所述图像模板对所述待录入图像进行切分后,将所述图像切片进行加密处理;在根据所述切片属性随机地将所述图像切片发送给用户前,将所述图像切片进行解密处理。
可选地,可以对每一个人工识别后输入的要素信息进行校验,以保证结果数据的合法性,例如录入的金额不能包括中文汉字字符。
由上述可知,使用人工识别方式录入图像切片的优点是正确性高。
第三种,根据所述切片属性选择多次录入方式对所述要素信息进行录入,包括:
根据所述切片属性使用光学字符识别方式对所述图像切片进行至少两次录入,并分别保存对同一图像切片进行多次光学字符识别后所得的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则将所述图像切片发送给用户以所述人工识别方式对所述要素信息进行录入;或者
根据所述切片属性随机地将所述图像切片分配给用户,并分别保存用户对同一图像切片进行多次人工识别后输入的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则将所述图像切片发送给用户以所述人工识别方式对所述要素信息进行录入。
具体地,使用多次录入方式对图像切片进行录入的过程中,可使用光学字符识别方式或人工录入方式对同一图像切片进行至少两次录入,具体的录入过程可以参考上述第一种和第二种录入方式的描述,在此不再赘述。
无论是光学字符识别方式录入还是人工识别方式录入,都产生至少两个录入得到的要素信息(中文字符、数字等),然后对比所述至少两个要素信息是否相同,如果相同则将该要素信息作为最终的结果数据,如果不相同,则直接将所述图像切片发送给用户进行人工识别录入。
因为某些图像切片上的要素信息比较重要,为保证录入的数据的正确性,所以可以选择多次录入方式对所述要素信息进行录入。需要说明的是,在本实施例或者根据本发明提供的方法的其他实施例中,图像切片的录入方式的切片属性是由人工预先定义的图像模板确定的,可以修改图像模板达到修改图像切片的录入方式的目的,可以根据需要定义图像切片的录入方式。
实施上述实施例,通过随机发送图像切片,确保了人工录入员不能获取完整待录入图像或无法获得完整拼接的待录入图像,从而保护了个人隐私和敏感信息,降低了重要数据泄露的风险。
相应地,本发明还提供了一种图像信息录入系统,请参考图3,图3是根据本发明图像信息录入系统的一种实施方式的结构示意图,包括图像模板库31、图像识别模块32、图像切分模块33、录入模块34和组装模块35,下面对各个模块的功能及其互相的配合关系作具体说明。
图像模板库31,用于存储预先定义的图像模板;
具体地,所述图像模板包括图像模板名称、图像特征值等,其中:
所述图像模板名称表明该图像模板对应的纸质图像的实物类型,例如转账支票图像模板对应了纸质转账支票的实物原件,而身份证图像模板对应了身份证的实物原件,图像模板库31就是上述各种图像模板的集合,即图像模板库31是存储各种图像模板的数据库。
图像识别模块32,用于根据图像模板库31识别待录入图像的类别,并根据识别出的所述待录入图像的类别确定该待录入图像的图像模板;
具体地,图像识别模板32调用图像模板库31中的图像模板,利用图像特征值对比等方法,识别出待录入图像的类别,进而根据所述类别确定该待录入图像对应的图像模板。图像识别模块32可以是使用OCR技术的装置、设备或者逻辑实体(例如OCR设备或者OCR软件)等。
图像切分模块33,用于实现如下功能:根据图像识别模块32确定的所述待录入图像的图像模板对所述待录入图像进行切分,切分后生成图像切片,并分别给所述图像切片分配切片属性;
具体地,图像切分模块33将一张完整的待录入图像切分,并生成多个图像切片文件(可以使用文件方式存放,也可以使用数据库存放),例如,图像识别模块32已经识别出待录入图像是一张身份证图像,则图像切分模块33根据身份证图像模板将该待录入图像切分为:“姓名”切片、“身份证号码”切片和“性别”切片,并分别给上述三种切片分配切片属性如下:
“姓名”切片的切片属性是使用人工识别方式录入要素信息;
“性别”切片的切片属性是使用OCR方式录入要素信息;
“身份证号码”切片的切片属性是使用多次录入方式录入要素信息。
需要说明的是,图像切片的切片属性可以根据业务需要自由定义,包括但不限于上述三种图像切片的切片属性,一个图像切片可以同时具有很多不同的切片属性。
录入模块34,用于获取所述图像切片,并根据所述切片属性选择对应的录入方式对所述图像切片的要素信息进行录入;
具体地,录入模块34随机获取所述图像切片,并临时保存,然后根据所述图像切片的切片属性决定如何对该临时保存的切片进行处理,即选择合适的录入方式来录入所述图像切片的要素信息。
组装模块35,用于将所述录入的要素信息组装为所述待录入图像的完整图像信息。
具体地,组装模块35将流水号相同的一组录入的要素信息组装在一起形成所述完整图像信息,组装过程可参考图1示出的实施例中的相关部分的说明。
由于待录入图像种类繁多,图像模板库可能需要升级或者调整,可选地,所述图像信息录入系统还包括模板定义模块36,该模板定义模块36用于添加、修改或删除所述图像模板库中的图像模板。例如,在图像模板库中新定义并增加一个“转账支票”模板,或者修改“转账支票”模板以使其适应现有转账支票的版式。
可选地,所述图像信息录入系统还包括人工切分模块37,人工切片模块37用于实现如下功能:当所述图像识别模块32未识别出待录入图像的类别时,或者当图像切分模块33生成错误的图像切片时,将所述待录入图像发送给用户进行人工切分,切分后生成所述图像切片,并分别给所述图像切片分配切片属性。
具体地,人工切分模块37包括显示设备(例如显示器)和配套的输入设备(例如鼠标、键盘、电子绘图板或电子触控装置等),可以把完整的待录入图像呈现给用户,而用户根据实际需求进行人工切分并将所述待录入图像切分为多个图像切片。
由于图像切片的录入方式有多种,下面结合附图4对录入模块34的结构进行描述,请参阅图4,图4示出了图3中的图像切分模块33和录入模块34的内部结,其中,录入模块34包括:
切片识别单元341,用于根据切片属性识别出图像切片的录入方式为人工识别录入或者光学字符识别录入或者多次录入;
人工识别录入单元342,用于实现如下功能:当所述图像切片的录入方式为人工识别录入时,根据所述切片属性随机地将所述图像切片分配给用户以供用户人工识别,并保存用户人工识别后输入的要素信息;
具体地,人工识别录入单元342从图像切片列表中随机选择一个图像切片,由于图像切片是随机命名的,所以所述图像切片在图像切片列表中是随机排列,因此实现随机将所述图像切片分配给用户;人工识别录入单元342包括显示设备(例如显示器)和配套的输入设备(例如鼠标、键盘、电子绘图板或电子触控装置等),可以把图像切片呈现给用户供用户人工识别并输入该图像切片的要素信息。
光学字符识别录入单元343,用于实现如下功能:当所述图像切片的录入方式为光学字符识别录入时,使用光学字符识别方式直接录入该图像切片的要素信息;
具体地,光学字符识别录入单元343可以是使用OCR技术的装置、设备或者逻辑体(例如OCR设备或者OCR软件等)。
多次录入单元,用于实现如下功能:当所述图像切片的录入方式为多次录入时,根据所述切片属性触发人工识别录入单元342对该图像切片进行至少两次人工识别录入,并分别保存用户对该图像切片每次人工识别后输入的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则触发人工识别录入单元342重新对该图像切片的要素信息进行录入,或者
根据所述切片属性触发所光学字符识别录入单元343对该图像切片进行至少两次光学字符识别录入,并分别保存光学字符识别录入单元343对该图像切片进行每次光学字符识别后录入的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则触发人工识别录入单元342对该图像切片的要素信息进行录入。
可选地,录入模块34还包括人工确认单元345,该单元用于获取人工识别录入单元342保存的要素信息,并将所述图像切片与所述要素信息发送给用户,以供用户对比确认所述要素信息是否录入正确。
具体地,人工确认单元345包括显示设备(例如显示器)和配套的输入设备(例如鼠标、键盘、电子绘图板或电子触控装置等),可以把图像切片与该图像切片的要素信息呈现给用户,以供用户对比确认结果数据是否正确。
可选地,图像切分模块33还可以包括用于对所述图像切片进行加密处理的切片加密单元331;
相应地,录入模块34还可以包括用于对由切片加密单元331进行了加密处理的图像切片进行解密处理的切片解密单元346。
这样,生成的图像切片由切片加密单元331进行加密处理后,无录入权限的用户即使获取该加密后的图像切片也不能对该图像切片进行修改或查看该图像切片上的要素信息,只有具备录入权限的用户可以使用切片解密单元346对该图像切片进行解密处理,进而查看并录入该图像切片上的要素信息,从而进一步保证数据安全,保护个人隐私或敏感信息
本发明提供的图像信息的录入方法以及系统,通过预先定义图像模板,并根据所述图像模板对待录入图像进行切分处理,有效避免了人工录入人员或人工校验员直接获取完整的原始图像,使个人隐私或敏感信息得到了保护;通过采用图像切片文件随机命名并随机抓取的方法,使人工录入人员无法通过接收图像切片的顺序来拼装完整图像,保证了重要数据不外泄;通过设置图像切片的权限属性来决定该图像切片对应的人工录入人员,可以实现能指定熟练的人工录入人员专门针对某一类型图像切片进行录入,提高了图像信息的录入效率;实施对图像切片加密处理,并在录入该图像切片时解密处理,进一步提高了录入过程中重要数据的保密性和安全性。综上所述,实施本发明提供的一种图像信息录入方法以及系统,提高了图像数据采集的安全性和保密性。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所揭露的仅为本发明的一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (14)

1.一种图像信息录入的方法,其特征在于,该方法包括:
根据预先定义的图像模板库识别待录入图像的类别;
根据识别出的所述待录入图像的类别确定该待录入图像的图像模板;
根据所述图像模板对所述待录入图像进行切分,切分后生成图像切片;
分别给所述图像切片分配切片属性;
根据所述切片属性选择相应的录入方式对所述图像切片的要素信息进行录入;
将所述录入的要素信息组装为所述待录入图像的完整图像信息。
2.根据权利要求1所述的方法,其特征在于,当根据预先定义的图像模板库未识别出待录入图像的类别时,该方法还包括:
将所述待录入图像进行人工切分,切分后生成图像切片,然后转到分别给所述图像切片分配切片属性的步骤。
3.根据权利要求1所述的方法,其特征在于,根据所述图像模板对所述待录入图像进行切分,切分后生成图像切片包括:
根据所述图像模板为所述图像建立平面坐标系;
确定需要切分的要素信息以及该要素信息在图像上的坐标;
根据所述坐标对所述要素信息进行切分,切分后生成所述图像切片。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述切片属性选择相应的录入方式对所述图像切片的要素信息进行录入包括:
根据所述切片属性选择光学字符识别方式对所述要素信息进行录入;或者
根据所述切片属性选择人工识别方式对所述要素信息进行录入;或者
根据所述切片属性选择多次录入方式对所述要素信息进行录入。
5.根据权利要求4所述的方法,其特征在于,根据所述切片属性选择光学字符识别方式对所述要素信息进行录入后,该方法还包括:
将使用光学字符识别方式录入的所述要素信息与所述图像切片发送给用户,以供用户对比确认所述要素信息是否录入正确。
6.根据权利要求4所述的方法,其特征在于,根据所述切片属性选择人工识别方式对所述要素信息进行录入包括:
根据所述切片属性随机地将所述图像切片分配给用户,并保存用户人工识别后输入的要素信息。
7.根据权利要求6所述的方法,其特征在于:
在根据所述图像模板对所述待录入图像进行切分后,将所述图像切片进行加密处理;
在根据所述切片属性随机地将所述图像切片发送给用户前,将所述图像切片进行解密处理。
8.根据权利要求4所述的方法,其特征在于,根据所述切片属性选择多次录入方式对所述要素信息进行录入包括:
根据所述切片属性使用光学字符识别方式对所述图像切片进行至少两次录入,并分别保存对同一图像切片进行多次光学字符识别后所得的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则将所述图像切片发送给用户以所述人工识别方式对所述要素信息进行录入;或者
根据所述切片属性随机地将所述图像切片分配给用户,并分别保存用户对同一图像切片进行多次人工识别后输入的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则将所述图像切片发送给用户以所述人工识别方式对所述要素信息进行录入。
9.一种图像信息录入系统,其特征在于,该系统包括:
图像模板库,用于存储预先定义的图像模板;
图像识别模块,用于根据所述图像模板库识别待录入图像的类别,并根据识别出的所述待录入图像的类别确定该待录入图像的图像模板;
图像切分模块,用于实现如下功能:根据所述图像识别模块确定的所述待录入图像的图像模板对所述待录入图像进行切分,切分后生成图像切片,并分别给所述图像切片分配切片属性;
录入模块,用于获取所述图像切片,并根据所述切片属性选择对应的录入方式对所述图像切片的要素信息进行录入;
组装模块,用于将所述录入的要素信息组装为所述待录入图像的完整图像信息。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括:
模板定义模块,用于添加、修改或删除所述图像模板库中的图像模板。
11.根据权利要求10所述的系统,其特征在于,该系统还包括:
人工切分模块,用于实现如下功能:当所述图像识别模块未识别出所述待录入图像的类别时,将所述待录入图像发送给用户进行人工切分,切分后生成所述图像切片,并分别给所述图像切片分配切片属性。
12.根据权利要求9至11任一项所述的系统,其特征在于,所述录入模块包括:
切片识别单元,用于根据所述切片属性识别所述图像切片的录入方式为人工识别录入或者光学字符识别录入或者多次录入;
人工识别录入单元,用于实现如下功能:当所述图像切片的录入方式为人工识别录入时,根据所述切片属性随机地将所述图像切片分配给用户以供用户人工识别,并保存用户人工识别后输入的所述要素信息;
光学字符识别录入单元,用于实现如下功能:当所述图像切片的录入方式为光学字符识别录入时,使用光学字符识别方式直接录入该图像切片的要素信息;
多次录入单元,用于实现如下功能:当所述图像切片的录入方式为多次录入时,根据所述切片属性触发所述人工识别录入单元对该图像切片进行至少两次人工识别录入,并分别保存用户对该图像切片每次人工识别后输入的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则触发所述人工识别录入单元重新对该图像切片的要素信息进行录入,或者
根据所述切片属性触发所述光学字符识别录入单元对该图像切片进行至少两次光学字符识别录入,并分别保存所述光学字符识别录入单元对该图像切片进行每次光学字符识别后录入的要素信息,然后对比所述分别保存的要素信息是否一致,如果不一致则触发所述人工识别录入单元对该图像切片的要素信息进行录入。
13.根据权利要求12所述的系统,其特征在于:
所述图像切分模块包括用于对所述图像切片进行加密处理的切片加密单元;
所述录入模块包括用于对所述由切片加密单元加密处理后的图像切片进行解密处理的切片解密单元。
14.根据权利要求12所述的系统,其特征在于,所述录入模块还包括:
人工确认单元,用于获取所述人工识别录入单元保存的要素信息,并将所述图像切片与所述要素信息发送给用户,以供用户对比确认所述要素信息是否录入正确。
CN2009102045557A 2009-12-01 2009-12-01 一种图像信息录入的方法以及系统 Active CN101739441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009102045557A CN101739441B (zh) 2009-12-01 2009-12-01 一种图像信息录入的方法以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102045557A CN101739441B (zh) 2009-12-01 2009-12-01 一种图像信息录入的方法以及系统

Publications (2)

Publication Number Publication Date
CN101739441A true CN101739441A (zh) 2010-06-16
CN101739441B CN101739441B (zh) 2012-01-25

Family

ID=42462930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102045557A Active CN101739441B (zh) 2009-12-01 2009-12-01 一种图像信息录入的方法以及系统

Country Status (1)

Country Link
CN (1) CN101739441B (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102759987A (zh) * 2012-06-13 2012-10-31 胡锦云 信息录入方法
CN102968627A (zh) * 2011-08-31 2013-03-13 上海夏尔软件有限公司 基于区域关键字位置识别的精确图像切分方法
CN103593642A (zh) * 2012-08-16 2014-02-19 阿里巴巴集团控股有限公司 一种卡信息获取方法和系统
CN104021138A (zh) * 2014-04-23 2014-09-03 北京智谷睿拓技术服务有限公司 图像检索方法及图像检索装置
CN104239811A (zh) * 2013-06-06 2014-12-24 冲电气工业株式会社 个人信息保护装置、系统以及方法
CN104408450A (zh) * 2014-11-21 2015-03-11 深圳天源迪科信息技术股份有限公司 身份证识别方法、装置及系统
WO2015062275A1 (en) * 2013-10-29 2015-05-07 Tencent Technology (Shenzhen) Company Limited Method, apparatus and system for information identification
CN105183950A (zh) * 2015-08-14 2015-12-23 深圳市向杉科技有限公司 一种基于移动终端查阅工程图纸的方法及系统
CN105279525A (zh) * 2015-11-19 2016-01-27 浪潮软件集团有限公司 一种图像处理的方法及装置
CN105550370A (zh) * 2016-01-26 2016-05-04 平安科技(深圳)有限公司 录入方法及录入系统
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统
US9514451B2 (en) 2013-10-29 2016-12-06 Tencent Technology (Shenzhen) Company Limited Method, apparatus and system for information identification
CN106446901A (zh) * 2016-10-31 2017-02-22 中国银行股份有限公司 一种银行票据录入方法、装置及系统
CN106570105A (zh) * 2016-11-01 2017-04-19 广西电网有限责任公司电力科学研究院 一种电力设备试验报告的结构化处理方法
WO2017140218A1 (zh) * 2016-02-18 2017-08-24 阿里巴巴集团控股有限公司 信息识别方法及装置
CN107123207A (zh) * 2016-02-25 2017-09-01 杭州健培科技有限公司 一种自助取片系统中的远程辅助识别的方法
CN107145734A (zh) * 2017-05-04 2017-09-08 深圳市联新移动医疗科技有限公司 一种医疗数据的自动获取与录入方法及其系统
CN107783953A (zh) * 2017-09-22 2018-03-09 平安普惠企业管理有限公司 信息录入方法及终端设备
CN108334484A (zh) * 2017-12-28 2018-07-27 北京科迅生物技术有限公司 数据录入的方法和装置
CN108664984A (zh) * 2017-03-28 2018-10-16 深圳市凯立德科技股份有限公司 一种数据检查的方法及装置
CN109064373A (zh) * 2018-07-17 2018-12-21 大连理工大学 一种基于外包图像数据录入的隐私保护方法
CN109583405A (zh) * 2018-12-06 2019-04-05 中国银行股份有限公司 一种信息录入方法及系统
CN109960707A (zh) * 2019-03-20 2019-07-02 上海亿阁信息科技有限公司 一种基于人工智能的高校招生数据采集方法及系统
CN109961439A (zh) * 2017-12-22 2019-07-02 江苏奥博洋信息技术有限公司 一种模板自适应对海量影像的快速切割方法
CN110502193A (zh) * 2019-07-19 2019-11-26 广州奔想智能科技有限公司 一种身份证打印方法、系统和存储介质
CN111062256A (zh) * 2013-12-03 2020-04-24 中兴通讯股份有限公司 一种数据提取、录入方法及装置
CN111104853A (zh) * 2019-11-11 2020-05-05 中国建设银行股份有限公司 图像信息录入方法、装置、电子设备及存储介质
CN111428633A (zh) * 2020-03-23 2020-07-17 中国建设银行股份有限公司 一种凭证影像处理方法、装置、设备和介质
CN111444794A (zh) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 基于ocr的票据识别辅助方法、设备、存储介质及装置
CN111476949A (zh) * 2020-04-03 2020-07-31 杭州恒生数字设备科技有限公司 一种基于数据关联的安全储物系统
CN113239893A (zh) * 2021-06-10 2021-08-10 深圳智子系科技有限公司 一种文档录入复核方法、系统、电子设备及介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1245935A (zh) * 1999-06-21 2000-03-01 李虹 名片全自动识别录入与检索系统
CN1147807C (zh) * 2000-08-22 2004-04-28 英业达集团(上海)电子技术有限公司 名片自动识别方法与系统
CN100362525C (zh) * 2005-06-06 2008-01-16 英华达(上海)电子有限公司 手机中使用图像识别进行名片信息的采集与录入的方法

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968627A (zh) * 2011-08-31 2013-03-13 上海夏尔软件有限公司 基于区域关键字位置识别的精确图像切分方法
CN102759987A (zh) * 2012-06-13 2012-10-31 胡锦云 信息录入方法
CN103593642A (zh) * 2012-08-16 2014-02-19 阿里巴巴集团控股有限公司 一种卡信息获取方法和系统
CN104239811A (zh) * 2013-06-06 2014-12-24 冲电气工业株式会社 个人信息保护装置、系统以及方法
WO2015062275A1 (en) * 2013-10-29 2015-05-07 Tencent Technology (Shenzhen) Company Limited Method, apparatus and system for information identification
US9514451B2 (en) 2013-10-29 2016-12-06 Tencent Technology (Shenzhen) Company Limited Method, apparatus and system for information identification
CN111062256B (zh) * 2013-12-03 2024-03-01 中兴通讯股份有限公司 一种数据提取、录入方法及装置
CN111062256A (zh) * 2013-12-03 2020-04-24 中兴通讯股份有限公司 一种数据提取、录入方法及装置
CN104021138A (zh) * 2014-04-23 2014-09-03 北京智谷睿拓技术服务有限公司 图像检索方法及图像检索装置
CN104021138B (zh) * 2014-04-23 2017-09-01 北京智谷睿拓技术服务有限公司 图像检索方法及图像检索装置
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统
CN104408450A (zh) * 2014-11-21 2015-03-11 深圳天源迪科信息技术股份有限公司 身份证识别方法、装置及系统
CN105183950A (zh) * 2015-08-14 2015-12-23 深圳市向杉科技有限公司 一种基于移动终端查阅工程图纸的方法及系统
CN105279525A (zh) * 2015-11-19 2016-01-27 浪潮软件集团有限公司 一种图像处理的方法及装置
CN105279525B (zh) * 2015-11-19 2018-11-27 浪潮金融信息技术有限公司 一种图像处理的方法及装置
CN105550370B (zh) * 2016-01-26 2019-03-26 平安科技(深圳)有限公司 录入方法及录入系统
CN105550370A (zh) * 2016-01-26 2016-05-04 平安科技(深圳)有限公司 录入方法及录入系统
WO2017140218A1 (zh) * 2016-02-18 2017-08-24 阿里巴巴集团控股有限公司 信息识别方法及装置
CN107092903A (zh) * 2016-02-18 2017-08-25 阿里巴巴集团控股有限公司 信息识别方法及装置
TWI673656B (zh) * 2016-02-18 2019-10-01 香港商阿里巴巴集團服務有限公司 資訊識別方法及裝置
CN107123207A (zh) * 2016-02-25 2017-09-01 杭州健培科技有限公司 一种自助取片系统中的远程辅助识别的方法
CN106446901A (zh) * 2016-10-31 2017-02-22 中国银行股份有限公司 一种银行票据录入方法、装置及系统
CN106570105A (zh) * 2016-11-01 2017-04-19 广西电网有限责任公司电力科学研究院 一种电力设备试验报告的结构化处理方法
CN108664984A (zh) * 2017-03-28 2018-10-16 深圳市凯立德科技股份有限公司 一种数据检查的方法及装置
CN108664984B (zh) * 2017-03-28 2024-04-09 深圳市凯立德科技股份有限公司 一种数据检查的方法及装置
CN107145734B (zh) * 2017-05-04 2020-08-28 深圳市联新移动医疗科技有限公司 一种医疗数据的自动获取与录入方法及其系统
CN107145734A (zh) * 2017-05-04 2017-09-08 深圳市联新移动医疗科技有限公司 一种医疗数据的自动获取与录入方法及其系统
CN107783953A (zh) * 2017-09-22 2018-03-09 平安普惠企业管理有限公司 信息录入方法及终端设备
CN109961439A (zh) * 2017-12-22 2019-07-02 江苏奥博洋信息技术有限公司 一种模板自适应对海量影像的快速切割方法
CN108334484A (zh) * 2017-12-28 2018-07-27 北京科迅生物技术有限公司 数据录入的方法和装置
CN109064373A (zh) * 2018-07-17 2018-12-21 大连理工大学 一种基于外包图像数据录入的隐私保护方法
CN109583405A (zh) * 2018-12-06 2019-04-05 中国银行股份有限公司 一种信息录入方法及系统
CN109960707A (zh) * 2019-03-20 2019-07-02 上海亿阁信息科技有限公司 一种基于人工智能的高校招生数据采集方法及系统
CN110502193A (zh) * 2019-07-19 2019-11-26 广州奔想智能科技有限公司 一种身份证打印方法、系统和存储介质
CN111104853A (zh) * 2019-11-11 2020-05-05 中国建设银行股份有限公司 图像信息录入方法、装置、电子设备及存储介质
CN111444794A (zh) * 2020-03-13 2020-07-24 安诚迈科(北京)信息技术有限公司 基于ocr的票据识别辅助方法、设备、存储介质及装置
CN111444794B (zh) * 2020-03-13 2023-12-12 安诚迈科(北京)信息技术有限公司 基于ocr的票据识别辅助方法、设备、存储介质及装置
CN111428633A (zh) * 2020-03-23 2020-07-17 中国建设银行股份有限公司 一种凭证影像处理方法、装置、设备和介质
CN111476949A (zh) * 2020-04-03 2020-07-31 杭州恒生数字设备科技有限公司 一种基于数据关联的安全储物系统
CN111476949B (zh) * 2020-04-03 2021-05-18 杭州恒生数字设备科技有限公司 一种基于数据关联的安全储物系统
CN113239893A (zh) * 2021-06-10 2021-08-10 深圳智子系科技有限公司 一种文档录入复核方法、系统、电子设备及介质

Also Published As

Publication number Publication date
CN101739441B (zh) 2012-01-25

Similar Documents

Publication Publication Date Title
CN101739441B (zh) 一种图像信息录入的方法以及系统
AU2018374912B2 (en) Model training system and method, and storage medium
US7940929B1 (en) Method for processing documents containing restricted information
CN100472546C (zh) 图像处理器
US8204949B1 (en) Email enabled project management applications
US20020114013A1 (en) System, computer program product and method for managing documents
CN104954322A (zh) 一种账号的绑定处理方法、装置及系统
CN101826101A (zh) 搜索引擎装置及其方法
CN109005142B (zh) 网站安全检测方法、装置、系统、计算机设备和存储介质
CN102947819A (zh) 信息追踪系统和方法
WO2001082141A1 (en) System and method for determining user identity fraud using similarity searching
US20210351927A1 (en) System, method and computer program product for mitigating customer onboarding risk
CN112567716A (zh) 安全数据传输系统和方法
CN114722416B (zh) 一种基于加密的财务信息化数据处理方法和系统
CA3038506A1 (en) Computerized voting system
CN113064562A (zh) 基于区块链的人机交互打印方法及打印系统
CN113434588B (zh) 基于移动通信话单的数据挖掘分析方法及装置
CN111582831B (zh) 政务信箱管理方法、系统及存储介质
JP2008112279A (ja) 情報処理システムおよび情報処理装置および情報処理プログラム
CN111614638A (zh) 一种基于大数据平台的人脸识别数据分发系统和分发方法
Simske et al. APEX: Automated policy enforcement eXchange
US20070223694A1 (en) Methods, media, and systems for entitlement clearing
CN107045542A (zh) 数据查询系统及查询方法
US20100325156A1 (en) Systems and methods for secure data entry and storage
CN113128958A (zh) 一种基于企业链码的电子档案管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant