CN108875570B - 信息处理装置、存储介质和信息处理方法 - Google Patents
信息处理装置、存储介质和信息处理方法 Download PDFInfo
- Publication number
- CN108875570B CN108875570B CN201810438102.XA CN201810438102A CN108875570B CN 108875570 B CN108875570 B CN 108875570B CN 201810438102 A CN201810438102 A CN 201810438102A CN 108875570 B CN108875570 B CN 108875570B
- Authority
- CN
- China
- Prior art keywords
- name
- image
- handwriting information
- handwritten
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 29
- 238000003672 processing method Methods 0.000 title claims description 5
- 239000002131 composite material Substances 0.000 claims abstract description 11
- 239000000284 extract Substances 0.000 claims abstract description 9
- 239000000945 filler Substances 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000003705 background correction Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/40—Spoof detection, e.g. liveness detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Discrimination (AREA)
- Collating Specific Patterns (AREA)
- Processing Or Creating Images (AREA)
- Facsimiles In General (AREA)
Abstract
本发明涉及信息处理装置,其对应手写姓名的姓名栏和在姓名栏以外区域填写的含有手写文字的用纸进行扫描,获得用纸图像,辨认含在用纸图像中的手写文字,生成对辨认的手写文字的每个文字特征进行表示的笔迹信息,判断含在用纸图像中的姓名栏上是否记载有姓名,如果判断为没有记载姓名,则从与一个以上人的姓名、人的属性、人的笔迹信息相互关联而存储的数据库中,抽出与特定属性相关联的一个以上的姓名和笔迹信息以制成文件表,选择以与生成的笔迹信息相关联的方式存储在文件表中的一个姓名,生成表示选择的姓名的姓名图像,且把姓名图像和用纸图像合成,从而生成合成图像。
Description
技术领域
本发明涉及对含有手写文字的用纸进行扫描获得用纸图像,从而可以生成在用纸图像中包含的手写文字的笔迹信息的信息处理装置、存储信息处理程序的存储介质和信息处理方法。
背景技术
周知的技术是对含有手写文字的用纸进行扫描获得用纸图像,根据在用纸图像中包含的手写文字的笔迹信息,来确定填写者。
在对含有手写文字的用纸进行扫描获得用纸图像,根据在用纸图像中包含的手写文字的笔迹信息,来确定填写者的技术中,人们期望有关技术可越来越准确地确定填写者。
发明内容
[解决问题的技术手段]
本发明一种方式的信息处理装置装备有处理器,该处理器使下列各部进行如下操作:获取图像部,对应手写姓名的姓名栏和在所述姓名栏以外区域填写的含有手写文字的纸进行扫描,获得用纸图像;文字辨认部,辨认含在所述用纸图像中的所述手写文字;生成笔迹信息部,生成对所述辨认的手写文字的每个文字特征进行表示的笔迹信息;姓名栏判断部,判断在所述用纸图像中的所述姓名栏中是否记载有姓名;填写者判断部,所述姓名栏判断部如果判断为没有姓名,则从与一个以上人的姓名、所述人的属性、所述人的笔迹信息相互关联而存储的数据库中,抽出与特定属性相关联的一个以上的姓名和笔迹信息以制成文件表,选择以与所述生成的笔迹信息相关联的方式存储在所述文件表中的一个姓名;图像生成部,生成表示所述选择的姓名的姓名图像,且把所述姓名图像和所述用纸图像合成,从而生成合成图像。
本发明一种方式的存储介质上存储有信息处理程序,其是非暂时性的、计算机可以读取的存储介质存储的信息处理程序,使信息处理装置的处理器让下列各部进行如下动作:获取图像部,对应手写姓名的姓名栏和在所述姓名栏以外区域填写的含有手写文字的用纸进行扫描,获得用纸图像;文字辨认部,辨认所述用纸图像中的所述手写文字;生成笔迹信息部,生成对所述辨认的手写文字的每个文字的特征进行表示的笔迹信息;姓名栏判断部,判断在所述用纸图像中的所述姓名栏上是否记载有姓名;填写者判断部,所述姓名栏判断部如果判断为没有记载姓名,则从与一个以上人的姓名、所述人的属性、所述人的笔迹信息相互关联而存储的数据库中,抽出与特定属性相关联的一个以上的姓名和笔迹信息以制成文件表,选择以与所述生成的笔迹信息相关联的方式存储在所述文件表中的一个姓名;图像生成部,生成表示所述选择的姓名的姓名图像,且把所述姓名图像和所述用纸图像合成,从而生成合成图像。
本发明一种方式的信息处理方法,包括如下步骤:对应手写姓名的姓名栏和在所述姓名栏以外区域填写的含有手写文字的用纸进行扫描,获得用纸图像;辨认所述用纸图像中的所述手写文字;生成对所述辨认的手写文字的每个文字特征进行表示的笔迹信息;判断在所述用纸图像中的所述姓名栏上是否记载有姓名;如果判断为没有记载姓名,则从与一个以上人的姓名、所述人的属性、所述人的笔迹信息相互关联而存储的数据库中,抽出与特定属性相关联的一个以上的姓名和笔迹信息以制成文件表;选择以与所述生成的笔迹信息相关联的方式存储在所述文件表中的一个姓名,生成表示所述选择的姓名的姓名图像;且把所述姓名图像和所述用纸图像合成,从而生成合成图像。
通过以下如附图所示,对附图中显示的根据本发明的最佳实施例的进行的详细描述说明,可以使更清楚本发明的对象目的、特征和优点更明晰。
附图说明
图1表示本发明一种实施方式涉及的图像形成装置的硬件构成。
图2表示图像形成装置的功能构成。
图3表示图像形成装置的动作流程(第一次)。
图4表示图像形成装置的动作流程(第二次以后)。
附图标记说明:图中的是表示菱形框的判断成立,否表示菱形框的判断不成立。
具体实施方式
下面参照附图对本发明的实施方式进行说明。在本实施方式中,把信息处理装置作为图像形成装置(以下将多功能外设简称为MFP)进行说明。
1.图像形成装置的硬件构成
图1表示本发明一种实施方式的图像形成装置的硬件构成。
MFP10具有控制部11。控制部11由作为处理器的CPU(中央处理器)、RAM(随机存储器)、作为存储器的ROM(只读存储器)以及专用的硬件电路等构成,承担MFP10的全部动作控制。使MFP10发挥各功能部(后面叙述)作用的计算机程序被存储在ROM等非暂时性的计算机可读取的存储介质中。
控制部11与图像读取部12、图像处理部14、图像存储器15、图像形成部16、操作部17、存储部18、通信控制部13等连接。控制部11对连接着的上述各部的动作进行控制,且与各部之间进行信号或数据的收发。
控制部11按照用户通过操作部17或网络连接的个人电脑(图中没有表示)等输入的执行作业的指示,为了对扫描器功能、印刷(打印)功能和复印功能等各功能的动作实行控制,而对有关必要的机构的驱动和处理进行控制。
图像读取部12是从原稿读取图像的图像扫描器。
图像处理部14根据需要对由图像读取部12读取的图像的图像数据进行图像处理。例如,为了提高用图像读取部12读取的图像在形成图像后的质量,图像处理部14进行明暗度修正等图像处理。
图像存储器15具有临时存储由图像读取部12读取得到的原稿图像数据的区域,或临时存储在图像形成部16中的成为印刷对象的数据的区域。
图像形成部16(打印机)把用图像读取部12读取的图像数据等形成图像。
操作部17具有触摸面板部和操作键部,所述触摸面板部和操作键部接受来自用户的有关MFP10可以实行的各种动作和处理的指示。触摸面板部具有设置了触摸面板的LCD(液晶显示器)或有机EL(电致发光)显示器等的显示部17a。
通信控制部13(通信设备)是用于连接网络N的接口。
存储部18是存储由图像读取部12读取的原稿图像等的、如HDD(硬盘驱动器)之类的大容量存储装置。存储部18还可以有可装拆式连接的移动式存储介质(例如USB(通用串行总线)存储器)及其接口。
2.图像形成装置的功能构成
图2表示图像形成装置的功能构成。
MFP10的控制部11的CPU(处理器)通过把存储在ROM(存储器)中的信息处理程序加载到RAM并执行,而使获取图像部101、文字辨认部102、生成笔迹信息部103、姓名栏判断部104、冒充判断部105、填写者判断部106和图像生成部107动作。
获取图像部101对应手写姓名的姓名栏和填写在姓名栏以外区域中的含有手写文字的用纸进行扫描,获得扫描得到的用纸图像。
文字辨认部102识别用纸图像中包含的手写文字。
生成笔迹信息部103生成表示文字辨认部102识别的手写文字中每个文字的特征的笔迹信息。
姓名栏判断部104判断用纸图像中包含的姓名栏中是否记载有姓名。
如姓名栏判断部104判断为记载有姓名,则冒充判断部105会判断生成笔迹信息部103生成的笔迹信息是否与在姓名栏中手写的姓名相关联,并存储在笔迹信息数据库112中。在冒充判断部105中,如判断为还没有把生成笔迹信息部103生成的笔迹信息与在姓名栏中手写的姓名相关联,并存储在笔迹信息数据库112中,则把与生成笔迹信息部103生成的笔迹信息相关联而存储在笔迹信息数据库112中的姓名抽出。
笔迹信息数据库112使一个以上的人的姓名、人的属性、人的笔迹信息相互关联并存储。
如果姓名栏判断部104判断为还没有记载姓名,则填写者判断部106从笔迹信息数据库112抽出与特定属性相关联的一个以上的姓名和笔迹信息,生成检索用文件表。填写者判断部106选择以与生成笔迹信息部103生成的笔迹信息相关联的方式存储在检索用文件表中的一个姓名。当有多个与在生成笔迹信息部103生成的笔迹信息相关联的姓名存储在检索用文件表中时,填写者判断部106把多个姓名作为候选,并把手写在其他用纸图像中的姓名栏中的姓名从候选中去除,选择没有去除而被留下来的一个姓名。
图像生成部107生成表示填写者判断部106选择的姓名的姓名图像,把姓名图像和用纸图像合成以生成合成图像。
3.图像形成装置的动作流程
图3表示图像形成装置的动作流程(第一次)。
图像读取部12(图像扫描器)对给纸机等提供的用纸进行扫描,生成用纸图像。在“用纸”中包含应该手写姓名的姓名栏、填写在姓名栏以外区域的手写文字。在“姓名栏”中有手写姓名、或没有填写的内容(有意或无意)。“姓名栏以外区域”例如是手写回答的回答栏。这种“用纸”例如是学校或预科学校等的考试答案纸或调查问卷纸。
获取图像部101获得图像读取部12生成的用纸图像(严格地说是图像数据)(步骤S101)。获取图像部101把获得的用纸图像提供给文字辨认部102。
文字辨认部102从获取图像部101获得用纸图像。文字辨认部102识别在用纸图像中所包含的手写文字(步骤S102)。“手写文字”包含在姓名栏中手写的文字(姓名)、在属性栏中手写的文字(属性)和在姓名栏以外区域手写的文字(答案)。具体说,文字辨认部102利用边缘检测把手写文字抽出。文字辨认部102参照OCR(光学文字识别,光学字符识别)用数据库111,分别对抽出的手写文字进行识别。具体说,与文字图像模式和文字代码对应,把一个个文字登录到OCR用数据库111中。文字辨认部102从OCR用数据库111检索显示抽出的文字的图像模式,获得与用检索得到的图像模式对应的文字代码。文字辨认部102获得关于全部手写文字的文字代码。文字辨认部102把在姓名栏中手写的文字(姓名)的文字代码组合,以识别姓名。文字辨认部102把在属性栏上手写的文字(属性)的文字代码组合,以识别属性。“属性”是表示学校名、学年、班级等人的所属单位的信息。
生成笔迹信息部103生成表示文字辨认部102辨认出的手写文字的每个文字特征的笔迹信息(步骤S103)。例如“笔迹信息”涉及每个文字起笔的强度(粗、浓)或弱度(细、淡)、转弯的圆度、弯折的角度、写完的强度(粗、浓)或弱度(细、淡)等。在生成笔迹信息部103中,将已生成的每个文字的笔迹信息与文字辨认部102识别的姓名和属性相关联,存储在笔迹信息数据库112中。
图4表示图像形成装置的动作流程(第二次以后)。
获取图像部101获得图像读取部12生成的用纸图像(严格地说是图像数据)(步骤S201。与图3的步骤S101相同)。获取图像部101把获得的用纸图像提供给文字辨认部102。
文字辨认部102从获取图像部101获得用纸图像。文字辨认部102对在用纸图像中所包含的手写文字进行识别(步骤S202。与图3的步骤S102相同)。文字辨认部102把在姓名栏中手写的文字(姓名)的文字代码组合,以识别姓名。文字辨认部102把在属性栏上手写的文字(属性)的文字代码组合,以识别属性。
生成笔迹信息部103生成表示文字辨认部102辨认的手写文字中每个文字特征的笔迹信息(步骤S203。与图3的步骤S103相同)。
姓名栏判断部104获得文字辨认部102辨认的姓名,判断在用纸图像上的姓名栏中是否记载有姓名(步骤S204)。下面就姓名栏判断部104的判断分成(1)和(2)两种情况进行说明,(1)是判断为用纸图像上的姓名栏中记载有姓名的情况(步骤S204,是),(2)是判断为用纸图像上的姓名栏中没有记载姓名(典型的情况是姓名栏是空白)的情况(步骤S204,否)。
(1)在姓名栏中记载有姓名的情况(步骤S204,是)
冒充判断部105判断是否生成笔迹信息部103生成的笔迹信息以与文字辨认部102辨认的姓名(在姓名栏中手写的姓名)相关联的方式存储在笔迹信息数据库112中(步骤S205)。
如果笔迹信息没有与在姓名栏中手写的姓名相关联,则别的人就可能“冒充”具有其姓名的人在该纸上手写上姓名和答案等;另一方面,如果笔迹信息与在姓名栏中手写的姓名相关联,则很有可能是具有其姓名的人本人自己在其纸上手写姓名和答案等而不是“冒充”。
冒充判断部105判断为笔迹信息以与姓名栏上手写的姓名相关联的方式存储在笔迹信息数据库112中(不是“冒充”的可能性大)(步骤S206,是)。在这种情况下,冒充判断部105会把生成笔迹信息部103生成出的笔迹信息与文字辨认部102辨认出的姓名(在姓名栏中手写的姓名)相关联,提供给笔迹信息数据库112补充存储并更新(步骤S207)。像这样把笔迹信息补充存储到笔迹信息数据库112中以进行更新,从而基于笔迹信息使人物的确定达到高精度。
一方面,冒充判断部105判断为笔迹信息并没有以与在姓名栏中手写的姓名相关联的方式存储在笔迹信息数据库112中(担心被“冒充”)(步骤S206,否)。在这种情况下,冒充判断部105会判断是否有以与生成笔迹信息部103生成的笔迹信息相关联的方式存储在笔迹信息数据库112中的姓名(步骤S208)。
冒充判断部105如果判断为有以与生成笔迹信息部103生成的笔迹信息相关联的方式而存储在笔迹信息数据库112中的姓名(步骤S209,是),则将其姓名(担心被“冒充”的人的姓名)显示在显示部17a上,警告用户(评级者等)(步骤S210)。
另一方面,冒充判断部105如果判断为没有以与生成笔迹信息部103生成的笔迹信息相关联的方式而存储在笔迹信息数据库112的姓名(步骤S209,否),则将没有符合条件的人这种内容的信息显示在显示部17a上,警告用户(评级者等)(步骤S211)。
(2)在姓名栏上没有记载姓名的情况(步骤S204,否)
填写者判断部106从笔迹信息数据库112抽出与特定属性相关联的一个以上的姓名和笔迹信息,生成检索用文件表(步骤S212)。所谓“特定属性”是指:根据应记载在姓名栏(没有填写的)上的姓名来确定的人的属性(班级等),基于用户(评级者等)的操作来指定。也就是说,“检索用文件表”是表示属于“特定属性”(一个班级等)的多个人的姓名和笔迹信息的文件表。
填写者判断部106判断在生成的检索用文件表中是否存储有生成笔迹信息部103生成的笔迹信息(步骤S213)。填写者判断部106如果判断为在生成的检索用文件表中没有存储生成笔迹信息部103生成的笔迹信息(步骤S213,否),则将没有符合条件的人这种内容的信息显示在显示部17a上,警告用户(评级者等)(步骤S211)。
另一方面,填写者判断部106如果判断为在生成的检索用文件表中存储有生成笔迹信息部103生成的笔迹信息(步骤S213,是)。在这种情况下,填写者判断部106判断在生成的检索用文件表中是存储有与生成笔迹信息部103生成的笔迹信息相关联的多个姓名,还是只存储一个姓名(步骤S214)。
填写者判断部106如果判断为在生成的检索用文件表中只存储有一个与生成笔迹信息部103生成的笔迹信息相关联的姓名,则选择这一个姓名(步骤S214,是)。在这种情况下,被选择的姓名的人是填写者的可能性大。因此,填写者判断部106把生成笔迹信息部103生成的笔迹信息与被选择的姓名相关联,提供给笔迹信息数据库112,补充存储并更新(步骤S215)。像这样在笔迹信息数据库112中补充存储笔迹信息以进行更新,从而基于笔迹信息使人物的确定达到高精度。填写者判断部106把被选择的姓名(是填写者的可能性大的人的姓名)提供给图像生成部107。
图像生成部107从填写者判断部106获得被选择的姓名(是填写者的可能性大的人的姓名)。图像生成部107生成表示填写者判断部106选择的姓名的姓名图像。“姓名图像”典型而言是表示姓名的文本图像。图像生成部107把生成的姓名图像和获取图像部101获得的用纸图像合成,生成合成图像(步骤S216)。例如图像生成部107通过把生成的姓名图像合成到在获取图像部101获得的用纸图像中包含的姓名栏中,从而生成合成图像。也就是说,图像生成部107生成如在空白的姓名栏中写入姓名那样的合成图像。图像生成部107把生成的合成图像输出(印刷、保存、显示、发送等)(步骤S217)。
另一方面,填写者判断部106如果判断为在生成的检索用文件表中存储有与生成笔迹信息部103生成的笔迹信息相关联的多个姓名(步骤S214,否)。在这种情况下,填写者判断部106把这样的多个姓名作为填写者的候选,保留对填写者的确定(步骤S218)。
接着,MFP10的控制部11对于其他的用纸图像执行从步骤S201至S207的处理。填写者判断部106从检索用文件表中删除(排除)冒充判断部105给笔迹信息数据库112补充存储并更新的姓名和笔迹信息(步骤S207),且更新检索用文件表(步骤S219)。换句话说,填写者判断部106通过从检索用文件表中把没有能成为填写者的候选的姓名和笔迹信息一个个排除,压缩了填写者的候选。填写者判断部106判断在更新后的(压缩了候选后的)检索用文件表中,是否只存储有一个与生成笔迹信息部103生成的笔迹信息相关联的姓名(步骤S220)。
填写者判断部106如果判断为在更新后的(压缩了候选后的)检索用文件表中,只存储一个与生成笔迹信息部103生成的笔迹信息相关联的姓名(没有被排出留下来的姓名只有一个),则选择此一个姓名(步骤S220,是)。在这种情况下,选择的姓名的人是填写者的可能性大。因此,填写者判断部106把选择的姓名(是填写者的可能性大的人的姓名)提供给图像生成部107。图像生成部107生成对填写者判断部106选择的姓名进行表示的姓名图像,生成合成图像(步骤S216),并输出生成的合成图像(步骤S217)。
另一方面,填写者判断部106如果判断为在更新后的(压缩候选后的)检索用文件表中,一个也没有存储与生成笔迹信息部103生成的笔迹信息相关联的姓名(在步骤S220中为否,在步骤S221中为否),则将没有符合条件的人这种内容的信息显示在显示部17a上,警告用户(评级者等)(步骤S211)。
另一方面,填写者判断部106如果判断为在更新后的(压缩候选后的)检索用文件表中,存储有多个与生成笔迹信息部103生成的笔迹信息相关联的姓名(在步骤S220中为否,在步骤S221中为是),则将成为候选的多个姓名显示在显示部17a上,让用户(评级者等)指定是否生成含有某个姓名的合成图像(步骤S222)。
填写者判断部106如果根据用户对操作部17进行特定操作,判断为生成含有特定(由用户指定)的姓名的合成图像(在步骤S223中为是),则生成显示其姓名的姓名图像,生成合成图像(步骤S216),并输出生成后的合成图像(步骤S217)。
4.变形例
在上述实施方式中,MFP10执行了所有的处理。也可以代之以信息处理装置从扫描器或MFP获得用纸图像,执行全部的处理(图中没有表示)。信息处理装置可以是通过内部网连接在图像扫描器或MFP上的、由用户(评级者等)利用的个人计算机;另外,信息处理装置也可以是通过互联网连接在图像扫描器或MFP上的所谓服务器。或者也可以是外部的服务器装置的存储器存储笔迹信息数据库112,信息处理装置通过通信设备获得笔迹信息数据库112,执行全部的处理(图中没有表示)。
5.总结
按照本实施方式,如果姓名栏判断部104判断为在用纸图像中包含的姓名栏中没有记载姓名,则填写者判断部106根据表示在生成笔迹信息部103生成的用纸图像中包含的每个手写文字的特征的笔迹信息,进行填写者判断。因此,在姓名栏中没有记载姓名的情况下,填写者判断部106可以根据笔迹信息高准确度地判断填写者。在填写者的候选有多个的情况下,填写者判断部106由于可以从与特定属性相关联的候选中聚焦填写者,所以可以高准确度地判断填写者。
按照本实施方式,在姓名栏判断部104判断出在用纸图像中包含的姓名栏上记载有姓名的情况下,冒充判断部105根据表示在生成笔迹信息部103生成的用纸图像中每个手写文字的特征的笔迹信息进行如下判断,即判断别的人是否“冒充”成具有其姓名的人,在其用纸手写了姓名和答案等,或者不是冒充,是具有其姓名的人本人在其用纸手写了姓名和答案等。由此在姓名栏中记载有姓名的情况下,冒充判断部105可以高准确度地判断有无“冒充”的可能性。
以上对本技术的各实施方式和各变形例进行了说明,但本技术并不仅限定于上述的实施方式,在不脱离本技术的宗旨的范围内,当然可以进行各种各样的变更。
Claims (9)
1.一种信息处理装置,其特征在于,装备有处理器,该处理器使下列各部进行如下处理:
获取图像部,对应手写姓名的姓名栏和在所述姓名栏以外区域填写的含有手写文字的用纸进行扫描,获得用纸图像;
文字辨认部,辨认含在所述用纸图像中的所述手写文字;
生成笔迹信息部,生成对所述辨认的手写文字的每个文字特征进行表示的笔迹信息;
姓名栏判断部,判断在所述用纸图像中的所述姓名栏中是否记载有姓名;
填写者判断部,所述姓名栏判断部如果判断为没有记载姓名,则从使与一个以上人的姓名、所述人的属性、所述人的笔迹信息相互关联而存储的数据库中,抽出与特定属性相关联的一个以上的姓名和笔迹信息以制成文件表,当有多个与所述生成的笔迹信息相关联的姓名存储在所述文件表中时,把所述多个姓名作为候选,并把手写在包含在其他用纸图像中的姓名栏中的姓名从所述候选中去除,选择没有去除而被留下来的一个姓名;
图像生成部,生成表示所述被选择姓名的姓名图像,且把所述姓名图像和所述用纸图像合成,从而生成合成图像。
2.根据权利要求1所述的信息处理装置,其特征在于,
所述生成笔迹信息部把所述生成的笔迹信息与所述选择的姓名相关联,提供给所述数据库。
3.根据权利要求1或2所述的信息处理装置,其特征在于,
所述图像生成部通过在所述用纸图像中含有的所述姓名栏中合成所述姓名图像,生成合成图像。
4.根据权利要求1或2所述的信息处理装置,其特征在于,
所述处理器还使冒充判断部进行以下动作:
如果所述姓名栏判断部判断为记载有姓名,则在冒充判断部中判断所述生成的笔迹信息是否与在所述姓名栏中手写的姓名相关联而存储在所述数据库中;
如判断为所述生成的笔迹信息还没有与在所述姓名栏中手写的姓名相关联而存储在所述数据库中,则抽出与所述生成的笔迹信息相关联而存储在所述数据库中的姓名。
5.根据权利要求4所述的信息处理装置,其特征在于,
在所述冒充判断部中,如果判断为所述生成的笔迹信息与在所述姓名栏中手写的姓名相关联而存储在所述数据库中,则把所述生成的笔迹信息与在所述姓名栏中手写的姓名相关联,且提供给所述数据库。
6.根据权利要求1或2所述的信息处理装置,其特征在于,
还具有存储所述数据库的存储器。
7.根据权利要求1或2所述的信息处理装置,其特征在于,
还具有通信设备,该通信设备用于获得外部的服务器装置的存储器存储的所述数据库。
8.一种存储介质,其是存储信息处理程序的非暂时性计算机可读的存储介质,其特征在于,
所述信息处理程序使信息处理装置的处理器让以下各部进行以下动作:
获取图像部,对应手写姓名的姓名栏和在所述姓名栏以外区域填写的含有手写文字的用纸进行扫描,获得用纸图像;
文字辨认部,辨认含在所述用纸图像中的所述手写文字;
生成笔迹信息部,生成对所述辨认的手写文字的每个文字特征进行表示的笔迹信息;
姓名栏判断部,判断在所述用纸图像中的所述姓名栏中是否记载有姓名;
填写者判断部,所述姓名栏判断部如果判断为没有记载姓名,则从与一个以上人的姓名、所述人的属性、所述人的笔迹信息相互关联存储的数据库中,抽出与特定属性相关联的一个以上的姓名和笔迹信息以制成文件表,当有多个与所述生成的笔迹信息相关联的姓名存储在所述文件表中时,把所述多个姓名作为候选,并把手写在包含在其他用纸图像中的姓名栏中的姓名从所述候选中去除,选择没有去除而被留下来的一个姓名;
图像生成部,生成表示所述选择的姓名的姓名图像,把所述姓名图像和所述用纸图像合成,从而生成合成图像。
9.一种信息处理方法,其特征在于,包括步骤:
对应手写姓名的姓名栏和在所述姓名栏以外区域填写的含有手写文字的用纸进行扫描,获得用纸图像;
辨认所述用纸图像中的所述手写文字;
生成表示所述辨认的手写文字的每个文字特征的笔迹信息;
判断在所述用纸图像中的所述姓名栏中是否记载有姓名,
如果判断为没有记载姓名,则从与一个以上人的姓名、所述人的属性、所述人的笔迹信息相互关联存储的数据库中,抽出与特定属性相关联的一个以上的姓名和笔迹信息,制成文件表,
当有多个与所述生成的笔迹信息相关联的姓名存储在所述文件表中时,把所述多个姓名作为候选,并把手写在包含在其他用纸图像中的姓名栏中的姓名从所述候选中去除,选择没有去除而被留下来的一个姓名,
生成表示所述选择的姓名的姓名图像,
把所述姓名图像和所述用纸图像合成,从而生成合成图像。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017096180A JP6729486B2 (ja) | 2017-05-15 | 2017-05-15 | 情報処理装置、情報処理プログラム及び情報処理方法 |
JP2017-096180 | 2017-05-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108875570A CN108875570A (zh) | 2018-11-23 |
CN108875570B true CN108875570B (zh) | 2022-04-19 |
Family
ID=64096643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810438102.XA Active CN108875570B (zh) | 2017-05-15 | 2018-05-09 | 信息处理装置、存储介质和信息处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10607071B2 (zh) |
JP (1) | JP6729486B2 (zh) |
CN (1) | CN108875570B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6870137B1 (ja) * | 2020-04-06 | 2021-05-12 | 株式会社Alconta | データ活用システム、データ活用方法及びプログラム |
KR20220169231A (ko) * | 2021-06-18 | 2022-12-27 | 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. | 핸드라이팅 텍스트에 기초하여 구별된 작성자의 파일을 생성 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1273401A (zh) * | 1999-05-06 | 2000-11-15 | 富士通株式会社 | 文字识别装置 |
CN101277360A (zh) * | 2007-03-19 | 2008-10-01 | 株式会社理光 | 图像处理装置、图像处理方法、以及图像处理程序生成 |
CN101276412A (zh) * | 2007-03-30 | 2008-10-01 | 夏普株式会社 | 信息处理装置、信息处理系统和信息处理方法 |
CN101872344A (zh) * | 2009-04-27 | 2010-10-27 | 上海百测电气有限公司 | 一种图像扫描的控制方法 |
CN102663124A (zh) * | 2012-04-20 | 2012-09-12 | 上海合合信息科技发展有限公司 | 移动设备上的联系人信息的管理方法及系统 |
CN103020619A (zh) * | 2012-12-05 | 2013-04-03 | 上海合合信息科技发展有限公司 | 一种自动切分电子化笔记本中手写条目的方法 |
CN103135894A (zh) * | 2011-11-24 | 2013-06-05 | 冲电气工业株式会社 | 票据数据输入装置以及票据数据输入方法 |
JP2014236262A (ja) * | 2013-05-31 | 2014-12-15 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置、画像形成システム、及び画像形成方法 |
CN104809099A (zh) * | 2014-01-24 | 2015-07-29 | 京瓷办公信息系统株式会社 | 文档文件生成装置及文档文件生成方法 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0646217A (ja) | 1992-07-22 | 1994-02-18 | Ricoh Co Ltd | ファクシミリ装置 |
JP2000057415A (ja) * | 1998-08-11 | 2000-02-25 | Hitachi Ltd | 自動取引装置 |
US6668354B1 (en) * | 1999-01-05 | 2003-12-23 | International Business Machines Corporation | Automatic display script and style sheet generation |
EP1093058A1 (en) * | 1999-09-28 | 2001-04-18 | Cloanto Corporation | Method and apparatus for processing text and character data |
US7236653B2 (en) * | 2003-03-27 | 2007-06-26 | Sharp Laboratories Of America, Inc. | System and method for locating document areas using markup symbols |
GB0417069D0 (en) * | 2004-07-30 | 2004-09-01 | Hewlett Packard Development Co | Methods, apparatus and software for validating entries made on a form |
JP4574313B2 (ja) * | 2004-10-04 | 2010-11-04 | キヤノン株式会社 | 画像処理装置および方法 |
JP4807486B2 (ja) * | 2005-02-23 | 2011-11-02 | 富士ゼロックス株式会社 | 教材処理装置、教材処理方法および教材処理プログラム |
JP4533187B2 (ja) * | 2005-03-01 | 2010-09-01 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
JP4856925B2 (ja) * | 2005-10-07 | 2012-01-18 | 株式会社リコー | 画像処理装置、画像処理方法及び画像処理プログラム |
US9430455B2 (en) * | 2005-12-15 | 2016-08-30 | Simpliance, Inc. | Methods and systems for intelligent form-filling and electronic document generation |
JP2008020506A (ja) | 2006-07-11 | 2008-01-31 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
US8189920B2 (en) * | 2007-01-17 | 2012-05-29 | Kabushiki Kaisha Toshiba | Image processing system, image processing method, and image processing program |
US20090138284A1 (en) * | 2007-11-14 | 2009-05-28 | Hybrid Medical Record Systems, Inc. | Integrated Record System and Method |
US8335754B2 (en) * | 2009-03-06 | 2012-12-18 | Tagged, Inc. | Representing a document using a semantic structure |
JP5712487B2 (ja) * | 2009-09-04 | 2015-05-07 | 株式会社リコー | 画像処理装置、画像処理システム、画像処理方法、及びプログラム |
US9390089B2 (en) * | 2009-12-17 | 2016-07-12 | Wausau Financial Systems, Inc. | Distributed capture system for use with a legacy enterprise content management system |
US20110271173A1 (en) * | 2010-05-03 | 2011-11-03 | Xerox Corporation | Method and apparatus for automatic filling of forms with data |
US20120087537A1 (en) * | 2010-10-12 | 2012-04-12 | Lisong Liu | System and methods for reading and managing business card information |
US9390460B2 (en) * | 2011-11-04 | 2016-07-12 | Document Security Systems, Inc. | System and method for dynamic generation of embedded security features in a document |
JP5984439B2 (ja) * | 2012-03-12 | 2016-09-06 | キヤノン株式会社 | 画像表示装置、画像表示方法 |
US20140146200A1 (en) * | 2012-11-28 | 2014-05-29 | Research In Motion Limited | Entries to an electronic calendar |
US9298685B2 (en) * | 2013-02-28 | 2016-03-29 | Ricoh Company, Ltd. | Automatic creation of multiple rows in a table |
US8958644B2 (en) * | 2013-02-28 | 2015-02-17 | Ricoh Co., Ltd. | Creating tables with handwriting images, symbolic representations and media images from forms |
US9256795B1 (en) * | 2013-03-15 | 2016-02-09 | A9.Com, Inc. | Text entity recognition |
JP6325407B2 (ja) * | 2014-09-29 | 2018-05-16 | 株式会社東芝 | 情報処理装置、情報処理方法及びプログラム |
US9384391B2 (en) * | 2014-10-03 | 2016-07-05 | Xerox Corporation | Methods and systems for processing documents |
WO2016073479A1 (en) * | 2014-11-03 | 2016-05-12 | Automated Clinical Guidelines, Llc | Method and platform/system for creating a web-based form that incorporates an embedded knowledge base, wherein the form provides automatic feedback to a user during and following completion of the form |
US9524435B2 (en) * | 2015-03-20 | 2016-12-20 | Google Inc. | Detecting the location of a mobile device based on semantic indicators |
DE102015208088A1 (de) * | 2015-04-30 | 2016-11-03 | Bundesdruckerei Gmbh | Verfahren zur Erzeugung einer elektronischen Signatur |
JP2016225699A (ja) | 2015-05-27 | 2016-12-28 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置及び画像形成プログラム |
JP6394579B2 (ja) * | 2015-12-08 | 2018-09-26 | 京セラドキュメントソリューションズ株式会社 | 画像読取装置及び画像形成装置 |
US9418315B1 (en) * | 2016-03-14 | 2016-08-16 | Sageworks, Inc. | Systems, methods, and computer readable media for extracting data from portable document format (PDF) files |
JP6579331B2 (ja) * | 2016-07-28 | 2019-09-25 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置、文書電子化プログラムおよび文書電子化方法 |
US10572528B2 (en) * | 2016-08-11 | 2020-02-25 | International Business Machines Corporation | System and method for automatic detection and clustering of articles using multimedia information |
US10192127B1 (en) * | 2017-07-24 | 2019-01-29 | Bank Of America Corporation | System for dynamic optical character recognition tuning |
US10635748B2 (en) * | 2017-12-14 | 2020-04-28 | International Business Machines Corporation | Cognitive auto-fill content recommendation |
US10521654B2 (en) * | 2018-03-29 | 2019-12-31 | Fmr Llc | Recognition of handwritten characters in digital images using context-based machine learning |
RU2715515C2 (ru) * | 2018-03-30 | 2020-02-28 | Акционерное общество "Лаборатория Касперского" | Система и способ выявления изображения, содержащего идентификационный документ |
US11055557B2 (en) * | 2018-04-05 | 2021-07-06 | Walmart Apollo, Llc | Automated extraction of product attributes from images |
JP2019195980A (ja) * | 2018-05-11 | 2019-11-14 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置および画像処理装置の制御方法ならびにプログラム |
-
2017
- 2017-05-15 JP JP2017096180A patent/JP6729486B2/ja not_active Expired - Fee Related
-
2018
- 2018-05-09 CN CN201810438102.XA patent/CN108875570B/zh active Active
- 2018-05-10 US US15/976,316 patent/US10607071B2/en not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1273401A (zh) * | 1999-05-06 | 2000-11-15 | 富士通株式会社 | 文字识别装置 |
CN101277360A (zh) * | 2007-03-19 | 2008-10-01 | 株式会社理光 | 图像处理装置、图像处理方法、以及图像处理程序生成 |
CN101276412A (zh) * | 2007-03-30 | 2008-10-01 | 夏普株式会社 | 信息处理装置、信息处理系统和信息处理方法 |
CN101872344A (zh) * | 2009-04-27 | 2010-10-27 | 上海百测电气有限公司 | 一种图像扫描的控制方法 |
CN103135894A (zh) * | 2011-11-24 | 2013-06-05 | 冲电气工业株式会社 | 票据数据输入装置以及票据数据输入方法 |
CN102663124A (zh) * | 2012-04-20 | 2012-09-12 | 上海合合信息科技发展有限公司 | 移动设备上的联系人信息的管理方法及系统 |
CN103020619A (zh) * | 2012-12-05 | 2013-04-03 | 上海合合信息科技发展有限公司 | 一种自动切分电子化笔记本中手写条目的方法 |
JP2014236262A (ja) * | 2013-05-31 | 2014-12-15 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置、画像形成システム、及び画像形成方法 |
CN104809099A (zh) * | 2014-01-24 | 2015-07-29 | 京瓷办公信息系统株式会社 | 文档文件生成装置及文档文件生成方法 |
Non-Patent Citations (4)
Title |
---|
Improving offline handwritten text recognition with hybrid HMM/ANN models;Salvador等;《IEEE Transactions on Pattern Analysis & Machine Intelligence》;20100819;第33卷(第4期);767-779 * |
一种基于纹理特征的笔迹鉴别方法;赵志艳等;《微计算机信息》;20140708;第26卷(第2期);205-207 * |
基于联合两种特征的手写体维文字符识别;姜文等;《计算机工程与应用》;20160325;第53卷(第5期);192-196 * |
基于边缘方向特征的离线笔迹鉴别;王东利;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20131215(第12期);I138-1079 * |
Also Published As
Publication number | Publication date |
---|---|
US10607071B2 (en) | 2020-03-31 |
JP2018195898A (ja) | 2018-12-06 |
CN108875570A (zh) | 2018-11-23 |
US20180330155A1 (en) | 2018-11-15 |
JP6729486B2 (ja) | 2020-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5699623B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、および、プログラム | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
CN108132762B (zh) | 图像处理装置以及图像形成装置 | |
US20060285748A1 (en) | Document processing device | |
JP4574313B2 (ja) | 画像処理装置および方法 | |
US20200104586A1 (en) | Method and system for manual editing of character recognition results | |
US20200202155A1 (en) | Method for image processing, and image-processing system | |
CN108875570B (zh) | 信息处理装置、存储介质和信息处理方法 | |
US11410442B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2021114192A (ja) | 情報処理装置及びプログラム | |
JP2010211470A (ja) | 文書データ生成装置と文書データ生成方法 | |
JP2020086850A (ja) | 情報処理装置、情報処理方法およびプログラム、並びに、画像形成システム | |
US11170253B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2006270589A (ja) | 情報処理装置、情報処理方法、プログラムおよび記録媒体 | |
JP4952079B2 (ja) | 画像処理装置、方法及びプログラム | |
US20150112719A1 (en) | Information processing apparatus, information processing method, and computer readable medium | |
JP2009182530A (ja) | 業務処理遂行支援装置 | |
JP4309881B2 (ja) | 身分証認識装置及び身分証認識方法 | |
JP2020135095A (ja) | 情報処理装置及びプログラム | |
JP7268764B1 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US20220309272A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
US11659106B2 (en) | Information processing apparatus, non-transitory computer readable medium, and character recognition system | |
US20230102476A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |