JP4977232B2 - 文字読取結果確認装置および文字読取結果確認方法 - Google Patents
文字読取結果確認装置および文字読取結果確認方法 Download PDFInfo
- Publication number
- JP4977232B2 JP4977232B2 JP2010110400A JP2010110400A JP4977232B2 JP 4977232 B2 JP4977232 B2 JP 4977232B2 JP 2010110400 A JP2010110400 A JP 2010110400A JP 2010110400 A JP2010110400 A JP 2010110400A JP 4977232 B2 JP4977232 B2 JP 4977232B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- group
- confirmation
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19013—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V30/1902—Shifting or otherwise transforming the patterns to accommodate for positional errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
(第1の実施形態)
図1は第1の実施形態の文字認識システムの構成を示す図である。
また、確認用画像34として、これらの画像を複数用いるようにしてもよい。
また、図4の右側の「同じ位置の画素いずれかが黒の画像」42は、同グループ内のいずれかの画像で画素の色が黒色である画素を全て特定の画素値:色(図では黒色など)にした場合の第2画像である。
また、前述したとおり確認用画像34はAND画像41とOR画像42を1枚の画像に重ね合わせて表現したものであるため、これを用いる場合でも同様に行うことができる。
この動作をグループX内の全ての文字画像に対して行い(S109)、処理を終了する。
以下、図8、図9を参照して第2の実施形態を説明する。図8は第2の実施形態の文字認識システムの構成を示す図である。なおこの第2の実施形態において第1の実施形態と同様な構成には同一の符号を付しその説明は省略する。
以下、図14を参照して第3の実施形態を説明する。図14は第3の実施形態の文字認識システムの構成を示す図である。なおこの第3の実施形態において第1の実施形態と同様な構成には同一の符号を付しその説明は省略する。
Claims (8)
- 文字が記入または印刷された帳票を光学的に読み取って得られた帳票画像から、一文字単位に切り出した文字画像に対して文字認識を行った結果、同じ文字として分類されたグループの複数の文字画像を取得する取得部と、
前記取得部により取得された同じグループの前記複数の文字画像を重ね合わせて、前記複数の文字画像の中で、前記全ての文字画像で同じ画素値を示す第1部位と、前記他の文字画像と異なる画素値を示す第2部位とをオペレータが目視で判別可能な確認用画像を生成する確認用画像生成部と
を具備することを特徴とする文字読取結果確認装置。 - 前記確認用画像生成部は、
グループ内の全ての文字画像で文字の一部である部分と、グループ内の少なくとも1枚の文字画像で文字の一部であり、少なくとも1枚の文字画像で文字の一部でない部分と、グループ内の全ての文字画像で文字の一部でない部分とで表示が異なるように前記確認用画像を生成することを特徴とする請求項1に記載の文字読取結果確認装置。 - 前記確認用画像生成部は、
グループ内の全ての文字画像で文字の一部である部分が所定の画素値である第1画像と、グループ内の少なくとも1枚の文字画像で文字の一部である部分が所定の画素値である第2画像とを確認用画像として生成することを特徴とする請求項1記載の文字読取結果確認装置。 - 前記確認用画像生成部は、
前記グループ内の文字画像に対してクラスタリングを行い、予め設定したグループ分けのパラメータを超える文字画像を新たなグループとして分類し、クラスタリング前のグループを細分することを特徴とする請求項1乃至3いずれか1記載の文字読取結果確認装置。 - 前記確認用画像の確認結果として誤認識された文字画像が含まれるグループとして入力されたキーを受け付け、前記グループを前記確認用画像生成部に入力する受付部と、
前記確認用画像生成部は、
前記受付部から入力された誤認識のグループの文字画像に対して確認画像を生成する際に、前記グループ分けのパラメータを変更した上で確認用画像を生成することを特徴とする請求項4記載の文字読取結果確認装置。 - 各部分を色分けして表示する際に、出現頻度に応じて確認用画像の色を部位毎に変えることを特徴とする請求項2記載の文字読取結果確認装置。
- 前記確認用画像生成部により生成された確認用画像を文字認識し、前記確認用画像が元のグループとして認識できなかった場合、前記グループに誤認識した文字画像が含まれているものと判定する文字認識部を具備することを特徴とする請求項1記載の文字読取結果確認装置。
- 文字が記入または印刷された帳票を光学的に読み取って得られた帳票画像から、一文字単位に切り出した文字画像に対して文字認識を行った結果、同じ文字として分類されたグループの複数の文字画像を取得するステップと、
取得した同じグループの前記複数の文字画像を重ね合わせて、前記複数の文字画像の中で、前記全ての文字画像で同じ画素値を示す第1部位と、前記他の文字画像と異なる画素値を示す第2部位とをオペレータが目視で判別可能な確認用画像を生成するステップと
を有することを特徴とする文字読取結果確認方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010110400A JP4977232B2 (ja) | 2010-05-12 | 2010-05-12 | 文字読取結果確認装置および文字読取結果確認方法 |
US12/961,204 US8411957B2 (en) | 2010-05-12 | 2010-12-06 | Character recognition result verification apparatus and character recognition result verification method |
CN2010105883845A CN102243707B (zh) | 2010-05-12 | 2010-12-10 | 字符识别结果验证设备和字符识别结果验证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010110400A JP4977232B2 (ja) | 2010-05-12 | 2010-05-12 | 文字読取結果確認装置および文字読取結果確認方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011238119A JP2011238119A (ja) | 2011-11-24 |
JP4977232B2 true JP4977232B2 (ja) | 2012-07-18 |
Family
ID=44911801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010110400A Active JP4977232B2 (ja) | 2010-05-12 | 2010-05-12 | 文字読取結果確認装置および文字読取結果確認方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8411957B2 (ja) |
JP (1) | JP4977232B2 (ja) |
CN (1) | CN102243707B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8731296B2 (en) * | 2011-04-21 | 2014-05-20 | Seiko Epson Corporation | Contact text detection in scanned images |
JP6119952B2 (ja) * | 2012-05-15 | 2017-04-26 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
CN107784219B (zh) * | 2016-08-25 | 2019-04-30 | 腾讯科技(深圳)有限公司 | 一种字符验证码实现方法、装置及终端 |
CN109961063B (zh) * | 2017-12-26 | 2021-12-14 | 杭州海康机器人技术有限公司 | 文本检测方法及装置、计算机设备和存储介质 |
CN108268841A (zh) * | 2018-01-10 | 2018-07-10 | 佛山市顺德区中山大学研究院 | 一种轧钢板热喷字符串识别与验证系统及方法 |
CN110222753B (zh) * | 2019-05-28 | 2022-07-29 | 北京金山数字娱乐科技有限公司 | 字符识别验证方法、系统、计算机设备、存储介质和芯片 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3278899A (en) * | 1962-12-18 | 1966-10-11 | Ibm | Method and apparatus for solving problems, e.g., identifying specimens, using order of likeness matrices |
JPH0449289A (ja) | 1990-06-14 | 1992-02-18 | Sankyo Co Ltd | 新規化合物アピオジオネン |
JPH0612520A (ja) * | 1992-06-24 | 1994-01-21 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識装置の確認修正方式 |
JPH06119484A (ja) * | 1992-10-05 | 1994-04-28 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP4049289B2 (ja) | 1999-08-04 | 2008-02-20 | 株式会社リコー | 文字認識方法、文字認識装置及び記録媒体 |
JP4771804B2 (ja) | 2005-12-20 | 2011-09-14 | 富士通株式会社 | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 |
KR101015663B1 (ko) | 2008-06-24 | 2011-02-22 | 삼성전자주식회사 | 문자인식장치에서의 문자인식방법 및 그 장치 |
-
2010
- 2010-05-12 JP JP2010110400A patent/JP4977232B2/ja active Active
- 2010-12-06 US US12/961,204 patent/US8411957B2/en active Active
- 2010-12-10 CN CN2010105883845A patent/CN102243707B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102243707A (zh) | 2011-11-16 |
JP2011238119A (ja) | 2011-11-24 |
US20110280452A1 (en) | 2011-11-17 |
CN102243707B (zh) | 2013-06-26 |
US8411957B2 (en) | 2013-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4977232B2 (ja) | 文字読取結果確認装置および文字読取結果確認方法 | |
JP5240047B2 (ja) | キーワード識別方法及装置 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US11475655B2 (en) | Methods for optical character recognition (OCR) | |
JP4694613B2 (ja) | 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体 | |
US20200320325A1 (en) | Image processing system, image processing apparatus, image processing method, and storage medium | |
KR20170004983A (ko) | 라인 분할 방법 | |
US20210056336A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US8463054B2 (en) | Hierarchical OCR using decision tree and nonparametric classifier | |
JP2010055142A (ja) | 文書処理装置およびプログラム | |
JP2014127188A (ja) | 整形装置及び方法 | |
JP2020046819A (ja) | 情報処理装置及びプログラム | |
JP5538812B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN107403123B (zh) | 识别目标图像中的条码图像的图像分析设备 | |
JP2015138496A (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
JP2013171309A (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
JP4672692B2 (ja) | 単語認識システムおよび単語認識プログラム | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
US20190294662A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2006227824A (ja) | 図面認識方法および装置 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
US20210019554A1 (en) | Information processing device and information processing method | |
JP5657401B2 (ja) | 文書処理装置、及び文書処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120321 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120413 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4977232 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |