JP2856752B2 - 文字認識結果修正方法 - Google Patents
文字認識結果修正方法Info
- Publication number
- JP2856752B2 JP2856752B2 JP1013996A JP1399689A JP2856752B2 JP 2856752 B2 JP2856752 B2 JP 2856752B2 JP 1013996 A JP1013996 A JP 1013996A JP 1399689 A JP1399689 A JP 1399689A JP 2856752 B2 JP2856752 B2 JP 2856752B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- character
- character recognition
- printed
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は、認識誤りの修正を効率よく行なう文字認識
結果修正方法に関する。
結果修正方法に関する。
(従来の技術) 一般に文字認識装置においては、文字認識した結果に
は認識誤りがあるのが普通である。そのため、文字認識
処理が行われた後に、認識誤りや認識不能文字の修正を
行うことが必須となる。認識誤りの修正を行うために
は、認識結果の文字と入力された帳票内の該当する文字
を人間が目で見比べてチェックしなくてはならない。し
かし、認識結果の文字列を順番に印字出力した用紙と、
入力帳票を見比べて認識誤りをチェックするのでは、対
応する文字を見いだすのが困難な上に、チェックした後
で認識結果の文字列を修正する操作を別途おこなわなく
てはならないという不便さがある。
は認識誤りがあるのが普通である。そのため、文字認識
処理が行われた後に、認識誤りや認識不能文字の修正を
行うことが必須となる。認識誤りの修正を行うために
は、認識結果の文字と入力された帳票内の該当する文字
を人間が目で見比べてチェックしなくてはならない。し
かし、認識結果の文字列を順番に印字出力した用紙と、
入力帳票を見比べて認識誤りをチェックするのでは、対
応する文字を見いだすのが困難な上に、チェックした後
で認識結果の文字列を修正する操作を別途おこなわなく
てはならないという不便さがある。
そこで従来の文字認識装置においては、認識誤りの修
正を行うプログラムによって、認識結果の文字と入力さ
れた文字パターンを文字ごとに並べて表示装置上に表示
し、この表示画面に基づいて認識誤りの修正を行うこと
がなされてきた。この方法によって、認識結果と入力文
字の照合および修正を非常に効率よく行うことが可能に
なる。
正を行うプログラムによって、認識結果の文字と入力さ
れた文字パターンを文字ごとに並べて表示装置上に表示
し、この表示画面に基づいて認識誤りの修正を行うこと
がなされてきた。この方法によって、認識結果と入力文
字の照合および修正を非常に効率よく行うことが可能に
なる。
しかし、この方法では表示が文字単位に行われるの
で、カタカナの「カ」と漢字の「力」のような形状だけ
では区別のつきにくい文字や、崩れた手書き文字などの
ように、その文字の文字列内における前後関係によって
判定することが必要な場合には不便であった。この欠点
は文字認識装置が、従来の数字や記号やカタカナのみを
対象にする専用帳票向けから、一般の雑誌や書籍等を対
象とするものへと発展するにつれて、特に問題になって
きた。
で、カタカナの「カ」と漢字の「力」のような形状だけ
では区別のつきにくい文字や、崩れた手書き文字などの
ように、その文字の文字列内における前後関係によって
判定することが必要な場合には不便であった。この欠点
は文字認識装置が、従来の数字や記号やカタカナのみを
対象にする専用帳票向けから、一般の雑誌や書籍等を対
象とするものへと発展するにつれて、特に問題になって
きた。
そこで、文字単位に表示するのではなく、前後関係が
明らかになるように複数の文字を同時に表示する方法が
用いられるようになってきている。表示する単位として
は、行単位、対象文字の前後数文字、構文解析を行った
結果の文節単位等が考えられる。この方法によれば、文
字列の前後関係も含めた照合が容易にできる。
明らかになるように複数の文字を同時に表示する方法が
用いられるようになってきている。表示する単位として
は、行単位、対象文字の前後数文字、構文解析を行った
結果の文節単位等が考えられる。この方法によれば、文
字列の前後関係も含めた照合が容易にできる。
ところが、一般文書を読み取る文字認識装置が更に融
通性のあるものになるに連れて、新たな問題が生じてき
た。すなわち、日本語文書には縦方向に印字されたもの
と横方向に印字されたもの、あるいは両者の混在したも
のが存在するが、文字認識装置の融通性の向上によっ
て、横方向に印字された文書のみならず、縦方向に印字
された文書も読み取ることが可能になって来ている。と
ころが、その際、従来の横書き文書のみを対象としてい
る照合・修正プログラムをそのまま用いて縦書き文書の
照合・修正を行うと、入力帳票の原画像の表示が横に長
いことを想定しているので、非常に見にくく照合の行い
にくい表示画面になる。
通性のあるものになるに連れて、新たな問題が生じてき
た。すなわち、日本語文書には縦方向に印字されたもの
と横方向に印字されたもの、あるいは両者の混在したも
のが存在するが、文字認識装置の融通性の向上によっ
て、横方向に印字された文書のみならず、縦方向に印字
された文書も読み取ることが可能になって来ている。と
ころが、その際、従来の横書き文書のみを対象としてい
る照合・修正プログラムをそのまま用いて縦書き文書の
照合・修正を行うと、入力帳票の原画像の表示が横に長
いことを想定しているので、非常に見にくく照合の行い
にくい表示画面になる。
(発明が解決しようとする課題) この様に従来の文字認識装置では、入力帳票が横書き
の場合と縦書きの場合の両方に対しては、認識結果の修
正を簡易に行なう事が困難であった。
の場合と縦書きの場合の両方に対しては、認識結果の修
正を簡易に行なう事が困難であった。
本発明は、入力帳票の文字列が縦方向に印字された文
書の場合にも、認識結果と入力帳票の画像との照合を容
易にし、簡単で確実に認識結果の修正を可能にすること
を目的としている。これによって、入力する帳票が横書
きで印字されている場合でも、縦書きで印字されている
場合でも、帳票のOCR入力が容易にできるようにするも
のである。
書の場合にも、認識結果と入力帳票の画像との照合を容
易にし、簡単で確実に認識結果の修正を可能にすること
を目的としている。これによって、入力する帳票が横書
きで印字されている場合でも、縦書きで印字されている
場合でも、帳票のOCR入力が容易にできるようにするも
のである。
(課題を解決するための手段) 本発明は、横書き用と縦書き用の2種類の修正画面を
用意しておき、横書きの場合には入力帳票の現在修正し
ている部分の画像を表示画面の上部または下部に位置す
る横に長い領域に表示して、縦書きの場合には表示画面
の左または右に位置する縦に長い領域に表示するもので
ある。
用意しておき、横書きの場合には入力帳票の現在修正し
ている部分の画像を表示画面の上部または下部に位置す
る横に長い領域に表示して、縦書きの場合には表示画面
の左または右に位置する縦に長い領域に表示するもので
ある。
(作用) 本発明によれば、入力行が横に印字されている場合に
も、縦に印字されている場合にも、帳票の現在修正中の
部分の画像が見やすい位置に表示されるので、その画像
と文字認識結果とを容易に見比べることができ、効率よ
く文字認識結果を照合し、修正することができる。
も、縦に印字されている場合にも、帳票の現在修正中の
部分の画像が見やすい位置に表示されるので、その画像
と文字認識結果とを容易に見比べることができ、効率よ
く文字認識結果を照合し、修正することができる。
(実施例) 以下では図面を参照しながら本発明の一実施例につい
て述べる。
て述べる。
第1図は、本発明の実施例装置の概略構成図である。
本装置では、読み取るべき文書をスキャナ1で入力し、
その画像データを画像メモリ2に保存する。行検出部3
は、画像メモリ2に保存された画像データに対して画像
処理を行うことにより、画像から文字行を切り出す。そ
の際に同時にその行が横方向に印字された行であるか、
縦方向に印字された行であるかを判定する。切り出され
た行は、次段の文字検出部4で文字に分解される。文字
認識部5は切り出された文字の各々を文字認識する。文
字認識した結果は行の位置情報と共に認識結果ファイル
6に保存される。
本装置では、読み取るべき文書をスキャナ1で入力し、
その画像データを画像メモリ2に保存する。行検出部3
は、画像メモリ2に保存された画像データに対して画像
処理を行うことにより、画像から文字行を切り出す。そ
の際に同時にその行が横方向に印字された行であるか、
縦方向に印字された行であるかを判定する。切り出され
た行は、次段の文字検出部4で文字に分解される。文字
認識部5は切り出された文字の各々を文字認識する。文
字認識した結果は行の位置情報と共に認識結果ファイル
6に保存される。
以上の処理が終了すると、照合・修正プログラム7を
起動する。照合・修正プログラム7は各行ごとに、画像
メモリ2から画像データを、認識結果ファイル6から認
識結果の文字列を取り出して表示装置8に表示する。
起動する。照合・修正プログラム7は各行ごとに、画像
メモリ2から画像データを、認識結果ファイル6から認
識結果の文字列を取り出して表示装置8に表示する。
行が横方向に印字されている場合の表示画面の構成を
第2図に示す。この画面は3つのウィンドウから構成さ
れるマルチ・ウィンドウで表示されている。最左端のウ
ィンドウには文書全体のレイアウトが示されている。画
面を構成する各々の行の位置は横長の枠の形で表示され
ており、現在、修正中の行は反転表示されている。右上
のウィンドウにはその行の認識結果の文字列が表示され
ており、右下のウィンドウにはその行の画像イメージが
表示されている。ユーザは文字認識結果と画像イメージ
を照合して、文字認識誤りを見いだし、キイボードの操
作によって文字認識結果の修正を行うことができる。こ
の操作を文書に含まれる全ての行に対して行うことによ
り、文字認識結果の照合・修正を行うことができ、その
結果、正しいコード・データが得られる。
第2図に示す。この画面は3つのウィンドウから構成さ
れるマルチ・ウィンドウで表示されている。最左端のウ
ィンドウには文書全体のレイアウトが示されている。画
面を構成する各々の行の位置は横長の枠の形で表示され
ており、現在、修正中の行は反転表示されている。右上
のウィンドウにはその行の認識結果の文字列が表示され
ており、右下のウィンドウにはその行の画像イメージが
表示されている。ユーザは文字認識結果と画像イメージ
を照合して、文字認識誤りを見いだし、キイボードの操
作によって文字認識結果の修正を行うことができる。こ
の操作を文書に含まれる全ての行に対して行うことによ
り、文字認識結果の照合・修正を行うことができ、その
結果、正しいコード・データが得られる。
ところが、文書が縦方向に印字されている場合には、
同一の表示画面では、文字行を正しい方向に表示できな
い。そこで、行検出部が、行が縦方向に並んでいること
を示す場合には、自動的に第3図のような表示画面に切
り替えられる。この画面も3つのウィンドウから構成さ
れたマルチ・ウィンドウとなっている。左のウィンドウ
は、第2図と同様に文書全体のレイアウトを示してい
る。中央のウィンドウは、現在、修正中の行の文字認識
結果の文字列を表示しており、右のウィンドウは、その
行の画像イメージを表示している。この画面を用いれ
ば、縦方向に印字された文書に対しても容易に文字認識
結果の照合・修正ができる。
同一の表示画面では、文字行を正しい方向に表示できな
い。そこで、行検出部が、行が縦方向に並んでいること
を示す場合には、自動的に第3図のような表示画面に切
り替えられる。この画面も3つのウィンドウから構成さ
れたマルチ・ウィンドウとなっている。左のウィンドウ
は、第2図と同様に文書全体のレイアウトを示してい
る。中央のウィンドウは、現在、修正中の行の文字認識
結果の文字列を表示しており、右のウィンドウは、その
行の画像イメージを表示している。この画面を用いれ
ば、縦方向に印字された文書に対しても容易に文字認識
結果の照合・修正ができる。
次に第4図と第5図に本発明の第2の実施例を示す。
第4図は、入力文書が縦方向に印字されている場合であ
る。本実施例の場合には、読み取り結果の出力は文書の
印字方向に関わらず横方向になされている。更に、文書
の該当場所の原画像の表示は行単位ではなく、その文字
の周辺の一定領域となっている。この原画像は表示画面
の右側に位置する矩形に表示されている。第5図は、入
力文書が横方向に印字されている場合である。原画像は
表示画面の下側に表示されている。
第4図は、入力文書が縦方向に印字されている場合であ
る。本実施例の場合には、読み取り結果の出力は文書の
印字方向に関わらず横方向になされている。更に、文書
の該当場所の原画像の表示は行単位ではなく、その文字
の周辺の一定領域となっている。この原画像は表示画面
の右側に位置する矩形に表示されている。第5図は、入
力文書が横方向に印字されている場合である。原画像は
表示画面の下側に表示されている。
以上のように本発明によれば、文字認識装置の読み取
り対象となる文書の行が縦方向に印字されている場合に
も、横方向に印字されている場合にも、印字されたその
ままの方向に、行の画像と認識結果の文字列を並べて表
示することができるので、両者の照合が容易に行え、簡
単に照合することができる。そのため、様々な文書の文
字認識結果から、完全な文字コード・データを効率よく
作成でき、結局、文字認識システム全体としてのスルー
プットを格段に向上できる。
り対象となる文書の行が縦方向に印字されている場合に
も、横方向に印字されている場合にも、印字されたその
ままの方向に、行の画像と認識結果の文字列を並べて表
示することができるので、両者の照合が容易に行え、簡
単に照合することができる。そのため、様々な文書の文
字認識結果から、完全な文字コード・データを効率よく
作成でき、結局、文字認識システム全体としてのスルー
プットを格段に向上できる。
第1図はこの発明の一実施例に係る文字認識装置のブロ
ック図、第2図は第1の実施例における文書の行が横方
向に印字されている場合の照合・修正プログラムの表示
画面図、第3図は第1の実施例における文書の行が縦方
向に印字されている場合の照合・修正プログラムの表示
画面図、第4図は第2の実施例における文書の行が横方
向に印字されている場合の照合・修正プログラムの表示
画面図、第5図は第2の実施例における文書の行が縦方
向に印字されている場合の照合・修正プログラムの表示
画面図である。 1……スキャナ、2……画像メモリ、3……行検出部、
4……文字検出部、5……文字認識部、6……認識結果
ファイル、7……照合・修正プログラム、8……表示装
置。
ック図、第2図は第1の実施例における文書の行が横方
向に印字されている場合の照合・修正プログラムの表示
画面図、第3図は第1の実施例における文書の行が縦方
向に印字されている場合の照合・修正プログラムの表示
画面図、第4図は第2の実施例における文書の行が横方
向に印字されている場合の照合・修正プログラムの表示
画面図、第5図は第2の実施例における文書の行が縦方
向に印字されている場合の照合・修正プログラムの表示
画面図である。 1……スキャナ、2……画像メモリ、3……行検出部、
4……文字検出部、5……文字認識部、6……認識結果
ファイル、7……照合・修正プログラム、8……表示装
置。
Claims (1)
- 【請求項1】入力された帳票の文字認識結果の文字認識
誤りの修正を行う際に、文字認識結果と前記帳票の修正
すべき場所の原画像を表示する文字認識結果修正方法に
おいて、 前記帳票上の修正すべき場所が横書き形式の場合には、
認識結果を該原画像に対して上側あるいは下側に位置す
る場所に横方向に表示し、 前記帳票上の修正すべき場所が縦書き形式の場合には、
認識結果を該原画像に対して左側あるいは右側に位置す
る場所に横方向に表示することを特徴とする文字認識結
果修正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1013996A JP2856752B2 (ja) | 1989-01-25 | 1989-01-25 | 文字認識結果修正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1013996A JP2856752B2 (ja) | 1989-01-25 | 1989-01-25 | 文字認識結果修正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02195488A JPH02195488A (ja) | 1990-08-02 |
JP2856752B2 true JP2856752B2 (ja) | 1999-02-10 |
Family
ID=11848842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1013996A Expired - Lifetime JP2856752B2 (ja) | 1989-01-25 | 1989-01-25 | 文字認識結果修正方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2856752B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2979109B2 (ja) * | 1992-12-03 | 1999-11-15 | 日本アイ・ビー・エム 株式会社 | 認識文字の情報作成方法及び装置 |
JP2002063375A (ja) * | 2000-08-23 | 2002-02-28 | Sumitomo Life Insurance Co | 業務支援装置および方法 |
-
1989
- 1989-01-25 JP JP1013996A patent/JP2856752B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH02195488A (ja) | 1990-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2835178B2 (ja) | 文書読取装置 | |
US6958755B1 (en) | Personalized computer fonts | |
JP2856752B2 (ja) | 文字認識結果修正方法 | |
JPH064717A (ja) | 漢字住所補正処理方法 | |
JPH02255964A (ja) | 文書変更部分の自動識別装置 | |
JP3457376B2 (ja) | 光学式読み取り装置における文字修正方法 | |
JP2974346B2 (ja) | 漢字処理装置 | |
JPH01292586A (ja) | 文字認識支援装置 | |
JPH117493A (ja) | 文字認識処理装置 | |
JPH0388086A (ja) | 文書読取装置 | |
JPH09288714A (ja) | 表認識方法および装置 | |
JPS592189A (ja) | 文字認識装置 | |
JP2687902B2 (ja) | 文書画像認識装置 | |
JPH0512486A (ja) | 画像処理装置 | |
JP3463300B2 (ja) | マークシート並びにマークシートの方向検出方法及び装置 | |
JPH0696272A (ja) | 帳票フォーマット定義体作成装置 | |
JPH06266889A (ja) | 文書認識装置 | |
JP2002133367A (ja) | 文字認識装置 | |
JP2003085477A (ja) | 文字認識装置および文字認識結果の訂正方法 | |
JPH117492A (ja) | キー入力編集方法及び編集装置 | |
JP4081074B2 (ja) | 帳票処理装置、帳票処理方法、及び帳票処理プログラム | |
JP3064508B2 (ja) | 文書認識装置 | |
JP2001307020A (ja) | 文字認識装置 | |
JPH10143606A (ja) | 文字認識装置および文字認識方法 | |
JPH04293185A (ja) | ファイリング装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071127 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081127 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081127 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091127 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091127 Year of fee payment: 11 |