JPH0562008A

JPH0562008A - 文字認識方法

Info

Publication number: JPH0562008A
Application number: JP3222695A
Authority: JP
Inventors: Tomikado Shimizu; 富門清水; Masatoshi Hino; 匡利樋野; Takuya Okamoto; 卓哉岡本; Hiroyuki Kinukawa; 博之絹川
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1991-09-03
Filing date: 1991-09-03
Publication date: 1993-03-12

Abstract

(57)【要約】【目的】文書入力の過程で、文字区切りに誤りがあった
り、正解文字が認識候補文字の中に含まれていない場合
でも、インターラクティブに認識結果を修正できるよう
にする。また、認識結果の修正を効率的に行なえるよう
にする。【構成】文書イメージ読取装置５４から読取られた文書
イメージは、認識装置５１によって文字認識され、原イ
メージおよび認識結果がディスプレイ５２に表示され
る。ユーザーは一文字以上からなる修正範囲を入力装置
５３を通じて指定することができ、それに対してシステ
ムは、"英字再認識”、"文字区切り修正”、"別途文字
入力”等の様々な修正補助機能を提供する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】近年、形状判断による文字認識技
術が向上し、印刷文書・手書き文書の自動読取装置など
が開発され、用途によっては、キーボード入力よりも効
率の良い文書入力を実現している。しかしながら、これ
らの文字読取装置に共通して言えることは、認識率は除
々に向上して来ているものの、１００％の自動認識すな
わち誤りのない認識が不可能なことである。したがっ
て、どのシステムにおいても認識処理の途中でのユーザ
ーの介入、あるいは認識結果に対する後修正が、多かれ
少なかれ必要とされている。

【０００２】本発明は、認識処理の過程に於いて、ユー
ザーが認識結果を容易に確認・修正できるような環境を
提供することにより、全体としての文書入力の効率を向
上しようとする文字認識方法に関するものである。

【０００３】

【従来の技術】従来の文字認識方法に於いても、文字認
識の過程に於いて、原イメージと認識結果をユーザーに
提示し、文字認識の結果を利用して、ユーザーによる修
正を楽に行なわせようという試みはあった。例えば、認
識誤りの文字に対して、その別の認識候補を表示し、そ
の中から正解を選ばせるといった機能は多くの文字認識
方法で実現されている。また、公開特許２−１１０６５
６に示すように、単語レベルの言語的要素の認識も行
い、単語レベルの別解を表示し、正解を選択させること
により、認識結果を修正できるようにしたシステムもみ
られる。

【０００４】

【発明が解決しようとする課題】しかしながら、従来の
文字認識方法に於いては、自らの認識候補の中から正解
を選択させる機能が主であったこと、ユーザーが文字区
切りの誤りを修正するための簡便な方法がなかったこと
等から、文字区切りに誤りがあったり、認識候補文字の
中に正解がなかった場合などに、文字認識の過程でのイ
ンターラクティブな修正が著しく煩雑あるいは不可能と
なることが多かった。また、ある部位は例えば英字の列
であることがユーザーの目には明らかであるのに、そこ
を漢字やひらがなや英字の混在列として認識してしま
い、修正に必要以上の手間が掛かるといったことも多か
った。

【０００５】本発明の目的は、上文字区切りの仕方に誤
りがあった場合や、認識候補文字の中に正解がない場合
でも、文字認識の過程でのインターラクティブな修正を
可能にし、また、文字列に対するさまざまな方式の一括
修正機能を設けることにより、認識結果の修正を効率的
に行なえるようにした文字認識方法を提供する。

【０００６】

【課題を解決するための手段】上記の目的を達成するた
めに、本発明では、ユーザが指定した修正が必要な部位
の指定を、認識された文字列の上で行なうか、認識を行
う前の原イメージの上で行なうことを特徴とし、それに
より、ユーザーは、修正が必要な箇所を一文字一文字指
定できるだけではなく、ある範囲の文字列の認識結果を
修正する必要があると指定することができる。

【０００７】また、本発明では、文字区切りを間違えた
場合には、認識された文字列の上では、修正が必要な範
囲を指定するのが困難となる場合があるので、修正が必
要な範囲の指定は、認識された文字列の上でも、原イメ
ージの上でも行なえるようにし、修正方式としても、"
文字区切り修正”、"英字再認識”、"漢字再認識”、"
ひらがな再認識”、"カタカナ再認識”、"別途文字入
力”、"他文字候補選択"、"他単語選択”等のさまざま
な方式が用意されているので、ユーザーはシステムの認
識間違いの状況を把握しながら、最も効率的と思われる
修正方法で認識結果を修正することができる。

【０００８】また、本発明では、指定された部位の文字
区切りを区切り記号等で直接指定する機能と、指定され
た部位の文字並びをかな漢字変換などの別の入力手段を
用いて直接指定する機能が設けられているので、文字区
切りを間違った場合や正解の文字が認識候補の中にない
場合でも、正しい認識結果を文字認識の過程でインター
ラクティブに得ることができる。

【０００９】

【作用】本発明による認識結果の修正方法を用いること
により、文字認識の段階で文字区切りに誤った場合や、
正解文字が認識候補の中に入っていなかった場合でも、
インターラクティブに正しい認識結果を得ることができ
る。また、一つ以上の文字からなる部位を英字の列、漢
字の列、ひらがなの列、カタカナの列等として再認識し
たり、その部位の単語としての認識候補を出力し、選択
させる機能を設けることにより、一文字一文字の修正機
能しかない場合より効率的に認識結果を修正することが
できる。

【００１０】

【実施例】以下、本発明の一実施例を図面により詳細に
説明する。

【００１１】図１は、本発明の一実施例における文書読
取の手順を示すためのフローチャートである。図２は、
この実施例における機器の構成と、おのおのの機器の受
け持つ機能の概略を説明するための説明図である。以
下、図１に従い、本発明を用いた場合の文書読取の手順
を詳細に説明する。

【００１２】図１において、実線の長方形の中に書かれ
た処理は、システムを構成する機器が行なう処理を表わ
し、破線の長方形の中に書かれた処理は、ユーザーが主
体的に行なう処理を表わす。また、破線の台形に囲まれ
た処理は、ユーザーの判断およびその判断に基づいた選
択処理を表わす。また、実線の２重の長方形に囲まれた
処理は、システムが表示する修正メニューに対して、ユ
ーザーがある修正項目を選択した場合に行なわれる認識
結果の修正処理であり、中にはシステムが単独で行なう
処理もあるが、多くはシステムとユーザーがインターラ
クティブに行なう処理であり、複雑な過程を内部に含
む。実線の２重の長方形に囲まれた処理については、後
により詳細に説明する。

【００１３】ユーザーが本システムを立ちあげると、図
２に示すディスプレイ５２に図３に示すような原イメー
ジ表示ウィンドウ１００と認識結果表示ウィンドウ１１
０が表示される。但し、まだぺージ読込処理、文字認識
処理を行なっていないので、どちらのウィンドウもその
表示部は空白である。ユーザーが読み込むべき文書の読
み込むべきページを図２に示す文書イメージ読取装置５
４にセットし、図３に示す新ぺージ読込ボタン１０２を
マウスカーソルでピックすると、そのぺージのイメージ
データが図２に示す原イメージバッファ６１に読込まれ
るとともに、その原イメージが図４に示すように原イメ
ージ表示ウィンドウ１００に表示される。この原イメー
ジ表示ウィンドウ１００は、図３に示す原イメージ表示
ウィンドウスクロールボタン１０４のしかるべき位置を
マウスカーソルでピックすることにより上下左右にスク
ロールできるようになっているので、原イメージが広い
場合でも、ユーザーは必要な箇所を参照することができ
る。

【００１４】入力すべきページの原イメージが原イメー
ジ表示ウィンドウ１００に表示されたあと、ユーザーは
システムに対して、読取範囲の指定を行なう。読取範囲
の指定の手順を図５に示す。ユーザーが原イメージ表示
ウィンドウの一点（Ａ）でマウスカーソルをピックする
とそこに図５に示すようなバツ印が表示される。続いて
別の一点（Ｂ）でマウスカーソルをピックすると指定し
た二つの点を対点とした長方形が原イメージ表示ウィン
ドウに表示される。この長方形のことを認識領域指示矩
形と呼ぶ。図６に示す認識領域指示矩形１２０はこのよ
うにして指定されたものである。認識領域指示矩形１２
０が誤って文字を横切ってしまった時などは、実行キー
等の認識を開始させるキーを押す前であれば、エスケー
プキーを押すことにより、認識領域を指定するために行
なったすべての操作を打消し、画面に表示された認識領
域指示矩形１２０やバツ印も消去することができる。認
識領域指示矩形が表示されたあと、実行キーあるいは"
１"キーあるいは"３"キーを押すとその内部が文字認識
される。実行キーおよび"１"キーはその認識領域を横書
きの領域として認識せよという指示を表わす。"３"キー
はその内部を縦書きの領域として認識せよという指示を
表わす。文字認識が終わると、図６に示すように、文字
行および文字区切りに関する認識結果は原イメージ表示
ウィンドウに表示され、文字並びに関する認識結果は認
識結果表示ウィンドウに表示される。図６は、横書きの
領域を認識した場合の認識結果の表示の様子を示すが、
縦書きの領域を文字認識した場合、ラインを示すための
矩形（図６の１３１にあたる）は縦に細長くなり、文字
の区切りであると判断した箇所を示すための縦の実線
（図６の１３２にあたる）あるいは文字の区切りである
可能性はあるがそこでは文字は切れていないと判断した
箇所を示すための縦の点線（図６の１３３にあたる）は
横になる。縦書きの領域を認識した場合でも文字並びに
関する認識結果は、認識結果表示ウィンドウに横書きで
表示される。認識結果表示ウィンドウも図３に示す認識
結果表示ウィンドウスクロールボタン１１１のしかるべ
き位置をマウスカーソルでピックすることにより上下左
右にスクロールできるようになっているので、認識結果
が広い場合でもユーザーは必要な箇所を参照することが
できる。横書きの場合でも縦書きの場合でも処理・操作
は殆んど同じなので以下の説明では認識領域が横書きの
場合だけを説明する。

【００１５】文字認識は以下のように行う。まず、横方
向のパスを多くの位置で走査することにより、文字行の
認識を行う。文字行の認識を行ったあと、各文字行につ
いて、その中での黒画素の並びから、その文字行の左端
および右端、および文字区切りとなる可能性のある部位
の認識を行う。次にその領域の中で文字矩形となりそう
な部位をすべて認識し、各文字矩形に対して図２に示す
文字形状辞書５６を参照し、その候補文字と距離値を求
める。距離値は、候補文字と原イメージの上の文字との
形態的特徴の差違を表わす量であり、距離値が小さいほ
ど似ていることを表わす。ここまでの認識結果を原認識
結果とよび、図２に示す文字認識結果バッファ６２の原
認識結果格納領域に格納される。原認識結果の構造を図
７に示す。次に原認識結果と図２に示す単語辞書５７等
を参照し、隣り会う文字矩形の列に対してその文字列と
しての解釈の可能性を求める。この認識結果のことを文
字列認識結果と呼び、図２に示す文字認識結果バッファ
６２の文字列認識結果格納領域に格納される。文字列認
識結果の構造を図８に示す。文字列としては、単語のほ
かに英字の列、記号等が認識される。また、特殊な文字
列としてある文字矩形を通る単語や英字の列、記号等が
一つも認識されなかった場合にはその文字矩形とその第
一の候補文字が一つの文字列として認識される。おのお
のの文字列に対しては、その文法的な性質を表わす文法
情報と、その確からしさを表わす数値である確信度が求
められ記載される。文法情報は文字列の種類を大雑把に
分類して、コード化したものである。確信度はその文字
列を構成する各文字の原認識結果における距離値、文字
数、前後の文字列との接続のし易さ等から計算される数
値である。確信度は大きいほど、その文字列が確からし
いことを表わす。最後に文字列認識結果をもとにして、
テキスト認識結果を求める。テキスト認識結果は、図９
に示すように、文字列の番号の列であり、システムの最
終的なその文字領域に対する認識結果を表わす。テキス
ト認識結果は、図２に示す文字認識結果バッファ６２の
テキスト認識結果格納領域に格納される。

【００１６】文字認識結果の表示は、以下のように行わ
れる。まず、文字行に関する認識結果は、実際には図１
０の点線に示すように文字に接する矩形であるが、表示
する場合には、図１０の実線に示すように文字から離れ
た矩形として表示する。この方が後で述べる文字区切り
の表示法とうまく整合する。文字区切りに関する認識結
果は、実際には図１１(ａ)に示すように幅のある線であ
るが、幅のある線を原イメージに表示すると、原イメー
ジがみにくくなるので、文字区切りは、図１１(ｂ)に示
すように、線で表示する。文字区切りを示す記号の位置
は、図１１(ｃ)に示すように実際の文字区切りの中間に
位置させる。文字区切りとなる可能性のある部位で、実
際に文字が切れているとは限らないが、本システムで
は、現在のテキスト認識結果において、文字の区切りで
あると判断している文字区切りには文字区切り記号（縦
の実線）を表示し、現在のテキスト認識結果において、
文字の区切りではないと判断している文字区切りには仮
の文字区切り記号（縦の点線）を表示するようにしてい
る。文字並びに関する認識結果は、第６図に示したよう
に、認識結果表示ウィンドウに表示される。原イメージ
で改行があった所で、認識結果としての文字列も改行す
るので、原イメージと認識結果としての文字列の対応を
みとることは容易である。

【００１７】システムの第一段の文字認識とその表示が
終わると、ユーザーは認識結果を確認する。認識結果に
誤りがある場合には、図１２に示すようにユーザーは修
正が必要な部位を原イメージ表示ウィンドウ、あるいは
認識結果表示ウィンドウの上で指定する。指定の方式と
しては、原イメージ表示ウィンドウの上で指定する場合
には、一端の基本矩形をマウスカーソルでピックし、続
いてもう一端の基本矩形をマウスカーソルでピックする
とその両端の基本矩形ではさまれた領域が修正範囲とな
る。基本矩形とは、文字行の中に表示されている最小の
矩形のことで、その左端及び右端は文字区切り記号ある
いは仮の文字区切り記号、あるいは文字行を表わす矩形
の縦の線であり、その上端及び下端は文字行を表わす矩
形の上端及び下端の一部である。認識結果表示ウィンド
ウの上で指定する場合には、一端の文字をマウスカーソ
ルでピックし、続いてもう一端の文字をマウスカーソル
でピックするとその両端の文字ではさまれた領域が修正
範囲となる。認識結果の上で修正範囲を指定するとき
は、結局、現在のテキスト認識結果において実際に文字
の切れ目であると判断されている二つの部位にはさまれ
た範囲としてしか修正範囲を指定できないことになる
が、原イメージの上で修正範囲を指定するときは、文字
の切れ目となる可能性のある二つの部位ではさまれた範
囲として修正範囲を指定できるので、原イメージの上で
修正範囲を指定するときのほうが細かに修正範囲を指定
することができる。修正範囲が指定されると図２に示す
ディスプレイ５２の上に修正メニューが表示される。図
１３にその例を示す。図１３に示す場合には、"英字再
認識”が適当だと思われるので、それをマウスでピック
するとその部位の英字再認識が行なわれ文字認識結果バ
ッファの内容が更新されるとともに新しい認識結果が原
イメージ表示ウィンドウと認識結果表示ウィンドウに表
示される。図１３の修正メニューでは"別途文字入
力"、"他文字候補選択”、"他単語選択”の各機能が網
掛けされており、選択不可能になっているが、修正部位
の左端が現在のテキスト認識結果において文字の切れ目
と認識されていないため別途文字入力等を行っても、入
力された文字列と現在認識している文字矩形とを一対一
に対応させられないためである。修正部位の左端と右端
とが現在のテキスト認識結果において文字の切れ目であ
ると判断されている場合には、すべての修正メニューが
選択可能になる。このようにして、ユーザーは認識結果
に誤りがなくなるまで、修正作業を続ける。

【００１８】ユーザーが認識結果に関して修正を行なう
必要がなくなったと判断した場合には、原イメージ表示
ウィンドウの上の"認識結果処理”ボタンをピックする
と画面上に図１４に示すような認識結果処理方法指定ウ
ィンドウが表示される。ユーザーが図１４に示すファイ
ル名入力領域１４３にファイル名を入力し、ファイル出
力ボタン１４１をマウスカーソルでピックすると認識結
果が指定されたファイルの末尾に出力され、画面は原イ
メージだけを表示している状態に戻る。破棄ボタン１４
２をマウスカーソルでピックすると現在の認識領域に関
する認識結果は破棄され、画面も原イメージだけを表示
している状態に戻る。この破棄ボタン１４２は、例えば
ある認識領域の読み取りを始めたが急に別の仕事ができ
て文書読み取りの仕事を続けられなくなったときなどに
用いる。

【００１９】以下、各々の修正メニューに関して詳細に
説明する。図１５に、文字区切り修正を行なう場合の様
子を示す。修正範囲として図１３で示した修正範囲が指
定され、修正メニューとして"文字区切り修正”が選択
されると、図１５に示したような文字区切り修正画面が
出力される。文字区切り修正画面の大きさは、修正範囲
の大きさに応じて可変である。文字区切りである可能性
のある箇所には、図１５に示したようにあらかじめ縦の
実線または点線が挿入されている。実線は、現在のテキ
スト認識結果においてそこが文字の切れ目であると判定
されていることを表わす。点線は、現在のテキスト認識
結果においてそこが文字の切れ目であるとは判定されて
いないことを表わす。ユーザーが点線の十分そばでピッ
クすると、その点線は実線に変わる。ユーザーが実線の
十分そばでピックすると、その実線は点線に変わる。こ
のようにして、ユーザーは個々の文字区切りの箇所で、
実際に文字が切れているかどうかを、容易に指定するこ
とができる。また、上記の操作によって、新しい文字区
切りが新たに導入されることはなく、各々の文字区切り
の箇所で、実際に文字が切れているかどうかが指定され
るだけである。ユーザーが文字区切り修正画面の右上す
みの終了ボタンをピックすると、文字区切り修正のため
の操作が終了する。ユーザーの操作が終了すると、シス
テムは文字区切りに関して指定された結果を、確定文字
区切りリストに登録する。但し以前に同じ内容が登録さ
れていた場合には登録はしない。また、以前に登録され
ていた内容と矛盾する場合には、以前の登録内容を修正
する。これは、ユーザーが文字区切り修正等において、
文字の切れ目に関して間違えた内容を登録してしまった
場合、後で修正できるようにするためである。確定文字
区切りリストも、原認識結果や文字列認識結果と同様
に、図２に示す文字認識結果バッファ６２の中に格納さ
れる。次にシステムは、修正範囲外の文字区切りについ
ては、そこで文字が切れるかどうかについて、以前のテ
キスト認識結果と一致するように予測する。修正範囲内
の文字区切りについては文字区切り修正で指定されたよ
うに予測する。上記の予測により、今まで認識されてい
なかった文字矩形が認識された場合、原認識結果にその
文字矩形を加え、その文字矩形を通るような文字列を、
文字列認識結果に加える。次に、文字の切れ目の予測に
よって予測される文字矩形のうち、修正範囲と交わらな
いものについては、それが以前のテキスト認識結果にお
いても文字矩形であると認識されていた場合、その認識
結果となるべき文字は以前のテキスト認識結果と同じで
あると予測する。最後に、文字列認識結果、テキスト認
識結果を上記の予測と合うように修正し、新しいテキス
ト認識結果を原イメージ表示ウィンドウ及び認識結果表
示ウィンドウに表示する。このようにすることにより、
文字区切り修正を行なうことにより、修正範囲以外で認
識結果が変化することを最小に抑えることができる。文
字列認識結果、テキスト認識結果の修正は以下のように
行なう。まず、以前のテキスト認識結果を構成する文字
列のうち、文字の切れ目に関する予測、認識結果となる
文字に関する予測と矛盾しないものは、新しいテキスト
認識結果を構成する文字列として採用する。次に、上記
の操作によって説明されなかった文字矩形に対して、文
字列認識結果のうち、文字の切れ目に関する予測、認識
結果となるべき文字に関する予測に反しないもので、そ
れらの文字矩形だけを通るものを探し、テキスト認識結
果を構成する文字列に順に加えていく。最後に、それで
も、説明されない文字矩形が残ったらその候補文字のう
ち、認識結果になる文字に関する予測に反しないものを
文字列として文字列認識結果に加えるとともに、テキス
ト認識結果を構成する文字列に加える。

【００２０】修正範囲を指定したあと、修正メニューと
して、"英字再認識”、"漢字再認識”、"ひらがな再認
識”、"カタカナ再認識”などが指定された場合、シス
テムは次のような処理を行う。まず、修正範囲の左端と
右端とについて、それが文字区切りであれば、そこで、
文字が切れるとして、確定文字区切りリストに登録す
る。但し、すでに、そのように登録されている場合に
は、上述の操作は必要とされない。また、それと矛盾す
る内容が登録されている場合には、その内容を修正す
る。次に修正範囲内の各文字区切りについて、例えば修
正範囲が英字の列であるとか、ひらがなの列であるとか
の指定に従い、そこで文字が切れるかどうかを前もって
予測する。ただし、その文字区切りがすでに、確定文字
区切りリストに記載されている場合には、予測はその記
述に従う。また、修正範囲外の文字区切りについては、
そこで文字が切れるかどうかを以前のテキスト認識結果
と一致するように予測する。上記の予測により、今まで
認識されていなかった文字矩形が認識された場合、原認
識結果に新しい文字矩形を加え、その文字矩形を通るよ
うな文字列を、文字列認識結果に加える。次に、文字の
切れ目の予測によって予測される文字矩形のうち、修正
範囲と交わらないものについては、それが以前のテキス
ト認識結果においても文字矩形であると認識されていた
場合、その認識結果となるべき文字は以前のテキスト認
識結果と同じであると予測する。また、文字の切れ目の
予測によって予測される文字矩形のうち、修正範囲に含
まれるものについては、その認識結果となる文字は指定
された文字種であると予測する。最後に上述の予測に矛
盾しないように、文字列認識結果、テキスト認識結果を
修正し、新しいテキスト認識結果を原イメージ表示ウィ
ンドウ及び認識結果表示ウィンドウに表示する。文字列
認識結果、テキスト認識結果の修正の仕方は、文字区切
りの修正の場合とほぼ同様である。

【００２１】"別途文字入力”、"他文字候補選択”、"
他単語選択”の三つの修正メニューは、文字区切りに関
する認識結果を修正することをしない。従って、指定さ
れた修正範囲の左端あるいは右端が現在のテキスト認識
結果において文字の切れ目と判断されていない場合に
は、これらの修正メニューは網掛けされ選択できないよ
うになっている。

【００２２】"別途文字入力”が選択された場合、ディ
スプレイ上には、図１６に示したような別途文字入力画
面が出力される。別途文字入力画面の大きさは、修正範
囲の大きさによって異なる。ユーザーは、別途文字入力
画面においてカナ漢字変換の手段を用いて、正解の文字
列を入力し、入力が終わったら、別途文字入力画面の上
の方にある終了キーをマウスでピックする。この場合、
別途文字入力された文字列の文字数と、現在のテキスト
認識結果において修正範囲に認識されている文字矩形の
数とが一致していない場合、例え終了キーがマウスでピ
ックされても、エラーメッセージが出力されるだけで、
認識結果の修正は起こらない。こうすることにより、処
理システムは、入力された文字列と内部で認識している
文字矩形とを一対一に対応させることができる。正当な
文字数の文字列が入力されると、システムは認識領域の
中での文字の切れ目は、以前のテキスト認識結果と同様
で、修正範囲外の文字矩形に関してはその認識結果とな
る文字は以前のテキスト認識結果と同様で、修正範囲内
の文字矩形については、その認識結果となる文字は指定
された文字であると予測し、その予測に合うように文字
列認識結果、テキスト認識結果を修正し、新しいテキス
ト認識結果を原イメージ表示ウィンドウ及び認識結果表
示ウィンドウに表示する。文字列認識結果、テキスト認
識結果の修正の仕方は文字区切り修正の場合とほぼ同様
である。

【００２３】"他文字候補選択”が選択された場合、図
１７に示すようにディスプレイ上に他文字候補選択画面
が出力され、修正範囲の各文字矩形について、原認識結
果における上位の候補文字が出力される。但し、各文字
矩形に対して一番目に表示される文字は、現在のテキス
ト認識結果において認識結果となっている文字とする。
図では各文字矩形に対してそれぞれ１０文字づつしか候
補文字が表示されていないが、スクロールすることによ
り、より多くの候補文字を表示することができる。正解
文字は、マウスでピックすることにより、選択すること
ができる。選択された文字の背景色は他の文字の背景色
と変えているので、どの文字が選択されているかは明瞭
である。各文字に対して正解文字を選択したあと、マウ
スで画面右上隅の終了キーをピックすると、ユーザーに
よる他文字候補選択のための操作は終了する。システム
は、認識領域の中での文字の切れ目は、以前のテキスト
認識結果と同様で、修正範囲外の文字矩形に関してはそ
の認識結果となる文字は以前のテキスト認識結果と同様
で、修正範囲内の文字矩形については、その認識結果と
なる文字は選択された文字であると予測し、その予測に
合うように文字列認識結果、テキスト認識結果を修正
し、新しいテキスト認識結果を原イメージ表示ウィンド
ウ及び認識結果表示ウィンドウに表示する。文字列認識
結果、テキスト認識結果の修正の仕方は文字区切り修正
の場合とほぼ同様である。

【００２４】"他単語選択”が選択された場合、図１８
に示すようにディスプレイ上に他単語選択画面が出力さ
れ、文字列認識結果に登録されている文字列のうち、修
正範囲を現在認識している文字区切りで区切った場合の
文字矩形の列と一致するものが、単語候補として出力さ
れる。出力される単語候補の数は場合によって異なる。
単語候補の上でマウスカーソルをピックすると、その単
語が選択される。また、単語候補以外の個所でマウスカ
ーソルをピックすると単語選択が取消される。ユーザー
が画面の右上すみにある終了ボタンをマウスでピックす
ると、他単語選択のための操作は終了する。このとき
に、単語が選択されていなければ、システムの認識結果
は以前のままである。単語が選択されていた場合、シス
テムは、認識領域の中での文字の切れ目は、以前のテキ
スト認識結果と同様で、修正範囲外の文字矩形に関して
はその認識結果となる文字は以前のテキスト認識結果と
同様で、テキスト認識結果は選択された単語を含むと予
測し、その予測に合うように文字列認識結果、テキスト
認識結果を修正し、新しいテキスト認識結果を原イメー
ジ表示ウィンドウ及び認識結果表示ウィンドウに表示す
る。文字列認識結果、テキスト認識結果の修正の仕方は
文字区切り修正の場合とほぼ同様である。

【００２５】以上が本実施例における処理の概略であ
る。説明の中では、言及しなかったが、図２−６３に示
す内部ポインターは、画面上に表示されているマウスカ
ーソルの位置を格納するための領域である。また、図２
に示す内部変数６４は、マウスのピックにより指定され
た位置や入力された文字列等を格納するための領域であ
り、用途により数種類用意されている。本システムにお
けるユーザーの指示は、システムの立ち上げと、別途文
字入力における文字入力操作を除いて、マウスの移動、
マウスのピック、実行キー、”１”キー、”３”キーの
押下等の簡単な操作でなされる。また、システムの処理
を補助する動作として、読み込むべきページを文書イメ
ージ読取装置にセットする操作が必要とされる。

【００２６】

【発明の効果】本発明による方法を用いれば、文字認識
装置による文書の入力の過程に於いて、文字区切りに誤
りがあったり、認識候補文字の中に正解がなかった場合
でも、文字認識の過程においてインターラクティブに認
識結果を修正することができる。また、"英字再認
識”、"漢字再認識”、"ひらがな再認識”、"カタカナ
再認識”、"別途文字入力”、"他単語選択”など与えら
れた範囲の認識結果を一括して修正する機能も設けられ
ているので効率的に認識結果を修正することができる。

【図面の簡単な説明】

【図１】本発明の一実施例における文書読取りの操作手
順・処理手順を説明するためのフローチャートである

【図２】実施例における機器の構成と役割を説明するた
めのブロック図である

【図３】実施例における基本画面の様子を説明するため
の説明図である

【図４】原イメージの表示の様子を説明するための説明
図である

【図５】認識領域を指定する方法を説明するための説明
図である

【図６】認識結果の表示の様子を説明するための説明図
である

【図７】原認識結果の構造を説明するための説明図であ
る

【図８】文字列認識結果の構造を説明するための説明図
である

【図９】テキスト認識結果の構造を説明するための説明
図である

【図１０】文字行に関する認識結果の表示の仕方を説明
するための説明図である

【図１１】文字区切りに関する認識結果の表示の仕方を
説明するための説明図である

【図１２】修正必要箇所を指定する方法を説明するため
の説明図である

【図１３】修正必要箇所が指定された場合出力される修
正メニューの様子を説明するための説明図である

【図１４】認識結果処理方法指定ウィンドウの様子を説
明するための説明図である

【図１５】"文字区切り修正”における操作を説明する
ための説明図である

【図１６】"別途文字入力"における操作を説明するため
の説明図である

【図１７】"他文字候補選択"における操作を説明するた
めの説明図である

【図１８】"他単語選択"における操作を説明するための
説明図である

【符号の説明】

１…文字区切り修正処理、２…英字再認識処理、３…漢
字再認識処理、４…ひらがな再認識処理、５…カタカナ
再認識処理、６…別途文字入力処理、７…他文字候補選
択処理、８…他単語選択処理、５１…処理装置、５２…
ディスプレイ、５３…入力装置、５４…文書イメージ読
取装置、５５…認識結果出力ファイル、５６…文字形状
辞書、５７…単語辞書、６１…原イメージバッファ、６
２…文字認識結果バッファ、６３…内部ポインター、６
４…内部変数、１００…原イメージ表示ウィンドウ、１
０１…認識結果の処理を行わせるためのボタン、１０２
…新しいページの読み取りを行なわせるためのボタン、
１０３…文書読取を終了させるためのボタン、１０４…
原イメージ表示ウィンドウをスクロールさせるためのボ
タン、１１０…認識結果表示ウィンドウ、１１１…認識
結果表示ウィンドウをスクロールさせるためのボタン、
１２０…認識領域指示矩形、１３１…文字行を表示する
ための矩形、１３２…文字の切れ目と認識されている文
字区切りを表示するための実線の縦線、１３３…文字の
切れ目と認識されていない文字区切りを表示するための
点線の縦線、１４１…認識結果をファイルに出力するよ
うに指示するためのボタン、１４２…認識結果を破棄す
るように指示するためのボタン、１４３…認識結果を出
力するファイル名を入力するための領域。

フロントページの続き (72)発明者絹川博之神奈川県川崎市麻生区王禅寺1099番地株式会社日立製作所システム開発研究所内

Claims

【特許請求の範囲】

【請求項１】印刷された文字あるいは手書きの文字を認
識し、該認識結果をユーザーに提示し、その修正を行な
わせる文字認識方法において、ユーザーが指定した修正
が必要な部位に対して、さまざまな修正を施す場合、修
正が必要な部位の指定を、認識された文字列の上で行な
うか、認識を行なう前の原イメージの上で行なうことを
特徴とする文字認識方法。
【請求項２】印刷された文字あるいは手書きの文字等を
認識し、該認識結果をユーザーに提示し、その修正を行
なわせる文字認識方法において、ユーザーが修正が必要
な部位を指定したことを契機として、"文字区切り修
正”、"英字再認識”、"漢字再認識”、"ひらがな再認
識”、"カタカナ再認識”、"別途文字入力”、"他文字
候補選択"、"他単語選択”の少くともいずれか１つの修
正メニューを表示し、ユーザーに選択させることを特徴
とする文字認識方法。
【請求項３】請求項２記載の文字認識方法において、ユ
ーザーが修正が必要であると指定した部位が、その時点
での認識状態から見てどのようなものであるかに従い、
修正メニューを変化させることを特徴とする文字認識方
法。
【請求項４】印刷された文字あるいは手書きの文字等を
認識し、該認識結果をユーザーに提示し、その修正を行
なわせる文字認識方法において、文字区切りに関する認
識結果を画面上に表示する場合、実際に文字区切りであ
ると判断した箇所に、なんらかの区切り記号を表示する
だけではなく、文字区切りである可能性があるが、文字
区切りではないと判断した箇所にも文字区切り記号とは
若干形状の異なる仮りの文字区切り記号を表示すること
を特徴とする文字認識方法。
【請求項５】印刷された文字あるいは手書きの文字等を
認識し、該認識結果をユーザーに提示し、その修正を行
なわせる機能を有する文字認識装置において、ユーザー
がある部位の文字区切りが誤っていると指定した場合、
その部位の原イメージを画面上に表示し、ユーザーにそ
の部位の区切り方を原イメージの上で記号で指定させる
ことを可能とした文字認識方法。
【請求項６】請求項５記載の文字認識方法において、文
字区切りが誤っている部位の原イメージの上で、ユーザ
ーが文字区切りを記号で指定する場合、記号の挿入だけ
でなく削除も可能とした文字認識方法。
【請求項７】請求項５記載の文字認識方法において、文
字区切りが誤っていると指定された部位に関して、シス
テムが種々の状況から判断して文字区切りであると判断
した箇所には文字区切り記号を原イメージの上に挿入し
ておき、システムが種々の状況から判断して文字区切り
となる可能性はあるが文字区切りではないと判断した個
所には文字区切り記号とは若干形状の異なる仮の文字区
切り記号を原イメージの上に挿入しておき、個々の文字
区切り記号と仮の文字区切り記号とは簡単な操作で互い
に他に変えられるようにすることを特徴とする文字認識
方法。
【請求項８】印刷された文字あるいは手書きの文字等を
認識し、該認識結果をユーザーに提示し、その修正を行
なわせる文字認識方法において、ユーザーがある部位
を"英字"、"漢字”、"ひらがな”、"カタカナ”のいず
れかの字種で再認識するように要求した場合、今までの
文字区切りを場合によっては修正し、その部位を指定さ
れた字種で再認識することを特徴とした文字認識方法。
【請求項９】印刷された文字あるいは手書きの文字等を
認識し、該認識結果をユーザーに提示し、その修正を行
なわせる文字認識方法において、ユーザーがある部位
を、別の手段で入力することを指定した場合、その部位
のその時点での認識結果に基づき、特定の字数の文字列
しか受け付けないことにより、常にイメージとその認識
結果としての文字との対応を保持することを特徴とした
文字認識方法。