JP3083171B2 - 文字認識装置及び方法 - Google Patents

文字認識装置及び方法

Info

Publication number
JP3083171B2
JP3083171B2 JP03065786A JP6578691A JP3083171B2 JP 3083171 B2 JP3083171 B2 JP 3083171B2 JP 03065786 A JP03065786 A JP 03065786A JP 6578691 A JP6578691 A JP 6578691A JP 3083171 B2 JP3083171 B2 JP 3083171B2
Authority
JP
Japan
Prior art keywords
character
recognition
unit
character recognition
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03065786A
Other languages
English (en)
Other versions
JPH04302070A (ja
Inventor
悦雄 伊藤
公人 武田
浩一 長谷部
真家 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03065786A priority Critical patent/JP3083171B2/ja
Publication of JPH04302070A publication Critical patent/JPH04302070A/ja
Application granted granted Critical
Publication of JP3083171B2 publication Critical patent/JP3083171B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
[発明の目的]
【0001】
【産業上の利用分野】本発明は、文字認識装置に関わ
る。
【0002】
【従来の技術】近年の文書処理の電子化に伴い、紙に印
刷された文書を読み取り、電子メディア化する文字読み
取り装置が開発されている。従来の文字認識装置は、各
種文書が記載された原稿を読み取り部により読み取る。
この時、読み取り部は原稿を文字の集まりとして捕らえ
るのではなく、点の集まりからなる画像データとして読
み取る。そして、読み取った画像データから文字認識部
が任意の範囲を切り出し、認識用辞書に格納している標
準文字パターンとのパターン照合処理を行う。この結
果、文字認識部で照合ができれば、この文字は出力部へ
出力されると共に、記録部に記録される。これらの処理
を行うことにより装置内で原稿上の文字がコードに変換
される。しかし、これらの処理では、数字の‘0’とア
ルファベット‘O’、小文字の‘1(エル)’、と大文
字の‘I(アイ)’、数字の‘1’など類似した文字の
間に曖昧性が残る場合があり、この部分をオペレータに
教示する必要があった。
【0003】また、文字認識部に曖昧性が無いと判断し
ても、原稿の文字掠れなどにより読み取り誤りがある場
合がある。このため、後処理として、読み取った文字を
単語毎にまとめ、その単語が語彙辞書に存在するか否か
を判断し(これを以降未知語判定と呼ぶ)、存在しない
場合には読み取り誤りである可能性があることをオペレ
ータに指示する必要があった。読み取り誤りの場合と曖
昧性が残る場合を合わせて認識誤りと呼ぶ。
【0004】しかし、従来の文字認識装置では、認識誤
り箇所の候補をオペレータに指示しても、オペレータに
はそれが、文字認識により曖昧性があると判断されたも
のであるか、未知語判定によって未知語と判断されたも
のであるかの情報を得ることができず、認識結果の修正
作業にかかる負担が大きかった。また、語彙辞書が整備
されていないため正しく認識されている語句を指摘した
り、曖昧性があるため正しく認識されている語句を指摘
したりすることがあり、煩わしかった。
【0005】
【発明が解決しようとする課題】このように従来の文字
認識装置では、認識誤り箇所の候補をオペレータに指示
しても、それが文字認識の曖昧性によるものか、未知語
であることによるものかがオペレータにはわからないた
め、以降の修正作業の負担が大きいという問題があっ
た。また、正しく認識されている語であるにも拘らず、
語彙辞書の未整備や曖昧性の判断不良のために認識誤り
としてしまうことを防ぐことができないという問題があ
った。
【0006】本発明はかかる事情を考慮してなされたも
ので、その目的とするところは、認識誤り箇所の候補の
認識誤りの原因をオペレータに示し、修正作業の効率化
を図ることのできる文字認識装置を提供することにあ
る。 [発明の構成]
【0007】
【課題を解決するための手段】本発明にかかる文字認識
装置は、入力された文字の画像パターンと、予め記憶さ
れてなる認識辞書の文字パターンとを照合して、類似度
が所定値以上の文字パターンの文字を選択する文字認識
手段と、この文字認識手段により得られた文字からなる
文字列が、予め記憶されてなる語彙辞書の文字列の中に
存在するか否かを判定する判定手段と、前記文字認識手
段において前記類似度が所定値以上の文字パターンが複
数ある中から選択された文字を含む場合、前記文字が曖
昧であることを示す識別子を前記文字とともに記憶し、
前記判定手段において前記語彙辞書の文字列の中に存在
しないと判定された場合、前記文字列が未知語であるこ
とを示す識別子を前記文字列とともに記憶する記憶手段
と、この記憶手段に記憶された識別子をもとに、前記文
字列が文字認識の結果曖昧な文字を含むものであるの
か、語彙辞書の文字列の中に存在しないものであるかを
区別して表示する表示手段とを有することを特徴とする
ものである。また、本発明にかかる文字認識方法は、入
力された文字の画像パターンと、予め記憶されてなる認
識辞書の文字パターンとを照合して、類似度が所定値以
上の文字パターンの文字を選択し、この選択された文字
からなる文字列が、予め記憶されてなる語彙辞書の文字
列の中に存在するか否かを判定し、前記類似度が所定値
以上の文字パターンが複数ある中から選択された文字を
含む場合と、前記語彙辞書の文字列の中に存在しないと
判定された場合に、各々識別子を付与し、この識別子を
もとに、前記文字列が文字認識の結果曖昧な文字を含む
ものであるのか、語彙辞書の文字列の中に存在しないも
のであるかを区別して表示することを特徴とするもので
ある。
【0008】
【作用】本発明によれば、入力した文字を画像データか
ら文字データに変換する際に誤りがあった可能性のある
語句を修正必要候補語句として表示するのであるが、こ
の場合、認識用辞書を用いてパターン照合する際に近い
パターンが複数あったのか(A)、照合された結果が語
彙辞書中に存在しないと判定されたのか(B)を区別し
て表示あるいは記憶する。これによりオペレータは、表
示された状態を参照しながら修正等の後編集を行うこと
ができる。
【0009】
【実施例】以下、図面を参照しながら本発明の一実施例
について説明を行う。図1に、本発明の一実施例に係る
文字認識装置の構成を表すブロック図を示す。
【0010】図1において入力部1は本発明における文
字認識装置の動作に必要なコマンドを入力したり、認識
結果に対する修正文字を入力したりできるもので通常、
キーボードやマウス、タッチパネルなどが用いられる。
表示部2は、入力部1より入力されたコマンドや文字を
表示したり、後述する読み取り部3からの読み取り結果
や文字認識部4による文字認識の途中状態や認識結果、
修正必要候補語句指示部8による指示内容を表示したり
できるもので、通常ビットマップディスプレイなどが使
用される。なお、画面を2分割して、片方を読み取り部
が読み取った画像イメージを表示させ、他方に本装置が
認識した文字を対応させて表示することもできる。読み
取り部3は原稿を読み取るためのもので、例えばライン
イメージセンサを備えたスキャナが用いられる。なお、
このスキャナの解像度により読み取れる文字の種類が決
まる。文字認識部4は読み取り部3が原稿を読み取った
結果得られた画像データを文字として認識するものであ
る。読み取り部3が原稿を読み取るときは、文字単位で
読み取っているのではなく、原稿の一端から順次スキャ
ンしていき、各点に情報が有るか無いかの2値で表して
画像データを得る。このため解像度を上げるほど、より
細かく原稿を読み取ることになり、より複雑な文字も読
み取ることができる。文字認識部4に供される画像デー
タは、読み取り部3で読み取る以外にも、イメージファ
イル12を入力する等の方法で得ることができる。そし
て、文字認識部4は画像データの任意の範囲を対象にし
て認識用辞書5に予め記録している標準文字パターンと
のパターン照合処理を行う。このパターン照合処理を画
像データの全てに対して行い、類似度が所定値以上とな
った標準文字パターンがマッチしたとして、画像データ
に対応する文字であると認識する。未知語判定部6は、
前述の文字認識部4により認識された結果を単語単位で
語彙辞書7に記録されているか否かを判定するものであ
る。修正必要候補語句指示部8は、文字認識部4による
パターン照合により複数のパターンと読み込みパターン
がマッチした場合あるいは読み込みパターンがどのパタ
ーンともマッチしない読み取りエラーの場合などの曖昧
な文字や、未知語判定部6により未知語であると判定さ
れた語は、文字認識において誤って認識されている可能
性があるとの判断により、その文字や語をオペレータに
指示するためのものである。識別子表示部9は、修正必
要候補語句指示部8により指摘された語句が文字認識部
と未知語判定部のどちらの判断により指示されているか
を区別して表示するためのものである。記録部10は、読
み取り部3で読み取った画像データや、文字認識部4に
よる文字認識の途中結果や最終結果などを記録するもの
である。制御部11は前記各部の制御やデータの仲介を行
うものである。
【0011】図2は、本発明における文字認識装置の全
体の処理の流れを示すフローチャートである。原稿を文
字データとして電子化するためには、先ず、原稿を読み
取り部3により読み取る(S201 )。次に、読み取った
結果に対して文字認識部4において文字認識を行う(S
202 )。このとき、認識結果に曖昧性が残る語句が有る
場合はそれらをAとする。例えば曖昧性を示すフラグS
P−Fを立ててその語句とともに記録部10に記憶する。
つぎに、文字認識が終わったデータに対して未知語判定
部6において未知語判定を行う(S203 )。文字認識の
際に類似度が所定値以上となるパターンが複数出てきた
とき、最も類似度の高いものについてのみ未知語判定す
るとしてもよいし、出てきたもの全てについて未知語判
定してもよい。このとき、未知語となった語句が有る場
合はそれ等をBとする。例えば未知語であることを示す
フラグundef−Fを立ててその語句とともに記録部
10に記憶する。以上で認識が終わり修正が必要であるか
もしれない箇所が判定できたため、オペレータによる確
認・修正を行うためにこのデータを表示部2により表示
する(S204 )。そして、オペレータの指示に従い、修
正必要候補語句の指摘とその語句に対する識別子の表示
を行う(S205 )。このとき、最も類似度の高い第一候
補とその識別子を表示するが、第二候補以下がある場合
には次候補キー等によりこれらも識別子とともに表示す
るようにしてもよい。オペレータはこの指示・表示を参
照しながら入力部1より文書データの修正を行い(S20
6 )、最終的な結果を得る。なお、文字認識の際に類似
度が所定値以上となるパターンが全くなかったときに
は、未知語判定及び文字データの表示はできないため、
曖昧性の識別子のみ表示してもよいし、別に「読み取り
エラー」と表示してもよい。
【0012】図2の処理をさらに詳細に説明すると、い
くつかのバリエーションがあり、その例を図3〜図5に
示す。図3は、修正必要候補語句の指摘(修正必要候補
語句指示部8による)とその語句に対する識別子の表示
(識別子表示部9による)を行うステップの動作の説明
の為のフローチャートである。修正必要候補語句の指摘
とその語句に対する識別子の表示を行う場合は、まず、
処理を行う文書の最初の語句を取出し(S301,S302
)それをDとする。Dが文字認識の結果曖昧性がある
文字を含んでいるか否か(Dが記録部10にある語句群A
の中に存在するか否か)を判断し(S303)、含まれて
いればDは修正必要候補語句であるため、表示部2にそ
の旨の指示を行う(S304 )。また、同時にこの指示が
文字認識の結果曖昧性がある文字を含んでいる為である
ことを示す識別子を表示する(S305 )。ステップ303
において、曖昧性のある文字が含まれていないと判断さ
れた場合には、次にDが未知語であるか否か(Dが記録
部10にある語句群Bの中に存在するか否か)の判断を行
う (S306 )。未知語である場合には、Dは修正必要
候補語句であるため、表示部2にその旨の指示を行う
(S307 )。また、同時にこの指示がDが未知語である
為であることを示す識別子を表示する(S308 )。オペ
レータは、Dが修正必要候補語句であるとして識別子と
ともに表示部2に表示されると、これを見て修正が必要
ならば、適宜修正を行う(図2S206 )。この様に、D
に対する修正必要候補語句の指摘とその語句に対する識
別子の表示を行った後、オペレータに次の修正必要候補
語句の指摘を行うかの問い合わせを行い(S309 )、指
摘を行う場合には次の候補が発見されるかあるいはデー
タのおわりまでこれらの手順を繰り返す。図3の処理に
おいては、曖昧性のある語に対しては、未知語かどうか
は問わず、オペレータの確認・修正のみにより最終結果
を得るようになっている。
【0013】図4のフローチャートに示す処理は、曖昧
性のある語に対しても、未知語であるか否かの判断を行
う点が図3の処理とは異なる。図3と同様、処理を行う
文書の語句を順番に取り出してDとする。Dが文字認識
の結果曖昧性がある(語句群Aに含まれる)と判断され
れば(S403 yes)、Dを修正必要候補語句として、
曖昧性によることを示す識別子とともに表示する(S40
4 ,S405 )。こうして表示されたDに対してオペレー
タが確認・修正を行い(S406 )、このDが未知語であ
るか否かの判断(S407 )にかける。Dが曖昧性がない
と判断された場合(S403 no)も、未知語か否かの判
断(S407 )を行い、未知語(語句群Bに含まれる)と
判断されれば(S408 yes)、Dを修正必要候補語句
として、未知語であることによることを示す識別子とと
もに表示する(S408 ,S409 )。こうして表示された
Dに対してオペレータが確認・修正を行う(S410 )。
【0014】図4の処理においては、曖昧性のために修
正必要候補語句とされたものが実際に認識誤りであった
場合には、オペレータが修正してから未知語かどうかの
検査をする。そこで、オペレータが修正した語に限って
は、S407 の時点で、修正結果D´を未知語判定部6 に
かけて、正しい語句D´が未知語であるかどうかを改め
て判定してもよい。こうすることにより、未知語判定さ
れた語には曖昧性が含まれていないことになるので、純
粋に未知語である語だけがS408 ,S409 にて表示され
る。よって、S410 の時点で、オペレータが、表示され
た未知語を語彙辞書7に登録する旨の指示を出すように
すれば、語彙辞書の充実が図れ、以降語彙辞書の不備の
ために正しい語が修正必要候補とされることがなくな
る。
【0015】図5のフローチャートに示す処理は、修正
必要候補語句である旨の指摘を行う条件を、オペレータ
が設定できるようにしたものである。図3と同様、処理
を行う文書の語句を順番に取り出してDとする。Dが語
句群A,Bの両方に含まれる(曖昧性があり未知語でも
ある)場合(S503 )、Dが語句群Aに含まれBには含
まれない(曖昧性があっても未知語ではない)場合(S
504 )、Dが語句群Bに含まれAには含まれない(曖昧
性はないが未知語である)場合(S505 )、Dが語句群
AにもBにも含まれない(曖昧性はなく未知語でもな
い)場合(S506)に分けて処理を行う。S503は、認識
誤りである可能性が高い。S504 ,S505 は、正しく認
識しているにも拘らずそれぞれ、曖昧性の判断が間違っ
たこと、語彙辞書に十分な数の語句が登録されていない
ことが原因で修正必要候補と判断してしまう可能性のあ
るものなので、オペレータがこれらを修正必要候補とし
て表示するか否かの設定をし、表示する設定がなされて
いるときのみ(S510 ,S512 )表示する(S511 ,S
513 )。この表示をオペレータが見て、適宜修正を行
い、(図2S206 )、未知語を語彙辞書に登録する必要
があれば登録する。曖昧性があって未知語でもあるS50
3 の場合には、これを修正必要候補語句として表示する
際に、その識別子を曖昧性として表示するか(S507
)、未知語として表示するか(S508 )の優先順位を
オペレータが設定しておくことができる。上述したよう
な、修正必要候補語句として表示する論理条件の設定
や、識別子の優先順位の設定を、曖昧性のある語句の出
現割合によって変更するとしてもよい。
【0016】以上のような処理を行う場合の表示部2の
様子の例を図7(a)に示す。認識結果のデータ中修正
必要候補語句が反転して表示され、この語句Dに対応す
る識別子が、例えば、曖昧性があるときには「曖昧性
+」、ないときには「曖昧性−」(あるいは何も表示し
ない)、未知語であるときには「未知語+」、そうでな
いときには「未知語−」(あるいは何も表示しない)と
いうように表示される。
【0017】図5の処理においては曖昧性、未知語の両
方のフラグが同時に表示されるが、図3の処理において
は「曖昧性+」と表示された語句に対しては未知語のフ
ラグは表示されない。また、図4の処理においては「曖
昧性+」と表示された語句に対してユーザが確認・修正
を行った後に未知語のフラグが表示される。
【0018】なお、上記の実施例では、まず、文字認識
の曖昧性の検査を行い、次に未知語の検査を行っている
が、この順序は逆でもよい。また、上記の実施例では、
予め文字認識と未知語判定を別々に前もって行っていた
が、これを同時に行ってもよいし、さらに結果の表示に
併せて行ってもよい。例えば、図4においてS403 のと
ころで取り出した語Dを文字認識し、その曖昧性を判断
し、曖昧性があれば表示して(S404 ,S405 )修正し
(S406 )、その後S407 でこのDが語彙辞書にない未
知語であるかを調べ、未知語であれば表示・修正を行
い、この一連の処理の後次の語をDとして取り出すとい
う具合に、様々に変形できる。
【0019】ここで、上述した文字認識装置を翻訳装置
に用いた場合の構成例を図6に示す。読み取り部603 で
は、第1言語(例えば英語)で書かれた文書をイメージ
情報として読み取り、文字認識部604 では、このイメー
ジ情報のパターンを認識用辞書605 の標準文字パターン
と照合して、文字コードとして認識する。未知語判定部
606 では、この文字コードを並べて作られる語句が語彙
辞書607 中に存在するかどうかで未知語判定を行う。認
識され未知語判定されたデータは翻訳部612 に送られ、
翻訳用辞書613 を用いて第2言語(例えば日本語)の文
章に変換される。語彙辞書607 は、翻訳用辞書613 にあ
る第1言語のデータを圧縮して高速に検索できるように
作成したものである。よって、未知語を補充する際に
は、語彙辞書のみでなく翻訳用辞書にも未知語及びこれ
に対応する訳語を登録する。
【0020】記憶部610 は、読み取り部603 のイメージ
情報、文字認識部604 の認識結果や途中経過、未知語判
定部606 の判定結果、翻訳部612 の翻訳結果等を記憶す
る。修正必要候補語句指示部608 は、入力部(例えばキ
ーボード)601 からの指示に基づき、記憶部610 に記憶
されたデータをもとに、上述の文字認識装置で説明した
ように修正必要候補語句の指摘を、表示部602 と識別子
表示部609 に対して行う。入力部601 は、オペレータ
が、指摘された修正必要候補語句の修正や、その他各部
への指示を行うためのものである。
【0021】本翻訳装置においては、文字認識部604 、
未知語判定部606 の処理を施したデータを翻訳にかける
前に、ユーザが表示部602の表示を見ながら入力部601
を介して修正を行い、文字認識装置における認識誤りを
なくした状態のデータを翻訳部612 に送る(a)手動モ
ードと、人手を介さずに読み取りから翻訳までを通して
行ってしまい、翻訳部612 の処理の終了したデータを表
示部602 に表示して、ユーザに修正させる(b)自動モ
ードとがある。
【0022】表示部602 における修正必要候補語句の指
摘の例を図7に示す。図7(a)は手動モードの場合
(図1の文字認識装置の表示部2における表示と同じに
なる)、図7(b)は自動モードの場合である。いずれ
の場合にも、修正必要候補語句は順番に、例えば反転表
示されて示され、反転表示された語句に対応する識別子
は、同じ画面上のどこかに、曖昧性、未知語の少なくと
も一方のフラグが+となる形で示される。この表示方法
は、他にも例えば、反転表示の色を変えて識別子とする
等の方法でも良い。(b)自動モードの場合は、文字認
識されたデータとその翻訳結果との両方が画面を区切っ
て表示される。図7(a)では、文字認識された原稿中
のclaimsなる語について、パターン照合の際他に
も近い文字があったことを曖昧性+で示し、claim
sが辞書にある語であることを未知語−で示している。
図7(b)では、文字認識された原稿(原文)中のva
riuusなる語(もとの原稿ではvariousであ
った)について、曖昧性があり未知語であることを示し
ている。訳文中では未知語variuusに対応する部
分が、例えば空白の反転表示等で示される。
【0023】(a)手動モードの場合は、認識誤りのな
いデータが翻訳されるので、翻訳結果を修正する後編集
が簡単になるという効果がある。また、翻訳の前に、未
知語という識別子と共に出た語句の辞書への登録ができ
るので、翻訳の効率も良くなる。しかも、認識結果の段
階で修正する作業も、上述の文字認識装置で説明したよ
うに効率化される。(b)自動モードの場合は、従来
は、翻訳できない原因が、(1)翻訳元のデータに読み
取り誤りがあった。(2)辞書に登録されていない未知
語であった、(3)(1)でも(2)でもないが文脈理
解等ができなかった、のように様々であるにも拘らず、
ある語が翻訳できなかったときにオペレータがその原因
を区別することができなかった。本翻訳装置では、この
問題点を解消し、図7(b)を例にすると、曖昧性の識
別子+ならば原因(1)、未知語の識別子+ならば原因
(2)、どちらでもないのに翻訳できていないならば原
因(3)、というように、翻訳できなかった原因をオペ
レータが容易に推測することができるという効果があ
る。
【0024】ところで、従来の文字認識装置は、文字認
識の専用システムとして独立した形態で提供されてい
る。このため、文字認識され例えば装置のディスク等に
記憶された文字コードを、例えば、翻訳する場合におい
てはフロッピーディスケット等に保存後、翻訳システム
に登録するようなことが行なわれている。このため、オ
ペレータは、文字認識された文書のファイル名、フロッ
ピーディスケット等の保存方法、コード体系等の知識を
習得する必要があり、この操作は繁雑でオペレータに多
大な労力を強いる欠点があった。
【0025】又、文字認識した文字コード列が誤ってい
るのかのチェックは、文字認識装置があらかじめ備えて
いるスペルチェック用の辞書(上記の実施例では語彙辞
書7,607 )を用いて行なわれているが、次に希望する
処理を行うシステム、例えば、機械翻訳システムが利用
する辞書に認識された文字コード列があるかないか等の
判断をすることができないという問題点があった。
【0026】そこで、認識された文字コード列に対して
次に行いたい処理方法を指示するだけで次の処理システ
ムに文字コード列を渡すことができるようにする制御手
段を文字認識装置側に設けることで、オペレータの労力
を軽減できる文字認識システムを第2の実施例として説
明する。
【0027】図8は、第2の実施例に係る文字認識シス
テムの概略構成を示すブロック図である。図8におい
て、81は入力部で、この入力部81の入力データは、文字
認識制御部83に送られる。入力部81は、文字の入力を始
め、文字認識システムを制御するための各種コマンドの
入力を可能にしたもので、キーボード、マウス等が使用
される。例えば、イメージ入力部82において原稿の入力
を開始する指示は、表示部89に表示される“イメージ読
取り”ボタンをマウスで選択することで行う。
【0028】文字認識制御部83は、システム全体を制御
するためのもので、ここでは、入力部81、イメージ入力
部82、イメージ記憶部84、文字認識部85、文字コード記
憶部86、文字コード編集部87、次処理制御部88、及び表
示部89を制御するようになっている。
【0029】イメージ入力部82は、印刷、又は手書きさ
れた原稿を1枚、又は複数枚セットされた状態から、紙
面のイメージを光学的に読み取る。読み取ったイメージ
は、文字認識制御部83へ送られ、圧縮等が施されてイメ
ージ記憶部84へ記憶される。複数の頁がセットされてい
る場合は、順に最後の頁まで読み取る。又、認識処理の
途中でオペレータの要求で再読み取りや頁の挿入等をす
る時にも、このイメージ入力部82を用いる。イメージ記
憶部84は、読み取ったイメージを頁単位に記憶する。文
字認識部85は、読み取ったイメージを文字認識する。文
字認識の技術については第1の実施例で説明した通りで
ある。文字コード記憶部86は、文字認識部85で認識され
た文字コードを記憶する。このとき、読み取った頁のイ
メージと対応付けして記憶する。
【0030】文字コード編集部87は、文字認識部85で認
識された文字コードを表示部89に表示し、ユーザの指示
により挿入、削除等の編集を行う。例えば、文字認識部
85で認識された文字の中で、曖昧な文字について検索す
ることができる。このとき、この曖昧性のある文字の近
辺には、イメージ記憶部84にある読み取ったイメージの
該当する部分を取り出して表示する等が行われる。文字
コード編集部87で編集が終了した文字コード列は、再
度、文字コード記憶部86へ記憶される。表示部89は、文
字読み取りイメージ等の情報を可視表示可能なもの、例
えばビットマップディスプレイ等が使用される。
【0031】次処理制御部88は、文字認識、編集の終っ
た文字コード列を他の処理システムに渡す前に、渡す先
の処理システムでこの文字コード列に施したい処理内容
を、ユーザの指示により選択する。例えば、文字コード
列を翻訳システムに渡す場合、翻訳システムの文書とし
て登録するだけでよいのか、登録するとともに翻訳をす
るのか、又は翻訳後、その翻訳結果を印刷までするのか
等の処理方法を選択する。又、翻訳の場合は、翻訳で利
用する辞書の名前、翻訳環境等の情報を設定することが
できる。
【0032】次にこのように構成した本システムの動作
を説明する。まず、図9は、本文字認識システムにおけ
る処理の流れを簡単に説明するための状態遷移図であ
る。図10〜19は、動作を説明するための画面例である。
図10は文字認識システムの初期画面である。オペレータ
は、まず、読み取る文書の文書識別面を入力する。その
後、“イメージ読み取り”ボタンをマウスで選択する
と、イメージ入力部82が動作を開始する(ステップ201
)。
【0033】イメージ入力部82が動作中は図11に示す読
み取りイメージが順に画面に表示される。複数の頁がイ
メージ入力部82にあるときは、頁のある限り読み取りを
繰り返し実行する(ステップ202 )。イメージ読み取り
が終了すると図10に戻る(ステップ203 )。
【0034】初期画面に戻った状態では、文書識別名を
変更して別の原稿のイメージ入力をすることもできる。
また、文書識別名を変更せずに続けて次の原稿の入力が
要求された場合は、既に読み取った原稿に追加するの
か、既に読み取った原稿をキャンセルして新たに入力す
るのかをオペレータに質問をする。
【0035】イメージ入力終了後、そのイメージの文字
認識を実行する場合は、“認識”ボタンをマウスで選択
する(ステップ204 )。本実施例の文字認識システムで
は、文字認識を開始する前に原稿のレイアウトを認識す
る。認識したレイアウトに誤りがないかオペレータに提
示する。図12にレイアウト認識の結果をオペレータに知
らせる画面例を示す。この画面において、誤って認識さ
れたブロックの順番は、“入れ替え”ボタンを使って変
更する。また、“全指定”ボタンで順に指定することも
できる。その他、文字認識をする範囲を指定することも
できる。また認識する必要のない部分は“削除”ボタン
で削除することもできる。例えば、機械翻訳する必要の
ない頁番号、ヘッダ、フッタ等を削除したり、認識する
範囲から外すことができる。
【0036】また、読み取ったイメージが鮮明でないと
きには、“再読み取り”ボタンを選択する(ステップ20
5 )。この操作でイメージ入力部82から読み取る状態
(濃淡、コントラスト、原稿位置等)を変更したイメー
ジを再入力することができる。また、イメージ入力の段
階で抜けてしまった頁は“頁挿入”ボタンを選択するこ
とで簡単に頁を挿入することができる。
【0037】図12で文字認識開始ボタンを選択すると認
識したレイアウトの順にしたがって、文字認識の実行を
開始する。認識中は図13の右側にどの位置を認識中かが
表示される(ステップ306 )。また、合わせて、認識し
た文字コードが画面の右側に順に表示される。文字認識
が終了すると、図14が表示される。このとき、読み取る
原稿の濃度の指定を誤ったり、原稿を傾いて置いたりす
ると、誤って認識される文字が多くなる。このときは、
“再読み取り”ボタンを選択することで再度、該当する
頁の原稿を読み直すことができる(ステップ207 )。
【0038】“次候補”ボタンを選択するとカーソル位
置から文字認識において曖昧性のある文字を検索する
(ステップ208 )。曖昧性のある文字が見付かると図15
のように曖昧性のある文字の近辺にイメージが表示され
る。オペレータは、そのイメージを参照しながら文字の
修正を行う。ここで、文字認識部85において未知語判定
をも行うとすると、第1の実施例で説明した、曖昧性の
ある文字と未知語とをそれぞれの識別子を付けて表示す
るという機能を付加することができる。
【0039】また、ここで翻訳システムが利用している
辞書に存在しない文字コード列についても提示すること
ができる。即ち、上記の未知語判定に用いる辞書と翻訳
システムが用いる辞書とで、収録されている語彙を一致
させておき、上記の未知語の識別子の付いた語句を提示
する。ここで、文字コード列に対する翻訳されるべき訳
語を入力することで、文字コード列とその訳語を翻訳シ
ステムで利用する辞書に登録する。さらに、この文字コ
ード列を未知語判定に用いる辞書にも登録する。ただ
し、この機能は翻訳システムでは有効であるが、例え
ば、他の計算機に送信するときは不要となる。
【0040】1頁分の編集が終了したら“次頁”ボタン
を選択する(ステップ209 )。続く頁イメージがあると
きは、次の頁のレイアウト認識が開始される。続く頁が
ないときは図10に戻る。このときは、全ての頁の文字認
識が終了しているので“イメージ入力”、“認識”ボタ
ンは網かけされた状態で表示される。これにより、文書
識別名で示される読み取った原稿には次の処理要求(実
施例では翻訳の要求)が残っていることがわかる。ま
た、例えば、5頁のイメージを読み取った状態で、3頁
まで文字認識、編集を実行し、途中で中断したときは、
“イメージ入力”ボタンだけが網かけ状態で表示され、
“認識”、“翻訳”ボタンは網かけとならず、まだ認識
を必要とするイメージが残っていることが示される。ま
た、認識を必要とするイメージが残っている状態で“翻
訳”ボタンを選択すると、図16の画面が表示されオペレ
ータに警告が発せられる。
【0041】“翻訳”ボタンを選択すると図17が表示さ
れる(ステップ311 )。この画面では、オペレータが認
識されたデータを渡す処理システムで次に行ってほしい
処理内容を選択する。実施例では、(1)翻訳システム
に登録する、(2)登録後、翻訳する、または(3)翻
訳後、印刷するのどれかを番号で選択する。
【0042】処理内容が選択され、“確認”ボタンが選
択されると、文書識別名で示される複数の頁からなる文
字コード列を1つにまとめて施したい処理内容とともに
翻訳システムに連絡する(ステップ212 )。その後、初
期画面に戻る。この図17の画面が表示されている間に次
処理制御部88が行っている動作を以下に説明する。
【0043】図20は、文字認識が終り、文字コード記憶
部86の文書に対して、次に希望する処理方法が選択さ
れ、頁単位で記憶される文字コード列がまとめられて次
の処理に渡される場合のデータの流れを示す。実施例で
は、図17の画面で処理番号が選択され、“確認”ボタン
が選択されると、この処理が開始される。図21は、上
記、“確認”ボタンが選択された場合の動作を説明する
ためのフローチャートである。ステップ701 では、処理
番号が選択されているか判定され、選択されていない場
合は、オペレータに知らされる。次に、選択された処理
方法が処理制御データに出力される(ステップ702 )。
実施例では、文書識別名の後に識別子“ctl”を付け
て示す。
【0044】続いて、文字コード記憶部86に記憶される
認識された頁単位の文字コード列を頁番号順に取出し、
1つにまとまったテキストデータに出力する(ステップ
703)。実施例では、文書識別名の後に識別子“tx
t”を付けて示す。
【0045】この出力された処理制御データとテキスト
データを次に希望する処理とあらかじめ決められた領域
に移動する(ステップ704 〜705 )。この次に希望する
処理とデータの受渡しのための領域として、あらかじめ
決める領域は、例えば、ディスク等の共通する領域等を
利用する。また、この共通する領域は、システムの中の
領域でなく、ネットワーク等で接続された他の計算機の
領域を利用することもできる。
【0046】次に希望する処理を行う他の処理システム
側では、あらかじめ決めた領域に処理制御データとテキ
ストデータが文字認識システムから出力されるのを待つ
(ステップ706 )。あらかじめ決められた領域に処理制
御データが出力されると、この処理制御データに指示さ
れる処理を開始する。又は、一定間隔で上記データが出
力されるか判定する等で処理を開始する(ステップ707
〜711 )。
【0047】例えば、機械翻訳においては、処理制御デ
ータの処理方法と翻訳で利用する辞書の種類等を取出
し、文字認識システムで入力されたテキストデータを翻
訳システムに文書登録、あるいは文書登録と翻訳、ある
いは翻訳された訳文の印刷までを自動的に行う。ここ
で、図9の説明に戻る。
【0048】読み取った文書の状態を知るために文書の
一覧表を表示する機能がある(ステップ213 )。図18に
文書一覧表の画面例を示す。読み取られた文書の文書名
が、読み取られた頁数及びその内認識の終了した頁数と
ともに表示されている。この文書一覧表の表示状態にお
いて文書を選択すると文書識別名を入力する必要がない
(ステップ214 )。また、“削除”ボタンを選択すると
不要な文書を簡単に消すことができる(ステップ215
)。
【0049】この他、翻訳システムに認識した文字コー
ド列を送って翻訳する際に利用する辞書は、“辞書選
択”、“翻訳環境設定”ボタンを選択することで簡単に
できる(ステップ216 )。図19に辞書の選択の画面例を
示す。以上の読み取り、文字認識、編集、次処理制御に
おいては、頁単位に情報を管理しているが、これを行う
文字認識制御部83の動作を以下に説明する。図22は、イ
メージ入力部82で読取った複数頁のイメージを記憶する
イメージ記憶部84と文字コード記憶部86の関係を示す図
である。
【0050】図22は、図10に示す初期画面で入力される
文書識別名を利用して、データの対応を取った例であ
る。“roubun”と“manual”の2つの文書
識別名を持つ原稿がイメージ記憶部84から入力され、
“ronbun”の3頁分が文字認識されている状態を
示している。
【0051】実施例のデータの名前は、文書識別名の後
に読取った順に3桁のシーケンス番号を付加し、さら
に、その後にデータの識別子として“rf”、“tx
t”等を付加して示す。図22において、“rf”の識別
子の付いているデータ、“rounbun004〜00
5”と“patent001〜004”は読取ったイメ
ージが圧縮した状態でそのまま記載されていることを示
す。また、“ronbun001〜003”は、既に文
字認識され文字コードとして文字コード記憶部に記憶さ
れているのでイメージ記憶部84から消されている。実施
例では、既に文字認識された頁イメージは消去する例で
示したが全て頁の認識が終るまでイメージ記憶部84に記
憶しても良い。また、文字コード記憶部86の“txt”
の識別子の付いているデータ、“ronbun001〜
003”は文字認識が終っていることを示している。こ
の他、“rounbun.ctl”で示されるデータ
は、図17、図19で選択された、次に希望する処理方法、
辞書の種類、原文識別名等を記憶する。
【0052】図23は、図22に示す状態で記憶される読取
りイメージに対して実施される再読取り、頁挿入、頁削
除の動作を説明するためのフローチャートである。この
場合、文字認識制御部83は、入力部81の処理要求が頁に
関する処理であるか判定する(ステップ101 〜103 )。
頁削除、再読取り、頁挿入以外の処理要求は、他のファ
ンクション処理をする(ステップ104 )。
【0053】ステップ103 でオペレータの要求が頁挿入
であると判断した場合は、まず、イメージ記憶部84に頁
単位で付けられているデータ識別名を取出すための比較
カウンターをクリアする(ステップ105 )。続いて、イ
メージ記憶部84から比較カウンターが示すデータ識別名
を取出し、文書識別名(i)と頁番号(i)を抽出する
(ステップ106 )。
【0054】次に、ステップ106 で抽出された、文書識
別名(i)と処理中の文書識別名と比較する(ステップ
107 )。一致しない場合は、別の文書識別名であるから
比較カウンタを1つ増加する(ステップ110 )。文書識
別名が一致する場合は、頁番号(i)と処理中の頁番号
と比較する(ステップ108 )。
【0055】頁番号(i)が処理中の頁、又は大きい場
合は、データ識別名の頁番号を1つ増加する(ステップ
109 )。その後、比較カウンターを増加して、まだイメ
ージ記憶部84に別のデータ識別名があるか判定し、別の
データ識別名がある場合は、ステップ106 に戻る(ステ
ップ110 〜111 )。
【0056】例えば、図22において、処理中の文書識別
名が“ronbun”の場合に、頁挿入の要求をする
と、3頁までは文字認識が終っているので処理中の頁は
4頁が該当する。このため、データ識別名は、“ron
bun.004.rf”→“ronbun.005.r
f”、“ronbun.005.rf”→“ronbu
n.006.rf”に変更される。
【0057】該当するデータ識別名の変更が終ると、イ
メージ入力部82から処理中のデータ識別名が示す領域に
挿入する頁のイメージを読取り、次の処理(実施例で
は、レイアウト認識)を開始する(ステップ112 )。ス
テップ102 でオペレータの要求が再読取りであると判断
した場合は、データ識別名の変更をする必要がないの
で、ステップ112 を実行する。
【0058】ステップ101 でオペレータの要求が頁削除
であると判断した場合は、まず、イメージ記憶部84から
処理中のデータ識別名と該当する読取りイメージを削除
する(ステップ113 )。
【0059】続いて、頁挿入と同様にデータ識別名を変
更する。頁削除の場合は、データ識別名の頁番号を1つ
減少する(ステップ118 )。その他のステップ114 〜12
0 は頁挿入のステップ105 〜111と同一であるので説明
を省略する。
【0060】以上説明した第2の実施例の主旨は、印
刷、又は手書きされた原稿のイメージを読み取る手段
と、読み取ったイメージを文字認識する手段と、文字認
識することでコード化された文字を編集する手段と、編
集された文字コード列に対して次に施すべき処理内容を
指示する手段を具備したことを特徴とする文字認識シス
テムであり、また、複数頁の印刷、又は手書きされた原
稿のイメージを読み取る手段と、読み取った複数頁のイ
メージを頁単位で記憶する手段と、読み取り手段におい
て頁単位に再読み取り、頁挿入、又は頁削除する手段
と、記憶された複数頁のイメージを頁単位に文字認識、
編集する手段と、記憶された全ての頁の文字認識、編集
が終了後に、複数頁からなる文字コード列を1 つにまと
める手段とを具備したことを特徴とする文字認識システ
ムである。
【0061】したがって、このように構成された文字認
識システムによれば、複数の頁のイメージを順に読み取
って文字認識、編集の処理を行う際、頁を意識すること
なく実行でき、全て読み取った頁イメージの文字認識、
編集が実行された後、その認識、編集された文字コード
列を1つにまとめ、そのまとめた文字コード列に対し
て、次の処理システムで行いたい処理内容を指示するこ
とで、ファイル名、コード体系等を意識せずに、次の処
理を実行することができオペレータの労力を大幅に軽減
できる。
【0062】なお、上述の実施例では認識した文字コー
ド列の処理を翻訳する例に対応させたが、他の計算機に
送信させてもよい。さらに、レイアウト情報をDTP文
書の形式に変換させるようにしてもよい。またイメージ
の入力をスキャナでなく、ファックスで送信されたデー
タを入力としてもよい。ファックスから入力されたイメ
ージを文字認識し、その認識された文字コード列を翻訳
システムで翻訳し、さらに印刷まで行うことができる。
【0063】
【発明の効果】以上説明したように、本発明に係る文字
認識装置によれば、認識誤り箇所の候補がいかなる理由
によって指摘されているのであるかをオペレータに示
し、また、指摘するために必要な条件のを設定を行うこ
とができるため、文字認識の後編集に於けるオペレータ
の負担を軽減し、作業効率を向上させることができる等
の実用上多大なる効果が奏せられる。
【図面の簡単な説明】
【図1】 本発明の一実施例に係る文字認識装置の概略
構成を示すブロック図。
【図2】 本発明の一実施例に係る文字認識装置の動作
の概要を示すフローチャート。
【図3】 図2における修正必要候補語句の指摘とその
語句に対する識別子の表示を行うステップの動作の一例
を表すフローチャート。
【図4】 図2における修正必要候補語句の指摘とその
語句に対する識別子の表示を行うステップ以降の動作の
別の例を表すフローチャート。
【図5】 図2における修正必要候補語句の指摘とその
語句に対する識別子の表示を行うステップの動作の別の
例を表すフローチャート。
【図6】 本発明に係る文字認識装置を用いた翻訳装置
の構成例を示すブロック図。
【図7】 (a)図1における表示部2、(b)図6に
おける表示部602 、の画面の例を示す図。
【図8】 第2の実施例に係る文字認識システムの構成
を示すブロック図。
【図9】 第2の実施例の処理の流れを説明するための
状態遷移図。
【図10】 本文字認識システムの初期画面図。
【図11】 本文字認識システムのイメージ入力中の画
面図。
【図12】 本文字認識システムのレイアウト認識結果
を示す画面図。
【図13】 本文字認識システムの文字認識中の画面
図。
【図14】 本文字認識システムの文字認識結果を示す
画面図。
【図15】 曖昧性のある文字を検索する際の画面図。
【図16】 全頁の認識が終了していない時点での次の
処理(翻訳)の要求に対する警告を発する際の画面図。
【図17】 オペレータに次に行いたい処理内容を選択
させる際の画面図。
【図18】 読み取った文書の一覧を表示する際の画面
図。
【図19】 翻訳のときに利用する辞書をオペレータに
選択させる際の画面図。
【図20】 認識の終了したデータが次の処理に渡され
るときのデータの流れを示す図。
【図21】 認識の終了したデータに対して次の処理シ
ステムで行う処理内容を指示する次処理制御部88の動作
を表すフロー図。
【図22】 複数頁のイメージを記憶するイメージ記憶
部84と文字コード記憶部86の関係を示す図。
【図23】 読み取り、文字認識、記憶、編集等を頁単
位で行うことに関する文字認識制御部83の動作を表すフ
ロー図。
【符号の説明】
1,601 …入力部 2,602 …表示部 3,603 …読み取り部 4,604 …文字認識部 5,605 …認識用辞書 6,606 …未知語判定部 7,607 …語彙辞書 8,608 …修正必要候補語句指示部 9,609 …識別子表示部 10,610 …記憶部 11,611 …制御部 12…イメージファイル 612 …翻訳部 613 …翻訳用辞書 81…入力部 82…イメージ入力部 83…文字認識制御部 84…イメージ記憶部 85…文字認識部 86…文字コード記憶部 87…文字コード編集部 88…次処理制御部 89…表示部
フロントページの続き (72)発明者 天野 真家 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝 総合研究所内 (56)参考文献 特開 昭63−143684(JP,A) 特開 昭61−74080(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/03 G06K 9/72

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された文字の画像パターンと、予め記
    憶されてなる認識辞書の文字パターンとを照合して、類
    似度が所定値以上の文字パターンの文字を選択する文字
    認識手段と、 この文字認識手段により得られた文字からなる文字列
    が、予め記憶されてなる語彙辞書の文字列の中に存在す
    るか否かを判定する判定手段と、 前記文字認識手段において前記類似度が所定値以上の文
    字パターンが複数ある中から選択された文字を含む場
    合、前記文字が曖昧であることを示す識別子を前記文字
    とともに記憶し、前記判定手段において前記語彙辞書の
    文字列の中に存在しないと判定された場合、前記文字列
    が未知語であることを示す識別子を前記文字列とともに
    記憶する記憶手段と、 この記憶手段に記憶された識別子をもとに、前記文字列
    が文字認識の結果曖昧な文字を含むものであるのか、語
    彙辞書の文字列の中に存在しないものであるかを区別し
    て表示する表示手段とを有することを特徴とする文字認
    識装置。
  2. 【請求項2】入力された文字の画像パターンと、予め記
    憶されてなる認識辞書の文字パターンとを照合して、類
    似度が所定値以上の文字パターンの文字を選択し、 この選択された文字からなる文字列が、予め記憶されて
    なる語彙辞書の文字列の中に存在するか否かを判定し、 前記類似度が所定値以上の文字パターンが複数ある中か
    ら選択された文字を含む場合と、前記語彙辞書の文字列
    の中に存在しないと判定された場合に、各々識別子を付
    与し、 この識別子をもとに、前記文字列が文字認識の結果曖昧
    な文字を含むものであるのか、語彙辞書の文字列の中に
    存在しないものであるかを区別して表示することを特徴
    とする文字認識方法。
JP03065786A 1991-03-29 1991-03-29 文字認識装置及び方法 Expired - Lifetime JP3083171B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03065786A JP3083171B2 (ja) 1991-03-29 1991-03-29 文字認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03065786A JP3083171B2 (ja) 1991-03-29 1991-03-29 文字認識装置及び方法

Publications (2)

Publication Number Publication Date
JPH04302070A JPH04302070A (ja) 1992-10-26
JP3083171B2 true JP3083171B2 (ja) 2000-09-04

Family

ID=13297068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03065786A Expired - Lifetime JP3083171B2 (ja) 1991-03-29 1991-03-29 文字認識装置及び方法

Country Status (1)

Country Link
JP (1) JP3083171B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4718699B2 (ja) * 2001-03-15 2011-07-06 株式会社リコー 文字認識装置、文字認識方法、プログラム、およびコンピュータ読み取り可能な記録媒体
JP2002279349A (ja) * 2001-03-21 2002-09-27 Ricoh Co Ltd 自動文字認識に用いる辞書の提供方法
JP2009193356A (ja) * 2008-02-14 2009-08-27 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体

Also Published As

Publication number Publication date
JPH04302070A (ja) 1992-10-26

Similar Documents

Publication Publication Date Title
US7081975B2 (en) Information input device
EP0241646B1 (en) Document processing apparatus
US5265171A (en) Optical character reading apparatus for performing spelling check
US5905811A (en) System for indexing document images
JP3083171B2 (ja) 文字認識装置及び方法
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
US20020181779A1 (en) Character and style recognition of scanned text
JPH05303619A (ja) 電子スクラップブック
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JP3928739B2 (ja) 文書ファイリングシステム
JP2829186B2 (ja) 光学的文字読取装置
JP2662404B2 (ja) 光学文字読取装置における辞書作成方法
JPH06348889A (ja) 文字認識装置
JPH06162107A (ja) 電子ファイリングシステム
JPH0562008A (ja) 文字認識方法
JPH07287766A (ja) 文書編集装置
JP2682873B2 (ja) 表形式文書の認識装置
JP4092768B2 (ja) 文字認識装置および文字認識方法
JPH06223221A (ja) 文字認識装置
JP3077580B2 (ja) 文字読取装置
JPH0581318A (ja) デジタル翻訳装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH04293185A (ja) ファイリング装置
JPH0636067A (ja) 文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090630

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100630

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100630

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110630

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110630

Year of fee payment: 11