JPH04252390A

JPH04252390A - 文字認識結果の後処理方法

Info

Publication number: JPH04252390A
Application number: JP3026844A
Authority: JP
Inventors: Takakuni Minewaki; 隆邦嶺脇
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1991-01-28
Filing date: 1991-01-28
Publication date: 1992-09-08
Anticipated expiration: 2014-10-25
Also published as: JP2968354B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字認識システムにお
いて、文字認識結果に対し単語照合や形態素解析によっ
て誤り修正を行なうための後処理方法に関する。

【０００２】

【従来の技術】文字認識システムにおいて、文字画像の
特徴量を用いた１文字単位の文字認識によって誤認識を
完全に排除することは極めて困難である。このため、活
字または手書きの文字を認識する日本語ＯＣＲシステム
においては、文字認識結果として得られた文字列につい
て、後処理で単語照合や形態素解析等により誤認識文字
の自動修正を行なうことが多い。

【０００３】このような日本語ＯＣＲシステムの後処理
の方法は数多く提案されているが、一般文章を対象とし
たものとしては次の方法が知られている。なお、ｃとｄ
の方法は、同一出願により特許出願がなされたものであ
る。ａ）認識対象となる領域（例えば段落）の認識がすべて
終了した後に、改行は無いものとして、領域内の全部の
文字列について先頭より順に後処理を行なう。ｂ）文を処理の単位とし、文の先頭から句点または読点
までの文字列を、改行を無視して処理する。ｃ）処理の単位を行とし、行の文字列を文字種の変化位
置で区切り、最後の区切り部分の文字を次行の先頭へ移
し、次行で処理する。ｄ）処理の単位を行とし、行の先頭から単語処理を行な
い、解析不能として残った行末部分の文字を次行の先頭
へ移し、次行で処理する。

【０００４】なお、単語照合や形態素解析による日本語
文書の文字認識結果の後処理に関する公知資料としては
、例えば「西野ほか：“日本語リーダ後処理の実現”、
自然言語処理　　６４−６（１９８７．１１．２０）、
ｐｐ．４５−５２」がある。

【０００５】

【発明が解決しようとする課題】前記ａまたはｂの方法
によれば、段落や文が長い場合、その認識が終了するま
で後処理の開始を待たされ処理効率が悪く、また認識結
果の格納のために大きなメモリ容量が必要となるという
問題がある。

【０００６】文字列は単語や文節で区切られて解析され
るが、一つの単語が行末と次行の先頭に分裂することが
ある。行を単位として後処理を行なう場合、このような
単語の分裂を考慮しないと、分裂した単語を正しく解析
することができないため、分裂単語中の誤認識文字の修
正を失敗する。

【０００７】行を処理単位とした前記ｂまたはｃの方法
は、そのような行末から次行先頭に跨って分裂した単語
を、次行で処理するため、分裂単語の誤りを修正可能で
ある。また、行を単位としているため、認識結果を後処
理が終了するまで保存するためのメモリが少なくとも、
ある行の後処理と並行して次行の認識処理を実行するこ
とができる。しかし解決すべき課題も残されている。

【０００８】すなわち、前記ｃの方法では、文字種の変
化による区切りによって行末部を決定しているため、行
内文字が全部がひらがなであったり、英数字であったり
した場合、文字種の情報のみでは文字列の区切りを特定
することができず、行内の全文字が次行へ移されるとい
う事態が発生する。つまり、次行へ移される文字数が必
ずしも少なくなるという保証がない。このような事態に
対応するためには、後処理待ちの認識結果を保存するた
めのメモリに余裕をみる必要があり、省メモリの目的を
十分に達成できないという問題が残されていた。

【０００９】また前記ｄの方法では、単語解析が不能と
なることが行末部の文字列を次行へ移すことを決定する
手段であるが、単語照合を行なった場合に、行末部分の
分裂した単語が必ず解析不能となるとは限らない。行末
の分裂した単語の一部が正解以外の別の単語との照合に
成功することがある。この場合、解析不能とならないの
で、次行への移送は行なわれず、誤った修正が確定して
しまうという問題がある。

【００１０】本発明の目的は、前記従来方法の問題点を
解決し、改行により分裂した単語も確実に修正可能で、
かつ文字認識処理と後処理とを並行的に実行する場合に
おいても後処理終了まで必要な情報を保存するためのメ
モリの容量を十分に小さくできる、後処理方法を提供す
ることにある。

【００１１】

【課題を解決するための手段】本発明の後処理方法によ
れば、１行毎に、行先頭より順に単語単位に処理を実行
し、一つの単語の処理を終わる都度、該単語に続く未処
理文字の字数と一定値とを比較し、該未処理文字の字数
が該一定値以下であるときは処理中の行の処理を終了し
、該未処理文字、あるいは該未処理文字に加え処理済み
の最後の単語部分の文字も次行の先頭へ移す。

【００１２】また、各行において、前行から移された文
字を除いた文字数がある一定値以下のとき、あるいは、
処理対象領域内の各行において、前行から移された文字
を除いた文字数が、処理済み行の最大文字数よりある一
定値以上少ないときは、または該最大文字数の一定割合
以下のとき、ならびに、行の最後の文字が句読点のとき
は、最後の文字まで当該行で処理する。

【００１３】

【作用】１行毎の後処理であるので、１行分の文字認識
処理が終了するたびに後処理を実行し処理効率を上げる
ことができるとともに、改行によって分裂し２行に跨っ
た単語についても次行にて連続した文字列として単語解
析を行ない、適切に修正することができる。

【００１４】未処理文字列に加えて最後に処理された単
語の文字列をも次行へ移すことにより、単語解析処理で
単語間接続の検証を行なう場合においても、改行により
分裂した単語の単語間接続の検証が可能となり、確実な
解析が保証される。

【００１５】次行に移される文字列の最大文字数は一定
値を超えることがないので、次行へ移した文字列の保存
に必要なメモリ量を極めて小さくすることができる。

【００１６】また、条件判定により、無意味な次行への
文字列の持ち越しを防止するため、処理の無駄を減らし
て効率的な後処理が可能である。

【００１７】

【実施例】図１は本発明に係る日本語文字認識システム
の概略ブロック図である。この日本語文字認識システム
において、画像入力部１０はスキャナー等により文書原
稿の画像を読み取り、その２値画像データを文書画像メ
モリ１１に格納する。行・文字切り出し部１２は、文書
画像メモリ１１内の画像から文字行と文字画像を切り出
し、文字画像データを文字画像メモリ１３に格納し、ま
た認識対象領域（例えば段落。自動的に検出するか、オ
ペレータより指定する。）の位置、切り出した行の位置
、文字位置、文字サイズ等の切り出し情報を切り出し情
報メモリ１４に格納する。

【００１８】文字認識部１５は、文字画像メモリ１３よ
り文字画像データを読み出し、正規化を行なってから特
徴量を抽出し、この特徴量と文字辞書メモリ１６内の辞
書とのマッチングを行なうことにより、また切り出し情
報中の形状情報を利用することにより認識結果候補を決
定し、その文字コードと距離データ等を認識結果メモリ
１７に格納する。

【００１９】後処理部１８は、本発明に直接係わる後処
理を実行する部分である。これは、認識結果を１行ずつ
認識結果メモリ１７より読み込み、その先頭に行末保存
メモリ１９より前行持ち越しの文字列を付加したのち、
行先頭より単語辞書メモリ２０の内容を用いて言語解析
・修正処理を行ない、修正結果により認識結果メモリ１
７の内容を書き換える。また、処理行の行末部分の文字
列を次行へ移す必要がある場合には、その文字列を行末
保存メモリ１９に書き込む。この後処理の内容の詳細に
ついては、実施例別に後述する。

【００２０】結果出力部２１は、認識結果メモリ１７の
内容をディスプレイ、プリンタ等の出力機器あるいは磁
気ディスク装置等のファイル装置に出力する。

【００２１】実施例１後処理の内容を図２に示したフローチャートに沿って順
に説明する。まず後処理部１８は、現在処理しようとし
ている１行（現在行と呼ぶ）の認識結果データを認識結
果メモリ１７より読み込む（ステップ１００）。

【００２２】次に、行末保存メモリ１９に前行から持ち
越された文字列があるか調べ（ステップ１０２）、存在
するときは、その文字列を行末保存メモリ１９より読み
込み、現在行の認識結果データの先頭に付加する（ステ
ップ１０４）。

【００２３】次に、現在行の認識結果データ（前行から
持ち越された文字列も含める）を、行頭より１単語ずつ
単語照合により解析を進めていく（ステップ１０６）。

【００２４】一つの単語を処理するたびに、その処理済
み単語に続く未処理の文字列の文字数が一定値（行末文
字数閾値）以下であるか否かを調べる（ステップ１０８
）。これは未処理文字列の次行持ち越しの判定の１ステ
ップである。未処理文字数が行末文字数閾値より大きい
場合は、次行持ち越しを行なう段階まで処理が進んでい
ないということであるので、次の単語の処理に移る。なお、行末文字数閾値はシステムによって異なってよい
が、後処理部１８で使用する単語辞書内の最大単語長の
文字数より１だけ少ない値を用いる。ここでは、最大単
語長を１０文字とし、行末文字数閾値を９であるものと
して説明を進める。

【００２５】未処理文字数が行末文字数閾値以下となっ
た場合、未処理文字数が０であるか調べる（ステップ１
１０）。未処理文字数が０であれば、現在行の処理は最
終文字まで終わっているので、次行が残っているかを調
べ（ステップ１１２）、残っていなければ、すなわち現
在行が認識対象領域の最終行であれば、処理を完了する
。次行があるならば、ステップ１００へ戻り次行の処理
を開始する。

【００２６】ステップ１１０で未処理文字が残っている
と判定した場合、最後の文字が句点または読点であるか
調べ（ステップ１１４）、句読点のときは現在行を最後
まで処理すべきと判断されるので、ステップ１０６に戻
って次の単語の処理を実行する。

【００２７】最後の文字が句読点でないときは、現在行
の前行から持ち越しの文字を除いた文字数が、認識対象
領域内の処理済み行中の最大文字数より一定の閾値以上
少ないか、あるいは、該最大文字数の一定割合以下であ
るかを調べる（ステップ１１６）。このような条件を満
たさない場合は、この時点で次行への持ち越しを行なわ
ないと判断され、ステップ１０６に戻る。他方、条件を
満たす場合は、前行からの持ち越し文字数を除いた現在
行の文字数が行末文字数閾値以下であるか調べる（ステ
ップ１１８）。条件を満たさないときはステップ１０６
に戻る。

【００２８】ステップ１１８の条件を満たさないときは
、現在行が認識対象領域の最終行であるか調べ（ステッ
プ１２０）、最終行ならば次行への持ち越しをせず現在
行の最後の文字まで現在行で処理するためステップ１０
６に戻るが、最終行でなければ、現在行の未処理文字列
を次行に持ち越すことと最終的に判断し、この文字列を
行末保存メモリ１９に格納し（ステップ１２２）、現在
行の処理を終了してステップ１００に戻り次行の処理を
開始する。

【００２９】ここで、次の２行の文字列画像の入力と表
示のデモンストレーションを行なう。からなる認識対象領域を例として、後処理を説明する。

【００３０】１行目の文字列について先頭より単語照合
により解析を進めていくと、４単語目までは次のように
処理が進む。画像／の／入力／と／（ただし、／は単語の境界を意味する）

【００３１】こ
の時点では１行目の残り文字数は１０であるので、次の
単語の処理に進む。次の単語「表示」を処理した段階で
、未処理文字数は８となって、これは行末文字数閾値で
ある９以下である。

【００３２】また、最後の文字は句読点ではなく、現在
行が最初の行であるためステップ１１６の条件を当然に
満たさず、さらに現在行の文字数は１６で行末文字数閾
値の９より多く、さらに現在行は最終行でないた。そこ
で、この段階で現在行すなわち１行目の処理を終了し、
未処理文字列「のデモンストレー」を行末保存メモリ１
９に保存し、２行目の処理に進む。ここでは行末文字数
閾値が９であるから、行末保存メモリ１９は９文字分の
容量を持っていれば足りる。

【００３３】２行目の認識結果文字列を読み込み、その
先頭に行末保存メモリ１９の内容を付加すると、次の文
字列となる。すなわち、１行目の改行で分裂した単語「
デモンストレーション」が連続した形になる。のデモンストレーションを行なう。（下線部が前行持ち越し文字列）

【００３４】この文字列の解析を進めると、の／デモン
ストレーション／を／行なう／。のようになる。ただし、ａ）行末文字が句点である（ステップ１１４）。ｂ）前行持ち越し文字を除いた文字数が７で、処理済み
行の最大文字数１６より行末文字数閾値９以上少なく、
また最大文字数に対する比が０．４４と十分に小さい（
ステップ１１６）。ｃ）前行繰り越し文字を除いた文字数が行末文字数閾値
以下である（ステップ１１８）。ｄ）最終行である（ステップ１２０）。したがって、最
終文字まで処理され、次行への持ち越しはしない。

【００３５】実施例２図２のステップ１２２において、未処理文字列に加えて
最後に処理された単語の文字列も行末保存メモリ１９に
格納し、次行へ持ち越すことが、実施例１と処理内容が
異なる。

【００３６】実施例１で用いた２行の文字列を再び例に
用いる。１行目の単語「表示」まで次のように処理が進
む。画像／の／入力／と／表示／のデモンストレー

【００３
７】この段階で１行目の処理を終わり、最後に処理した
単語「表示」以降の文字列を次行へ持ち越す。したがって、２行目は表示のデモンストレーションを行なう。となり、単語解析処理を行なえば表示／の／デモンストレーション／を／行なう／。となる。

【００３８】ここで、未処理単語のみでなく、最後に処
理した単語の文字列まで次行へ持ち越す理由は次の通り
である。後処理における単語解析処理が、単語照合のみ
でなく、連続した単語間の接続をも検証するものである
場合、未処理文字列のを次行へ持ち越したのでは、次行
の処理において、最初の単語とその直前の単語（前行の
最後に処理した単語）との接続を検証できないことによ
り、解析の不十分な部分が残ってしまう。このような不
都合は、本実施例による如く、最後の処理単語も次行へ
持ち越すことにより避けることができる。

【００３９】例に上げた２行の文字列を再び用いて説明
する。実施例１によれば、２行目の先頭に「のデモンス
トレーション」が持ち越され、最初に「の」という単語
が処理されるが、その前にある「表示」の情報が持ち越
されないので、「表示」と「の」の間の接続の検証がで
きない。これに対し、本実施例によれば、「表示」も２
行目に持ち越されるため、２行目の処理において「表示
」と「の」の間の接続検証についての不連続な点はなく
なる。

【００４０】換言すれば、後処理における単語解析処理
のレベルに応じて行末処理を選べばよく、単語照合のみ
の解析であれば実施例１の行末処理で問題がなく、単語
照合のみならず単語間接続検証をも行なう解析であれば
、実施例２の行末処理が適当であるということである。

【００４１】なお、以上説明した処理を実行する後処理
部１９は、汎用のプロセッサを用いソフトウエアにより
実現され、あるいは専用のハードウエアを用いて実現さ
れる。いずれにしても、以上の説明に基づき当業者は容
易に後処理部１９を実現可能であるので、後処理部１９
を実現するためのソフトウエアまたはハードウエアの具
体例の提示は省略する。

【００４２】

【発明の効果】以上詳細に説明した如く、本発明によれ
ば、次のような効果を得られる。１）行毎の後処理であるので、１行分の文字認識処理が
終了するたびに後処理を実行し処理効率を上げることが
できる。２）行末処理、すなわち未処理文字列または最終処理単
語と未処理文字列を次行への持ち越し処理を行なうので
、改行によって分裂し２行に跨った単語についても次行
にて連続した文字列として単語解析を行ない、適切に修
正することができる。３）行末処理において未処理文字列のみならず最終処理
単語まで次行へ持ち越すことにより、単語解析処理で単
語間接続の検証を行なう場合においても、改行により分
裂した単語の単語間接続の検証が可能となり、確実な解
析が保証される。４）未処理文字の字数、前行からの持ち越し文字を除い
た文字数、あるいは、前行からの持ち越し文字を除いた
文字数と処理済み行の最大文字数との比較、最終文字の
種類等の条件判定により、無意味な行末処理を防止する
ため、処理の無駄を減らして効率的な後処理が可能であ
る。５）次行に持ち越される文字列の最大文字数は一定値を
超えることがないので、次行へ移した文字列の保存に必
要なメモリ量を極めて小さくすることができる。

【図面の簡単な説明】

【図１】本発明に係る日本語文字認識システムの概略ブ
ロック図である。

【図２】本発明の一実施例における後処理のフローチャ
ートである。

【符号の説明】

１０　　画像入力部１１　　文書画像メモリ１２　　行・文字切り出し部１３　　文字画像メモリ１４　　切り出し情報メモリ１５　　文字認識部１６　　文字辞書メモリ１７　　認識結果メモリ１８　　後処理部１９　　行末保存メモリ２０　　単語辞書メモリ２１　　結果出力部

Claims

【特許請求の範囲】

【請求項１】　　文字認識結果に対し単語解析処理等に
よって誤り修正を行なう後処理において、１行毎に、行
先頭より順に単語単位に処理を実行し、一つの単語の処
理を終わる都度、該単語に続く未処理文字の字数と一定
値とを比較し、該未処理文字の字数が該一定値以下であ
るときは処理中の行の処理を終了し、該未処理文字を次
行の先頭へ移すことを特徴とする文字認識結果の後処理
方法。
【請求項２】　　文字認識結果に対し単語解析処理等に
よって誤り修正を行なう後処理において、１行毎に、行
先頭より順に単語単位に処理を実行し、一つの単語の処
理を終わる都度、該単語に続く未処理文字の字数と一定
値とを比較し、該未処理文字の字数が該一定値以下であ
るときは処理中の行の処理を終了し、処理済みの最後の
単語部分から行末までの文字を次行の先頭へ移すことを
特徴とする文字認識結果の後処理方法。
【請求項３】　　各行において、前行から移された文字
を除いた文字数がある一定値以下のときは、最後の文字
まで当該行で処理することを特徴とする請求項１または
２記載の文字認識結果の後処理方法。
【請求項４】　　処理対象領域内の各行において、前行
から移された文字を除いた文字数が、処理済み行の最大
文字数よりある一定値以上少ないときは、または該最大
文字数の一定割合以下のときは、最後の文字まで当該行
で処理することを特徴とする請求項１または２記載の文
字認識結果の後処理方法。
【請求項５】　　各行において、最後の文字が句読点の
ときは、該句読点まで当該行で処理することを特徴とす
る請求項１、２、３または４記載の文字認識結果の後処
理方法。