JP3080066B2

JP3080066B2 - 文字認識装置、方法及び記憶媒体

Info

Publication number: JP3080066B2
Application number: JP10134746A
Authority: JP
Inventors: 修司仙田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1998-05-18
Filing date: 1998-05-18
Publication date: 2000-08-21
Anticipated expiration: 2018-05-18
Also published as: JPH11328316A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文字認識装置、方
法及び記憶媒体に関し、特に、印刷文字または手書き文
字を認識するオフラインもしくはオンライン文字認識装
置において、言語知識によって個別文字認識手段が出力
する候補文字の中から効率的かつ精度良く正解文字を求
めることのできる文字認識装置に関する。

【０００２】

【従来の技術】個々の文字の形状のみから文字を認識す
る個別文字認識手法では、前後にどのような文字が書か
れているかに関係なく、個々の文字を独立に認識する。
それに対して、言語的な知識を利用して前後関係を考慮
した後処理を行えば、文字認識精度は大幅に向上すると
期待できる。このような言語知識による文字認識後処理
手法は、文字ｎ−ｇｒａｍを利用するもの（例えば、伊
東「Ｂｉｇｒａｍによるオンライン漢字認識の文脈後処
理手法」情報処理学会自然言語処理研究会資料、第９
７−６号、１９９３年発行）と形態素解析を利用するも
の（例えば、高尾、西野「日本語文書リーダ後処理の現
実と評価」情報処理学会論文誌、第３０巻１１号１３
９４〜１４０１頁、１９８９年発行）に大別できる。

【０００３】上記の伊東の論文にもあるように、文字ｎ
−ｇｒａｍとは、ある文字が出現する確率をその直前の
ｎ−１文字によって決定される事後確率として定義する
手法であり、この確率を文字ｎ−ｇｒａｍ確率と呼ぶ。
日本語の場合、文字種が多いため、ｎとしては２または
３を用いることが多く、それぞれ、文字ｂｉｇｒａｍ
（バイグラム）または文字ｔｒｉｇｒａｍ（トライグラ
ム）と呼ばれる。文字ｎ−ｇｒａｍ確率は、予め、大量
の学習用文書から統計的に求めておくことができる。よ
って、文字ｎ−ｇｒａｍ確率は統計的言語知識である。
文字ｎ−ｇｒａｍを利用すると、ある文字列の出現確率
は、文字列中の個々の文字の文字ｎ−ｇｒａｍ確率を掛
け合わせることによって求めることができる。よって、
個別文字認識手段が出力する候補文字の中から最も出現
確率の高い文字列を求めてそれを正解とするのが文字ｎ
−ｇｒａｍによる文字認識後処理である。文字ｎ−ｇｒ
ａｍの利点は、言語知識となる文字ｎ−ｇｒａｍ確率を
機械的に求めることができること、文字列の出現確率を
求めるだけなので後処理部の構成が簡単になること、学
習用文書には存在しない表現が出現しても特別な処理を
必要としないことが挙げられる。

【０００４】上記の高尾と西野の論文にもあるように、
形態素解析とは、品詞ごとに分類された単語辞書と品詞
間の接続可否を記述した品詞接続表とを用いて、文字列
を接続可能な単語の列として解析する手法である。形態
素解析による文字認識後処理は、単語と品詞という文法
的な知識を用いるので、文字ｎ−ｇｒａｍによる統計的
な手法と比べると文法的に正しい解を得ることができる
という利点がある。しかし、単語を単位として解析を行
なうので未知の単語があると解析できないこと、接続可
否の情報だけでは複数の解が有り得る場合にどれを選べ
ば良いか分からないこと、１文字単語同士の接続などに
よって文法的には正しくても実際には有り得ない文字列
を正解としてしまうことなどが問題となる。

【０００５】これらの形態素解析手法の欠点を補うもの
として、特開平８−３１５０７８号公報に示されるよう
に、文字ｔｒｉｇｒａｍなどの統計による言語知識を利
用しつつ形態素解析を行なう手法がある。この手法を実
現するための構成が図１５に示されている。

【０００６】図１５のブロック図を参照して説明する
と、本手法は、文字候補生成手段１００が入力文の文字
候補を生成する。形態素解析手段１０１は、生成された
文字候補を入力とし、単語モデル１０３から単語仮説生
成手段１０２で得られた単語仮説情報と、類似語モデル
１０５から類似語検索手段１０４で得られた類似語と、
品詞付けモデル１０６からの品詞付けモデル情報に基づ
いて形態素列を出力する。

【０００７】上記単語モデル１０３は、品詞出現確率テ
ーブル、品詞別単語長テーブル、単語内文字三つ組確率
テーブルから構成される。単語内文字三つ組確率テーブ
ルは、単語内に限った場合の文字ｔｒｉｇｒａｍ確率を
表形式で蓄積したものである。この単語モデル１０３に
よって、単語辞書に未知の単語が存在しても、そのつづ
りと品詞が自動的に生成されるために解析を続けること
ができる。

【０００８】類似語モデル１０５は、単語テーブル、文
内文字三つ組確率テーブルから構成される。文内文字三
つ組確率テーブルは、通常の文字ｔｒｉｇｒａｍ確率で
ある。品詞付けモデル１０６は、品詞三つ組確率テーブ
ル、品詞別単語出現確率テーブルから構成される。品詞
三つ組確率は、ある品詞の事後確率を直前の２つの品詞
で定義した品詞ｔｒｉｇｒａｍ確率である。このよう
に、文字ｔｒｉｇｒａｍ確率と品詞ｔｒｉｇｒａｍ確率
を用いることによって、複数の候補が接続可能な場合に
どれが最も良いかという順位付けを行なっている。

【０００９】

【発明が解決しようとする課題】しかしながら、上述の
ように形態素解析を主体とする手法は、予め用意した文
法に合致する文章しか受理できないという問題がある。
形態素解析に用いられる文法は、人手により詳細に設計
されるものであるため、柔軟性の少ない書き言葉を中心
としたものである。より柔軟に多様な文章を入力できる
ようにするにはそれを受理する柔軟な文法を用意する必
要があるが、これには多くの人手を要するため容易には
実現できない。仮に、完璧な文法を用意できたとして
も、形態素解析は文章の意味を理解するものではないた
めに、文法的には正しくても実際には有り得ない文字列
を受理してしまうという問題は残る。また、統計による
言語知識と形態素解析を併用する手法は、処理が複雑に
なるために処理時間が増大するという問題がある。

【００１０】それに対して、文字ｎ−ｇｒａｍだけを用
いる手法は、日本語は文字の種類が多いために、文字ｔ
ｒｉｇｒａｍでさえ十分に学習することは難しいという
問題がある。例えば、３０００字種を対象とした場合、
３０００×３０００×３０００個の文字ｔｒｉｇｒａｍ
確率を求める必要があり、実際に使われるのはそのうち
の一部であるとしても、その数は膨大なものになる。こ
のように膨大な数の文字ｔｒｉｇｒａｍ確率を統計的に
十分な精度で求めるには、それに見合うだけの膨大な量
の学習用文書が必要とする。

【００１１】また、学習が可能な状況であっても、求め
た文字ｔｒｉｇｒａｍ確率を格納する辞書容量は非常に
大きなものであり、取り扱いが困難である。更に、この
ようにして求めた文字ｔｒｉｇｒａｍ確率でさえ、それ
は直前の２文字から次の１文字が生起する確率を表して
いるにすぎないので、３文字より長い表現をうまく扱う
ことはできない。

【００１２】文字ｎ−ｇｒａｍを用いる他の問題とし
て、文字ｎ−ｇｒａｍでは候補文字の組み合わせの中か
ら正解を求めることは比較的容易であるが、正解の文字
が候補文字に入っていなかった場合の処理は非常に困難
であるということが挙げられる。その理由は、文字ｎ−
ｇｒａｍで表現できる文字列長が短いために、候補文字
以外から正解を探し出そうとすると、その候補が多くな
りすぎるためである。

【００１３】そこで、本発明の第１の目的は、統計によ
る言語知識と文字認識の確信度とを併用することによっ
て、多様な文章を認識対象とする文字認識装置、方法及
び記憶媒体を提供することにある。

【００１４】本発明の第２の目的は、文字ｎ−ｇｒａｍ
を補足する言語知識として生起確率付き単語辞書を併用
し、後処理の精度を向上させた文字認識装置を提供、方
法及び記憶媒体することにある。

【００１５】本発明の第３の目的は、単語辞書を用いた
あいまい検索を行なうことにより候補文字以外から正解
を探しだすことを可能とし、後処理の精度を向上させた
文字認識装置、方法及び記憶媒体を提供することにあ
る。

【００１６】

【課題を解決するための手段】前述の課題を解決するた
め、本発明による文字認識装置、方法及び記憶媒体は、
次のような特徴的な構成を採用している。

【００１７】（１）個別文字認識を行ない候補文字と各
候補文字の確からしさを表わす確率である確信度を出力
する個別文字認識手段と、前記個別文字認識手段で出力
された候補文字の列に対して、ある文字が出現する確率
をその直前のｎ−１文字によって決定される事後確率と
して定義される文字ｎ−ｇｒａｍ確率を計算する文字ｎ
−ｇｒａｍ確率計算手段と、前記個別文字認識手段で出
力された候補文字の列の中から単語を検索しその生起確
率を計算する単語生起確率計算手段と、前記個別文字認
識手段で出力された文字認識の確信度と前記文字ｎ−ｇ
ｒａｍ確率計算手段で計算された文字ｎ−ｇｒａｍ確率
と前記単語生起確率計算手段で計算された単語の生起確
率とを統合して最適な候補文字列を選択する最適候補選
択手段とを備えて成る文字認識装置。

【００１８】（２）前記個別文字認識手段で出力された
候補文字の列の中から単語辞書に登録された単語と類似
した単語を検索するあいまい検索を行ない、あいまい検
索により見つかった単語の中で不一致となった文字とそ
の確信度を候補文字に追加するあいまい単語検索手段を
有する（１）の文字認識装置。

【００１９】（３）前記最適候補選択手段が出力する最
適候補文字列の評価値から処理の打ち切りを判断する評
価値判定手段と、前記評価値が低い場合に前記個別文字
認識手段が出力するべき候補文字数を増やす候補文字数
増加手段と、を備える（１）または（２）の文字認識装
置。

【００２０】（４）前記文字ｎ−ｇｒａｍ確率計算手段
が利用する文字ｎ−ｇｒａｍ確率辞書と前記単語生起確
率計算手段が利用する生起確率付き単語辞書とを２つ１
組とした複数組の辞書と、前記文字ｎ−ｇｒａｍ確率辞
書と生起確率付き単語辞書の組を使用して得られた最適
候補文字列の評価値のうち、最も評価値の高い組を選択
する最適辞書選択手段と、を有する（１）、（２）また
は（３）の文字認識装置。

【００２１】（５）前記ｎは２または３である（１）、
（２）、（３）または（４）の文字認識装置。

【００２２】（６）与えられた文字列パタンをその形状
的な特徴によって１文字ごとに分割し、切り出し候補と
して出力する文字切り出し候補生成手段と、前記切り出
し候補に対応する文字パタンを文字認識辞書によって文
字認識し、１つの切り出し候補に対して複数の候補文字
と各候補文字の確からしさを表わす確率である確信度を
出力する個別文字認識手段と、候補文字列の文字ｎ−ｇ
ｒａｍ確率を求める文字ｎ−ｇｒａｍ確率計算手段と、
前記候補文字列が予め用意した生起確率付き単語辞書に
存在するか検索する完全一致単語検索手段と、前記候補
文字列が前記生起確率付き単語辞書に存在するかどうか
を検索する際、一部の文字が一致しなくても検索できた
とみなすあいまい検索を行なうあいまい単語検索手段
と、前記完全一致単語検索手段または前記あいまい単語
検索手段によって検索された単語の生起確率を求める単
語生起確率計算手段と、前記得られた候補文字の中か
ら、前記個別文字認識手段によって与えられた個々の文
字の確信度と、前記文字ｎ−ｇｒａｍ確率計算手段もし
くは前記単語生起確率計算手段によって与えられた前後
の文字を考慮した確率とを統合して、全体として最適な
文字列を認識結果として出力する最適候補選択手段と、
を備えて成る文字認識装置。

【００２３】（７）文字ｎ−ｇｒａｍ確率計算と完全一
致単語検索とあいまい単語検索のそれぞれの処理の終了
後に最適候補選択手段による評価値計算を行なって、あ
る一定の値以上の評価値が得られればそこで処理を打ち
切る評価値判定手段と、あいまい単語検索をした後の最
適候補文字列の評価値が一定の値以下である場合には個
別文字認識における候補文字数を増やす候補文字数増加
手段と、を有する（６）の文字認識装置。

【００２４】（８）前記文字ｎ−ｇｒａｍ確率辞書は、
異なる分野の学習用文書から学習された辞書で構成さ
れ、各文字ｎ−ｇｒａｍ確率辞書を使用した場合に得ら
れる最適候補文字列の評価値のうち最も大きい方の結果
を最終的な結果とする最適辞書選択手段を有する（６）
または（７）の文字認識装置。

【００２５】（９）個別文字認識を行ない候補文字とそ
の確信度を求めるステップと、前記候補文字の列に対し
て、ある文字が出現する確率をその直前のｎ−１文字に
よって決定される事後確率として定義される文字ｎ−ｇ
ｒａｍ確率を求めるステップと、得られた候補文字の列
中から単語を検索し、その生起確率を求めるステップ
と、前記文字認識の確信度と文字ｎ−ｇｒａｍ確率と単
語の生起確率を統合した認識基準から求めた評価値に基
づいて最適な候補文字列を選択する文字認識方法。

【００２６】（１０）前記候補文字の列の中から単語辞
書に登録された単語と類似した単語を検索するあいまい
検索を行ない、あいまい検索により見つかった単語の中
で不一致となった文字とその確信度を候補文字に追加す
るステップを有する（９）の文字認識方法。

【００２７】（１１）前記最適候補列選択の際に用いる
前記評価値から処理の打ち切りを判断するするステップ
と、前記評価値が低い場合に候補文字数を増やすステッ
プとを有する（９）の文字認識方法。

【００２８】（１２）前記評価値は、複数の言語知識を
それぞれ適用して得られた評価値のうち高い方の言語知
識に基づいて得られる請求項９に記載の文字認識方法。

【００２９】（１３）上記（９）乃至（１２）のいずれ
かに記載されているステップ処理手順が格納されている
記憶媒体。

【００３０】

【発明の実施の形態】以下、図面を参照しながら本発明
による文字認識装置、方法及び記憶媒体の種々の実施形
態を図面を参照しながら説明する。

【００３１】先ず、本発明の概要を簡単に説明する。本
発明の第１の目的は、統計による言語知識と文字認識の
確信度とを併用することによって、多様な文章を認識対
象とする文字認識装置、方法及び記憶媒体を提案するこ
とである。

【００３２】すなわち、統計による言語知識は学習用文
書から自動的に生成するので、対象とする文章に応じた
言語知識を準備することは容易であり、複数の言語知識
を切り替えて使用することも可能である。そして、個別
文字認識から得られる確信度を併用することによって、
予め用意した言語知識では対応できない表現があって
も、後処理を行わない個別文字認識の精度と同等の精度
を保つことができる。

【００３３】また、本発明の第２の目的は、文字ｎ−ｇ
ｒａｍを補足する言語知識として生起確率付き単語辞書
を併用し、後処理の精度を向上させる文字認識装置、方
法及び記憶媒体を提案することである。

【００３４】すなわち、文字ｎ−ｇｒａｍだけでは、ｎ
を増やすと学習が困難になることと辞書用量が指数的に
増加することが問題となり、ｎを減らすとｎ文字より長
い表現を扱えないことが問題となる。これに対して、本
発明では、ｎの小さい文字ｎ−ｇｒａｍと単語辞書を併
用することによって上記問題を解決する。単語辞書中の
単語には生起確率を付与することによって確率を基にし
て両者の統合を行なう。

【００３５】本発明の第３の目的は、単語辞書を用いた
あいまい検索を行なうことにより、候補文字以外から正
解を探しだすことを可能とし、後処理の精度を向上させ
ることである。単語の一部が候補文字に入っていない場
合でも、あいまい検索によって検索を行なうことがで
き、その結果から候補文字の補完を行なう文字認識装
置、方法及び記憶媒体を提案することである。

【００３６】次に、図１に示すブロック図を参照する
と、本発明の第１の実施の形態においては、文字切り出
し候補生成手段１は文字列パタンを入力として図８に示
すような切り出し候補を出力する。この切り出し候補
は、切り出し位置１〜６に対して切り出し候補を図８に
示す如く、アーク１〜８と指定して得られる。個別文字
認識手段２は、上記切り出し候補を入力としてそれを文
字認識し、その文字認識結果を図９のような確信度付き
候補文字として出力する。文字ｎ−ｇｒａｍ確率計算手
段３は、上記候補文字列を入力としてそれに対する文字
ｎ−ｇｒａｍ確率を求める。単語生起確率計算手段４
は、上記候補文字の列を入力として、それが単語であっ
た場合にその生起確率を求める。

【００３７】最適候補選択手段５は、単語生起確率計算
手段４と個別文字認識手段２によって得られた候補文字
の確信度と、文字ｎ−ｇａｒｍ確率計算手段３、単語生
起確率計算手段４によって得られた候補文字列の確率と
を統合して最適な結果を得る。

【００３８】また、文字認識辞書６は、個別文字認識を
行なうための情報を保持し、文字ｎ−ｇｒａｍ確率辞書
７は学習用文書から統計的に求められた文字ｎ−ｇｒａ
ｍ確率を保持し、生起確率付き単語辞書８は単語の表記
と学習用文書中におけるその生起確率を保持し、候補文
字ラティスバッファ９は個別文字認識手段２によって得
られた確信度付き候補文字と文字ｎ−ｇｒａｍ確率計算
手段３または単語生起確率計算手段４によって得られた
候補文字列の確率とを切り出し位置に基づいたラティス
構造として格納している。

【００３９】更に、完全一致単語検索手段４１は候補文
字列を入力としてそれと完全に一致する単語を生起確率
付き単語辞書８から検索し、あいまい単語検索手段４２
は、候補文字列を入力としてそれと類似した単語を生起
確率付き単語辞書８から検索する。

【００４０】より具体的に説明すると、文字切り出し候
補生成手段１は、与えられた文字列パタンをその形状的
な特徴によって１文字ごとに分割し、切り出し候補とし
て出力する。切り出し候補の間には重なりがあってもよ
く、例えば、Ａという候補と、Ａに隣接するＢという候
補と、それらを合わせたＡＢという候補とを出力しても
よい。そのため、各切り出し候補は、例えば図８に示す
ように、文字列パタンの位置に対応したノード間をつな
ぐアークとしてラティス構造で表現される。

【００４１】個別文字認識手段２は、上記切り出し候補
に対応する文字パタンを文字認識辞書６によって文字認
識し、１つの切り出し候補に対して複数の候補文字と各
候補文字の確信度を出力する。この確信度は、各候補文
字の確からしさを表わす確率である。このようにして得
られた確信度付き候補文字は、例えば図９に示すよう
に、ラティス構造のアークに付与されて候補文字ラティ
スバッファ９に蓄積される。

【００４２】文字ｎ−ｇｒａｍ確率計算手段３は、候補
文字ラティスバッファ９からｎ文字の候補文字列を全て
生成し、それらの文字ｎ−ｇｒａｍ確率を文字ｎ−ｇｒ
ａｍ確率辞書７を参照して計算する。計算された文字ｎ
−ｇｒａｍ確率は、例えば図１１のように、候補文字ラ
ティスバッファ９に蓄積される。

【００４３】単語生起確率計算手段４は、完全一致単語
検索手段４１またはあいまい単語検索手段４２によって
検索された単語の生起確率を候補文字ラティスバッファ
９に蓄積する。

【００４４】完全一致単語検索手段４１は、候補文字ラ
ティスバッファ９から生成される候補文字列が生起確率
付き単語辞書８に存在するか検索する。

【００４５】あいまい単語検索手段４２は、完全一致単
語検索手段４１と同様に、候補文字ラティスバッファ９
から生成される候補文字列が生起確率付き単語辞書８に
存在するかどうかを検索するが、この検索には、一部の
文字が一致しなくても検索できたとみなすあいまい検索
を行なう。多くの不一致を許すと全く関係のない単語ま
で検索されてしまうため、単語長に応じて不一致文字数
の最大値が設定されている。あいまい検索によって検索
された単語内の不一致文字は、候補文字ラティスバッフ
ァ９には候補文字として存在していないので、その文字
に対する文字パタンと文字コードを個別文字認識手段２
に渡すことによって、図１３に示すように、上記文字パ
タンを前記文字コードとして認識するときの確信度を求
めてそれらを候補文字ラティスバッファ９に追加する。

【００４６】最適候補選択手段５は、候補文字ラティス
バッファ９に蓄積された候補文字の中から、個別文字認
識手段２によって与えられた個々の文字の確信度と、文
字ｎ−ｇｒａｍ確率計算手段３もしくは単語生起確率計
算手段４によって与えられた前後の文字を考慮した確率
とを統合して、全体として最適な文字列を認識結果とし
て出力する。

【００４７】文字ｎ−ｇｒａｍ確率辞書７は、ｎ文字の
表記とその文字ｎ−ｇｒａｍ確率とを組とした表形式で
格納されている。例えば、文字ｂｉｇｒａｍ確率辞書の
一部を示す図１０では、「パク０．０２２４」は、
「パ」という文字の後に「ク」という文字が出現する条
件付き確率Ｐ（ク｜パ）が０．０２２４であることを表
している。生起確率付き単語辞書８は、文字ｎ−ｇｒａ
ｍ確率辞書７と同様に、単語の表記とその生起確率とを
組とした表形式で格納されている。ここで格納される生
起確率は、文字ｎ−ｇｒａｍ確率辞書７との対応を取る
ために、単語の最初の文字は既に存在するとした場合の
条件付き確率である。例えば、生起確率付き単語辞書８
の一部を示す図１２では、「パタン０．００６８」は、
「パ」という文字の後に「タン」という文字列が出現す
る条件付き確率Ｐ（タン｜パ）が０．００６８であるこ
とを表している。

【００４８】次に、図１および図２を参照して本実施の
形態の動作について詳細に説明する。

【００４９】入力として与えられた文字列パタンは、文
字切り出し候補生成手段１によってその形状的な特徴に
基づき１文字ごとに分割され、切り出し候補として出力
される（図２のステップＳ１）。個々の切り出し候補に
対応する文字パタンは、個別文字認識手段２によって独
立に文字認識され、認識結果として得られた候補文字の
文字コードと確信度が、例えば、図９のように、候補文
字ラティスバッファ９に蓄積される（ステップＳ２）。

【００５０】次に、文字ｎ−ｇｒａｍ確率計算手段３に
よって、候補文字ラティスバッファ９中に存在するｎ文
字の候補文字列が全て生成され、それらの文字ｎ−ｇｒ
ａｍ確率が計算されて、例えば、図１０のように、候補
文字ラティスバッファ９に書き込まれる（ステップＳ
３）。次に、完全一致単語検索手段４１によって、候補
文字ラティスバッファ９中に存在する候補文字列全てが
生起確率付き単語辞書８によって検索され（ステップＳ
４）、見つかった単語とその生起確率は単語生起確率計
算手段４によって候補文字ラティスバッファ９に書き込
まれる（ステップＳ５）。

【００５１】続いて、あいまい単語検索手段４２によっ
て、候補文字ラティスバッファ９中に存在する候補文字
の列全てが生起確率付き単語辞書８によってあいまい検
索される（ステップＳ６）。このあいまい検索では、単
語長に応じて設定された不一致文字数の上限の範囲内
で、候補文字列と単語の文字に不一致があってもよい。
あいまい検索によって見つかった単語中の不一致となっ
た文字は、個別文字認識手段２によってその確信度が計
算されて、候補外文字として候補文字ラティスバッファ
９に書き加えられる（ステップＳ７）。そして、その生
起確率は、単語生起確率計算手段４によって、例えば、
図１２のように、候補文字ラティスバッファ９に書き込
まれる（ステップＳ８）。

【００５２】最後に、最適候補選択手段５によって、候
補文字ラティスバッファ９に蓄積された候補文字の中か
ら、個別文字認識手段２によって与えられた個々の文字
の確信度と、文字ｎ−ｇｒａｍ確率計算手段３もしくは
単語生起確率計算手段４によって与えられた前後の文字
を考慮した確率とを統合して、全体として最適となる候
補文字が選択され、文字列認識結果として出力される
（ステップＳ９）。

【００５３】次に、上述本発明の実施形態の作用効果に
ついて説明する。本実施の形態では、個別文字認識手段
２が出力する個別文字の確信度と、文字ｎ−ｇｒａｍ確
率計算手段３もしくは単語生起確率計算手段４が出力す
る文字の前後を考慮した文字列としての確率とを統合す
る最適候補選択手段５を備えているために、文字認識の
確信度と統計による言語知識とを併用することによって
多様な文章を認識対象とすることができる。すなわち、
統計による言語知識は学習用文書から自動的に生成する
ので、対象とする文章に応じた言語知識を準備すること
は容易であるだけでなく、個別文字認識から得られる確
信度を併用することによって、予め用意した言語知識で
は対応できない表現であっても、後処理を行わない個別
文字認識の精度と同等の精度を保つことができる。

【００５４】また、本実施の形態では、文字ｎ−ｇｒａ
ｍ確率辞書７だけでなく生起確率付き単語辞書８をも備
えているために、文字ｎ−ｇｒａｍの言語知識の不足を
補うことができる。文字ｎ−ｇｒａｍ確率辞書７と生起
確率付き単語辞書８は、両者とも文字列の生起確率を表
わすものであり、全く同じ尺度として扱うことができる
ので両者の統合は容易である。

【００５５】更に、本実施の形態では、あいまい単語検
索手段４２を備えているために、候補外文字をも言語知
識による後処理の対象としており、精度の向上が期待で
きる。

【００５６】次に、具体的な実施例を用いて本実施の形
態の動作を説明する。図８の上部に示すような「パタン
研」と書かれた文字列パタンが入力されたとする。文字
切り出し候補生成手段１は、形状的な特徴に基づいて図
８中にアーク１〜８として示したような切り出し候補を
生成する（図２のステップＳ１）。図８の例では、８個
の切り出し候補が生成される。

【００５７】次に、個別文字認識手段２は、個々の切り
出し候補に対応する文字パタンを文字認識する（ステッ
プＳ２）。文字認識の結果、図９のように、各切り出し
候補に対応する候補文字のコードと確信度がアークに付
与された。図９は、候補文字ラティスバッファ９を図示
したものであり、（左端切り出し位置、右端切り出し位
置、文字コード、確信度）の４つの組の表として蓄積さ
れている。例えば、アーク１では（０、１、１、０．８
２）、アーク２では（０、２、パ、０．４４）等のよう
に表現される。

【００５８】文字ｎ−ｇｒａｍ確率計算手段３は、図１
０に示すような文字ｂｉｇｒａｍ確率辞書を参照して、
図９に示すように候補文字ラティスバッファ９中の文字
列長２の全ての文字列の文字ｂｉｇｒａｍ確率を計算
し、それを候補文字ラティスバッファ９に蓄積する（ス
テップＳ３）。

【００５９】本実施例の場合、図１１に示すように、５
個の文字ｂｉｇｒａｍ確率が蓄積された。それ以外の候
補文字列は文字ｂｉｇｒａｍ確率辞書に存在しなかった
ために候補文字ラティスバッファ９には蓄積されていな
いが、後述する文字ｂｉｇｒａｍ確率による評価値を計
算する際には定数εの確率であるとする。これは、学習
用文書に現れなかった表現にも対処するためである。ε
としては、学習用文書の文字数をＬとすれば、ε＜１／
Ｌとするのが適当である。本実施例では、ε＝０．１／
Ｌとしたが、これに限るものではない。

【００６０】次に、全ての候補文字列から図１２に示す
ような単語辞書を参照して単語検索を行なう。本実施例
の場合、完全一致する単語は存在しなかった（ステップ
Ｓ４，Ｓ５）。続いて、あいまい単語検索手段４２によ
ってあいまい検索が行われ、「パタン」が検索された
（ステップＳ６）。本実施例では、あいまい単語検索手
段は、単語辞書中の３文字以上の単語に対して、長さが
同じで１文字の不一致があっても一致したとみなすもの
を用いた。「タ」は候補外文字であるので、個別文字認
識手段２によって確信度が計算され、図１３に示すよう
に候補文字ラティスバッファ９に追加された（ステップ
Ｓ７）。また、「パタン」の生起確率は０．００６８で
あるので、図１３に示すように「パタン０．００６８」
に対応するアークが追加された（ステップＳ８）。

【００６１】最後に、最適候補選択手段５が、図１１に
示された文字の確信度と文字ｂｉｇｒａｍ確率、図１３
に示された単語生起確率を統合して最適な候補文字の選
択を行なう。具体的には、候補文字ラティス中の先頭か
ら最後に至る全ての候補文字列のうち、以下の評価値Ｅ
が最大となる候補文字列を選択する。Ｅ＝（１−ω）Ｅｃ＋ωＥｂＥｃは候補文字列内の各文字の文字認識確信度による評
価値であり、Ｐ（Ｃｉ）を文字Ｃｉの確信度として、Ｅｃ＝Σｌｏｇ（Ｐ（Ｃｉ））によって定める。Ｅｂは言語知識による候補文字列の評
価値であり、文字ｂｉｇｒａｍ確率だけを使う場合に
は、Ｅｂ＝Σｌｏｇ（Ｐ（Ｃｉ｜Ｃｉ−１））によって定義される。

【００６２】もし候補文字列内に完全一致検索またはあ
いまい検索によって検索された単語が存在する場合に
は、それに対応する部分の文字ｂｉｇｒａｍ確率による
評価値は単語の生起確率から求めた評価値に置き換え
る。例えば、候補文字列が「パタン研」である場合、仮
に単語辞書に「パタン」がないとすれば、Ｅｂ＝ｌｏｇ（Ｐ（タ｜パ））＋ｌｏｇ（Ｐ（ン｜
タ））＋ｌｏｇ（Ｐ（研｜ン））となるが、本実施例では、
「パタン」は単語辞書にあるので、「パタン」に対応す
る上記ｌｏｇ（Ｐ（タ｜パ））＋ｌｏｇ（Ｐ（ン｜
タ））の部分がｌｏｇ（Ｐ（タン｜パ））に置き換わ
り、Ｅｂ＝ｌｏｇ（Ｐ（タン｜パ））＋ｌｏｇ（Ｐ（研｜
ン））となる。ωは文字認識による確信度と文字列としての生
起確率を統合する定数である。ω＝０の場合は、個別文
字認識の結果と一致し、ω＝１の場合は、文字認識の確
信度を用いない結果と一致する。ωは０．１〜０．５ぐ
らいが良い。本実施例では、ω＝０．２としたが、これ
に限るものではない。

【００６３】図１３では、「パタン研」という候補文字
列に対して、Ｅｃ＝ｌｏｇ（０．４４）＋ｌｏｇ（０．
０８）＋ｌｏｇ（０．７３）＋ｌｏｇ（０．４８）、Ｅ
ｂ＝ｌｏｇ（０．００６８）＋ｌｏｇ（０．０００２）
となり、これが最も評価値の高い候補文字列として選択
された。

【００６４】次に、本発明の第２の実施の形態について
図３を参照して詳細に説明する。

【００６５】図３を参照すると、本発明の第２の実施の
形態は、最適候補選択手段５が出力する候補文字列の評
価値を基に処理の打ち切りを判断する評価値判定手段５
１と、評価値判定手段５１の結果を基に候補文字数を増
やす候補文字数増加手段５２を有する点が、本発明の第
１の実施の形態とは異なる。

【００６６】評価値判定手段５１は、文字ｎ−ｇｒａｍ
確率計算と完全一致単語検索とあいまい単語検索のそれ
ぞれの処理の終了後に最適候補選択手段による評価値計
算を行なって、ある一定の値以上の評価値が得られれば
そこで処理を打ち切る。候補文字数増加手段５２は、あ
いまい単語検索をした後の最適候補文字列の評価値が一
定の値以下である場合には個別文字認識における候補文
字数を増やす。

【００６７】次に、本実施の形態の動作について図４〜
図７を参照して説明する。入力として与えられた文字列
パタンは、文字切り出し候補生成手段１によってその形
状的な特徴に基づき切り出し候補として出力され（図４
のステップＳ１１）、個別文字認識手段２によって文字
認識される（ステップＳ１２）。次に、文字ｎ−ｇｒａ
ｍ確率計算手段３によって、文字ｎ−ｇｒａｍ確率が計
算された後（ステップＳ１３）、最適候補選択手段５に
よって、最適な候補文字列とその評価値が計算される
（ステップＳ１４）。

【００６８】得られた評価値は、予め定められた定数Ｔ
と比較され、これを上回っている場合にはこの時点での
候補文字列が文字認識結果として出力される（図７のス
テップＳ４３）。評価値がＴより小さい場合、完全一致
単語検索手段４１によって、生起確率付き単語辞書８に
存在する単語が検索され（図５のステップＳ２１）、単
語が見つかった場合には、単語生起確率計算手段４によ
って単語の生起確率が候補文字ラティスバッファ９に蓄
積された後（ステップＳ２２）、最適候補選択手段５に
よって、最適な候補文字列とその評価値が計算される
（ステップＳ２３）。

【００６９】得られた評価値は、予め定められた定数Ｔ
と比較され、これを上回っている場合にはこの時点での
候補文字列が文字認識結果として出力される（ステップ
Ｓ２４）。評価値がＴより小さい場合、あいまい単語検
索手段４２によって、生起確率付き単語辞書８に存在す
る単語があいまい検索され（図６のステップＳ３１）、
単語が見つかった場合には不一致となっていた候補外文
字の確信度を文字認識手段２によって求め（ステップＳ
３２）、単語生起確率計算手段４によって単語の生起確
率が候補文字ラティスバッファ９に蓄積された後（ステ
ップＳ３３）、最適候補選択手段５によって、最適な候
補文字列とその評価値が計算される（ステップＳ３
４）。

【００７０】得られた評価値は、予め定められた定数Ｔ
と比較され、これを上回っている場合にはこの時点での
候補文字列が文字認識結果として出力される（ステップ
Ｓ３５）。評価値がＴより小さい場合、個別文字認識手
段２における１文字パタンあたりの候補文字数が定数Ｎ
よりも大きいかどうかを調べ（図７のステップＳ４
１）、大きくない場合は前記候補文字数を増やして（ス
テップＳ４２）、図４のステップＳ１２の個別文字認識
に戻る。候補文字数が定数Ｎよりも大きい場合は、この
時点での最適候補文字列が文字認識結果として出力され
る（ステップＳ４３）。

【００７１】次に、本実施の形態の作用効果について説
明する。本実施の形態では、文字ｎ−ｇｒａｍ確率計算
と完全一致単語検索とあいまい単語検索のそれぞれの処
理の終了後に最適候補選択手段による評価値計算を行な
ってある一定の値以上の評価値が得られればそこで処理
を打ち切るために、完全一致単語検索とあいまい単語検
索を必ず行なう場合よりも処理時間を短縮できる。更
に、本実施の形態では、あいまい単語検索をした後の最
適候補文字列の評価値が一定の値以下である場合には個
別文字認識における候補文字数を増やすために、個別文
字認識率が高い場合には高速に正解を得ることができ、
個別文字認識率が低い場合は低速にはなるが正解をより
広い範囲で探すという適応的な処理を行える。

【００７２】次に、本発明の第３の実施の形態について
図１４を参照して説明する。本実施の形態は、第１の文
字ｎ−ｇｒａｍ確率辞書７１と、第１の生起確率付き単
語辞書８１と、第２の文字ｎ−ｇｒａｍ確率辞書７２
と、第２の生起確率付き単語辞書８２と、最適辞書選択
手段５０を有する点が本発明の第１の実施の形態とは異
なる。

【００７３】第１の文字ｎ−ｇｒａｍ確率辞書７１と第
１の生起確率付き単語辞書８１は組をなしており、例え
ば、電子メール本文用、住所宛名用、論文用などと、分
野を限定した学習用文書から学習されたものである。そ
して、第２の文字ｎ−ｇｒａｍ確率辞書７２と第２の生
起確率付き単語辞書８２も組をなしており、第１の文字
ｎ−ｇｒａｍ確率辞書７１と第１の生起確率付き単語辞
書８１とは異なる分野の学習用文書から学習されたもの
である。最適辞書選択手段５０は、第１の文字ｎ−ｇｒ
ａｍ確率辞書７１と第１の生起確率付き単語辞書８１を
使用した場合に得られる最適候補文字列の評価値と、第
２の文字ｎ−ｇｒａｍ確率辞書７２と第２の生起確率付
き単語辞書８２を使用した場合に得られる最適候補文字
列の評価値とを比べて大きい方の結果を最終的な結果と
する。ここでは、文字ｎ−ｇｒａｍ確率辞書および生起
確率付き単語辞書が２組の場合を示したが、それ以上で
も同様である。

【００７４】次に、上述第３の実施の形態の作用効果に
ついて説明する。本実施の形態では、複数の連動した文
字ｎ−ｇｒａｍ確率辞書および生起確率付き単語辞書を
有するので、異なる分野ごとに辞書を用意することによ
り、その分野に適した処理が行える。どの辞書を利用す
るかは評価値を基に自動的に決定されるので使用者が指
定する必要はない。

【００７５】以上に詳述した実施形態の構成をまとめる
と次のようになる。本発明の第１の文字認識装置は、文
字認識の確信度と文字ｎ−ｇｒａｍ確率と単語の生起確
率を統合し、最適な候補を選択する。具体的には、個別
文字認識を行ない候補文字とその確信度を出力する個別
文字認識手段２と、候補文字列中から単語を検索しその
生起確率を計算する単語生起確率計算手段４と、あいま
い検索を行ない不一致となった文字を候補文字に追加す
るあいまい単語検索手段４２と、文字認識の確信度と文
字ｎ−ｇｒａｍ確率と単語の生起確率を統合して最適な
候補文字列を選択する最適候補選択手段５とを有する。

【００７６】本発明の第２の文字認識装置は、評価値に
よって単語検索を打ち切ったり、個別文字認識の候補文
字数を調整したりする。より具体的には、最適候補選択
手段が出力する評価値から処理の打ち切りを判断する評
価値判定手段５１と、評価値が低い場合に候補文字数を
増やす候補文字数増加手段５２を有する。

【００７７】本発明の第３の文字認識装置は、複数の言
語知識の中から対象とする文章に応じた言語知識を自動
的に選択する。より具体的には、複数の言語知識をそれ
ぞれ適用して得られた評価値のうち、高い方の言語知識
を選択する最適辞書選択手段５０を有する。

【００７８】個別文字認識手段２は、文字パタンを文字
認識辞書６によって文字認識し、複数の候補文字と各候
補文字の確信度を出力する。この確信度は、各候補文字
の確からしさを表わす確率である。最適候補選択手段５
は、個別文字認識手段２によって与えられた個々の文字
の確信度と、文字ｎ−ｇｒａｍ確率計算手段３もしくは
単語生起確率計算手段４によって与えられた前後の文字
を考慮した確率とを統合して、全体として最適な文字列
を認識結果として出力する。

【００７９】単語生起確率計算手段４は、完全一致単語
検索手段４１またはあいまい単語検索手段４２によって
検索された単語の生起確率を文字ｎ−ｇｒａｍ確率と同
等な尺度となるように計算する。

【００８０】あいまい単語検索手段４２は、一部の文字
が不一致であっても検索できたとするあいまい検索を行
ない、検索された単語の不一致となった文字の確信度を
個別文字認識手段２を用いて計算し、それを候補文字に
追加する。

【００８１】評価値判定手段５１は、最適候補選択手段
５が出力する評価値が十分に大きいかどうかを判断し、
その結果として単語検索処理を打ち切る。

【００８２】候補文字数増加手段５２は、最適候補選択
手段５１が出力する評価値が小さい場合に個別文字認識
における候補文字数を増やす。

【００８３】最適辞書選択手段５０は、複数の言語知識
をそれぞれ適用した場合の最適候補選択手段による評価
値を比較し、評価値が最も大きい言語知識を選択する。

【００８４】

【発明の効果】以上説明したように本発明による文字認
識装置は次のような顕著な効果を奏する。

【００８５】すなわち、本発明の第１の効果は、文字認
識の確信度と統計による言語知識とを併用することによ
って多様な文章を認識対象とすることができることであ
る。これは、個別文字認識から得られる確信度を併用す
ることによって、予め用意した言語知識では対応できな
い表現であっても、後処理を行わない個別文字認識の精
度と同等の精度を保つことができるからである。

【００８６】第２の効果は、生起確率付き単語辞書を利
用することによって文字ｎ−ｇｒａｍの言語知識の不足
を補えることである。その理由は、文字ｎ−ｇｒａｍ確
率辞書と生起確率付き単語辞書は、両者とも文字列の生
起確率を表わすものであり全く同じ尺度として扱うこと
ができるので両者の統合は容易だからである。

【００８７】第３の効果は、候補外文字を言語知識によ
る後処理の対象とできることである。これは、あいまい
単語検索手段によってあいまい検索を行ない、不一致と
なった候補外文字の確信度を個別文字認識手段を用いて
計算し直すからである。

【００８８】第４の効果は、単語検索の処理時間を省略
できることである。その理由は、単語検索の前に最適候
補選択手段による評価値計算を行ない、十分な値が得ら
れればその時点での最適候補を解とするからである。

【００８９】第５の効果は、個別文字認識率が高い場合
には高速に正解を得ることができ、個別文字認識率が低
い場合は低速にはなるが正解をより広い範囲で探すとい
う適応的な処理を行えることである。これは、最適候補
選択手段が出力する評価値が小さい場合には個別文字認
識における候補文字数を増やすからである。

【００９０】第６の効果は、異なる分野ごとに辞書を用
意することにより、その分野に適した処理が自動的に行
えることである。その理由は、複数の連動した文字ｎ−
ｇｒａｍ確率辞書および生起確率付き単語辞書を用意
し、最適候補選択手段によって最も評価値が高いものを
選択するからである。

【図面の簡単な説明】

【図１】本発明による文字認識装置の第１の実施の形態
を示すブロック図である。

【図２】図１に示す本発明の第１の実施の形態の動作を
示すフローチャートである。

【図３】本発明による文字認識装置の第２の実施の形態
を示すブロック図である。

【図４】図３に示す本発明の第２の実施の形態の動作を
示すフローチャートである。

【図５】図３に示す本発明の第２の実施の形態の動作を
示すフローチャートである。

【図６】図３に示す本発明の第２の実施の形態の動作を
示すフローチャートである。

【図７】図３に示す本発明の第２の実施の形態の動作を
示すフローチャートである。

【図８】文字切り出し候補の例をラティス構造で示す図
である。

【図９】確信度付き候補文字が蓄積された候補文字ラテ
ィスバッファの例を示す図である。

【図１０】文字ｂｉｇｒａｍ確率辞書の一部を示す図で
ある。

【図１１】文字ｂｉｇｒａｍ確率が蓄積された候補文字
ラティスバッファの例を示す図である。

【図１２】生起確率付き単語辞書の一部を示す図であ
る。

【図１３】あいまい検索された生起確率付き単語が蓄積
された候補文字ラティスバッファの例を示す図である。

【図１４】本発明による文字認識装置の第３の実施の形
態を示すブロック図である。

【図１５】従来の文字認識装置の構成ブロック図であ
る。

【符号の説明】

１文字切り出し候補生成手段２個別文字認識手段３文字ｎ−ｇｒａｍ確率計算手段４単語生起確率計算手段５最適候補選択手段６文字認識辞書７文字ｎ−ｇｒａｍ確率辞書８生起確率付き単語辞書９候補文字ラティスバッファ４１完全一致単語検索手段４２あいまい単語検索手段５０最適辞書選択手段５１評価値判定手段５２候補文字数増加手段７１第１の文字ｎ−ｇｒａｍ確率辞書７２第２の文字ｎ−ｇｒａｍ確率辞書８１第１の生起確率付き単語辞書８２第２の生起確率付き単語辞書１００文字候補生成手段１０１形態素解析手段１０２単語仮説生成手段１０３単語モデル１０４類似単語検索手段１０５類似語モデル１０６品詞付けモデル

フロントページの続き (56)参考文献特開平５−174195（ＪＰ，Ａ) 特開平９−282420（ＪＰ，Ａ) 特開平11−328317（ＪＰ，Ａ) 特開昭62−247480（ＪＰ，Ａ) 「情報処理学会論文誌」Ｖｏｌ．33 Ｎｏ．５ｐ．664−670（1992) 「電子情報処理学会論文誌」Ｖｏｌ. Ｊ76−Ｄ−２Ｎｏ．６ｐ．1090− 1096（1993) 「電子情報処理学会論文誌」Ｖｏｌ. Ｊ68−ＤＮｏ．１ｐ．64−71 （1985) 「情報処理学会全国大会講演論文集」Ｖｏｌ．56ｔｈＮｏ．２ｐ．113− 114（1998) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/72 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】個別文字認識を行ない候補文字と各候補文
字の確からしさを表わす確率である確信度を出力する個
別文字認識手段と、前記個別文字認識手段で出力された
候補文字の列に対して、ある文字が出現する確率をその
直前のｎ−１文字によって決定される事後確率として定
義される文字ｎ−ｇｒａｍ確率を計算する文字ｎ−ｇｒ
ａｍ確率計算手段と、前記個別文字認識手段で出力され
た候補文字の列の中から単語を検索しその生起確率を計
算する単語生起確率計算手段と、前記個別文字認識手段
で出力された文字認識の確信度と前記文字ｎ−ｇｒａｍ
確率計算手段で計算された文字ｎ−ｇｒａｍ確率と前記
単語生起確率計算手段で計算された単語の生起確率とを
統合して最適な候補文字列を選択する最適候補選択手段
とを備えて成ることを特徴とする文字認識装置。
【請求項２】前記個別文字認識手段で出力された候補文
字の列の中から単語辞書に登録された単語と類似した単
語を検索するあいまい検索を行ない、あいまい検索によ
り見つかった単語の中で不一致となった文字とその確信
度を候補文字に追加するあいまい単語検索手段を有する
請求項１に記載の文字認識装置。
【請求項３】前記最適候補選択手段が出力する最適候補
文字列の評価値から処理の打ち切りを判断する評価値判
定手段と、前記評価値が低い場合に前記個別文字認識手
段が出力するべき候補文字数を増やす候補文字数増加手
段と、を備える請求項１または２に記載の文字認識装
置。
【請求項４】前記文字ｎ−ｇｒａｍ確率計算手段が利用
する文字ｎ−ｇｒａｍ確率辞書と前記単語生起確率計算
手段が利用する生起確率付き単語辞書とを２つ１組とし
た複数組の辞書と、前記文字ｎ−ｇｒａｍ確率辞書と生
起確率付き単語辞書の組を使用して得られた最適候補文
字列の評価値のうち、最も評価値の高い組を選択する最
適辞書選択手段と、を有する請求項１、２または３に記
載の文字認識装置。
【請求項５】前記ｎは２または３である請求項１、２、
３または４に記載の文字認識装置。
【請求項６】与えられた文字列パタンをその形状的な特
徴によって１文字ごとに分割し、切り出し候補として出
力する文字切り出し候補生成手段と、前記切り出し候補
に対応する文字パタンを文字認識辞書によって文字認識
し、１つの切り出し候補に対して複数の候補文字と各候
補文字の確からしさを表わす確率である確信度を出力す
る個別文字認識手段と、候補文字列の文字ｎ−ｇｒａｍ
確率を求める文字ｎ−ｇｒａｍ確率計算手段と、前記候
補文字列が予め用意した生起確率付き単語辞書に存在す
るか検索する完全一致単語検索手段と、前記候補文字列
が前記生起確率付き単語辞書に存在するかどうかを検索
する際、一部の文字が一致しなくても検索できたとみな
すあいまい検索を行なうあいまい単語検索手段と、前記
完全一致単語検索手段または前記あいまい単語検索手段
によって検索された単語の生起確率を求める単語生起確
率計算手段と、前記得られた候補文字の中から、前記個
別文字認識手段によって与えられた個々の文字の確信度
と、前記文字ｎ−ｇｒａｍ確率計算手段もしくは前記単
語生起確率計算手段によって与えられた前後の文字を考
慮した確率とを統合して、全体として最適な文字列を認
識結果として出力する最適候補選択手段と、を備えて成
ることを特徴とする文字認識装置。
【請求項７】文字ｎ−ｇｒａｍ確率計算と完全一致単語
検索とあいまい単語検索のそれぞれの処理の終了後に最
適候補選択手段による評価値計算を行なって、ある一定
の値以上の評価値が得られればそこで処理を打ち切る評
価値判定手段と、あいまい単語検索をした後の最適候補
文字列の評価値が一定の値以下である場合には個別文字
認識における候補文字数を増やす候補文字数増加手段
と、を有する請求項６に記載の文字認識装置。
【請求項８】前記文字ｎ−ｇｒａｍ確率辞書は、異なる
分野の学習用文書から学習された辞書で構成され、各文
字ｎ−ｇｒａｍ確率辞書を使用した場合に得られる最適
候補文字列の評価値のうち最も大きい方の結果を最終的
な結果とする最適辞書選択手段を有する請求項６または
７に記載の文字認識装置。
【請求項９】個別文字認識を行ない候補文字とその確信
度を求めるステップと、前記候補文字の列に対して、あ
る文字が出現する確率をその直前のｎ−１文字によって
決定される事後確率として定義される文字ｎ−ｇｒａｍ
確率を求めるステップと、得られた候補文字の列中から
単語を検索し、その生起確率を求めるステップと、前記
文字認識の確信度と文字ｎ−ｇｒａｍ確率と単語の生起
確率を統合した認識基準から求めた評価値に基づいて最
適な候補文字列を選択することを特徴とする文字認識方
法。
【請求項１０】前記候補文字の列の中から単語辞書に登
録された単語と類似した単語を検索するあいまい検索を
行ない、あいまい検索により見つかった単語の中で不一
致となった文字とその確信度を候補文字に追加するステ
ップを有する請求項９に記載の文字認識方法。
【請求項１１】前記最適候補列選択の際に用いる前記評
価値から処理の打ち切りを判断するするステップと、前
記評価値が低い場合に候補文字数を増やすステップとを
有する請求項９に記載の文字認識方法。
【請求項１２】前記評価値は、複数の言語知識をそれぞ
れ適用して得られた評価値のうち高い方の言語知識に基
づいて得られる請求項９に記載の文字認識方法。
【請求項１３】請求項９乃至１２のいずれかに記載され
ているステップ処理手順が格納されている記憶媒体。