JPH10198759A

JPH10198759A - 文字認識装置及びその方法並びに記憶媒体

Info

Publication number: JPH10198759A
Application number: JP9013276A
Authority: JP
Inventors: 英司 ▲高▼須; Eiji Takasu
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1997-01-09
Filing date: 1997-01-09
Publication date: 1998-07-31

Abstract

(57)【要約】【課題】ユーザに入力された文字の認識率を向上さ
せ、ユーザの日常習慣に即した文字入力環境を提供する
ことができる文字認識装置及びその方法並びに記憶媒体
を提供する。【解決手段】ウインドウアプリケーション等の文字列
取得部２０４で取得された文字列は、文字列解析部２０
５で連続した文字の組合わせとして、その種類と個数と
をそれぞれカウントされる（図４）。このカウントされ
た文字の組合わせの種類と個数とは後処理辞書に反映さ
れ、その文字の組合わせの連鎖確率をカウント数に応じ
て変更される（ステップＳ９０３，ステップＳ９０５，
ステップＳ９０６）。最後に、この連鎖確率と認識演算
値との統合処理が為され、この統合処理のコストで最も
少ない経路の文字列を最終的な後処理結果とする（図
８）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文字認識装置及び
その方法に関し、特に、文字の認識精度の向上を目的と
した後処理を行う文字認識装置及びその方法並びに記憶
媒体に関する。

【０００２】

【従来の技術】従来の文字認識装置の中には、入力され
た未知文字パターンに対し、予め装置内に認識辞書とし
て用意されている標準パターンと比較して類似度の高い
標準パターンの文字コードを選定するパターンマッチン
グ部と、このパターンマッチング部から得られた認識候
補を用いて単語照合処理、文脈処理等を施して文字列と
して最も確からしい認識結果を出力する後処理部を具備
する装置がある。

【０００３】文脈処理を用いた後処理として、文字列に
おける個々の文字の連鎖確率を応用したN-gram統計処理
が挙げられる。N-gram統計処理は、ある文字列が与えら
れたときに後続する文字の連鎖確率を利用するものであ
り、特に、与えられた文字列が２文字から構成されてい
るときをBi-gram統計処理と、３文字から構成されてい
るときをTri-gram統計処理と呼ばれている。

【０００４】例えば、一般的にBi-gram統計処理をオン
ライン文字認識後処理に反映する場合は以下のようにな
る。

【０００５】ユーザが「願う」と入力した場合、まず、
パターンマッチング部にて「願」「う」の筆跡をマッチ
ング処理する。ここで「願」に対して「願」「顧」が、
「う」に対して「ラ」「う」が類似度順に認識候補とし
て出力されたとする。

【０００６】次に、それぞれの認識候補の組合わせを作
成する。ここでは、「願ラ」「願う」「顧ラ」「顧う」
の4つの組合わせ方が存在するが、この中でBi-gram統計
処理による連鎖確率が一番高い組合わせは「願う」とな
るので、最終的な認識結果を「願う」として出力する。

【０００７】このように後処理としてN-gram統計処理を
施す場合には、予め新聞記事などのサンプルテキストを
用いてN-gram統計を算出しておき、算出されたN-gram統
計から得られた文字の連鎖確率をN-gram辞書として認識
装置内にファイル等の形式で格納し、認識実行時に読み
出して使用する必要がある。

【０００８】

【発明が解決しようとする課題】しかしながら、上記の
ように作成されたN-gram辞書は、使用したサンプルテキ
ストに強く依存しており、連鎖確率を求めることができ
ない文字の組合わせも出ることがある。特に日本語の場
合には、JIS第一水準漢字でも３，０００文字を超える
文字種が存在し、単純に計算しても９，０００，０００
通りのBi-gram統計が必要であることから、新聞記事や
その他の言語ソースを用いたとしても、文字種すべての
組合わせに対して連鎖確率を導き出すことはほとんど不
可能である。

【０００９】よって、N-gram辞書には連鎖確率を求める
ことができない文字組合わせが存在し、認識候補の組合
わせでこの連鎖確率を求めることができない文字組合わ
せが存在する場合には、後処理の効果を得ることができ
ない。

【００１０】また、ユーザの作成する文章内容がある特
定の分野（例えば、医療分野）に偏っている場合は、一
般の言語ソース（例えば、新聞記事）を基に作成された
N-gram辞書を使用しても後処理による効果が期待できな
いという問題点がある。

【００１１】さらに、ユーザの入力する文字筆跡は千差
万別であり誤認識の傾向も異なるので、後処理による誤
認識改善の効果が均一的にならないという問題点があ
る。

【００１２】そこで、上記の問題点を解決するため、本
発明の目的は、ユーザに入力された文字の認識率を向上
させ、ユーザの日常習慣に即した文字入力環境を提供す
ることができる文字認識装置及びその方法並びに記憶媒
体を提供することである。

【００１３】

【課題を解決するための手段】上記目的を達成するため
に、請求項１の文字認識装置は、ユーザにより入力され
た文字を認識する文字認識装置において、少なくとも２
文字以上の文字を入力する文字入力手段と、前記文字入
力手段に入力された文字を文字として認識する認識手段
と、前記認識手段に認識された文字の中で連接した文字
の組合わせの種類及び個数を解析する文字解析手段と、
前記文字解析手段によって得られた解析結果を格納する
格納手段と、前記格納手段に格納された解析結果に基づ
いて認識の後処理を行う認識後処理手段とを備えること
を特徴とする。

【００１４】請求項２の文字認識装置は、請求項１記載
の文字認識装置において、前記文字入力手段により入力
された文字が、ウィンドウアプリケーションに入力され
ることを特徴とする。

【００１５】請求項３の文字認識装置は、請求項１又は
２記載の文字認識装置において、前記認識手段は、前記
文字入力手段により入力された文字に対し、認識候補を
１つ以上作成することを特徴とする。

【００１６】請求項４の文字認識装置は、請求項１乃至
３のいずれか１項記載の文字認識装置において、前記文
字解析手段はｎ文字（ｎは整数）から成る文字列から
（ｎ−１）個の文字列を作成し、重複する文字列には重
複数を対応づけることを特徴とする。

【００１７】請求項５の文字認識装置は、請求項１乃至
４のいずれか１項記載の文字認識装置において、前記文
字解析手段は、前記認識手段による認識結果が修正され
たことを検知して動作することを特徴とする。

【００１８】請求項６の文字認識装置は、請求項１乃至
５のいずれか１項記載の文字認識装置において、前記文
字解析手段は、前記入力された文字を修正した文字と前
記修正された文字の１文字前の文字との組合わせの種類
及び個数を解析することを特徴とする。

【００１９】請求項７の文字認識装置は、請求項１乃至
６のいずれか１項記載の文字認識装置において、前記認
識後処理手段が行う認識の後処理で文字の連鎖確率を使
用することを特徴とする。

【００２０】請求項８の文字認識装置は、請求項１乃至
７のいずれか１項記載の文字認識装置において、前記文
字入力手段が文字入力板であることを特徴とする。

【００２１】請求項９の文字認識装置は、請求項１乃至
８のいずれか１項記載の文字認識装置において、前記文
字認識装置はオンライン文字認識装置であることを特徴
とする。

【００２２】請求項１０の文字認識装置は、請求項１乃
至９のいずれか１項記載の文字認識装置において、前記
格納手段が後処理辞書を備えることを特徴とする。

【００２３】請求項１１の文字認識方法は、ユーザによ
り入力された文字を認識する文字認識方法において、少
なくとも２文字以上の文字を入力する文字入力工程と、
前記文字入力工程で入力された文字を文字として認識す
る認識工程と、前記認識工程で認識された文字の中で連
接した文字の組合わせの種類及び個数を解析する文字解
析工程と、前記文字解析工程によって得られた解析結果
を格納する格納工程と、前記格納工程で格納された解析
結果に基づいて認識の後処理を行う認識後処理工程とを
含むことを特徴とする。

【００２４】請求項１２の文字認識方法は、請求項１１
記載の文字認識方法において、前記文字入力工程で入力
された文字が、ウィンドウアプリケーションに入力され
ることを特徴とする。

【００２５】請求項１３の文字認識方法は、請求項１１
又は１２記載の文字認識方法において、前記認識工程
は、前記文字入力工程で入力された文字に対し、認識候
補を１つ以上作成することを特徴とする。

【００２６】請求項１４の文字認識方法は、請求項１１
乃至１３のいずれか１項記載の文字認識方法において、
前記文字解析工程によりｎ文字（ｎは整数）から成る文
字列から（ｎ−１）個の文字列を作成し、重複する文字
列には重複数を対応づけることを特徴とする。

【００２７】請求項１５の文字認識方法は、請求項１１
乃至１４のいずれか１項記載の文字認識方法において、
前記文字解析工程は、前記認識工程による認識結果が修
正されたことを検知して動作することを特徴とする。

【００２８】請求項１６の文字認識方法は、請求項１１
乃至１５のいずれか１項記載の文字認識方法において、
前記文字解析工程は、前記入力された文字を修正された
文字と前記修正された文字の１文字前の文字との組合わ
せの種類及び個数を解析することを特徴とする。

【００２９】請求項１７の文字認識方法は、請求項１１
乃至１６のいずれか１項記載の文字認識方法において、
前記認識後処理工程で行う認識の後処理において文字の
連鎖確率を使用することを特徴とする。

【００３０】請求項１８の文字認識方法は、請求項１１
乃至１７のいずれか１項記載の文字認識方法において、
前記文字認識方法はオンライン文字認識方法であること
を特徴とする。

【００３１】請求項１９の記憶媒体は、ユーザにより入
力された文字を認識する文字認識装置で使用されるプロ
グラムを記憶した記録媒体において、少なくとも２文字
以上の文字を入力する文字入力工程のモジュールと、前
記文字入力工程のモジュールに入力された文字を文字と
して認識する認識工程のモジュールと、前記認識工程の
モジュールに認識された文字の中で連接した文字の組合
わせの種類及び個数を解析する文字解析工程のモジュー
ルと、前記文字解析工程のモジュールによって得られた
解析結果を格納する格納工程のモジュールと、前記格納
工程のモジュールに格納された解析結果に基づいて認識
の後処理を行う認識後処理工程のモジュールとを記憶し
たことを特徴とする。

【００３２】

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。

【００３３】尚、以下の本発明の実施の形態の説明で
は、オンライン文字認識方式の文字認識装置を例にとっ
て説明するが、本発明はOCR装置においても適用可能で
ある。

【００３４】（第１の実施の形態）以下、図１を参照し
ながら、本発明の第１の実施の形態に係る文字認識装置
の構成を説明する。ここで、図１は本発明の第１の実施
の形態に係る文字認識装置の構成を説明するブロック図
である。

【００３５】まず、文字認識装置は、装置全体を制御す
るCPU１００を備えている。CPU１００はシステムバス１
０９に接続されている。システムバス１０９は、ROM１
０１と、RAM１０２と、座標入力部１０３と、表示コン
トローラ１０５と、DC（コントローラ）１０７とに接続
されている。

【００３６】座標入力部１０３は線画や文字を入力する
のに使用する入力ペン１０４に接続されており、表示コ
ントローラ１０５はCRT又は液晶で構成される表示器１
０６に接続されている。DC１０７はフロッピーディスク
やハードディスク等の外部メモリ１０８に接続されてい
る。

【００３７】次に、各構成部分の機能を詳述する。CPU
１００はROM１０１に記憶された制御プログラムやデー
タ等に従って装置全体を制御し、ROM１０１は後述する
フローチャートの制御プログラムを格納する。

【００３８】RAM１０２はCPUのワークエリアとして使用
されると共に、入力された文字ストロークデータ等を記
憶し、メモリバッファを備えている。座標入力部１０３
は線画や文字を入力できるデイジタイザであり、この座
標入力部１０３上で入力ペン１０４を用いて描かれた文
字パターンの座標データを入カデータとして装置内に入
力する。なお、座標入力部１０３は透明電極で構成され
ており、表示部１０６と重ね合わせた構成となってい
る。

【００３９】表示コントローラ１０５は表示部１０６を
制御し、表示部１０６はCRT又は液晶で線画や文字を表
示する。

【００４０】DC１０７はフロッピーディスクやハードデ
ィスクとのインタフェースを制御し、外部メモリ１０８
はフロッピーディスク、ハードディスク等である。

【００４１】また、CPU１００は入力ペン１０４で指示
された期間（ペンダウン状態の期間）内に連続して入力
された座標位置を検出し、表示部１０６はその検出され
た個々の座標を連結して線描画し、対応する表示部１０
６上のドットを表示する。これによって、本装置は、あ
たかもペンで紙に文字や図形を書くかの如く動作するよ
うになる。

【００４２】本文字認識装置は、CPU１００の制御によ
ってROM１０１に格納された制御プログラムをRAM１０２
に読み込み、この後文字認識等の処理を実行する。

【００４３】以上のような構成は、文字認識専用の装置
であっても、パーソナルコンピュータ等の汎用のコンピ
ュータ装置であっても同様に備えることができ、本実施
の形態はそのどちらによってもでも実現されうるもので
ある。

【００４４】以下、図２を参照しながら、本発明の第１
の実施の形態に係る文字認識装置の処理の流れを説明す
る。ここで、図２は本発明の第１の実施の形態に係る文
字認識装置の処理の流れを説明する概念図である。図２
中の矢印はデータの流れる方向を示しており、矢印元か
ら矢印先へ送られるデータの種類は各部によって異な
る。

【００４５】まず、文字認識装置の処理は計８つの部で
行われる。この８つの部とは、文字入力手段としての文
字入力部２００、認識手段としての認識部２０１、認識
後処理手段としての後処理部２０２、結果出力部２０
３、文字列取得部２０４、文字列解析手段としての文字
列解析部２０５、辞書作成部２０６、及び後処理辞書部
２０７である。これら８つの部はROM１０１に格納され
た制御プログラムであり、実行する際には格納手段とし
てのRAM１０２に読み込まれる。文字入力部２００は認
識部２０１及び後処理部２０２を介して結果出力部２０
３に接続されており、文字列取得部２０４は文字列解析
部２０５、辞書作成部２０６、及び後処理辞書部２０７
を介して後処理部２０２に接続されている。また、文字
取得部２０４は認識部２０１に接続されている。

【００４６】文字入力部２００は、座標入力部１０３と
入力ペン１０４とによりユーザの入力する筆跡を座標点
の集合として取り込み、メモリバッファ（不図示）に格
納する。

【００４７】認識部２０１は、認識辞書（不図示）内に
納められている文字の標準文字パターンと文字入力部２
００に入力された入力文字パターンとをパターンマッチ
ング処理する部分であり、標準文字パターンと入力文字
パターンとをユークリッド距離計算することによって、
比較演算し、類似順に認識候補を出力する。

【００４８】後処理部２０２は、認識部２０１より得ら
れた認識結果（即ち、認識候補文字コード、認識演算
値）を用いて認識候補順序の変更を行う部分である。本
実施の形態ではこの後処理部２０２の処理方法として、
文字列における文字の連鎖確率を適用するBi-gram統計
処理を採用する。

【００４９】結果出力部２０３は、後処理部２０２で確
定した第１位の認識候補の文字コードが表す文字フォン
トを表示する。なお、文字フォントの表示はユーザが筆
跡入力した文字枠に表示することが可能で、その際に
は、入力された文字筆跡を消去して再表示すればよい。
また、第１位の認識候補結果に限らず、下位の認識候補
結果を表示し、選択できる構成にしてもよい。

【００５０】文字列取得部２０４は、図３に示すウィン
ドウアプリケーションによってユーザとのインタフェー
スを実現する。このウィンドウアプリケーションの構築
は公知の技術を用いて実現でき、例えば、Windows for
Pens（以下WFPと略す）のAPI（Application Programmin
g Interface）を用いて構築することができる。

【００５１】図３中の３０１はユーザが入力ペン１０４
を用いて筆跡を入力できる筆跡入力エリアであり、一枠
に一文字を入力させるようにガイドし、また、認識部２
０１はこの一枠に書かれた筆跡を一文字と見なして認識
処理する。図３はユーザが「焚書坑儒」という文字を入
力ペン１０４で筆跡入力エリア３０１に入力し、認識部
２０１が認識した結果を後処理部２０２で処理し結果出
力部２０３で出力した時の様子を示している。

【００５２】なお、認識結果が誤っていた場合は、その
文字枠内をタップし、認識候補を出力させて候補を選択
するか、枠内に再度文字を上書きすることで目的の文字
に変換させることが可能となっている。ユーザは文字の
変換を終了し、３０２の学習ボタンをタップすると、筆
跡入力エリア３０１に表示されている文字列の文字コー
ドを文字列解析部２０５に送る。

【００５３】文字列解析部２０５では送られてきた文字
コードを用いて、連続した２文字の組合わせを抽出し、
その組合わせが複数文字列に存在していれば、その個数
をカウントする。

【００５４】この処理の流れを図４のフローチャートに
示す。

【００５５】まず、文字数を変数Ｎにセットし（ステッ
プＳ４００）、「文字組合わせテーブル」用の領域をRA
M１０２内に確保する（ステップＳ４０１）。この「文
字組合わせテーブル」は２文字の組合わせの文字コード
とその組合わせが複数文字列に存在する個数とを格納す
るエリアを備えている。

【００５６】次に、ループカウンタｉを初期化する、即
ちループカウンタｉに１をセットし（ステップＳ４０
２）、ｉ番目の文字とｉ＋１番目の文字との組合わせを
作成する（ステップＳ４０３）。

【００５７】次いで、ステップＳ４０４において変数Ｎ
にセットされた文字数がループカウンタｉの値より大き
いか否かを判別し、変数Ｎにセットされた文字数がルー
プカウンタｉの値より大きい場合には、ステップＳ４０
５に進む。

【００５８】ステップＳ４０５において「文字組合わせ
テーブル」にその文字の組合わせが存在するか否かを判
別し、「文字組合わせテーブル」にその文字の組合わせ
が存在しない場合には、新たにその文字列の追加と文字
列の個数を１として登録する（ステップＳ４０６）。ス
テップＳ４０５において「文字組合わせテーブル」にそ
の文字の組合わせが存在する存在する場合には、該当す
る文字列の個数欄の値を１増やす（ステップＳ４０
７）。

【００５９】ステップＳ４０６及びステップＳ４０７の
処理が終了するとループカウンタｉを１だけインクリメ
ントし（ステップＳ４０８）、再びステップＳ４０４に
戻り、変数Ｎにセットされた文字数がループカウンタｉ
の値より大きい場合には上記の処理を繰り返し、小さい
場合には本処理を終了する。この処理によって、例えば
筆跡入力エリア３０１の文字列による「文字組合わせテ
ーブル」は図５のようになる。

【００６０】ここで、本実施の形態で用いられるBi-gra
m後処理辞書の構造を図６に示す。このBi-gram後処理辞
書は、２文字からなる文字列の先頭文字コードを格納す
る先頭文字コード６０１と、後続する文字の種類数を格
納する後続文字種数６０２と、後続する文字の総数を格
納する後続文字総数６０３と、後続する文字のコードを
格納する後続文字コード６０４と、後続する文字のコー
ドの個数を格納する後続文字数６０５とを備えており、
後続文字コード６０４及び後続文字数６０５は複数個備
えてもよい。

【００６１】Bi-gram後処理辞書がこのように構成され
ていると、例えば、先頭文字コード６０１に後続する後
続文字コード６０４の文字コードの連鎖確率は、（後続
文字数６０５）／（後続文字総数６０３）の値で示され
ることになる。

【００６２】また、先頭文字コード６０１に、例えば、
「０００１−Ａ」という文字コードが入ると、この文字
コードに対応する文字に後続する全ての文字種について
の情報がBi-gram後処理辞書に登録される。その後、他
の文字コードについても同様の処理が為される。

【００６３】辞書作成部２０６では、文字列解析部２０
５で作成された「文字組合わせテーブル」を用いて、後
処理辞書部２０７内の後処理辞書を変更する。この処理
の流れを図７のフローチャートを用いて説明する。

【００６４】まず、文字列解析部２０５で作成された
「文字組合わせテーブル」の最初のレコードを読み込み
（ステップＳ７０１）、読み込みが終了するまで読み込
みを継続する（ステップＳ７０２）。

【００６５】ステップＳ７０２で読み込みを終了する
と、ステップＳ７０３において、レコード内の「先頭文
字」フィールドの文字コードが後処理辞書内の先頭文字
コード６０１に登録されているか否かを判別する。登録
されていれば、次のステップＳ７０４で、レコード内の
「後続文字」フィールドの文字コードが後処理辞書内の
先頭文字６０１に続く後続文字コード６０４として登録
されているか否かを判別する。登録されていれば、後処
理辞書内の後続文字数６０５に、注目しているレコード
の「個数」フィールドの値を加え（ステップＳ７０
５）、「文字組合わせテーブル」の次のレコードを読み
込むためにステップＳ７０１に戻る。

【００６６】なお、上記ステップ７０３において、レコ
ード内の「先頭文字」フィールドの文字コードが後処理
辞書内の先頭文字コード６０１に登録されていない場合
には、レコード内の「先頭文字」が後処理辞書に未登録
の文字列なので、先頭文字コード６０１、後続文字種数
６０２、後続文字総数６０３、後続文字コード６０４、
及び後続文字数６０５のそれぞれに「文字組合わせテー
ブル」のレコードの内容を新規に書き込む（ステップＳ
７０６）。その後、「文字組合わせテーブル」の次のレ
コードを読み込むためにステップＳ７０１に戻る。

【００６７】また、上記ステップＳ７０４において、レ
コード内の「後続文字」フィールドの文字コードが後処
理辞書内の先頭文字６０１に続く後続文字コード６０４
として登録されていない場合には、先頭文字は後処理辞
書に登録されているが、後続文字は登録されていないの
で、後続文字コード６０４と後続文字数６０５とに「文
字組合わせテーブル」のレコードの内容を新規に書き込
む（ステップＳ７０７）。その後、「文字組合わせテー
ブル」の次のレコードを読み込むためにステップＳ７０
１に戻る。

【００６８】次に、図８及び図９を参照しながら、後処
理部２０２の動作を説明する。

【００６９】まず、ユーザが「焚書坑儒」という文字を
記入したとする。０番目の文字を読点「。」とし、この
４つの文字をパターンマッチングして得られた認識候補
が図８である。文字No.１の第１位認識候補は「焚」、
第２位認識候補は「替」、第３位認識候補は「禁」であ
り、文字No.２の第１位認識候補は「害」、第２位認識
候補は「書」であり、文字No.３の第１位認識候補は
「坑」であり、文字No.４の第１位認識候補は「懐」、
第２位認識候補は「儒」、第３位認識候補は「麿」であ
る。文字No.０と文字No.１とに注目し、先頭文字
を「。」、後続文字を「焚」とし、図９のフローチャー
トに沿って処理を行う。

【００７０】最初に、ステップＳ９０１において、先頭
文字「。」に対応する先頭文字コードが後処理辞書に先
頭文字コード６０１として登録されているか否かを判別
する。登録されていれば、ステップＳ９０２において、
後続文字「焚」に対応する後続文字コードが後処理辞書
に先頭文字コード６０１として登録されているか否かを
判別する。登録されていれば、「。」の後続文字として
「焚」が記入される確率としての連鎖確率計算を行う
（ステップＳ９０３）。これは前述した図６の（後続文
字数６０５）／（後続文字総数６０３）によって計算す
ることができる。

【００７１】上記ステップＳ９０１において、先頭文字
「。」に対応する先頭文字コードが後処理辞書に先頭文
字コード６０１として登録されていない場合には、特殊
頻度計算を行う（ステップＳ９０６）。ここでは、後処
理辞書に登録されていない文字の連鎖確率を決定する。
例えば、予め連鎖確率で低く押さえた値を後処理辞書に
記憶しておけばよい。

【００７２】また、上記ステップＳ９０２において、後
続文字「焚」に対応する後続文字コードが後処理辞書に
先頭文字コード６０１として登録されていない場合に
は、特殊頻度計算を行う（ステップＳ９０５）。ここで
も、後処理辞書に登録されていない文字の連鎖確率を決
定する。例えば、予め連鎖確率で低く押さえた値を後処
理辞書に記憶しておけばよい。

【００７３】ステップＳ９０３、ステップＳ９０５、又
はステップＳ９０６で連鎖確率を決定すると、最後に連
鎖確率と認識演算値との統合処理を行う（ステップＳ９
０４）。ここで、認識演算値とは後処理辞書に登録され
ている文字とユーザに入力された文字との類似度を表す
値である。ステップＳ９０４の統合処理は、図８中に示
された式Ｃ_n＝Ｃ_n-1＋Ｗ・ｌｏｇ(Ｐ）＋ｄに基づいて
行われる。ここで、Ｃ_nはｎ番目の文字のコスト（コス
トとは、この式によって算出された結果をいう。）（Ｃ
₀＝０）、ｎはｎ番目の文字（ｎ≧１）、Ｗは重みづ
け、Ｐは連鎖確率、ｄは認識演算値である。

【００７４】以上の処理を他の認識候補に対しても同様
に行う。文字No.0と文字No.1とに関していえば、「。」
→「焚」の他に、「。」→「替」、「。」→「禁」を同
様に処理し、それぞれのコストを導き出す。導き出され
たそれぞれの組のコストは一時的にRAM１０２に保存し
ておく。

【００７５】次に文字No.１と文字No.２とについても同
様の処理を行う。最終的に求められた文字No.１と文字N
o.２との文字組合わせ（６通り）によるコストを前回の
文字No.０と文字No.１とからなる文字組合わせのそれぞ
れのコスト（Ｃ_n-1）に加える。すなわち、「。」→
「焚」→「害」、「。」→「焚」→「書」、「。」→
「替」→「害」、「。」→「替」→「書」、「。」→
「禁」→「書」、「。」→「禁」→「書」のそれぞれに
新たなコストが作成される。このようにして文字No.４
まで上記の処理を行い、終了した時点で、最もコストの
少ない経路を求める。求められた経路のそれぞれの文字
を最終的な後処理結果として結果出力部２０３に出力す
る。

【００７６】尚、図８の式はこれに限らず、公知のベイ
ズ式等を適用することも可能である。

【００７７】また、本実施の形態では、ユーザが学習さ
せたい文字列を座標入力部１０３及び入力ペン１０４を
使用して、ユーザが直接書く形式を採用しているが、座
標入力部１０３及び入力ペン１０４を使用せずに外部の
テキスト、又は文字を表した画像データ等を図３のよう
なウインドウアプリケーションに貼り付けることで文字
列を入力するようにしてもよい。

【００７８】上述したように、第１の実施の形態によれ
ば、ウインドウアプリケーション等の文字列取得部２０
４で取得された文字列は、文字列解析部２０５で連続し
た文字の組合わせとして、その種類と個数とをそれぞれ
カウントされる（図４）。このカウントされた文字の組
合わせの種類と個数とは後処理辞書に反映され、その文
字の組合わせの連鎖確率をカウント数に応じて変更され
る（ステップＳ９０３，ステップＳ９０５，ステップＳ
９０６）。最後に、この連鎖確率と認識演算値との統合
処理が為され、この統合処理のコストで最も少ない経路
の文字列を最終的な後処理結果とする（図８）。以上の
処理を行うことで、ユーザに入力された文字の認識率を
向上させ、ユーザの日常習慣に即した文字入力環境を提
供することができる。また、予め備えられているBi-gra
m後処理辞書を用いて後処理効果が得られない場合に
も、Bi-gram後処理辞書に文字列を簡単に追加すること
ができ、後処理効果を十分に発揮させることができる。
さらに、ユーザの入力する文書内容がある特定分野に偏
っている場合でも、ユーザがその特定分野の用語を学習
させることにより、後処理効果を十分に発揮させること
ができる。

【００７９】（第２の実施の形態）第１の実施の形態で
は図３に示すようなウィンドウアプリケーションを用い
て後処理辞書への変更を可能としたが、第２の実施の形
態では、ペンＯＳや文字認識装置等で多く見られる文字
入力板を使用して自動的に後処理辞書を変更する形態を
説明する。

【００８０】尚、第２の実施の形態に係る文字認識装置
の構成は第１の実施の形態に係る文字認識装置と同様で
あるが、座標入力部１０３は文字入力板を備えている。

【００８１】図１０は文字入力板を使用して後処理辞書
の変更を行う操作を説明する図である。

【００８２】まず、この文字入力板は文字認識装置内の
他のアプリケーションから文書データの呼び出しが可能
であり、ジェスチャ等によって起動する。また、この文
字入力板は、ユーザが入力ペン１０４を用いて認識させ
たい文字を記入するエリア１００１と、エリア１００１
に記入された文字列に対応する文字コードを起動元のア
プリケーションへ送るコマンドボタン１００２と、エリ
ア１００１に表示されている文字列を一括して消去する
コマンドボタン１００３と、ユーザが選択したエリア１
００１に表示されている文字列のかな漢字変換を行うか
な漢字変換ボタン１００４と、ユーザが選択したエリア
１００１に表示されている文字列の筆跡をユーザ辞書等
に登録する筆跡登録ボタン１００５と、後処理辞書に特
定の文字を登録する後処理辞書学習ボタン１００６とを
備えている。

【００８３】エリア１００１に記入された文字列の筆跡
が認識処理されると、その文字の第一位認識候補が記入
した場所に表示される。なお、その他の認識候補は枠内
のエリアをタップすることによって、ポップアップウィ
ンドウの形式で表示され、その中から目的の文字を選択
することによって候補が入れ替わるようになっている。
また、エリア１００１上では常時上書き可能であり、そ
の都度認識処理されて認識候補を表示する。このよう
に、一旦認識処理された後でも、候補選択や上書きによ
って、誤認識等の修正は可能となっている。

【００８４】尚、エリア１００１に記入された文字列の
筆跡は逐次認識処理されて認識結果を表示してもよく、
また、ユーザがすべての文字列の筆跡を記入し終わった
後に一括認識してもよい。また、認識処理とは後処理の
工程を含んでいてもよい。

【００８５】次に、図１１を参照しながら、後処理学習
ボタン１００６をタップしたときの処理を説明する。こ
こで、図１１は後処理学習ボタン１００６をタップした
ときの処理を説明するフローチャートである。

【００８６】まず、ステップＳ１１０１において、後処
理辞書学習ボタン１００６がユーザにタップされたか否
かを判断する。タップされたことを検知すると、ステッ
プＳ１１０２でエリア１００１に表示された文字列をユ
ーザが修正したか否かを判別する。この判別処理は、エ
リア１００１上の文字枠単位で認識した回数を記憶して
おき、同一文字枠で２回以上認識されたり（上書き
時）、候補の入れ替えが行われたことをチェックするこ
とで実行可能になる。

【００８７】ステップＳ１１０２でエリア１００１に表
示された文字列をユーザが修正した場合には、後処理辞
書に追加する学習文字列を決定する（ステップＳ１１０
３）。例えば、図１０の「ころらの」の「ろ」を「れ」
に修正したとすると、その前の文字枠に表示されている
文字コードと組合わせ、「これ」を学習文字列として決
定する。

【００８８】次に、「文字組合わせテーブル」を作成し
（ステップＳ１１０４）、さらに後処理辞書を変更する
（ステップＳ１１０５）。なお、「文字組合わせテーブ
ル」の作成及び後処理辞書の変更の処理は、第１の実施
の形態で説明されたものと同様である。

【００８９】上記ステップＳ１１０１において、後処理
辞書学習ボタン１００６がユーザにタップされていない
場合には、本処理は行わない。

【００９０】ステップＳ１１０２でエリア１００１に表
示された文字列をユーザが修正していない場合には、ス
テップＳ１１０３からステップＳ１１０５までの処理を
行わない。

【００９１】尚、ステップＳ１１０２で複数の文字に修
正作業が為されていると判別した場合は上記の処理を全
ての修正文字に対して行う。

【００９２】また、エリア１００１の左上隅の文字枠に
修正が加えられた場合の学習文字は「読点」＋「左上隅
文字」とする。

【００９３】上記説明では学習文字列を決定する際、修
正文字と修正文字の一文字前の文字との組合わせを行っ
たが、修正文字と修正文字の一文字後の文字との組合わ
せによっても学習の効果は期待できる。

【００９４】上述したように、第２の実施の形態によれ
ば、ステップＳ１１０２でエリア１００１に表示された
文字列をユーザが修正した場合には、後処理辞書に追加
する学習文字列を決定し（ステップＳ１１０３）、次
に、「文字組合わせテーブル」を作成し（ステップＳ１
１０４）、さらに後処理辞書を変更する（ステップＳ１
１０５）ので、ユーザが日頃から慣れている文字入力板
上で簡単な操作によって後処理辞書の学習を行うことが
できる。また、修正文字及びこの修正文字の一文字前の
文字を後処理辞書に登録するので、パターンマッチング
処理の弱点を補完することができる。

【００９５】第１の実施の形態及び第２の実施の形態で
はN−gram辞書としてBi-gram辞書を適用したが、Bi-gra
m辞書に限らずTri-gram辞書を適用する後処理方式にも
応用できる。

【００９６】また、第１の実施の形態及び第２の実施の
形態において、本発明は文字認識装置やパソコン等にプ
ログラムを供給することによって達成できる場合にも適
用できることはいうまでもない。この場合、本発明を達
成するためのソフトウエアによって表されるプログラム
を格納した記憶媒体を文字認識装置やパソコン等に読み
出すことによってその文字認識装置やパソコン等が本発
明の効果を享受することが可能となる。尚、これらの文
字認識装置やパソコン等に内部記憶装置又は外部記憶装
置を接続し、記憶媒体に記憶されたプログラムを読み出
す構成にすることができる。

【００９７】図１２は文字認識装置に用いられる記憶媒
体のメモリマップを示す説明図である。デイレクトリ情
報は各工程のモジュールが記憶された記憶場所を示して
いる。各工程のモジュールはそれぞれ以下の機能を有す
る。即ち、文字入力工程のモジュールは少なくとも２文
字以上の文字を入力し、認識工程のモジュールは文字入
力工程のモジュールに入力された文字を文字として認識
する。文字解析工程のモジュールは認識工程のモジュー
ルに認識された文字の中で連接した文字の組合わせの種
類及び個数を解析する。格納工程のモジュールは文字解
析工程のモジュールによって得られた解析結果を格納
し、認識後処理工程のモジュールは格納工程のモジュー
ルに格納された解析結果に基づいて認識の後処理を行
う。

【００９８】上記記憶媒体としては、フロッピーデイス
ク、ハードデイスク、光デイスク、光磁気デイスク、Ｃ
Ｄ−ＲＯＭ、ＣＤ−Ｒ、磁気テープ、不揮発性のメモリ
カード等がある。

【００９９】

【発明の効果】以上説明したように、請求項１の文字認
識装置によれば、ユーザに入力された文字を認識する文
字認識装置において、少なくとも２文字以上の文字を入
力する文字入力手段と、前記文字入力手段に入力された
文字を文字として認識する認識手段と、前記認識手段に
認識された文字の中で連接した文字の組合わせ種類及び
個数を解析する文字解析手段と、前記文字解析手段によ
って得られた解析結果を格納する格納手段と、前記格納
手段に格納された解析結果に基づいて認識の後処理を行
う認識後処理手段とを備えるので、ユーザに入力された
文字の認識率を向上させ、ユーザの日常習慣に即した文
字入力環境を提供することができる。

【０１００】請求項１０の文字認識方法によれば、ユー
ザに入力された文字を認識する文字認識方法において、
少なくとも２文字以上の文字を入力する文字入力工程
と、前記文字入力工程で入力された文字を文字として認
識する認識工程と、前記認識工程で認識された文字の中
で連接した文字の組合わせ種類及び個数を解析する文字
解析工程と、前記文字解析工程によって得られた解析結
果を格納する格納工程と、前記格納工程で格納された解
析結果に基づいて認識の後処理を行う認識後処理工程と
を含むので、ユーザに入力された文字の認識率を向上さ
せ、ユーザの日常習慣に即した文字入力環境を提供する
ことができる。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態に係る文字認識装置
の構成を説明するブロック図である。

【図２】本発明の第１の実施の形態に係る文字認識装置
の処理の流れを説明する概念図である。

【図３】ウィンドウアプリケーションの説明図である。

【図４】複数文字列に存在する連続した２文字の組合わ
せの個数をカウントする処理の流れを示したフローチャ
ートである。

【図５】筆跡入力エリア３０１の文字列による「文字組
合わせテーブル」の説明図である。

【図６】Bi-gram後処理辞書の構造の説明図である。

【図７】後処理辞書部２０７内の後処理辞書を変更する
処理の流れを示したフローチャートである。

【図８】後処理部２０２の動作の説明図である。

【図９】後処理部２０２の動作を説明するフローチャー
トである。

【図１０】文字入力板を使用して後処理辞書の変更を行
う操作を説明する図である。

【図１１】後処理学習ボタン１００６をタップしたとき
の処理を説明するフローチャートである。

【図１２】文字認識装置に用いられる記憶媒体のメモリ
マップを示す説明図である。

【符号の説明】

１００ CPU １０１ ROM １０２ RAM １０３座標入力部１０４入力ペン１０５表示コントローラ１０６表示器１０７ DC（コントローラ）１０８外部メモリ１０９システムバス

Claims

【特許請求の範囲】

【請求項１】ユーザにより入力された文字を認識する
文字認識装置において、少なくとも２文字以上の文字を
入力する文字入力手段と、前記文字入力手段に入力され
た文字を文字として認識する認識手段と、前記認識手段
に認識された文字の中で連接した文字の組合わせの種類
及び個数を解析する文字解析手段と、前記文字解析手段
によって得られた解析結果を格納する格納手段と、前記
格納手段に格納された解析結果に基づいて認識の後処理
を行う認識後処理手段とを備えることを特徴とする文字
認識装置。
【請求項２】前記文字入力手段により入力された文字
が、ウィンドウアプリケーションに入力されることを特
徴とする請求項１記載の文字認識装置。
【請求項３】前記認識手段は、前記文字入力手段によ
り入力された文字に対し、認識候補を１つ以上作成する
ことを特徴とする請求項１又は２記載の文字認識装置。
【請求項４】前記文字解析手段はｎ文字（ｎは整数）
から成る文字列から（ｎ−１）個の文字列を作成し、重
複する文字列には重複数を対応づけることを特徴とする
請求項１乃至３のいずれか１項記載の文字認識装置。
【請求項５】前記文字解析手段は、前記認識手段によ
る認識結果が修正されたことを検知して動作することを
特徴とする請求項１乃至４のいずれか１項記載の文字認
識装置。
【請求項６】前記文字解析手段は、前記入力された文
字を修正した文字と前記修正された文字の１文字前の文
字との組合わせの種類及び個数を解析することを特徴と
する請求項１乃至５のいずれか１項記載の文字認識装
置。
【請求項７】前記認識後処理手段が行う認識の後処理
で文字の連鎖確率を使用することを特徴とする請求項１
乃至６のいずれか１項記載の文字認識装置。
【請求項８】前記文字入力手段が文字入力板であるこ
とを特徴とする請求項１乃至７のいずれか１項記載の文
字認識装置。
【請求項９】前記文字認識装置はオンライン文字認識
装置であることを特徴とする請求項１乃至８のいずれか
１項記載の文字認識装置。
【請求項１０】前記格納手段が後処理辞書を備えるこ
とを特徴とする請求項１乃至９のいずれか１項記載の文
字認識装置。
【請求項１１】ユーザにより入力された文字を認識す
る文字認識方法において、少なくとも２文字以上の文字
を入力する文字入力工程と、前記文字入力工程で入力さ
れた文字を文字として認識する認識工程と、前記認識工
程で認識された文字の中で連接した文字の組合わせの種
類及び個数を解析する文字解析工程と、前記文字解析工
程によって得られた解析結果を格納する格納工程と、前
記格納工程で格納された解析結果に基づいて認識の後処
理を行う認識後処理工程とを含むことを特徴とする文字
認識方法。
【請求項１２】前記文字入力工程で入力された文字
が、ウィンドウアプリケーションに入力されることを特
徴とする請求項１１記載の文字認識方法。
【請求項１３】前記認識工程は、前記文字入力工程で
入力された文字に対し、認識候補を１つ以上作成するこ
とを特徴とする請求項１１又は１２記載の文字認識方
法。
【請求項１４】前記文字解析工程によりｎ文字（ｎは
整数）から成る文字列から（ｎ−１）個の文字列を作成
し、重複する文字列には重複数を対応づけることを特徴
とする請求項１１乃至１３のいずれか１項記載の文字認
識方法。
【請求項１５】前記文字解析工程は、前記認識工程に
よる認識結果が修正されたことを検知して動作すること
を特徴とする請求項１１乃至１４のいずれか１項記載の
文字認識方法。
【請求項１６】前記文字解析工程は、前記入力された
文字を修正された文字と前記修正された文字の１文字前
の文字との組合わせの種類及び個数を解析することを特
徴とする請求項１１乃至１５のいずれか１項記載の文字
認識方法。
【請求項１７】前記認識後処理工程で行う認識の後処
理において文字の連鎖確率を使用することを特徴とする
請求項１１乃至１６のいずれか１項記載の文字認識方
法。
【請求項１８】前記文字認識方法はオンライン文字認
識方法であることを特徴とする請求項１１乃至１７のい
ずれか１項記載の文字認識方法。
【請求項１９】ユーザにより入力された文字を認識す
る文字認識装置で使用されるプログラムを記憶した記録
媒体において、少なくとも２文字以上の文字を入力する
文字入力工程のモジュールと、前記文字入力工程のモジ
ュールに入力された文字を文字として認識する認識工程
のモジュールと、前記認識工程のモジュールに認識され
た文字の中で連接した文字の組合わせの種類及び個数を
解析する文字解析工程のモジュールと、前記文字解析工
程のモジュールによって得られた解析結果を格納する格
納工程のモジュールと、前記格納工程のモジュールに格
納された解析結果に基づいて認識の後処理を行う認識後
処理工程のモジュールとを記憶したことを特徴とする記
憶媒体。