JP3442548B2 - 文字認識方法および装置 - Google Patents

文字認識方法および装置

Info

Publication number
JP3442548B2
JP3442548B2 JP26023495A JP26023495A JP3442548B2 JP 3442548 B2 JP3442548 B2 JP 3442548B2 JP 26023495 A JP26023495 A JP 26023495A JP 26023495 A JP26023495 A JP 26023495A JP 3442548 B2 JP3442548 B2 JP 3442548B2
Authority
JP
Japan
Prior art keywords
character
recognition
type
data
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26023495A
Other languages
English (en)
Other versions
JPH09102012A (ja
Inventor
和彦 山下
典夫 中村
真一 松居
康浩 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP26023495A priority Critical patent/JP3442548B2/ja
Publication of JPH09102012A publication Critical patent/JPH09102012A/ja
Application granted granted Critical
Publication of JP3442548B2 publication Critical patent/JP3442548B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、手書きワープロやペン
式電子手帳などの手書き文字の認識、あるいは光学式文
字認識(OCR)などによってイメージデータ化された
文字の認識に用いられる文字認識方法および装置に関す
るものである。
【0002】
【従来の技術】文字認識とは、与えられた文字の筆跡あ
るいはイメージデータをコンピュータで扱える文字コー
ドに変換する技術であり、ペンとタブレットを用いてリ
アルタイムな点列データとして筆跡データを入力して文
字コードに変換するオンライン文字認識や、すでに筆記
あるいは印刷された文字をスキャナ等の光電変換装置に
より読み込んで文字コードに変換する光学式文字認識
(OCR)などがある。
【0003】このような文字認識装置を用いて一度に複
数の文字データを入力して認識させた場合に、例えば、
「2」と「Z」、「3」と「ろ」のように形状が類似し
た文字間で誤認識が発生することがある。これらは、正
しい文字種を指定してやることで期待する認識結果を得
られるものが多い。このような場合、従来の文字認識装
置では、誤った文字を指定すると共に正しい文字種を指
定して訂正を行なう方法(例えば特開平2−22208
5号公報、特開平7−65112号公報等)などがあっ
た。
【0004】図14は、この方法を採用した文字認識装
置100の構成図である。本図に示すように当該文字認
識装置100は、操作者が筆跡データやイメージデータ
など(これらを総称して、以下、単に「文字データ」と
称する。)を入力するための文字データ入力部101
と、文字データの各種入力パターンに対応する認識候補
文字が文字コードとして格納されている認識辞書102
と、上記入力された文字データに基づき認識辞書102
内を検索し特定の認識候補文字のコードを出力する文字
認識部103と、その文字コードを対応する文字に変換
して表示する認識結果表示部104と、その認識結果の
うち訂正したい文字がある場合に該当する正しい文字種
を指定する文字種指定部105と、当該訂正したい文字
を指定する訂正対象文字指定部106と、当該指定され
た訂正対象文字について、文字種指定部105において
指定された文字種に限定して認識辞書を再検索して訂正
する文字訂正部107とからなる。
【0005】図15は、文字認識装置100における訂
正の様子を説明するための図である。操作者が文字デー
タ入力部101に、例えば図15(a)に示すような文
字データを入力したとする。この文字データは、オンラ
イン文字認識の場合はペンとタブレット(図示せず)な
どで入力される筆跡データが、OCRの場合はスキャナ
(図示せず)により光学的に読み取られた文字のイメー
ジデータが入力される。
【0006】文字認識部103は、各文字データの入力
パターンに基づいて認識辞書102を検索し、当該認識
結果の文字コードを認識結果表示部104に出力し、認
識結果表示部104において当該文字コードに該当する
文字が表示される。今、認識結果表示部104の表示画
面110に図15(b)に示すような認識結果が表示さ
れたとする。本表示結果は、「3」が「ろ」と誤認識さ
れているので、操作者は、当該「ろ」を「3」に訂正す
るべく、図15(c)に示すように、文字種指定部10
5の「数字」を指定する。表示画面110は、その前面
に透明なタブレットなどの入力装置が設置されて、再認
識対象文字指定部106の入力画面ともなっており、操
作者は、次に、表示画面110上の「ろ」を再認識対象
文字として指定する。
【0007】文字訂正部107は、当該指定された
「ろ」について、指定された文字種に限定して認識辞書
を再検索して「3」を認識候補として得、再度認識結果
表示部104に出力して図15(d)に示すような再認
識結果を得る。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来の文字認識装置において、誤った認識結果を訂正した
い場合には、その該当する文字およびその文字種の双方
を別個に指定する必要があり、操作が煩雑であった。ま
た、文字種を表示画面上でメニュー指定する場合には、
当該画面上にメニュー領域を設けなければならず、電子
手帳などの画面の小さい装置では文字の入力や表示のた
めの領域がそれだけ小さくなってしまう。
【0009】本発明は、かかる現状に鑑みてなされたも
のであり、正しい文字種をわざわざ指定する必要がな
く、一回の指定操作のみで誤った文字を訂正することが
できる文字認識方法および装置を提供することを目的と
する。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明は、手書き、光電変換等で入力され
た文字データから文字を認識する方法であって、複数の
文字データの入力を受け付ける文字データ受付ステップ
と、文字データの入力パターンに対応する認識候補文字
がその文字種の情報と共に登録された認識辞書を検索
し、上記入力された文字データの各々について少なくと
も1個の認識候補文字からなる認識候補文字群を作成す
る認識候補文字群作成ステップと、上記各文字データに
ついて作成された認識候補文字群のうち所定のものを認
識結果として表示する認識結果表示ステップと、上記認
識結果中に誤認識の文字がある場合に、操作者からの当
該誤認識文字を含む複数の文字の指定を受け付けて再認
識対象文字群とする再認識対象文字受付ステップと、上
記再認識対象文字群の各文字について、上記認識候補文
字群を参照し、それらの文字種をもとに所定の基準で再
認識の際の文字種を特定する文字種特定ステップと、上
記再認識対象文字群の各文字について、上記特定された
文字種に限定して、上記認識候補文字群もしくは認識辞
書を検索して文字の再認識を行なう文字再認識ステップ
と、を含むことを特徴とする。
【0011】請求項2の発明は、請求項1の文字再認識
ステップが、再認識の結果においてさらに誤認識の文字
がある場合に、操作者の指示を受け付け、前記文字種特
定ステップにおいて文字種を特定するために用いられた
基準における次順位の文字種を新たな再認識のための文
字種とし、この文字種に限定して文字の再認識を行うこ
とを特徴とする。
【0012】請求項3の発明は、請求項1または2の認
識候補文字群作成ステップが、認識辞書を検索するに先
立ち、上記入力された複数の文字データから文字切り出
し手段によって認識対象となる1文字を切り出す文字切
り出し小ステップを有し、前記文字再認識ステップは、
上記特定された文字種に限定して文字の再認識を行なう
際に、再認識対象文字群のうち当該文字種に対応する認
識候補文字を有しない文字があれば、前記文字切り出し
手段に当該文字に対応する文字データについて再切り出
しを行うように指示する第1の再切り出し指示小ステッ
プと、当該再切り出しされた文字データについて上記特
定された文字種に限定して再認識を行う第1の文字再認
識小ステップと、を含むことを特徴とする。
【0013】請求項4の発明は、請求項3の再認識対象
文字受付ステップが、前記文字切り出し小ステップにお
いて、複数の文字データが誤って1文字として合成され
て切り出された場合に、操作者からの、当該合成されて
切り出された複数の文字データのうちの本来の1文字分
および他の正しく切り出された少なくとも1個の文字の
指定を受け付ける再認識対象文字受付小ステップを有
し、前記文字再認識ステップは、前記文字切り出し手段
に対し、上記合成されて切り出された複数の文字データ
を、上記本来の1文字分として指定された文字データと
残りの文字データとに分離して再切り出しを行うように
指示する第2の再切り出し指示小ステップと、当該再切
り出しされた各文字データについて上記特定された文字
種に限定して再認識を行う第2の文字再認識小ステップ
と、を含むことを特徴とする。
【0014】請求項5の発明は、手書き、光電変換等で
入力された文字データから文字を認識する装置であっ
て、複数の文字データの入力を受け付ける文字データ受
付手段と、文字データの入力パターンに対応する認識候
補文字がその文字種の情報と共に登録された認識辞書
と、前記認識辞書から、上記入力された各文字データに
ついて少なくとも1個の認識候補文字を検索して認識候
補文字群を作成し、そのうち所定のものを認識結果とし
て出力する文字認識手段と、上記認識結果として出力さ
れた文字を表示する認識結果表示手段と、上記認識結果
中に誤認識の文字がある場合に、操作者からの当該誤認
識文字を含む複数の文字の指定を受け付けて再認識対象
文字群とする再認識対象文字受付手段と、上記再認識対
象文字群の各文字について、上記認識候補文字群を参照
し、それらの文字種をもとに所定の基準で再認識の際の
文字種を再認識文字種として特定する文字種特定手段
と、上記再認識対象文字群の各文字について、上記再認
識文字種に限定して、上記認識候補文字群もしくは認識
辞書を検索して文字の再認識を行なう文字再認識手段
と、を含むことを特徴とする。
【0015】請求項6の発明は、請求項5において、文
字認識手段が、入力された文字データについて、前記認
識辞書から文字認識の確実性の高い順に認識候補文字を
検索して認識候補文字群を作成し、そのうち第1順位の
文字を認識結果として出力することを特徴とする。請求
項7の発明は、請求項6において、文字種特定手段が、
上記認識候補文字群を参照し、上記再認識対象文字群の
各文字について第1順位の認識候補文字の文字種のうち
一番多い文字種を再認識文字種として特定することを特
徴とする。
【0016】請求項8の発明は、請求項5において、文
字種特定手段が、上記認識候補文字群を参照し、当該認
識候補文字群において認識候補として挙げられていない
文字種を上記再認識対象文字群の各文字について加算
し、その合計が一番少ない文字種を、再認識文字種とし
て特定することを特徴とする。請求項9の発明は、請求
項6において、文字認識手段が、入力された各文字デー
タについて前記認識辞書から認識候補文字を検索する際
に、当該認識候補文字の認識の確実性を示す数値を確信
度として付与する確信度付与部を有し、前記文字種特定
手段は、上記認識候補文字群について、各文字種ごとに
確信度の合計値を求め、この合計値が一番高い文字種を
再認識文字種として特定することを特徴とする。
【0017】請求項10の発明は、請求項5において、
文字種特定手段が、上記再認識対象文字群の先頭もしく
は最後の文字の文字種を再認識文字種として特定するこ
とを特徴とする。請求項11の発明は、請求項5ないし
10において、文字再認識手段が、上記再認識文字種の
文字が、上記認識候補文字群に含まれる否かを判定
し、含まれておれば、当該文字種の認識候補文字を再認
識結果として出力し、含まれていなければ、文字種を当
該再認識文字種に限定して再度前記認識辞書を検索し、
その検索結果を再認識結果として出力することを特徴と
する。
【0018】請求項12の発明は、請求項5ないし9、
もしくは11において、文字再認識手段が、再認識結果
においてさらに訂正したい文字がある場合に、操作者の
指示を受け付け、前記文字種特定手段において再認識文
字種を特定するために用いられた基準における次順位の
文字種を新たな再認識文字種として特定し、これにより
文字の再認識を行うことを特徴とする。
【0019】請求項13の発明は、請求項ないし12
において、文字認識手段が、認識辞書を検索するに先立
って上記入力された複数の文字データから認識対象とな
る1文字を切り出す文字切り出し部を有すると共に、前
記文字再認識手段は、上記再認識文字種に限定して文字
の再認識を行なう際に、再認識対象文字群のうち当該文
字種に対応する認識候補文字を有しない文字があれば、
当該文字に対応する文字データについて再切り出しを行
うように前記文字切り出し部に指示を送る再切り出し指
示部を有し、この再切り出しされた文字データについて
上記再認識文字種に限定して再認識を行うことを特徴と
する。
【0020】請求項14の発明は、請求項13における
再認識対象文字受付手段が、前記文字切り出し部におい
て複数の文字データが誤って1文字として合成されて切
り出された場合に、操作者からの、当該合成されて切り
出された複数の文字データのうちの本来の1文字分およ
び他の正しく切り出された少なくとも1個の文字データ
の指定を受け付け、前記再切り出し指示部は、前記文字
切り出し部に対し、上記合成されて切り出された複数の
文字データを、上記本来の1文字分として指定された文
字データと残りの文字データとに分離して再切り出しを
行うように指示を送り、前記文字再認識手段は、この再
切り出しされた文字データについて上記再認識文字種に
限定して再認識を行うことを特徴とする。
【0021】
【作用】上述の構成により、請求項1の発明によれば、
文字データ受付ステップにおいて、複数の文字データの
入力を受け付け、認識候補文字群作成ステップにおい
て、文字データの入力パターンに対応する認識候補文字
がその文字種の情報と共に登録された認識辞書を検索し
て上記入力された文字データの各々について少なくとも
1個の認識候補文字からなる認識候補文字群を作成し、
認識結果表示ステップにおいて、上記各文字データにつ
いて作成された認識候補文字群のうち所定のものを認識
結果として表示し、再認識対象文字受付ステップにおい
て、上記認識結果中に誤認識の文字がある場合に、操作
者からの当該誤認識文字を含む複数の文字の指定を受け
付けて再認識対象文字群とし、文字種特定ステップにお
いて、上記再認識対象文字群の各文字について上記認識
候補文字群を参照し、それらの文字種をもとに所定の基
準で再認識の際の文字種を特定し、文字再認識ステップ
において、上記再認識対象文字群の各文字について上記
特定された文字種に限定して、上記認識候補文字群もし
くは認識辞書を検索して文字の再認識を行なう。
【0022】請求項2の発明によれば、再認識の結果に
おいてさらに誤認識の文字がある場合に、操作者の指示
を受け付け、文字種特定ステップにおいて文字種を特定
するために用いられた基準における次順位の文字種を新
たな再認識のための文字種として、この文字種に限定し
て文字の再認識を行う。請求項3の発明によれば、文字
再認識ステップにおいて、上記特定された文字種に限定
して文字の再認識を行なう際に、再認識対象文字群のう
ち当該文字種に対応する認識候補文字を有しない文字が
あれば、当該文字に対応する文字データについて再切り
出しをするように文字切り出し手段に指示をし、当該再
切り出しされた文字データについて上記特定された文字
種に限定して再認識を行う。
【0023】請求項4の発明によれば、複数の文字デー
タが誤って1文字として合成されて切り出された場合
に、再認識対象文字受付小ステップは、操作者からの、
当該合成されて切り出された複数の文字データのうちの
本来の1文字分および他の正しく切り出された少なくと
も1個の文字の指定を受け付け、文字再認識ステップ
は、文字切り出し手段に対し、上記合成されて切り出さ
れた複数の文字データを、上記本来の1文字分として指
定された文字データと残りの文字データとに分離して再
切り出しを行うように指示し、当該再切り出しされた文
字データについて上記特定された文字種に限定して再認
識を行う。
【0024】請求項5の発明は、請求項1の文字認識方
法を実施する文字認識装置であって、文字データ受付手
段により複数の文字データの入力を受け付け、文字認識
手段は、文字データの入力パターンに対応する認識候補
文字がその文字種の情報と共に登録されるた認識辞書か
ら、上記入力された各文字データについて少なくとも1
個の認識候補文字を検索して認識候補文字群を作成し、
そのうち所定のものを認識結果として出力し、認識結果
表示手段により当該認識結果を表示する。再認識対象文
字群作成手段は、上記認識結果中に誤認識の文字がある
場合に、操作者からの当該誤認識文字を含む複数の文字
の指定を受け付けて再認識対象文字群とし、文字種特定
手段は、上記再認識対象文字群の各文字について、上記
認識候補文字群を参照し、それらの文字種をもとに所定
の基準で再認識の際の文字種を再認識文字種として特定
する。文字再認識手段は、上記再認識対象文字群の各文
字について、上記再認識文字種に限定して、上記認識候
補文字群もしくは認識辞書を検索して文字の再認識を行
なう。
【0025】請求項6の発明によれば、文字認識手段
は、入力された文字データについて、前記認識辞書から
文字認識の確実性の高い順に認識候補文字を検索して認
識候補文字群を作成し、そのうち第1順位の文字を認識
結果として出力する。請求項7の発明によれば、文字種
特定手段は、上記認識候補文字群を参照し、上記再認識
対象文字群の各文字について第1順位の認識候補文字の
文字種のうち一番多い文字種を再認識文字種として特定
する。
【0026】請求項8の発明によれば、文字種特定手段
は、上記認識候補文字群を参照し、当該認識候補文字群
において認識候補として挙げられていない文字種を上記
再認識対象文字群の各文字について加算し、その合計が
一番少ない文字種を、再認識文字種として特定する。請
求項9の発明によれば、確信度付与部により、入力され
た各文字データについて前記認識辞書から認識候補文字
を検索する際に当該認識候補文字の認識の確実性を示す
数値を確信度として付与し、文字種特定手段は、上記認
識候補文字群について、各文字種ごとに確信度の合計値
を求め、この合計値が一番高い文字種を再認識文字種と
して特定する。
【0027】請求項10の発明によれば、文字種特定手
段は、上記再認識対象文字群の先頭もしくは最後の文字
の文字種を再認識文字種として特定する。請求項11の
発明によれば、文字再認識手段は、上記再認識文字種の
文字が、上記認識候補文字群に含まれる否かを判定
し、含まれておれば、当該文字種の認識候補文字を再認
識結果として出力し、含まれていなければ、文字種を当
該再認識文字種に限定して再度前記認識辞書を検索し、
その検索結果を再認識結果として出力する。
【0028】請求項12の発明によれば、文字再認識手
段は、再認識結果においてさらに訂正したい文字がある
場合に、操作者の指示を受け付け、前記文字種特定手段
において再認識文字種を特定するために用いられた基準
における次順位の文字種を新たな再認識文字種として特
定し、これにより文字の再認識を行う。請求項13の発
明によれば、文字切り出し部は、認識辞書を検索するに
先立ち、上記入力された複数の文字データから認識対象
となる1文字を切り出し、文字再認識手段は、上記再認
識文字種に限定して文字の再認識を行なう際に、再認識
対象文字群のうち当該文字種の認識候補文字を有しない
文字があれば、再切り出し指示部により当該対応する文
字データについて再切り出しをするように前記文字切り
出し部に指示し、この再切り出しされた文字データにつ
いて再認識文字種に限定して再認識を行う。
【0029】請求項14の発明によれば、再認識対象文
字受付手段は、前記文字切り出し部において、複数の文
字データが誤って1文字として合成されて切り出された
場合に、操作者からの、当該合成されて切り出された複
数の文字データのうちの本来の1文字分および他の正し
く切り出された少なくとも1個の文字データの指定を受
け付け、前記再切り出し指示部は、前記文字切り出し部
に対し、上記合成されて切り出された複数の文字データ
を上記本来の1文字分として指定された文字データと残
りの文字データとに分離して再切り出しを行うように指
示し、この再切り出しされた文字データについて再認識
文字種に限定して再認識を行う。
【0030】
【実施例】以下、本発明に係る文字認識装置を実施例に
基づいて説明する。 (第1実施例)図1は、本発明に係る文字認識装置の第
1実施例の構成図である。本実施例に係る文字認識装置
1は、CPUを主体とするメイン制御部2と、筆跡デー
タをオンラインで入力するタブレットや既に書かれた文
字を光学的に読み取るOCR等からなる文字データ入力
部3と、入力された複数の文字データから1文字ずつ切
り出す文字切り出し部4と、各種の文字データの入力パ
ターンに応じて対応する文字のコードが登録されている
認識辞書5と、文字切り出し部4で切り出された文字デ
ータについて認識辞書5から認識候補文字を検索する文
字検索部6と、当該検索された認識候補文字を入力され
た文字データごとに保存する認識候補文字記憶部7と、
メイン制御部2において上記認識候補文字のデータに基
づき所定の基準で決定された文字コードを認識結果とし
て文字に変換して表示する認識結果表示部8と、この認
識結果を見て、操作者が、訂正が必要と考えた場合にそ
の誤認識文字を含む複数の文字群を再認識対象文字群と
して指定する再認識対象文字指定部9と、この指定され
た文字群の各文字の認識候補文字から後述する所定の基
準で正しい文字種を特定する文字種特定部10と、この
特定された文字種に基づいて上記指定された再認識対象
文字群の文字について再認識を行う文字再検索部11と
からなる。
【0031】このように構成された文字認識装置1の動
作を、図2を参照して具体的に説明する。図2の各図
は、文字認識装置1の入出力画面を示すものであって、
操作者に便利なように文字データ入力部3の入力画面3
1のすぐ下に認識結果表示部8の出力画面81が設けら
れている。
【0032】入力画面31の前面には、タブレット等に
よって筆跡データの入力面が形成されており、操作者が
電子ペンなどで筆跡データを入力すると、その文字デー
タは文字切り出し部4に送られると共に、図2(a)に
示すように当該筆跡通りに入力画面31に表示される。
文字切り出し部4は、図2(b)の点線で示すように、
与えられた一連の文字データに対して認識対象となる1
文字の範囲を確定する。この操作は、「文字の切り出
し」と呼ばれる。
【0033】1文字ずつ切り出された文字データは、メ
イン制御部2を介して文字検索部6に送られ、文字検索
部6は、当該文字データの入力パターンに符合する入力
パターンを認識辞書5から検索して、当該入力パターン
に与えられた文字の文字コードを認識候補文字とし、そ
の認識の確実性の高いものから認識候補文字記憶部7に
出力し、保存させる。
【0034】なお、上述の文字データ入力部3における
文字データの入力方式や文字切り出し部4における文字
の切り出し、文字検索部6における検索のアルゴリズム
等については、OCRおよびオンライン文字認識に関す
る各種の文献にその詳細が開示されている公知の技術で
あり、説明を省略する。図4は、認識候補文字記憶部7
内に認識文字候補が記憶されている状態をテーブルで示
したものである。
【0035】本例では、最上列に示す各切り出された文
字データのそれぞれに対して、最大3個までの認識候補
文字が挙げられており、これらを以後、各文字データに
対する「認識候補文字群」と呼ぶことにする。各認識候
補文字の右下に付された数値は、入力された文字データ
に対する当該認識の確実性の度合いを示すものであって
(以後、この確実性の度合いを示す数値を「確信度」と
称する。)、値が100に近いほど入力された文字デー
タと認識辞書内の入力パターンとの差が小さいことを示
しており、確信度が大きいものほど認識候補順位が上位
に設定される。
【0036】メイン制御部2は、認識候補文字記憶部7
に保存された認識候補文字群のデータからそれぞれの入
力文字データに対し確信度の高いものを第1候補文字と
して指定し、その文字コードを認識結果として、認識結
果表示部8に送る。認識結果表示部8は、当該文字コー
ドに基づき対応する文字を図2(c)に示すように出力
画面81に表示する。
【0037】操作者は、当該認識結果が、期待した認識
結果であるか否かを判断するが、図2(c)の認識結果
によれば、「8320円」となるべきところが、「8ろ
2o円」となっており、「ろ→3」および「o→0」の
訂正が必要である。そこで、操作者は、当該訂正の対象
となる文字「ろ」、[o」と、訂正の指標となる正しい
文字種で表示されている文字を含む複数の文字を再認識
対象文字群として再認識対象文字指定部9から指定す
る。
【0038】ここで文字種とは、「漢字」、「ひらが
な」、「カタカナ」、「英字」、「数字」などの文字の
種類をいい、場合によっては、「=」、「+」などの
「記号」も含まれる。ここで指定する文字は必ず複数個
なければならず、それら全てが同じ文字種に訂正される
ように指定しなければならない。
【0039】出力画面81の前面には、タブレット等の
入力面が形成されており、再認識対象文字指定部9の入
力画面を兼ねている。操作者は訂正の対象となる文字
「ろ」および[o」を「数字」の文字種に訂正したいの
であるから、再認識対象文字群として、例えば「8」、
「ろ」、「2」、「o」を指定し、出力画面81のそれ
らの文字の下に電子ペンで下線を付加して再認識対象文
字群の指定を行う(図3(a))。
【0040】この再認識対象文字群の指定に関するデー
タは再認識対象文字指定部9からメイン制御部2に送ら
れ、メイン制御部2は、当該再認識対象文字群について
訂正されるべき正しい文字種を特定するように文字種特
定部10に指示を送る。文字種特定部10は、当該再認
識対象文字群の各文字についての文字認識候補群のデー
タを認識候補文字記憶部7から呼び出し、これらのデー
タに基づいて次に示す4つの基準のうちのいずれかの特
定基準により、訂正されるべき正しい文字種、すなわち
文字再認識の際に指標となる文字種(以下、「再認識文
字種」と称する。)を特定する。 (1) 特定基準1 本基準では、第1候補の多い文字種に着眼する。すなわ
ち、図4に示す再認識対象文字群の各文字について挙げ
られた認識候補文字群について第1候補の文字種を計数
し、一番多い文字種を再認識文字種とする。第1候補の
認識候補文字は確信度が高く、その文字種が多いほど再
認識文字種となる蓋然性が高いからである。
【0041】本例では、図5(a)に示すように、第1
候補の文字種として、「数字」が2個(「8」と
「2」)、「英字」が1個(「o」)、「かな」が1個
(「ろ」)となって「数字」が一番多いので、再認識文
字種は「数字」に特定される。 (2)特定基準2 本基準では、各文字種に対して認識不能な文字の数に着
眼する。すなわち、図4に示す再認識対象文字群の各文
字について挙げられた認識候補文字群を調べ、各文字種
に対して認識候補として挙げられていない文字(以下、
「認識不能文字」と称する。)を計数し、その数が一番
少ない文字種を再認識文字種とする。
【0042】本例では、「数字」の文字種の認識候補文
字は、体制対象文字の4文字全ての候補にあるので認識
不能文字は0個となる。また、「英字」は、1文字が候
補を持たないので認識不能文字は1個となる。同様に他
の文字種についても順に調べていくと、この結果は、図
5(b)に示すようになり、認識不能文字の一番少ない
文字種である「数字」を再認識文字種と特定する。
【0043】この特定基準は、認識不能文字について操
作者が再認識文字種として指定することはないだろうと
いう推定に基づく。 (3)特定基準3 本基準では、各文字種ごとの確信度の合計値に着眼す
る。すなわち、図4における4個の再認識対象文字につ
いて、それぞれの認識候補文字群の中にある文字種を調
べ、各文字種の確信度の合計を求め、その合計の一番高
い文字種を再認識文字種として特定する。1つの再認識
対象文字に同じ文字種の認識候補文字が複数個ある場合
はそのうち最も確信度の高い数字を用いて合計を求め
る。
【0044】例えば、「英字」の文字種の場合は、1文
字目の「g」の67、3文字目の「Z」の77、4文字
目の「o」の85を合計したものが確信度の合計とな
る。このようにして各文字種について確信度の合計を求
めた結果が図5(c)である。この結果、「数字」の確
信度合計が一番大きく、再認識文字種は、「数字」に特
定される。 (4)特定基準4 本基準では、再認識対象文字群の先頭の文字種に着眼す
る。
【0045】図4における再認識対象文字群の先頭の第
1候補文字、すなわち「8」の文字種が再認識文字種と
なり、ここでは「数字」となる(図5(d))。また、
場合によっては再認識対象文字群の最後の文字の文字種
を再認識文字種に特定するようにしてもよい。文字種特
定部10では、上述のいずれかの特定基準が予め設定さ
れており、その特定基準に基づいて再認識文字種を特定
し、文字再検索部11に知らせる。
【0046】文字再検索部11は、特定された再認識文
字種に限定して、再認識対象文字群として指定されてい
る文字全部について次の手順により再認識を行なう。ま
ず、第1段階として、認識候補文字記憶部7に記憶され
た当該再認識対象文字群の各文字の認識候補文字群を参
照して、「数字」の文字種の認識候補文字を検索し、あ
ればその文字コードを再認識結果と判定する。この場
合、もし同じ文字種の認識候補文字が同じ認識文字候補
群の中に2個以上存在すれば、そのうち候補順位の上位
の方を認識結果とする。
【0047】この第1段階の検索においては、すでに検
索された認識候補文字群から再検索するだけなのですぐ
に処理できる。第1段階の検索において、認識候補文字
群に再認識文字種の文字が挙げられていない再認識対象
文字があれば、次に、第2段階として、文字種を上記再
認識文字種に限定して認識辞書5内を再検索し、その検
索結果の文字を再認識結果として出力する。もし、一つ
の再認識対象文字に対して2個以上の認識候補文字が検
索された場合には、候補順位の上位の文字を再認識結果
として出力する。
【0048】この場合、文字再検索部11自らが、認識
辞書5内を検索するのではなく、文字検索部6に文字種
を「数字」に限定して再検索するように指示し、その検
索結果を出力するようにしてもよい。図4に示す例で
は、再認識対象文字群の全てにおいて「数字」の文字種
が各認識候補文字群に挙がっているので、第1段階の検
索のみで処理され、それぞれ当該文字種の認識結果の文
字に訂正されて、出力画面81に図3(b)のように表
示される。操作者は、再認識結果を確認して訂正なしと
判断すれば、次の文字データの入力に移る。
【0049】しかし、さらに訂正が必要と判断した場合
には、最初に特定された再認識文字種が適当でなかった
と判断して再度訂正を指示し、上述の文字種特定基準に
おける第2順位の文字種によって再々認識を行う(但
し、上記特定基準4においては一義的に文字種が特定さ
れるので、第2順位の文字種の概念はなく、ここでは除
かれる。)。
【0050】以下、本発明の特徴部分である文字再認識
の動作を再々認識までを含めて図6のフローチャートに
基づき説明する。なお、この動作説明では、再認識文字
種の特定を特定基準3(確信度の合計値の高い文字種)
で行う場合について述べる。今、入力画面31に図7
(a)の上段に示すような筆跡データを入力した結果、
文字検索部6で検索が行われ、メイン制御部2を介し
て、図7(a)の下段の出力画面81に示すような認識
結果が表示された場合を考える。
【0051】操作者は、「28」という結果を期待して
いたが、文字検索部6で検索された結果、認識候補文字
記憶部7に作成された認識候補文字群における候補順位
は、図7(d)に示すようになり、メイン制御部2で
は、入力された文字データの各文字についてそれぞれ第
1順位の認識候補文字を指定した結果、「2g」という
認識結果を得た。
【0052】そこで、操作者は、図7(a)に示すよう
に出力画面81の「2g」にアンダーラインを引いて再
認識対象文字群として指定する(ステップS1)。する
とメイン制御部2は、当該再認識対象文字群の情報と、
それらについて再認識文字種を特定すべき旨の指示を文
字種特定部10に送り、文字種特定部10は、当該指示
に基づき認識候補文字記憶部7から各再認識対象文字に
対応する認識候補文字群を呼び出し、図7(d)の情報
を得る(ステップS2)。
【0053】次に、文字種特定部10は、各文字種につ
いて確信度の合計値を求めるが、最初に、例えば「数
字」の文字種について、内部のカウンタ(図示せず)の
合計値をクリアして(ステップS3)、当該文字種の認
識候補文字を各再認識対象文字の第1順位の認識候補文
字から順に検索し(ステップS4)、見つかればその認
識候補文字の有する確信度を上記内部カウンタに加え
(ステップS6)、まだ検索していない再認識対象文字
がある場合にはステップS4に戻って次の再認識対象文
字について同じ動作を行う(ステップS7、S8)。
【0054】ステップS7において、「数字」の文字種
について、全ての再認識対象文字に関して確信度の合計
が終了したら、次にステップS8に移り、別の文字種、
例えば「英字」について上記ステップS3からステップ
S7までの動作を繰り返し、再びステップS8にきたと
き別の文字種について確信度の合計をなさしめる。も
し、特定の再認識対象文字について、同じ文字種の認識
候補文字が複数あっても、順位の上位の認識候補文字か
ら検索し、当該文字種の認識候補文字があればその確信
度を加算して、次の再認識対象文字について検索を開始
するので、下位の同じ文字種の認識候補文字の確信度は
加算されない。
【0055】このようにして、全ての文字種について上
記確信度の合計が終了すると、確信度の合計値の高い順
に文字種を並べて図7(e)のような結果を得(ステッ
プS8、S9)、文字種特定部10内部のメモリに記憶
すると共に、確信度合計の一番高い文字種である「英
字」を再認識文字種として特定し、その旨をメイン制御
部2に送る(ステップS10、S11)。
【0056】メイン制御部2は、当該再認識文字種に基
づき再認識するように文字再検索部11に指示を送り、
文字再検索部11は、まず、認識候補文字記憶部7を検
索して再認識対象文字の認識候補文字群の中に当該文字
種の認識候補文字が含まれているか否かを調べ、含まれ
ておればそれを再認識結果として出力し(ステップS1
2、S13,S14)、含まれていなければ、認識辞書
5のデータを文字種を再認識文字種(英字)に限定して
検索し、その検索結果を再認識結果として出力する(ス
テップS15)。この際、1個の再認識対象文字につい
て同じ文字種の認識候補文字が2つ以上検索された場合
には、候補順位の高い方を再認識結果とする。
【0057】これらの再認識の動作を各再認識対象文字
ごとに行い、全ての再認識対象文字について再認識を終
了するとその結果を認識結果表示部8に表示する(ステ
ップS16、S17)。図7(d)の例では、認識候補
文字群の中に「英字」の文字種「Z」、「g」があるの
で、これらが認識結果として出力され、図7(b)に示
すように「2g」が「Zg」と訂正されて表示されるこ
とになる。
【0058】しかしながら、これは操作者の期待する訂
正ではないので、操作者は、例えば「Zg」を再度、再
認識対象文字として再認識対象文字指定部9から指定す
ることにより、次の候補の文字種(ここでは次に確信度
の合計値の高い文字種)で訂正するように要求する(ス
テップS18、S19,S20)。すると、文字種特定
部10から次候補の文字種(ここでは「数字」)を再認
識文字種としてその旨をメイン制御部2に知らせ、メイ
ン制御部2はさらに文字再検索部11に当該情報を送っ
て再検索するように指示し、文字再検索部11では、文
字種を「数字」に限定してしてステップS11からステ
ップS17までの再認識動作を繰り返す。
【0059】その結果、「28」という訂正が行われ、
図7(c)に示すような再認識結果が出力画面81に表
示される。これは、操作者の期待する結果であるので、
当該入力された文字データについての文字認識動作を終
了する(ステップS18)。しかし、全ての文字種につ
いて再認識動作を行っても、期待する結果を得られなか
った場合には、当該文字データに対する文字認識を断念
して終了し、文字データを入力し直して最初から文字認
識させることになる(ステップS19)。
【0060】このように最初は操作者の期待する文字種
でない訂正が行なわれた場合でも、操作者の簡単な再操
作により期待する文字種での訂正を導くことができる。
以上述べたように複数の文字を一度に認識させて、その
認識結果に誤りが見つかった場合には、当該誤認識文字
をその文字が訂正されるべき正しい文字種の文字と共に
複数指定するだけで、明示的に文字種を指定することな
く期待する文字種の認識結果を得ることができる。
【0061】なお、本実施例では、再認識対象文字群の
指定を、出力画面81の認識結果文字にアンダーライン
を引くことによって行なっているが、それ以外の方法で
指定を行なうことも可能である。例えば、図8(a)に
示すように、2つの文字の線で結んで再認識対象文字を
指定することができる。この指定方法の場合は、同時に
2つの文字しか指定できないので、上述のように「8ろ
2o」を一度に修正することはできないが、訂正すべき
文字が1文字の場合には、上述の特定基準4の先頭の文
字種での再認識文字種特定方法と組み合わせることで、
訂正を確実かつ容易に行なうことができる。
【0062】また、図8(b)に示すように、訂正すべ
き文字を1文字ずつ順に電子ペンなどで指定するように
することもできる。この指定方法は、直接訂正したい文
字の付近に再認識文字種で表示された文字がない場合に
便利である。また、特定基準4の先頭の文字種での再認
識文字種特定方法と組合せれば、「2」を飛ばして、
「8ろo」の指定のみで「830」という訂正を行なう
ことができる。
【0063】図8(c)は、再認識対象とする文字を線
で囲んで指定する方法を示す。この指定方法の場合、指
定しようとしている認識結果文字の表示が横に並んでい
る場合は、アンダーラインと同様の効果しかないが、認
識結果の文字が出力画面81に、例えば2段で表示され
るような場合には、図8(d)のように上下段にわたっ
て訂正したい同じ文字種の文字と共に指定できるという
利点がある。
【0064】また、図9(a)に示すように、訂正すべ
き文字以外を線で囲んで指定する方法も可能である。こ
の例では、囲まれた文字以外を全て漢字に訂正すること
になる。入力文字の一部だけが他の文字と違う文字種の
場合に有効な指定方法となる。また、横書きの場合はア
ンダーラインであったが、縦書きの場合は傍線によって
指定するようにしてもよい。
【0065】以上の例では、出力画面81が再認識対象
文字指定部9の入力画面を兼ねていたので、認識結果文
字に対して再認識対象文字の指定を行うようにしたが、
文字データ入力画面31を再認識対象文字指定部9の入
力画面と兼用させれば、図9(b)に示すように、当該
入力画面31に表示された文字データそのものに対して
再認識対象文字の指定を行うこともできる。 (第2実施例)第1実施例においては、文字切り出し部
4において入力された文字データの切り出しが正しく行
われた場合を前提にして文字認識を行っていたが、実際
には切り出しそのものが正しくない場合も起こり得る。
【0066】本実施例は、切り出しが正しく行なわれな
かった場合でも正しく認識結果を導くことができるよう
に第1実施例を改良した点に特徴がある。図10は、本
実施例の文字認識装置20の構成図である。図1の第1
実施例と異なる点は、文字切り出し部4に再切り出しの
指示を送るための文字再切り出し指示部12を設けた点
である。その他の構成は、第1実施例と同じなので、本
実施例における特徴的な部分のみ以下説明する。
【0067】今、図11(a)上段のような文字データ
を文字データ入力部3から入力した場合について考え
る。この入力データに対して文字切り出し部4は、点線
で示すように、「け」に相当する文字データを二分して
切り出してしまったため、文字検索部6による検索の結
果、認識候補文字記憶部7に保存された認識候補文字群
は、図11(a)下段のようになる。
【0068】上述のようにメイン制御部2は、この認識
候補文字群のうち第1順位の認識候補文字を認識結果と
して出力するから認識結果表示部8により表示される文
字は順に「1」、「+」、「し」、「ご」、「む」とな
る。ここで、操作者の期待している認識結果は「けしご
む」である。操作者は、「1」と「+」を再切り出しし
て1文字として認識させ、文字種を「かな」として認識
させたいので、「かな」の文字種の文字、例えば
「し」、「ご」と一緒に再認識対象文字群として指定す
る。
【0069】この場合、再認識対象文字指定部9の入力
画面は、文字データ入力部3の入力画面と兼用されてい
るものとすると、図11(b)に示すように、例えば当
該対象文字を線で囲むようにして指定する。この指定さ
れた訂正対処文字群について、文字種特定部10は、当
該訂正対象の文字について認識候補文字群(図11
(c)参照)を参照し、所定の基準、例えば上述の特定
基準3の確信度の合計値の一番高い文字種を特定する方
法によって再認識文字種を特定する。この場合には、図
11(c)に示すように「かな」の文字種の確信度の合
計が一番高いので再認識文字種は「かな」に特定され
る。
【0070】文字再検索部11は、「し」と「ご」につ
いては、最初の認識結果の中に「かな」の候補を持つの
で、そのまま「し」、「ご」を認識結果とする。しか
し、「1」と「+」については「かな」の候補を持たな
いため、メイン制御部2を介して、文字再切り出し指示
部12にその旨を知らせる。文字切り出し指示部12
は、文字切り出し部4に、上記認識ができなかった文字
データについて再度切り出しを行うように指示を出し、
文字切り出し部4は、「1」と「+」と判定された文字
データについて再度切り出しを行い、図11(d)に示
すように1文字と認識し直して、その文字データを文字
再検索部11に送る。
【0071】文字再検索部11は、当該文字データに基
づき文字種を「かな」に限定して認識辞書5を検索し、
認識結果として「け」を得る。これは、操作者の期待し
た結果であるので、次の文字データの入力に移る。な
お、上述の例では、1文字が過って2文字に分割されて
切り出された例について文字データを合成して切り出す
場合を示したが、反対に「13」等の2文字(あるいは
それ以上の文字)が、「B」等の1文字として認識され
て切り出され、これを分割する場合にも同様に適用でき
る。
【0072】なお、このように切り出した前後の部品を
組替えて文字の再切り出しを行なう方法については、従
来の各種文字認識技術(「村瀬 他:”候補文字ラティ
ス法による枠無し筆記文字列のオンライン認識”,電子
通信学会論文誌,’85/4Vol.J68−D N
o.4(1985)」等)で開示されている公知の技術
であるため、ここではその詳細な説明は省略する。
【0073】また、本実施例では、文字再検索部11で
再認識対象文字群の認識候補文字を検索して、再認識文
字種に対応する候補文字がない場合に、直ちに再切り出
しを行うように設定しているが、この際に、文字再切り
出し指示部12は、文字切り出し部4による当初の切り
出し状況を調べて、1文字の切り出し幅が狭過ぎる(も
しくは広過ぎる)場合に、文字切り出し部4に再切り出
しの指示を送り、それ以外の場合には、認識辞書5を検
索するか、あるいは次の候補の再認識文字種について再
度検索するように文字再検索部11に指示を送るように
してもよい。
【0074】また、上例では、再認識対象文字の指定
を、文字データ入力部3の入力画面における筆跡データ
あるいはイメージデータに対して行なっているが、第1
の実施例同様に認識結果の文字群に対して指定するよう
にしてもよい。なお、切り出しが正しく行なわれなかっ
たときに、再切り出しにより文字を分割する場合には、
上述のように再切り出しの必要のある文字全部を再認識
対象文字として指定するほか、当該再認識対象文字の指
定時に当該文字データの分割位置を明示的に指定する方
法も有効である。
【0075】例えば、操作者が、図12の中段に示すよ
うな2段の数式を文字データとして入力し、文字切り出
し部4が「1」と「+」を1文字として過って切り出
し、その結果「け」と認識された場合を考える。操作者
は、「け」を「1」と「+」に分割して認識して欲しか
ったのであるから、例えば、図13(a)に示すように
文字データの入力画面に、本来の1文字分の「+」とこ
の「+」の文字種である「記号」と同じ文字種の「/」
を線でまとめて囲んで、再認識対象文字の指定を行う。
このデータが再認識対象文字指定部9からメイン制御部
2に送られ、さらに文字種特定部10に送られる。
【0076】文字種特定部10は、当該再認識対象文字
の認識候補文字群を参照して再認識文字種を特定する
が、そもそも「+」の文字データに対応する認識候補文
字群は、作成されていないので、「/」の文字データに
与えられた認識候補文字群(図12)から、各文字種に
ついての確信度を読み出し(図13(b))、確信度の
一番高い「記号」を再認識文字種として特定する。
【0077】一方、再認識対象文字指定部9からの指定
は、メイン制御部2を介して文字再切り出し指示部12
にも送られ、文字再切り出し指示部12は、指示された
「け」に対応する文字データについて、指定された部分
で切り出して分割するように文字切り出し部4に指示を
送る。その結果、図13(c)上段に示すような切り出
しがなされ、この文字データがメイン制御部2を介して
文字再検索部11に送られる。文字再検索部11は、当
該再切り出しされた文字データに基づいて認識辞書5を
検索し、図13(c)下段に示すような認識候補文字群
を得る。メイン制御部2は、それらの認識候補文字群か
らそれぞれ第1候補の「1」、「+」を認識結果として
出力する。
【0078】また、「/」については、これは「記号」
の文字種なので、そのまま「/」を認識結果として出力
する。このように、再認識対象文字の指定の際に明示的
に分割位置(本来の1文字分)を示してやることで、再
切り出し操作を容易にでき、正しい認識結果をより簡単
かつ的確に得ることができる。
【0079】なお、上述の例では、文字データ入力部3
の入力画面31が、入力文字データに直接、分割位置の
指定を含む再認識対象文字の指定を行うようにしている
が、認識結果表示部8の出力画面81が再認識対象文字
指定部9の入力画面を兼ねている場合にも同様な再認識
対象文字の入力操作が可能である(出力画面81に表示
された「け」の文字の右半分と「/」を線で囲むように
すればよい。)。
【0080】以上、本発明を実施例に基づいて説明して
きたが、本発明の内容は上述の実施例に限定されるもの
ではない。例えば、上述の実施例では、再認識対象文字
群の指定に基づき、文字種特定部において上記特定基準
1ないし4に基づいて再認識文字種を特定し、当該再認
識文字種に基づいて再認識した結果、さらに訂正を要す
る場合には、それぞれの基準における次順位の文字種に
より再認識するようにしたが、場合によっては、他の基
準に切り替えて文字種を再特定し、これに基づいて再認
識するようにしてもよい。
【0081】また、第1実施例において、文字切り出し
部4を備えているが(図1)、筆跡データを入力する場
合において、1文字の入力する場所が予め枠などで区切
られている場合などにおいては、この文字切り出し部4
は省略できる。また、第2実施例において再認識対象文
字の指定の際に、指定方法を変えることにより、再認識
の態様を変化させるようにしてもよい。例えば、線で囲
んで再認識対象文字を指定する場合には、文字の再切り
出しを含む再認識を実行し、アンダーラインを引いて指
定する場合には文字の再切り出しを行わないで再認識を
実行するように構成してもよい。
【0082】
【発明の効果】以上説明してきたように、請求項1の発
明によれば、文字認識の結果において誤認識の文字があ
る場合に、操作者からの当該誤認識文字を含む複数の文
字の指定を受け付けて再認識対象文字群とし、この再認
識対象文字群の各文字について作成された認識候補文字
群を参照して、それらの文字種をもとに所定の基準で再
認識の際の文字種を特定するので、操作者が再認識対象
文字群を指定するのみで再認識の際の正しい文字種が自
動的に決定され、わざわざ文字種の指定を行う必要なし
に再認識できる。
【0083】請求項2の発明によれば、再認識の結果に
おいてさらに誤認識の文字がある場合に、文字種特定ス
テップにおいて文字種を特定するために用いられた基準
における次順位の文字種を新たな再認識のための文字種
として、再度文字の再認識を行うので、仮に最初の再認
識時に期待した結果がでない場合でも、確実に訂正する
ことができる。
【0084】請求項3の発明によれば、上記の特定され
た文字種に限定して文字の再認識を行なう際に、再認識
対象文字群のうち当該文字種に対応する認識候補文字を
有しない文字があれば、前記文字切り出し手段に当該文
字に対応する文字データについて再切り出しを行って、
この再切り出しされた文字データについて文字の再認識
を行うので、文字の切り出し段階で誤りがあった場合で
も、再認識対象文字群の指定のみで、自動的に再切り出
しを行い、正しく切り出された文字データに基づいて再
認識を行うことができる。
【0085】請求項4の発明によれば、複数の文字デー
タが誤って1文字として合成されて切り出された場合
に、操作者が、当該合成されて切り出された複数の文字
データのうちの本来の1文字分および他の正しく切り出
された少なくとも1個の文字の指定を再認識対象文字群
として指定することにより、合成されて切り出された複
数の文字データを、上記本来の1文字分として指定され
た文字データと残りの文字データとに分離して再切り出
しを行ので、分割による再切り出しを確実に行うことが
できる。
【0086】請求項5の発明によれば、請求項1の文字
認識方法を実施する装置を提供できる。誤認識文字の訂
正のための操作が再認識対象文字群の指定のみで行える
ので大変容易になると共に、その入力画面等において文
字種の指定部を設ける必要がなく装置のコンパクト化が
図れる。請求項6の発明によれば、入力された文字デー
タについて、認識辞書から文字認識の確実性の高い順に
認識候補文字を検索して認識候補文字群を作成し、その
うち第1順位の文字を認識結果として出力するので、期
待した認識結果が得られる可能性が高い。
【0087】請求項7の発明によれば、認識候補文字群
を参照して、再認識対象文字群の各文字について第1順
位の認識候補文字の文字種のうち一番多い文字種を再認
識文字種とするので、再認識の際の正しい文字種として
蓋然性の高い文字種を決定することができる。請求項8
の発明によれば、認識候補文字群を参照して、当該認識
候補文字群において認識候補として挙げられていない文
字種を上記再認識対象文字群の各文字について加算し、
その合計が一番少ない文字種を再認識文字種とするの
で、再認識の際の正しい文字種として蓋然性の高い文字
種を決定することができる。
【0088】請求項9の発明によれば、認識候補文字群
について、各文字種ごとに確信度の合計値を求め、この
合計値が一番高い文字種を再認識文字種とするので、再
認識の際の正しい文字種として蓋然性の高い文字種を決
定することができる。請求項10の発明によれば、上記
再認識対象文字群の先頭もしくは最後の文字の文字種を
再認識文字種とするので、操作者が再認識対象文字の最
初もしくは最後に所定の文字種の文字を指定するだけで
再認識の際の正しい文字種を確実に決定できる。
【0089】請求項11の発明によれば、まず、再認識
文字種の文字が、上記認識候補文字群に含まれる否か
を判定し、含まれておれば、当該文字種の認識候補文字
を再認識結果として出力するので、再認識の処理を迅速
に行える。請求項12の発明によれば、請求項2の文字
認識方法を実施する装置を提供でき、仮に最初の再認識
の際に期待した認識結果がでなくても、再認識文字種を
特定するために用いられた基準における次順位の文字種
を新たな再認識文字種として特定し、これに基づき確実
に認識させることができる。
【0090】請求項13の発明によれば、請求項3の文
字認識方法を実施する装置を提供でき、これにより、再
認識対象文字群の指定をするだけで文字の切り出しの誤
りも容易に訂正できる。請求項14の発明によれば、請
求項4の文字認識方法を実施する装置を提供でき、これ
により、誤って合成されて切り出された文字データにつ
いて、再認識対象文字群の指定のみで的確な分割位置で
の再切り出しを行うことができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置の第1実施例の構成
図である。
【図2】上記実施例における文字データの入力例、文字
切り出しの様子および認識結果の例をそれぞれ示す図で
ある。
【図3】上記実施例における認識結果に対する再認識対
象文字の指定例およびこれに対する再認識結果をそれぞ
れ示す図である。
【図4】図2の入力された文字データに対して作成され
た認識文字候補群の例を示す図である。
【図5】上記実施例の文字種特定部における文字種の特
定基準の例をそれぞれ示す図である。
【図6】上記実施例における文字再認識の動作を示すフ
ローチャートである。
【図7】上記文字再認識動作を説明するための入力文字
データ、当該文字データに対する認識結果の変化、再認
識対象文字について作成された認識候補文字群および文
字種特定のための確信度の合計値のそれぞれの例を示す
図である。
【図8】再認識対象文字群の指定方法の変形例をそれぞ
れ示す図である。
【図9】上記再認識対象文字群の指定方法の別の変形例
をそれぞれ示す図である。
【図10】本発明に係る文字認識装置の第2実施例の構
成図である。
【図11】上記実施例における文字データの入力例とこ
れに対する認識候補文字群、再認識対象文字群の指定
例、文字種特定のための確信度計算例、再切り出しに基
づく認識結果、をそれぞれ示す図である。
【図12】上記実施例における別の文字データの入力例
とこれに対して作成された認識候補文字群の例を示す図
である。
【図13】図12の入力された文字データに対する再認
識対象文字群の指定例、この再認識対象文字群について
計算された確信度合計値の例および再切り出しされた文
字データについて新たに作成された認識候補文字群の例
をそれぞれ示す図である。
【図14】従来の文字認識装置の構成図である。
【図15】従来の文字認識装置における、文字データの
入力例、認識結果、訂正指定および再認識結果の例をそ
れぞれ示す図である。
【符号の説明】
1、20 文字認識装置 2 メイン制御部 3 文字データ入力部 4 文字切り出し部 5 認識辞書 6 文字検索部 7 認識候補文字記憶部 8 認識結果表示部 9 再認識対象文字指定部 10 文字種特定部 11 文字再検索部 12 文字再切り出し指示部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 櫻井 康浩 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平5−62008(JP,A) 特開 平8−221519(JP,A) 特開 平8−212301(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】 手書き、光電変換等で入力された文字デ
    ータから文字を認識する方法であって、 複数の文字データの入力を受け付ける文字データ受付ス
    テップと、 文字データの入力パターンに対応する認識候補文字がそ
    の文字種の情報と共に登録された認識辞書を検索し、上
    記入力された文字データの各々について少なくとも1個
    の認識候補文字からなる認識候補文字群を作成する認識
    候補文字群作成ステップと、 上記各文字データについて作成された認識候補文字群の
    うち所定のものを認識結果として表示する認識結果表示
    ステップと、 上記認識結果中に誤認識の文字がある場合に、操作者か
    らの当該誤認識文字を含む複数の文字の指定を受け付け
    て再認識対象文字群とする再認識対象文字受付ステップ
    と、 上記再認識対象文字群の各文字について、上記認識候補
    文字群を参照し、それらの文字種をもとに所定の基準で
    再認識の際の文字種を特定する文字種特定ステップと、 上記再認識対象文字群の各文字について、上記特定され
    た文字種に限定して、上記認識候補文字群もしくは認識
    辞書を検索して文字の再認識を行なう文字再認識ステッ
    プと、を含むことを特徴とする文字認識方法。
  2. 【請求項2】 前記文字再認識ステップは、再認識の結
    果においてさらに誤認識の文字がある場合に、操作者の
    指示を受け付け、前記文字種特定ステップにおいて文字
    種を特定するために用いられた基準における次順位の文
    字種を新たな再認識のための文字種とし、この文字種に
    限定して文字の再認識を行うことを特徴とする請求項1
    記載の文字認識方法。
  3. 【請求項3】 前記認識候補文字群作成ステップは、 認識辞書を検索するに先立ち、上記入力された複数の文
    字データから文字切り出し手段によって認識対象となる
    1文字を切り出す文字切り出し小ステップを有し、 前記文字再認識ステップは、 上記特定された文字種に限定して文字の再認識を行なう
    際に、再認識対象文字群のうち当該文字種に対応する認
    識候補文字を有しない文字があれば、前記文字切り出し
    手段に当該文字に対応する文字データについて再切り出
    しを行うように指示する第1の再切り出し指示小ステッ
    プと、 当該再切り出しされた文字データについて上記特定され
    た文字種に限定して再認識を行う第1の文字再認識小ス
    テップと、を含むことを特徴とする請求項1または2記
    載の文字認識方法。
  4. 【請求項4】 前記再認識対象文字受付ステップは、 前記文字切り出し小ステップにおいて、複数の文字デー
    タが誤って1文字として合成されて切り出された場合
    に、操作者からの、当該合成されて切り出された複数の
    文字データのうちの本来の1文字分および他の正しく切
    り出された少なくとも1個の文字の指定を受け付ける再
    認識対象文字受付小ステップを有し、 前記文字再認識ステップは、 前記文字切り出し手段に対し、上記合成されて切り出さ
    れた複数の文字データを、上記本来の1文字分として指
    定された文字データと残りの文字データとに分離して再
    切り出しを行うように指示する第2の再切り出し指示小
    ステップと、 当該再切り出しされた各文字データについて上記特定さ
    れた文字種に限定して再認識を行う第2の文字再認識小
    ステップと、を含むことを特徴とする請求項3記載の文
    字認識方法。
  5. 【請求項5】 手書き、光電変換等で入力された文字デ
    ータから文字を認識する装置であって、 複数の文字データの入力を受け付ける文字データ受付手
    段と、 文字データの入力パターンに対応する認識候補文字がそ
    の文字種の情報と共に登録された認識辞書と、 前記認識辞書から、上記入力された各文字データについ
    て少なくとも1個の認識候補文字を検索して認識候補文
    字群を作成し、そのうち所定のものを認識結果として出
    力する文字認識手段と、 上記認識結果として出力された文字を表示する認識結果
    表示手段と、 上記認識結果中に誤認識の文字がある場合に、操作者か
    らの当該誤認識文字を含む複数の文字の指定を受け付け
    て再認識対象文字群とする再認識対象文字受付手段と、 上記再認識対象文字群の各文字について、上記認識候補
    文字群を参照し、それらの文字種をもとに所定の基準で
    再認識の際の文字種を再認識文字種として特定する文字
    種特定手段と、 上記再認識対象文字群の各文字について、上記再認識文
    字種に限定して、上記認識候補文字群もしくは認識辞書
    を検索して文字の再認識を行なう文字再認識手段と、を
    含むことを特徴とする文字認識装置。
  6. 【請求項6】 前記文字認識手段は、入力された文字デ
    ータについて、前記認識辞書から文字認識の確実性の高
    い順に認識候補文字を検索して認識候補文字群を作成
    し、そのうち第1順位の文字を認識結果として出力する
    ことを特徴とする請求項5記載の文字認識装置。
  7. 【請求項7】 前記文字種特定手段は、上記認識候補文
    字群を参照し、上記再認識対象文字群の各文字について
    第1順位の認識候補文字の文字種のうち一番多い文字種
    を再認識文字種として特定することを特徴とする請求項
    6記載の文字認識装置。
  8. 【請求項8】 前記文字種特定手段は、上記認識候補文
    字群を参照し、当該認識候補文字群において認識候補と
    して挙げられていない文字種を上記再認識対象文字群の
    各文字について加算し、その合計が一番少ない文字種
    を、再認識文字種として特定することを特徴とする請求
    項5記載の文字認識装置。
  9. 【請求項9】 前記文字認識手段は、入力された各文字
    データについて前記認識辞書から認識候補文字を検索す
    る際に、当該認識候補文字の認識の確実性を示す数値を
    確信度として付与する確信度付与部を有し、 前記文字種特定手段は、上記認識候補文字群について、
    各文字種ごとに確信度の合計値を求め、この合計値が一
    番高い文字種を再認識文字種として特定することを特徴
    とする請求項6記載の文字認識装置。
  10. 【請求項10】 前記文字種特定手段は、上記再認識対
    象文字群の先頭もしくは最後の文字の文字種を再認識文
    字種として特定することを特徴とする請求項5記載の文
    字認識装置。
  11. 【請求項11】 前記文字再認識手段は、上記再認識文
    字種の文字が、上記認識候補文字群に含まれる否かを
    判定し、含まれておれば、当該文字種の認識候補文字を
    再認識結果として出力し、含まれていなければ、文字種
    を当該再認識文字種に限定して再度前記認識辞書を検索
    し、その検索結果を再認識結果として出力することを特
    徴とする請求項5ないし10記載の文字認識装置。
  12. 【請求項12】 前記文字再認識手段は、再認識結果に
    おいてさらに訂正したい文字がある場合に、操作者の指
    示を受け付け、前記文字種特定手段において再認識文字
    種を特定するために用いられた基準における次順位の文
    字種を新たな再認識文字種として特定し、これにより文
    字の再認識を行うことを特徴とする請求項5ないし9、
    もしくは11記載の文字認識装置。
  13. 【請求項13】 前記文字認識手段は、認識辞書を検索
    するに先立って上記入力された複数の文字データから認
    識対象となる1文字を切り出す文字切り出し部を有する
    と共に、前記文字再認識手段は、上記再認識文字種に限
    定して文字の再認識を行なう際に、再認識対象文字群の
    うち当該文字種に対応する認識候補文字を有しない文字
    があれば、当該文字に対応する文字データについて再切
    り出しを行うように前記文字切り出し部に指示を送る再
    切り出し指示部を有し、この再切り出しされた文字デー
    タについて上記再認識文字種に限定して再認識を行うこ
    とを特徴とする請求項ないし12記載の文字認識装
    置。
  14. 【請求項14】 前記再認識対象文字受付手段は、前記
    文字切り出し部において、複数の文字データが誤って1
    文字として合成されて切り出された場合に、操作者から
    の、当該合成されて切り出された複数の文字データのう
    ちの本来の1文字分および他の正しく切り出された少な
    くとも1個の文字データの指定を受け付け、 前記再切り出し指示部は、前記文字切り出し部に対し、
    上記合成されて切り出された複数の文字データを、上記
    本来の1文字分として指定された文字データと残りの文
    字データとに分離して再切り出しを行うように指示し、 前記文字再認識手段は、この再切り出しされた文字デー
    タについて上記再認識文字種に限定して再認識を行うこ
    とを特徴とする請求項13記載の文字認識装置。
JP26023495A 1995-10-06 1995-10-06 文字認識方法および装置 Expired - Lifetime JP3442548B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26023495A JP3442548B2 (ja) 1995-10-06 1995-10-06 文字認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26023495A JP3442548B2 (ja) 1995-10-06 1995-10-06 文字認識方法および装置

Publications (2)

Publication Number Publication Date
JPH09102012A JPH09102012A (ja) 1997-04-15
JP3442548B2 true JP3442548B2 (ja) 2003-09-02

Family

ID=17345224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26023495A Expired - Lifetime JP3442548B2 (ja) 1995-10-06 1995-10-06 文字認識方法および装置

Country Status (1)

Country Link
JP (1) JP3442548B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4738777B2 (ja) * 2004-09-02 2011-08-03 株式会社リコー 文字認識装置、文字認識方法および文字認識プログラム
JP2006330780A (ja) * 2005-05-23 2006-12-07 Sharp Corp 文字認識装置および文字認識プログラム

Also Published As

Publication number Publication date
JPH09102012A (ja) 1997-04-15

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
JPH06274680A (ja) 文書認識方法およびシステム
JP4570648B2 (ja) 画像文書処理装置、画像文書処理方法、画像文書処理プログラムおよび記録媒体
JP3442548B2 (ja) 文字認識方法および装置
WO2000036530A1 (fr) Methode de recherche et dispositif correspondant, support enregistre
JPH08166966A (ja) 辞書検索装置、データベース装置、文字認識装置、音声認識装置、および文章修正装置
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JPH0528324A (ja) 英文字認識装置
JP3274014B2 (ja) 文字認識装置および文字認識方法
JPH0452509B2 (ja)
JPH09274645A (ja) 文字認識方法および装置
JPH05120471A (ja) 文字認識装置
JPH0630052B2 (ja) 音声認識表示装置
JPH06333083A (ja) 光学式文字読取装置
JP3022790B2 (ja) 手書き文字入力装置
JP3045886B2 (ja) 手書き入力機能付き文字処理装置
JP2874815B2 (ja) 日本語文字読取装置
JP3387421B2 (ja) 単語入力支援装置及び単語入力支援方法
JPH05120472A (ja) 文字認識装置
JPH11120294A (ja) 文字認識装置および媒体
JP2000099635A (ja) 文字列予測装置及び文字列予測方法
JPH0797370B2 (ja) 文字・音声入力変換方式
JP3717971B2 (ja) 認識文字とイメージデータの対応的表示方法及び文字認識装置
JPH10293811A (ja) 文書認識装置及び方法並びにプログラム記憶媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080620

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090620

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100620

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100620

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130620

Year of fee payment: 10

EXPY Cancellation because of completion of term