JPH0696263A - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JPH0696263A
JPH0696263A JP4240924A JP24092492A JPH0696263A JP H0696263 A JPH0696263 A JP H0696263A JP 4240924 A JP4240924 A JP 4240924A JP 24092492 A JP24092492 A JP 24092492A JP H0696263 A JPH0696263 A JP H0696263A
Authority
JP
Japan
Prior art keywords
character
code
information
recognition
same
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4240924A
Other languages
English (en)
Inventor
Sueji Miyahara
末治 宮原
Shunichi Miyawaki
俊一 宮脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4240924A priority Critical patent/JPH0696263A/ja
Publication of JPH0696263A publication Critical patent/JPH0696263A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 認識結果を短時間に、容易に、かつ精度良く
確認、修正できるパターン認識装置を提供する。 【構成】 同一文字抽出部39は検証情報格納部32の
中の未確定文字、あるいは未確定文字の候補文字が同じ
ものあるいは類似のものから成っているもの、あるいは
それらの特徴が同じものあるいは類似のものから成って
いるものを同一の文字が誤ったものと見なして自動的に
抽出する。修正処理部36は、同一文字抽出部39で得
られた複数の同一あるいは類似の文字群を入力文字イメ
ージとともに表示部35に表示し、オペレータが文字を
複数個選択し、複数ヶ所を一度に正解文字に変換した
り、新たな正解文字を入力したりできる機能を有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字、図形、音声等の
パターン情報を自動的に認識し、認識結果を検証および
確認修正するのに必要な認識情報、すなわち認識処理系
から得られる入力文字イメージまたは音声、文字の特徴
または音声の特徴、認識結果、認識結果に含まれる候補
情報である候補文字または候補コードと距離値、あるい
は類似度を保存しておく認識情報格納部と、認識情報に
対して言語処理や候補情報による検証を施し、認識誤り
候補の文字列またはコード列、およびそれらの文字列ま
たはコード列に対する訂正候補の文字列またはコード列
を抽出して検証情報格納部に記憶しておく検証処理部等
を有し、文字パターン情報またはコード列情報を計算機
で処理できるようなコードデータに変換するパターン認
識装置に関する。
【0002】
【従来の技術】図10はこの種のパターン(文字)認識
装置の従来例の構成図である。入力部1は認識対象の文
字パターンを入力し、電気信号に変換する。認識部2は
電気信号に変換された文字を入力し、個々の文字パター
ンを切り出す前処理、認識に用いるパラメータを少ない
情報で表現するための特徴抽出、入力された文字がどの
カテゴリに属するかを判定する識別処理を施す。修正部
3Aは認識情報を用いた認識結果の検証処理や言語処理
(単語知識や言語規則)などを用いて曖昧な認識結果を
検証する後処理を施し、その結果がオペレータによって
確認修正される。出力部4は修正された正解文字コード
の情報を外部に出力する。制御部5はこれら各部1〜4
を制御する。
【0003】図11は図10中の修正部3Aの構成図で
ある。検証処理部30内の認識情報格納部31には、認
識部2から送られてきた認識情報が一旦保持される。検
証処理部30で認識情報の検証のために検証規則33を
用いて検証処理を施し、認識結果が未確定な文字の位置
を認識情報格納部31に、曖昧な文字や文字の特徴、お
よびその候補文字を検証情報格納部32にそれぞれ記録
する。表示処理部34では確認修正に必要な情報を表示
部35に表示し、オペレータの確認修正を受け付ける。
表示処理部34は確認修正に必要な情報表示部35に表
示し、オペレータの確認修正を受け付ける。この時、表
示処理部34はオペレータが確認や修正の処理を行い易
いように、認識情報格納部31の内容と検証情報格納部
32の内容とを、位置、大きさ、色などを整えて表示部
35に表示する。次に、オペレータは、表示された認識
情報や検証情報を目視によって確認し、その中に認識誤
りが存在すれば修正入力部37を用いて正しい情報を候
補の中から選択したり、新たな正解文字情報を入力した
りして、誤りのないデータに完成させる。修正処理部3
6Aは修正入力部37からの指示に従って、認識情報格
納部31の内容を正しいコードデータに書き換える。こ
のようにして得られた情報が誤りのないデータとして修
正済み情報格納部38に転送される。
【0004】
【発明が解決しようとする課題】上述した従来の文字認
識装置では、認識部2から送られてくる認識情報や検証
情報を表示部35に表示、あるいは音声出力し、それを
オペレータが目視や聞き取りによって検査を行ってい
た。そこで認識誤りを検出した場合、そのつどキーボー
ドやマウス、あるいはポインティング端末(タブレット
の場合)を用いて正解文字を入力し正しいデータを作っ
ていた。したがって、認識結果の認識修正では、目視
チェックにより認識誤りの検出、認識誤りの位置まで
カーソルを移動、処理モードを認識処理モードから文
字入力モードへ移行、正しい文字を入力する、正解
情報と認識誤りを置換するなどの操作が必要であった。
【0005】そのため、(a)オペレータの操作が煩雑
である。(b)修正のための操作回数が多いためデータ
入力速度が遅くなる、(b)認識誤りを指示するための
カーソル移動に時間がかかる(検証情報を利用して不自
然な文字列の位置までスキップすることもできる)など
の問題が存在していた。音声認識装置でも同様の問題が
あった。
【0006】本発明の目的は、認識結果を短時間に、容
易に、かつ精度良く確認、修正できるパターン認識装置
を提供することである。
【0007】
【課題を解決するための手段】本発明のパターン認識装
置は、検証情報格納部の中の未確定文字または未確定コ
ード、あるいは未確定文字の候補文字または未確定コー
ドの候補コードが同じものあるいは類似のものから成っ
ているもの、あるいはそれらの特徴が同じものあるいは
類似のものから成っているものを同一の文字またはコー
ドが誤ったものと見なして自動的に抽出する同一文字ま
たはコード抽出部と、該同一文字またはコード抽出部で
得られた複数の同一、あるいは類似の文字群またはコー
ド群を入力文字イメージまたは入力音声とともに表示部
に表示し、オペレータが文字またはコードを複数個選択
し、複数ヶ所を一度に正解文字または正解コードに変換
したり、新たな正解文字または正解コードを入力したり
できる機能を有する修正処理部とを備えている。
【0008】
【作用】本発明は、検証処理で未確定と判定された認識
情報から直接、あるいはオペレータが修正した文字また
はコードの履歴情報を用いて検出した誤認識情報から認
識結果に含まれる誤認識文字または誤認識コードやリジ
ェクト文字やリジェクトコードを自動的に抽出し、これ
を同一カテゴリごとにまとめて一括して修正すること
で、誤認識文字または誤認識コードやリジェクト文字ま
たはリジェクトコードを正解文字または正解コードに効
率よく修正、および確定できるようにしたものである。
【0009】誤認識文字または誤認識コードやリジェク
ト文字またはリジェクトコードに対して、オペレータが
選択、あるいは入力した正解文字または正解コードを認
識結果の文字またはコードや候補文字および候補コード
および認識情報とともに、オペレーターが修正した履歴
情報として蓄積する履歴情報格納部と、該認識情報格納
部内の認識情報の中から修正情報格納部の修正情報と同
一あるいは類似の文字またはコードを、文字またはコー
ドの情報、あるいは文字またはコードとその距離値の情
報、あるいは文字またはコードの特徴の情報を用いて誤
認識文字または誤認識コードとして検出する誤認識文字
または誤認識コード検出部とを有し、修正処理部は、該
履歴情報格納部の履歴情報の中の重複する情報や類似の
情報を1つにまとめて修正情報として修正情報格納部に
格納し、同一文字またはコード抽出部は、該誤認識文字
またはコード検出部で検出された誤認識文字またはコー
ドの候補、あるいはそれらの候補文字または候補コード
が同じものあるいは類似のものから成っているもの、あ
るいは特徴が同じものあるいは類似のものから成ってい
るものを同一の文字またはコードが誤ったものと見なし
て自動的に抽出することにより、認識結果に含まれる誤
認識文字または誤認識コードやリジェクト文字またはリ
ジェクトコードを効率よく検出することができる。
【0010】修正処理部が、オペレータが入力した正解
文字または正解コードを利用して、表示部上に表示され
た複数の文字またはコードの中から同一の誤認識文字ま
たは誤認識コードの候補、あるいは文字イメージまたは
音声をオペレータが選択し、それらに対応する認識情報
を正解文字または正解コードに書き換える機能と、さら
に、この処理を繰り返すことによって種々の誤認識候補
のカテゴリに対して正解文字または正解コードに一括修
正できる機能を有することにより、種々の誤認識候補の
カテゴリに対して正解文字または正解コードに一括修正
できる。
【0011】同一文字またはコード抽出部が、同一の未
確定文字または未確定コードや誤認識文字または誤認識
コードの候補と文字イメージまたは音声、およびその前
後に格納されている認識情報を認識情報格納部の中から
自動的に抽出し、修正処理部がこれら未確定文字または
未確定コードや誤認識文字または誤認識コードの候補と
正解文字または正解コードとを文字イメージまたは入力
音声や認識結果と同時に表示部に表示することにより、
確認修正の操作が容易になる。
【0012】検証処理部が、検証処理結果の確からしさ
を信頼度として算出し、その結果を未確定文字または未
確定コードとともに記録しておき、誤認識文字またはコ
ード検出部は修正情報あるいは履歴情報を用いて誤認識
情報格納部の認識情報の中から、誤認識文字または誤認
識コードの候補を検出する際、誤認識検出の正確さを信
頼度として算出し、誤認識文字または誤認識コードとと
もに記録しておき、同一文字または同一コード抽出部
が、誤認識文字検出部で検出された誤認識文字または誤
認識コードの候補、あるいはそれらの候補文字または候
補コードが同じものあるいは類似のものから成っている
もの、あるいは特徴が同じものあるいは類似のものから
成っているものを同一の文字またはコードが誤ったもの
と見なして、信頼度の高い順から自動的に抽出する機能
とを有することにより、確認修正を効率良く行なえる。
【0013】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0014】実施例1 図1は本発明の一実施例の文字認識装置の基本構成図で
ある。本実施例は修正部3のみが図10の従来例の文字
認識装置と異なっている。
【0015】図2は修正部3の構成図である。修正部3
は図11の修正部3Aに対して破線で囲まれた部分が追
加・変更されている。同一文字抽出部39は同一文字格
納部40と同一文字検出規則41を含み、同一カテゴリ
を示す誤認識文字候補の文字、あるいは同一カテゴリを
示す文字の特徴と、同一カテゴリを示す訂正候補の文
字、あるいはそれらの特徴を同一文字検出規則41に従
ってそれぞれ別々に検出し、それらを同一文字格納部4
0に格納する。誤認識文字検出部45は誤認識情報格納
部46と誤認識文字検出規則47を含み、認識情報格納
部31内の認識情報の中から修正情報格納部43内の修
正情報と同一、あるいは類似の文字を誤認識文字検出規
則47を用いて誤認識文字として検出し、誤認識情報格
納部46に格納する。修正処理部36は、履歴情報格納
部42と修正情報格納部43と修正情報検出規則44を
含み、誤認識文字やリジェクト文字に対して、オペレー
タが選択、あるいは入力した正解文字を認識結果の文字
や候補文字および認識情報とともに、オペレータが修正
した履歴情報として履歴情報格納部42に蓄積し、履歴
情報格納部42中の履歴情報中の重複する情報や類似の
情報を修正情報検出規則44を用いて1つにまとめて修
正情報として修正情報格納部43に格納する。
【0016】次に、この修正部3の動作を説明する。ま
ず、認識部2から送られてきた認識情報を検証規則33
を用いて検証処理部30で検証した後、認識情報格納部
31に一旦保持する。この認識情報格納部31の中の認
識情報は、修正入力部37から入力されるオペレータの
指示に従って直接、または同一文字抽出部39で処理さ
れたものが表示部35に表示される。オペレータは表示
部35に表示された情報を目視によって確認し、その中
に誤認識文字が存在すれば修正入力部37を用いて正解
文字を候補文字の中から選択したり、またはコード情報
の入力機能を用いて新たな正解文字を入力する。修正の
処理ではこのとき、認識情報に対して検証処理部30に
おいて、あらかじめ検証規則33により検証処理(たと
えば、入力パターンの特徴と認識辞書との距離値の許容
値、あるいは他のカテゴリとの距離の近さの許容値など
を組合せたものが条件を満足するもの、または信頼度は
距離値の近さや類似度の小ささで表したものが条件を満
足するもの)を施して、誤認識文字候補の文字(あるい
は文字の特徴)やそれらの候補文字を検出しておき検証
情報格納部32に記録しておく。次に、同一文字検出部
39において同一カテゴリを示す誤認識文字候補の文字
(あるいは同一カテゴリを示す文字の特徴)を、同一カ
テゴリを示す訂正候補の文字、あるいはそれらの特徴と
を同一文字検出規則41に従ってそれぞれ別々に検出
し、それらを同一文字格納部40に格納してからオペレ
ータの指示を待つ。一括修正の処理は、オペレータが修
正入力部37から入力する表示命令の指示に従って、同
一文字格納部40の中から同一カテゴリごとにまとめら
れた誤認識文字の候補や候補文字、およびそれらの文字
に対応する認識情報格納部31の文字イメージとを表示
処理部34の要求に基づいて表示部35に表示する。オ
ペレータは表示部35に表示された誤認識文字の候補群
を目視によって確認し、キーボードやマウスなどを用い
て同じカテゴリに属する文字イメージを1つのグループ
をしてまとめた後、正解文字を選択、あるいは入力す
る。この処理を同一文字格納部40の中の誤認識文字の
候補がなくなるまで行うことにより、認識情報格納部3
1の中の認識結果の認識誤り文字をなくすことができ
る。また、この時、確認修正が行われたことを示す情報
(確定情報)を認識情報の中に記録する。この確定情報
を付与することによって、認識結果の後処理をさらに信
頼性の高いものにすることができる。
【0017】図3は、検証情報格納部32の中の検証情
報の具体的な内容を示したものである。検証情報は、入
力文字イメージ311、文字の特徴312、認識結果3
13、候補文字314、距離値315、位置情報31
6、確定情報317(確定情報317が記録されるまで
は、未確定文字、および誤認識文字の候補であることを
示す情報として使用する)からなる。確定情報317
は、表示部35に表示された認識情報の中からオペレー
タが目視によって同じ文字カテゴリと判断し、選択した
ときに認識情報の中に書き込まれるものであり、例えば
同じ文字カテゴリのグループごとに1,2,・・・,i
の数字列で表すことができる。認識情報格納部31は、
修正処理部36からの指示に従って認識結果313の内
容を正解文字に書き換える。書き換えられた認識結果
は、書き換え前の認識結果と置き換えて表示部35に表
示される。この時、オペレータが修正した修正情報と修
正の対象になった認識情報とを履歴情報として履歴情報
格納部42の中に蓄積しておき、以後の誤認識文字の候
補の修正に利用する。
【0018】図4は、同一文字抽出部39とオペレータ
が行なう処理の流れを示すフローチャートである。な
お、実線で囲まれた部分が同一文字抽出部39の処理の
流れを、点線で囲まれた部分がオペレータの処理を示し
ている。まず、同一文字抽出部39は、検証処理部30
で抽出された未確定文字と誤確認文字検出部45で抽出
された誤認識文字の候補とを認識情報の中から検出して
オペレータの確認修正の候補とする(ステップ39
1)。次に、同一文字抽出部39は、ステップ391で
検出された確認修正文字の候補の中から同一カテゴリが
誤ったものと見なされる文字パターンを自動的に抽出す
る(ステップ392)。抽出の基準は、例えば(1)の
検証処理の結果として抽出された文字において、候補文
字群の中に同一カテゴリを示すものが多く現れるものを
集めてくる方法(例えば、特開平2−18682号)
や、候補文字の同一カテゴリ間の距離値が近いものを集
めて来る方法、(2)検証処理の結果として抽出された
文字において、文字の特徴同士の差分が小さいものを集
めて来る方法(たとえば、一般的に用いられるものとし
て橋本新一郎著「文字認識概論」通気通信協会発行、オ
ーム社発売、P15〜P20)などがある。ここでは前
者を用いて説明する。次に、同一文字抽出部39は、抽
出された認識情報の中から誤認識文字の候補が同一カテ
ゴリのものを、オペレータの確認修正に必要な入力文字
イメージ311と誤認識文字の候補、すなわち認識誤り
候補として検出して認識結果313とともに表示し、オ
ペレータの確認と一括修正を受け付ける(ステップ39
3)。同一文字抽出部39は、表示部35に表示する候
補文字314の文字カテゴリが重複表示しないように、
文字カテゴリをまとめてから表示部35に表示する。次
に、オペレータは、表示部35に表示された入力文字イ
メージ311を目視によって確認し、同じ文字カテゴリ
の入力文字イメージ311を修正入力部37を用いて選
択し、1つのグループとして完成させる(ステップ39
4)。この時、修正処理部36は修正入力部37の指示
に従って、オペレータが選択した入力文字イメージ31
1に対して確定情報317を割り付ける、次に、オペレ
ータは、1つのグループとしてまとめられた入力文字イ
メージ311に対応する正解文字を修正入力部37を用
いて、候補文字から選択したり、新たな文字を入力する
(ステップ395)。修正処理部36は修正入力部37
の指示と確定情報317との対応をとって認識結果31
3の内容を正解文字に書き換える。
【0019】図5は本実施例の内、オペレータが同じ文
字カテゴリをまとめて確認修正する場合の表示部35の
表示例を示しており、351は入力文字イメージ表示、
352は認識結果の文字表示、353は候補文字の表示
を示している。同一文字抽出部39によって認識情報格
納部31から抽出された認識情報(入力文字イメージ)
のうち、確認修正に必要な情報が表示部35に表示され
る。オペレータは、入力文字イメージ表示351を確認
し、同じ文字カテゴリの入力文字イメージ群表示354
を修正入力部37を用いて選択する。表示部35では、
選択された入力文字イメージ群の表示354と選択され
ていない入力文字イメージ群の表示355を区別するた
め、色や大きさを変化させて表示部35に表示する。オ
ペレータは1つのグループとして選択を終了すると、こ
のグループの文字カテゴリに対応する正解文字を認識結
果の文字表示352の中、あるいは候補文字表示353
の中から選択したり、文字入力機能を用いて新たな正解
文字を修正入力部37を用いて入力する。修正処理部3
6は修正入力部37の指示に従って認識結果313の内
容を正解文字に書き換える。このようにして修正入力部
37は、オペレータの確認と一括修正を繰り返し受け付
ける。なお、本実施例に示した同じ文字カテゴリごとに
まとめて確認修正する場合、該当する同一文字以外の入
力文字イメージ表示351が表示部35に表示される
が、表示された入力文字イメージ351の中から、オペ
レータが修正が必要だと判断した入力文字イメージ表示
351については、繰り返し同じ文字カテゴリをまとめ
て正解文字の入力を可能とする。なお、パターン認識の
対象が図形の場合も、上記と同様にして誤認識図形やリ
ジェクト図形を一括して修正することができ、入力精度
の高い図形コード情報を得ることができる。
【0020】本実施例は、認識結果に含まれる認識誤り
文字を自動的に抽出し、オペレータが抽出された認識情
報をカテゴリごとにまとめて確認するとともに一括修正
の操作ができるようにしたもので、これによって、オペ
レータの修正に要する時間を少なくすることができ、デ
ータ入力の生産性が向上すると共に、修正操作を容易に
することができる。
【0021】実施例2 図6は修正部3における履歴情報420を用いた一括修
正の処理を示す図であって、420は履歴情報、421
はオペレータが入力した正解文字、その他は図3の文字
イメージ311から距離値315と同じ情報が入ってい
る。
【0022】図7は履歴情報420に対して修正情報検
出規則44を用いて重複する情報を除去した修正情報4
30の内容を示す図であり、431は修正情報の正解文
字、432は修正情報が誤認識文字の自動検出に活用さ
れた利用回数、433は自動検出が正しかった場合の利
用回数(正利用)、434は自動検出が誤った場合の利
用回数(負利用)である。具体的処理は、修正部3にお
いて、認識情報格納部31の中の認識結果をオペレータ
が確認して修正する際に、正解文字421を選択、ある
いは入力するのと同時に修正に関係する情報、すなわち
正解文字421、誤認識文字の候補、候補文字、距離
値、認識情報(入力文字イメージ、文字の特徴や認識結
果の候補情報など)を履歴情報420として履歴情報格
納部42に記録する。このようなオペレータの処理が続
けられた後に、修正処理部36は過去の履歴、あるいは
修正処理がある一定量行なわれた時点、たとえば一日の
仕事あるいは1,000枚程度の文書の読み取りが終了
した時点で、修正情報430を作成してその結果を修正
情報格納部43に記録しておく。このような修正情報4
30の作成は、履歴情報420の中から重複する情報1
つにまとめて情報を圧縮するとともに、同一カテゴリが
答えになる可能性がある情報を選択・まとめる処理であ
る。修正情報430の活用方法は、誤認識文字検出部4
5において検証情報格納部32の中の検証情報が修正情
報430と一致あるいは類似するもの、認識情報格納部
31内の認識情報と修正情報340と一致あるいは類似
するのを誤認識文字検出規則47に従って自動的に抽出
して、誤認識情報格納部46に蓄積し、次に同一文字抽
出部39において同一カテゴリをグループ化して確認修
正の処理が行えるように、認識結果の表示に修正情報4
30の中の正解文字431を追加して表示部35に表示
してオペレータの確認修正を容易にする。この処理によ
って、オペレータは表示部35に表示された誤認識文字
の候補を目視によって確認し、キーボードやマウスなど
を用いて同じ文字カテゴリに属する入力文字イメージ3
11を1つのグループとしてまとめた後、正解文字を選
択、あるいは入力すればよい。この処理は過去の検証情
報の中に同じ誤り傾向ものもが存在すれば、それを候補
文字の中に入れて表示部35からオペレータに提示する
ものであって、誤認識文字の検出に有効に働くととも
に、修正のためにオペレータが入力する正解文字の入力
回数を低減できる。
【0023】本実施例は、未修正の認識情報の中からオ
ペレータの修正した履歴情報と同じ傾向を示す認識情報
や検証情報を自動的に抽出し、これを同一カテゴリごと
にまとめて修正操作ができるようにしたもので、これに
より、オペレータが修正した履歴情報を用いて効率良
く、しかも検出もれの少ない一括修正ができる。
【0024】実施例3 図8は修正処理部36において、履歴情報420として
履歴情報格納部42に記録されている、オペレータが選
択、あるいは入力した正解文字の情報を利用して、後続
の修正処理を容易にできるようにした実施例のフローチ
ャートである。これは先にオペレータが選択、あるいは
入力した正解文字の情報を履歴情報格納部42に保持し
ておき、表示部35上に表示された種々の文字列に対
し、その中から同一の誤認識文字の候補をオペレータが
選択することによって、認識情報格納部31の中の誤認
識文字を、直前に入力した履歴情報420の正解文字に
書き換えるようにしたものである。また、この処理を繰
り返すことによって誤認識文字候補の種々のカテゴリに
対して正解文字に書き換えることができるようにしたも
のである。正解文字の選択・入力を同一カテゴリを選択
前に入力するのか、後に入力するのかを示す「認識結果
の修正モード」は、オペレータが変更可能なシステムの
ディフォルト値として与える。本実施例では正解文字を
選択前に入力する場合について、以下のステップで処理
を進める。この図で実線の部分は自動処理、破線の部分
はオペレータによる処理である。まず、認識結果の修正
モードを入力する(ステップ501)。次に、表示画面
に表示された誤認識文字の候補に対して、オペレータが
正解文字を入力する(ステップ502)。次に、正解文
字と同一カテゴリの誤認識文字候補の文字イメージを複
数個選択する(ステップ503)。次に、選択が終了し
た時点、すなわち同一画面表示で他のカテゴリに対する
修正作業をするために次の正解文字を入力する時点、1
つの修正情報での誤認識文字の修正作業を終了する時点
で選択された誤認識文字候補の文字(認識結果)を正解
文字に書き換える(ステップ504,505)。次に、
同一画面表示で他のカテゴリに対する修正作業を行うが
否かを判定する(ステップ506)。最後に、1つの検
証情報や修正情報を用いて集められた同一文字格納部4
0内の誤認識文字の候補がなくなった否かを判定する
(ステップ507)。
【0025】本実施例は、オペレータが一度確認した文
字パターンに対し、連続して正解情報の入力を行うこと
ができるようにしたもので、オペレータの確認修正作業
の生産性が向上する。
【0026】実施例4 図9は、実施例4を説明するための表示部35の表示画
面の図であり、このとき修正部3の構成は図2と同じ構
成となっている。同一文字列抽出部39は、修正処理部
36の指示に従って同一列格納部40の内容を表示部3
5に表示する際、認識誤り文字の前後に格納されている
認識情報(文字パターン)も認識情報格納部31の中か
ら自動的に抽出し、これらを同時に表示部35に表示す
る。ただし、類似する認識情報の前または後に認識情報
が存在しない場合は、修正対象の認識情報、すなわち、
入力文字パターン表示351の中央の文字に位置するよ
うに認識情報の桁を合わせて表示部35に表示する。こ
のとき認識結果の文字表示352も同時に表示し、文字
パターンが認識結果と対応がとれるようにする。正解文
字の選択が容易になるように訂正候補の文字列表示35
3も同時に表示する。また、表示部35は同一カテゴリ
の認識情報が1画面上に全て表示しきれない場合、画面
切り替えモードを表示部35に表示し、オペレータは、
画面切り替えを行いながら確認と一括修正の処理を行
う。オペレータは表示部35に表示された修正対象の認
識情報の文字種を、その前後に表示された認識情報を参
考に確認し、修正入力部37を用いて同じ文字カテゴリ
を1つのグループとしてまとめて修正処理を行う。
【0027】本実施例は、抽出された同一文字およびそ
の前後の文字を同時に表示部に表示することにより、オ
ペレータは当該同一文字の文字カテゴリを前後の文字か
ら同形文字や類似文字の識別が容易に推測でき、オペレ
ータの確認作業を支援することができる。
【0028】実施例5 本実施例は、修正部3において、検証処理の際の検証処
理結果の確からしさを信頼度321として算出し、その
結果を検証情報格納部32に記録しておくとともに、修
正情報を用いて同一文字を抽出する際の同一文字抽出結
果の確からしさを信頼度321として算出しておき、後
続の同一文字抽出部39において前記算出された信頼度
321が同じあるいは類似のカテゴリから成っているも
のを同一カテゴリの文字が誤ったものと見なし、その確
からしさを信頼度321として算出し、同一文字抽出部
39ではその信頼度の高い順から自動的に抽出するよう
にし、この情報を用いて同一のカテゴリをまとめて表示
できるようにしたものである。
【0029】信頼度321は、認識結果から得られる候
補文字や候補文字の距離値を用いる場合や文字パターン
の特徴と修正情報430を用いる場合とがある。前者の
場合、同一文字抽出部39は、修正処理部36の指示に
従って同一文字格納部40の中から同一カテゴリで、距
離値の近いものから選択して表示部35に表示する。信
頼度321として修正情報430を用いる場合は、修正
情報430が表記通りの正解文字431を表示して有効
だった場合(正利用433)と、有効に働かず他の文字
が選択あるいは入力された場合(負利用434)との比
較値を用い、比較値の高いものから選択して表示部35
に表示する。
【0030】本実施例は、認識誤り候補の文字列、ある
いは訂正候補の文字列が同一カテゴリを示すものに対し
て、信頼度の高い順に抽出するもので、これにより、認
識結果に含まれる認識誤りを効率よく抽出することがで
きる。
【0031】実施例6 本実施例は認識の対象パターンが音声の場合を示すもの
である。音声認識の場合の修正部3において、同一音声
抽出部(同一文字抽出部39に相当)では同一カテゴリ
を示す誤認識音声の候補が集められ、その音声のラベル
用の音声(カテゴリ名)に続いて集められた原音声が信
頼度の高い順に出力される。この時、原音声がラベルの
音声と同じカテゴリであれば、同一カテゴリであること
を示す指示をタブレットやマウスなどの端末を用いて行
う。この指示された原音声に対応する誤認識音声の候補
を、ラベルとして出力された音声のカテゴリ名を示すコ
ード情報に変換することにより、誤認識音声が正解音声
に修正され、音声認識の確認修正を効率よく行うことが
できる。
【0032】本実施例は、音声認識の場合を示したもの
で、誤認識音声の候補をまとめて音声出力し、同一の音
声だけを選択的に抽出した後、まとめて修正指示を行っ
て正解コードに変換することにより、効率よく確認修正
ができる。
【0033】
【発明の効果】以上説明したように本発明は、以下に示
すような効果がある。 (1)請求項1の発明は、認識結果に含まれる認識誤り
文字またはコードを自動的に抽出し、オペレータは抽出
された認識情報をカテゴリにまとめて確認するとともに
一括修正の操作ができるようにしたことにより、オペレ
ータの修正に要する時間を少なくすることができ、デー
タ入力の生産性が向上すると共に、修正操作を容易にす
ることができる。 (2)請求項2の発明は、未修正の認識結果の中からオ
ペレータが修正した履歴情報と同じ傾向を示す認識情報
や検証情報を自動的に抽出し、これを同一カテゴリごと
にまとめて一括修正の操作ができるようにしたことによ
り、履歴情報を用いて効率良く、しかも検出もれの少な
い一括修正できる。 (3)請求項3の発明は、オペレータが選択あるいは入
力した正解文字または正解コードを利用して、同一の認
識誤り候補の文字列またはコード、あるいは訂正候補の
文字またはコードを正解文字または正解コードに書き換
えるようにしたことにより、オペレータが正解情報の入
力を行う必要がなくなり、オペレータの確認修正作業の
生産性が向上する。また、この処理を繰り返し行なうこ
とにより、類似文字等への正解文字入力を同一表示画面
で行うことができ、確認修正作業の生産性が向上する。 (4)請求項4の発明は、抽出された同一文字または同
一コードおよびその前後の文字またはコードを同時に表
示部に表示することにより、オペレータは当該同一文字
または同一コードの文字カテゴリを前後の文字またはコ
ードから同形文字または同形コードや類似文字または類
似コードの識別が容易に推測でき、オペレータの確認作
業を支援することができる。 (5)請求項5の発明は、認識誤り候補の文字またはコ
ード、あるいは訂正候補の文字またはコードが同一カテ
ゴリを示すものに対して、信頼度の高い順に自動的に抽
出することにより、認識結果に含まれる認識誤りの修正
を効率的に行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施例の文字認識装置の構成図であ
る。
【図2】図1中の修正部3の構成図である。
【図3】図2中の認識情報格納部31中の認識情報の内
容を示す図である。
【図4】図2中の同一文字列抽出部39およびオペレー
タが行なう処理を示すフローチャートである。
【図5】オペレータが同じ文字カテゴリをまとめて修正
する場合の表示部35の表示を示す図である。
【図6】履歴情報420を示す図である。
【図7】図6の履歴情報420から重複する情報を除去
した修正情報430を示す図である。
【図8】オペレータが選択あるいは入力した正解文字の
情報を利用して後続の修正処理を容易にできるようにし
た実施例3のフローチャートである。
【図9】実施例4における表示部35の内容を説明する
ための図である。
【図10】文字認識装置の従来例の構成図である。
【図11】図11の文字認識装置の修正部3Aの構成図
である。
【符号の説明】 1 入力部 2 認識部 3,3A 修正部 4 出力部 5 制御部 30 検証処理部 31 認識情報格納部 32 検証情報格納部 33 検証規則 34 表示処理部 35 表示部 36,36A 修正処理部 37 修正入力部 38 修正済み情報格納部 39 同一文字抽出部 40 同一文字格納部 41 同一文字検出規則 42 履歴情報格納部 43 修正情報格納部 44 修正情報検出規則 45 誤認識文字検出部 46 誤認識情報格納部 47 誤認識文字検出規則 311 入力文字イメージ 312 文字の特徴 313 認識結果 314 候補文字 315 距離値 316 位置情報 317 確定情報 321 信頼度 351 入力文字イメージ表示 352 認識結果の文字表示 353 候補文字表示 354 選択入力文字パターン群表示 355 否選択入力文字パターン群表示 391〜395 ステップ 420 履歴情報 421 正解文字 430 修正情報 431 正解文字 432 利用回数 433 正利用回数 434 負利用回数 501〜507 ステップ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字、図形、音声等のパターン情報を自
    動的に認識し、認識結果を検証、および確認修正するの
    に必要な認識情報、すなわち認識処理系から得られる入
    力文字イメージまたは音声、文字の特徴または音声の特
    徴、認識結果、認識結果に含まれる候補情報である候補
    文字または候補コードと距離値あるいは類似度を保存し
    ておく認識情報格納部と、前記認識情報に対して言語処
    理や候補情報による検証を施し、認識誤り候補の文字列
    またはコード列、およびそれらの文字列またはコード列
    に対する訂正候補の文字列またはコード列を抽出して検
    証情報格納部に記憶しておく検証処理部等を有し、文字
    パターン情報またはコード列情報を計算機で処理できる
    ようなコードデータに変換する修正部を含むパターン認
    識装置において、 該検証情報格納部の中の未確定文字または未確定コー
    ド、あるいは未確定文字の候補文字または未確定コード
    の候補コードが同じものあるいは類似のものから成って
    いるものを同一の文字またはコードが誤ったものと見な
    して自動的に抽出する同一文字またはコード抽出部と、 該同一文字またはコード抽出部で得られた複数の同一、
    あるいは類似の文字群またはコード群を入力文字イメー
    ジまたは入力音声にとともに表示部に表示し、オペレー
    タが文字またはコードを複数個選択したり、複数ヶ所を
    一度に正解文字または正解コードに変換したり、新たな
    正解文字または正解コードを入力したりできる機能を有
    する修正処理部とを備えたことを特徴とするパターン認
    識装置。
  2. 【請求項2】 誤認識文字または誤認識コードやリジェ
    クト文字またはリジェクトコードに対して、オペレータ
    が選択、あるいは入力した正解文字または正解コードを
    認識結果の文字またはコードや候補文字または候補コー
    ドおよび認識情報とともに、オペレータが修正した履歴
    情報として蓄積する履歴情報格納部と、 該認識情報格納部内の認識情報の中から修正情報格納部
    の修正情報と同一あるいは類似の文字またはコードを、
    文字またはコードの情報、あるいは文字またはコードと
    その距離値の情報、あるいは文字またはコードの特徴の
    情報を用いて誤認識文字または誤認識コードとして検出
    する誤認識文字または誤認識コード検出部とを有し、 前記修正処理部は、該履歴情報格納部の履歴情報の中の
    重複する情報や類似の情報を1つにまとめて修正情報と
    して前記修正情報格納部に格納し、 前記同一文字またはコード抽出部は、該誤認識文字また
    はコード検出部で検出された誤認識文字またはコードの
    候補、あるいはそれらの候補文字または候補コードが同
    じものあるいは類似のものから成っているもの、あるい
    は特徴が同じものあるいは類似のものから成っているも
    のを同一の文字またはコードが誤ったものと見なして自
    動的に抽出する請求項1記載のパターン認識装置。
  3. 【請求項3】 前記修正処理部は、オペレータが入力し
    た正解文字または正解コードを利用して、表示部上に表
    示された複数の文字またはコードの中から同一の誤認識
    文字または誤認識コードの候補、あるいは文字イメージ
    または音声をオペレータが選択し、それらに対応する認
    識情報を正解文字または正解コードに書き換える機能
    と、さらに、この処理を繰り返すことによって種々の誤
    認識候補のカテゴリに対して正解文字または正解コード
    に一括修正できる機能を有する請求項2記載のパターン
    認識装置。
  4. 【請求項4】 前記同一文字またはコード抽出部は、同
    一の未確定文字または未確定コードや誤認識文字または
    誤認識コードの候補と文字イメージまたは音声、および
    その前後に格納されている認識情報を前記認識情報格納
    部の中から自動的に抽出し、前記修正処理部は、これら
    未確定文字または未確定コードや誤認識文字または誤認
    識コードの候補と正解文字または正解コードとを文字イ
    メージまたは入力音声や認識結果と同時に表示部に表示
    する請求項1または2記載のパターン認識装置。
  5. 【請求項5】 前記検証処理部は、検証処理結果の確か
    らしさを信頼度として算出し、その結果を未確定文字ま
    たは未確定コードとともに記録しておき、前記誤認識文
    字またはコード検出部は修正情報あるいは履歴情報を用
    いて前記誤認識情報格納部の認識情報の中から、誤認識
    文字または誤認識コードの候補を検出する際、誤認識検
    出の正確さを信頼度として算出し、誤認識文字または誤
    認識コードとともに記録しておき、前記同一文字または
    同一コード抽出部は、誤認識文字検出部で検出された誤
    認識文字または誤認識コードの候補、あるいはそれらの
    候補文字または候補コードが同じものあるいは類似のも
    のから成っているもの、あるいは特徴が同じものあるい
    は類似のものから成っているものを同一の文字またはコ
    ードが誤ったものと見なして、信頼度の高い順から自動
    的に抽出する機能とを有する請求項1または2記載のパ
    ターン認識装置。
JP4240924A 1992-09-09 1992-09-09 パターン認識装置 Pending JPH0696263A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4240924A JPH0696263A (ja) 1992-09-09 1992-09-09 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4240924A JPH0696263A (ja) 1992-09-09 1992-09-09 パターン認識装置

Publications (1)

Publication Number Publication Date
JPH0696263A true JPH0696263A (ja) 1994-04-08

Family

ID=17066677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4240924A Pending JPH0696263A (ja) 1992-09-09 1992-09-09 パターン認識装置

Country Status (1)

Country Link
JP (1) JPH0696263A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312692A (ja) * 2000-02-21 2001-11-09 Nippon Digital Kenkyusho:Kk 認識文字修正方法及び認識文字修正プログラム
JP2002074262A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 認識文字修正方法
KR100470346B1 (ko) * 2002-06-07 2005-02-07 주식회사 팔만시스템 이미지의 클러스터링 방법 및 이 방법을 이용하여 문자를고속으로 입력 및 교정하는 방법
JP2006178543A (ja) * 2004-12-20 2006-07-06 Canon Marketing Japan Inc 画像処理方法、画像処理装置
JP2006331354A (ja) * 2005-05-30 2006-12-07 Sharp Corp 文字認識装置、文字認識方法、並びに、そのプログラムおよび記録媒体
US7260262B2 (en) 2002-06-28 2007-08-21 International Business Machines Corporation Display control method, and program, information processing apparatus and optical character recognizer
US7466861B2 (en) 2004-04-19 2008-12-16 International Business Machines Corporation Method for outputting character recognition results
JP2015055891A (ja) * 2013-09-10 2015-03-23 株式会社東芝 文字認識結果検証装置及び文字読取システム
WO2019181441A1 (ja) * 2018-03-20 2019-09-26 日本電気株式会社 情報処理装置、制御方法、及びプログラム
JP2019197321A (ja) * 2018-05-08 2019-11-14 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像形成装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312692A (ja) * 2000-02-21 2001-11-09 Nippon Digital Kenkyusho:Kk 認識文字修正方法及び認識文字修正プログラム
JP2002074262A (ja) * 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 認識文字修正方法
KR100470346B1 (ko) * 2002-06-07 2005-02-07 주식회사 팔만시스템 이미지의 클러스터링 방법 및 이 방법을 이용하여 문자를고속으로 입력 및 교정하는 방법
US7260262B2 (en) 2002-06-28 2007-08-21 International Business Machines Corporation Display control method, and program, information processing apparatus and optical character recognizer
US7466861B2 (en) 2004-04-19 2008-12-16 International Business Machines Corporation Method for outputting character recognition results
JP2006178543A (ja) * 2004-12-20 2006-07-06 Canon Marketing Japan Inc 画像処理方法、画像処理装置
JP2006331354A (ja) * 2005-05-30 2006-12-07 Sharp Corp 文字認識装置、文字認識方法、並びに、そのプログラムおよび記録媒体
JP2015055891A (ja) * 2013-09-10 2015-03-23 株式会社東芝 文字認識結果検証装置及び文字読取システム
WO2019181441A1 (ja) * 2018-03-20 2019-09-26 日本電気株式会社 情報処理装置、制御方法、及びプログラム
JPWO2019181441A1 (ja) * 2018-03-20 2021-03-18 日本電気株式会社 情報処理装置、及び制御方法
US11966435B2 (en) 2018-03-20 2024-04-23 Nec Corporation Information processing apparatus, control method, and program
JP2019197321A (ja) * 2018-05-08 2019-11-14 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像形成装置

Similar Documents

Publication Publication Date Title
JPH07185473A (ja) ビデオコーティング装置
US7769235B2 (en) Text recognition method using a trainable classifier
JPH0696263A (ja) パターン認識装置
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
JPH0668261A (ja) パターン認識装置
JPH0612520A (ja) 文字認識装置の確認修正方式
KR950001061B1 (ko) 문서인식 수정장치
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2953162B2 (ja) 文字認識装置
JPH0636066A (ja) 文字認識装置の確認修正処理方式
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH0713991A (ja) 誤認文字修正装置
JPH05108867A (ja) パターン認識装置
JPH11120294A (ja) 文字認識装置および媒体
JP2890788B2 (ja) 文書認識装置
JPH0654503B2 (ja) パタ−ン認識装置
JP3419418B2 (ja) 文字読取方法および装置
JPS63143684A (ja) 文字認識装置における認識結果修正方法
JPH06119483A (ja) 文字読み取り装置
JPH03116392A (ja) パターン認識後処理方式
JPH06195514A (ja) 文字認識装置
JPH04268684A (ja) 認識文字の修正方法
JP2002074262A (ja) 認識文字修正方法
JPH06187507A (ja) 文字認識装置