JPH0636066A - 文字認識装置の確認修正処理方式 - Google Patents

文字認識装置の確認修正処理方式

Info

Publication number
JPH0636066A
JPH0636066A JP4191997A JP19199792A JPH0636066A JP H0636066 A JPH0636066 A JP H0636066A JP 4191997 A JP4191997 A JP 4191997A JP 19199792 A JP19199792 A JP 19199792A JP H0636066 A JPH0636066 A JP H0636066A
Authority
JP
Japan
Prior art keywords
information
recognition
character
correction
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4191997A
Other languages
English (en)
Inventor
Shunichi Miyawaki
俊一 宮脇
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4191997A priority Critical patent/JPH0636066A/ja
Publication of JPH0636066A publication Critical patent/JPH0636066A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 本発明は,文字認識装置において,オペレー
タの確認修正の操作を従来の1文字づつの修正操作では
なく,同一の文字カテゴリごとにまとめて修正できるよ
うにすることを目的としている。 【構成】 文字認識装置において,認識情報に含まれる
候補情報や信頼値情報を用いて当該認識情報を所定の順
にソートし,その結果に基づいて入力文字情報や候補情
報をディスプレイに表示し,画面上で複数の同一文字カ
テゴリの選択を行い,1回の操作で正解情報に変換でき
るようにしている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,文字認識装置において
認識結果に含まれる誤り文字を,オペレータが効率よく
正解情報に修正できるようにしたものであり,文字認識
結果の確認修正をする文字認識装置の確認修正処理方式
に関するものである。
【0002】
【従来の技術】図8は従来から用いられている文字認識
装置の基本的な構成である。図中の符号1は入力部,2
は認識部,3は修正部,4は出力部,5は制御部であ
る。
【0003】図9は文字認識装置の従来形の修正部の構
成である。図中の符号31は認識情報格納部,32はモ
ニタ部,33は修正済み情報格納部,34は修正処理
部,35は修正入力部である。
【0004】以下,図を用いて説明する。図8に示す文
字認識装置を動作するには,まず,認識対象の文字情報
が,従来公知のごとく,入力部1によって電気信号に変
換された後,認識部2によって,個々の文字を切り出す
前処理,認識に用いるパラメータを少ない情報で表現す
るための特徴抽出,入力文字がどの文字カテゴリに属す
るかを判定する識別処理,単語知識や言語規則などを用
いてあいまいな認識結果を確定していく後処理などの各
処理が施される。
【0005】次にそこで得られた認識結果を修正部3の
モニタに表示してオペレータが確認し,誤り文字に対し
て修正の処理が施され,修正された情報の中から必要な
情報が出力部4を通して外部に出力される。
【0006】図9は従来形の修正部3を示すものであっ
て,認識部2から送られてきた認識情報を認識情報格納
部31に一旦保持し,その中から確認修正に必要な情報
をモニタ部32に表示するとともに,オペレータからの
確認修正を受け付ける。
【0007】モニタ部32は認識情報格納部31の内容
をオペレータによって確認修正し易いように位置,大き
さ,色を整えてディスプレイに表示する。次にオペレー
タは表示された認識情報を目視や聞き取りで確認し,そ
の中に誤り文字が存在すれば修正入力部35を用いて正
しい情報を候補カテゴリの中から選択したり,新たな情
報を入力したりして,誤りのないデータに完成させる。
修正処理部34は修正入力部35からの指示に従って,
認識情報格納部31の内容を正しいコードデータに書き
換える。このようにして得られた情報が誤りのないデー
タとして修正済み情報格納部33に転送される。
【0008】
【発明が解決しようとする課題】従来から文字認識装置
の確認修正処理方式では,認識部2から送られてくる認
識情報をモニタ部によって表示あるいは音声出力し,そ
れをオペレータが目視や聞き取りによって検査を行って
いた。そこで誤り文字が検出された場合には,その都度
キーボード,あるいはマウスを用いて正解情報を入力し
正しいデータを作っていた。そのため,認識結果の確認
修正では,目視チェックによる誤り文字の検出,誤
り文字の位置までカーソルを移動,処理モードを認識
処理モードから日本語入力モードへ移行,正解文字を
入力する,正解情報と誤り文字を置換する,を行い正
しいデータを入力していた。
【0009】そのため, (a)オペレータの操作が煩雑である。 (b)修正のための操作回数が多いためデータ入力速度
が遅くなる。
【0010】(c)誤り文字を指示するためのカーソル
移動に時間がかかる。 等の問題が存在していた。本発明は,文字認識装置にお
いて,オペレータの確認修正の操作を従来の1文字づつ
の修正操作ではなく,同一の文字カテゴリごとにまとめ
て修正操作できるようにすることを目的としている。
【0011】
【課題を解決するための手段】本発明においては,文字
認識装置において,認識情報に含まれる候補情報や信頼
値情報を用いて当該認識情報を所定の順序にソートし,
その結果に基づいて入力文字情報や候補情報をディスプ
レイに表示し,画面上で複数の同一文字カテゴリの選択
を行い,1回の操作で正解情報に変換できるようにして
いる。
【0012】
【作用】本発明においては,文字認識結果に含まれる誤
り文字を同一の文字カテゴリごとにまとめ,その文字カ
テゴリごとに確認修正ができるようにしている。
【0013】
【実施例】
(実施例1)図1は,本発明で対象とする確認修正処理
方式を含む文字認識装置の修正部の構成である。図中の
符号31は認識情報格納部,32はモニタ部,33は修
正済み情報格納部,34は修正処理部,35は修正入力
部である。また36は認識情報処理部である。なお,図
1において点線で囲った部分が従来の構成に新たに追
加,変更した部分であり,修正部3と他機能部との関係
については図8に示したものと同じ構成となっている。
【0014】図1に示す修正部3を動作するには,ま
ず,認識部2から送られてきた認識情報を認識情報格納
部31に一旦保持する。この認識情報格納部31の認識
情報は,修正入力部35から入力されるオペレータの指
示に従って,認識情報処理部36で処理したものやある
いは変換したものがモニタ部32に表示される。オペレ
ータはモニタ部32に表示された入力文字情報と認識情
報とを比較しながら後述の修正処理を行う。
【0015】図2は,認識情報格納部31の中の認識情
報を示したものである。311は認識情報通番,312
は入力文字情報,313は文字の特徴,314は正解情
報(認識結果の第1位候補カテゴリに対応するコードデ
ータまたはオペレータが修正入力したコードデータ),
315は候補情報(例えば第1位から第R位までの候補
カテゴリと,その候補カテゴリに対応する距離値(d1
〜dR)),316は位置情報,317は信頼値情報で
ある。
【0016】信頼値情報317は,候補情報315に基
づいて認識結果が正解であるか否か,言い換えると認識
結果の信頼が高いか低いかの情報を格納したものであ
り,例えば信頼値の高い認識情報(信頼値情報317が
「0」)とは,認識結果の確認修正処理を行う前にオペ
レータが文字認識装置に設定・登録する認識辞書giと
第1位候補カテゴリとの距離ni,および第1位候補カ
テゴリと第2位候補カテゴリとの距離値の差mi,認識
情報に含まれる第1候補カテゴリの距離値(d1)と第
2位候補カテゴリの距離値(d2)との関係が d1<ni,かつd2−d1>mi の条件を満足する認識情報であり,信頼値の低い認識情
報(信頼値情報317が「1」)とは, d1>ni,あるいはd2−d1k<mi の条件を満足する認識情報である。
【0017】図3は,認識情報処理部36の詳細図であ
り,361は認識情報抽出部,362はソート結果格納
部,363は候補情報抽出部である。認識情報抽出部3
61は,認識情報格納部31の中から当該格納部に含ま
れる信頼値情報317に基づいて,信頼値の低い認識情
報を抽出する。次に,最初に抽出した認識情報の中から
文字の特徴313や候補情報315を基準にして,当該
認識情報とそれ以外の信頼値の低い認識情報とを類似し
ている順番に番号を付与し,その類似順位に従って認識
情報をソート,その結果をソート結果格納部362に格
納する。
【0018】また,前記条件で抽出されなかった信頼値
の高い認識情報は,認識情報抽出部361を介して修正
済み情報格納部33へ送られ保持される。なお,類似順
位の計算には文字の特徴や距離値から計算される値を用
いる。例えば,候補文字の場合は特願平63−1696
6号を用いればよい。
【0019】以上のような機能を各部に配置し,図1に
示すような構成にすることによって,モニタ部32にソ
ート結果格納部362の入力情報と候補カテゴリとを表
示することができ,それをオペレータが修正入力部35
から同じ文字カテゴリごとにグルーピングするとともに
正解を入力し,リジェクトされた多数の文字カテゴリを
一回の操作で一度に修正することができる。この具体的
な処理を図4を用いて説明し,オペレータの指示方法を
図5を用いて説明する。
【0020】図4は,ソート結果格納部362の中の認
識情報を示したものである。図中の記号311から31
7までは図2に対応し,318は類似順位,319はク
ラスタリング情報(入力文字情報を同一の文字カテゴリ
ごとにまとめた情報)である。
【0021】認識情報処理部36は,ソート結果格納部
362に格納されている全ての認識情報の中で最も小さ
い類似順位318から順番に入力文字情報312を抽出
し,モニタ部32に表示するとともにオペレータのクラ
スタリング処理を受け付ける。オペレータはモニタ部3
2に表示した入力文字情報312を目視により確認し,
修正入力部35からマウスやキーボードを用いて同一の
文字カテゴリに属する入力文字情報312のクラスタリ
ング(以降,オペレータが修正のためにモニタ部に表示
する入力文字情報を「修正文字情報」と呼ぶ)を行う。
【0022】修正処理部34は,修正入力部35の指示
に従ってクラスタリングされた認識情報を候補情報抽出
部363に送るとともに,クラスタリングされた情報
(例えば,クラスタリングされていれば「1」,それ以
外であれば「0」などの識別コード)をソート結果格納
部362のクラスタリング情報319に格納する。モニ
タ部32では,修正文字情報と入力文字情報を区別する
ため,修正文字情報に色付けや枠どりをしてオペレータ
に提示する。
【0023】候補情報抽出部363は,送られてきた認
識情報の中から候補情報315に含まれる候補カテゴリ
を抽出し,モニタ部32に表示するとともにオペレータ
の修正処理を受け付ける。
【0024】図5は,モニタ部32に表示した修正文字
情報および候補カテゴリの一例である。321は修正文
字情報,322は候補カテゴリ表示領域,323は候補
カテゴリである。
【0025】候補カテゴリの表示は,オペレータが入力
文字情報のクラスタリングを行った順番に,対応する候
補カテゴリを表示する。オペレータは,修正文字情報3
21とその修正文字情報321に対応する候補カテゴリ
323とを目視により確認し,候補カテゴリ323の中
に正解情報が存在すれば,その正解情報を修正入力部3
5からマウスやキーボードを用いて選択する。もし,候
補カテゴリ323の中に正解情報が存在しなかった場合
には,修正入力部35から日本語入力機能を用いて新た
な正解情報を入力する。修正処理部34は,修正入力部
35からの指示やクラスタリング情報319に従ってソ
ート結果格納部362の内容を正しいコードデータに書
き換える。
【0026】ソート結果格納部362は,位置情報31
6に基づいて正解情報の入力された認識情報を修正済み
情報格納部33の該当する格納場所に転送する。同時
に,修正文字情報321と候補カテゴリ323をディス
プレイ上から消去するとともに,クラスタリング情報3
19に従って未処理の認識情報の中から類似順位318
の小さい順に入力文字情報を抽出しディスプレイに再表
示する。オペレータはモニタ部32に表示された入力文
字情報が無くなるまで,クラスタリングおよび正解情報
の入力を繰り返す。
【0027】図6は,修正部3の一連の動作を示す処理
フローであり,点線で囲った部分が認識情報処理部36
の動作を示している。 (ステップ801)信頼値情報に基づいて,信頼値の低
い認識情報を抽出する。この時,信頼値の高い認識情報
は正解情報として修正済み情報格納部へ送られ保持され
る。
【0028】(ステップ802)信頼値の低い認識結果
と見なされて抽出された認識情報を所定のルールに従っ
て類似している順番にソートし,その結果をソート結果
格納部に送る。
【0029】(ステップ803)ソート結果格納部の中
から入力文字情報を抽出しディスプレイに表示する。 (ステップ804)オペレータは,ディスプレイに表示
した入力文字情報を目視によって確認し,注目カテゴリ
に属する入力文字情報のクラスタリングを行う。
【0030】(ステップ805)クラスタリングされた
認識情報の中から候補カテゴリを抽出し,ディスプレイ
に表示するとともにオペレータの修正処理を受け付け
る。 (ステップ806)オペレータは,候補カテゴリの中に
正解カテゴリが存在すれば該当する正解カテゴリを選択
する。もし,候補カテゴリの中に正解カテゴリが存在し
ない場合は,日本語入力機能を用いて新たな正解カテゴ
リを入力する。
【0031】(ステップ807)修正処理部34の指示
に従って,クラスタリングされた認識情報の中を正しい
コードデータに書き換える。また,書き換えられた認識
情報は修正済み情報格納部へ送られ保持される。さら
に,正解情報の入力された修正文字情報と候補カテゴリ
をディスプレイから消去し,未処理の認識結果に対しス
テップ804から再び同じ処理を繰り返す。
【0032】(ステップ808)オペレータは,全ての
認識情報を修正した時これを終了する。 (実施例2)特許請求の範囲の請求項2は,ディスプレ
イに表示する候補カテゴリをオペレータが見易く,選択
し易いように表示する方式である。
【0033】図7は,実施例2を説明するための図であ
る。図7では図3の認識情報処理部36の中に,認識情
報抽出部361,ソート結果格納部362,候補情報抽
出部363に加えて,カテゴリカウンタ部364,カテ
ゴリソート処理部365を新たに備えたことを特徴とす
る。
【0034】以下,図を用いて説明する。候補情報抽出
部363は,認識情報の中から候補カテゴリを抽出し,
カテゴリカウンタ部364へ送る。カテゴリカウンタ部
364は,候補を文字カテゴリごとに分けて出現回数を
カウントし,そのカウント値をカテゴリソート処理部3
65へ送る。同時に,各候補カテゴリの中から最初にカ
ウントした候補カテゴリもカテゴリソート処理部365
へ送る。カテゴリソート処理部365は,各候補カテゴ
リに対応したカウント値に従ってカウント値の多い順に
各候補カテゴリをソートし,その結果をディスプレイの
候補カテゴリ表示領域322に表示するとともに,オペ
レータの修正処理を受け付ける。
【0035】以上により,候補カテゴリ表示領域322
には,必要最小限の候補カテゴリ323を表示すること
ができ,更に,オペレータはディスプレイに表示された
候補カテゴリ323の中から正解情報をすばやく確認・
選択することが出来る。
【0036】(実施例3)実施例1では,認識結果に誤
認識が存在しない場合の処理であった。誤認識が含まれ
る場合に対するオペレータの確認修正処理においては,
一度認識結果をディスプレイに表示し,オペレータが認
識結果に含まれる誤り文字を特定文字コードに置き換え
て,その特定文字コードを自動で抽出できるようにする
ことで可能となる。具体的には,オペレータが置換した
特定文字コードを正解情報314に一旦格納するととも
に,信頼値情報317の中に修正を行ったことを意味す
る識別フラグ(例えば「1」)を格納する。以下信頼値
情報317を用いて実施例1と同様の処理を行う。
【0037】
【発明の効果】以上のように,本発明によれば,認識結
果に含まれる誤り文字を自動で抽出し,オペレータは抽
出された認識情報を文字カテゴリごとにまとめて修正操
作出来る。これによって,オペレータの修正に要する時
間を少なくすることができ,データ入力の生産性が向上
すると共に,修正操作を用意にすることが出来る。
【図面の簡単な説明】
【図1】本発明で対象とする確認修正処理方式を含む文
字認識装置の修正部の構成である。
【図2】認識情報格納部の中の認識情報の内容を示した
図である。
【図3】認識情報処理部の中の構成図を示している。
【図4】ソート結果格納部の中の認識情報の内容を示し
た図である。
【図5】モニタ部の表示の内容を説明するための図であ
る。
【図6】オペレータのクラスタリング,および修正の操
作と装置内の処理の流れとの関係を説明する図である。
【図7】候補カテゴリをまとめてから表示するための認
識情報処理部の中の構成図を示している。
【図8】文字認識装置の基本的な構成である。
【図9】文字認識装置の従来形の修正部の構成である。
【符号の説明】
1 入力部 2 認識部 3 修正部 4 出力部 5 制御部 31 認識情報格納部 32 モニタ部 33 修正済み情報格納部 34 修正処理部 35 修正入力部 36 認識情報処理部 361 認識情報抽出部 362 ソート結果格納部 363 候補情報抽出部 364 カテゴリカウンタ部 365 カテゴリソート処理部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 紙面上に書かれている文字情報を自動的
    に認識してデータにメディア変換する文字認識形のデー
    タ入力装置であって,文字情報を電気信号に変換する入
    力部と,変換された信号から文字の特徴を抽出し,あら
    かじめ用意された認識辞書と照合あるいは論理条件判定
    を行って入力された文字が何であるかを決定する認識部
    と,認識結果を目視や聞き取りによって確認し,誤りが
    存在すればオペレータが正解を入力して修正を行う修正
    部と,修正結果を外部へ送出する出力部と,これら全て
    を制御する制御部とからなる文字認識装置において,確
    認修正のために必要な認識情報であって,入力文字情
    報,文字の特徴,認識結果,認識結果に含まれる候補情
    報,および信頼値情報を保存しておく認識情報格納部
    と,認識情報格納部の中から,信頼値の低い認識情報を
    所定の順序にソートし,このソートされた順序で前記認
    識情報に含まれる入力文字情報および候補情報をディス
    プレイに表示する認識情報処理部と,ディスプレイに表
    示された入力文字情報に基づいて,オペレータが文字カ
    テゴリごとに複数個の認識情報を選択し,正解情報を一
    度に入力することを可能とする修正処理部とを備え,認
    識結果に含まれるリジェクト文字を正解情報に修正する
    ようにしたことを特徴とする文字認識装置の確認修正処
    理方式。
  2. 【請求項2】 前記請求項1記載の修正処理部におい
    て,オペレータが選択した認識情報の中に含まれる候補
    情報で同一の候補カテゴリが複数文字出現する場合に
    は,その候補カテゴリを出現数の多い順にソートし,か
    つ同一の候補カテゴリが一回だけ出現するようにまとめ
    てからディスプレイに表示出来るようにしたことを特徴
    とする文字認識装置の確認修正処理方式。
  3. 【請求項3】 前記請求項1記載の文字認識装置におい
    て,信頼値情報をオペレータが誤認識文字や誤り文字の
    代わりに入力する特定文字コードに置き換えて,確認や
    修正が出来るようにしたことを特徴とする文字認識装置
    の確認修正処理方式。
JP4191997A 1992-07-20 1992-07-20 文字認識装置の確認修正処理方式 Pending JPH0636066A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4191997A JPH0636066A (ja) 1992-07-20 1992-07-20 文字認識装置の確認修正処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4191997A JPH0636066A (ja) 1992-07-20 1992-07-20 文字認識装置の確認修正処理方式

Publications (1)

Publication Number Publication Date
JPH0636066A true JPH0636066A (ja) 1994-02-10

Family

ID=16283897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4191997A Pending JPH0636066A (ja) 1992-07-20 1992-07-20 文字認識装置の確認修正処理方式

Country Status (1)

Country Link
JP (1) JPH0636066A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111612157A (zh) * 2020-05-22 2020-09-01 四川无声信息技术有限公司 训练方法、文字识别方法、装置、存储介质及电子设备
US11200410B2 (en) 2018-09-14 2021-12-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11200410B2 (en) 2018-09-14 2021-12-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium
CN111612157A (zh) * 2020-05-22 2020-09-01 四川无声信息技术有限公司 训练方法、文字识别方法、装置、存储介质及电子设备
CN111612157B (zh) * 2020-05-22 2023-06-30 四川无声信息技术有限公司 训练方法、文字识别方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN109344237B (zh) 一种用于人机交互的信息处理的方法及装置
WO1998035314A2 (en) System and method for pattern recognition
CN115034200A (zh) 图纸信息提取方法、装置、电子设备及存储介质
CN106529470A (zh) 一种基于多级深度卷积神经网络的手势识别方法
JP3313272B2 (ja) 住所読み取り方法および識別関数重みベクトル生成方法
CN112416732B (zh) 一种基于隐马尔可夫模型的数据采集运行异常检测方法
JPH0696263A (ja) パターン認識装置
CN107797979B (zh) 分析装置和分析方法
JPH0636066A (ja) 文字認識装置の確認修正処理方式
US7111255B2 (en) Time-based evaluation of data verification results
JP2017111500A (ja) 文字認識装置及びプログラム
US6009267A (en) Apparatus for analyzing the task specification (business rule specification) of a source program
CN115357490A (zh) 一种针对移动应用的界面缩放缺陷检测方法及电子装置
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
JP3319203B2 (ja) 文書ファイリング方法及び装置
CN113850157A (zh) 一种基于神经网络的字符识别的方法
JPH0612520A (ja) 文字認識装置の確認修正方式
EP0724222A1 (en) Device and method for processing fuzzy data
CN114048524A (zh) 一种多方向文本比对方法
JPH0668261A (ja) パターン認識装置
JPH05108867A (ja) パターン認識装置
JPH06176191A (ja) 文字認識装置
JP3771369B2 (ja) 文字認識装置及び文字認識処理方法
JPH0411914B2 (ja)
JPH06309369A (ja) 情報検索装置