JPH03172982A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH03172982A
JPH03172982A JP1310532A JP31053289A JPH03172982A JP H03172982 A JPH03172982 A JP H03172982A JP 1310532 A JP1310532 A JP 1310532A JP 31053289 A JP31053289 A JP 31053289A JP H03172982 A JPH03172982 A JP H03172982A
Authority
JP
Japan
Prior art keywords
character
characters
level
recognition
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1310532A
Other languages
English (en)
Inventor
Akira Ukawa
宇川 彰
Toshio Takizawa
滝沢 俊男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1310532A priority Critical patent/JPH03172982A/ja
Publication of JPH03172982A publication Critical patent/JPH03172982A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識装置に関し、特に、認識不良文字に対
する措置をオペレータが的確に実行できるようにしたも
のである。
[従来の技術] 最近、各種の情報処理システムの入力装置として文字認
識装置が実用化されつつある。例えば、病院のカルテを
利用した精算業務システム、自動翻訳システム、個人情
報(住所、氏名)入力システム、商品情報が記載されて
いる伝票の処理システム等に利用されている。これらの
システム例の場合、認識対象文字(絵文字や記号等を含
む概念)は英数文字だけでなく、仮名、漢字をも含んで
いる。従って、文字認識装置が光学式であろうとオンラ
イン手書式であろうと、検索文字範囲が広いため、現在
のところ、全ての入力文字に対して認識率が100%と
いうわけにはいっていない。すなわち、認識不良文字の
発生を避けることができない。
このような認識不良文字に対しては、従来、認識不良で
あることを表す記号「?」を表示しなり、2値化状態の
イメージデータを認識文字列に近接した位置に表示しな
りして(特公昭57−46106号公報参照)オペレー
タに認識不良であることを知得させていた。いずれの場
合にせよ、これに対しては、オペレータはキー人力によ
って正しい文字の入力を行なっていた。
[発明が解決しようとする課題] ところで、オペレータに認識不良文字の発生を知得させ
る上述した第1の方法では、記号r7゜が文字列に含ま
れているなめ、オペレータがこれを見過ごすことがあり
、再入力を実行しない恐れを避けることができない。
また、認識不良文字に対しては、上述のように、キー人
力による文字の再入力を行っているが、かかる操作が面
倒であるということができる。すなわち、認識不良文字
となる文字の多くは複雑な漢字であり、仮名漢字変換入
力及び漢字選択のために多くのキータッチを必要とし、
入力操作が面倒であると共に、時間がかかる。文字認識
装置を利用する目的の一つはキー人力操作を減少させる
ためであり、キー人力に不慣れなオペレータが操作する
可能性も強く、キー人力による文字の再入力を頻繁に行
なわなければならないことは文字認識装置の本来の機能
面からみると問題である。
このような点を考慮してキー人力による文字の再入力を
少なくした文字認識装置も既に提案されている。すなわ
ち、認識不良文字であっても、多くの場合、装置はいく
つかに候補を絞っているので、候補文字を順次又は−括
的に全て表示して選択させる装置が提案されている。
しかし、このような装置であっても以下のような欠点を
有する。抜きんでた候補がなく候補数が非常に多い場合
には、選択のための画面切替えを繰り返し行なわなけれ
ばならず、時間がかがる。
また、全ての候補の中に正しい文字がない場合には、そ
の時点からキー人力による文字の再入力を実行しなけれ
ばならず、この場合には、当初からキー人力を用いた文
字の再入力を実行した方が時間的に有利であって問題で
ある。
また、認識程度が高くても低くても、認識不良でない限
り、第1候補文字を同一態様で表示する場合、誤認識文
字を見付けに<<、校正を行なっても抜けが多くなって
誤った文字のままであるものが生じる。
本発明は、上述した従来の問題は、認識不良文字を全て
一律に扱っていたなめに生じているという認識に立って
なされたものであり、オペレータが各認識不良文字に対
して適切な校正措置を講じることができる情報をオペレ
ータに与える、しかも、校正時間を短くすることができ
る文字認識装置を提供しようとするものである。
[課題を解決するための手段] かかる課題を解決するため、本発明は、入力された各文
字を認識する文字認識装置において、各入力文字に対し
て認識された文字に、その認識程度を表すレベル情報を
付加するレベル情報付加手段を設け、このレベル情報を
付加して認識された文字を表示出力又は印字出力するよ
うにしたものである。
[作用] 認識された文字に対する認識レベルをオペレータが知得
できたならば、認識不良文字に対してその認識レベルに
応じた適切、迅速な文字確定処理(校正処理)を実行で
きると考えられる。
そこで、本発明では、レベル情報付加手段を設け、各入
力文字に対して認識された文字に、その認識程度を表す
レベル情報を付加して認識された文字を表示出力又は印
字出力するようにした。
[実施例] 以下、本発明を光学式文字認識装置に適用した一実施例
を図面を参照しながら詳述する。
ここで、第1図〜第4図が実施例に係わる図であって、
第1図は認識処理フローチャート、第2図は文字認識装
置の構成を示すブロック図、第3図は認識レベルによる
表示の違いを示す説明図、第4図は校正処理フローチャ
ートである。
この実施例の光学式文字認識装置1は、第2図に示すよ
うに、文字列が記載されている図示しない原稿を光学的
に読取る画像読取り部2と、読取り画像から文字列の各
文字を認識する認識処理本体3と、認識結果を表示出力
する多色表示可能な表示出力部4と、認識結果を印字出
力する印字出力部5と、認識処理や校正処理の起動コマ
ンド等の各種コマンドや校正に必要な情報等を入力する
キー人力部6とから構成されている。
認識処理本体3は、より詳細には、全体の制御を司る中
央処理ユニット10と、画像読取り部2からの画像信号
を2値化したり正規化したりノイズ除去したりする前処
理部11と、後述する第1図及び第4図に示す処理アル
ゴリズム等を記憶しているアルゴリズムメモリ12と、
認識前の入力画像のデータや認識後の結果データや認識
レベルデータ等を記憶するデータメモリ13と、認識処
理に利用される各文字についての基準文字情報を記憶し
ている辞書メモリ14とから構成されている。
なお、中央処理ユニット10と、アルゴリズムメモリ1
2に格納されている第1図の処理アルゴリズム部分とが
、上述したレベル情報付加手段を構成している。
次に、このような構成を有する光学式文字認識装置1の
認識時の処理を、第1図を用いて説明する。
入力画像に含まれる各文字に対して、従来と同様な方法
で文字認識を行なう(ステップ100)。
例えば、文字領域の切出し、ストローク化、画数判定、
辞書白基準文字とのマツチング等の各種の処理を通じて
文字認識を行なう。
次いで、認識結果をレベル分けする(ステップ101)
。この実施例の場合、レベル分けを、最も正解であると
考えられる第1候補の認識程度(類似度)によって行な
う。例えば、第1候補の認識程度を他の候補と比較した
ときに、その正解率がほぼ100%の場合にレベル1の
認識結果とし、はぼ90%の場合にレベル2の認識結果
とし、はぼ50%の場合にレベル3の認識結果とし、そ
れより小さい場合にレベル4の認識結果とする。
認識結果がレベル1の場合には、第1候補の認識文字を
確定させて良いことを表すレベル1フラグをセットして
認識された1個の文字をデータメモリ13に格納させる
と共に、表示出力部4にその認識文字を白色表示させる
(ステップ102.103)。なお、この実施例の場合
、表示出力部4における背景色がグレーであるとする。
認識結果がレベル2の場合には、候補が2.3程度に限
定されたことを表すレベル2フラグをセットして認識さ
れた候補文字全てをデータメモリ13に格納させると共
に、表示出力部4にそのうちの第1候補の認識文字を黄
色表示させる(ステップ104.105)。
認識結果がレベル3の場合には、候補が多数(3〜4以
上)あることを表すレベル3フラグをセットして認識さ
れた候補文字全てをデータメモリ13に格納させると共
に、表示出力部4にそのうちの第1候補の認識文字を赤
色表示させる(ステップ106.107)。
認識結果がレベル4の場合には、候補を限定できない程
度に認識不良であったことを表すレベル4フラグをセッ
トしてその不良あることをデータメモリ13に格納させ
ると共に、表示出力部4に記号「?」を青色表示させる
(ステップ108゜109)。
このようにして原稿に記載されている文字列の各文字を
認識してその認識された文字を表示出力部4に多色表示
させる。
例えば、文字列「文字の認識をする装置の話」に対して
認識処理した結果、そのうちの文字「認」及び「識」の
レベルが2で、文字「話」のレベルが3で、他の文字の
レベルが1であると、第3図に示すように、文字「認」
及び「識」が黄色で表示され、文字「話」が赤色で表示
され、他の文字が白色で表示される。
次に、レベル2〜4に属する認識不良文字である未確定
文字を決定させる校正処理について、第4図を用いて説
明する。
例えば、キー人力部6を介してこの校正処理モードが指
示されると、第4図に示す処理アルゴリズムを開始する
文字列順序に従った1個の文字の認識結果レベルを取出
し、その認識結果レベルがレベル1か又はレベル2〜4
のいずれであるかを判別する(ステップ120.121
)。レベル1の場合には、確定処理が不必要であるので
、次の順番の文字の認識結果レベルの取出しくステップ
120)に進む。
他方、レベルがレベル2〜4に属する文字であると、表
示出力部4に表示されているその文字の第1候補文字に
カーソルを位置させ、その後、レベルフラグに基づいて
レベルを具体的に判別する(ステップ122,123)
レベル2であると判別すると、まず文字確定が指示され
たか否かを判断する(ステップ124)。
確定が指示されると、そのときに表示出力部4に表示さ
せていた候補文字に対する確定処理を行ない、すなわち
、その候補文字を確定文字としてデータメモリ13に格
納させると共に白色表示させる(ステップ125)。そ
の後、全ての文字を校正の処理対象とした処理が終了し
ていないことを確認して次の文字の校正処理(ステップ
120)に進む(ステップ126)。
確定が指示されない場合には、次候補表示が指示された
か否かを判断する(ステップ127)。
指示された場合には、認識処理で次に正解である可能性
が高いと判別された候補文字を取出して、色を変えずに
、すなわち、黄色でその候補文字を表示させて確定指示
判断(ステップ124)に戻る(ステップ128)。
次候補表示が指示されない場合には、キーによる文字入
力が指示されたか否かを判断する(ステップ129>、
指示されない場合には確定指示判断(ステップ124)
に直ちに戻る。他方、指示された場合には、キー人力部
6から入力文字を取込んでその入力文字を確定文字とし
てデータメモリ13に格納させると共に白色表示させる
(ステップ130.131)。その後、全文字を校正の
処理対象とした処理が終了していないことを確認する上
述した処理(ステップ126)に進む。
上述したレベル判別(ステップ123)によってレベル
3という結果を得た場合も、レベル2の場合とほぼ同様
な処理を行なう。相違点は候補文字の一括表示による選
択確定操作を認めた点である。この処理の違いは、候補
文字数の多少の違いによる。
すなわち、表示文字の確定が指示されず(ステップ13
2)、かつ次候補文字への表示切替が指示されない場合
(ステップ133)には、候補文字の一括表示選択処理
が指示されたか否かを判別する(ステップ135)。指
示されない場合には、キーによる文字入力が指示された
か否かの判断処理に進む(ステップ136)。他方、−
柄表示選択処理が指示されると、その文字に関する全て
の候補文字を取出して、表示出力部4の認識文字列の表
示エリア外に選択用番号を付して表示させ、選択された
番号を取込み、収り込んだ番号の候補文字に対する確定
処理を行なう(ステップ137〜139)。なお、番号
の指定がない未選択状態ではキーによる文字入力が指示
されたか否かの処理(ステップ136)に進む。この場
合の確定処理は、その選択文字を確定文字としてデータ
メモリ13に格納させると共にその文字を表示文字列の
所定位置に白色表示させる。この確定処理が終了した場
合は、全文字を校正の処理対象とした処理が終了してい
ないことを確認する処理(ステップ126)に進む。
上述したレベル判別(ステップ123)によってレベル
4という結果を得た場合は、キーによる入力文字の取込
みを直ちに行なう(上述したステップ130)。
このような処理を繰返しながら、全ての文字を一度は校
正対象としながら、レベル2〜4の各文字に対して文字
の確定動作を行なっていく。
上述の実施例によれば、認識対象文字の認識結果をレベ
ル分けして色表示したので、オペレータは認識レベルを
知得することができ、校正処理時に無駄な操作を行なう
ことなく迅速に文字の確定を行なうことができる。また
、レベル分けを導入したので、文字確定の基本的操作を
上述のようにレベルによって変えることができてこの点
からも操作性を向上させることができる。全ての認識不
良文字に対してキーによる文字入力の措置だけに限定さ
れていないので、認識程度が高いものに対しては適宜候
補選択を適用できて操作性を向上させることができる。
さらに、認識レベルの違いを色の違いで表示しているた
め、認識不良文字(レベル2〜4の文字)の存在をオペ
レータが確実に認識することができる。
本発明は、上述した実施例に限定されるものではなく、
以下のような変形を施したものであっても良い。
レベルを明確にする表示方法としては、上述した実施例
のものの他に、第5図(A)に示すような文字部分20
.21の色は同じであるが各文字領域での背景(フィー
ルド)22.23の色が異なるようにする方法や、第5
図(B)に示すような表示した文字25に近接してレベ
ルを表す番号26を表示する方法を適用しても良い。特
に、後者の表示方法は、白黒の表示出力部でも適用でき
るという利点を有する。なお、白黒の表示出力部に対す
るレベルの表示方法として、反転表示や点滅表示を利用
してレベルの違いを表す方法を適用することができる。
レベルを分ける観点としては、上述した第1候補につい
ての認識程度(類似度)によって分けるものの他、例え
ば、類似度が所定の閾値を越えている候補文字数によっ
て分けることも適用することができる。レベル数は上記
実施例のものに限定されないことは勿論である。
上述では、レベル分けして表示を行なうものを示したが
、印字出力でもレベルを分けた出力(例えば色を変えた
文字印字)を行なうようにしても良い。認識文字の校正
をまず用紙上に印字されたもので行なうオペレータにと
っては、このようなレベル分は印字の意義が大きい。
上記実施例においては、光学式文字認識装置に本発明を
適用したものを示したが、オンライン手書文字認識装置
に適用することもできる。
また、本発明は漢字を認識対象とする装置を意識してな
されたものであるが、漢字を認識対象としない文字認識
装置に対しても適用することができる。
[発明の効果] 以上のように、本発明によれば、認識結果をレベル分け
して認識文字と一緒に出力するようにしたので、オペレ
ータが各認識文字に対するレベルを知得することができ
、各認識不良文字に対して適切な校正措置を講じること
ができ、また、校正時間を短くすることができる。
【図面の簡単な説明】
第1図は本発明による文字認識装置の一実施例の認識処
理フローチャート、第2図はその実施例の文字認識装置
の構成を示すブロック図、第3図は実施例の認識レベル
による表示の相違を示す説明図、第4図は実施例の校正
処理フローチャート、第5図は他のレベル分は表示方法
を示す説明図である。 1・・・光学式文字認識装置、2・・・画像読取り部、
3・・・認識処理本体、4・・・表示出力部、5・・・
印字出力部、6・・・キー人力部、10・・・中央処理
ユニット、11・・・前処理部、12・・・アルゴリズ
ムメモリ、13・・・データメモリ、14・・・辞書メ
モリ。 実施例の認識処理フトチ會−ト 第1図

Claims (5)

    【特許請求の範囲】
  1. (1)入力された各文字を認識する文字認識装置におい
    て、 各入力文字に対して認識された文字に、その認識程度を
    表すレベル情報を付加するレベル情報付加手段を設け、
    このレベル情報を付加して認識された文字を表示出力又
    は印字出力するようにしたことを特徴とする文字認識装
    置。
  2. (2)上記レベル情報が表すレベルを、第1候補文字の
    類似度に基づいて決定することを特徴とする請求項第1
    項に記載の文字認識装置。
  3. (3)上記レベル情報が表すレベルを、所定の閾値以上
    の類似度を有する候補文字数に基づいて決定することを
    特徴とする請求項第1項に記載の文字認識装置。
  4. (4)上記レベル情報が、色の相違でレベルの相違を表
    すものであることを特徴とする請求項第1項〜第3項の
    いずれかに記載の文字認識装置。
  5. (5)上記レベル情報が、レベルを表す文字であること
    を特徴とする請求項第1項〜第3項のいずれかに記載の
    文字認識装置。
JP1310532A 1989-12-01 1989-12-01 文字認識装置 Pending JPH03172982A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1310532A JPH03172982A (ja) 1989-12-01 1989-12-01 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1310532A JPH03172982A (ja) 1989-12-01 1989-12-01 文字認識装置

Publications (1)

Publication Number Publication Date
JPH03172982A true JPH03172982A (ja) 1991-07-26

Family

ID=18006367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1310532A Pending JPH03172982A (ja) 1989-12-01 1989-12-01 文字認識装置

Country Status (1)

Country Link
JP (1) JPH03172982A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292999A (ja) * 1995-04-24 1996-11-05 Nec Corp 文字認識装置
JP2010231440A (ja) * 2009-03-26 2010-10-14 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JP2015032017A (ja) * 2013-07-31 2015-02-16 京セラドキュメントソリューションズ株式会社 画像形成装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5324733A (en) * 1976-08-20 1978-03-07 Hitachi Ltd Cha racter reader
JPS60142792A (ja) * 1983-12-29 1985-07-27 Fujitsu Ltd 多種文字認識装置
JPS60217483A (ja) * 1984-04-12 1985-10-31 Toshiba Corp 文字認識装置
JPS616430B2 (ja) * 1980-06-03 1986-02-26 Mitsubishi Electric Corp

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5324733A (en) * 1976-08-20 1978-03-07 Hitachi Ltd Cha racter reader
JPS616430B2 (ja) * 1980-06-03 1986-02-26 Mitsubishi Electric Corp
JPS60142792A (ja) * 1983-12-29 1985-07-27 Fujitsu Ltd 多種文字認識装置
JPS60217483A (ja) * 1984-04-12 1985-10-31 Toshiba Corp 文字認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08292999A (ja) * 1995-04-24 1996-11-05 Nec Corp 文字認識装置
JP2010231440A (ja) * 2009-03-26 2010-10-14 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JP2015032017A (ja) * 2013-07-31 2015-02-16 京セラドキュメントソリューションズ株式会社 画像形成装置

Similar Documents

Publication Publication Date Title
US5119437A (en) Tabular document reader service
KR102297232B1 (ko) 형태학적 영상처리를 활용한 이상 탐지 방법
JPH03172982A (ja) 文字認識装置
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JPH0573725A (ja) 手書き文字・図形認識装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2002366900A (ja) 光学式文字読取装置
KR100332752B1 (ko) 문자인식방법
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPS60217483A (ja) 文字認識装置
JPS62281082A (ja) 文字認識装置
JPS6089290A (ja) パタ−ン認識方法
JP3221969B2 (ja) 文字認識装置
JPH0612520A (ja) 文字認識装置の確認修正方式
JPH03240183A (ja) 認識文字自動修正方式
CN117746432A (zh) 一种文本拼接方法、装置、电子设备及存储介质
JPH06282680A (ja) 文字認識処理装置
JPH06223221A (ja) 文字認識装置
JPH01298483A (ja) 画像認識装置
JPH07141468A (ja) 手書入力文字装置における手書文字認識処理方法
JPH01162993A (ja) オンライン手書文字認識装置
JPH06208649A (ja) 文字認識装置
JPH07334611A (ja) 非認識文字の表示方法
JPS63157292A (ja) 手書き漢字ocr装置
JP2002074262A (ja) 認識文字修正方法