JPH09212586A - 文字読取方法 - Google Patents

文字読取方法

Info

Publication number
JPH09212586A
JPH09212586A JP8014145A JP1414596A JPH09212586A JP H09212586 A JPH09212586 A JP H09212586A JP 8014145 A JP8014145 A JP 8014145A JP 1414596 A JP1414596 A JP 1414596A JP H09212586 A JPH09212586 A JP H09212586A
Authority
JP
Japan
Prior art keywords
character
check digit
character string
result
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8014145A
Other languages
English (en)
Inventor
Masato Suda
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8014145A priority Critical patent/JPH09212586A/ja
Publication of JPH09212586A publication Critical patent/JPH09212586A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】チェックデジット無し文字列に対する認識エラ
ーの発生をしにくくできるとともに、高い認識性能とオ
ペレータへの効果的な指示が決定でき、効率的な文字読
取りが可能となる文字読取方法を提供する。 【解決手段】同一帳票内のチェックデジット付き文字列
とチェックデジット無し文字列とを読取る場合、まずチ
ェックデジット付き文字列に対して各文字ごとに辞書情
報との類似度演算を行い、次にこの類似度演算結果に対
しチェックデジットを用いた演算を行うことにより演算
結果の正読、エラー検出、リジェクト回復の結果を得、
次にチェックデジット無し文字列に対して各文字ごとに
辞書情報との類似度演算を行うことにより1位および2
位の類似度値を得て、これら1位と2位の類似度値の相
対差を上記チェックデジット演算の結果に応じて決定さ
れる閾値と比較することにより正読、エラー、リジェク
トの判定を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、たとえば、同一帳
票内に存在するチェックデジット付き文字列とチェック
デジット無し文字列とを読取る文字読取方法に関する。
【0002】
【従来の技術】近年、文字読取装置の技術は手書き漢字
の領域まで認識技術が発展している。オフイスオートメ
ーションにおける文字読取装置は、英字、数字、シンボ
ルを読取り、計算機へのデータ入力を行なう窓口業務、
事務処理において合理化、効率化に多大な貢献をなして
いる。ファクトリオートメーションにおいても、刻印ま
たは捺印された英字、数字の文字を読んで各種生産物の
流れを管理したり、生産ラインの生産物の仕分けを行な
ったりしている。また、郵便物の処理においても、郵便
番号の読取りから漢字、片仮名で記載された姓名、住所
の読取りへと進展し、配達区分の自動化に貢献してい
る。
【0003】このような、各種用途に多用されている文
字読取装置であっても、いまだ完全な認識率は得られ
ず、その補完のため、その用途に応じて各種後処理が施
されている。たとえば、住所の読取りにおいては単語認
識、窓口業務、事務処理では1行内における文字数チェ
ック、桁位置での文字種限定認識、年月日などの範囲チ
ェック、チェックデジット付き文字列のチェックなどで
ある。さらに、これら後処理の段階で正解文字の回復、
エラー(誤読)文字の検出なども行なっている。
【0004】
【発明が解決しようとする課題】窓口業務における各種
帳票の印刷活字文字の読取り対象となる帳票には、チェ
ックデジットが付加されているものが多いが、全ての対
象文字列に付加されているわけではなく、人手による読
取結果の最終確認は避けられない。エラー文字の確認の
ためには、常に全文字を目視チェックする必要がある。
通常、読取対象文字列とその読取結果を対にして表示
し、リジェクト文字であれば、白黒反転させたりブリン
クさせることで、オペレータに指示を促している。
【0005】また、帳票によっては複数の同一単語、ま
たは、複数の文字列のうち、チェックデジット付き文字
列とチェックデジット無し文字列と混在したものがあ
る。そこで、本発明は、同一単語同士をチェックした
り、チェックデジット付加情報をチェックデジット無し
文字列の認識へ反映させ、チェックデジット無し文字列
に対する認識エラーの発生をしにくくできるとともに、
高い認識性能とオペレータへの効果的な指示が決定で
き、効率的な文字読取りが可能となる文字読取方法を提
供することを目的とする。
【0006】
【課題を解決するための手段】本発明の文字読取方法
は、同一記録媒体内に存在するチェックデジット付き文
字列とチェックデジット無し文字列とを読取るもので、
チェックデジット付き文字列を認識し、このチェックデ
ジット付き文字列の認識結果に応じて判定基準を変えて
チェックデジット無し文字列の認識を行なうことを特徴
とする。
【0007】また、本発明の文字読取方法は、同一記録
媒体内に存在するチェックデジット付き文字列とチェッ
クデジット無し文字列とを読取るもので、まずチェック
デジット付き文字列に対して各文字ごとに辞書情報との
類似度演算を行ない、次にこの類似度演算の結果に対し
1位の類似度値と2位の類似度値との差に関連した判定
基準に基づいて認識文字の判定を行ない、この判定結果
に対してチェックデジットを用いたチェックデジット演
算を行なうことにより演算結果の正読、エラー検出、リ
ジェクト回復の結果を得、次にチェックデジット無し文
字列に対して各文字ごとに辞書情報との類似度演算を行
なうことにより1位の類似度値および2位の類似度値を
得て、これら1位と2位の類似度値を、前記チェックデ
ジット演算の結果に応じて決定される所定の判定基準と
比較することにより正読、エラー、リジェクトの判定を
行なうことを特徴とする。
【0008】また、本発明の文字読取方法は、同一記録
媒体内に存在する複数の同一単語を読取るもので、まず
複数の同一単語を各文字ごとにそれぞれ認識し、次に対
応する複数の同一単語の各文字の認識結果を比較するこ
とにより、認識確度の低い認識結果は認識確度の高い認
識結果に変更することを特徴とする。
【0009】さらに、本発明の文字読取方法は、同一記
録媒体内に存在する複数の同一単語を読取るもので、ま
ず一方の単語に対して各文字ごとに辞書情報との類似度
演算を行なうことにより正読、リジェクトの判定を行な
い、次に他方の単語に対して各文字ごとに辞書情報との
類似度演算を行なうことにより正読、リジェクトの判定
を行ない、次にこれら両単語の各判定結果を各文字ごと
に比較して、両方の判定結果を基に最終回答を得ること
を特徴とする。
【0010】本発明によれば、同一記録媒体内のチェッ
クデジット付き文字列とチェックデジット無し文字列と
を読取る場合、チェックデジット付き文字列の認識結果
をチェックデジット無し文字列の認識に反映すること
で、チェックデジット無し文字列に対する認識エラーの
発生をしにくくできるとともに、高い認識性能とオペレ
ータへの効果的な指示が決定でき、効率的な文字読取り
が期待できる。
【0011】また、本発明によれば、同一記録媒体内の
複数の同一単語を読取る場合、複数の同一単語の各認識
結果を比較し、認識確度の低い認識結果は認識確度の高
い認識結果に変更することで、高い認識性能とオペレー
タへの効果的な指示が決定でき、効率的な文字読取りが
期待できる。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。まず、第1の実施の形態に
ついて説明する。図1は、本実施の形態に係る文字読取
方法が適用される文字読取装置の構成を概略的に示すも
のである。図1において、光電変換部1は、たとえば、
後述するような複数の文字列が記録されている記録媒体
としての帳票P上に光を照射する光源と、帳票P上から
の反射光を受光して電気信号に変換するCCD形ライン
センサなどの光電変換器と、光源からの光を帳票P上に
導き、その反射光を光電変換器の受光面に導く光学系な
どからなり、帳票P上を光学的に走査することにより、
帳票P上の文字画像を電気信号(アナログ信号)に変換
するようになっている。
【0013】光電変換部1から出力されるアナログ信号
は、A/D変換部2でデジタル信号に変換された後、2
値化部3で“1”,“0”の信号に2値化される。2値
化部3から出力される2値化画像は、文字行切出部4に
送られ、ここで文字行単位に切出される。文字行切出部
4で切出された各文字行は、文字切出部5に送られ、こ
こで文字単位の切出しが行なわれる。
【0014】文字切出部5で切出された各文字は、正規
化部6でサイズの正規化が行なわれた後、標本化部7で
類似度演算のための標本化パターンとして生成され、識
別部8に送られる。識別部8は、標本化部7からの標本
化パターンと辞書情報との類似度演算を行ない、答(候
補文字)と類似度値を得るもので、たとえば、図2に示
すように、類似度演算部11および辞書12によって構
成されている。
【0015】識別部8の識別結果は、後処理部9に送ら
れる。後処理部9は、識別部8からの答と類似度値を評
価・編集するもので、たとえば、図2に示すように、チ
ェックデジット演算部13、判定部14および編集部1
5によって構成されている。後処理部9の処理結果は、
表示部10に送られ、オペレータに対して表示出力する
ようになっている。
【0016】図3は、帳票Pの一例を示すもので、たと
えば、2行の文字列16,17が印刷記録されている。
上位の1行目の文字列16は、チェックデジット付き文
字列であり、下位の2行目の文字列17は、チェックデ
ジット無し文字列である。チェックデジット付き文字列
16において、下部に実線を付してある桁の文字
“8”,“1”,“0”がチェックデジットコードを意
味する。
【0017】チェックデジット“8”の算出は、たとえ
ば、1桁目の文字“H”から9桁目の文字“5”までに
“321”の繰返しデータを掛け合わせたものを「1
0」で割り、その余りを充てている。チェックデジット
“1”は、11桁目の文字“9”から16桁目の文字
“5”までを、上記同様の処理で求めたものである。右
端のチェックデジット“0”は、文字列16全体のチェ
ックデジットで、上記同様の処理を左端(1桁目)の文
字“H”から右端(17桁目)の文字“1”で行なうこ
とで、算出される。
【0018】以下、図2の構成図および図4のフローチ
ャートを参照してチェックデジット処理とその後処理に
ついて説明する。まず、入力された1行目の文字列16
の標本化パターンは、標本化部7から類似度演算部11
に送られ、ここで辞書12内の辞書情報との類似度演算
を各文字ごとに行ない、その文字列に対する各文字ごと
の演算結果(1位と2位の候補文字と、それらの類似度
値などからなる)をチェックデジット演算部13に送
る。
【0019】チェックデジット演算部13は、類似度演
算部11の演算結果に対して、そのチェックデジットを
用いた周知のチェックデジット演算を行なうことによ
り、演算結果の正読、エラー検出(チェックデジットに
よるチェック結果が異状)、リジェクト回復(1位と2
位の候補文字の類似度値の差が小さく、判定が困難なリ
ジェクト結果をチェックデジット演算により一方に確
定)の結果を得て、その結果を示す情報を判定部14に
送る。判定部14は、チェックデジット演算部13から
送られてきた情報にエラー検出が無いかどうか判定し、
エラー検出の情報があれば、その情報を類似度演算部1
1にフィードバックする。
【0020】この場合、類似度演算部11においては、
正読、リジェクトの判定を1位と2位の候補文字の類似
度値の相対差により決定している。相対差とは、1位の
類似度値から2位の類似度値を引いた値を1位の類似度
値で割った値であり、この相対差が判定基準であるあら
かじめ設定される所定の閾値よりも大きければ正読(あ
るいは、エラー)と判定し、小さければリジェクトと判
定している。
【0021】次に、類似度演算部11は、入力された2
行目の文字列17に対して、1行目と同様に辞書情報と
の類似度演算処理を行なう。このとき、判定部14から
フィードバックされた情報がエラー検出であれば、類似
度演算部11は、上記相対差の閾値の値を大きくするこ
とにより、2行目の文字列17に対する判定でエラーを
少なくし、リジェクトがでやすいようにする。
【0022】一方、1行目の文字列16に対するチェッ
クデジット演算の結果が正読、あるいは、リジェクトの
情報であれば、判定部14から類似度演算部11へのフ
ィードバック情報は出力されない。したがって、この場
合、類似度演算部11は、上相対差の記閾値の値を変更
することなく、2行目の文字列17に対する正読、リジ
ェクトの判定処理を行なう。
【0023】こうして処理された各文字列16,17の
処理結果は、それぞれ編集部15に送られ、ここで1行
目と2行目に並びを編集されて表示部10へ送られ、オ
ペレータに対して表示出力される。
【0024】このように、第1の実施の形態によれば、
同一帳票P内のチェックデジット付き文字列16とチェ
ックデジット無し文字列17を読取る場合、チェックデ
ジット付き文字列16の認識結果をチェックデジット無
し文字列17の認識に反映することで、チェックデジッ
ト無し文字列17に対する認識エラーの発生をしにくく
できるとともに、高い認識性能とオペレータへの効果的
な指示が行なえ、効率的な文字読取りが期待できる。
【0025】次に、第2の実施の形態について説明す
る。第2の実施の形態の第1の実施の形態と異なる点
は、後処理部9の構成が異なるだけで、その他の部分は
前述した第1の実施の形態と同様である。図5は、後処
理部9の構成を示しており、図示のように特定文字認識
結果バッファ18、および、比較判定部19によって構
成されている。
【0026】以下、図5の構成図および図6のフローチ
ャートを参照して特定文字列の答えを決定するための後
処理について説明する。図3に示した例の帳票P上の文
字列16,17は、前述したように、1行目から類似度
演算部11に入力され、辞書12の辞書情報との類似度
演算により各文字ごとの答と類似度値を求める。
【0027】帳票P上における1行目の文字列16と2
行目の文字列17の同一単語の存在する文字位置は既知
であり、図3の帳票P上の同一単語である文字“HD
D”は、1行目の文字列16では左端(1桁目)からの
記録、2行目の文字列17では4桁目から記録されてい
る。
【0028】特定文字認識結果バッファ18は、類似度
演算部11から出力された1行目の文字列16における
文字“H”と“D”と“D”の各答を格納する。次に、
比較判定部19は、類似度演算部11から出力される2
行目の文字列17に対する類似度演算の結果、つまり、
2行目の文字列17における文字“H”と“D”と
“D”の各答を受取ることにより、特定文字認識結果バ
ッファ18に格納されている1行目の文字列16におけ
る文字“H”と“D”と“D”の各答とをそれぞれ比較
する。比較の結果、両方が同じ答えであれば、それらを
最終的な答として確定するが、一方が正読で他方がリジ
ェクトの場合は、他方のリジェクト文字を一方の正読文
字と同じ文字に変更する。さらに、両方の答が異なる場
合は、両方の答をそれぞれリジェクト文字にする。
【0029】こうして処理された各文字列16,17の
処理結果は、それぞれ表示部10へ送られ、オペレータ
に対して表示出力される。この場合、表示部10は、た
とえば、リジェクト文字をブリンク表示するなどして、
最終結果を決定する。
【0030】このように、第2の実施の形態によれば、
同一帳票P内の2つの同一単語を読取る場合、2つの同
一単語の各認識結果を比較し、認識確度の低い認識結果
は認識確度の高い認識結果に変更することで、高い認識
性能とオペレータへの効果的な指示が行なえ、効率的な
文字読取りが期待できる。なお、上述した第1の実施の
形態と第2の実施の形態とを組合わせて用いることも、
もちろん可能である。
【0031】
【発明の効果】以上詳述したように本発明によれば、同
一単語同士をチェックしたり、チェックデジット付加情
報をチェックデジット無し文字列の認識へ反映させ、チ
ェックデジット無し文字列に対する認識エラーの発生を
しにくくできるとともに、高い認識性能とオペレータへ
の効果的な指示が決定でき、効率的な文字読取りが可能
となる文字読取方法を提供できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る文字読取方法
が適用される文字読取装置の構成を概略的に示すブロッ
ク図。
【図2】図1の識別部および後処理部の具体的な構成を
示すブロック図。
【図3】帳票と文字列の一例を示す図。
【図4】第1の実施の形態に係る文字読取方法の処理を
説明するフローチャート。
【図5】本発明の第2の実施の形態に係る識別部および
後処理部の具体的な構成を示すブロック図。
【図6】第2の実施の形態に係る文字読取方法の処理を
説明するフローチャート。
【符号の説明】
P……帳票(記録媒体)、1……光電変換部、2……A
/D変換部、3……2値化部、4……文字行切出部、5
……文字切出部、6……正規化部、7……標本化部、8
……識別部、9……後処理部、10……表示部、11…
…類似度演算部、12……辞書、13……チェックデジ
ット演算部、14……判定部、15……編集部、16…
…チェックデジット付き文字列、17……チェックデジ
ット無し文字列、18……特定文字認識結果バッファ、
19……比較判定部。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 同一記録媒体内に存在するチェックデジ
    ット付き文字列とチェックデジット無し文字列とを読取
    るもので、チェックデジット付き文字列を認識し、この
    チェックデジット付き文字列の認識結果に応じて判定基
    準を変えてチェックデジット無し文字列の認識を行なう
    ことを特徴とする文字読取方法。
  2. 【請求項2】 同一記録媒体内に存在するチェックデジ
    ット付き文字列とチェックデジット無し文字列とを読取
    るもので、まずチェックデジット付き文字列に対して各
    文字ごとに辞書情報との類似度演算を行ない、次にこの
    類似度演算の結果に対し1位の類似度値と2位の類似度
    値との差に関連した判定基準に基づいて認識文字の判定
    を行ない、この判定結果に対してチェックデジットを用
    いたチェックデジット演算を行なうことにより演算結果
    の正読、エラー検出、リジェクト回復の結果を得、次に
    チェックデジット無し文字列に対して各文字ごとに辞書
    情報との類似度演算を行なうことにより1位の類似度値
    および2位の類似度値を得て、これら1位と2位の類似
    度値を、前記チェックデジット演算の結果に応じて決定
    される所定の判定基準と比較することにより正読、エラ
    ー、リジェクトの判定を行なうことを特徴とする文字読
    取方法。
  3. 【請求項3】 前記チェックデジット演算によりエラー
    検出の結果が得られた場合、前記判定基準をリジェクト
    がでやすい方向の値に変更してチェックデジット無し文
    字列に対する処理を行なうことを特徴とする請求項2記
    載の文字読取方法。
  4. 【請求項4】 前記チェックデジット演算により正読あ
    るいはリジェクトの結果が得られた場合、前記判定基準
    を変更することなくチェックデジット無し文字列に対す
    る処理を行なうことを特徴とする請求項2記載の文字読
    取方法。
  5. 【請求項5】 同一記録媒体内に存在する複数の同一単
    語を読取るもので、まず複数の同一単語を各文字ごとに
    それぞれ認識し、次に対応する複数の同一単語の各文字
    の認識結果を比較することにより、認識確度の低い認識
    結果は認識確度の高い認識結果に変更することを特徴と
    する文字読取方法。
  6. 【請求項6】 同一記録媒体内に存在する複数の同一単
    語を読取るもので、まず一方の単語に対して各文字ごと
    に辞書情報との類似度演算を行なうことにより正読、リ
    ジェクトの判定を行ない、次に他方の単語に対して各文
    字ごとに辞書情報との類似度演算を行なうことにより正
    読、リジェクトの判定を行ない、次にこれら両単語の各
    判定結果を各文字ごとに比較して、両方の判定結果を基
    に最終回答を得ることを特徴とする文字読取方法。
  7. 【請求項7】 両単語の各判定結果を比較した結果、対
    応する特定の文字が正読とリジェクトであった場合、リ
    ジェクト文字を正読に変更することにより最終回答を得
    ることを特徴とする請求項6記載の文字読取方法。
  8. 【請求項8】 両単語の各判定結果を比較した結果、対
    応する特定の文字が不一致であった場合、両方の文字と
    もリジェクトにすることにより最終回答を得ることを特
    徴とする請求項6記載の文字読取方法。
JP8014145A 1996-01-30 1996-01-30 文字読取方法 Pending JPH09212586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8014145A JPH09212586A (ja) 1996-01-30 1996-01-30 文字読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8014145A JPH09212586A (ja) 1996-01-30 1996-01-30 文字読取方法

Publications (1)

Publication Number Publication Date
JPH09212586A true JPH09212586A (ja) 1997-08-15

Family

ID=11852993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8014145A Pending JPH09212586A (ja) 1996-01-30 1996-01-30 文字読取方法

Country Status (1)

Country Link
JP (1) JPH09212586A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219819A (ja) * 2013-05-08 2014-11-20 日立オムロンターミナルソリューションズ株式会社 文字認識装置及びその方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014219819A (ja) * 2013-05-08 2014-11-20 日立オムロンターミナルソリューションズ株式会社 文字認識装置及びその方法

Similar Documents

Publication Publication Date Title
JPS6077279A (ja) 文字イメ−ジ切出し方法
JPS58223876A (ja) バ−コ−ド認識装置
JPH08161436A (ja) 領収書読取装置
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPH07182448A (ja) 文字認識方法
JPH09212586A (ja) 文字読取方法
JPH0743755B2 (ja) 文字認識装置
JPH06124366A (ja) 住所読取装置
JPH11328309A (ja) 光学的文字読み取り方法とその装置
JPH07239899A (ja) 光学的文字読取装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPS5914078A (ja) 帳票読取装置
JPH04139593A (ja) 郵便番号認識装置
JPS6111886A (ja) 文字認識方式
JPH0812683B2 (ja) 特定文字列高速抽出方法
JPS6015993B2 (ja) 文字の手動走査読取り法
JPH01311390A (ja) 文字置換制御方式
JP2578768B2 (ja) 画像処理方法
JP3419418B2 (ja) 文字読取方法および装置
JPH05217015A (ja) 郵便物の宛名読取装置
JPH0259504B2 (ja)
JPS6027077A (ja) 光学的文字読取装置
JPH0137790B2 (ja)
JPH03122786A (ja) 光学的文字読取装置
JPH03123989A (ja) 文字認識装置