JPS5930176A - 文字判定処理方式 - Google Patents

文字判定処理方式

Info

Publication number
JPS5930176A
JPS5930176A JP57137979A JP13797982A JPS5930176A JP S5930176 A JPS5930176 A JP S5930176A JP 57137979 A JP57137979 A JP 57137979A JP 13797982 A JP13797982 A JP 13797982A JP S5930176 A JPS5930176 A JP S5930176A
Authority
JP
Japan
Prior art keywords
word
character
dictionary
word dictionary
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57137979A
Other languages
English (en)
Inventor
Yukiyasu Iida
飯田行恭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57137979A priority Critical patent/JPS5930176A/ja
Publication of JPS5930176A publication Critical patent/JPS5930176A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明はカナ、英数字の混在文字や漢字のように類似字
形の多い文字を読取る文字読取装置における文字判定処
理方式に関するものである。
カナ、英数字等の混在文行や漢qては、例えばカナの”
工”と莢字のII I 111数字の11711とカナ
の1りI+1漢字の1l−1nと”土11.1字11と
11宇11等のように字形的に似通つ/こ文′字の絹が
斂多くイJY1するプcめ、これらの文字を字形のみて
高精度に認識することは難しい。
文字の高精度認識を達成する方法として、予め入力され
る文字列のチーフル(中語辞−カ()を用76して、読
取結果と単語辞朋とを叩合し、工−ン−、リジェクトを
修正することが提案さねでいる。
然し乍ら、単語の種類は読取り対象によってJ1常に異
り、如何なるアプリケ−/ヨ/にも使える単語辞字1を
予め用扁、−ノ゛ることは不iJ能である。従って、従
来の単語辞1を利用した文字読取りでは、帳票に頻繁に
記入されることが多い如名や住所等に限るか、アプリケ
−/ヨンに応じて辞町を作る必要があり、汎用性がない
とか、辞書作成のための手続きが煩わしい等の欠点を持
っていた。
本発明は、アプリケ−/ヨン毎に見れば読取対象単語の
数は限られているという点と、0CR(光学的文字読取
り)の文字認識手段を使乏−ば容易に文字データが入力
できる点とに着目し、OCRのコーー=リーがアプリケ
−/ヨン対応に読取対象単語を記入した帳票をOCR装
置に読取らせることにより必要な単語辞書を作成し、そ
れを参照し2て人力文字に対する読取結果をチェック、
修止−Jるもので、その目的は、従来方式のように煩わ
し1.7)手続を経ることなく、文字読取りに有効な’
li語辞−1をOCR装置内に蓄積させ、その情報を使
って類似字形を含む文字を高精度に読取ることにある。
第1図は本発明の文字判定処理方式に」こる一実施例の
構成を示すブロック図で、IIIJ、共通制御部、2は
走査部、;3は認識部、4は操イ′[部、5は114語
辞1作成部、6は単語辞書記憶部、71学語照合処理部
、8は共通制御部1と他部との結線、9は認識部3と単
語辞書作成部5との結線、IOは認識部3と中、語照合
処理部7との結線、月は出力線である。
次にその動作につき説明する。
共通制御部1の指令により、走査部2は帳票を走査し、
光電変換して得られる入力文字の両信号を認識部3に転
送し、認識部:3は共通制御部1の指令によ−り認識処
理を行い、人力文字と最も字形的に類似したカテゴリの
文字コードを出力するが、入力文字が複数のカテゴリに
(jRでいるときは複数の文字コ−1゛を出力する。(
世し、この時は望識結果としてはリジ・グクトである。
) ここで、入力帳票がノ枦語登録用帳票であるならば、共
通制御部1は単語辞書作成部5を動作させ、Φ語静11
作成部5は認識部;3から送られてくる中語登輔用帳票
上の11語の文字コー ド列を基に浄語辞宵を作成す為
。この時、114語登録用帳票で指定された辞11名の
辞11が既にtN語辞ヤ1記憶部6に格納されているな
らd:、単語辞書作成部5はその辞書を単語辞書記憶部
(jから読出し、これに人力文字コード列を追加登録し
ていく。
入力文字コード列の中には一意に文字コード列定してい
ないものや、誤った文字コー ドが含筐れている可能性
があるので、必要があ)1は共通制御部1は、読取結果
を操作部4のディスプレイに表示し、オペレータはディ
スプレイ」二の読取結果をチェックし、操作部4のキー
ボードによりエラー文字、リジェクト文字の修正を行う
次に人力帳票が単語辞書指定帳票であれば、共通制御部
1は単語照合処理部7を起動し、単語照合処理部7は単
語辞書指定帳票に1かれた辞1名の辞別を単語辞書記憶
部6から読出す。続いて、読取対象帳票が入力されると
各フィールド毎に、文字列に対する候補−文字コー ド
列が認識部3から単語照合処理部7に送られ、単語1)
6合処理部7は、各フィールド毎に指定された単語辞〒
1と候補文字コード列とを照合し、最もよく一致する単
語辞書の文字コード列を出力線11に出力する。
以上の動作により、本発明はOCRの認識手段を使って
、アプリケーションに応じた単語辞書を作成でき、これ
らの単語辞書を使って入力文字列に対する候補文字コー
ド列をチェック修正することにより、文字を高精度に読
取ることができる。
第2図は一71語登録帳票の一例を示すもので、12は
帳票押別フィールドで、ここにはこの帳票が単語登録帳
票であることを示すコードが記入され、13は辞書名フ
ィールド、I4は短語記入フィールドで登録すべき単語
を記入し、辞書名フィールドにはこれらの単語が登録さ
れる辞−古老を記入する。
第3図は単語辞書指定帳票の一例を示すもので、15は
帳票種別フィールド、】6は番目フィールド、17は辞
11名フィールドであり、帳票種別フィールド15にd
、この帳票が郊語辞円指定帳票であることを示すコード
が記入され、番号フィールド16には読取対象帳票のJ
N語照合を行いたいノイールドの番号を、また辞岩名フ
ィールド17には照合しだいI)つ語辞宵の辞別名をそ
れぞれ記入するものである。
第4図は本発明に使用する却語辞岩の構造の一例を示し
たものである。
この辞銅は人力文字列の予め定めだ複数文字位置の文字
(図では第1番目の文字、第2番目の文字及び最後の文
字)をキー文字として検索を行う。
インデックスは上記文字位置に対応して複数あり、各文
字コー ドに対し、その文字コードを所定の文字位置に
持つ単語が格納されている11詔チー−フルの先頭のア
ドレスを示す。
図において<A)ld、インデックスで、(F)は第1
番目の文字位置、(S) tま第2番目の文字も7置、
(L)は最終の文字位置を示している。(B)は単語″
ツーフルで、そのリスト部はキー文字に対応して初数あ
り、各アドレスには、そのアドレスに格納さtlている
単語のキー文字と同じ文字コードを同し曹匿に持つ他の
単語が格納されている単語チー 7フルのアドレス(リ
ンク情報)が入っている。
このような構造であるため、新だに単語を登録する場合
、そのΦ語をJ枦語デーノルの空き領域の先頭アドレス
に格納し、該単語と同じキー文字を持つ単語の中で一時
点前に登録された単語に対応するリンク部(これはイン
デックスとリンク情報によって容易に検索できる)に」
二記アドレスを書き込めば」:<、単語の逐次登録が容
易である。まだ+F語照合時における辞書検索では、キ
ー文字を基にインデックスとリンク情報を用いて必要な
辞H1+領域のみをリ−ヂずilばよいので高速検索が
可能である。
第5Nは一中語辞ill: (’+成部5の一実施例の
構成を示−j= −Z’ r+ツタ図で、18は文字コ
ード列し7′スタ、19は単語辞書作成部制御回路、2
oは角業用メモリであり、8は共通制御部1との結線、
9 I′、i認識部;3との結線、21は単語辞書記憶
部6へのアドレス線、22は単語辞書記憶部(〕とのデ
ータ線である。
共通制御部1からの指令を受けて単語辞書作成部制御回
路19が動イ′[シ、認識+τ11:4がら文字コー用
・列レジスタ18に送られてきでいる辞書名のjp語辞
i月が格納されているアドレスを、j(’i語辞書記憶
部6に送る。単語辞書記憶部6は要求のあった単語辞λ
1データを作業用メモリ20へ転送する。
もしこの時、指定された辞1名の単語n1が単語辞書記
憶部6に存在しない場合、単語辞1作成部1i′iI御
回路19は所定の大きさの領域を作業用メモリ20内に
確保し、インデックスリンク部、その他必蟹な変数領域
を初期化する。続いて認識部3から入力単語の文字コー
ド列が文字:レード列レジスタI8に転送される。単語
辞書作成部制御回路19ハ文字コード列レンスタ18の
文字1−ド列及びリンク情報を作業用メモリ20内の?
1′11置1に書き込む。
単語登録用帳票の読取りが終rした時点で単語辞書作成
部制御回路18は、共通制御部1からの指令により、作
業用メモリ20内のJヤ語辞宵を単語辞書記憶部6の所
定のアドレスに格納する。
第6図は単語照合処理部7の一実施例の構成を示すフロ
ック図で、23は文字コード列レジスタ、24は単語照
合処理部制御回路、25は比較回路、26は作業用メモ
リを示し、8は共通制御部]との結線、lOは認識部3
との結線、11は出力線、27は単語辞書記憶部6への
アドレス線、28は単語辞書記憶部6とのデータ線であ
る。
単語辞書指定帳票が入力されると、共通制御部1の指令
て、ノル語14jj合処理部制御回路24は、認識部;
3から送られてき/(辞)11名の一中詔辞書が格納さ
れているアドレスを単語辞−1記憶部6に送る。
栄firi辞21記憶部6は卯求のあった一?I′1語
辞11のブタを作業用メモリ2Gに転送する。続いて人
力さJ1/こ読取′対象帳票の各フィ、−ルト内の文字
列に対−J゛る候補文字:+−1列が文字コー ド列レ
ジスタ23に格納さり、る。この局、人力文字列内に字
形的にあいまいな文字があノ1ば、候補文字コード列は
複数ある。JP語合部処理部制御回路24は、候補文字
列コー 1゛列の中で一扁に確定しているキー文字を基
に作業用メモリ26内のインデックスとリンク情報を使
って同じキー文字を持つ単語をη1語辞Fiから取り出
し、比軸回路25しこJムる。次に中合部合処Jul!
部制網1回路24は、文才コード列レジスタ23内の候
補文字コード列を逐次比較回路25に送る。比較回路2
5は、2つの入力文才コー ド列を比較し、同じ文字数
の時のみ、各文字位置の文字コー ドが一致するか否か
を調べ、不一致の数をa1数する。
以−にの処理を同一キー文字を持つ一1′べての単語辞
11の却語に対し行う。比較回路2sil一連の処理の
中で猟に不−・致数の最小値およびその時の単語辞書か
ら入力されノコ文字コード列を保持しており、処理が終
了し、た時点で、その文字ツー1゛列を出力線1】に出
力する。ととて不−・致数が最小の文字コード列が複数
あった場合、不一致し/ξ文字位置の文字をリジェクト
として出力する。
却語照合処理部7は以上述へ/こような機能を有するだ
め、人力される単語が予め単語辞真に登録されているな
らば入力文字に対する認識結果中に含捷れるエラー及び
リジJり1文字を修Il−できる。
以」二説明したように、本発明によ11. ii 、読
取対象に応じて、容易に単語辞膚をo c it内に蓄
積でき、この単語計重を使ってエラー、リジェクト文字
の修正を行うことで、字形的に類似−jる文字が敬多く
存在するカナ、英数字混在文字や漢字を高精度に読取る
ことができる。まプこ本発明の中語辞V(は前述したよ
うな構造を持つため、単語の逐次登録および高速検索が
でき、文字読取速度を低下させるこ表なく弔語辞刊1作
成処理と申請照合処理を可γ11元とするなどの利点が
ある。
【図面の簡単な説明】
第1図は本発明の文字判定処理方式による一実M+4例
の構成を示す一フロック図、第2図はJf語登録帳票の
一例、第、′う図はすれ語辞が1指定11V%票の一例
、第・1図は単語辞11の構造の一例を示す図、第5図
及び第6図はそilぞれ第1図における単語辞1作成部
5及びQj語照合処理部7の一実施例の構成を示すフロ
ック図である。 1 ・・・・・・・・共通制御部、 2・・・・・・・
・走査部、:う ・・・・・・・・・認識部、 ・1 
・・・・・・・操作部、 5・・・・・・弔語辞が1作
成部、 6 ・・・・・−・tp語辞−15L)境部、
 7 ・・・・・・・・・#11語照合部理部、 8・
・・川・・・共通制御部1と他部との結線、()  ・
・−・・・認識部3とfit g(4計部作成)り[1
5との結線、 10−・・・・・認識部;3とJF語合
部処理部7との結線、11団・・・出力線、12・・・
・・・・帳票種別フィールド、 1:う・−・曲・辞書
名フィールド、14・・・・・・・・・単語記入フィー
ルド、15・・・・パ・帳票フィールド、+6・・・・
・・番号フィールド、17  ・・・・・・辞書名フィ
ールド、18・・・・文字コード列レジスタ、+9  
・・・・・・単語辞11作成部制御回路、20.26 
 ・  作業用メモリ、2]、27  ・・・・・・単
語辞別記憶部6への”アドレス線、22.28・・・・
・・・・中語辞」記憶部6とのデータ線、23・・・・
・文字コード列レジスタ、21・・・・・・−Jlj語
照合部理部制御回路、25  ・・・・・比較回路。 第1図 第2図 第3図 第4図 TA)                 (B)第5
図 第6図

Claims (2)

    【特許請求の範囲】
  1. (1)  帳票上の文字を光学的に読取る走査部と、そ
    の読取った人力の1つの人力文字に7・]シ、複数の候
    補文字コー ドを出力できる認識部と、その認識部から
    出力さfする文字コ−1・列から!r語辞望1を作成す
    るJi語辞真作成部と、その作成し/【栄語辞11に指
    定した辞11名をつけて登録する?11語辞−1記憶部
    と、辞閣名て指定さt]た単詔辞J1をその一1lj語
    辞膚記憶部から読出し、前記読取71象l眼票1.の文
    字9列の候補文字ヨー1列と上記読出し/;−Qi語辞
    11とを照合する。ip語照合処理部とをイj’ L 
    、最もよく一致する単語辞真の文字コ−1・列を出力す
    るようにしたことを特徴とする文字判定処理方式。
  2. (2)  各アドレスに単語およびその単語の特定文字
    位置にある文字コードと、その特定文字位置にある文字
    コードとが同一・である他の単語とが格納されている、
    アドレス情報を保持している単語チーゾルと、各文字コ
    ード毎に前言己特定位置に同じ文字コードを持つ一中語
    テーフルの先頭のアドレスを保持しているインデックス
    とからなる単語辞宵を用いて単語の登録及び照合を行う
    ことを特徴とする特許請求の範囲第(1)項記載の文字
    判定処理方式。
JP57137979A 1982-08-10 1982-08-10 文字判定処理方式 Pending JPS5930176A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57137979A JPS5930176A (ja) 1982-08-10 1982-08-10 文字判定処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57137979A JPS5930176A (ja) 1982-08-10 1982-08-10 文字判定処理方式

Publications (1)

Publication Number Publication Date
JPS5930176A true JPS5930176A (ja) 1984-02-17

Family

ID=15211209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57137979A Pending JPS5930176A (ja) 1982-08-10 1982-08-10 文字判定処理方式

Country Status (1)

Country Link
JP (1) JPS5930176A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60207981A (ja) * 1984-03-31 1985-10-19 Toshiba Corp 辞書登録方式

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5592981A (en) * 1978-12-29 1980-07-14 Fujitsu Ltd Pattern matching processing system
JPS5680788A (en) * 1979-12-05 1981-07-02 Fujitsu Ltd Character recognition system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5592981A (en) * 1978-12-29 1980-07-14 Fujitsu Ltd Pattern matching processing system
JPS5680788A (en) * 1979-12-05 1981-07-02 Fujitsu Ltd Character recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60207981A (ja) * 1984-03-31 1985-10-19 Toshiba Corp 辞書登録方式

Similar Documents

Publication Publication Date Title
KR910007531B1 (ko) 음성인식장치
JPS5930176A (ja) 文字判定処理方式
JP2595934B2 (ja) 仮名漢字変換処理装置
JPH08339376A (ja) 外国語検索装置及び情報検索システム
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JP3071745B2 (ja) 文字認識結果の後処理方法
JPS63268082A (ja) パタ−ン認識装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPS59197974A (ja) 文字認識装置
JP3725206B2 (ja) 文字認識装置
JP2874199B2 (ja) 単語辞書照合装置
JPH03257693A (ja) 文字認識結果修正方式
JPS60225273A (ja) 単語検索方式
JPH0546814A (ja) 文字読み取り装置
Marukawa et al. A post-processing method for handwritten Kanji name recognition using Furigana information
JP2628775B2 (ja) 辞書作成装置
JPH02148174A (ja) Ocrによる住所データベース検索装置
JPS63103393A (ja) 単語認識装置
JPS63138479A (ja) 文字認識装置
JPH04215183A (ja) キーワード検索方法
JPS60207983A (ja) 文字認識用辞書作成方式
JPS594071B2 (ja) 文字認識装置
JPH03189891A (ja) 辞書参照による知識処理を行う文字列読み取り装置
JPS62285189A (ja) 文字認識後処理方式
JPH0576675B2 (ja)