JPS5831480A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS5831480A
JPS5831480A JP56128610A JP12861081A JPS5831480A JP S5831480 A JPS5831480 A JP S5831480A JP 56128610 A JP56128610 A JP 56128610A JP 12861081 A JP12861081 A JP 12861081A JP S5831480 A JPS5831480 A JP S5831480A
Authority
JP
Japan
Prior art keywords
character
subcategory
dictionary
pattern
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56128610A
Other languages
English (en)
Other versions
JPH0226266B2 (ja
Inventor
Shunkichi Tada
多田 俊吉
Yukiyasu Iida
飯田 行恭
Toshio Tsutsumida
敏夫 堤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP56128610A priority Critical patent/JPS5831480A/ja
Publication of JPS5831480A publication Critical patent/JPS5831480A/ja
Publication of JPH0226266B2 publication Critical patent/JPH0226266B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、文字読取装置、特に文字種専用読取りと複数
文字種混在読取りを行うに商って、各特徴毎に文字種を
示すフラグを用意することによって辞書メモリの作成を
容易にしかつ辞書メモリの容量を低減するようにした文
字読取装置に関するものである。
従来のこの種装置では、各文字種ごとに専用の辞書があ
り、これらの辞書を直接組合せるのみでは文字種混在フ
ィールドの読取りに十分な精度を確保できないため、例
えは英字用と数字用の辞書の他に英数字用の辞書を作成
し、3種の辞書を各々辞書メモリ内に別々に持つことに
よって、混在読取りを行うように構成されていた。この
ために夫々の辞書が共に冗長かつ大規模なものとなる欠
点があった。また、英字、数字に加えカナ、記号、を加
えるなど文字種が増えるたびに各混在の組合せごとの新
たな辞書を作成する作業を伴φ、きわめて煩雑となる。
また、混在読取り用の辞書では、形状の似た文字を区別
する丸め、文字の変形に対して各サブカテゴリが許容す
る変形の範囲を狭くする必要があるので異字種相互に混
同の可能性が高いカテゴリに対して変形許容範“囲の狭
い混在読取り用のサブカテゴリと変形許容範囲の広い文
字種専用のサブカテゴリを個々に設けておき、読取りフ
ィールドごとにサブカテゴリを切替えて使用する方法が
一般的に用−られる。しかしζ混在の組合せが増えてく
ると、辞書の維持管理が一本化しにくい外、サブカー、
ゴリ相互の冗長性を除去できない欠点がある。
本発明は、文字種専用と、英字、数字、カナ、記号の複
数文字種が混在するフィールドを単一の辞書で読取るよ
うにすると共に、各特徴ごとに文字種を示すフラグを用
意して、辞書規模の圧縮と高知能化をはかり、改造、拡
張の容易な形で溝築された辞書をもつ文字読取装置を提
供することを目的としている。
第1図は、本発明が実現された装置の一実施例ブロック
図であって、1は帳票を走査した画像の入力端子、2は
文字パタンを切出して特徴を抽出する特徴群作成回路、
3は特徴群の各特徴ごとにアドレスを割当てたテーブル
メモリ、4は辞書メモリ、5は文字判定回路、6は文字
判定結果出力端子であり、図示しなφ制御回路のもとて
文字の認識処理を行うものである。本発明は辞書メモリ
4と文字判定回路5との構造に主な特徴があり、以下第
2図、第3図、第4図を用いて本発明の実施例を詳細に
説明する0 纂2図は、入力文字パタンの一例を示し、カテゴリ「8
」に含まれるパタ/7とカテゴリrBJに含まれるパタ
ン8を表わしている。AA、AJ、Arn、Arは、そ
れぞれテーブルメモリ3のアドレスであり文字パタンの
特徴の種類を示しているOCl 、”* 、C8SC4
、”4はそれぞれ対応するアドレス内容であって、特徴
群作成回路2の種類に依存した形態、例えば入力文字パ
タ′/における各特徴の出現の有無である場合、各特徴
の出現頻度数である場合、あるいは、特徴の重みである
場合その他いくつかの形態が考慮される0本発明は、以
上のいずれにも適用できるがここでは最も単純な特徴の
出現の有無を検索する場合を用iて説明する0 この場合には、C0ζ”R、C,、C4、C’4が1(
出現した)か0(出現せず)の2値で与えられ、「8」
では例えばc、 −(:’t xcs =(’+ =l
であることが「8」を判定する条件となり、「B」では
、C1,、C,■c、−1でありかつアドレスAsの内
容C−が0となることがrBJを判定する条件と々る。
即ち、「8」の左中央部にあるくぼみが類似字形rBJ
には存在しないことによって夫々が特徴をもって埴る0 183図は、本発明の辞書メモリ4の1部を示した一実
施例を示し、41.42.43.44はそれぞれ英字い
)、数字(へ)、カナ(へ)、記号0の各文字種を衆わ
すフラグ、45はテーブルメモリ3のアドレス、46は
同アドレスの、内容と照合する2値情報である。47は
カテゴリ名に相当する文字コードであって、41〜47
をあわせて1つのサブカテゴリ401を構成している。
401はカテゴリ「8」の1種類の字形に対応し、サブ
カテゴリ402はカテゴリrBJの1字形に対応するも
のであり、サブカテゴリ内の構成要素A[C]がすべて
テーブルメモリ3を満足するとき、文字コード47を出
力す′るように制御される0数字「8°」のサブカテゴ
リ401はフラグNにすべてlをセットしておき、他の
文字種用フラグには、各混在読取りの組合せに応じてl
をセットする。例えばAs(C4) fc′)−ては英
数字読取りフィールドにおいて利用されるように7ラグ
AとフラグNとvclを゛セットするようにされる0同
様に英字rBJのサブカテゴリ402はフラグAにすべ
てlをセットしておき混在用の組合せフラグとして各フ
ラグNK8を各々用いる。辞書メモリの制御では、数字
専用フィールドにおいてはANK8−0100以外の各
アドレスを無視し、テーブルメモリ3との照合を行う。
即ち、数字専用フィールドでは、サブカテゴリ401は
、AL〔C8〕・。
Ay(−C,〕・A’(C1:]  の論理積によって
判定を行馳ANK8−0000の終了コードを検知し、
文字コード「8」を出力する。AL、Ay、 Ajの−
ずれかが満足されないときには無条件に次のサブカテゴ
リの先頭に制御を移すことによって入力バタンが当該サ
ブカテゴリに一致しなかったと判定する0次に英数字フ
ィールドでは、ANK8−0100.1000.110
0の3種組合せを調べ同様に論理積を求める。サブカテ
ゴリ401ではAL・Ar龜A1・Arm となり、I
R2図に示す゛ようにrBJとの字形分離に有効なA隅
を加えて文字判定を行う0以下Axは、数字・カナ混在
読取りと数字・カナを含む3種以上の混在読取りとにお
いて論理積の項となF)、Ayは、英数字カナの3種混
在と全種混在読取りとの時に論理積項となるよう制御さ
れる。
一方、サブカテゴリ402は英字を基準として上記と同
様の制御が適用される。
以上の4ビツトのフラグを設けた辞書メそりでは、例え
ば数字専用読取り時に英字用の辞書メモリ領域内のサブ
カテゴリ402は各アドレスのフラグNが0であるか1
であってもフラグAが一緒に1であるためにすべて無視
されることになる0このため上記制御のみではサブカテ
ゴリ402の各特徴が満足された形となってrBJが判
定されて出力されることになる。したがって、ある読取
りフィールドで論理積項数がすべて無視されたサブカテ
ゴリそのものを出力しないようにす為制御機能が必要で
ある。
この機能を実現するには、(1)各読取りフィールドに
よって辞書メモリ内の有効アドレス群を限定する方法即
ち例えば数字専用読取りフィールドの場合にはサブカテ
ゴリ4027ついてこれを前もって存在しなφものとみ
なすようにする第1の方法、(1読取りフィールドの対
象とする文字種を示すフラグにもとづいてすべてのアド
レスが無視されたサブカテゴリを検出して、当該サブカ
テゴリをスキップする#&2の方法、(鴎サブカテゴリ
内部に他の文字種では存在しない特徴を登録しておき、
相互に相手の文字種専用のフラグをセットしておく方法
即ち例えばサブカテゴリ402内にフラグNのみをlと
したAm(C−)  を別mにもうけておくようにした
w&3の方法、Qv)サブカテゴリ毎に論理積項として
参照された特徴のカウンタを用意してカナ/りの内容が
O(すべて無視されたことを示す)であれば文字コード
を出力しないようにする14の方法などが考えられる。
鶏lの方法は、辞書メそりの有効アドレスを読取りフィ
ールドごとに変更する必要があるので制御が複雑である
が有効アドレスの限定により文字判定地理の高速化が図
れる。籐2の方法は、文字種混在用−徹のみで構成され
たサブカテゴリを設妙ることができない制限を除けd1
効率的な辞書走査が可能である。第3の方法では文字種
相互間を分離できる有効な特徴を見出すことは困難であ
るが、各サブカテゴリの先頭に他の3つの文字種専用フ
ラグを付したダ建−特徴を個々に用意し、各々* r@
’−’y=、イールドでは参照するが混在フィールドで
は参照しないように制御すれば目的とする制御機能は満
足される。JR4の方法は辞書メモリ全体を走査する必
要はあるが、混在用特徴のみで構成されたサブカテゴリ
屯許答でき、制御が最も単純である。
本実施例ではI!4の方法による制御機能を持つ文字判
定方式を取り上げ第4図を用いて説@を進める。
第4図は、謡1図の文字判定回路5の詳mな構造とテー
ブルメそり3および辞書メモリ4を示したもので、テー
ブルメそり3には前述のように各特徴ごとに割当てたア
ドレス31に入力文字Iくタンの特徴抽出結果32が格
納されている0入力端子501からは、各読取りフィー
ルドの先頭文字パタyが辞書レジスタ507に読出され
るときに′ 4ビツトの読取りフィールド情報が送られ
、フィールド情報フラグレジスタ502にセットされる
0入力端子503は、カウンタ504の一リセットを行
うためのもので、各人力バタン毎に、サブカテゴリの先
頭アドレス群a11β0、・・・・ω1 を保持してい
る!ツピングメモリ505の先頭にポインタを設定する
。出力端子506からは、辞書レジスタ507の下位ビ
ット群508が示す文字コードが出力される。辞書レジ
スタ507Vcは辞書メモリアドレスカウンタ509の
示すアドレス’l 、町・・・・ω2の内容が送り込ま
れる。上位ビット群510はAND回路511によって
フィールド情報フラグレジスタ502と比較され、下位
ビット群508のAが示すテーブルメモリ、3のアドレ
ス31の内容32と下位ビット群508のC′とを比較
器512で比較判定した出力を無視すべきときOR回路
513の出力に1がセットされる。これを具体的に説明
すると、例えば数字専用フィールドではftf*7sf
4=0100、英数字フィールドではf、 f鵞fsf
a−1100、英数字カナ記号フィールドではft f
tfsfa−1111となっている。
OR回路513の出力は、英数字フィールドの場合、辞
書メそりのアドレスλ1、λ、などでハ、Oとなり、λ
、、λ7などでは1となる。λ2はF、F。
FmFa=0000であるため、OR回路514の出力
がサブカテゴリ内で唯一1となり、AND回路515を
介して文字コード出力ゲート516を開いて文字コード
を出力するとともにOR回路513の出力をlとする。
以上の動作によって文字種の7フグ情報を用いたサブカ
テゴリ内の論理積項数を変更する制御が実現できる。
辞書レジスタ507の内容が上記論理積の項となるとき
即ち上述のλ1、λ、の場合には比較器512の出力が
有効となる。比較器512により抽出された特徴と辞書
内特徴の一致を判定し、不一致のときには、OR回路5
17の出力が0と嫌るaこのときFr F* F’s 
P4’= 0000であるためOR回路5180出力が
1とな9、カウンタ504がインクリメントされて、辞
書メモリアドレスカウンタ509にはμm がセットさ
れる。従って入力文字パタンは、サブカテゴリλに含ま
れな−ことが検出できる0AND回路519、カウンタ
5201比較器521は読取対象外のサブカテゴリを無
視する制御を行う。カウンタ520は辞書メモリアドレ
スカウンタ509が客サブカテゴリの先頭アドレスを指
示するときにリセットされ、AND回路519は、サブ
カテゴリの論理積項となる特徴即ちλ8、λ3などを検
出したと一倉カウンタ520のインクリメントを行うQ
比較器521は文字コードを出力しようとするとき、論
理積項が1つも無けれdカウンタ520の内容が0であ
るため、その出力を禁止することができる。以上の動作
を経て文字コード出力端子506の出力が文字判定出力
となる。
以上説明したように、本発明によれば、辞書メモリに置
くサブカテゴリの記述が単純であり、各サブカテゴリを
文字種専用にも他の文字種との混在用にも使え、かつ混
在の組合せに応じて自由に文字の変形許容範囲を変更で
きるものであるから、単一の辞書で文字種専用と各文字
種混在フィールドの文字読取りを行うことができる利点
が多るO ・また、サブカテゴリの構成張索である!黴
ごとに文字種情報を与えるものであるから辞書を作成す
る作業の煩雑さが著−レ−c Il租さ−れ−る外−1
辞書の修正、拡張が容易であり、サブカテゴリ内の冗長
性も低減できるため混在読取りに対応する辞書規模の増
大が緩和され、かつ混在読取りを行うことによる専用読
取り辞書への制約が無いなどの利点がある。
【図面の簡単な説明】
第1図は本発明による装置の一実施例ブロック構成、第
25図は装置に入力した文字バタンと特徴とを説明する
概念図、jR3図は辞書メモリの一実施例構成、第4図
は本発明の一実施例論理構成を示す0   ゛」 l・・・・画像人力趨子、2・・・・特徴群作成回路、
3・・・・テーブルメモリ、4・・・・辞書メモリ、5
・・文字判定回路、6・・・・文字判定結果出力端子、
41−42−43・44 ・・・・辞書メモリの文字種
情報ブラダ、3−1・45・・・・テーブルメモリアド
レス、401−402・・・・サブカテゴリ、47・・
・・文字コード、501・・・・文字種フィールド情報
入力端子、502・・・・フィールド情報フラグレジス
タ、504−520  ・・・・カウンタ、505・・
・・マツピングメモリ、506・・・・文字コード出力
端子、507・・・・辞書レジスタ、512々521・
・・・比較器 516・・・・ゲート回路。 特許出願人 日本電信電話公社 代理人弁理士  森  1)   寛 第1図

Claims (1)

    【特許請求の範囲】
  1. 帳票を走査し文字パタンを切出して当該パタンの字形を
    記述する特徴群を抽出する回路と、特徴の組合せ論理か
    ら成るサブカテゴリを集めて記憶した辞書メモリと、文
    字パタンの特徴群が組合せ論理を満足するサブカテゴリ
    を選択して当該サブカテゴリの属するカテゴリ名を出力
    する制御回路とをそなえ、文字を認識する文字読取装置
    において、辞書メモリ内の各アドレスに、特徴基を表わ
    すコード番号と英字、数字、カナ、記号を含む各文字種
    を示すフラグ情報とを格納しておくことにより、各文字
    種だけの専用フィールドを読取るためのサブカテゴリと
    、これらの文字種をいくつか組合せた文字種混在フィー
    ルドを読取漬ためのサブカテゴリとを辞書メモリ内で共
    用する手段、読取るフィールドが指示する文字種と上記
    各アドレスに格納されているフラグとが一致するが否か
    を判定する手段、当該フラグが一致した特徴だけを組合
    せて作成したサブカテゴリを入力文字パタンから抽出し
    た特徴群と照合する手段をそなえ、入力文字パタンのカ
    テゴリを判定することを特徴とする文字読取装置。
JP56128610A 1981-08-17 1981-08-17 文字読取装置 Granted JPS5831480A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56128610A JPS5831480A (ja) 1981-08-17 1981-08-17 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56128610A JPS5831480A (ja) 1981-08-17 1981-08-17 文字読取装置

Publications (2)

Publication Number Publication Date
JPS5831480A true JPS5831480A (ja) 1983-02-24
JPH0226266B2 JPH0226266B2 (ja) 1990-06-08

Family

ID=14989037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56128610A Granted JPS5831480A (ja) 1981-08-17 1981-08-17 文字読取装置

Country Status (1)

Country Link
JP (1) JPS5831480A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63782A (ja) * 1986-06-20 1988-01-05 Ricoh Co Ltd パタ−ン認識装置
JPS63155391A (ja) * 1986-12-19 1988-06-28 Mitsubishi Electric Corp 単語読取装置
JPS63158679A (ja) * 1986-12-23 1988-07-01 Matsushita Electric Ind Co Ltd 文字認識装置
JPS63279387A (ja) * 1987-05-12 1988-11-16 Mitsubishi Electric Corp 文字認識装置
JPH0466666U (ja) * 1990-10-12 1992-06-12
JPH0467760U (ja) * 1990-10-24 1992-06-16

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS556642A (en) * 1978-06-29 1980-01-18 Fujitsu Ltd Character recognition unit
JPS55115177A (en) * 1979-02-26 1980-09-04 Toshiba Corp Character reader
JPS5622179A (en) * 1979-07-31 1981-03-02 Fujitsu Ltd Pattern recognizer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS556642A (en) * 1978-06-29 1980-01-18 Fujitsu Ltd Character recognition unit
JPS55115177A (en) * 1979-02-26 1980-09-04 Toshiba Corp Character reader
JPS5622179A (en) * 1979-07-31 1981-03-02 Fujitsu Ltd Pattern recognizer

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63782A (ja) * 1986-06-20 1988-01-05 Ricoh Co Ltd パタ−ン認識装置
JPS63155391A (ja) * 1986-12-19 1988-06-28 Mitsubishi Electric Corp 単語読取装置
JPS63158679A (ja) * 1986-12-23 1988-07-01 Matsushita Electric Ind Co Ltd 文字認識装置
JPS63279387A (ja) * 1987-05-12 1988-11-16 Mitsubishi Electric Corp 文字認識装置
JPH0466666U (ja) * 1990-10-12 1992-06-12
JPH0467760U (ja) * 1990-10-24 1992-06-16

Also Published As

Publication number Publication date
JPH0226266B2 (ja) 1990-06-08

Similar Documents

Publication Publication Date Title
JPS63316231A (ja) コンピユーター・ソーテイングを容易にする方法
JPS5831480A (ja) 文字読取装置
US4254476A (en) Associative processor
JPS59500068A (ja) 文書比較器
US3737852A (en) Pattern recognition systems using associative memories
EP3236368A1 (en) Encoding processing program, encoding processing device, encoding processing method, decoding processing program, decoding processing device, and decoding processing method
CN106203569A (zh) 基于二维码的集邮册信息管理方法
JPS59121537A (ja) ビツトパタ−ン照合回路
JPS62179083A (ja) 文字列照合方法
JP7215722B2 (ja) 並び替えデータ生成装置、並び替えデータ生産方法、プログラム及び記録媒体
JPS62247462A (ja) 情報フアイル装置
JPH0394325A (ja) データ処理装置
JP2509186B2 (ja) コ−ド変換方式
JPS59160255A (ja) 電子電話帳
JPS59165127A (ja) ふりがな付かな漢字変換入力方式
JP2718107B2 (ja) 比較処理方式
JPH03271963A (ja) カナ・漢字変換方式
JPS5850044A (ja) インデクス・レコ−ドの検索処理方式
JPS62182838A (ja) 文書処理装置
JPS5847066B2 (ja) 文字認識装置
JPS62165228A (ja) 情報入力方法
JPH0211939B2 (ja)
JPH10171838A (ja) データ処理システム
JPS598083A (ja) 文字ストリング検索方式
JPS60230262A (ja) 電子辞書