JPS61148585A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPS61148585A JPS61148585A JP59270434A JP27043484A JPS61148585A JP S61148585 A JPS61148585 A JP S61148585A JP 59270434 A JP59270434 A JP 59270434A JP 27043484 A JP27043484 A JP 27043484A JP S61148585 A JPS61148585 A JP S61148585A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- features
- character pattern
- dictionary
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、抽出された複数種の特徴の内特定特徴を注目
選択し1選択された前記特定特徴値をもとにして認識対
象の文字カテゴリを絞る文字認識装置に関する。
選択し1選択された前記特定特徴値をもとにして認識対
象の文字カテゴリを絞る文字認識装置に関する。
事務処理の自動化が進展するに伴い、記録された文字を
自動的に読取り認識する技術は、事務処理の自動化をよ
り発展させる上で重要なテーマとなっており、様々な観
点から研究・開発が行われている。
自動的に読取り認識する技術は、事務処理の自動化をよ
り発展させる上で重要なテーマとなっており、様々な観
点から研究・開発が行われている。
認識する文字としては、印刷された文字、タイプライタ
で打たれた文字及び手書き文・字等があるが、特に手書
き文字は書く人により同一文字でも様々なカテゴリが発
生する。かかる文字を迅速にしかも正確に認識すること
が事務処理の自動化が更に進展する上で要求される条件
の1つとなっている。
で打たれた文字及び手書き文・字等があるが、特に手書
き文字は書く人により同一文字でも様々なカテゴリが発
生する。かかる文字を迅速にしかも正確に認識すること
が事務処理の自動化が更に進展する上で要求される条件
の1つとなっている。
〔従来の技術と発明が解決しようとする問題点〕第4図
は文字認識システムの一般的なブロックダイヤグラム、
第5図は認識辞書部の格納状況図をそれぞれ示す。
は文字認識システムの一般的なブロックダイヤグラム、
第5図は認識辞書部の格納状況図をそれぞれ示す。
一般的に文字認識装置の文字認識処理過程は。
5つのブロック、即ち観測部1.前処理部2.特徴抽出
部3.認識辞書4を含む認識部5.後処理部6から構成
されている。
部3.認識辞書4を含む認識部5.後処理部6から構成
されている。
観測部lでは書物や伝票上の文字を光学的な文字パター
ンの濃度値、或いはコントラスト値を電気信号に変換し
、前処理部2は電気信号に変換した文字パターンに含ま
れる種々の雑音を除去して。
ンの濃度値、或いはコントラスト値を電気信号に変換し
、前処理部2は電気信号に変換した文字パターンに含ま
れる種々の雑音を除去して。
認識過程での誤差を出来るだけ少なくするための過程で
ある。
ある。
特徴抽出部3では文字パターンを特徴付けるパラメタの
検出を行い、認識部5では特徴抽出部3で抽出された特
徴パラメタに基づいて1文字カテゴリの識別を行う。こ
の場合、各文字カテゴリに属する文字パターンが持つべ
き特徴パラメタのデータを記憶しておく認識辞書4が備
えである。
検出を行い、認識部5では特徴抽出部3で抽出された特
徴パラメタに基づいて1文字カテゴリの識別を行う。こ
の場合、各文字カテゴリに属する文字パターンが持つべ
き特徴パラメタのデータを記憶しておく認識辞書4が備
えである。
後処理部6は、認識された複数の文字カテゴリの情報を
調べて、その前後関係から誤って認識された文字の検出
を行い、正しい文字へ訂正する処理過程である。
調べて、その前後関係から誤って認識された文字の検出
を行い、正しい文字へ訂正する処理過程である。
このような文字認識システムでの文字カテゴリの識別方
法として、−次的に分類して認識する方法、即ち大分類
の認識辞書4と全対象文字カテゴリとを照合して識別す
る方法がある。
法として、−次的に分類して認識する方法、即ち大分類
の認識辞書4と全対象文字カテゴリとを照合して識別す
る方法がある。
又2複数段階の認識過程を経て、即ち大分類。
中分類、小分類等の認識辞書4を備え、それぞれの段階
で識別対象の文字カテゴリを絞って行く方法もあるが1
本例の説明は大分類方式を前提としており、従って、認
識辞書4は大分類辞書に相当する。 。
で識別対象の文字カテゴリを絞って行く方法もあるが1
本例の説明は大分類方式を前提としており、従って、認
識辞書4は大分類辞書に相当する。 。
この大分類辞書4には、第5図に示すよにな形式で各文
字カテゴリに属する文字パターンが持つべき特徴パラメ
タのデータが記憶されている。
字カテゴリに属する文字パターンが持つべき特徴パラメ
タのデータが記憶されている。
第5図の、左側はカテゴリコードを示し、右側の5つの
欄が5つの特徴(抽出する特徴数は状況により異なり9
本例では5つとした)に対する特徴パラメタのデータを
示す。
欄が5つの特徴(抽出する特徴数は状況により異なり9
本例では5つとした)に対する特徴パラメタのデータを
示す。
例えば、カテゴリコード「亜」の特徴Aに対する特徴パ
ラメタのデータは“16”、特fiBに対する特徴パラ
メタのデータは“8”等と記録されいる。但し、カテゴ
リコードの順番は任意に配列されている。
ラメタのデータは“16”、特fiBに対する特徴パラ
メタのデータは“8”等と記録されいる。但し、カテゴ
リコードの順番は任意に配列されている。
上述のような大分類方式で入力文字パターンを認識する
従来の文字認識装置では、入力文字パターンから抽出さ
れた複数の特徴の特徴パラメタのデータと大分類辞書4
に記憶されている識別対象の全文字カテゴリの前記複数
の特徴の特徴パラメタのデータとをそれぞれ照合する。
従来の文字認識装置では、入力文字パターンから抽出さ
れた複数の特徴の特徴パラメタのデータと大分類辞書4
に記憶されている識別対象の全文字カテゴリの前記複数
の特徴の特徴パラメタのデータとをそれぞれ照合する。
つまり、入力文字パターンから抽出された5つの特徴パ
ラメタのデータ値に近い文字カテゴリを。
ラメタのデータ値に近い文字カテゴリを。
全文字カテゴリと順次照合することにより、最も近い複
数個を選択するため、この選択処理過程に多くの時間を
要すると言う問題点があった。
数個を選択するため、この選択処理過程に多くの時間を
要すると言う問題点があった。
本発明は、上記問題点を解消した新規な文字認識装置を
実現することを目的とするものであり。
実現することを目的とするものであり。
該問題点は、大分類辞書は、前記複数種の特徴の内の所
定特徴をもとにその内容を所定値順位にソーテングして
構成されてなると共に、入力された文字パターンの特徴
中より該特徴に相当する特徴値がソーテングされた前記
大分類辞書のどの範囲にあるかを決定する照合範囲決定
テーブルを設けてなる本発明による文字認識装置により
解決される。
定特徴をもとにその内容を所定値順位にソーテングして
構成されてなると共に、入力された文字パターンの特徴
中より該特徴に相当する特徴値がソーテングされた前記
大分類辞書のどの範囲にあるかを決定する照合範囲決定
テーブルを設けてなる本発明による文字認識装置により
解決される。
即ち、大分類辞書内に記録されている複数個の特徴の中
でより安定な特徴9例えば、特徴に対する各文字カテゴ
リの特徴パラメタのデータ値の変動幅が比較的小さい特
徴を見つけ、その特徴のデータ値を予めソーテングした
状態で記録して置き。
でより安定な特徴9例えば、特徴に対する各文字カテゴ
リの特徴パラメタのデータ値の変動幅が比較的小さい特
徴を見つけ、その特徴のデータ値を予めソーテングした
状態で記録して置き。
入力した文字パターンの抽出された特徴の特徴パラメタ
のデータ値と、大分類辞書内に記憶されている文字カテ
ゴリの特徴パラメタのデータ値とを比較照合する時、照
合範囲決定テーブルにより入力文字パターンの特徴パラ
メタのデータ値前後のデータ値を持つ文字カテゴリのア
ドレスを決定し対象範囲を絞り、照合処理時間の大幅な
短縮を図った。
のデータ値と、大分類辞書内に記憶されている文字カテ
ゴリの特徴パラメタのデータ値とを比較照合する時、照
合範囲決定テーブルにより入力文字パターンの特徴パラ
メタのデータ値前後のデータ値を持つ文字カテゴリのア
ドレスを決定し対象範囲を絞り、照合処理時間の大幅な
短縮を図った。
以下本発明の要旨を第1図〜第3図に示す実施例により
、具体的に説明する。
、具体的に説明する。
第1図は本発明に係る文字認識装置の一実施例。
第2図は本発明に係る大分類辞四のソーテング結果の一
実施例、第3図は本発明に係る文字カテゴリ照合範囲決
定状況図をそれぞれ示す。
実施例、第3図は本発明に係る文字カテゴリ照合範囲決
定状況図をそれぞれ示す。
尚全図を通じて同一記号は同一対象物又は内容を示す。
今、入力文字パターン■を認識するために、予め大分類
辞書4に記憶されている特徴が5種類あるとする。この
5種類の特徴A−Bを各カテゴリコードの特徴パラメタ
のデータ値で見た場合、変動幅が小さく最も安定性ある
特徴が特徴へであったとする。
辞書4に記憶されている特徴が5種類あるとする。この
5種類の特徴A−Bを各カテゴリコードの特徴パラメタ
のデータ値で見た場合、変動幅が小さく最も安定性ある
特徴が特徴へであったとする。
大分類辞書4は上述のように各カテゴリコードと5種類
の特徴A−Eの値が記憶されているが。
の特徴A−Eの値が記憶されているが。
この辞書4の特徴Aを第2図に示すように値の小さい順
に予めソーテングして記憶させて置く。
に予めソーテングして記憶させて置く。
次に、入力文字パターン■が入力し、特徴抽出部4で入
力文字パターン■の5種類の特徴(a)(特徴A−E)
を抽出し、この時の特1欣Aの値がkであったとすると
、大分類辞書4中より特徴Aの値がk又はkに最も近い
値を取るカテゴリを探し。
力文字パターン■の5種類の特徴(a)(特徴A−E)
を抽出し、この時の特1欣Aの値がkであったとすると
、大分類辞書4中より特徴Aの値がk又はkに最も近い
値を取るカテゴリを探し。
このカテゴリの前後Nカテコリ、計2Nカテコリを大分
類して認識部5に出力する。
類して認識部5に出力する。
次に、大分類された2Nカテゴリについて、全特徴A−
Eを用いて照合を行い認識結果■を後処理部6に送出す
る。尚第3図は照合対象の2Nカテコリ範囲を大分類す
る状況を示し、 C1〜Cnはカテゴリコードを示す。
Eを用いて照合を行い認識結果■を後処理部6に送出す
る。尚第3図は照合対象の2Nカテコリ範囲を大分類す
る状況を示し、 C1〜Cnはカテゴリコードを示す。
2Nカテゴリを゛大分類するための実現方法として本実
施例は、第1図に示すように制御部7内に設けである照
合範囲決定テーブル(blにて行うもの、とする。
施例は、第1図に示すように制御部7内に設けである照
合範囲決定テーブル(blにて行うもの、とする。
即ち、入力文字パターン■の5種類の特徴(alは制御
部7に送出される。制御部7では、この5種類の特@(
a)の内、特徴Aの値kをもとに照合範囲決定テーブル
(b)を検索する。
部7に送出される。制御部7では、この5種類の特@(
a)の内、特徴Aの値kをもとに照合範囲決定テーブル
(b)を検索する。
照合範囲決定テーブル(b)には、特徴Aの各値に応じ
て照合対象となる辞書4の範囲の開始アドレス(S)と
、終了アドレス(e)とが記入されている。制御部7は
この開始アドレス(S)、終了アドレスfe)によって
辞書4の照合範囲を絞り、この絞った範囲の文字カテゴ
リに対して認識部5で入力特徴(a)との照合を行う。
て照合対象となる辞書4の範囲の開始アドレス(S)と
、終了アドレス(e)とが記入されている。制御部7は
この開始アドレス(S)、終了アドレスfe)によって
辞書4の照合範囲を絞り、この絞った範囲の文字カテゴ
リに対して認識部5で入力特徴(a)との照合を行う。
以上のような本発明によれば、対象カテゴリ数の多い文
字認識において、大分類の時間を大幅に短縮することが
可能となる。
字認識において、大分類の時間を大幅に短縮することが
可能となる。
第1図は本発明に係る文字認識装置の一実施例。
第2図は本発明に係る大分類辞書のソーテング結果の一
実施例。 第3図は本発明に係る文字カテゴリ照合範囲決定状況図
。 第4図は文字認識システムの一般的なブロックダイヤグ
ラム。 第5図は認識辞書部の格納状況図。 をそれぞれ示す。 図において。 1は観測部、 2は前処理部。 3は特徴抽出部。 4は認識辞書(大分類辞書)。 5は認識部、 6は後処理部。 7は制御部。 をそれぞれ示す。 吊 1 目 亭3 覇
実施例。 第3図は本発明に係る文字カテゴリ照合範囲決定状況図
。 第4図は文字認識システムの一般的なブロックダイヤグ
ラム。 第5図は認識辞書部の格納状況図。 をそれぞれ示す。 図において。 1は観測部、 2は前処理部。 3は特徴抽出部。 4は認識辞書(大分類辞書)。 5は認識部、 6は後処理部。 7は制御部。 をそれぞれ示す。 吊 1 目 亭3 覇
Claims (1)
- 入力文字パターンから複数種の特徴を抽出する特徴抽出
部と、抽出された前記複数種の特徴をもとにして前記入
力文字パターンを一次的に分類する大分類辞書と、前記
大分類辞書と前記特徴抽出部との出力により該入力文字
パターンを認識する認識部とを備えてなる装置において
、前記大分類辞書は、前記複数種の特徴の内の所定特徴
をもとにその内容を所定値順位にソーテングして構成さ
れてなると共に、入力された文字パターンの特徴中より
該特徴に相当する特徴値がソーテングされた前記大分類
辞書のどの範囲にあるかを決定する照合範囲決定テーブ
ルを設けたことを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59270434A JPS61148585A (ja) | 1984-12-21 | 1984-12-21 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59270434A JPS61148585A (ja) | 1984-12-21 | 1984-12-21 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61148585A true JPS61148585A (ja) | 1986-07-07 |
Family
ID=17486222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59270434A Pending JPS61148585A (ja) | 1984-12-21 | 1984-12-21 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61148585A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS633965A (ja) * | 1986-06-24 | 1988-01-08 | Nec Corp | 印字用インクボ−ル打撃手段 |
JPS63282890A (ja) * | 1987-05-15 | 1988-11-18 | Fujitsu Ltd | パタ−ン識別装置 |
-
1984
- 1984-12-21 JP JP59270434A patent/JPS61148585A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS633965A (ja) * | 1986-06-24 | 1988-01-08 | Nec Corp | 印字用インクボ−ル打撃手段 |
JPS63282890A (ja) * | 1987-05-15 | 1988-11-18 | Fujitsu Ltd | パタ−ン識別装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100324847B1 (ko) | 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법 | |
US6834121B2 (en) | Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof | |
JPS62221088A (ja) | 光学式文字読取装置 | |
JPH0675995A (ja) | 自動分類付与装置および方法 | |
JPS61148585A (ja) | 文字認識装置 | |
JP2000231559A (ja) | 情報処理装置 | |
JPH07160822A (ja) | パターン認識方法 | |
JPS6146573A (ja) | 文字認識装置 | |
JPH024033B2 (ja) | ||
JP2002183667A (ja) | 文字認識装置及び記録媒体 | |
JP2894111B2 (ja) | 光学式活字文字認識装置における認識結果の総合判定方式 | |
JPS63782A (ja) | パタ−ン認識装置 | |
JP2003115028A (ja) | 帳票識別辞書自動生成方法及び帳票処理システム | |
JPH0944604A (ja) | 文字認識処理方法 | |
JPS6252912B2 (ja) | ||
JPS63282586A (ja) | 文字認識装置 | |
JPS63249282A (ja) | マルチフオント印刷文字読取り装置 | |
JPS5932080A (ja) | 文字パタ−ンの認識処理方式 | |
JPH06139402A (ja) | 文字認識装置 | |
Amin | Prototyping structural description using decision tree learning techniques | |
JPH01191992A (ja) | 文字認識装置 | |
JPS5856909B2 (ja) | 文字認識装置 | |
JPS60138689A (ja) | 文字認識方法 | |
JPH02308384A (ja) | 住所認識装置 | |
JPS6191780A (ja) | 文字認識装置 |