JPS60108981A - 光学文字読取装置 - Google Patents
光学文字読取装置Info
- Publication number
- JPS60108981A JPS60108981A JP58216149A JP21614983A JPS60108981A JP S60108981 A JPS60108981 A JP S60108981A JP 58216149 A JP58216149 A JP 58216149A JP 21614983 A JP21614983 A JP 21614983A JP S60108981 A JPS60108981 A JP S60108981A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- character
- categories
- similarity
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Multi Processors (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は光学文字読取装置に関し、特に漢字読取装置の
如く、照合ずべき辞書の多い場合に好適な光学文字読取
装置に関するものである。
如く、照合ずべき辞書の多い場合に好適な光学文字読取
装置に関するものである。
〔発明の背景]
従来の数字、英字、仮名文字あるいは記号等を読取り対
象とする光学文字読取装置においては。
象とする光学文字読取装置においては。
μ識部を複数個設けることにより処理を並列化し文字認
識の高速化を計っているものが知られている。この種の
光学文字読取装置においては、読取対象文字のカテゴリ
数が少ないため、辞書容量も少なく、文字認識の高速化
を比較的容易に達成することが可能であった。
識の高速化を計っているものが知られている。この種の
光学文字読取装置においては、読取対象文字のカテゴリ
数が少ないため、辞書容量も少なく、文字認識の高速化
を比較的容易に達成することが可能であった。
しかし7ながら、この方式を漢字の如きカテゴリ数の多
い文字を読取対象とする光学文字読取装置に適用すると
、辞書アクセスがネックとなり、文字認識速度の低下を
招くという問題がある。
い文字を読取対象とする光学文字読取装置に適用すると
、辞書アクセスがネックとなり、文字認識速度の低下を
招くという問題がある。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の光学文字読取装置における上述の
如き問題を解消し、文字認識速度を向上させた光学文字
読取装置を提供することにある。
するところは、従来の光学文字読取装置における上述の
如き問題を解消し、文字認識速度を向上させた光学文字
読取装置を提供することにある。
本発明の上記目的は、帳票上の文字・記号等を読取る光
学文字読取装置において、複数の認識部と、該複数の認
識部の各々に対応する専用の辞書部とを設けるとともに
、標準パターンを前記各辞帯部に分割格納し、前記各認
識部が同一の入カバターンを認識して認識結果の候補を
出力する如く構成さ4tたことを特徴とする光学文字読
取装置によって達成される。
学文字読取装置において、複数の認識部と、該複数の認
識部の各々に対応する専用の辞書部とを設けるとともに
、標準パターンを前記各辞帯部に分割格納し、前記各認
識部が同一の入カバターンを認識して認識結果の候補を
出力する如く構成さ4tたことを特徴とする光学文字読
取装置によって達成される。
以下、本発明の実施例を図面に基づいて詳細に説明する
。
。
第1回は一般的な光学文字読取装置の全体構成図である
。図において、1は読取対象である帳票2を照明する照
明用ランプ、3は上記帳票2からの反射光を受光する半
導体センサ、4は上記半導体センサ3の受光した光信号
を電気信号に変換する光電変換部を示している。また、
5は上記光電変換部4で電気信号に変換された文字列パ
ターンを1文字ごとに切出す文字切出し部、6は該文字
切出し部5により切出された1文字のパターンから特徴
を抽出し、後述する辞書部7の内容との整合を取ること
により認識を行う認識部を示している。
。図において、1は読取対象である帳票2を照明する照
明用ランプ、3は上記帳票2からの反射光を受光する半
導体センサ、4は上記半導体センサ3の受光した光信号
を電気信号に変換する光電変換部を示している。また、
5は上記光電変換部4で電気信号に変換された文字列パ
ターンを1文字ごとに切出す文字切出し部、6は該文字
切出し部5により切出された1文字のパターンから特徴
を抽出し、後述する辞書部7の内容との整合を取ること
により認識を行う認識部を示している。
上述の如く構成された光学文字読取装置に・おいては、
認識部6が文字切出し部5により切出された1文字分の
文字パターンと辞書部7の内容との整合を取ることによ
り認識結果を出力し、一連の処理を終了するものである
。
認識部6が文字切出し部5により切出された1文字分の
文字パターンと辞書部7の内容との整合を取ることによ
り認識結果を出力し、一連の処理を終了するものである
。
第2図は本発明の一実施例の要部である認識部と辞書部
の詳細な構成図である。本実施例における認識部は複数
個の認識プロセッサ(以下単に「プロセラ4す」ともい
う)10〜5oがら構成されており、辞書部は上記各プ
ロセッサごとに分割独立して設けられている。例えば、
辞書11は数字を認識するための標準パターンを格納し
ており、辞書21は英字、カタ仮名、記号を認識するた
めの標準パターンを、辞書31はびら仮名およびア行が
らす行までの漢字を認識するための標準パターンを、辞
書41は夕行からハ行までの漢字を認識するための標準
パターンを、辞書51はマ行以降の漢字の標準パターン
を、そJLぞれ格納している。
の詳細な構成図である。本実施例における認識部は複数
個の認識プロセッサ(以下単に「プロセラ4す」ともい
う)10〜5oがら構成されており、辞書部は上記各プ
ロセッサごとに分割独立して設けられている。例えば、
辞書11は数字を認識するための標準パターンを格納し
ており、辞書21は英字、カタ仮名、記号を認識するた
めの標準パターンを、辞書31はびら仮名およびア行が
らす行までの漢字を認識するための標準パターンを、辞
書41は夕行からハ行までの漢字を認識するための標準
パターンを、辞書51はマ行以降の漢字の標準パターン
を、そJLぞれ格納している。
そして、各認識部は対応する上記各辞書の内容に従って
、例えば、プロセッサ1oは数字を認識するための専用
認識プログラムを、プロセッサ2oは英字、カタ仮名、
記号を認識するための専用認識プログラムを、また、プ
ロセッサ30〜50は前記辞書31〜5Iに対応するひ
ら仮名、漢字を認識するための専用認識プログラムを、
それぞれ有する如く構成さ才している。
、例えば、プロセッサ1oは数字を認識するための専用
認識プログラムを、プロセッサ2oは英字、カタ仮名、
記号を認識するための専用認識プログラムを、また、プ
ロセッサ30〜50は前記辞書31〜5Iに対応するひ
ら仮名、漢字を認識するための専用認識プログラムを、
それぞれ有する如く構成さ才している。
また、最終判定部60は、後述する如く、上記各認識プ
ロセッサの出力した候補カテゴリと該候補力テ」りと入
力文字パターンとの類似度とを格納する候補カテゴリ表
70.該候補カテゴリ表70の内容の並べ換えを行う候
補ソーティング部71.該ソーティング部71による並
べ換え結果を格納するソーティング結果表80および該
ソーティング結果表80の内容を検定する認識演算部8
Iから構成されている。
ロセッサの出力した候補カテゴリと該候補力テ」りと入
力文字パターンとの類似度とを格納する候補カテゴリ表
70.該候補カテゴリ表70の内容の並べ換えを行う候
補ソーティング部71.該ソーティング部71による並
べ換え結果を格納するソーティング結果表80および該
ソーティング結果表80の内容を検定する認識演算部8
Iから構成されている。
−に述の如く構成された本実施例の動作を以下説明する
。
。
前記文字切出し部5によって1文字ごとに切出された文
字パターンは、同時に複数のi識プロセッサlO〜50
に入力されて認識処理が行われる。すなわち、各プロセ
ッサは入力文字パターンからその特徴を抽出し、各々の
有する辞書11〜51の内容゛を参照して整合を取り、
候補カテゴリと該候補の前記入力文字に対する類似度と
を出力する。
字パターンは、同時に複数のi識プロセッサlO〜50
に入力されて認識処理が行われる。すなわち、各プロセ
ッサは入力文字パターンからその特徴を抽出し、各々の
有する辞書11〜51の内容゛を参照して整合を取り、
候補カテゴリと該候補の前記入力文字に対する類似度と
を出力する。
第3図は最終判定部60の詳細な機能を、例を用−いて
示すものである。候補カテゴリ表70は前記各認識−プ
ロセッサ10〜50が文字パターン「力」を認識したと
きの候補カテゴリとその類似度から成る。
示すものである。候補カテゴリ表70は前記各認識−プ
ロセッサ10〜50が文字パターン「力」を認識したと
きの候補カテゴリとその類似度から成る。
候補カテゴリ「0」と「7」は認識プロセッサ10の出
力であり、また、「力」と1口」は認識プロセッサ20
、「か」、r力」および「九」は認識プロセッサ3o、
「刀」と「方」は認識プロセッサ40、そし、て「丸」
は認識プロセッサ50の出力である。上記各候補には、
類似度のデータが付加されているのは、前述の通りであ
る。
力であり、また、「力」と1口」は認識プロセッサ20
、「か」、r力」および「九」は認識プロセッサ3o、
「刀」と「方」は認識プロセッサ40、そし、て「丸」
は認識プロセッサ50の出力である。上記各候補には、
類似度のデータが付加されているのは、前述の通りであ
る。
最終判定部60の候補ソーティング部71は、」二記候
補カテゴリ表70を入力として候補カテゴリを類似度の
大きい順に並べ換え、ソーティング結果表80を得る。
補カテゴリ表70を入力として候補カテゴリを類似度の
大きい順に並べ換え、ソーティング結果表80を得る。
該ソーティング結果表80において、類似度の最大の候
補カテゴリー(「力」)を第1候補カテゴリ、次に大き
い候補カナ2ゴリ(「力」)を第2候補カテゴリと呼ぶ
。そして、認識演算部81はil候補カテゴリの類似度
が予め定めた閾値に、より大きく、かつ、第1候補カテ
ゴリの類似度と第2候補カテゴリの類似度との差が予め
定めた閾値K。
補カテゴリー(「力」)を第1候補カテゴリ、次に大き
い候補カナ2ゴリ(「力」)を第2候補カテゴリと呼ぶ
。そして、認識演算部81はil候補カテゴリの類似度
が予め定めた閾値に、より大きく、かつ、第1候補カテ
ゴリの類似度と第2候補カテゴリの類似度との差が予め
定めた閾値K。
より大きいときに、第1候補カテゴリ(r力」)を認識
結果と判定して、こAしを出力する如く構成されている
ものである。もし、上記判定条件が満たされない場合に
は、認識結果を「読取り不能」として誤認識を防d−す
る。
結果と判定して、こAしを出力する如く構成されている
ものである。もし、上記判定条件が満たされない場合に
は、認識結果を「読取り不能」として誤認識を防d−す
る。
第3図に示し、た例では、第1候補カテゴリである「力
」が上記判定条件を満たしているので、これが答として
出力されている。なお、L記説明では詳細は省略したが
、類似度の算出は、通常良く用いられる下記の式により
行ったが、これに限定さ4Lるものではない。
」が上記判定条件を満たしているので、これが答として
出力されている。なお、L記説明では詳細は省略したが
、類似度の算出は、通常良く用いられる下記の式により
行ったが、これに限定さ4Lるものではない。
5=(p、F)/IIPI・IIFI
ここで、Sは類似度を示し、(P、F)は照合パターン
f(x、y)と対応する標準パターンp (x r y
)の内積、IPII、 IIFIIはそれぞれのノル
ムを表わしている。
f(x、y)と対応する標準パターンp (x r y
)の内積、IPII、 IIFIIはそれぞれのノル
ムを表わしている。
上記実施例においては、辞書を5つのパートに分割し、
これらにカテゴリに重点を置いた標準パターンの割付け
を行ったが、分割個数は辞書の容量あるいは認識プログ
ラムによって如何ようにも変更することが可能である。
これらにカテゴリに重点を置いた標準パターンの割付け
を行ったが、分割個数は辞書の容量あるいは認識プログ
ラムによって如何ようにも変更することが可能である。
また、標準パターンの割イリけの方法も、カテゴリに重
点を置かない方法であっても差支えない。
点を置かない方法であっても差支えない。
以ヒ述ぺた如く、本発明によれば5帳票」二の文字・記
号等を読取る光学文字読取装置において、tI数のご、
2識部と、該複数の認識部の各々に対応する専用の辞書
部とを設けるとともに、標準パターンを前記各辞書部に
分割格納し、前記各認識部が同一の入カバターンを認識
して認識結果の候補を出力する如く構成したので、文字
認識速度を向上させた光学文字読取装置を実現できると
いう顕著な効果を奏するものである。
号等を読取る光学文字読取装置において、tI数のご、
2識部と、該複数の認識部の各々に対応する専用の辞書
部とを設けるとともに、標準パターンを前記各辞書部に
分割格納し、前記各認識部が同一の入カバターンを認識
して認識結果の候補を出力する如く構成したので、文字
認識速度を向上させた光学文字読取装置を実現できると
いう顕著な効果を奏するものである。
第1図は一般的な光学文字読取装置の全体構成図、第2
図は本発明の一実施例の要部である認識部と辞書部の構
成図、第3図はその最終判定部の詳細を示ず構成図であ
る。 2:@票、3:半導体センサ、4:光電変換部、5:文
字切出し部、6:認識部、10〜50:認識プロセッサ
、21〜5I:辞書、60:最終判定部、70:候補カ
テゴリ表、7に候補ソーティング部、80:ソーテイン
ク結果表、81:認識演算部。 第1図 答 え 第1頁の続き @発明者岡1)邦弘 国分寺市東恋ケ窪1丁目28幡地 株式会社日立製作所
中央研究所内
図は本発明の一実施例の要部である認識部と辞書部の構
成図、第3図はその最終判定部の詳細を示ず構成図であ
る。 2:@票、3:半導体センサ、4:光電変換部、5:文
字切出し部、6:認識部、10〜50:認識プロセッサ
、21〜5I:辞書、60:最終判定部、70:候補カ
テゴリ表、7に候補ソーティング部、80:ソーテイン
ク結果表、81:認識演算部。 第1図 答 え 第1頁の続き @発明者岡1)邦弘 国分寺市東恋ケ窪1丁目28幡地 株式会社日立製作所
中央研究所内
Claims (1)
- (1)帳票上の文字・記号等を読取る光学文字読取装置
において、複数の認識部と、該複数の認識部の各々に対
応する専用の辞書部とを設けるとともに、標準パターン
を前記各辞書部に分割格納し、前記各認識部が同一の入
カバターンを認識して認識結果の候補を出力する如く構
成されたことを特徴とする光学文字読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58216149A JPS60108981A (ja) | 1983-11-18 | 1983-11-18 | 光学文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58216149A JPS60108981A (ja) | 1983-11-18 | 1983-11-18 | 光学文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60108981A true JPS60108981A (ja) | 1985-06-14 |
Family
ID=16684045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58216149A Pending JPS60108981A (ja) | 1983-11-18 | 1983-11-18 | 光学文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60108981A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6151260A (ja) * | 1984-08-20 | 1986-03-13 | Sanyo Electric Co Ltd | パタ−ンマツチング回路 |
JPS62145485A (ja) * | 1985-12-20 | 1987-06-29 | Ricoh Co Ltd | 文字認識方式 |
JPS63223890A (ja) * | 1987-03-12 | 1988-09-19 | Toshiba Corp | 図面読取装置 |
JPH01259475A (ja) * | 1988-04-11 | 1989-10-17 | Canon Inc | 文字認識方法 |
EP0516316A2 (en) * | 1991-05-29 | 1992-12-02 | Canon Kabushiki Kaisha | Selection agent for a symbol determination system with multiple character recognition processors |
JPH0981730A (ja) * | 1995-09-18 | 1997-03-28 | Canon Inc | パターン認識方法及び装置及びコンピュータ制御装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5672782A (en) * | 1979-11-16 | 1981-06-17 | Toshiba Corp | Character read system |
JPS5699583A (en) * | 1980-01-09 | 1981-08-10 | Nippon Telegr & Teleph Corp <Ntt> | Character decision processing system |
-
1983
- 1983-11-18 JP JP58216149A patent/JPS60108981A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5672782A (en) * | 1979-11-16 | 1981-06-17 | Toshiba Corp | Character read system |
JPS5699583A (en) * | 1980-01-09 | 1981-08-10 | Nippon Telegr & Teleph Corp <Ntt> | Character decision processing system |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6151260A (ja) * | 1984-08-20 | 1986-03-13 | Sanyo Electric Co Ltd | パタ−ンマツチング回路 |
JPH0587872B2 (ja) * | 1984-08-20 | 1993-12-20 | Sanyo Electric Co | |
JPS62145485A (ja) * | 1985-12-20 | 1987-06-29 | Ricoh Co Ltd | 文字認識方式 |
JPS63223890A (ja) * | 1987-03-12 | 1988-09-19 | Toshiba Corp | 図面読取装置 |
JPH01259475A (ja) * | 1988-04-11 | 1989-10-17 | Canon Inc | 文字認識方法 |
EP0516316A2 (en) * | 1991-05-29 | 1992-12-02 | Canon Kabushiki Kaisha | Selection agent for a symbol determination system with multiple character recognition processors |
JPH0981730A (ja) * | 1995-09-18 | 1997-03-28 | Canon Inc | パターン認識方法及び装置及びコンピュータ制御装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62221088A (ja) | 光学式文字読取装置 | |
JPS60108981A (ja) | 光学文字読取装置 | |
JPS62165267A (ja) | 音声ワ−ドプロセツサ装置 | |
Han et al. | Coarse classification of Chinese characters via stroke clustering method | |
JPH024033B2 (ja) | ||
JPS59158482A (ja) | 文字認識装置 | |
KR100210492B1 (ko) | 영문 접촉문자 분리기능을 개선한 문서 인식장치 및 그 방법 | |
JPS6336389A (ja) | 文字読取装置 | |
JPH0254386A (ja) | 光学的文字読取装置の文字認識装置 | |
JPH051514B2 (ja) | ||
JPS63178379A (ja) | 光学式文字読取装置 | |
JPH0262659A (ja) | 日本文訂正候補文字抽出装置 | |
JPS6120180A (ja) | 光学的文字認識装置 | |
JPS61114388A (ja) | 文字入力装置 | |
JPS61272887A (ja) | 文字認識方式 | |
JPS6129976A (ja) | 文字認識方法 | |
JPS60254388A (ja) | 光学的文字読取装置 | |
JPS60101681A (ja) | 文字読取方式 | |
JPH0442382A (ja) | 単語読取装置 | |
JPS6327991A (ja) | 入力情報認識装置用ヒストグラム作成方法 | |
JPS60124773A (ja) | 文書作成装置 | |
JPH0264884A (ja) | 文字認識装置の辞書検索回路 | |
JPH0656627B2 (ja) | 文字認識方式 | |
JPH04148294A (ja) | 文字認識方式 | |
JPH02148277A (ja) | パターン認識装置 |