JPH0385691A - 認識結果判定方式 - Google Patents
認識結果判定方式Info
- Publication number
- JPH0385691A JPH0385691A JP1223666A JP22366689A JPH0385691A JP H0385691 A JPH0385691 A JP H0385691A JP 1223666 A JP1223666 A JP 1223666A JP 22366689 A JP22366689 A JP 22366689A JP H0385691 A JPH0385691 A JP H0385691A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- distance
- recognition
- multiplication value
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 38
- 239000000284 extract Substances 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims 1
- 238000012567 pattern recognition method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A、産業上の利用分野
本発明は認識対象のデータと辞書に登録されたデータを
参照、比較して文字、線分、シンボルを認識する認識結
果判定方式に関する。
参照、比較して文字、線分、シンボルを認識する認識結
果判定方式に関する。
B1発明の概要
本発明は各種の整合方式によって認識対象データと辞書
登録データを参照、比較し、文字、線分、シンボルを認
識する方式において、 互いに異なる複数の認識方式を適用して求められた複数
の文字、線分、シンボル候補のうち、認識対象に相当す
る辞書登録データとの距離がN番目に近い候補どうしを
乗算したものと、N+1番目に近い候補どうしを乗算し
たものとを比較し、該比較結果に基づいて文字、線分、
シンボル候補の順位付けを行うことにより、 認識処理時間を増加させることなく文字、線分、シンボ
ルの認識率を向上させたものである。
登録データを参照、比較し、文字、線分、シンボルを認
識する方式において、 互いに異なる複数の認識方式を適用して求められた複数
の文字、線分、シンボル候補のうち、認識対象に相当す
る辞書登録データとの距離がN番目に近い候補どうしを
乗算したものと、N+1番目に近い候補どうしを乗算し
たものとを比較し、該比較結果に基づいて文字、線分、
シンボル候補の順位付けを行うことにより、 認識処理時間を増加させることなく文字、線分、シンボ
ルの認識率を向上させたものである。
C従来の技術
文字や図形等を読み取るには例えば第3図のように構成
された図面入力装置が用いられる。第3図において1は
イメージスキャナであり、図面や文書のイメージ(画像
)を白または黒の点として画素(ドツト)単位に、すな
わち2値化データ(0と1)に変換する。2はベクタラ
イザーであり、前記画素単位に変換されたデータが同一
線」―にあれば直線、すなわち方向と長さを持ったベク
トルに変換する。3は認識装置であり、前記ベクトルデ
ータから図面、文書を構成する基本要素(文字、線分、
シンボル)に分離し、それら文字、線分、シンボルを所
定の認識方式によって認識する。これによって図面や文
書上の情報がコード化されてコンピュータに入力可能と
なる。
された図面入力装置が用いられる。第3図において1は
イメージスキャナであり、図面や文書のイメージ(画像
)を白または黒の点として画素(ドツト)単位に、すな
わち2値化データ(0と1)に変換する。2はベクタラ
イザーであり、前記画素単位に変換されたデータが同一
線」―にあれば直線、すなわち方向と長さを持ったベク
トルに変換する。3は認識装置であり、前記ベクトルデ
ータから図面、文書を構成する基本要素(文字、線分、
シンボル)に分離し、それら文字、線分、シンボルを所
定の認識方式によって認識する。これによって図面や文
書上の情報がコード化されてコンピュータに入力可能と
なる。
前記認識装置3が行う認識方式には、例えば大分類処理
によるパターン認識方式や詳細分類処理によるパターン
認識方式がある。すなわちまず比較的処理の簡単な大分
類処理(F uz□ア空間整合広によってF uzzy
辞書内辞書−タを参照比較する)を用いて候補をしぼり
込み、次に少くなった候補に対して処理時間のかかる、
しかし分類能力の高い詳細分類処理(輪郭DP整合法に
よって輪郭DP辞書内のデータを参照比較する)を行う
。
によるパターン認識方式や詳細分類処理によるパターン
認識方式がある。すなわちまず比較的処理の簡単な大分
類処理(F uz□ア空間整合広によってF uzzy
辞書内辞書−タを参照比較する)を用いて候補をしぼり
込み、次に少くなった候補に対して処理時間のかかる、
しかし分類能力の高い詳細分類処理(輪郭DP整合法に
よって輪郭DP辞書内のデータを参照比較する)を行う
。
D2発明が解決しようとする課題
上記の認識方式において、大分類処理によりパターン認
識を行って第N位までのカテゴリ候補C1(+ =’l
、 2 、 ・・N)が選び出されると、それぞ
れに対応する辞書との距離(統計的距離)Ql(i−1
2,・・・N)が求められる。また詳細分類処理におい
ても並べかえられた候補C0〜CNに対して辞書との距
離Ri(i = 1 、 2 、・・・N)が求められ
る。前記Q+、R+の値はともに辞書との距離が近い程
零に近づき、距離が遠いと大きくなるものとすると、通
常はR1の小さい順にCIを並べ、入力(認識対象の文
字、シンボル等)が辞書の持つカテゴリ内のどれに対応
しているかを判定する。
識を行って第N位までのカテゴリ候補C1(+ =’l
、 2 、 ・・N)が選び出されると、それぞ
れに対応する辞書との距離(統計的距離)Ql(i−1
2,・・・N)が求められる。また詳細分類処理におい
ても並べかえられた候補C0〜CNに対して辞書との距
離Ri(i = 1 、 2 、・・・N)が求められ
る。前記Q+、R+の値はともに辞書との距離が近い程
零に近づき、距離が遠いと大きくなるものとすると、通
常はR1の小さい順にCIを並べ、入力(認識対象の文
字、シンボル等)が辞書の持つカテゴリ内のどれに対応
しているかを判定する。
従ってN個の候補の中で順番を付ける能力は詳細分類の
能力で決まってしまう。この場合大分類での候補CIの
順序と詳細分類で並べかえられた候補CIの順序とが等
しければ、つまり並べかえが起きなければ問題はないが
、通常は異なることが多い。このように従来の認識方式
では認識率が低いという欠点があった。
能力で決まってしまう。この場合大分類での候補CIの
順序と詳細分類で並べかえられた候補CIの順序とが等
しければ、つまり並べかえが起きなければ問題はないが
、通常は異なることが多い。このように従来の認識方式
では認識率が低いという欠点があった。
本発明は上記の点に鑑みてなきたちのでその目的は、認
識処理時間を増やすことなく文字、線分、シンボルの認
識率を高めることができる認識結果判定方式を提供する
ことにある。
識処理時間を増やすことなく文字、線分、シンボルの認
識率を高めることができる認識結果判定方式を提供する
ことにある。
89課題を解決するための手段
本発明は、文字、線分、シンボルが混在する被写体をラ
スタスキャンして得られた黒白に対応する2値化画素デ
ータから文字、線分、シンボルのデータを抽出し、該抽
出されたデータと文字、線分、ノンポルが登録された辞
書とを参照、比較して文字、線分、シンボルを認識する
方式において、複数の認識方式によって認識対象データ
と前記辞書に登録されたデータを参照、比較して複数の
文字、線分、シンボル候補を求め、 前記複数の認識方式によって求められた複数の文字、線
分、シンボル候補のうち、各々第N番目の順位となった
候補の辞書内データとの距離どうしを乗算して第1の距
離乗算値を求め、前記複数の認識方式によって求められ
た複数の文字、線分、シンボル候補のうち、各々第N+
1番目の順位となった候補の辞書内データとの距離どう
しを乗算して第2の距離乗算値を求め、前記第1の距離
乗算値と第2の距離乗算値を比較し、該比較結果に基づ
いて前記複数の文字、線分、シンボル候補の順位付けを
行うことを特徴ととしている。
スタスキャンして得られた黒白に対応する2値化画素デ
ータから文字、線分、シンボルのデータを抽出し、該抽
出されたデータと文字、線分、ノンポルが登録された辞
書とを参照、比較して文字、線分、シンボルを認識する
方式において、複数の認識方式によって認識対象データ
と前記辞書に登録されたデータを参照、比較して複数の
文字、線分、シンボル候補を求め、 前記複数の認識方式によって求められた複数の文字、線
分、シンボル候補のうち、各々第N番目の順位となった
候補の辞書内データとの距離どうしを乗算して第1の距
離乗算値を求め、前記複数の認識方式によって求められ
た複数の文字、線分、シンボル候補のうち、各々第N+
1番目の順位となった候補の辞書内データとの距離どう
しを乗算して第2の距離乗算値を求め、前記第1の距離
乗算値と第2の距離乗算値を比較し、該比較結果に基づ
いて前記複数の文字、線分、シンボル候補の順位付けを
行うことを特徴ととしている。
10作用
所定の認識方式、例えば大分類処理によるパターン認識
方式によって求められた各候補の順序(配列)と他の認
識方式、例えば詳細分類処理によるパターン認識方式に
よって求められた各候補の順序とが同一であれば第2の
距離乗算値は第1の距離乗算値よりも犬となる。このた
め詳細分類処理によるパターン認識方式によって求めら
れた候補の順序どおりに各候補の順位が決定される。ま
た大分類による認識方式で得られた各候補の順序と詳細
分類による認識方式で得られた各候補の順序とが異なり
、第2の距離乗算値が第1の距離乗算値よりも小となっ
た場合は、N番目の候補とN+1番目の候補の順序を入
れ換えて順位付けされる。
方式によって求められた各候補の順序(配列)と他の認
識方式、例えば詳細分類処理によるパターン認識方式に
よって求められた各候補の順序とが同一であれば第2の
距離乗算値は第1の距離乗算値よりも犬となる。このた
め詳細分類処理によるパターン認識方式によって求めら
れた候補の順序どおりに各候補の順位が決定される。ま
た大分類による認識方式で得られた各候補の順序と詳細
分類による認識方式で得られた各候補の順序とが異なり
、第2の距離乗算値が第1の距離乗算値よりも小となっ
た場合は、N番目の候補とN+1番目の候補の順序を入
れ換えて順位付けされる。
このように複数の認識方式で求められた各候補の順位を
総合的に判定することができる。このため認識率が著し
く向上する。
総合的に判定することができる。このため認識率が著し
く向上する。
G、実施例
以下、図面を参照しながら本発明の一実施例を説明する
。第1図は実施例の処理内容を示すブロック図であり、
IIは例えば第3図のベクタライザー2のデータから分
離させた基本要素(文字、線分、シンボル)を複数の認
識方式によって認識する認識処理部である。12は認識
処理部11の認識結果のうち同一順位となった候補の、
辞書(認識対象に相当する辞書内のデータ)との各距離
を各々乗算する距離乗算処理部である。この距離乗算処
理部12では第N番目の順位となった候補の辞書との距
離どうしを乗算して第1の距離乗算値が求められ、第N
+1番目の順位となった候補の辞書との距離どうしを乗
算して第2の距離乗算値が求められる。I3は距離乗算
処理部I2で求められた第1および第2の距離乗算値を
比較して第2の距離乗算値が第1の距離乗算値よりも小
さいか否かを判定する比較判定処理部である。14は、
前記比較判定処理部13において第2の距離乗算値が第
1の距離乗算値よりも小さいことを判定したときに、N
番目の候補とN+1番目の候補を入れ換える候補交換処
理部である。
。第1図は実施例の処理内容を示すブロック図であり、
IIは例えば第3図のベクタライザー2のデータから分
離させた基本要素(文字、線分、シンボル)を複数の認
識方式によって認識する認識処理部である。12は認識
処理部11の認識結果のうち同一順位となった候補の、
辞書(認識対象に相当する辞書内のデータ)との各距離
を各々乗算する距離乗算処理部である。この距離乗算処
理部12では第N番目の順位となった候補の辞書との距
離どうしを乗算して第1の距離乗算値が求められ、第N
+1番目の順位となった候補の辞書との距離どうしを乗
算して第2の距離乗算値が求められる。I3は距離乗算
処理部I2で求められた第1および第2の距離乗算値を
比較して第2の距離乗算値が第1の距離乗算値よりも小
さいか否かを判定する比較判定処理部である。14は、
前記比較判定処理部13において第2の距離乗算値が第
1の距離乗算値よりも小さいことを判定したときに、N
番目の候補とN+1番目の候補を入れ換える候補交換処
理部である。
前記比較判定処理部13および候補交換処理部14の処
理フローは第2図のように示される。第2図においてR
rは例えば大分類方式で認識された候補のうち1番目の
候補の辞書との距離、R。
理フローは第2図のように示される。第2図においてR
rは例えば大分類方式で認識された候補のうち1番目の
候補の辞書との距離、R。
は大分類方式で認識された候補のうち、1番目(J−I
+1)の候補の辞書との距離、Qlは詳細分類方式で認
識された候補のうち1番目の候補の辞書との距離、QJ
は詳細分類方式で認識された候補のうち1番目の候補の
辞書との距離である。前記大分類および詳細分類の認識
方式から求められたR1.RJ、Qx、QJが、RI
X Q ■≦R、y x Q yであるか否かをステッ
プS、で判定する。その結果YESであれば1番目の候
補と1番目(J=I+1)1 の候補はそのままの順位付けがなされる。またステップ
SIの判定結果がNoである場合はステップS2におい
てI番目の候補と1番目の候補の順序を入れ換える。
+1)の候補の辞書との距離、Qlは詳細分類方式で認
識された候補のうち1番目の候補の辞書との距離、QJ
は詳細分類方式で認識された候補のうち1番目の候補の
辞書との距離である。前記大分類および詳細分類の認識
方式から求められたR1.RJ、Qx、QJが、RI
X Q ■≦R、y x Q yであるか否かをステッ
プS、で判定する。その結果YESであれば1番目の候
補と1番目(J=I+1)1 の候補はそのままの順位付けがなされる。またステップ
SIの判定結果がNoである場合はステップS2におい
てI番目の候補と1番目の候補の順序を入れ換える。
上記のように複数の認識結果から各候補の総合的な順位
付けが行われるので、認識率が非常に高められる。また
本発明を適用した場合の処理時間はほとんど増えない。
付けが行われるので、認識率が非常に高められる。また
本発明を適用した場合の処理時間はほとんど増えない。
尚、複数の認識方式は大分類方式、詳細分類方式に限ら
ず他の認識方式を用いても良い。
ず他の認識方式を用いても良い。
H1発明の効果
以上のように本発明によれば複数の認識方式によって求
めた複数の文字、線分、シンボル候補のうち、各々N番
目の候補の辞書との距離どうしを乗算したものと、N千
1番目の候補の辞書との距2 離どうしを乗算したものとを比較し、該比較結果に基づ
いて前記各候補の順位付けを行うようにしたので、複数
の認識結果から各候補の総合的な順位付けを行うことが
できる。このため処理時間を増やすことなく認識率を大
幅に高めることができる。
めた複数の文字、線分、シンボル候補のうち、各々N番
目の候補の辞書との距離どうしを乗算したものと、N千
1番目の候補の辞書との距2 離どうしを乗算したものとを比較し、該比較結果に基づ
いて前記各候補の順位付けを行うようにしたので、複数
の認識結果から各候補の総合的な順位付けを行うことが
できる。このため処理時間を増やすことなく認識率を大
幅に高めることができる。
第1図は本発明の一実施例を示、すブロック図、第2図
は本発明の一実施例の要部フローヂャート、第3図は図
面入力装置のブロック図である。 11・・・認識処理部、12・・・距離乗算処理部、1
3・・比較判定処理部、14・・・候補交換処理部。 外2名 実施例のブロック図 1・・・認識処理部 2・・・距離乗算処理部 3・比較判定処理部 4・・・候補交換処理部
は本発明の一実施例の要部フローヂャート、第3図は図
面入力装置のブロック図である。 11・・・認識処理部、12・・・距離乗算処理部、1
3・・比較判定処理部、14・・・候補交換処理部。 外2名 実施例のブロック図 1・・・認識処理部 2・・・距離乗算処理部 3・比較判定処理部 4・・・候補交換処理部
Claims (1)
- (1)文字、線分、シンボルが混在する被写体をラスタ
スキャンして得られた黒白に対応する2値化画素データ
から文字、線分、シンボルのデータを抽出し、該抽出さ
れたデータと文字、線分、シンボルが登録された辞書と
を参照、比較して文字、線分、シンボルを認識する方式
において、 複数の認識方式によって認識対象データと前記辞書に登
録されたデータを参照、比較して複数の文字、線分、シ
ンボル候補を求め、 前記複数の認識方式によって求められた複数の文字、線
分、シンボル候補のうち、各々第N番目の順位となった
候補の辞書内データとの距離どうしを乗算して第1の距
離乗算値を求め、 前記複数の認識方式によって求められた複数の文字、線
分、シンボル候補のうち、各々第N+1番目の順位とな
った候補の辞書内データとの距離どうしを乗算して第2
の距離乗算値を求め、前記第1の距離乗算値と第2の距
離乗算値を比較し、該比較結果に基づいて前記複数の文
字、線分、シンボル候補の順位付けを行うことを特徴と
する認識結果判定方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1223666A JPH0385691A (ja) | 1989-08-30 | 1989-08-30 | 認識結果判定方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1223666A JPH0385691A (ja) | 1989-08-30 | 1989-08-30 | 認識結果判定方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0385691A true JPH0385691A (ja) | 1991-04-10 |
Family
ID=16801749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1223666A Pending JPH0385691A (ja) | 1989-08-30 | 1989-08-30 | 認識結果判定方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0385691A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0516316A2 (en) * | 1991-05-29 | 1992-12-02 | Canon Kabushiki Kaisha | Selection agent for a symbol determination system with multiple character recognition processors |
-
1989
- 1989-08-30 JP JP1223666A patent/JPH0385691A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0516316A2 (en) * | 1991-05-29 | 1992-12-02 | Canon Kabushiki Kaisha | Selection agent for a symbol determination system with multiple character recognition processors |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4757551A (en) | Character recognition method and system capable of recognizing slant characters | |
JP3133403B2 (ja) | 近隣ブロック予測ビット圧縮法 | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
US5909510A (en) | Method and apparatus for document classification from degraded images | |
WO1996024114A2 (en) | Method and apparatus for separating foreground from background in images containing text | |
US20020154815A1 (en) | Character recognition device and a method therefore | |
US6185338B1 (en) | Character recognition using candidate frames to determine character location | |
US6240209B1 (en) | Method for deriving character features in a character recognition system | |
JPH0385691A (ja) | 認識結果判定方式 | |
JPH0333990A (ja) | マスク処理を用いる光学式文字認識装置及び方法 | |
EP1010128B1 (en) | Method for performing character recognition on a pixel matrix | |
Aouadi et al. | A recognition based approach for segmenting touching components in Arabic manuscripts | |
JPS60153575A (ja) | 文字読取方法 | |
Jeng | Optical Chinese character recognition using accumulated stroke features | |
JPH11120291A (ja) | パタン認識システム | |
JPH0922443A (ja) | オンライン手書き文字認識方法 | |
RU2126552C1 (ru) | Способ распознавания кодированных изображений | |
JPS63780A (ja) | パターン認識方法 | |
Sushen et al. | An Effective Content Based Image Retrieval Using Dot Diffusion Block Truncation Coding | |
JPH09265530A (ja) | 辞書作成方法およびカラー画像認識方法 | |
JPH08101880A (ja) | 文字認識装置 | |
JP2641209B2 (ja) | 特徴ベクトルの圧縮方法 | |
JPH09319826A (ja) | 手書き文字認識装置 | |
JPS60147891A (ja) | 文字認識装置 | |
JPS6089290A (ja) | パタ−ン認識方法 |