JPH0219986A - 文字認識における適合辞書決定方法および該方法を実施する文字認識装置 - Google Patents
文字認識における適合辞書決定方法および該方法を実施する文字認識装置Info
- Publication number
- JPH0219986A JPH0219986A JP63168669A JP16866988A JPH0219986A JP H0219986 A JPH0219986 A JP H0219986A JP 63168669 A JP63168669 A JP 63168669A JP 16866988 A JP16866988 A JP 16866988A JP H0219986 A JPH0219986 A JP H0219986A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image data
- dictionary
- characters
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 19
- 230000003044 adaptive effect Effects 0.000 title abstract 4
- 238000000605 extraction Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
複数種類の活字の書体について文字の特徴データを記憶
する複数の活字辞書を用いる文字認識において、入力し
たイメージ・データに含まれる文字の書体に適合する活
字辞書を決定する文字認識における適合辞書決定方法に
関し、 認識率および認識速度が低下することのないようにする
ことを目的とし、 複数種類の活字の書体について文字の特徴データを記憶
する活字辞書を有し、入力したイメージ・データから文
字が存在する領域のイメージ・データを切り出し、該文
字が存在する領域のイメージ・データから抽出した文字
の特徴データと前記活字辞書に記憶した活字の特徴デー
タとを比較することにより該入力したイメージ・データ
中の文字を認識する文字認識における適合辞書決定方法
であって、前記入力したイメージ・データのうち、外部
より指定した部分領域のイメージ・データから文字が存
在する領域のイメージ・データを切り出し、該文字が存
在する領域のイメージから抽出した文字の特徴データを
前記複数種類の書体の活字辞書の各々に記憶した活字の
特徴データと順次比較して該複数種類の書体の活字辞書
の各々による文字認識結果を求め、該各々による文字認
識結果を、前記指定した部分領域の文字の、オペレータ
による認識結果と比較することにより、入力したイメー
ジ・データの文字の書体に適合する活字辞書を決定する
ように構成する。
する複数の活字辞書を用いる文字認識において、入力し
たイメージ・データに含まれる文字の書体に適合する活
字辞書を決定する文字認識における適合辞書決定方法に
関し、 認識率および認識速度が低下することのないようにする
ことを目的とし、 複数種類の活字の書体について文字の特徴データを記憶
する活字辞書を有し、入力したイメージ・データから文
字が存在する領域のイメージ・データを切り出し、該文
字が存在する領域のイメージ・データから抽出した文字
の特徴データと前記活字辞書に記憶した活字の特徴デー
タとを比較することにより該入力したイメージ・データ
中の文字を認識する文字認識における適合辞書決定方法
であって、前記入力したイメージ・データのうち、外部
より指定した部分領域のイメージ・データから文字が存
在する領域のイメージ・データを切り出し、該文字が存
在する領域のイメージから抽出した文字の特徴データを
前記複数種類の書体の活字辞書の各々に記憶した活字の
特徴データと順次比較して該複数種類の書体の活字辞書
の各々による文字認識結果を求め、該各々による文字認
識結果を、前記指定した部分領域の文字の、オペレータ
による認識結果と比較することにより、入力したイメー
ジ・データの文字の書体に適合する活字辞書を決定する
ように構成する。
本発明は、複数種類の活字の書体について文字の特徴デ
ータを記憶する複数の活字辞書を用いる文字認識におい
て、入力したイメージ・データに含まれる文字の書体に
適合する活字辞書を決定する文字認識における適合辞書
決定方法、および、該方法を実施する文字認識装置に関
する。
ータを記憶する複数の活字辞書を用いる文字認識におい
て、入力したイメージ・データに含まれる文字の書体に
適合する活字辞書を決定する文字認識における適合辞書
決定方法、および、該方法を実施する文字認識装置に関
する。
紙上に記された文字を読み取る文字認識装置においては
、例えば、第5図に示されるように、イメージ・スキャ
ナ10等によって紙上から光学的に読み取ったイメージ
・データを一旦イメージ・メモリ11に保持し、該イメ
ージ・データから文字が存在する部分を切り出しく文字
切り出し手段21)、該文字が存在する部分から文字の
輪郭を抽出しく輪郭抽出手段31)、さらに、該輪郭を
ベクトル化する等して該輪郭の特徴データを抽出しく特
徴抽出手段32)、該抽出した特徴データを、活字辞書
9に記憶される活字の特徴データ(文字フォント)と順
次比較することにより、イメージ・データに含まれる文
字の認識を行なう(文字認識手段40)。
、例えば、第5図に示されるように、イメージ・スキャ
ナ10等によって紙上から光学的に読み取ったイメージ
・データを一旦イメージ・メモリ11に保持し、該イメ
ージ・データから文字が存在する部分を切り出しく文字
切り出し手段21)、該文字が存在する部分から文字の
輪郭を抽出しく輪郭抽出手段31)、さらに、該輪郭を
ベクトル化する等して該輪郭の特徴データを抽出しく特
徴抽出手段32)、該抽出した特徴データを、活字辞書
9に記憶される活字の特徴データ(文字フォント)と順
次比較することにより、イメージ・データに含まれる文
字の認識を行なう(文字認識手段40)。
ところが、読み取る対象の文字を含むイメージ・データ
においては、使用する活字によっ°ζ文字フォント(文
字の特徴データ)の種類が異なっており(例えば、明朝
体、ゴシック体、教科書体、さらには、異なるメーカに
よる文字フォント等)、上記の活字辞書は該異なる文字
フォントの種類毎に設ける必要がある。
においては、使用する活字によっ°ζ文字フォント(文
字の特徴データ)の種類が異なっており(例えば、明朝
体、ゴシック体、教科書体、さらには、異なるメーカに
よる文字フォント等)、上記の活字辞書は該異なる文字
フォントの種類毎に設ける必要がある。
そのため、従来、複数種類の文字フォントの辞書を有し
て、読み込んだイメージ・データから抽出した文字の特
徴データを、全ての種類の活字辞書に記憶される活字の
特徴データと順次比較することにより、イメージ・デー
タに含まれる文字の認識を行なうマルチテンプレート方
式による文字認識装置が提案されている。
て、読み込んだイメージ・データから抽出した文字の特
徴データを、全ての種類の活字辞書に記憶される活字の
特徴データと順次比較することにより、イメージ・デー
タに含まれる文字の認識を行なうマルチテンプレート方
式による文字認識装置が提案されている。
しかしながら、従来のマルチテンプレート方式による文
字認識装置においては、文字の認識率の低下、および認
識速度の遅延等の問題が生じており、このような問題を
解決する技術が要望されていた。
字認識装置においては、文字の認識率の低下、および認
識速度の遅延等の問題が生じており、このような問題を
解決する技術が要望されていた。
第6図は、従来のマルチテンプレート方式による文字認
識装置の機能の概略を説明するものである。
識装置の機能の概略を説明するものである。
第6図において、500は読み取りの対象となる文字を
含むイメージ・データが表示された原稿、301は上記
従来のマルチテンプレート方式による文字認識装置、9
7.9□、93は、それぞれ、異なる書体の活字の特徴
データ(異なる種類の文字フォント)を記憶する活字辞
書、400は該文字認識装置301によりて認識した文
字(のキャラクタコード)を入力する端末装置である。
含むイメージ・データが表示された原稿、301は上記
従来のマルチテンプレート方式による文字認識装置、9
7.9□、93は、それぞれ、異なる書体の活字の特徴
データ(異なる種類の文字フォント)を記憶する活字辞
書、400は該文字認識装置301によりて認識した文
字(のキャラクタコード)を入力する端末装置である。
従来のマルチテンプレート方式による文字認識装置にお
いては、例えば、上記の異なる書体の活字の特徴データ
(異なる種類の文字フォント)を記憶する複数の活字辞
書95,9□、9.の全てに記憶される全ての活字の特
徴データ(文字フォント)について、イメージ・データ
から抽出した文字の特徴データとの比較照合を行なう。
いては、例えば、上記の異なる書体の活字の特徴データ
(異なる種類の文字フォント)を記憶する複数の活字辞
書95,9□、9.の全てに記憶される全ての活字の特
徴データ(文字フォント)について、イメージ・データ
から抽出した文字の特徴データとの比較照合を行なう。
そのため、イメージ・データから抽出した文字の特徴デ
ータが、該抽出した文字の文字フォントの種類と異なる
種類の文字フォントの活字データを記憶する活字辞書内
の別の文字として誤認識されることがある。
ータが、該抽出した文字の文字フォントの種類と異なる
種類の文字フォントの活字データを記憶する活字辞書内
の別の文字として誤認識されることがある。
例えば、原稿上に「き」と記されたイメージ・データか
ら抽出された特徴データが、第6図の辞書へ 91にお
いては「き」、辞書B9□においては「て」、そして、
辞書C93においては「さ」に最も近いと判定され、且
つ、辞書A 9+による「き」との近領度より、他の
辞書B 9tにおける「で」、あるいは、辞書C9s
における「さ」との近似度が大きいと判定されたとする
と、該原稿上の文字「き」が、「て」、あるいは、「さ
」として誤認識されてしまう。すなわち、認識率が低下
する。
ら抽出された特徴データが、第6図の辞書へ 91にお
いては「き」、辞書B9□においては「て」、そして、
辞書C93においては「さ」に最も近いと判定され、且
つ、辞書A 9+による「き」との近領度より、他の
辞書B 9tにおける「で」、あるいは、辞書C9s
における「さ」との近似度が大きいと判定されたとする
と、該原稿上の文字「き」が、「て」、あるいは、「さ
」として誤認識されてしまう。すなわち、認識率が低下
する。
また、従来のマルチテンプレート方式による文字認識装
置においては、前記のように、活字辞書91.9□、9
3の全てに記憶される全ての活字の特徴データ(文字フ
ォント)について比較照合を行なうため、認識速度が低
下するという問題もある。
置においては、前記のように、活字辞書91.9□、9
3の全てに記憶される全ての活字の特徴データ(文字フ
ォント)について比較照合を行なうため、認識速度が低
下するという問題もある。
本発明は上記の問題点に鑑み、なされたもので、文字認
識装置における認識率および認識速度の低下を防止する
文字認識における適合辞書決定方法、および、該方法を
実施する文字認識装置を提供することを目的とするもの
である。′ 〔課題を解決するための手段〕 本発明による、文字認識における適合辞書決定方法にお
いては、第1図に示されるように、ステップStにて、
イメージ・データを入力し、ステップS2にて、該入力
したイメージ・データのうち、該イメージ・データに含
まれる文字の書体に適合する活字辞書を判定するための
部分イメージ・データを指定する。そして、ステップS
3にて、該部分イメージ・データから文字としての特徴
データを抽出し、ステップS4にて、該抽出した文字と
しての特徴データを、前記複数の活字辞書により比較し
て文字認識を行ない、該複数の活字辞書それぞれによる
文字認識結果を求める。
識装置における認識率および認識速度の低下を防止する
文字認識における適合辞書決定方法、および、該方法を
実施する文字認識装置を提供することを目的とするもの
である。′ 〔課題を解決するための手段〕 本発明による、文字認識における適合辞書決定方法にお
いては、第1図に示されるように、ステップStにて、
イメージ・データを入力し、ステップS2にて、該入力
したイメージ・データのうち、該イメージ・データに含
まれる文字の書体に適合する活字辞書を判定するための
部分イメージ・データを指定する。そして、ステップS
3にて、該部分イメージ・データから文字としての特徴
データを抽出し、ステップS4にて、該抽出した文字と
しての特徴データを、前記複数の活字辞書により比較し
て文字認識を行ない、該複数の活字辞書それぞれによる
文字認識結果を求める。
ステップS5にては、上記ステップS2にて指定した部
分イメージ・データに含まれる文字の、オペレータによ
る認識結果を入力する。
分イメージ・データに含まれる文字の、オペレータによ
る認識結果を入力する。
ステップS6において、ステップS4にて求めた複数の
活字辞書それぞれによる文字認識結果を、ステップS5
にて入力したオペレータによる認識結果と比較して該文
字認識結果の優劣を判定する。
活字辞書それぞれによる文字認識結果を、ステップS5
にて入力したオペレータによる認識結果と比較して該文
字認識結果の優劣を判定する。
こうして、ステップS7において、オペレータによる認
識結果と最も近い文字認識結果を示した活字辞書が、該
イメージ・データに含まれる文字の書体に適合する活字
辞書として決定される。
識結果と最も近い文字認識結果を示した活字辞書が、該
イメージ・データに含まれる文字の書体に適合する活字
辞書として決定される。
以上の手順の後、ステップS8において、該決定された
活字辞書にしたがって、前記イメージ・データ全体に含
まれる文字の認識が行なわれる。
活字辞書にしたがって、前記イメージ・データ全体に含
まれる文字の認識が行なわれる。
第2図は、上述の、文字認識における適合辞書決定方法
を実施する文字認識装置の基本構成を示すものである。
を実施する文字認識装置の基本構成を示すものである。
第2図において、lはイメージ・データ入力手段、2は
文字切り出し手段、3は特徴抽出手段、4は文字認識手
段、5は部分イメージ指定手段、6は部分イメージ・オ
ペレータ認識入力手段、7は適合辞書決定手段、8は辞
書選択手段、91.9□・・・9oは、複数の活字辞書
である。
文字切り出し手段、3は特徴抽出手段、4は文字認識手
段、5は部分イメージ指定手段、6は部分イメージ・オ
ペレータ認識入力手段、7は適合辞書決定手段、8は辞
書選択手段、91.9□・・・9oは、複数の活字辞書
である。
イメージ・データ入力手段lはイメージ・データを入力
する。
する。
部分イメージ指定手段5は、前記の入力したイメージ・
データのうちの所定の部分領域のイメージ・データを外
部より指定する。
データのうちの所定の部分領域のイメージ・データを外
部より指定する。
文字切り出し手段2は、前記入力したイメージ・データ
、あるいは、前記所定の部分領域のイメージ・データか
ら、文字が存在する領域のイメージ・データを切り出す
。
、あるいは、前記所定の部分領域のイメージ・データか
ら、文字が存在する領域のイメージ・データを切り出す
。
特徴抽出手段3は、前記文字が存在する領域のイメージ
・データから文字の特徴データを抽出する。
・データから文字の特徴データを抽出する。
複数の活字辞書9□9□、・・・汎は、複数種類の活字
の書体について文字の特徴データを記憶する。
の書体について文字の特徴データを記憶する。
辞書選択手段8は、前記複数の活字辞書93,9□。
・・・97のうち1つを選択する。
文字認識手段4は、前記特徴抽出手段3にて抽出された
文字の特徴データを、前記辞書選択手段8にて選択され
た活字辞書93.92.・・・9.、に記憶された文字
の特徴データと比較するごとにより、該抽出された文字
を認識する。
文字の特徴データを、前記辞書選択手段8にて選択され
た活字辞書93.92.・・・9.、に記憶された文字
の特徴データと比較するごとにより、該抽出された文字
を認識する。
部分イメージ・オペレータ認識入力手段6は、前記指定
した所定の部分領域のイメージ・データに含まれる文字
の、オペレータによる認識結果を入力する。
した所定の部分領域のイメージ・データに含まれる文字
の、オペレータによる認識結果を入力する。
適合辞書決定手段7は、前記辞書選択手段8において前
記複数の活字辞書9..9□、・・・9oを順次選択さ
せることにより、前記文字認識手段4からの、該複数の
活字辞書91,9□、・・・9.、の各々との比較によ
る文字認識結果を得、該各々との比較による文字認識結
果を前記オペレータによる認識結果と比較することによ
り、入力したイメージ・データに含まれる文字の認識に
適合する活字辞書を決定する。
記複数の活字辞書9..9□、・・・9oを順次選択さ
せることにより、前記文字認識手段4からの、該複数の
活字辞書91,9□、・・・9.、の各々との比較によ
る文字認識結果を得、該各々との比較による文字認識結
果を前記オペレータによる認識結果と比較することによ
り、入力したイメージ・データに含まれる文字の認識に
適合する活字辞書を決定する。
入力したイメージ・データのうち、オペレータが指定し
た一部分のイメージ・データのみについて、全ての活字
辞書94.9□、・・・97による文字認識を順次行な
い、該文字認識の認識率の優劣の比較基準としては、該
指定した一部分のイメージ・データの、オペレータによ
る文字認識結果を用いる。
た一部分のイメージ・データのみについて、全ての活字
辞書94.9□、・・・97による文字認識を順次行な
い、該文字認識の認識率の優劣の比較基準としては、該
指定した一部分のイメージ・データの、オペレータによ
る文字認識結果を用いる。
したがって、従来のマルチテンプレート方式による文字
認識装置におけるように、入力したイメージ・データ全
てについて、全ての活字辞書9.。
認識装置におけるように、入力したイメージ・データ全
てについて、全ての活字辞書9.。
9□、・・・91による文字認識を行なうことがないの
で、認識速度の遅延が少なくなり、また、オペレータが
指定したイメージ・データを用い、オペレータが該イメ
ージ・データから読み取った認識結果を判定基準として
適合する辞書の判定を行なうので、異常な誤認識が無く
なり、認識率の低下も防止できる。
で、認識速度の遅延が少なくなり、また、オペレータが
指定したイメージ・データを用い、オペレータが該イメ
ージ・データから読み取った認識結果を判定基準として
適合する辞書の判定を行なうので、異常な誤認識が無く
なり、認識率の低下も防止できる。
また、第2図の構成の文字認識装置においては、適合辞
書決定手段7により、前記辞書選択手段8において前記
複数の活字辞書91.9□、・・・97を順次選択させ
ることにより、前記文字認識手段4からの、該複数の活
字辞書91.9□、・・・91の各々との比較による文
字認識結果を得、該各々との比較による文字認識結果を
前記オペレータによる認識結果と比較することにより、
入力したイメージ・データに含まれる文字の認識に適合
する活字辞書を決定する。
書決定手段7により、前記辞書選択手段8において前記
複数の活字辞書91.9□、・・・97を順次選択させ
ることにより、前記文字認識手段4からの、該複数の活
字辞書91.9□、・・・91の各々との比較による文
字認識結果を得、該各々との比較による文字認識結果を
前記オペレータによる認識結果と比較することにより、
入力したイメージ・データに含まれる文字の認識に適合
する活字辞書を決定する。
該適合する活字辞書の決定の後は、辞書選択手段8は、
該適合する活字辞書を選択し、その後、文字認識手段4
における、入力されたイメージ・データに含まれる文字
の認識は、該適合する活字辞書のみを用いて行なわれる
。
該適合する活字辞書を選択し、その後、文字認識手段4
における、入力されたイメージ・データに含まれる文字
の認識は、該適合する活字辞書のみを用いて行なわれる
。
第3図は、本発明の実施例の文字認識装置の構成の概略
を示すものである。
を示すものである。
第3図において、10はイメージ・スキャナ、400は
端末装置、そして、300が本発明の実施例の文字認識
装置である。該文字認識装置300において、11はイ
メージ・メモリ、100はマイクロコンピュータ、20
0はインターフェイス回路、80は辞書セレクタ、91
゜92、および93は、それぞれ活字辞書であり、該マ
イクロコンピュータ100は、前記第2図の構成にも示
された文字切り出し手段2、および文字認識手段4、前
記第2図の構成の特徴抽出手段3に対応する輪郭抽出手
段31および特徴抽出手段32、そして、第2図の構成
の適合辞書決定手段7に対応する部分イメージ認識率判
定手段70を実現する。
端末装置、そして、300が本発明の実施例の文字認識
装置である。該文字認識装置300において、11はイ
メージ・メモリ、100はマイクロコンピュータ、20
0はインターフェイス回路、80は辞書セレクタ、91
゜92、および93は、それぞれ活字辞書であり、該マ
イクロコンピュータ100は、前記第2図の構成にも示
された文字切り出し手段2、および文字認識手段4、前
記第2図の構成の特徴抽出手段3に対応する輪郭抽出手
段31および特徴抽出手段32、そして、第2図の構成
の適合辞書決定手段7に対応する部分イメージ認識率判
定手段70を実現する。
イメージ・スキャナ10は、文字画像を表示する原稿等
から光学的に画像(イメージ)データを読み取る。イメ
ージ・メモリ11は、該イメージ・データを一旦保持す
る。文字切り出し手段2は、該イメージ・メモリ11に
一旦保持したイメージ・データから文字が存在する部分
を切り出す。輪郭抽出手段31は、該文字が存在する部
分から文字の輪郭を抽出する。さらに、特徴抽出手段3
2は、該輪郭をベクトル化する等して該輪郭の特徴デー
タを抽出する。
から光学的に画像(イメージ)データを読み取る。イメ
ージ・メモリ11は、該イメージ・データを一旦保持す
る。文字切り出し手段2は、該イメージ・メモリ11に
一旦保持したイメージ・データから文字が存在する部分
を切り出す。輪郭抽出手段31は、該文字が存在する部
分から文字の輪郭を抽出する。さらに、特徴抽出手段3
2は、該輪郭をベクトル化する等して該輪郭の特徴デー
タを抽出する。
複数の活字辞書91,92.および93は、それぞれ異
なる書体の文字フォント(活字の特徴データ)を記憶す
る。辞書セレクタ80は、該複数の活字辞書91,92
.および93のうち1つを選択する。文字認識手段4は
、前記特徴抽出手段32にて抽出した特徴データを、該
辞書セレクタ80にて選択された活字辞書に記憶される
活字の特徴データ(文字フォント)と順次比較すること
により、イメージ・データに含まれる文字の認識を行な
う。
なる書体の文字フォント(活字の特徴データ)を記憶す
る。辞書セレクタ80は、該複数の活字辞書91,92
.および93のうち1つを選択する。文字認識手段4は
、前記特徴抽出手段32にて抽出した特徴データを、該
辞書セレクタ80にて選択された活字辞書に記憶される
活字の特徴データ(文字フォント)と順次比較すること
により、イメージ・データに含まれる文字の認識を行な
う。
第3図の構成においては、まず、イメージ・スキャナ1
0がイメージ・データを8売み取って、8亥イメージ・
データがイメージ・メモリ11に保持されると、端末装
置400からインターフェイス回路200を介しての制
御により、イメージ・メモリ11に保持されたイメージ
・データのうち所定の部分のみが、適合する辞書を決定
するための試験データとして指定されて、文字切り出し
手段2に送られる。この指定は、例えば、イメージ・メ
モリ11から端末装置400に送られたイメージ・デー
タを該端末装置400におけるデイスプレィ等によって
オペレータが確認しつつ、カーソル等によって行なうこ
とができる。
0がイメージ・データを8売み取って、8亥イメージ・
データがイメージ・メモリ11に保持されると、端末装
置400からインターフェイス回路200を介しての制
御により、イメージ・メモリ11に保持されたイメージ
・データのうち所定の部分のみが、適合する辞書を決定
するための試験データとして指定されて、文字切り出し
手段2に送られる。この指定は、例えば、イメージ・メ
モリ11から端末装置400に送られたイメージ・デー
タを該端末装置400におけるデイスプレィ等によって
オペレータが確認しつつ、カーソル等によって行なうこ
とができる。
上記の指定されたイメージ・データからは、文字切り出
し手段2、輪郭抽出手段31、特徴抽出手段32を経る
ことにより、文字の特徴データが抽出される。
し手段2、輪郭抽出手段31、特徴抽出手段32を経る
ことにより、文字の特徴データが抽出される。
ここで、部分イメージ認識率判定手段70は辞書セレク
タ80を制御して、活字辞書91,92゜および93を
順次選択させる。
タ80を制御して、活字辞書91,92゜および93を
順次選択させる。
文字認識手段4は、前記の指定されたイメージ・データ
から抽出された文字の特徴データを、上記辞書セレクタ
80にて順次選択された活字辞書91.92.および9
3の活字の特徴データと順次比較対照することにより、
該活字辞書91゜92、および93の各々との比較によ
る上記抽出された文字の特徴データに対する文字認識結
果を求める。
から抽出された文字の特徴データを、上記辞書セレクタ
80にて順次選択された活字辞書91.92.および9
3の活字の特徴データと順次比較対照することにより、
該活字辞書91゜92、および93の各々との比較によ
る上記抽出された文字の特徴データに対する文字認識結
果を求める。
部分イメージ認識率判定手段70は、上記文字認識手段
4にて求められた、活字辞書91,92゜および93の
各々との比較による文字認識結果を、端末装置400か
らインターフェイス回路200を介して入力された、前
記指定されたイメージ・データに含まれる文字の、オペ
レータによる読み(認識結果)と比較する。こうして、
最も良い認識率が得られた活字辞書を判定して、該活字
辞書を、前記入力したイメージ・データの文字認識に適
合する活字辞書として使用する。すなわち、この後、該
入力したイメージ・データの文字認識の間、前記辞書セ
レクタ80においては該適合する活字辞書が選択され、
文字認識手段4における文字認識に使用される。
4にて求められた、活字辞書91,92゜および93の
各々との比較による文字認識結果を、端末装置400か
らインターフェイス回路200を介して入力された、前
記指定されたイメージ・データに含まれる文字の、オペ
レータによる読み(認識結果)と比較する。こうして、
最も良い認識率が得られた活字辞書を判定して、該活字
辞書を、前記入力したイメージ・データの文字認識に適
合する活字辞書として使用する。すなわち、この後、該
入力したイメージ・データの文字認識の間、前記辞書セ
レクタ80においては該適合する活字辞書が選択され、
文字認識手段4における文字認識に使用される。
第4図は、第3図の本発明の実施例の文字認識装置の機
能の具体例を示すものである。
能の具体例を示すものである。
第4図において、原稿500には、「信号はきいろ」と
記されている。イメージ・メモリ11には、この「信号
はきいろ」というイメージがイメージ・データとして保
持され、さらに、このイメージ・データは端末装置40
0に送られ、該端末装置400のデイスプレィ上に表示
される。
記されている。イメージ・メモリ11には、この「信号
はきいろ」というイメージがイメージ・データとして保
持され、さらに、このイメージ・データは端末装置40
0に送られ、該端末装置400のデイスプレィ上に表示
される。
オペレータはが端末装置400において、該デイスプレ
ィ上の「信号はきいろ」という表示を見て、カーソルに
より、「きいろ」という部分を、適合する活字辞書の決
定のための試験用イメージ・データとして指示する。オ
ペレータは、また、端末装置400のキーボード装置等
により、該試験用イメージ・データとして指示した部分
イメージ・データの該オペレ7夕による読み(認識結果
)「きいろ」を入力する。
ィ上の「信号はきいろ」という表示を見て、カーソルに
より、「きいろ」という部分を、適合する活字辞書の決
定のための試験用イメージ・データとして指示する。オ
ペレータは、また、端末装置400のキーボード装置等
により、該試験用イメージ・データとして指示した部分
イメージ・データの該オペレ7夕による読み(認識結果
)「きいろ」を入力する。
前記カーソル指示による「きいろ」という部分の指定は
、第3図のインターフェイス回路200を介して、イメ
ージ・メモリ11からの読出し制御信号として該イメー
ジ・メモリ11の図示しない制御回路に送出され、これ
に応じて、該イメージ・メモリ11からは、前記カーソ
ル指示による「きいろ」という部分のイメージ・データ
のみが読み出され、前述のように、文字切り出し手段2
、輪郭抽出手段31、特徴抽出手段32を経て、特徴ベ
クトル化される。
、第3図のインターフェイス回路200を介して、イメ
ージ・メモリ11からの読出し制御信号として該イメー
ジ・メモリ11の図示しない制御回路に送出され、これ
に応じて、該イメージ・メモリ11からは、前記カーソ
ル指示による「きいろ」という部分のイメージ・データ
のみが読み出され、前述のように、文字切り出し手段2
、輪郭抽出手段31、特徴抽出手段32を経て、特徴ベ
クトル化される。
そして、上記特徴ベクトル化された文字のデータは、文
字認識手段4に入力され、活字辞書91゜92、および
93に記憶された活字の特徴データと順次比較され、そ
れぞれの活字辞書を用いた認識結果、〔きいろ〕、〔き
にち〕、および〔さいろ〕が、部分イメージ認識率判定
手段70に入力される。該部分イメージ認識率判定手段
70には、前記の部分イメージ・データの該オペレータ
による読み(認識結果)「きいろ」が入力されており、
上記それぞれの活字辞書を用いた認識結果、〔きいろ〕
、〔きにち〕、および〔さいろ〕は、このオペレータに
よる認識結果と比較され、その認識率が判定される。
字認識手段4に入力され、活字辞書91゜92、および
93に記憶された活字の特徴データと順次比較され、そ
れぞれの活字辞書を用いた認識結果、〔きいろ〕、〔き
にち〕、および〔さいろ〕が、部分イメージ認識率判定
手段70に入力される。該部分イメージ認識率判定手段
70には、前記の部分イメージ・データの該オペレータ
による読み(認識結果)「きいろ」が入力されており、
上記それぞれの活字辞書を用いた認識結果、〔きいろ〕
、〔きにち〕、および〔さいろ〕は、このオペレータに
よる認識結果と比較され、その認識率が判定される。
認識率の定義の仕方については、種々のものが考えられ
るが、ここの例では、3文字のうちいくつの文字が正し
く認識されたかによって認識率を定義している。こうし
て、活字辞書A 91による認識率は100%、活字
辞書B 92による認識率は33%、活字辞書C93
による認識率は66%となり、活字辞書A 91が、
前記イメージ・メモリ11に保持されるイメージ・デー
タの文字認識に使用するに適した活字辞書と決定される
。
るが、ここの例では、3文字のうちいくつの文字が正し
く認識されたかによって認識率を定義している。こうし
て、活字辞書A 91による認識率は100%、活字
辞書B 92による認識率は33%、活字辞書C93
による認識率は66%となり、活字辞書A 91が、
前記イメージ・メモリ11に保持されるイメージ・デー
タの文字認識に使用するに適した活字辞書と決定される
。
本発明の、文字認識における適合辞書決定方法、あるい
は、該方法を実施する文字認識装置によれば、認識率お
よび認識速度が低下することがないようにすることがで
きる。
は、該方法を実施する文字認識装置によれば、認識率お
よび認識速度が低下することがないようにすることがで
きる。
第1図は、本発明の、文字認識における適合辞書決定方
法の基本構成図、 第2図は、第1図の方法を実施する文字認識装置の基本
構成図、 第3図は、本発明の実施例の文字認識装置の概略構成図
、 第4図は、本発明の実施例の文字認識装置の機能の具体
例の説明図、 第5図は、単一種類の活字辞書を有する文字認識装置の
概略構成図、そして 第6図は、従来の複数の活字辞書を有する文字認識装置
の機能説明図である。 〔符号の説明〕 1・・・イメージ・データ入力手段、2・・・文字切り
出し手段、3・・・特徴抽出手段、4・・・文字認識手
段、5・・・部分イメージ指定手段、6・・・部分イメ
ージ・オペレータ認識入力手段、7・・・適合辞書決定
手段、8・・・辞書選択手段、9.9.、9.、〜9n
、91゜92.93・・・活字辞書、10・・・イメー
ジ・スキャナ、11・・・イメージ・メモリ、31・・
・輪郭抽出手段、32・・・特徴抽出手段、70・・・
部分イメージ認識率判定手段、80・・・辞書セレクタ
、100・・・マイクロコンピュータ、200・・・イ
ンターフェイス回路、300・・・本発明の実施例の文
字認識装置、301・・・従来のマルチテンプレート方
式による文字認識装置、400・・・端末装置、500
・・・原稿。
法の基本構成図、 第2図は、第1図の方法を実施する文字認識装置の基本
構成図、 第3図は、本発明の実施例の文字認識装置の概略構成図
、 第4図は、本発明の実施例の文字認識装置の機能の具体
例の説明図、 第5図は、単一種類の活字辞書を有する文字認識装置の
概略構成図、そして 第6図は、従来の複数の活字辞書を有する文字認識装置
の機能説明図である。 〔符号の説明〕 1・・・イメージ・データ入力手段、2・・・文字切り
出し手段、3・・・特徴抽出手段、4・・・文字認識手
段、5・・・部分イメージ指定手段、6・・・部分イメ
ージ・オペレータ認識入力手段、7・・・適合辞書決定
手段、8・・・辞書選択手段、9.9.、9.、〜9n
、91゜92.93・・・活字辞書、10・・・イメー
ジ・スキャナ、11・・・イメージ・メモリ、31・・
・輪郭抽出手段、32・・・特徴抽出手段、70・・・
部分イメージ認識率判定手段、80・・・辞書セレクタ
、100・・・マイクロコンピュータ、200・・・イ
ンターフェイス回路、300・・・本発明の実施例の文
字認識装置、301・・・従来のマルチテンプレート方
式による文字認識装置、400・・・端末装置、500
・・・原稿。
Claims (1)
- 【特許請求の範囲】 1、複数種類の活字の書体について文字の特徴データを
記憶する活字辞書(9_1,9_2,…9_n)を有し
、入力したイメージ・データから文字が存在する領域の
イメージ・データを切り出し、該文字が存在する領域の
イメージ・データから抽出した文字の特徴データと前記
活字辞書に記憶した活字の特徴データとを比較すること
により該入力したイメージ・データ中の文字を認識する
文字認識における適合辞書決定方法であって、 前記入力したイメージ・データのうち、外部より指定し
た部分領域のイメージ・データから文字が存在する領域
のイメージ・データを切り出し、該文字が存在する領域
のイメージから抽出した文字の特徴データを前記複数種
類の書体の活字辞書(9_1,9_2,…9_n)の各
々に記憶した活字の特徴データと順次比較して該複数種
類の書体の活字辞書(9_1,9_2,…9_n)の各
々による文字認識結果を求め、該各々による文字認識結
果を、前記指定した部分領域の文字の、オペレータによ
る認識結果と比較することにより、入力したイメージ・
データの文字の書体に適合する活字辞書を決定すること
を特徴とする文字認識における適合辞書決定方法。 2、イメージ・データを入力するイメージ・データ入力
手段(1)と、 前記入力したイメージ・データのうち所定の部分領域の
イメージ・データを外部より指定する部分イメージ指定
手段(5)と、 前記入力したイメージ・データ、あるいは、前記所定の
部分領域のイメージ・データから、文字が存在する領域
のイメージ・データを切り出す文字切り出し手段(2)
と、 該文字が存在する領域のイメージ・データから文字の特
徴データを抽出する特徴抽出手段(3)と、 複数種類の活字の書体について文字の特徴データを記憶
する複数の活字辞書(9_1,9_2,…9_n)と、 前記複数の活字辞書(9_1,9_2,…9_n)のう
ち1つを選択する辞書選択手段(8)と、 前記特徴抽出手段(3)にて抽出された文字の特徴デー
タを、前記辞書選択手段(8)にて選択された活字辞書
(9_1,9_2,…9_n)に記憶された文字の特徴
データと比較することにより、該抽出された文字を認識
する文字認識手段(4)と、前記指定した所定の部分領
域のイメージ・データに含まれる文字の、オペレータに
よる認識結果を入力する部分イメージ・オペレータ認識
入力手段(6)と、 前記辞書選択手段(8)において前記複数の活字辞書(
9_1,9_2,…9_n)を順次選択させ、前記文字
認識手段(4)からの、該複数の活字辞書(9_1,9
_2,…9_n)の各々との比較による文字認識結果を
得、該各々との比較による文字認識結果を前記オペレー
タによる認識結果と比較することにより、入力したイメ
ージ・データに含まれる文字の認識に適合する活字辞書
を決定する適合辞書決定手段(7)とを有してなること
を特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63168669A JPH0219986A (ja) | 1988-07-08 | 1988-07-08 | 文字認識における適合辞書決定方法および該方法を実施する文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63168669A JPH0219986A (ja) | 1988-07-08 | 1988-07-08 | 文字認識における適合辞書決定方法および該方法を実施する文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0219986A true JPH0219986A (ja) | 1990-01-23 |
Family
ID=15872299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63168669A Pending JPH0219986A (ja) | 1988-07-08 | 1988-07-08 | 文字認識における適合辞書決定方法および該方法を実施する文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0219986A (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57187780A (en) * | 1981-05-13 | 1982-11-18 | Toshiba Corp | Multifont character reader |
JPS6198487A (ja) * | 1984-10-19 | 1986-05-16 | Ricoh Co Ltd | 辞書選択方式 |
JPS62271089A (ja) * | 1986-05-20 | 1987-11-25 | Ricoh Co Ltd | 文字情報入力装置 |
JPS62288989A (ja) * | 1986-06-09 | 1987-12-15 | Toshiba Corp | 文字認識方式 |
JPS63147287A (ja) * | 1986-12-11 | 1988-06-20 | Nec Corp | 光学的文字認識装置 |
-
1988
- 1988-07-08 JP JP63168669A patent/JPH0219986A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57187780A (en) * | 1981-05-13 | 1982-11-18 | Toshiba Corp | Multifont character reader |
JPS6198487A (ja) * | 1984-10-19 | 1986-05-16 | Ricoh Co Ltd | 辞書選択方式 |
JPS62271089A (ja) * | 1986-05-20 | 1987-11-25 | Ricoh Co Ltd | 文字情報入力装置 |
JPS62288989A (ja) * | 1986-06-09 | 1987-12-15 | Toshiba Corp | 文字認識方式 |
JPS63147287A (ja) * | 1986-12-11 | 1988-06-20 | Nec Corp | 光学的文字認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3155577B2 (ja) | 文字認識方法及び装置 | |
US4850026A (en) | Chinese multifont recognition system based on accumulable stroke features | |
EP0542566A2 (en) | Character recognition method and apparatus thereof | |
US4747053A (en) | Electronic dictionary | |
JP3792755B2 (ja) | 文字認識方法及び装置 | |
US4827530A (en) | Method and apparatus for Korean character recognition from Korean alphabet row | |
US5481277A (en) | Character generator | |
JPH0219986A (ja) | 文字認識における適合辞書決定方法および該方法を実施する文字認識装置 | |
US5473743A (en) | Character generator with selectable conversion | |
JPS60142792A (ja) | 多種文字認識装置 | |
US5787202A (en) | Character recognition apparatus | |
JPH10177623A (ja) | 文書認識装置および言語処理装置 | |
JPH0991371A (ja) | 文字表示装置 | |
US5224041A (en) | Electronic dictionary for outputting words in the opposite order in which they are searched | |
JP2886690B2 (ja) | 光学的文字読取装置における文字認識方法 | |
JPH01137383A (ja) | 文字認識装置 | |
JPS5972511A (ja) | 一般コ−ドによる特殊コ−ド入力装置 | |
JPS6227861A (ja) | 漢字入力装置 | |
JP3111521B2 (ja) | 認識文字修正方法 | |
JPH03150690A (ja) | 文字認識装置 | |
JPH0731672B2 (ja) | 文書作成装置 | |
JPS63147287A (ja) | 光学的文字認識装置 | |
JPH0475556B2 (ja) | ||
JP2824704B2 (ja) | 文字認識装置 | |
JPS61182186A (ja) | 文字認識装置 |