JPH04302073A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH04302073A JPH04302073A JP3066103A JP6610391A JPH04302073A JP H04302073 A JPH04302073 A JP H04302073A JP 3066103 A JP3066103 A JP 3066103A JP 6610391 A JP6610391 A JP 6610391A JP H04302073 A JPH04302073 A JP H04302073A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- dictionary
- characters
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 5
- 230000002452 interceptive effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、図面や文章に書かれて
いる文学を認識する文字認識装置に関し、特に、認識結
果の編集時に文字を自動的に登録する文字認識装置に関
する。
いる文学を認識する文字認識装置に関し、特に、認識結
果の編集時に文字を自動的に登録する文字認識装置に関
する。
【0002】
【従来の技術】文字認識装置は、図面や文書等に記載さ
れている字形をイメージスキャナ等で画像入力し、これ
を標準辞書やユーザ辞書と照合して、文字として認識す
るものである。
れている字形をイメージスキャナ等で画像入力し、これ
を標準辞書やユーザ辞書と照合して、文字として認識す
るものである。
【0003】図3は、従来の文字認識装置の一例(特願
平1−302873号)を示す構成図である。図におい
て、31はイメージスキャナ等の画像入力部、32はそ
の画像入力部31で得た2値画像を輪郭ベクトルに変換
するベクトル化処理部、33はその輪郭ベクトルを文字
の部分とその他の部分とに分け、文字候補ベクトルを抽
出する要素分離部、34は文字候補となって輪郭ベクト
ルを文字列としてグループ化する文字列化処理部、35
はその文字列の情報(文字列の高さ、文字列の方向、文
字列内における文字候補間の距離等)に基づいて文字列
から1文字分の文字候補データを切出す1文字分切出し
部、36は切出された1文字分の輪郭ベクトルを予め用
意しておいた辞書の字体とマッチングを行い、その結果
近似している文字の文字コードを出力する文字認識処理
部、37はその認識結果を編集し、後記する形で保管す
る認識結果編集部である。
平1−302873号)を示す構成図である。図におい
て、31はイメージスキャナ等の画像入力部、32はそ
の画像入力部31で得た2値画像を輪郭ベクトルに変換
するベクトル化処理部、33はその輪郭ベクトルを文字
の部分とその他の部分とに分け、文字候補ベクトルを抽
出する要素分離部、34は文字候補となって輪郭ベクト
ルを文字列としてグループ化する文字列化処理部、35
はその文字列の情報(文字列の高さ、文字列の方向、文
字列内における文字候補間の距離等)に基づいて文字列
から1文字分の文字候補データを切出す1文字分切出し
部、36は切出された1文字分の輪郭ベクトルを予め用
意しておいた辞書の字体とマッチングを行い、その結果
近似している文字の文字コードを出力する文字認識処理
部、37はその認識結果を編集し、後記する形で保管す
る認識結果編集部である。
【0004】辞書は2種類あって、図4に示す如く、文
字認識処理部41は標準辞書42及びユーザ辞書43の
双方とマッチングを行う。標準辞書42は推奨字体の文
字が格納されていて、ユーザが新規な字体の文字を登録
したい場合は、装置の説明で前記した処理とは別個の処
理で、予めユーザ辞書43に文字登録処理を行っておか
なければならない。
字認識処理部41は標準辞書42及びユーザ辞書43の
双方とマッチングを行う。標準辞書42は推奨字体の文
字が格納されていて、ユーザが新規な字体の文字を登録
したい場合は、装置の説明で前記した処理とは別個の処
理で、予めユーザ辞書43に文字登録処理を行っておか
なければならない。
【0005】図5は、前記認識結果編集部37に格納さ
れるマッチング結果の模式図で、認識結果の文字コード
が認識距離の近いものから順に10個並べられる。
れるマッチング結果の模式図で、認識結果の文字コード
が認識距離の近いものから順に10個並べられる。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の文字認識装置には、下記の課題が存在する。
来の文字認識装置には、下記の課題が存在する。
【0007】(1)ユーザの登録字体が増えるとマッチ
ング量が増加し、認識速度が遅くなる。
ング量が増加し、認識速度が遅くなる。
【0008】(2)認識処理の流れと別個に文字登録を
行わなければならない。
行わなければならない。
【0009】(3)文字の登録を行わないと、同様な字
体で書かれている文字に対して、同様な認識ミスを繰返
す可能性が大である。
体で書かれている文字に対して、同様な認識ミスを繰返
す可能性が大である。
【0010】(4)文字を登録することによって、登録
した文字に対する認識率は向上するが、別の文字に対す
る認識率は低下する恐れがある。例えば、「1」という
文字を斜めに傾いた「1」と登録すれば、それを「1」
と認識させることができると同時に本来はスラッシュと
認識すべき「/」も「1」と認識することになる。
した文字に対する認識率は向上するが、別の文字に対す
る認識率は低下する恐れがある。例えば、「1」という
文字を斜めに傾いた「1」と登録すれば、それを「1」
と認識させることができると同時に本来はスラッシュと
認識すべき「/」も「1」と認識することになる。
【0011】本発明は、このような課題に鑑みて創案さ
れたもので、文字登録を別途に行うのでなく、文字が自
動的に登録され、登録忘れによる同一字形文字の認識ミ
スを防ぎ、認識速度を向上させる文字認識装置を提供す
ることを目的としている。
れたもので、文字登録を別途に行うのでなく、文字が自
動的に登録され、登録忘れによる同一字形文字の認識ミ
スを防ぎ、認識速度を向上させる文字認識装置を提供す
ることを目的としている。
【0012】
【課題を解決するための手段】本発明における上記課題
を解決するための手段は、画像入力部で得た2値画像を
輪郭ベクトルに変換し、文字部分と他の部分とに分け、
文字候補となった輪郭ベクトルを文字列としてグループ
化し、その文字列の情報に基づいて文字列から1文字分
を切出し、これを文字認識処理部が標準辞書及びユーザ
登録辞書の字体とマッチングを行い、その結果近似して
いる文字の文字コードを出力する文字認識装置において
、1文字分の文字輪郭データを標準辞書の字体とマッチ
ングを行う第1段の文字認識処理部と、その認識結果が
所定の基準を満たさない場合に前段の認識結果を標準辞
書及びユーザ登録辞書の双方とマッチングを行う第2段
の文字認識処理部と、認識させようとする文字の字体が
標準辞書及びユーザ辞書の字体と異なる場合に対話修正
を行う認識結果編集処理部と、このとき対話修正を受け
た文字をユーザ登録辞書に登録する文字登録部とを備え
た文字認識装置とするものである。
を解決するための手段は、画像入力部で得た2値画像を
輪郭ベクトルに変換し、文字部分と他の部分とに分け、
文字候補となった輪郭ベクトルを文字列としてグループ
化し、その文字列の情報に基づいて文字列から1文字分
を切出し、これを文字認識処理部が標準辞書及びユーザ
登録辞書の字体とマッチングを行い、その結果近似して
いる文字の文字コードを出力する文字認識装置において
、1文字分の文字輪郭データを標準辞書の字体とマッチ
ングを行う第1段の文字認識処理部と、その認識結果が
所定の基準を満たさない場合に前段の認識結果を標準辞
書及びユーザ登録辞書の双方とマッチングを行う第2段
の文字認識処理部と、認識させようとする文字の字体が
標準辞書及びユーザ辞書の字体と異なる場合に対話修正
を行う認識結果編集処理部と、このとき対話修正を受け
た文字をユーザ登録辞書に登録する文字登録部とを備え
た文字認識装置とするものである。
【0013】
【作用】本発明は、文字認識処理部を2段にすることに
より認識処理を高速化すると共に、認識結果編集処理部
及び文字登録部により対話修正を行った文字の自動登録
を行うものである。
より認識処理を高速化すると共に、認識結果編集処理部
及び文字登録部により対話修正を行った文字の自動登録
を行うものである。
【0014】上記の第1段の文字認識処理部は1文字分
の文字輪郭データを標準辞書の字体とマッチングを行い
、その認識結果が所定の基準を満たす場合はその認識結
果の例えば上位10個を出力する。認識結果が所定の基
準を満たさない場合に第2段の文字認識処理部が前段の
認識結果を標準辞書及びユーザ登録辞書の双方とマッチ
ングを行い、その認識結果を出力する。認識結果が第1
段の文字認識処理部で標準辞書とのマッチングのみで得
られた場合は処理時間がそれだけ短くて済む。
の文字輪郭データを標準辞書の字体とマッチングを行い
、その認識結果が所定の基準を満たす場合はその認識結
果の例えば上位10個を出力する。認識結果が所定の基
準を満たさない場合に第2段の文字認識処理部が前段の
認識結果を標準辞書及びユーザ登録辞書の双方とマッチ
ングを行い、その認識結果を出力する。認識結果が第1
段の文字認識処理部で標準辞書とのマッチングのみで得
られた場合は処理時間がそれだけ短くて済む。
【0015】認識させようとする文字の字体が標準辞書
及びユーザ辞書の字体と異なる場合には、認識結果編集
処理部で対話修正を行うが、その際、その対話修正によ
り、文字登録部は当該文字をユーザ登録辞書に登録する
。
及びユーザ辞書の字体と異なる場合には、認識結果編集
処理部で対話修正を行うが、その際、その対話修正によ
り、文字登録部は当該文字をユーザ登録辞書に登録する
。
【0016】
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。図1は、本発明の一実施例の構成図であ
る、同図において、1はイメージスキャナ等の画像入力
部、2は入力された2値画像を輪郭ベクトルに変換する
ベクトル化処理部、3はその輪郭ベクトルを文字の部分
とその他の部分とに分離し、文字候補ベクトルを抽出す
る要素分離部、4は文字候補ベクトルを文字列としてグ
ループ化する文字列化処理部、5は文字列の情報に基づ
いて文字列から1文字分の文字候補データを切出す1文
字分切出し部で、これらの機能と動作は従来例で示した
各部と全く同様である。しかし、1文字分の輪郭ベクト
ルを辞書の字体とマッチングを行う文字認識処理部は、
本実施例では2段階になっている。第1の文字認識処理
部6は、推奨字体の標準辞書8のみにマッチングを試み
、図2に示す20個の文字候補21を得る。その結果、
標準辞書の字体と異なる字形を認識した場合、正解が候
補中の1位にならないことも考えられ、その場合、第2
の文字認識処理部7は標準辞書8及びユーザ辞書9の双
方にマッチングを試み、図2に示すユーザ登録字体の文
字候補22に対しても前段で得た20個の文字候補21
を参照し、その認識結果の上位10個の文字候補23を
図1に示す認識結果10として、認識結果編集処理部1
1へ出力する。認識させようとする文字の字形が標準辞
書8及びユーザ辞書9の字形と異なる場合は正しく認識
されず、誤った結果を出力することもあり、その際は認
識結果編集処理部11が対話修正を行う。このとき対話
修正指令を受けた文字に対しては文字登録部12が自動
的にユーザ辞書9への登録を行う。
細に説明する。図1は、本発明の一実施例の構成図であ
る、同図において、1はイメージスキャナ等の画像入力
部、2は入力された2値画像を輪郭ベクトルに変換する
ベクトル化処理部、3はその輪郭ベクトルを文字の部分
とその他の部分とに分離し、文字候補ベクトルを抽出す
る要素分離部、4は文字候補ベクトルを文字列としてグ
ループ化する文字列化処理部、5は文字列の情報に基づ
いて文字列から1文字分の文字候補データを切出す1文
字分切出し部で、これらの機能と動作は従来例で示した
各部と全く同様である。しかし、1文字分の輪郭ベクト
ルを辞書の字体とマッチングを行う文字認識処理部は、
本実施例では2段階になっている。第1の文字認識処理
部6は、推奨字体の標準辞書8のみにマッチングを試み
、図2に示す20個の文字候補21を得る。その結果、
標準辞書の字体と異なる字形を認識した場合、正解が候
補中の1位にならないことも考えられ、その場合、第2
の文字認識処理部7は標準辞書8及びユーザ辞書9の双
方にマッチングを試み、図2に示すユーザ登録字体の文
字候補22に対しても前段で得た20個の文字候補21
を参照し、その認識結果の上位10個の文字候補23を
図1に示す認識結果10として、認識結果編集処理部1
1へ出力する。認識させようとする文字の字形が標準辞
書8及びユーザ辞書9の字形と異なる場合は正しく認識
されず、誤った結果を出力することもあり、その際は認
識結果編集処理部11が対話修正を行う。このとき対話
修正指令を受けた文字に対しては文字登録部12が自動
的にユーザ辞書9への登録を行う。
【0017】本実施例は下記の効果が明らかである。
【0018】(1)文字認識の結果を編集する作業中に
文字を自動的に登録するので、文字登録を別途に行う必
要がない。
文字を自動的に登録するので、文字登録を別途に行う必
要がない。
【0019】(2)文字登録を自動的に行うので文字登
録を忘れることがなく、同一字形の文字に対して認識ミ
スを繰返すことはない。
録を忘れることがなく、同一字形の文字に対して認識ミ
スを繰返すことはない。
【0020】(3)所望の登録文字が1位に呈示される
可能性が増し、ユーザ辞書の一部分との照合を行うだけ
で、登録されている文字に対して正しい認識結果が得ら
れる。
可能性が増し、ユーザ辞書の一部分との照合を行うだけ
で、登録されている文字に対して正しい認識結果が得ら
れる。
【0021】(4)ユーザ辞書の要らない文字に対して
マッチングを行うことがないので、認識速度が向上する
。
マッチングを行うことがないので、認識速度が向上する
。
【0022】
【発明の効果】以上、説明したとおり、本発明によれば
、文字登録を別途に行う必要がなく、文字が自動的に登
録され、登録忘れによる同一字形文字の認識ミスが防止
され、認識速度も向上する文字認識装置を提供すること
ができる。
、文字登録を別途に行う必要がなく、文字が自動的に登
録され、登録忘れによる同一字形文字の認識ミスが防止
され、認識速度も向上する文字認識装置を提供すること
ができる。
【図1】本発明の一実施例の構成図、
【図2】本発明のマッチングの模式図、
【図3】従来例
の構成図、
の構成図、
【図4】従来例の部分拡大図、
【図5】従来例のマッチングの模式図である。
1,31…画像入力部、2,32…ベクトル化処理部、
3,33…要素分離部、4,34…文字列化処理部、5
,35…1文字切出し部、6,7,36,41…文字認
識処理部、8,42…標準辞書、9,43…ユーザ辞書
、10…認識結果、11…認識結果編集処理部、12…
文字登録部、37…認識結果編集部。
3,33…要素分離部、4,34…文字列化処理部、5
,35…1文字切出し部、6,7,36,41…文字認
識処理部、8,42…標準辞書、9,43…ユーザ辞書
、10…認識結果、11…認識結果編集処理部、12…
文字登録部、37…認識結果編集部。
Claims (2)
- 【請求項1】 画像入力部で得た2値画像を輪郭ベク
トルに変換し、文字部分と他の部分とに分け、文字候補
となった輪郭ベクトルを文字列としてグループ化し、そ
の文字列の情報に基づいて文字列から1文字分を切出し
、これを文字認識処理部が標準辞書及びユーザ登録辞書
の字体とマッチングを行い、その結果近似している文字
の文字コードを出力する文字認識装置において、1文字
分の文字輪郭データを標準辞書の字体とマッチングを行
う第1段の文字認識処理部と、その認識結果が所定の基
準を満たさない場合に前段の認識結果を標準辞書及びユ
ーザ登録辞書の双方とマッチングを行う第2段の文字認
識処理部とを備えることを特徴とする文字認識装置。 - 【請求項2】 請求項1に記載の文字認識装置におい
て、認識させようとする文字の字体が標準辞書及びユー
ザ辞書の字体と異なる場合に対話修正を行う認識結果編
集処理部と、このとき対話修正を受けた文字をユーザ登
録辞書に登録する文字登録部とを備えることを特徴とす
る文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3066103A JPH04302073A (ja) | 1991-03-29 | 1991-03-29 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3066103A JPH04302073A (ja) | 1991-03-29 | 1991-03-29 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04302073A true JPH04302073A (ja) | 1992-10-26 |
Family
ID=13306218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3066103A Pending JPH04302073A (ja) | 1991-03-29 | 1991-03-29 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04302073A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6373982B1 (en) | 1998-05-07 | 2002-04-16 | International Business Machines Corporation | Process and equipment for recognition of a pattern on an item presented |
US7545992B2 (en) | 2004-07-07 | 2009-06-09 | Canon Kabushiki Kaisha | Image processing system and image processing method |
US7596271B2 (en) | 2004-07-07 | 2009-09-29 | Canon Kabushiki Kaisha | Image processing system and image processing method |
US7640269B2 (en) | 2004-07-07 | 2009-12-29 | Canon Kabushiki Kaisha | Image processing system and image processing method |
US7860266B2 (en) | 2004-07-07 | 2010-12-28 | Canon Kabushiki Kaisha | Image processing system and image processing method |
JP2021068378A (ja) * | 2019-10-28 | 2021-04-30 | Tis株式会社 | 帳票処理プログラム、帳票処理装置、帳票処理方法 |
-
1991
- 1991-03-29 JP JP3066103A patent/JPH04302073A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6373982B1 (en) | 1998-05-07 | 2002-04-16 | International Business Machines Corporation | Process and equipment for recognition of a pattern on an item presented |
US7545992B2 (en) | 2004-07-07 | 2009-06-09 | Canon Kabushiki Kaisha | Image processing system and image processing method |
US7596271B2 (en) | 2004-07-07 | 2009-09-29 | Canon Kabushiki Kaisha | Image processing system and image processing method |
US7640269B2 (en) | 2004-07-07 | 2009-12-29 | Canon Kabushiki Kaisha | Image processing system and image processing method |
US7860266B2 (en) | 2004-07-07 | 2010-12-28 | Canon Kabushiki Kaisha | Image processing system and image processing method |
JP2021068378A (ja) * | 2019-10-28 | 2021-04-30 | Tis株式会社 | 帳票処理プログラム、帳票処理装置、帳票処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6272242B1 (en) | Character recognition method and apparatus which groups similar character patterns | |
KR19980042782A (ko) | 문자 인식 장치 및 방법 | |
JP3155616B2 (ja) | 文字認識方法及び装置 | |
JPH04302073A (ja) | 文字認識装置 | |
JPH0991371A (ja) | 文字表示装置 | |
JPH09274645A (ja) | 文字認識方法および装置 | |
JP2639314B2 (ja) | 文字認識方式 | |
JP2922949B2 (ja) | 文字認識の後処理方法 | |
JP2827066B2 (ja) | 数字列混在文書の文字認識の後処理方法 | |
JPH01277989A (ja) | 文字列パターン読み取り装置 | |
JP2939945B2 (ja) | ローマ字住所認識装置 | |
JPS6336389A (ja) | 文字読取装置 | |
JP2660998B2 (ja) | 日本語処理装置 | |
JPH0614375B2 (ja) | 文字入力装置 | |
JP3022790B2 (ja) | 手書き文字入力装置 | |
JPH06119497A (ja) | 文字認識方法 | |
JPH08297720A (ja) | 一般文書読み取り装置 | |
JPH0546814A (ja) | 文字読み取り装置 | |
JP3123169B2 (ja) | 文字認識方法 | |
JP2549831B2 (ja) | 文字認識装置の入力パターン・文字列登録方法 | |
JP2972443B2 (ja) | 文字認識装置 | |
JPS61221978A (ja) | 多色図面読取装置 | |
JPH11134439A (ja) | 単語認識方法 | |
JPH06308994A (ja) | 日本語音声認識方法 | |
JPH09161009A (ja) | 文字認識方法 |