JPH04302073A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04302073A
JPH04302073A JP3066103A JP6610391A JPH04302073A JP H04302073 A JPH04302073 A JP H04302073A JP 3066103 A JP3066103 A JP 3066103A JP 6610391 A JP6610391 A JP 6610391A JP H04302073 A JPH04302073 A JP H04302073A
Authority
JP
Japan
Prior art keywords
character
recognition
dictionary
characters
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3066103A
Other languages
English (en)
Inventor
Tomoyuki Kurita
栗田 知幸
Masasato Takai
高井 正郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP3066103A priority Critical patent/JPH04302073A/ja
Publication of JPH04302073A publication Critical patent/JPH04302073A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、図面や文章に書かれて
いる文学を認識する文字認識装置に関し、特に、認識結
果の編集時に文字を自動的に登録する文字認識装置に関
する。
【0002】
【従来の技術】文字認識装置は、図面や文書等に記載さ
れている字形をイメージスキャナ等で画像入力し、これ
を標準辞書やユーザ辞書と照合して、文字として認識す
るものである。
【0003】図3は、従来の文字認識装置の一例(特願
平1−302873号)を示す構成図である。図におい
て、31はイメージスキャナ等の画像入力部、32はそ
の画像入力部31で得た2値画像を輪郭ベクトルに変換
するベクトル化処理部、33はその輪郭ベクトルを文字
の部分とその他の部分とに分け、文字候補ベクトルを抽
出する要素分離部、34は文字候補となって輪郭ベクト
ルを文字列としてグループ化する文字列化処理部、35
はその文字列の情報(文字列の高さ、文字列の方向、文
字列内における文字候補間の距離等)に基づいて文字列
から1文字分の文字候補データを切出す1文字分切出し
部、36は切出された1文字分の輪郭ベクトルを予め用
意しておいた辞書の字体とマッチングを行い、その結果
近似している文字の文字コードを出力する文字認識処理
部、37はその認識結果を編集し、後記する形で保管す
る認識結果編集部である。
【0004】辞書は2種類あって、図4に示す如く、文
字認識処理部41は標準辞書42及びユーザ辞書43の
双方とマッチングを行う。標準辞書42は推奨字体の文
字が格納されていて、ユーザが新規な字体の文字を登録
したい場合は、装置の説明で前記した処理とは別個の処
理で、予めユーザ辞書43に文字登録処理を行っておか
なければならない。
【0005】図5は、前記認識結果編集部37に格納さ
れるマッチング結果の模式図で、認識結果の文字コード
が認識距離の近いものから順に10個並べられる。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の文字認識装置には、下記の課題が存在する。
【0007】(1)ユーザの登録字体が増えるとマッチ
ング量が増加し、認識速度が遅くなる。
【0008】(2)認識処理の流れと別個に文字登録を
行わなければならない。
【0009】(3)文字の登録を行わないと、同様な字
体で書かれている文字に対して、同様な認識ミスを繰返
す可能性が大である。
【0010】(4)文字を登録することによって、登録
した文字に対する認識率は向上するが、別の文字に対す
る認識率は低下する恐れがある。例えば、「1」という
文字を斜めに傾いた「1」と登録すれば、それを「1」
と認識させることができると同時に本来はスラッシュと
認識すべき「/」も「1」と認識することになる。
【0011】本発明は、このような課題に鑑みて創案さ
れたもので、文字登録を別途に行うのでなく、文字が自
動的に登録され、登録忘れによる同一字形文字の認識ミ
スを防ぎ、認識速度を向上させる文字認識装置を提供す
ることを目的としている。
【0012】
【課題を解決するための手段】本発明における上記課題
を解決するための手段は、画像入力部で得た2値画像を
輪郭ベクトルに変換し、文字部分と他の部分とに分け、
文字候補となった輪郭ベクトルを文字列としてグループ
化し、その文字列の情報に基づいて文字列から1文字分
を切出し、これを文字認識処理部が標準辞書及びユーザ
登録辞書の字体とマッチングを行い、その結果近似して
いる文字の文字コードを出力する文字認識装置において
、1文字分の文字輪郭データを標準辞書の字体とマッチ
ングを行う第1段の文字認識処理部と、その認識結果が
所定の基準を満たさない場合に前段の認識結果を標準辞
書及びユーザ登録辞書の双方とマッチングを行う第2段
の文字認識処理部と、認識させようとする文字の字体が
標準辞書及びユーザ辞書の字体と異なる場合に対話修正
を行う認識結果編集処理部と、このとき対話修正を受け
た文字をユーザ登録辞書に登録する文字登録部とを備え
た文字認識装置とするものである。
【0013】
【作用】本発明は、文字認識処理部を2段にすることに
より認識処理を高速化すると共に、認識結果編集処理部
及び文字登録部により対話修正を行った文字の自動登録
を行うものである。
【0014】上記の第1段の文字認識処理部は1文字分
の文字輪郭データを標準辞書の字体とマッチングを行い
、その認識結果が所定の基準を満たす場合はその認識結
果の例えば上位10個を出力する。認識結果が所定の基
準を満たさない場合に第2段の文字認識処理部が前段の
認識結果を標準辞書及びユーザ登録辞書の双方とマッチ
ングを行い、その認識結果を出力する。認識結果が第1
段の文字認識処理部で標準辞書とのマッチングのみで得
られた場合は処理時間がそれだけ短くて済む。
【0015】認識させようとする文字の字体が標準辞書
及びユーザ辞書の字体と異なる場合には、認識結果編集
処理部で対話修正を行うが、その際、その対話修正によ
り、文字登録部は当該文字をユーザ登録辞書に登録する
【0016】
【実施例】以下、図面を参照して、本発明の実施例を詳
細に説明する。図1は、本発明の一実施例の構成図であ
る、同図において、1はイメージスキャナ等の画像入力
部、2は入力された2値画像を輪郭ベクトルに変換する
ベクトル化処理部、3はその輪郭ベクトルを文字の部分
とその他の部分とに分離し、文字候補ベクトルを抽出す
る要素分離部、4は文字候補ベクトルを文字列としてグ
ループ化する文字列化処理部、5は文字列の情報に基づ
いて文字列から1文字分の文字候補データを切出す1文
字分切出し部で、これらの機能と動作は従来例で示した
各部と全く同様である。しかし、1文字分の輪郭ベクト
ルを辞書の字体とマッチングを行う文字認識処理部は、
本実施例では2段階になっている。第1の文字認識処理
部6は、推奨字体の標準辞書8のみにマッチングを試み
、図2に示す20個の文字候補21を得る。その結果、
標準辞書の字体と異なる字形を認識した場合、正解が候
補中の1位にならないことも考えられ、その場合、第2
の文字認識処理部7は標準辞書8及びユーザ辞書9の双
方にマッチングを試み、図2に示すユーザ登録字体の文
字候補22に対しても前段で得た20個の文字候補21
を参照し、その認識結果の上位10個の文字候補23を
図1に示す認識結果10として、認識結果編集処理部1
1へ出力する。認識させようとする文字の字形が標準辞
書8及びユーザ辞書9の字形と異なる場合は正しく認識
されず、誤った結果を出力することもあり、その際は認
識結果編集処理部11が対話修正を行う。このとき対話
修正指令を受けた文字に対しては文字登録部12が自動
的にユーザ辞書9への登録を行う。
【0017】本実施例は下記の効果が明らかである。
【0018】(1)文字認識の結果を編集する作業中に
文字を自動的に登録するので、文字登録を別途に行う必
要がない。
【0019】(2)文字登録を自動的に行うので文字登
録を忘れることがなく、同一字形の文字に対して認識ミ
スを繰返すことはない。
【0020】(3)所望の登録文字が1位に呈示される
可能性が増し、ユーザ辞書の一部分との照合を行うだけ
で、登録されている文字に対して正しい認識結果が得ら
れる。
【0021】(4)ユーザ辞書の要らない文字に対して
マッチングを行うことがないので、認識速度が向上する
【0022】
【発明の効果】以上、説明したとおり、本発明によれば
、文字登録を別途に行う必要がなく、文字が自動的に登
録され、登録忘れによる同一字形文字の認識ミスが防止
され、認識速度も向上する文字認識装置を提供すること
ができる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成図、
【図2】本発明のマッチングの模式図、
【図3】従来例
の構成図、
【図4】従来例の部分拡大図、
【図5】従来例のマッチングの模式図である。
【符号の説明】
1,31…画像入力部、2,32…ベクトル化処理部、
3,33…要素分離部、4,34…文字列化処理部、5
,35…1文字切出し部、6,7,36,41…文字認
識処理部、8,42…標準辞書、9,43…ユーザ辞書
、10…認識結果、11…認識結果編集処理部、12…
文字登録部、37…認識結果編集部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  画像入力部で得た2値画像を輪郭ベク
    トルに変換し、文字部分と他の部分とに分け、文字候補
    となった輪郭ベクトルを文字列としてグループ化し、そ
    の文字列の情報に基づいて文字列から1文字分を切出し
    、これを文字認識処理部が標準辞書及びユーザ登録辞書
    の字体とマッチングを行い、その結果近似している文字
    の文字コードを出力する文字認識装置において、1文字
    分の文字輪郭データを標準辞書の字体とマッチングを行
    う第1段の文字認識処理部と、その認識結果が所定の基
    準を満たさない場合に前段の認識結果を標準辞書及びユ
    ーザ登録辞書の双方とマッチングを行う第2段の文字認
    識処理部とを備えることを特徴とする文字認識装置。
  2. 【請求項2】  請求項1に記載の文字認識装置におい
    て、認識させようとする文字の字体が標準辞書及びユー
    ザ辞書の字体と異なる場合に対話修正を行う認識結果編
    集処理部と、このとき対話修正を受けた文字をユーザ登
    録辞書に登録する文字登録部とを備えることを特徴とす
    る文字認識装置。
JP3066103A 1991-03-29 1991-03-29 文字認識装置 Pending JPH04302073A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3066103A JPH04302073A (ja) 1991-03-29 1991-03-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3066103A JPH04302073A (ja) 1991-03-29 1991-03-29 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04302073A true JPH04302073A (ja) 1992-10-26

Family

ID=13306218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3066103A Pending JPH04302073A (ja) 1991-03-29 1991-03-29 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04302073A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6373982B1 (en) 1998-05-07 2002-04-16 International Business Machines Corporation Process and equipment for recognition of a pattern on an item presented
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7640269B2 (en) 2004-07-07 2009-12-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7860266B2 (en) 2004-07-07 2010-12-28 Canon Kabushiki Kaisha Image processing system and image processing method
JP2021068378A (ja) * 2019-10-28 2021-04-30 Tis株式会社 帳票処理プログラム、帳票処理装置、帳票処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6373982B1 (en) 1998-05-07 2002-04-16 International Business Machines Corporation Process and equipment for recognition of a pattern on an item presented
US7545992B2 (en) 2004-07-07 2009-06-09 Canon Kabushiki Kaisha Image processing system and image processing method
US7596271B2 (en) 2004-07-07 2009-09-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7640269B2 (en) 2004-07-07 2009-12-29 Canon Kabushiki Kaisha Image processing system and image processing method
US7860266B2 (en) 2004-07-07 2010-12-28 Canon Kabushiki Kaisha Image processing system and image processing method
JP2021068378A (ja) * 2019-10-28 2021-04-30 Tis株式会社 帳票処理プログラム、帳票処理装置、帳票処理方法

Similar Documents

Publication Publication Date Title
US6272242B1 (en) Character recognition method and apparatus which groups similar character patterns
KR19980042782A (ko) 문자 인식 장치 및 방법
JP3155616B2 (ja) 文字認識方法及び装置
JPH04302073A (ja) 文字認識装置
JPH0991371A (ja) 文字表示装置
JPH09274645A (ja) 文字認識方法および装置
JP2639314B2 (ja) 文字認識方式
JP2922949B2 (ja) 文字認識の後処理方法
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH01277989A (ja) 文字列パターン読み取り装置
JP2939945B2 (ja) ローマ字住所認識装置
JPS6336389A (ja) 文字読取装置
JP2660998B2 (ja) 日本語処理装置
JPH0614375B2 (ja) 文字入力装置
JP3022790B2 (ja) 手書き文字入力装置
JPH06119497A (ja) 文字認識方法
JPH08297720A (ja) 一般文書読み取り装置
JPH0546814A (ja) 文字読み取り装置
JP3123169B2 (ja) 文字認識方法
JP2549831B2 (ja) 文字認識装置の入力パターン・文字列登録方法
JP2972443B2 (ja) 文字認識装置
JPS61221978A (ja) 多色図面読取装置
JPH11134439A (ja) 単語認識方法
JPH06308994A (ja) 日本語音声認識方法
JPH09161009A (ja) 文字認識方法