JPH01291394A - 文字認識装置における文字コード出力方法 - Google Patents

文字認識装置における文字コード出力方法

Info

Publication number
JPH01291394A
JPH01291394A JP63121498A JP12149888A JPH01291394A JP H01291394 A JPH01291394 A JP H01291394A JP 63121498 A JP63121498 A JP 63121498A JP 12149888 A JP12149888 A JP 12149888A JP H01291394 A JPH01291394 A JP H01291394A
Authority
JP
Japan
Prior art keywords
character
dictionary
memory
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63121498A
Other languages
English (en)
Inventor
Hiromi Ishizaki
寛美 石崎
Michiyoshi Tachikawa
道義 立川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63121498A priority Critical patent/JPH01291394A/ja
Publication of JPH01291394A publication Critical patent/JPH01291394A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 技術分野 本発明は、文字認識装置における文字コード出力方法に
関する。
従来技術 一般に、この種の装置では、イメージセンサ等により読
取ってイメージメモリに記憶された画像情報を、CPU
によりスキャニングして1行ずつ切り出し、かつ文字毎
に切り出して認識対象なる文字の特徴量抽出を行ない、
その結果に基づき辞書メモリ中を検索し、該当する文字
コード(−漢字コード=JIS文字コード)を出力させ
るものである。
ここに、JIS文字コードを考えた場合、例えば平仮名
や片仮名或いは数字においては、同一形状の文字であっ
ても、通常の大きさの文字(以下、大文字と称する)の
他に、拗音や促音等の表現のための小さな文字(以下、
小文字と称する)を有するものがある。例えば、“つ″
(大文字)と′“いっしょ中の“っ“(小文字)等の場
合がある。パあ゛“′い゛“う゛等も同様であり、例え
ば′あ′” ″い″ “う”等の小文字を有する。そし
て、例えば、JIS文字コードによれば、゛あ“は24
221((Hは16進数を示す)なる文字コードで表さ
れ、“′あ”は2421 Hなる文字コードで表される
。これは、文字に限らず、記号でも同様である。例えば
、形は同じであるが、その位置が異なるものとして、“
・”(中点)や“、′(下点)がある。この場合も、J
IS文字コードによれば、“・パは2126Hで表され
、“、パは2125Hで表される。何れにしても、異な
る文字コードの割当てにより特定される。
ところが、文字、記号等のパターン認識に際しては、同
じ形の大文字と小文字、記号であれば」二位置(又は中
位層)記号と下位置記号等であっても、辞書メモリにJ
IS文字コードをすべて登録しておくものである。例え
ば、前述した大文字の°あ″と小文字の゛あ″とを別々
に辞書メモリに登録しておき、両者は別文字であるとし
てマツチング処理している。つまり、切り出された画像
から得られる特徴抽出量と距離をとり、距離の小さいほ
うと判定された大文字の文字コード又は小文字の文字コ
ードを認識結果として出力することになる。
しかし、1つの文字や記号から抽出される特徴量はかな
りの量になるものであり、同一の形、即ち文字形状の特
徴の同じ大文字と小文字とを別文字として扱い、すべて
の、J I S文字コードが登録された辞書メモリを用
いてマツチング処理を行なうことは、それたけ処理時間
を要し、かつ、認識率も低下することになる。
目的 本発明は、このような点に鑑みなされたもので、文字コ
ードの内、形が同じで、単にその大きさや位置の異なる
文字や記号については、逆に形が同じという特徴を利用
することにより辞書登録数を減少させ、認識速度の向上
ないしは認識率の向上を図ることができる文字認識装置
における文字コード出力方法を提供することを目的とす
る。
構成 本発明は、上記目的を達成するため、形が同じで大きさ
又は位置の異なる文字又は記号は一種類の態様で辞書に
登録しておき、この辞書を検索して認識対象の画像の形
状的特徴によりその文字又は記号を認識した後、切り出
された当該文字等の画像の高さ、幅、位置等の特徴情報
に基づき当該文字等が大文字か小文字か等の種別を判定
し、前記辞書から当該文字等の大文字又は小文字等の判
定結果に応じた種別の文字コードを出力させることを特
徴とする。
即ち、辞書中には同一形の文字等は複数は存在せず1種
類のみであり、最初のマツチング処理では形のみに着目
し大文字、小文字等の区別なく、画像の形に基づき文字
等が特定される。この後、画像の高さや幅等の情報に基
づき文字が大文字であるか小文字であるか1.記号であ
れば上位置記号であるか下位置記号であるか等が判断さ
れ、最終的に判断されたほうの文字コードが出力される
以下、本発明の一実施例を図面を参照して説明する。
まず、CPUIは画像データを記憶しているイメージメ
モリ2をスキャニングして認識対象とする1行を切り出
す。ついで、この1行につき、演算を行ない、文字に該
当するアドレスを特徴量メモリ3に記憶する。アドレス
情報は、内容的には、文字の高さと幅とトップ位置等の
情報である。また、文字画像から特徴量を抽出計算し、
この特徴量メモリ3に記憶する。
ついで、特徴量メモリ3に記憶された特徴量と辞書メモ
リ4に記憶されているデータとの距離を、文字毎に計算
し、最も距離の小さい値を持つ文字、即ち最も近似した
形状を持つ文字を認識結果とじてメモリ5に記憶する。
これが、マツチング処理である。ここに、本実施例では
、辞書メモリ4中には形が同じで大きさや位置の異なる
ものについては、1つの態様のみを登録しておくもので
ある。
例えば、“あ”′あ゛゛い”パい゛う”“′う″等の大
文字、小文字を考えた場合、従来であれば、これらの″
あ″“あ”゛い“″ ″い′”′う“゛う”等がすべて
登録されているが、本実施例では“あ”′い”′う″等
の大文字なるもののみを登録しておくものである。
マツチング処理の結果のコードが、メモリ5中のメモリ
■に記憶されている値と比較して小さい場合にはコード
変換の関数を呼出す。さらに、このコードをメモリ5中
の各メモリ■◎@に各々記憶されている所定値と比較し
、以後の処理を振り分ける。まず、メモリ■と比較して
大きい場合には片仮名グループの処理へ移行し、メモリ
◎と比較して大きい場合には平仮名グループの処理へ移
行し、メモリ@と比較して大きい場合には数字グループ
の処理へ移行する。これら3態様以外の場合には記号グ
ループの処理に移行する。
1二に、例えば片仮名グループの処理の場合、文字の高
さと幅とが、メモリ5中の基準値メモリ■に記憶されて
いる基準値なる閾値と比較して大きい場合には、そのま
まリターンする。即ち、本例であれば、大文字なる片仮
名文字と判断されたことになり、当該片仮名の大文字に
ついての文字コードが認識結果メモリ6に出力される。
一方、文字の高さと幅とが、閾値よりも小さい場合には
当該コードから基準値メモリ■の閾値を引き、その差を
オフセットとし、本例では小文字等の文字コードを記憶
しているテーブルメモリ7をアクセスし、これらに記憶
されている文字コードを認識結果メモリ6に出力する。
つまり、この場合は当該片仮名文字の小文字についての
文字コードが認識結果メモリ6に出力されることになる
平仮名グループや数字グループの処理も、基準値メモリ
■■による閾値が異なり、また、アクセスするテーブル
メモリ8が異なるが、片仮名グループの場合の処理と同
様であり、文字の高さと幅との情報に基づき大文字の文
字コード又は小文字の文字コードが出力される。
一方、ヱれらの文字ではなく、記号グループの場合には
、特徴量メモリ3に記憶されている文字の画像のトップ
位置情報(即ち、切り出された行の画像中の位置を上/
下の切り分けの判断とする)から、メモリ5中の基準値
メモリ■の閾値と比較し、小さければそのままコード変
換処理を行なう。
即ち、点の場合であれば、辞書メモリ4に格納されてい
るほうの゛・“(中点)の文字コードが出力される。小
さくなければ、辞書メモリ4に格納されていないほうの
′、”(下点)と判断され、その文字コードが出力され
る。
つまり、大文字/小文字の文字にしても、上位置(中位
置)/下位置の記号等にしても、その形が同じものであ
れば、1つの種類のみを辞書メモリ4に登録しておけば
よく、辞書が小さくなる分、マツチング処理の時間を短
縮できるとともに、認識率も向上することになる。
効果 本発明は、上述したように形が同じで大きさ又は位置の
異なる文字又は記号は一種類の態様で辞書に登録してお
き、この辞書を検索して認識対象の画像の形状的特徴に
よりその文字又は記号を認識した後、切り出された当該
文字等の画像の高さ、幅、位置等の特徴情報に基づき当
該文字等が大文字か/h文字か等の種別を判定し、前記
辞書から当該文字等の大文字又は小文字等の判定結果に
応じた種別の文字コードを出力させるようにしたので、
辞書登録数が大幅に減少し、よって、認識対象について
のマツチング処理に際して処理時間を減少させ、かつ、
認識率を向上させることができる。
【図面の簡単な説明】
図面は本発明の一実施例を示し、第1図はブロック図、
第2図は全体の概略処理を示すフローチャート、第3図
は認識処理を示すフローチャートである。 3・・辞書

Claims (1)

    【特許請求の範囲】
  1. 形が同じで大きさ又は位置の異なる文字又は記号は一種
    類の態様で辞書に登録しておき、この辞書を検索して認
    識対象の画像の形状的特徴によりその文字又は記号を認
    識した後、切り出された当該文字等の画像の高さ、幅、
    位置等の特徴情報に基づき当該文字等が大文字か小文字
    か等の種別を判定し、前記辞書から当該文字等の大文字
    又は小文字等の判定結果に応じた種別の文字コードを出
    力させることを特徴とする文字認識装置における文字コ
    ード出力方法。
JP63121498A 1988-05-18 1988-05-18 文字認識装置における文字コード出力方法 Pending JPH01291394A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63121498A JPH01291394A (ja) 1988-05-18 1988-05-18 文字認識装置における文字コード出力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63121498A JPH01291394A (ja) 1988-05-18 1988-05-18 文字認識装置における文字コード出力方法

Publications (1)

Publication Number Publication Date
JPH01291394A true JPH01291394A (ja) 1989-11-22

Family

ID=14812667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63121498A Pending JPH01291394A (ja) 1988-05-18 1988-05-18 文字認識装置における文字コード出力方法

Country Status (1)

Country Link
JP (1) JPH01291394A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0457534A2 (en) * 1990-05-14 1991-11-21 Canon Kabushiki Kaisha Image processing method and apparatus

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59123982A (ja) * 1982-12-29 1984-07-17 Fujitsu Ltd 文字認識装置
JPS61194582A (ja) * 1985-02-23 1986-08-28 C I C Japan Kk 手書き文字認識装置
JPS62173580A (ja) * 1986-01-27 1987-07-30 Mitsubishi Electric Corp 手書き文字認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59123982A (ja) * 1982-12-29 1984-07-17 Fujitsu Ltd 文字認識装置
JPS61194582A (ja) * 1985-02-23 1986-08-28 C I C Japan Kk 手書き文字認識装置
JPS62173580A (ja) * 1986-01-27 1987-07-30 Mitsubishi Electric Corp 手書き文字認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0457534A2 (en) * 1990-05-14 1991-11-21 Canon Kabushiki Kaisha Image processing method and apparatus
US5729630A (en) * 1990-05-14 1998-03-17 Canon Kabushiki Kaisha Image processing method and apparatus having character recognition capabilities using size or position information

Similar Documents

Publication Publication Date Title
Lehal et al. A Gurmukhi script recognition system
JP3639126B2 (ja) 住所認識装置及び住所認識方法
JP2713622B2 (ja) 表形式文書読取装置
JPH01291394A (ja) 文字認識装置における文字コード出力方法
Fairhurst et al. Moving window classifier: approach to offline image recognition
KR19990049667A (ko) 한글 문자체 인식 방법
JPH07319880A (ja) キーワード抽出・検索装置
JPH0436432B2 (ja)
JP3911942B2 (ja) 文字認識装置
JP3151866B2 (ja) 英文字認識方法
JP2963474B2 (ja) 類似文字識別方法
JP2746345B2 (ja) 文字認識の後処理方法
JP2685257B2 (ja) 認識方法
JP2000288478A (ja) 宛先特定装置
JPH09179935A (ja) 文字認識装置およびその制御方法
JP2000082113A (ja) 文字認識装置および辞書作成方法および記録媒体
JPS61272887A (ja) 文字認識方式
JP2851865B2 (ja) 文字認識装置
JPH06119497A (ja) 文字認識方法
JP2974396B2 (ja) 画像処理方法及び装置
JPS63269267A (ja) 文字認識方法
JPH08243506A (ja) 住所読取り装置及び方法
JPH10235299A (ja) 手書宛先認識装置
JPH06231310A (ja) 文字認識装置における文字認識方法
JPH0421080A (ja) 文字認識装置