JPS6095690A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPS6095690A
JPS6095690A JP58202807A JP20280783A JPS6095690A JP S6095690 A JPS6095690 A JP S6095690A JP 58202807 A JP58202807 A JP 58202807A JP 20280783 A JP20280783 A JP 20280783A JP S6095690 A JPS6095690 A JP S6095690A
Authority
JP
Japan
Prior art keywords
character
features
characters
category
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58202807A
Other languages
English (en)
Other versions
JPH0475556B2 (ja
Inventor
Mitsuru Toyoda
豊田 充
Kenichiro Ishii
健一郎 石井
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58202807A priority Critical patent/JPS6095690A/ja
Publication of JPS6095690A publication Critical patent/JPS6095690A/ja
Publication of JPH0475556B2 publication Critical patent/JPH0475556B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、主として複数の字体の印刷文字を読取対象
として認識辞書の構成と、その認識辞書を用いて入力文
字の属するカテゴリと字体7判別する文字読取装置に関
するものである。
〔従来技術〕
従来、印刷文字を対象とした文字読取装置の認識法には
、文字パターン自体を重ね合わせ、最も良く重なり合う
ものを候補とするパターンマツチング法と、文字ノくタ
ーンよりその文字を構成する線分などの特徴を抽出し、
最も特徴が似ているものを特徴とする特徴マツチング法
がある。こnらの認識法を用いた文字読取装置において
、複数の字体を読み取るための辞書構成にはすべての字
体の字形を平均して用意したものと、カテゴリ毎に各字
体の辞書を用意しLものがある。前者の場合は平均的な
特徴で認−辞書が構成されるため、高精度な認識ができ
ない上に、字体を認識できない。
後者は認識辞書のメモリ量が増大するとともに、識別処
理が遅くなるという欠点があった。−また、従来の文字
読取装@Lは、読取対象となった文字の字体を文字コー
ドとともに出力する機能を有するものはなかつに0 〔発明の概要〕 この発明は、これらの欠点を解決するために、文字パタ
ーンに出現する特徴は同一のカテゴリ(伺という文字か
ということンであれば字体(明朝体、ゴシック体等のこ
と)が異なっても同じ特徴が多数存在することに着目し
、字体間で共通匠出現する特徴暑く(り出した共通特徴
と、それぞれの字体妊固有に出現する特徴を持つ個別特
徴とに分類して文字を登録することにより認識辞書の規
模を節約し、かつ、カテゴリと字体を同時に認識するよ
うにしたものである。以下、この発明を図面について説
明する。
〔発明の実施例〕
第1図は゛この発明による文字読取装置の構成の一例で
ある。この図で、1は帳票で、読み取るべき文字入力文
字が記載さjている。2は前処理部で、帳票1に記載さ
れている文字i1文字ずつ切り出す。3は特徴抽出部、
4は識別部、5はあらかじめ特徴が記憶されている認識
辞書部、6は制御部、7は出力端子である。
次に、動作について説明する。装置にセットさT’Lf
、:、帳票IK記載さtty、、:文字は1行ずつ光電
変換さ1また後、制御部6の信号に従って前処理部2で
1文字ずつ切り出さ11、特徴抽出部3で各文字の特徴
が抽出されてこiらの特徴データが識別部4に送ら扛る
。識別部4では、例えば線形識別関数を用いた類似算出
法では、入力文字の特徴とあらかじめ認識辞書部5に用
意した特徴とを照合し、類似度を算出し、最も高い類似
度を示したカテゴリあるいはあるしきい値以上の類似度
を持つカテゴリを出力する。
次に、認識辞書部5の構成法と識別部4におけるカテゴ
リおよび字体の認識法について、第2図を用いて詳細に
説明する。第2図において、(a)は従来の認識辞書構
成、(b)はこの発明による認識辞書構成の概念図であ
る。ここでは簡略化の1こめに、2字体を読取対象とし
た場合について説明1−る。
(a) において、同一のカテゴリC,K対し、字体”
、xの特徴FIのimg’JI素が(t+、t2.i4
゜f6+・・・・・・fn−、、f、、)、字体#2の
特徴F、の構S、要素が(fa 、fs、fs、fa、
°”L−z 、fn−1)であつに場合、七〇iま結合
すると認識辞書部5の規模は約2倍となる。
そこで同図(b)に示すよ5に、字体#lと字体#2に
共通である特徴(共通特車ンをFo = (h、fa 
・・・f、、、、L字体#1のみの特9(個別特徴ンを
FI′=(ft * f4.++ fn ) 2字体4
2のみの特徴(個別特徴ンをF:=(f3.f5.・・
・fn−1)として分類し、別々に認識辞書部5に登録
する。こ21乞全カテゴリに対し行う。
認識辞書部5を用いて識別を行う際、入力文字の特徴と
認識辞書部5の特徴(FO+C) 、(FO+F;)を
照合し、類似度の高一方の字体をそσ)字種の候補とす
ることにより字体の認識を行(・、カテゴリと字体の情
報製同時に出力する。なお、この時、入力文字の特徴と
共通特徴F。との照合は1回行うだけで良(、第2図(
a)のようKF、。
F、の全特徴と照合を行う場合よりも識別処理を高速に
行うことができろ。
なお、線幅比や飾りの有無などの特徴を用い1こフォン
ト認識用の辞書と、この発明による認識辞書部を併用し
て識別ン行えば、さらに高精度にフォントを認識できる
ことはいうまでもない。
〔発明の効果〕
以上説明したように、この発明は、共通特徴と個別特徴
とを別々に登録して認識辞書部を構成し、この両特徴と
入力文字から抽出さt′Lf、ニー特徴とを照合してと
のカテゴリのどの字体の個別特徴と一致したかを判定し
てカテゴリと字体情報を得るよ5にしたので、認識辞書
部の規模の増大ン抑え、かつ、字体の種類を判別でき、
また、字体数が増加しても適用することができる利点か
ある。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
はこの発明による認識辞書部の構成を説明する概念図で
ある。 図中、1は帳票、2は前処理部、3は特徴抽出部、4は
識別部、5は認識辞書部、6は制御部、1は出力端子、
(a)は従来の認識辞書構成、(b)はこの発明による
認識辞書構成を示し、Fl、F2゜F Q + Fl 
+ F;はそれぞれ同一のカテゴリC,において、Fl
 は字体#1の特徴、F2は字体#2の特徴、Foは字
体 1と 2の共通特徴、F:は字体11のみの特徴、
F:は字体#2の特徴である。

Claims (1)

    【特許請求の範囲】
  1. 複数種の字体が混在した入力文字を読み取る文字読取装
    置において、字体が異なっても同一のカテゴリに共通し
    て出現する共通特徴と、そのカテゴリにおいてそれぞれ
    の字体に固有に出現する個別特徴とが別々に登録されて
    いる認識辞書部と、前記入力文字から前記各特徴を抽出
    する特徴抽出部と、前記認識辞書部内の前記各特徴と前
    記#微抽出部の入力文字から抽出された各特徴とを照合
    する際に、前記共通特徴の一致を判定した後そのカテゴ
    リのどの字体の個別特徴と一致したかを判定してカテゴ
    リと字体情報とt出力する識別部とを具備したことを特
    徴とする文字読取装置。
JP58202807A 1983-10-31 1983-10-31 文字読取装置 Granted JPS6095690A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58202807A JPS6095690A (ja) 1983-10-31 1983-10-31 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58202807A JPS6095690A (ja) 1983-10-31 1983-10-31 文字読取装置

Publications (2)

Publication Number Publication Date
JPS6095690A true JPS6095690A (ja) 1985-05-29
JPH0475556B2 JPH0475556B2 (ja) 1992-12-01

Family

ID=16463520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58202807A Granted JPS6095690A (ja) 1983-10-31 1983-10-31 文字読取装置

Country Status (1)

Country Link
JP (1) JPS6095690A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01255986A (ja) * 1988-04-05 1989-10-12 Fujitsu Ltd マルチフオント辞書の作成法
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
US7130487B1 (en) 1998-12-15 2006-10-31 Matsushita Electric Industrial Co., Ltd. Searching method, searching device, and recorded medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01255986A (ja) * 1988-04-05 1989-10-12 Fujitsu Ltd マルチフオント辞書の作成法
JPH02268388A (ja) * 1989-04-10 1990-11-02 Hitachi Ltd 文字認識方法
US7130487B1 (en) 1998-12-15 2006-10-31 Matsushita Electric Industrial Co., Ltd. Searching method, searching device, and recorded medium

Also Published As

Publication number Publication date
JPH0475556B2 (ja) 1992-12-01

Similar Documents

Publication Publication Date Title
JPS6095690A (ja) 文字読取装置
JPH0520794B2 (ja)
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JPS60153575A (ja) 文字読取方法
JP2848560B2 (ja) 画像認識方法及び装置
JP3151866B2 (ja) 英文字認識方法
JP2538543B2 (ja) 文字情報認識装置
JPH028348B2 (ja)
JPH0357509B2 (ja)
JPS6146573A (ja) 文字認識装置
JPS63282586A (ja) 文字認識装置
SU363105A1 (ru) Способ формирования мер сходства при распознавании образов
JPS6095689A (ja) 光学的文字読取装置
JP2813600B2 (ja) 表形式文書読取装置
JPS60138689A (ja) 文字認識方法
JPS59106084A (ja) 文字読取り装置
JPH01191992A (ja) 文字認識装置
JP3100786B2 (ja) 文字認識後処理方式
JPS60217490A (ja) 文字認識装置
JPS58105387A (ja) 文字認識方法
JPS6129976A (ja) 文字認識方法
JPS608990A (ja) 文字認識方式
JPS61251984A (ja) マルチフオント活字文字認識装置
JPS61194584A (ja) 単語認識方式
JPH0338787A (ja) 文字認識処理装置