JPS61251984A - マルチフオント活字文字認識装置 - Google Patents

マルチフオント活字文字認識装置

Info

Publication number
JPS61251984A
JPS61251984A JP60093313A JP9331385A JPS61251984A JP S61251984 A JPS61251984 A JP S61251984A JP 60093313 A JP60093313 A JP 60093313A JP 9331385 A JP9331385 A JP 9331385A JP S61251984 A JPS61251984 A JP S61251984A
Authority
JP
Japan
Prior art keywords
dictionary
character
font
characters
fonts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60093313A
Other languages
English (en)
Inventor
Akira Sakurai
彰 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60093313A priority Critical patent/JPS61251984A/ja
Publication of JPS61251984A publication Critical patent/JPS61251984A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、マルチフォント活字文字の認識装置に関する
〔従来技術〕
従来のマルチフォント活字文字認識装置においては、フ
ォント別に辞書を用意しているため、辞書容量が極めて
大きく、これが装置価格の上昇と認識速度の低下を招い
ている。
また、認識処理については、初めの何文字かについて全
フォントの辞書を検索し、入力文字と候補文字との距離
の合計が最小のフォントを選択し、あるいは、候補文字
の多数決をとり、その結果に認識結果が最も近いフォン
トを選択し、その後はそのフォントの辞書だけを用いて
認識している。
その結果、初めの何文字かの認識時間が長く、また、途
中でフォントが変わる文書などの文字認識の場合に対応
できなかった。
〔目 的〕
本発明は、そのような従来の問題点に鑑みてなされたも
のであり、その主たる目的は、辞書容量を削除し、装置
価格の低減と認識速度の向上を図ったマルチフォント活
字文字認識装置を提供することにある。
〔構 成〕
本発明によれば、マルチフォント活字文字認識装置の辞
書は、グローバル辞書と詳細辞書とに分割される。すべ
てのフォントで構造が同一の文字は、全フォント共通に
1つの文字として前記グローバル辞書に登録され、2つ
以上のフォントについて構造が類似した文字は、その2
つ以上のフォントに共通の1つの文字として前記グロー
バル辞書に登録されると\もに、各フォント別にそれぞ
れ前記詳細辞書にも登録され、他のフォントとは構造が
非類似の文字は、それぞれ前記グローバル辞書に登録さ
れる。そして、入力文字は前記グローバル辞書によって
認識され、それで同定できない入力文字については前記
詳細辞書を用いて認識される。
〔実施例〕
以下、図面を参照し、本発明の一実施例を説明する。
第1図は、本発明のマルチフォント活字文字認識方式を
適用した文字認識装置の一例を示す概略ブロック図であ
る。
この図において、10は原稿から文字を読み取る入力部
であり、スキャナや文字切出回路などから構成されてい
る。この入力部10により読み取られた文字は、特徴抽
出部12へ入力され、その文字の構造的特徴(例えばス
トローク特徴や方向コードのヒストグラム)と、フォン
ト識別の手掛りとなる文字高さなどが抽出される。抽出
された構造的特徴や文字高さの情報は、次の認識部14
へ入力される。
認識部14は、その入力情報に基づき、辞書16を検索
して入力文字を認識する。
こぎで、本発明の主要な特徴である辞書16の構造を説
明する。この辞書16は、グローバル辞書16Aと詳細
辞書16Bに分かれている。■すべてのフォントで構造
が同一の文字は、全フォント共通に1つの文字としてグ
ローバル辞書16Aに登録されている。■2つ以上のフ
ォントについて構造が類似した文字は、その2つ以上の
フォントに共通の1つの文字としてグローバル辞書16
Aに登録されると一\もに、各フォント別にそれぞれ詳
細辞書16Bにも登録されている。■他のフォントとは
構造が非類似の文字は、それぞれフォント情報を付加し
てグローバル辞書16Aに登録されている。
実際上、文字の大部分は■または■の文字に該当し、■
の文字は多くないため、辞書16全体の容量は、フォン
ト別に辞書を容易にした場合よりも大幅に削除される。
次に第2図のフローチャートを参照しながら、認識部1
4による文字認識処理について説明する。
まず認識部14は、入力文字と構造特徴が類似した文字
をグローバル辞書16から検索する(ステップ100)
検索された候補文字が1つであるか判定しくステップ1
02)、1つの場合(入力文字は■または■の文字であ
る)、入力文字をその候補文字であると認識し、その文
字コードを出力する(ステップ104)。そして、その
候補文字にフォント情報が付加されているか判定する(
ステップ106)。
認識部14は、過去5文字分の各フォントの出現頻度を
内部のカウンタでカウントしている。そして、フォント
情報が付加されていれば(その文字は■の文字である)
、そのフォントの頻度に1を加える(ステップ108)
。フォント情報が付加されていなければ(その文字は■
の文字である)、文字の高さ情報から、最も妥当なフォ
ントの頻度に1を加える(ステップ110)。
ステップ108または110に進んだ場合、認識部14
は、内部カウンタでカウントしている過去5文字につい
ての各フォントの頻度から、最も高い頻度のフォントを
選び、そのフォント情報をフォントレジスタ18にセッ
トしくステップ112)、次の入力文字の認識に進む。
ステップ102の判定結果がNoならば、認識部14は
、詳細辞書16Bから第1候補文字と第2候補文字を検
索する(ステップ14)。そして、第1候補文字と第2
候補文字の距離を所定値と比較する(ステップ116)
その距離が所定値以上であれば(ステップ116の判定
がNoの場合)、認識部14は、ステップ110,11
2へ進む。
ステップ116の判定がYESならば、認識部14は、
第1候補文字のフォントがフォントレジスタ18にセッ
トされているフォント情報に相当するものであるか判定
する(ステップ118)。
この判定の結果がYESならば、認識部14は、第2候
補文字のフォントがフォントレジスタ18にセットされ
ているフォント情報に相当するものであるか判定する(
ステップ12o)。その判定結果がNoならば、第1候
補文字の文字コードを認識結果として出力しくステップ
122)、ステップ110に進む。
ステップ118の判定結果がNOならば、認識部14は
、第2候補文字のフォントがフォントレジスタ18にセ
ットされているフォント情報に相当するフォントである
か判定する(ステップ124)。その結果がYESなら
ば、第2候補文字の文字コードを認識結果として出力し
くステップ125)、ステップ110に進む。
ステップ124の判定結果がNoならば、認識部14は
、リジェクトコードを出力しくステップ126)、次の
入力文字の処理に進む。
このように、まずグローバル辞書16Aを検索し、候補
文字を絞りきれない場合に詳細辞書16Bを検索する。
実際には、グローバル辞書16Aの検索で認識を終了で
きる場合が多く、かつグローバル辞書16Aおよび詳細
辞書16Bを含む辞書16全体の容量も従来より相当に
少ないため、認識速度がかなり向上する。
さらに、この実施例のように、認識するたびにフォント
情報を更新し、以降の入力文字のフォント決定のために
必要に応じて、そのフォント情報を参照すれば、異なっ
たフォントの文字が混在しでいる原稿の場合にも、高い
認識率を達成できるとへもに、フォント情報の利用によ
り、入力文字のフォント識別が簡単になるため、辞書容
量の削減と相まって、認識速度も一層向上する。
なお、この実施例では入力文字から抽出した特徴により
文字認識をおこなっているが、その認識手法は、例えば
パターンマツチングによってもよい。
〔効 果〕
以上説明したように、この発明によれば、マルチフォン
ト活字文字認識装置の辞書容量を従来より大幅に削除し
、装置価格の低減と認識速度の向上を達成できる。
【図面の簡単な説明】
第1図は本発明の一実施例の概略ブロック図、第2図は
同実施例における文字認識処理のフローチャートである
。 10・・・入力部、  12・・・特徴抽出部、14・
・・認識部、  16・・・辞書、L6A・・・グロー
バル辞書、  16B・・・詳細辞書、18・・・フォ
ントレジスタ。

Claims (2)

    【特許請求の範囲】
  1. (1)グローバル辞書と詳細辞書とを備え、すべてのフ
    ォントで構造が同一の文字は、全フォント共通に1つの
    文字として前記グローバル辞書に登録し、2つ以上のフ
    ォントについて構造が類似した文字は、その2つ以上の
    フォントに共通の1つの文字として前記グローバル辞書
    に登録するとともに、各フォント別にそれぞれ前記詳細
    辞書にも登録し、他のフォントとは構造が非類似の文字
    は、それぞれ前記グローバル辞書に登録しておき、前記
    グローバル辞書を用いて入力文字を認識し、それを同定
    できない入力文字について前記詳細辞書を用いて認識す
    るようにしてなるマルチフォント活字文字認識装置。
  2. (2)他のフォントとは構造が非類似の文字は、それぞ
    れフォント情報を付加してグローバル辞書に登録するこ
    とを特徴とする特許請求の範囲第1項記載のマルチフォ
    ント活字文字認識装置。
JP60093313A 1985-04-30 1985-04-30 マルチフオント活字文字認識装置 Pending JPS61251984A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60093313A JPS61251984A (ja) 1985-04-30 1985-04-30 マルチフオント活字文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60093313A JPS61251984A (ja) 1985-04-30 1985-04-30 マルチフオント活字文字認識装置

Publications (1)

Publication Number Publication Date
JPS61251984A true JPS61251984A (ja) 1986-11-08

Family

ID=14078823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60093313A Pending JPS61251984A (ja) 1985-04-30 1985-04-30 マルチフオント活字文字認識装置

Country Status (1)

Country Link
JP (1) JPS61251984A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0356228A2 (en) * 1988-08-23 1990-02-28 Pitney Bowes, Inc. Method and apparatus for categorizing and certifying mail

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0356228A2 (en) * 1988-08-23 1990-02-28 Pitney Bowes, Inc. Method and apparatus for categorizing and certifying mail

Similar Documents

Publication Publication Date Title
JPS61251984A (ja) マルチフオント活字文字認識装置
JP2681663B2 (ja) 日本文訂正候補文字抽出方法
JP3115459B2 (ja) 文字認識辞書の構成方法及び検索方法
JP3151866B2 (ja) 英文字認識方法
JP2746345B2 (ja) 文字認識の後処理方法
JP2985243B2 (ja) 文字認識方法
JP3100786B2 (ja) 文字認識後処理方式
JP2766205B2 (ja) 文字認識装置
JP2995825B2 (ja) 日本語文字認識装置
JP2917310B2 (ja) 単語照合における単語辞書検索方式
JPH0475556B2 (ja)
JP2969751B2 (ja) 文字認識処理方式
JPH0259979A (ja) 文書画像処理装置
JPH0830734A (ja) 文字列認識装置
JPH06195508A (ja) 文字切り出し方法
JP2851865B2 (ja) 文字認識装置
JPS60138689A (ja) 文字認識方法
JPH0264884A (ja) 文字認識装置の辞書検索回路
JPH0347554B2 (ja)
JPS60110089A (ja) 文字認識装置
JPH0589294A (ja) 英文字認識装置
JPH07225763A (ja) 文書処理装置
JPS63138479A (ja) 文字認識装置
JPH01201789A (ja) 文字読取装置
JPS6115288A (ja) 光学的文字読取装置