JPH08161428A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH08161428A
JPH08161428A JP6304523A JP30452394A JPH08161428A JP H08161428 A JPH08161428 A JP H08161428A JP 6304523 A JP6304523 A JP 6304523A JP 30452394 A JP30452394 A JP 30452394A JP H08161428 A JPH08161428 A JP H08161428A
Authority
JP
Japan
Prior art keywords
character
aspect ratio
rectangle
dictionary
relative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6304523A
Other languages
English (en)
Inventor
Takakuni Minewaki
隆邦 嶺脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6304523A priority Critical patent/JPH08161428A/ja
Publication of JPH08161428A publication Critical patent/JPH08161428A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 縦長、横長の文字を高精度に認識する。 【構成】 文字矩形メモリ4には、切り出された文字毎
の矩形情報が格納される。基準文字矩形決定部5は、文
字の矩形情報から基準となる文字の矩形(高さ、幅)を
決める。算出部6は、対象文字の縦横比と基準文字の縦
横比から相対縦横比を算出する。認識部7は、対象文字
を認識して認識結果候補を出力する。文字辞書8には文
字毎の相対縦横比が格納され、照合部9は候補文字につ
いての文字辞書8内の相対縦横比と、対象文字の相対縦
横比とを比較し、判定部11は、その相違度が小さい候
補を認識結果として判定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、縦長、横長の文字を高
精度に認識する文字認識方法に関する。
【0002】
【従来の技術】従来から、類似した文字を識別する文字
認識方法が種々提案されている。このような例として、
本出願人は先に、入力文字の認識結果候補となった特定
の類似文字について、その標準の縦横比と入力文字の正
規化前の縦横比との比較によって正解の可能性を評価す
る類似文字識別方法を提案した(特開平4−98383
号公報を参照)。また、この類似文字識別方法を改良し
たものとして、複数の認識結果候補から候補数を絞り込
む際に、認識結果候補文字の縦横比と認識対象文字の縦
横比とを比較し、その比較結果が所定の閾値を超える認
識結果候補文字を、複数の候補から削除する文字認識方
法を提案した(特開平4−372089号公報を参
照)。
【0003】
【発明が解決しようとする課題】ところで、新聞の文字
は全体的に平べったい文字フォント(平体)で印刷され
(図12)、電話帳は全体的に長細いフォント(長体)
で印刷されている(図13)。また、文書によっては、
文章がすべて横倍角や縦倍角で印刷されていることもあ
る。さらに、コピーやファクスの出力により、部分的、
全体的に縦横の寸法が変倍され、文字の形が正体でない
ことがある。
【0004】上記した従来の技術では、個々の文字の高
さと幅の比をそのまま縦横比として算出し、辞書に格納
された値と比較していて、辞書は、通常の全角文字(正
体)を基にして作成されているので、前述した平体や長
体など、正体以外のフォントで記述されている文字につ
いては認識精度が悪いという問題があった。
【0005】本発明の目的は、縦長、横長の文字を高精
度に認識する文字認識方法を提供することにある。
【0006】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、入力画像から切り出され
た文字矩形の高さと幅の比(以下、縦横比という)を基
に、文字を認識処理する文字認識方法において、該入力
画像から基準となる文字矩形を決定し、該基準文字矩形
の縦横比と、認識対象の文字矩形の縦横比との比率(以
下、相対縦横比)を求め、該算出された相対縦横比と、
辞書に格納された各文字についての相対縦横比とを比較
することによって、前記認識対象の文字を判定すること
を特徴としている。
【0007】請求項2記載の発明では、入力画像から切
り出された文字矩形の高さと幅の比(以下、縦横比とい
う)を基に、所定の文字フォントを認識処理する文字認
識方法において、各文字の異なるフォントについての縦
横比を辞書に格納し、該入力画像から基準となる文字矩
形のフォントを判定し、認識対象の文字矩形の縦横比
と、該判定結果に応じて参照される辞書の縦横比とを比
較することによって、前記認識対象の文字を判定するこ
とを特徴としている。
【0008】
【作用】切り出された文字毎の矩形情報が文字矩形メモ
リに格納される。基準文字矩形決定部では、文字の矩形
情報から基準となる文字の矩形(高さ、幅)を決め、対
象文字の縦横比と基準文字の縦横比から相対縦横比が算
出される。認識部では、対象文字を認識して、認識結果
の候補を出力する。文字辞書には、文字毎の相対縦横比
が格納されていて、照合部では候補文字についての文字
辞書内の相対縦横比と、対象文字の相対縦横比とを比較
し、その差が小さい候補文字を認識結果として判定され
る。
【0009】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。 〈実施例1〉図1は、本発明の実施例の構成を示す。図
において、1はスキャナなどによって構成され、対象と
なる原稿の画像を読み込む画像入力部、2は読み込まれ
た画像データを格納する画像メモリ、3は画像メモリ中
の画像データから文字の矩形を切り出す文字切り出し
部、4は切り出された文字毎の矩形情報を格納する文字
矩形メモリ、5は文字毎の矩形情報から基準となる文字
の矩形を決める基準文字矩形決定部、6は対象文字の文
字矩形と基準文字の文字矩形を比較して、その相対比
(相対縦横比)を算出する算出部、7は対象文字を認識
して認識結果候補を出力する認識部、8は文字毎の相対
縦横比が格納された文字辞書、9は候補文字についての
文字辞書内の相対縦横比と、対象文字の相対縦横比とを
比較する照合部、10は照合結果を格納する結果メモ
リ、11は照合結果から相違度が小さいものを採用する
結果判定部である。
【0010】図2は、本発明の処理の流れを表すフロー
チャートである。以下、具体例を用いて実施例を説明す
る。例えば、文字列中に現れた「ニ」という文字を認識
する場合を例にして説明すると、対象としている文字
は、例えば図3に示す、新聞の平体のような横長のフォ
ントで印刷されているものとする。
【0011】図3に示す原稿が画像入力部1で読み取ら
れて、画像メモリ2に画像データが書き込まれる。文字
切り出し部3は、画像メモリ2から文字の矩形を切り出
して、文字矩形メモリ4に格納する。
【0012】基準文字矩形決定部5は、例えば、 (1)文書全体の文字矩形情報から、統計的な処理によ
り文書の基準となる文字の矩形(高さ、幅)を決定する (2)現在注目している行の文字矩形を統計的な処理に
より、行の基準となる文字の矩形(高さ、幅)を決定す
る (3)予め判定された文書の種類(新聞/雑誌/電話
帳)により、文字の基準矩形(高さ、幅)を決定するな
どの処理によって、基準文字矩形を決定する。
【0013】図4は、平体文字から基準文字矩形が決定
される例を示し、図5は、長体文字から基準文字矩形が
決定される例を示す。図3の例の場合、基準文字矩形決
定部5によって、基準文字矩形の高さがH=40、幅が
W=50であると決定されたとものとする(ステップ1
01)。
【0014】また、文字矩形メモリ4には、対象とする
文字「ニ」の文字矩形が、例えば、高さh=30、幅w
=50として格納されている。相対縦横比算出部6は、
基準文字と対象文字の縦横比の比率を算出する(ステッ
プ102)。例えば、この算出式は、 相対縦横比=(w/h)/(W/H) で定義される。このとき、基準文字矩形に対して対象文
字矩形がより横長ならば大きい値(>1)が、逆に基準
文字矩形に対して対象文字矩形がより縦長ならば小さい
値(<1)が得られる。上記した例の「ニ」について
は、相対縦横比として、1.3が得られる。
【0015】一方、認識部7は、対象文字「ニ」につい
て認識処理を行って、対象文字の認識結果候補として、
「:」、「ニ」、「=」の類似文字を出力したとする。
これらの文字の個々の文字辞書8には、図6に示すよう
に、それぞれ文字の標準的なフォント(正体)での相対
縦横比が格納されている。
【0016】そして、照合部9は、文字辞書8の値と対
象文字の相対縦横比とを照合する(ステップ103)。
すなわち、候補文字についての辞書内の相対縦横比と、
対象文字の相対縦横比(1.3)との差を求めると、図
7に示すものとなる。次いで、照合部9は、差異の絶対
値が小さい順に候補をソートして、結果メモリ10に書
き出す。図8は、候補がソートされた結果メモリの内容
を示す。なお、このとき、前掲した第2の公報に記載の
方法を用いて、相対縦横比に上限値、下限値を設定し
て、対象文字の相対縦横比がその範囲を超える場合に
は、候補をリジェクトするように、実施例を変更するこ
とも可能である。
【0017】結果判定部11では、結果メモリ10の内
容から、認識結果として、第1候補の文字「ニ」を正解
として判定出力する(ステップ104)。従来のよう
に、対象文字の高さと幅のみから縦横比を算出した場合
には、「ニ」の縦横比は50/30=1.7という値が
得られ、これと上記した文字辞書の値とを比較すると、
差異の最も小さいものとして、「=」が出力され、誤認
識することになる。これは、従来の認識方法では、文字
全体が横長であることを考慮できず、従って通常の文字
形が横長であるものを選択してしまうことによる誤りで
ある。
【0018】〈実施例2〉この実施例2の構成は、実施
例1のものと同様である。ただし、基準文字矩形決定部
5は、処理の結果、「基準文字は平体」、「基準文字は
長体」、「基準文字は正体」、「基準文字は横2倍
角」、「基準文字は縦2倍角」などの基準文字の特性
(つまりフォント)を判定出力する。
【0019】そして、文字辞書8には、各文字の上記フ
ォントに対応して、縦横比(幅/高さ)が複数格納され
ていて、基準文字矩形決定部5の判定出力に応じた値が
選択、出力される。図9は、実施例2における文字辞書
8の内容を示し、この場合は、文字「:」、「ニ」、
「=」について、そのフォント毎(平体、正体、長体な
ど)の縦横比が格納されている。
【0020】上記した実施例1と同様に対象文字が
「ニ」であるとすると、基準文字矩形決定部5からは、
予め処理された結果をもとに「基準文字は平体」である
と出力され、この出力に応じて、文字辞書メモリ8の
「縦横比 平体」の行の辞書値が参照される。
【0021】照合部9では、対象文字の縦横比h=3
0、w=50からw/h=1.7を求め、この値と、上
記の辞書値との差異を求めると、図10に示すものとな
る。そして、差異の絶対値が小さい順に候補をソートし
て結果メモリ10に書き出す。図11は、候補がソート
された結果メモリの内容を示す。結果判定部11では、
結果メモリ10の内容から、第1候補の文字「ニ」を正
解として判定出力する。
【0022】
【発明の効果】以上、説明したように、本発明によれ
ば、入力画像から基準となる文字矩形を決定し、該基準
文字矩形の縦横比と、認識対象の文字矩形の縦横比との
比率である相対縦横比を求め、この相対縦横比と、辞書
に格納された各文字についての相対縦横比とを比較する
ことによって、文字の判定を行っているので、縦長や横
長の文字の高精度な認識が可能となる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す。
【図2】本発明の処理の流れを表すフローチャートであ
る。
【図3】横長のフォントで印刷された認識対象文字の例
を示す。
【図4】平体文字から基準文字矩形が決定される例を示
す。
【図5】長体文字から基準文字矩形が決定される例を示
す。
【図6】実施例1における文字辞書の構成を示す。
【図7】実施例1における辞書との照合結果を示す。
【図8】実施例1における結果メモリの内容を示す。
【図9】実施例2における文字辞書の構成を示す。
【図10】実施例2における辞書との照合結果を示す。
【図11】実施例2における結果メモリの内容を示す。
【図12】平体文字の例を示す。
【図13】長体文字の例を示す。
【符号の説明】
1 画像入力部 2 画像メモリ 3 文字切り出し部 4 文字矩形メモリ 5 基準文字矩形決定部 6 相対縦横比算出部 7 認識部 8 文字辞書メモリ 9 照合部 10 結果メモリ 11 結果判定部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力画像から切り出された文字矩形の高
    さと幅の比(以下、縦横比という)を基に、文字を認識
    処理する文字認識方法において、該入力画像から基準と
    なる文字矩形を決定し、該基準文字矩形の縦横比と、認
    識対象の文字矩形の縦横比との比率(以下、相対縦横
    比)を求め、該算出された相対縦横比と、辞書に格納さ
    れた各文字についての相対縦横比とを比較することによ
    って、前記認識対象の文字を判定することを特徴とする
    文字認識方法。
  2. 【請求項2】 入力画像から切り出された文字矩形の高
    さと幅の比(以下、縦横比という)を基に、所定の文字
    フォントを認識処理する文字認識方法において、各文字
    の異なるフォントについての縦横比を辞書に格納し、該
    入力画像から基準となる文字矩形のフォントを判定し、
    認識対象の文字矩形の縦横比と、該判定結果に応じて参
    照される辞書の縦横比とを比較することによって、前記
    認識対象の文字を判定することを特徴とする文字認識方
    法。
JP6304523A 1994-12-08 1994-12-08 文字認識方法 Pending JPH08161428A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6304523A JPH08161428A (ja) 1994-12-08 1994-12-08 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6304523A JPH08161428A (ja) 1994-12-08 1994-12-08 文字認識方法

Publications (1)

Publication Number Publication Date
JPH08161428A true JPH08161428A (ja) 1996-06-21

Family

ID=17934049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6304523A Pending JPH08161428A (ja) 1994-12-08 1994-12-08 文字認識方法

Country Status (1)

Country Link
JP (1) JPH08161428A (ja)

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US6259812B1 (en) Key character extraction and lexicon reduction cursive text recognition
EP1265189B1 (en) Pattern extraction apparatus and method
US20080002884A1 (en) Method and device for recognition of a handwritten pattern
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
US8103099B2 (en) Method and system for recognizing characters and character groups in electronically represented text
US20070041643A1 (en) Character recognition apparatus and character recognition method
Saiga et al. An OCR system for business cards
JPH08161428A (ja) 文字認識方法
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP3620299B2 (ja) 文書ファイリング装置及び文書ファイリング方法
JPH0728935A (ja) 文書画像処理装置
JP2746345B2 (ja) 文字認識の後処理方法
JP2894305B2 (ja) 認識装置の候補修正方式
JP2963474B2 (ja) 類似文字識別方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH11265424A (ja) 文字認識方法、装置および記録媒体
JP4092847B2 (ja) 文字認識装置および文字認識方法
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JP3226355B2 (ja) 認識結果評価方法
JP2931485B2 (ja) 文字切出し装置及び方法
JPH09330378A (ja) パターン辞書比較方法