JP2974167B2 - 文字の大分類認識方法 - Google Patents

文字の大分類認識方法

Info

Publication number
JP2974167B2
JP2974167B2 JP3053485A JP5348591A JP2974167B2 JP 2974167 B2 JP2974167 B2 JP 2974167B2 JP 3053485 A JP3053485 A JP 3053485A JP 5348591 A JP5348591 A JP 5348591A JP 2974167 B2 JP2974167 B2 JP 2974167B2
Authority
JP
Japan
Prior art keywords
group
character
representative point
large classification
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3053485A
Other languages
English (en)
Other versions
JPH05128312A (ja
Inventor
輝幸 丸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3053485A priority Critical patent/JP2974167B2/ja
Publication of JPH05128312A publication Critical patent/JPH05128312A/ja
Application granted granted Critical
Publication of JP2974167B2 publication Critical patent/JP2974167B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字認識装置
(OCR)などにおいて、詳細認識処理の前処理とし
て、認識対象の文字画像を似通った文字群単位などにグ
ループ分けする文字大分類認識方法に関する。
【0002】
【従来の技術】OCRなどにおいては、認識処理時間の
短縮を目的として、まず、入力された文字画像を大分類
し、次に、この大分類グループを対象に詳細認識する手
法を用いることが多々ある。
【0003】この種の従来技術では、例えば特開平1−
161592号公報に記載のように、認識辞書内のすべ
ての文字を、似通った特徴量を持つ文字群のグループに
振り分け、これらの平均の特徴量などにより標準特徴量
を求め、グループの特徴量として大分類辞書を作成す
る。そして、入力された文字画像の特徴量を抽出し、各
グループの標準特徴量とマッチングをとり、最も距離の
近いグループを求める(大分類)。その後、この求まっ
たグループに含まれる各文字の特徴量とのマッチングを
行い、最終的な文字候補を決定する。
【0004】
【発明が解決しようとする課題】上記従来技術は、文字
の詳細特徴量を大分類グループ認識にそのまま利用する
ものであるため、フォントが確定している場合あるいは
雑音が無い場合などにおいては非常に有効であるが、手
書きなどにより変形の大きい文字画像や雑音などの存在
する文字画像においては、求まった大分類グループが正
解文字候補を含む詳細認識対象グループに等しくならな
い場合が生じる。また、マルチフォント認識において大
分類操作を行う場合、文字によってはフォントごとに複
数の大分類辞書に登録しなければならない場合があり、
二重登録により辞書サイズが大きくなる傾向がある。
【0005】本発明の目的は、変形文字や雑音の存在
等、理想的でない文字画像が入力された場合でも、大分
類操作において詳細認識対象処理グループを正確に求め
ることのできる文字大分類認識方法を提供することにあ
る。
【0006】本発明の他の目的は、マルチフォント認識
において大分類操作を行う場合も、大分類辞書の二重登
録を必要最少限に抑え、辞書サイズが大きくなるのを防
止できる文字大分類認識方法を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の文字大分類認識方法は、認識対象の文字
画像を複数の領域に分割するステップと、各領域毎にス
トロークの分布状態を表わす特性量を抽出するステップ
と、各領域毎に特性量の分布を求め、その分布状態を表
現する複数の代表点を抽出するステップと、前記抽出さ
れた代表点群とあらかじめ用意された各グループの標準
代表点群と比較して詳細認識候補グループを決定するス
テップとよりなることを特徴とする。
【0008】また、請求項2の文字大分類認識方法は、
認識対象の文字画像を複数の領域に分割するステップ
と、各領域毎にストロークの分布状態を表わす特性量を
抽出するステップと、各領域毎に特性量の分布を求める
と共に、その分布状態を近似する関数を求め、該近似関
数の複数の係数を抽出するステップと、該抽出された係
数値群とあらかじめ用意された各グループの標準係数値
群と比較して詳細認識候補グループを決定するステップ
とよりなることを特徴とする。
【0009】
【作用】請求項1における各大分類グループの標準代表
点群は、代表点群の似通った文字群を一つのグループと
して、そのグループに含まれる文字群の持つ代表点群の
標準となるものである。この各大分類グループの標準代
表点群のそれぞれの代表点と、認識対象文字の求まった
代表点群の対応する代表点とを比較することで類似度を
求め、詳細認識候補グループを決定する。
【0010】また、請求項2でおける各大分類グループ
の標準係数値群は、係数値群の似通った文字群を一つの
グループとして、そのグループに含まれる文字群の持つ
係数値群の標準となるものである。この各大分類グルー
プの標準係数値群のそれぞれの係数値と、認識対象文字
の求まった係数値群の対応する係数値とを比較すること
で類似度を求め、詳細認識候補グループを決定する。
【0011】上記代表点群や近似関数の係数値群は、文
字のグローバルな形状を表現するものであり、これらを
用いることにより、大分類操作において文字の変形や雑
音の存在等による誤認識が減少する。また、マルチフォ
ントであっても同一辞書内に含まれ易くなり、辞書サイ
ズを抑えることができる。
【0012】
【実施例】図1は本発明の各実施例のシステム構成図を
示す。イメージズキャナ11は手書き又は印刷された文
書を読み込む。入力画像用メモリ14は、該イメージス
キャナ11で読み込まれた文書画像を格納する。一方、
辞書メモリ16は、あらかじめ全ての文字データについ
て代表点群あるいは近似関数の係数値群を求め、その似
通った代表点群あるいは係数値群を持つ文字単位でグル
ープ化し、各グループ毎に標準代表点群あるいは標準係
数値群を格納している。処理装置12は、入力画像用メ
モリ14より文字画像を一つずつ切り出して作業用メモ
リ15に格納し、該文字画像のグローバルな形状を表現
する代表点群あるいは近似関数の係数値群を求め、この
求めた代表点群あるいは係数値群を、辞書メモリ16の
各大分類グループの標準代表点群あるいは標準係数値群
と比較することで、詳細認識候補グループを決定し、そ
の後、該グループに着目して詳細認識処理を行い、最終
的に候補文字を決定する。ディスプレイ13は処理装置
12で求まった候補グループや候補文字を表示する。以
下、処理装置12での本発明にかかわる処理を詳述す
る。
【0013】図2は本発明の第1の実施例における処理
装置12のフローチャートを示したものである。
【0014】ステップ101では、入力画像用メモリ1
4より一つの文字画像を切り出し作業用メモリ15に格
納する。ステップ102では、この切り出した文字画像
を複数の領域に分割する。ここでは、図4に示すよう
に、x方向性を持つ4領域に分割するものとする。ステ
ップ103では、各領域毎にストロークの分布状態を表
わす特性量を抽出する。ここでは、文字画像の輪郭部に
着目し、ストロークの分布状態を表わす特性量を、輪郭
画素においては1、それ以外の画素においては0として
抽出する。ステップ104では、各領域における特性量
の分布状態を求める。ここでは、各領域内の輪郭画素を
示す1の数をx方向に累積することで求める。図5は、
図4の各領域における特性量の分布状態(輪郭画素の累
積曲線)を示したものである。
【0015】ステップ105では、各領域について、求
まった特性量の分布より、その分布状態を表現する複数
の代表点を抽出する。ここでは、図5に示すように、各
領域毎に、輪郭画素の累積曲線を複数に区切り、各境界
累積値を示すx座標(図5ではx1,x2,x3)を代
表点とする。図6は図5の各領域における代表点を集め
たもので、これを代表点群と称す。図6の代表点群は、
図4の文字画像のグローバルな形状を表現している。
【0016】ステップ106では、辞書メモリ16内の
各大分類グループの標準代表点群とステップ105で抽
出された認識対象文字画像の代表点群の各対応する代表
点位置の差を求める。ここで、辞書メモリ16内の各大
分類グループの標準代表点群は、例えば次のようにして
作成すればよい。辞書作成のための全ての文字データに
ついてそれぞれ代表点を求め、クラスタリングの代表的
手法であるK−mean法により、代表点の座標を用い
全ての文字データをいくつかのクラスにクラスタリング
する。そして、各クラスタをそれぞれ大分類グループと
し、最終的に得られたシード点の示す代表点群を各大分
類グループの標準代表点群とする。
【0017】ステップ107では、ステップ106で求
まった認識対象文字画像の代表点群と各大分類グループ
の標準代表点群の各対応する代表点位置の差の総和をと
り、各大分類グループと当該文字画像との距離(類似
度)を求める。ステップ108では、当該文字画像との
距離の最も小さい大分類グループを詳細認識対象グルー
プとする。本例では、図6に示した代表点群に最も近い
標準代表点群をもつ大分類グループが詳細認識対象グル
ープとして選択される。
【0018】その後、ステップ109において、ステッ
プ108で選択された大分類グループに含まれる各文字
と当該認識対象の文字画像との特徴量のマッチング等を
行って、最終的な候補文字を決定する。このようにし
て、本例では「文」の文字コードが決定される。この詳
細認識処理の手法は種々提案されており、そのいずれを
使用してもよい。
【0019】図3は本発明の第2の実施例における処理
装置12のフローチャートを示したものである。
【0020】図3において、ステップ201〜205は
図2の第1の実施例のステップ101〜105に対応す
る。ステップ206では、特性量の分布状態を近似する
関数(近似関数)を求め、該近似関数の複数の係数を抽
出する。ここでは、ステップ205(ステップ105)
で抽出した代表点群の座標を文字画像平面上において所
謂双スプライン補間し、この双スプライン補間において
用いた各補間係数を近似関数の係数とする。図7は、図
4の文字画像の例について、等間隔の固定代表点群と図
6の如く求まった代表点群との対応関係を示したもので
ある。従って、図6における対応する代表点群の双スプ
ライン補間は図8のようになる。この双スプライン補間
で用いた補間係数値群も、先の代表点群と同様に当該文
字画像のグローバルな形状を表現している。
【0021】ステップ207では、辞書メモリ16内の
各大分類グループの標準係数値群とステップ206で抽
出された認識対象文字画像における近似関数の係数値群
の各対応する係数値の差を求める。各グループの標準係
数値群の作成法は先の標準代表点群の場合と同様であ
る。即ち、全ての文字データについて、それぞれ近似関
数の係数を求め、クラスタリングの代表点手法であるK
−mean法により、係数値を用い全ての文字データを
いくつかのクラスタにクラスタリングする。そして、各
クラスタをそれぞれ大分類グループとし、最終的に得ら
れたシード点の示す係数値群を各大分類グループの標準
係数値群とする。
【0022】ステップ208では、ステップ207で求
まった認識対象文字画像の係数値群と各大分類グループ
の標準係数値群の各対応する係数値の差の総和をとり、
各大分類グループと当該文字画像との距離(類似度)を
求める。ステップ209では、当該文字画像との距離の
最も小さな大分類グループを詳細認識対象グループとす
る。その後、ステップ210において、ステップ209
で選択された大分類グループに含まれる各文字と当該認
識対象の文字画像との特徴量のマッチング等を行って、
最終的な文字候補を決定する。このようにして、第1の
実施例と同様に、本例では「文」の文字コードが決定さ
れる。
【0023】以上、本発明の各実施例を説明した。ここ
で、図2のステップ102や図3のステップ202の領
域分割では、文字画像をX方向性を持つ4領域に分割す
るとしたが、一般にはX方向性を持つM領域及び/又は
Y方向性を持つN領域(但し、M,N>2)に分割する
ことが可能である。また、ステップ108やステップ2
09では、認識対象文字との距離の最も小さい大分類グ
ループを選択するとしたが、各大分類グループを距離の
小さい順にソートし、上位のL個のグループを詳細認識
候補グループとしてもよい。
【0024】
【発明の効果】以上の説明から明らかなように、本発明
では、文字のグローバルな形状を用いているため、大分
類操作において、手書きによる文字の変形や文字にのっ
た雑音等による誤認識が減少する。また、大分類認識用
辞書の作成においても、文字のグローバルな形状を用い
ることにより、マルチフォントであっても同一辞書内に
含まれ易くなり、辞書サイズを抑えることができる。
【図面の簡単な説明】
【図1】本発明の各実施例に対応するシステム構成図で
ある。
【図2】本発明の第1のフローチャートである。
【図3】本発明の第2のフローチャートである。
【図4】文字画像の分割の具体例を示す図である。
【図5】図4の各領域における特性量の分布状態を示す
図である。
【図6】図4の文字画像に対する代表点群を示す図であ
る。
【図7】等間隔の固定代表点群と図6の代表点群との対
応関係を示す図である。
【図8】図6の代表点群の双スプライン補間を示す図で
ある。
【符号の説明】
11 イメージズキャナ 12 処理装置 13 ディスプレイ 14 入力画像用メモリ 15 作業用メモリ 16 辞書メモリ

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 詳細認識処理の前処理として、認識対象
    の文字画像を似通った文字群単位などにグループ分けす
    る文字の大分類認識方法であって、認識対象の文字画像
    を複数の領域に分割するステップと、各領域毎にストロ
    ークの分布状態を表わす特性量を抽出するステップと、
    各領域毎に特性量の分布を求め、その分布状態を表現す
    る複数の代表点を抽出するステップと、前記抽出された
    代表点群とあらかじめ用意された各グループの標準代表
    点群と比較して詳細認識候補グループを決定するステッ
    プとよりなることを特徴とする文字の大分類認識方法。
  2. 【請求項2】 詳細認識処理の前処理として、認識対象
    の文字画像を似通った文字群単位などにグループ分けす
    る文字の大分類認識方法であって、認識対象の文字画像
    を複数の領域に分割するステップと、各領域毎にストロ
    ークの分布状態を表わす特性量を抽出するステップと、
    各領域毎に特性量の分布を求めると共に、その分布状態
    を近似する関数を求め、該近似関数の複数の係数を抽出
    するステップと、前記抽出された係数値群とあらかじめ
    用意された各グループの標準係数値群と比較して詳細認
    識候補グループを決定するステップとよりなることを特
    徴とする文字の大分類認識方法。
JP3053485A 1991-02-25 1991-02-25 文字の大分類認識方法 Expired - Fee Related JP2974167B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3053485A JP2974167B2 (ja) 1991-02-25 1991-02-25 文字の大分類認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3053485A JP2974167B2 (ja) 1991-02-25 1991-02-25 文字の大分類認識方法

Publications (2)

Publication Number Publication Date
JPH05128312A JPH05128312A (ja) 1993-05-25
JP2974167B2 true JP2974167B2 (ja) 1999-11-08

Family

ID=12944150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3053485A Expired - Fee Related JP2974167B2 (ja) 1991-02-25 1991-02-25 文字の大分類認識方法

Country Status (1)

Country Link
JP (1) JP2974167B2 (ja)

Also Published As

Publication number Publication date
JPH05128312A (ja) 1993-05-25

Similar Documents

Publication Publication Date Title
US5335290A (en) Segmentation of text, picture and lines of a document image
US5410611A (en) Method for identifying word bounding boxes in text
US5854854A (en) Skew detection and correction of a document image representation
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US7233697B2 (en) Character recognition device and a method therefor
JPH05242292A (ja) 分離方法
JPH0772905B2 (ja) 記号列の認識方法
EP0381773B1 (en) Character recognition apparatus
JPH01253077A (ja) 文字列検出方法
US6532302B2 (en) Multiple size reductions for image segmentation
JP2005148987A (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
US5923782A (en) System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
JP2974167B2 (ja) 文字の大分類認識方法
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP3113769B2 (ja) 文字認識装置
JP2592756B2 (ja) 文字切り出し装置およびこれを用いた文字認識装置
US10878271B2 (en) Systems and methods for separating ligature characters in digitized document images
JP2918363B2 (ja) 文字分類方法及び文字認識装置
KR950011065B1 (ko) 문자 인식방법
CN117710985A (zh) 光学字符识别方法、装置及智能终端
JPH0573718A (ja) 領域属性識別方式
JPH03126188A (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees