JPH09138838A - 文字認識方法およびその装置 - Google Patents

文字認識方法およびその装置

Info

Publication number
JPH09138838A
JPH09138838A JP7297951A JP29795195A JPH09138838A JP H09138838 A JPH09138838 A JP H09138838A JP 7297951 A JP7297951 A JP 7297951A JP 29795195 A JP29795195 A JP 29795195A JP H09138838 A JPH09138838 A JP H09138838A
Authority
JP
Japan
Prior art keywords
line segment
character
segments
description
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7297951A
Other languages
English (en)
Inventor
Masaharu Kurakake
正治 倉掛
Yoshimasa Kimura
義政 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7297951A priority Critical patent/JPH09138838A/ja
Publication of JPH09138838A publication Critical patent/JPH09138838A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 多様なフォントの文字や変形の大きい手書き
文字の誤認識を除去する文字認識方法およびその装置を
提供する。 【解決手段】 まず、正規化した認識文字パターンのイ
メージデータを入力部1から入力する。次に、外郭線分
検出部2にてスキャン方向に対して予め定めた範囲内に
ある最初の文字線分を外郭線分として抽出し、セグメン
ト抽出部4にてその外郭線分の連結成分を線分セグメン
トとして抽出する。これを対象として、特徴抽出部5に
て形状抽出を行い、さらに線分セグメント間の相対位置
関係を関係記述および空白特徴として抽出して後続の認
識処理に反映させる。次に、辞書マッチング部7での認
識辞書との比較において、まず、空白特徴の数が一致す
る認識辞書エントリーを選択し、次に、その中から形状
記述および関係記述の類似度の高いものを認識結果とす
るという、2段階構成で文字認識を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、スキャナーあるい
はテレビカメラ等で入力された画像中から文字を認識す
る技術に関するものである。
【0002】
【従来の技術】従来の文字認識技術は、構造解析的手法
と統計的パターンマッチング手法に大別できるが、いず
れも認識対象文字パターンの特徴を認識辞書に登録され
ている各エントリーカテゴリーの特徴と比較して、最も
類似している文字カテゴリーを認識結果としている。
【0003】構造解析的手法の場合は(例えば、信学論
(D)、J65−D,No.5,pp.542−549
参照)、各エントリーカテゴリー毎に特有なストローク
構造を認識辞書に登録しておき、認識対象文字パターン
に対してそれらの特徴的ストローク構造の有無を調べて
認識する。また、ストローク構造ではなく、背景の構造
の有無を調べる方法もある。これらの方法では、各文字
線分(あるいはその反転である背景)の形状特徴を主た
る認識用特徴として用いており、文字線分間の空間的相
対位置関係は、文字領域を固定的な小領域に分割し、抽
出されたストローク構造がどの小領域に属するかという
情報を付加することにより、間接的にどのストローク構
造とどのストローク構造が空間的に隣接する位置に存在
するかということが分かるという形で反映されているに
すぎない。
【0004】統計的パターンマッチング手法の場合は
(例えば、信学論(D)、J76−D−2,No.9,
pp.1851−1859、J70−D,No.7,p
p.1390−1397、J66−D,No.10,p
p.1185−1192参照)、文字線分の輪郭線上で
の方向、あるいは文字線分内の点における縦・横・斜め
方向のランレングスの比等を特徴とし、各特徴の統計的
分布を反映した距離関数に基づき最も距離が小さい文字
カテゴリーを認識結果としている。これらの手法におい
ても、特徴間の相対位置関係を明確に表現する手段がな
く、文字領域を固定的な小領域に分割し、各小領域毎に
各画素で得られた特徴を集積した結果(平均をとる、あ
るいはヒストグラムの頻度)を改めて特徴ベクトルの要
素とすることで間接的に小領域内の特徴間の相対位置関
係を反映しているに留まり、属する小領域が異なる文字
線分の特徴間の相対位置関係については、距離関係の中
で使用される該当する共分散等で反映されるに過ぎな
い。
【0005】このように、従来の文字認識手法では、特
徴間の空間的相対位置関係を直接的に取り扱う手法がな
い。固定的な小領域分割法により特徴間の空間的相対位
置関係を間接的に反映させる場合にも、線分セグメント
が微少な文字形状変形のため隣接する小領域へと移動し
た場合には、特徴の上では大きく異なる結果となり、文
字線分間の相対位置関係を文字形状の変形に対して安定
に表現することができないという問題点があった。
【0006】
【発明が解決しようとする課題】上記した従来のいずれ
の文字認識方法においても、個々の文字線分の形状を主
たる特徴として取り扱い、各文字線分間の相対位置関係
は副次的特徴として用いるに留まっていた。そのため、
局所的な形状の把握は行うことができても文字全体の形
状を把握することが困難となり、多様なフォントの文字
や変形の大きい手書き文字を認識する際に誤認識する可
能性が高いという問題点があった。
【0007】本発明は、多様なフォントの文字や変形の
大きい手書き文字を誤認識しやすいという従来の文字認
識方法の欠点を除去する文字認識方法および文字認識装
置を提供することを目的としている。
【0008】
【課題を解決するための手段】上記の目的を達成するた
め、本発明では、入力された画像中から文字が書かれて
いる領域を一文字単位に切り出した文字イメージデータ
に対してそこから書かれている文字を認識する処理にお
いて、まず、文字イメージデータの外郭の文字線分を検
出し、次に、前記検出された文字線分の連結成分の中で
所定の範囲の連結成分をそれぞれ線分セグメントとして
抽出し、次に、前記抽出された各線分セグメントの位置
と形状を形状記述として記憶し、次に、所定の線上に射
影したとき隣り合う異なる前記線分セグメントの対の位
置が重なるか接する場合には当該両線分セグメントの前
記所定の線上に対する位置関係を関係記述として記憶
し、該線分セグメントの対の両線分セグメントの位置が
離れている場合には当該両線分セグメント間の空白部分
の位置を空白特徴として記憶し、次に、前記空白特徴を
用いて認識辞書と比較して認識辞書エントリーを選択
し、次に、前記選択された認識辞書エントリーの中で対
応する前記関係記述と形状記述の類似度が最も高い認識
辞書エントリーを認識結果として出力することを特徴と
する文字認識方法を手段とする。
【0009】また、本発明では、入力された画像中から
文字が書かれている領域を一文字単位に切り出した文字
イメージデータに対してそこから書かれている文字を認
識する処理において、まず、1以上のスキャン方向に対
して文字イメージデータの指定された外接枠からスキャ
ンを行い、次に、前記1以上のスキャン方向において最
初にぶつかる文字線分を検出し、次に、前記検出された
文字線分の連結成分の中でその全体あるいは一部があら
かじめ定めておいた範囲内に存在する連結成分をそれぞ
れ線分セグメントとして抽出し、次に、前記抽出された
各線分セグメントのスキャン開始点である外接枠側の輪
郭線の位置と形状を形状記述として記憶し、次に、前記
スキャン開始点である外接枠へ当該スキャンと逆方向に
射影したときに隣り合う異なる線分セグメントの対に対
して、前記スキャン開始点である外接枠へ当該スキャン
と逆方向に射影された当該両線分セグメントの位置が重
なるか接する場合には前記両線分セグメントの位置およ
びそのいずれが前記スキャン開始点である外接枠と近い
かを関係記述として記憶し、前記スキャン開始点の外接
枠へ当該スキャンと逆方向に射影された当該両線分セグ
メントの位置が離れている場合には前記両線分セグメン
ト間に空白があるとして前記外接枠上の両線分セグメン
トの射影上で相手に近い側の端点の間の位置を空白特徴
として記憶し、次に、前記1以上のスキャン方向に対し
て得られた前記形状記述、関係記述及び空白特徴を当該
文字イメージデータの特徴記述として認識辞書と比較す
る際に、前記スキャン方向毎に前記空白特徴の数が一致
する認識辞書エントリーを選択し、次に、前記選択され
た認識辞書エントリーの中で対応する前記関係記述と形
状記述の類似度が最も高い認識辞書エントリーの文字コ
ードを認識結果として出力することを特徴とする文字認
識方法を手段とする。
【0010】さらに、本発明では、入力された画像中か
ら文字が書かれている領域を一文字単位に切り出した文
字イメージデータを正規化して入力する入力手段と、1
以上のスキャン方向に対して文字イメージデータの指定
された外接枠からスキャンを行うスキャン制御手段と、
前記1以上のスキャン方向において最初にぶつかる文字
線分を外郭線分として検出する外郭線分検出手段と、前
記検出された外郭線分の連結成分の中でその全体あるい
は一部があらかじめ設定しておいた処理範囲内に存在す
る連結成分をそれぞれ線分セグメントとして抽出するセ
グメント抽出手段と、前記抽出された各線分セグメント
のスキャン開始点である外接枠側の輪郭線の位置と形状
を形状記述として抽出するとともに、前記スキャン開始
点である外接枠へ当該スキャンと逆方向に射影したとき
に隣り合う異なる線分セグメントの対に対して、前記ス
キャン開始点である外接枠へ当該スキャンと逆方向に射
影された当該両線分セグメントの位置が重なるか接する
場合には前記両線分セグメントの位置およびそのいずれ
が前記スキャン開始点である外接枠と近いかを関係記述
として抽出し、前記スキャン開始点である外接枠へ当該
スキャンと逆方向に射影された当該両線分セグメントの
位置が離れている場合には前記両線分セグメント間に空
白があるとして前記外接枠上の両線分セグメントの射影
上で相手に近い側の端点の間の位置を空白特徴として抽
出する特徴抽出手段と、認識辞書を格納する記憶手段
と、前記1以上のスキャン方向に対して得られた前記形
状記述、関係記述及び空白特徴を当該文字イメージデー
タの特徴記述として前記認識辞書と比較する手段であっ
て、前記スキャン方向毎に前記空白特徴の数が一致する
認識辞書エントリーを選択し、前記選択された認識辞書
エントリーの中で対応する前記関係記述と形状記述の類
似度が最も高い認識辞書エントリーの文字コードを認識
結果とする辞書マッチング手段と、前記認識結果を出力
する出力手段と、を備えることを特徴とする文字認識装
置を手段とする。
【0011】本発明に係わる文字認識方法および装置で
は、文字認識で用いる認識用特徴に文字線分の形状特徴
の他に連結成分の関係記述や空白特徴を用いることによ
り、各文字線分間の相対位置関係を認識処理に反映させ
て上記の目的を達成する。すなわち本発明では、文字認
識で用いる認識用特徴に、(1)あらかじめ定めておい
た範囲内にある最初の文字線分を対象としていること、
(2)線分セグメント間の相対位置関係を関係記述およ
び空白特徴として反映させていること、および、(3)
認識辞書との比較において、まず空白特徴の数が一致す
るものを選択し、その中から形状記述および関係記述の
類似度を用いるという2段階構成になっていることを最
も主要な特徴とする。
【0012】(1)では、あらかじめ定める範囲に基づ
いて特徴抽出の対象となる文字線分を選択している。例
えば、上記範囲を文字領域全体とすると、全ての文字線
分の中からスキャンの際に最初にぶつかる文字線分を特
徴抽出の対象とすることになる。上記範囲を文字領域内
の一部分とすると、スキャンの際に最初にぶつかる文字
線分の連結成分の内、この指定範囲に存在する文字線分
を含む連結成分を特徴抽出の対象とすることになり、文
字領域全体をみると着目するスキャンライン上に最外郭
文字線分があっても設定範囲内の最外郭文字線分と連結
していなければ特徴抽出の際に空白特徴が検出され、当
該文字線分が特徴抽出へ影響を与えないこととなる。こ
のことにより、他の文字線分の変形の影響を受けやすい
文字の中心位置付近の文字線分を無視し、より安定な周
辺部分の文字線分のみを選択的に特徴抽出へ反映させ
る。
【0013】(2)では、スキャン開始点である外接枠
へスキャンと逆方向に射影した隣り合う線分セグメント
対(2次元パターンとしてみると両線分セグメントは連
結ではない)に対して、射影された位置が重なりあう場
合および接する場合には、そのいずれがスキャン開始点
である外接枠と近いかという相対位置関係を関係記述と
して特徴へ抽出し、射影された位置が離れている場合に
は、線分セグメントが無い領域があることを示すため空
白特徴を抽出して、認識用の特徴とすることにより、ス
キャン方向およびそれと垂直の方向に対して線分セグメ
ント同士の相対位置関係を特徴に反映させている。この
ことにより、従来の文字認識手法では困難であった線分
セグメント間の相対位置関係の特徴への直接的反映を可
能にし、大局的な文字形状の把握を行えるようにする。
また、文字領域をブロックに分割しなくても相対位置関
係が特徴へ反映できるようにして、従来の文字認識手法
でしばしばみられる固定的なブロック分割法の悪影響を
除いている。
【0014】(3)では、認識辞書とのマッチングを2
段階で行う構成になっており、まず空白特徴の数が一致
するものを選択することで候補カテゴリーを絞り、次に
その中から各線分セグメントの形状や隣接する線分セグ
メント間の相対位置関係を比較して最も類似度が高い候
補カテゴリーを認識結果としている。空白特徴は、線分
セグメントを外接枠に射影した際に、他の線分セグメン
トとは位置が離れている場合に抽出され、外接枠へ線分
セグメントを射影した際の線分セグメント間の区切りを
示している。同じ空白特徴に挟まれた線分セグメント同
士を一つのまとまりとみなすと、空白特徴の数は、文字
全体の線分セグメントのまとまりの数に対応しており、
空白特徴の数が一致する辞書エントリーを候補カテゴリ
ーとして絞り込むことは、文字全体の大局的な線分セグ
メント構造が一致する辞書エントリーを候補カテゴリー
として選択する事を意味する。2段目の処理で、前段で
選択された候補カテゴリーの中から最終的な認識結果を
選ぶために形状記述および関係記述の類似度を用いるこ
とは、線分セグメント間の相対関係、さらには各線分セ
グメントの形状というように、順に局所的な線分セグメ
ント構造の類似性によって最終認識結果を求めているこ
とを意味する。以上のように、まず空白特徴の数が一致
するものを選択し、その中から形状記述および関係記述
の類似度を用いるという2段階構成で認識処理を行うこ
とにより、大局的な線分セグメント構造と局所的線分セ
グメント構造を分離して認識辞書とのマッチングを行
い、文字変形に対してより安定な大局的文字線分構造に
よる候補カテゴリーの絞り込みを先に行うことで、文字
変形に対してより安定な認識処理を行うことができるよ
うにしている。
【0015】
【発明の実施の形態】以下、本発明の実施の形態を、図
を用いて詳細に説明する。
【0016】図1は、この発明を実施する装置の構成の
一実施の形態例を示すブロック図である。この図1にお
いて、1は認識対象文字を入力する入力部、2はスキャ
ンの際に最初にぶつかる文字線分を検出する外郭線分検
出部、3は外郭線分検出部2で検出された外郭線分の内
で処理の対象とする範囲の設定をする処理範囲設定部、
4は外郭線分検出部2で検出された文字線分の連結成分
の中でその全体あるいは一部が処理範囲設定部3で設定
された処理対象範囲内に存在する連結成分をそれぞれ線
分セグメントとして抽出するセグメント抽出部、5は認
識に用いる特徴を抽出する特徴抽出部、6は、スキャン
を制御し、スキャンの方向を変更しながら外郭線分検出
部2へ処理を渡し、全設定スキャン方向終了後は次に述
べる辞書マッチング部7へ処理を渡すスキャン制御部、
7はスキャン制御部6で抽出された特徴と認識辞書との
マッチングを行い認識結果を決定する辞書マッチング
部、8は辞書マッチング部7で用いる認識辞書を蓄えて
おくメモリ、9は辞書マッチング部7で決定された認識
結果を出力する出力部、10は全体を制御する制御部で
ある。
【0017】本発明の特徴である特徴抽出部5と辞書マ
ッチング部7の一実施の形態例の詳細ブロック図を図
2、図3に示す。
【0018】図2は、図1の特徴抽出部5を実現する装
置の構成の一実施の形態例を示すブロック図である。こ
の図2において、51は図1のセグメント抽出部4で抽
出された全ての線分セグメントに対して特徴抽出の未処
理のものがあれば、次に述べる形状記述抽出部52に処
理を移し、全て特徴抽出処理済みであれば図1の辞書マ
ッチング部7へ処理を移す制御を行う特徴抽出部制御
部、52は線分セグメントの外接枠側の輪郭線の位置と
形状を形状記述として抽出する形状記述抽出部、53は
外接枠へ射影したときに隣り合う異なる線分セグメント
対に対して、外接枠に射影された両線分セグメントの位
置が重なるか接する場合には次に述べる関係記述抽出部
54へ処理を移し、外接枠に射影された両線分セグメン
トの位置が離れている場合にはその次に述べる空白特徴
抽出部55へ処理を移すセグメント対間係判定部、54
は外接枠に射影された場合に位置が重なるか接する線分
セグメント対の位置およびそのいずれかが外接枠と近い
かを関係記述として抽出する関係記述抽出部、55は外
接枠に射影された場合に位置が離れている線分セグメン
ト対の間に空白があるとして外接枠上の両セグメントの
射影の端点の間の位置を空白特徴として抽出する空白特
徴抽出部である。
【0019】図3は、図1の辞書マッチング部7を実現
する装置の構成の一実施の形態例を示すブロック図であ
る。この図3において、71は、図1の特徴抽出部5で
抽出された空白特徴の数をスキャン方向毎に図1のメモ
リ8に蓄えられた認識辞書の各エントリーと比較し、全
てのスキャン方向で空白特徴の数が一致する辞書エント
リーを選択する空白特徴比較部、72は空白特徴比較部
71で選択された辞書エントリーの中から図1の特徴抽
出部5で抽出された形状記述と関係記述と類似度が最も
高い辞書エントリーを認識結果として図1の出力部9に
渡す類似度計算部である。
【0020】図4は本発明の一実施の形態例の処理を説
明するためのフローチャートである。 この図4におい
て、41は辞書マッチングで用いる認識辞書を図1のメ
モリ8に読み込む過程である。
【0021】42は認識処理を継続するか終了するかを
判断する過程で、認識対象文字パターンが存在する場合
は過程43へ移り、認識対象文字パターンが存在しない
場合は認識処理を終了する。
【0022】43は認識対象文字パターンを入力する過
程であり、パターンを入力して正規化を行い、正規化パ
ターンを次に述べる処理過程44へ渡す。正規化は文字
認識で通常用いられる方法でよく、例えば、文字線分領
域画素の重心がパターンイメージの中心にくるように文
字線分全体を平行移動し、重心から各文字線分画素の2
次モーメントが、事前に決められた値となるように重心
を中心に文字線分全体を拡大/縮小する方法が考えられ
る。
【0023】44は、スキャン方向を制御する過程であ
り、未処理のスキャン方向がある場合は事前にきめられ
た順番に従ってスキャン方向を更新し過程45へ移り、
事前に決められた全てのスキャン方向に対して処理が済
んでいる場合は過程52へ移る。認識対象文字パターン
の領域が長方形である場合のスキャン方向の例を図5に
示す。この例では、文字領域外接枠の上下左右の4方向
をスキャン方向としている。
【0024】45は、上記過程44で指定されたスキャ
ン方向で対象文字パターンの外接枠からスキャンを行
い、最初の文字線分(外郭文字線分)を検出する過程、
46は、上記過程45で検出された外郭文字線分の連結
成分の中で連結成分全体、あるいはその一部が指定範囲
内に存在する連結成分をそれぞれ線分セグメントとして
抽出する過程である。
【0025】図6は過程45において検出する文字線分
の存在範囲の指定の例を示す。図6ではスキャン方向に
対して、line1よりスキャンを開始する外接枠に近
い場所から始まる文字線分、およびline2よりスキ
ャンを開始する外接枠に近い場所で終了する文字線分を
処理対象文字線分の存在範囲と指定している。図6にお
いて、上3つの文字線分はスキャンの開始点からlin
e1までに始点があるので処理の対象(○)とし、また
上から4番目の文字線分はline2までに終点がある
ので処理の対象(○)とするが、上から5、6番目の文
字線分はそのどちらにも該当しないので処理の対象外
(×)とする。
【0026】図7は、過程45、過程46の処理内容を
説明する図で、文字例「案」に対して(図7(a))、
外郭文字線分の検出結果(図7(b))と、線分セグメ
ント抽出結果(図7(c))を示している。
【0027】47は、特徴抽出処理を継続するか終了す
るかを判断する過程で、特徴抽出が未処理の線分セグメ
ントが存在する場合は過程48へ移り、特徴抽出が未処
理の線分セグメントが存在しない場合は過程44へ戻
る。
【0028】48は、抽出された線分セグメントに対し
て外接枠側の輪郭線の位置と形状特徴を形状記述として
抽出し記憶する過程である。形状特徴は通常の画像処理
で用いられる手法で抽出すればよく、例えば、輪郭線上
各点の曲率などが考えられる。図8は、線分セグメント
例(図8(a))に対して、左側からの方向をスキャン
方向として抽出した形状記述の対象となる輪郭線の例
(図8(b))を示す。
【0029】49は、外接枠へ射影したときに隣り合う
異なる線分セグメント対に対して、外接枠に射影された
両線分セグメントの位置が重なるか接する場合に該当す
るか、両線分セグメントの位置が離れている場合に該当
するかを判定する過程である。
【0030】50は、過程49で外接枠へ射影したとき
に隣り合う異なる線分セグメント対に対して、外接枠に
射影された両線分セグメントの位置が重なるか接する場
合に該当すると判定された当該両線分セグメントの位置
およびそのいずれが外接枠と近いかを関係記述として記
憶する過程である。
【0031】51は、過程49で外接枠へ射影したとき
に隣り合う異なる線分セグメント対に対して、外接枠に
射影された両線分セグメントの位置が離れている場合に
該当すると判定された両線分セグメント間に空白がある
として外接枠上の両セグメントの射影の相手に近い側の
端点の位置を空白特徴として記憶する過程である。
【0032】図9は、上記の過程50、過程51の内容
を説明する図であり、関係記述抽出例、空白特徴抽出例
を示す。この例では、スキャン方向に対して指定された
line1からline2までの処理対象文字線分の存
在範囲において、線分セグメント3と線分セグメント4
がスキャン開始外接枠(line1)へ射影したときに
隣り合う異なる線分セグメント対の位置が接する場合の
例であり、線分セグメント3が線分セグメント4よりス
キャン開始外接枠(line1)へ近いという関係記述
が抽出される。また、線分セグメント4と線分セグメン
ト5がスキャン開始外接枠(line1)へ射影したと
きに隣り合う異なる線分セグメント対の位置が離れてい
る場合の例であり、線分セグメント4と線分セグメント
5間の空白特徴が抽出される。
【0033】先に述べたように事前に決められた全ての
スキャン方向に対して過程45〜51の処理が済んでい
る場合は過程52へ移る。52は、認識辞書エントリー
の中から、前記過程で得られた空白特徴の数が一致する
のを選択する過程であり、53は過程52で選択された
辞書エントリーの中から関係記述と形状記述の類似度が
最も高い辞書エントリーの文字コードを認識結果として
出力する過程である。類似度の例としてはDPマッチン
グ等を用いればよい。
【0034】
【発明の効果】以上説明したように本発明は、(1)あ
らかじめ定めておいた範囲内にある最初の文字線分を特
徴抽出対象としていること、(2)線分セグメント間の
相対位置関係を関係記述および空白特徴として反映させ
ていること、および、(3)認識辞書との比較におい
て、まず空白特徴の数が一致するものを選択し、その中
から形状記述および関係記述の類似度を用いるという2
段階構成になっていることのため、文字変形に対してよ
り安定な外郭線分のみを特徴抽出の対象とすることがで
き、関係記述および空白特徴を用いることで文字線分間
の相対位置関係という大局的文字線分構造を特徴に反映
することができ、辞書マッチングにおいては大局的文字
線分構造による候補カテゴリーの絞り込みを先に行うこ
とで、文字変形に対してより安定な認識処理を行うこと
ができる。
【図面の簡単な説明】
【図1】本発明による装置の構成の一実施の形態例を示
すブロック図である。
【図2】上記構成の実施の形態例における特徴抽出部を
実施する装置の構成の一例を示すブロック図である。
【図3】上記構成の実施の形態例における辞書マッチン
グ部を実施する装置の構成の一例を示すブロック図であ
る。
【図4】本発明による文字認識処理の一実施の形態例を
説明するためのフローチャートである。
【図5】上記処理の実施の形態例における未処理スキャ
ン方向の有無判断過程の処理内容を補足する図であっ
て、認識対象文字パターンの領域が長方形である場合の
スキャン方向の例を示す図である。
【図6】上記処理の実施の形態例における外郭文字線分
検出過程の処理内容を補足する図であって、検出する文
字線分の存在範囲の指定の例を示す図である。
【図7】上記処理の実施の形態例における外郭文字線分
検出過程、線分セグメント抽出過程の処理内容を説明す
る図であって、(a)は文字例「案」、(b)はその文
字例「案」に対する外郭文字線分の検出結果、(c)は
セグメント抽出結果を示す図である。
【図8】(a),(b)は、上記処理の実施の形態例の
形状記述抽出過程における形状記述の対象となる輪郭線
の例を示す図である。
【図9】上記処理の実施の形態例における関係記述抽出
過程、空白特徴抽出過程の内容を説明する図であって、
関係記述抽出例、空白特徴抽出例を示す図である。
【符号の説明】
1…入力部 2…外郭線分検出部 3…処理範囲設定部 4…セグメント抽出部 5…特徴抽出部 6…スキャン制御部 7…辞書マッチング部 8…メモリ 9…出力部 10…制御部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力された画像中から文字が書かれてい
    る領域を一文字単位に切り出した文字イメージデータに
    対してそこから書かれている文字を認識する処理におい
    て、 まず、文字イメージデータの外郭の文字線分を検出し、 次に、前記検出された文字線分の連結成分の中で所定の
    範囲の連結成分をそれぞれ線分セグメントとして抽出
    し、 次に、前記抽出された各線分セグメントの位置と形状を
    形状記述として記憶し、 次に、所定の線上に射影したとき隣り合う異なる前記線
    分セグメントの対の位置が重なるか接する場合には当該
    両線分セグメントの前記所定の線上に対する位置関係を
    関係記述として記憶し、該線分セグメントの対の両線分
    セグメントの位置が離れている場合には当該両線分セグ
    メント間の空白部分の位置を空白特徴として記憶し、 次に、前記空白特徴を用いて認識辞書と比較して認識辞
    書エントリーを選択し、 次に、前記選択された認識辞書エントリーの中で対応す
    る前記関係記述と形状記述の類似度が最も高い認識辞書
    エントリーを認識結果として出力することを特徴とする
    文字認識方法。
  2. 【請求項2】 入力された画像中から文字が書かれてい
    る領域を一文字単位に切り出した文字イメージデータに
    対してそこから書かれている文字を認識する処理におい
    て、 まず、1以上のスキャン方向に対して文字イメージデー
    タの指定された外接枠からスキャンを行い、 次に、前記1以上のスキャン方向において最初にぶつか
    る文字線分を検出し、 次に、前記検出された文字線分の連結成分の中でその全
    体あるいは一部があらかじめ定めておいた範囲内に存在
    する連結成分をそれぞれ線分セグメントとして抽出し、 次に、前記抽出された各線分セグメントのスキャン開始
    点である外接枠側の輪郭線の位置と形状を形状記述とし
    て記憶し、 次に、前記スキャン開始点である外接枠へ当該スキャン
    と逆方向に射影したときに隣り合う異なる線分セグメン
    トの対に対して、前記スキャン開始点である外接枠へ当
    該スキャンと逆方向に射影された当該両線分セグメント
    の位置が重なるか接する場合には前記両線分セグメント
    の位置およびそのいずれが前記スキャン開始点である外
    接枠と近いかを関係記述として記憶し、前記スキャン開
    始点の外接枠へ当該スキャンと逆方向に射影された当該
    両線分セグメントの位置が離れている場合には前記両線
    分セグメント間に空白があるとして前記外接枠上の両線
    分セグメントの射影上で相手に近い側の端点の間の位置
    を空白特徴として記憶し、 次に、前記1以上のスキャン方向に対して得られた前記
    形状記述、関係記述及び空白特徴を当該文字イメージデ
    ータの特徴記述として認識辞書と比較する際に、前記ス
    キャン方向毎に前記空白特徴の数が一致する認識辞書エ
    ントリーを選択し、 次に、前記選択された認識辞書エントリーの中で対応す
    る前記関係記述と形状記述の類似度が最も高い認識辞書
    エントリーの文字コードを認識結果として出力すること
    を特徴とする文字認識方法。
  3. 【請求項3】 入力された画像中から文字が書かれてい
    る領域を一文字単位に切り出した文字イメージデータを
    正規化して入力する入力手段と、 1以上のスキャン方向に対して文字イメージデータの指
    定された外接枠からスキャンを行うスキャン制御手段
    と、 前記1以上のスキャン方向において最初にぶつかる文字
    線分を外郭線分として検出する外郭線分検出手段と、 前記検出された外郭線分の連結成分の中でその全体ある
    いは一部があらかじめ設定しておいた処理範囲内に存在
    する連結成分をそれぞれ線分セグメントとして抽出する
    セグメント抽出手段と、 前記抽出された各線分セグメントのスキャン開始点であ
    る外接枠側の輪郭線の位置と形状を形状記述として抽出
    するとともに、前記スキャン開始点である外接枠へ当該
    スキャンと逆方向に射影したときに隣り合う異なる線分
    セグメントの対に対して、前記スキャン開始点である外
    接枠へ当該スキャンと逆方向に射影された当該両線分セ
    グメントの位置が重なるか接する場合には前記両線分セ
    グメントの位置およびそのいずれが前記スキャン開始点
    である外接枠と近いかを関係記述として抽出し、前記ス
    キャン開始点である外接枠へ当該スキャンと逆方向に射
    影された当該両線分セグメントの位置が離れている場合
    には前記両線分セグメント間に空白があるとして前記外
    接枠上の両線分セグメントの射影上で相手に近い側の端
    点の間の位置を空白特徴として抽出する特徴抽出手段
    と、 認識辞書を格納する記憶手段と、 前記1以上のスキャン方向に対して得られた前記形状記
    述、関係記述及び空白特徴を当該文字イメージデータの
    特徴記述として前記認識辞書と比較する手段であって、
    前記スキャン方向毎に前記空白特徴の数が一致する認識
    辞書エントリーを選択し、前記選択された認識辞書エン
    トリーの中で対応する前記関係記述と形状記述の類似度
    が最も高い認識辞書エントリーの文字コードを認識結果
    とする辞書マッチング手段と、 前記認識結果を出力する出力手段と、 を備えることを特徴とする文字認識装置。
JP7297951A 1995-11-16 1995-11-16 文字認識方法およびその装置 Pending JPH09138838A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7297951A JPH09138838A (ja) 1995-11-16 1995-11-16 文字認識方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7297951A JPH09138838A (ja) 1995-11-16 1995-11-16 文字認識方法およびその装置

Publications (1)

Publication Number Publication Date
JPH09138838A true JPH09138838A (ja) 1997-05-27

Family

ID=17853205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7297951A Pending JPH09138838A (ja) 1995-11-16 1995-11-16 文字認識方法およびその装置

Country Status (1)

Country Link
JP (1) JPH09138838A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100357957C (zh) * 2004-08-10 2007-12-26 富士通株式会社 用于识别图像中的字符的字符识别装置和字符识别方法
KR101985612B1 (ko) * 2018-01-16 2019-06-03 김학선 종이문서의 디지털화 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100357957C (zh) * 2004-08-10 2007-12-26 富士通株式会社 用于识别图像中的字符的字符识别装置和字符识别方法
KR101985612B1 (ko) * 2018-01-16 2019-06-03 김학선 종이문서의 디지털화 방법

Similar Documents

Publication Publication Date Title
EP3702958B1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
JP3099797B2 (ja) 文字認識装置
JPH09138838A (ja) 文字認識方法およびその装置
JP2865528B2 (ja) 指紋照合装置
KR100300961B1 (ko) 최적얼굴영역추출방법및그에따른얼굴인식방법
JP2000076378A (ja) 文字認識方法
JPH05108806A (ja) 画像特徴抽出方法及びその装置
JP2925303B2 (ja) 画像処理方法及び装置
JPH07200735A (ja) 図形認識装置
JP2974857B2 (ja) 指紋辞書登録処理方式
JP2865529B2 (ja) 指紋照合装置
JPH051512B2 (ja)
JP2001060250A (ja) 文字認識方法および装置
JPH06131446A (ja) 指紋照合装置及び指紋照合方法
JPH0935058A (ja) 画像認識方法
JP3115139B2 (ja) 文字切り出し方法
JP2974396B2 (ja) 画像処理方法及び装置
JP2899159B2 (ja) 指紋照合装置
JPS622382A (ja) 画像処理方法
JP3006823B2 (ja) 文字および単語の認識方式
JP2865530B2 (ja) 指紋照合装置
JP2828820B2 (ja) 指紋照合装置
JPS62257583A (ja) 文字認識方式
JP2963474B2 (ja) 類似文字識別方法
JP2002245407A (ja) 認識候補文字棄却判定方法、文字認識装置及び認識候補文字棄却判定プログラム