JP2505605B2 - 文字パタ―ン切り出し装置 - Google Patents

文字パタ―ン切り出し装置

Info

Publication number
JP2505605B2
JP2505605B2 JP2013650A JP1365090A JP2505605B2 JP 2505605 B2 JP2505605 B2 JP 2505605B2 JP 2013650 A JP2013650 A JP 2013650A JP 1365090 A JP1365090 A JP 1365090A JP 2505605 B2 JP2505605 B2 JP 2505605B2
Authority
JP
Japan
Prior art keywords
character
rectangle
array
pattern
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013650A
Other languages
English (en)
Other versions
JPH03219382A (ja
Inventor
宣雄 朝日
一巳 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2013650A priority Critical patent/JP2505605B2/ja
Publication of JPH03219382A publication Critical patent/JPH03219382A/ja
Application granted granted Critical
Publication of JP2505605B2 publication Critical patent/JP2505605B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、文字列パターンから個々の文字パターン
を分離して切り出す文字パターン切り出し装置に関する
ものである。
[従来の技術] 文字パターンを認識するには、例えば、撮像した文字
列を光電変換し、文字の部分と背景の部分とをそれぞれ
“1"(黒画素に対応)と“0"(白画素に対応)の信号に
2値化した文字列パターンから個々の文字パターンを正
確に切り出さなければならない。
「文字認識概論」橋本新一郎編著第62頁〜第63頁(昭
和57年3月20日社団法人電気通信協会発行、オーム社発
売)に記載された従来この種の装置においては、1文字
の標準的な大きさに関する情報をフォーマット情報とし
て入力し、1文字づつ文字パターンを切り出す方式があ
る。しかし、この方式では、処理対象となる文字列パタ
ーンにノイズがのっている場合、このノイズを文字とし
て切り出したり、2つ以上の文字が接触している場合、
個々の文字を正しい位置で分離することが難しいなどの
問題点があった。
この問題点を解決するために、文字列パターンから求
めたヒストグラムの情報と、フォーマットとしてあらか
じめ与えられた文字配列のマスク情報とに基づいて文字
パターンの切り出し位置を決定する方式が提案されてい
る。
この提案された従来例の構成を第12図を参照しながら
説明する。
第12図は、例えば特願平1−115162号に示された従来
の文字パターン切り出し装置を示すブロック図である。
第12図において、従来の文字パターン切り出し装置
は、文字を光学的に走査して黒画素と白画素との2値か
らなる「文字列パターン」に変換する撮像手段(1)
と、この撮像手段(1)に接続され、撮像された1列分
の文字の画像情報である「文字列パターン」を2値化し
た信号として記憶する撮像画像記憶手段(2)と、この
撮像画像記憶手段(2)に接続され、撮像画像記憶手段
(2)に記憶された「文字列パターン」を文字の列方向
と直行する方向(例えば、横書きの文字列の場合は上下
方向)に走査し、この走査開始位置を列方向に沿ってず
らし、走査ごとに上記「文字列パターン」の黒画素の数
を計数して求められる「周辺分布値」を算出する周辺分
布値算出手段(3)と、フォーマット情報としてあらか
じめ与えられ、切り出す文字の配列を示す「マスク情
報」を格納する文字配列辞書記憶手段(4)と、上記周
辺分布値算出手段(3)及び文字配列辞書記憶手段
(4)に接続され、周辺分布算出手段(3)で求めた
「周辺分布値」と文字配列辞書記憶手段(4)に記録さ
れた「マスク情報」とを用いて文字配列を示すスクの位
置をずらしながら各マスク位置に対応する「文字配列評
価値」を算出して記憶する文字配列評価値算出手段
(5)と、この文字配列評価値算出手段(5)に接続さ
れ、文字配列評価値算出手段(5)で求めた「文字配列
評価値」の大きさに基づいて「切り出したマスク」を決
定し、決定した「切り出しマスク」の位置情報を用いて
個々の文字パターンの左端と右端の座標を決定する文字
配列決定手段(6)と、撮像画像記憶手段(2)及び文
字配列決定手段(6)に接続され、文字パターンの位置
情報に基づいて撮像画像記憶手段(2)に記憶された
「文字列パターン」から1個の文字に相当する文字パタ
ーンを切り出して出力する文字パターン切り出し手段
(7)とから構成されている。
つぎに、上述した従来例の動作を第13図に参照しなが
ら説明する。
第13図(A)〜(E)は、従来の文字パター切り出し
装置の動作を示す説明図である。
(A)図において、(8)は撮像して光電変換した黒
画素と白画素とによって表される「文字列パターン」で
あり、黒画素「*」、白画素を「・」にって表現してい
る。
(B)図において、(9)は文字列パターン(8)を
(A)図の上下方向に走査して各走査ごとの黒画素の数
を示した「周辺分布値」であり、グラフ化したものであ
る。
(C)図において、(10)は文字配列辞書記憶手段
(4)に格納されている「マスク情報」であり、分かり
易く表現したものである。
(D)図は、文字配列評価値算出手段(5)において
周辺分布値(9)及びマスク情報(10)を入力として
「文字配列評価値」を算出する方法を示している。
(E)図は、文字配列決定手段(6)によって、文字
列パターン(8)から切り出された文字パターンを示し
ている。
まず、撮像手段(1)によって読み取るべき文字を光
電変換し、文字の部分と背景の部分とにそれぞれ対応す
る文字列パターン(8)に変換する。この文字列パター
ン(8)は、上述したように、1列分の文字が2値の電
気信号として通常のメモリーからなる撮像画像記憶手段
(2)に2次元マトリクス状に記憶される。
次に、周辺分布値算出手段(3)によって、2次元メ
モリーの撮像画像記憶手段(2)内に記憶された文字列
パターン(8)を矢印(8c)の方向(Y軸方向)に走査
し、この方向の1列中に存在する文字の部分を表す黒画
素(8a)の数を計数する。この走査経路の始点を矢印
(8d)の方向(X軸方向)にずらし、矢印(8d)の方向
の各列について順次上下方向の走査を行い、黒画素の数
を度数とする周辺分布値()を求める。
文字配列評価値算出手段(5)では、文字配列辞書記
憶手段(4)にあらかじめ格納してあるマスク情報(1
0)と周辺分布値算出手段(3)によって算出した文字
列パターン(8)の周辺分布値(9)とを用いて「文字
配列評価値」を算出する。
ここで、マスク情報(10)はフォーマット情報として
あらかじめ与えるもので、読み取るべき文字配列の文字
部を示したものである。「文字配列評価値」は、このマ
スク情報(10)を文字列パターン(8)の周辺分布値
(9)に対して1画素づつ右へずらしながら、周辺分布
値(9)の黒画素数の内、ずらしたマスク(以後、この
ずらしたマスクを“ずらしマスク”と呼び、右からi画
素ずらしたマスクを“第iずらしマスク”と呼ぶ。)の
文字部に対応する黒画素の総数と文字部以外の領域に対
応する黒画素の総数との関数で定義される。
具体的には、第13図(D)に示すように、“第iずら
いマスク”に対する「文字配列評価値」は、文字部に対
応する周辺分布値(9)の黒画素の総数Pi(11)と、文
字部以外の領域に対応する周辺分布値(9)の黒画素の
総数Qi(12)から下記の式IのF(i)で求める。
F(i)=Pi−Qi …I 式Iで求まる文字配列評価値F(i)は、“第1ずら
しマスク”の文字部に文字列パターン(8)の黒画素が
多く含まれ、文字部以外の領域に存在する黒画素の数が
少ないほど大きな値をとる。
文字配列決定手段(6)では、文字配列評価値F
(i)が最大となる“ずらしマスク”を最適な切り出し
マスクとして検出する。最後に、文字パターン切り出し
手段(7)は、文字配列決定手段(6)から出力された
文字パターンの位置情報に基づいて、撮像画像記憶手段
(2)に記憶されている文字列パターン(8)から個々
の文字に相当する文字パターンを切り出す。
[発明が解決しようとする課題] 上述したような従来の文字パターン切り出し装置で
は、文字列パターンの左端からマスクを順次ずらしてい
き、文字配列評価値が最大となるマスクを切り出しマス
クとして採用し、この切り出しマスクにより、個々の文
字パターンを切り出している。このとき、マスクのずら
しは、マスクの文字部の長さの半分までに制限される。
なぜならば、マスクのずらしを文字部の長さの半分以上
に許すと、文字列パターンとマスクが1文字づつずれる
ところで評価値は再び極大をとり、文字切り出しに誤り
が生じる可能性があるからである。このため、処理対象
となる文字列パターンの左端に大きなノイズがのってい
る場合や、文字列パターンに枠が含まれている場合、ノ
イズや枠の左端に第0ずらしマスクを設定すると、上記
のマスクのずらし制限から、マスクが文字列イメージの
中の切り出すべき位置までずらすことができず、個々の
文字を正しい位置で分離できないという問題点があっ
た。
例えば、第14図(A)に示すように、文字列パターン
(13)に枠(13a)が含まれている場合には、文字列パ
ターン(13)を走査して求めた周辺分布値をグラフ化し
て示すと第14図(B)に示すグラフ(14)のようにな
る。ここで、例えば、第14図(C)に示すように、枠
(13a)の左端に第0ずらしマスクを設定すると、枠内
の文字列パターンの左端までマスクをずらすことが許さ
れないため、枠を含んだ位置で評価値が最大となり、文
字の切り出し位置に誤りが生じることがある。
また、第15図(A)に示すように、文字列パターン
(15)に大きなノイズ(15a)が含まれている場合に
は、文字列パターン(15)を走査して求めた周辺分布値
をグラフ化しして示すと第15図(B)に示すグラフ(1
6)のようになる。この場合は、周辺分布値を求める上
下方向の範囲が正確ではないので、文字数の異なる別の
マスクとの文字配列評価値の方が大きくなり、文字配列
の判定を誤る。
このように、従来の装置では、文字列パターンにノイ
ズがのっていたり、文字列パターンに枠が存在する場
合、このノイズや枠を文字として切り出し、個々の文字
が正しい位置で分離できないという問題点があった。
この発明は、上述した問題点を解決するためになさた
もので、文字列パターンにノイズがのっていたり、分離
文字が含まれている場合でも、1つ1つの文字を正しく
切り出すことができる文字パターン切り出し装置を得る
ことを目的とする。
[課題を解決するための手段] この発明に係る文字パターン切り出し装置は、列状に
配置された文字とその背景部分にそれぞれ対応した黒画
素と白画素の2値の画素からなる文字列パターンを2次
元マトリスク状に記憶する撮像画像記憶手段と、前記文
字列パターンを走査して黒画素が連結する領域を検出
し、その領域に外接する矩形を求めそれらの幅と高さ及
び座標情報を領域矩形テーブルに格納する領域矩形検出
手段と、切り出し対象の文字配列の標準幅、及び標準高
さを含む文字矩形情報、並びに文字配列マスク情報を予
め格納した文字矩形配列辞書記憶手段と、前記領域矩形
テーブルに格納された各領域矩形の幅と高さを前記文字
矩形情報中の前記標準幅と前記標準高さと比較すること
により、前記領域矩形テーブルから1文字矩形、接触文
字矩形、左右分離文字矩形、上下分離文字矩形を検出
し、それぞれ文字矩形候補として文字矩形候補テーブル
に格納する文字矩形候補検出手段と、前記文字矩形候補
テーブルに格納された文字矩形候補の中から予め矩形種
別毎に定めておいた優先度が最も高いものを選択して、
その各々を基準文字矩形群として検出する基準文字矩形
検出手段と、前記基準文字矩形群が存在する上下方向で
範囲で前記黒画素の数を求めて周辺分布値を算出周辺分
布値検出手段と、前記文字配列マスク情報及び前記周辺
分布値を用いて、前記各基準文字矩形と文字配列マスク
の各ブロックを対応させたときを基準としてずらしマッ
チングを行い前記周辺分布値との一致度を表す文字配列
評価値を算出する文字配列評価値算出手段と、前記文字
配列評価値が最大となるような文字配列マスクとの整合
位置を文字配列と決定する文字配列決定手段と、前記決
定された文字配列の情報に基づいて前記撮像画像記憶手
段に格納された文字例パターンから1文字づつ文字パタ
ーンを切り出す文字パターン切り出し手段とを備えたも
のである。
[作用] この発明においては、領域矩形検出手段によって、文
字列パターン中に存在する黒画素の領域の領域矩形が検
出される。
また、文字矩形候補検出手段によって、上記領域矩形
のうち文字矩形の候補が抽出され、これに基づいて基準
文字矩形検出手段によって標準文字矩形が検出されて、
周辺分布値算出手段によって周辺分布値の算出範囲が決
められる。
そして、文字配列評価値算出手段におけるマスクとの
ずらしマッチングで基準位置(開始位置)とするので、
文字列パターンにノイズがのったり、枠が含まれている
場合でも、個々の文字を正しく切り出すことができる。
[実施例] この発明の実施例の構成を第1図を参照しながら説明
する。
第1図は、この発明の一実施例を示すブロック図であ
り、撮像手段(1)〜周辺分布値算出手段(3)、文字
配列評価算出手段(5)〜文字パターン切り出し手段
(7)は上記従来装置のものと全く同一である。
第1図において、この発明の一実施例は、上述した従
来装置のものと全く同一のものと、撮像画像記憶手段
(2)に接続され、文字列パターンを走査し、黒画素の
領域を検出し、その外接矩形を「領域矩形テーブル」と
して出力する領域矩形検出手段(17)と、あらかじめ
「文字矩形情報」及び「文字配列マスク情報」が格納さ
れている文字矩形配列辞書記憶手段(4A)と、領域矩形
検出手段(17)及び文字矩形配列辞書記憶手段(4A)に
接続され、「領域矩形テーブル」を走査し、文字矩形配
列辞書記憶手段(4A)に格納しておいた「文字矩形情
報」と比較することにより文字矩形の候補を抽出し、
「文字矩形候補テーブル」として出力する文字矩形候補
検出手段(18)と、入力側がこの文字矩形候補検出手段
(18)及び文字矩形配列辞書記憶手段(4A)に接続さ
れ、かつ出力側が周辺分布値算出手段(3)に接続さ
れ、上記「文字矩形候補テーブル」と文字矩形配列辞書
記憶手段(4A)に格納されている「文字配列マスク情
報」とのマッチング処理のための基準とする「基準文字
矩形群」を検出する基準文字矩形検出手段(19)とから
構成されている。
つぎに、上述した実施例の動作を第2図〜第11図を参
照しながら説明する。
第1図において、撮像手段(1)、文字配列決定手段
(6)及び文字パターン切り出し手段(7)の動作は、
従来装置と同様であるのでここでは説明を省略する。
領域矩形検出手段(17)は、撮像手段(1)により2
値化した第2図に示す文字列イメージ(13)を走査し、
黒画素が4連結する領域をラベリングの手法を用いて検
出し、同一ラベルを受けた黒画素の領域に外接する矩形
を求め、第3図に示す「領域矩形テーブル」(20)に格
納する。この「領域矩形テーブル」(20)には、文字列
イメージ(13)から得られる各領域矩形の上下左右の座
標(TOP,BOTTOM,LEFT,RIGHT)及び矩形の幅と高さ(WID
TH,HEIGHT)が書かれている。
上記領域矩形検出手段(17)により得られた領域矩形
には、文字切り出しの対象とはならないノイズや枠が含
まれていたり、また、「北」や「元」などの分離文字は
2つの領域矩形に分離していたり、さらに、文字列イメ
ージ(13)において2つ以上の文字が接触している場
合、1つの領域矩形として検出されているものがある。
文字矩形候補検出手段(18)は、文字矩形配列辞書記
憶手段(4A)に格納されている「文字矩形情報」を用い
て、領域矩形テーブル(20)中から領域矩形から1文字
矩形、接触文字矩形、左右分離文字矩形及び上下分離文
字矩形を検出し、「文字矩形候補テーブル」に格納す
る。このとき、文字矩形候補とならわかった領域矩形
は、文字切り出しの対象とはならない矩形として破棄さ
れる。
第4図を用いて文字矩形候補を検出する方法を詳しく
説明する。
第4図において、「wi」及び「hi」は領域矩形テーブ
ル(20)中のi番目の矩形の幅と高さを表し、「W、
「H」及び「θ」は文字矩形配列辞書記憶手段(4A)に
格納されている「文字矩形情報」で、それぞれ標準幅、
標準高さ及びしきい値である。ここで、しきい値「θ」
は1より小さな値である。
第4図のステップ(21)の意味するところは、領域矩
形の大きさが標準に十分近いことを示し、すなわち、 {|wi−W|≦θ・W} &{|hi−H|≦θ・H} の条件を満たした矩形は1文字矩形とする。
ステップ(22)の意味するところは、領域矩形の高さ
は標準高さに十分近いが、幅が標準幅より大きいことを
示し、すなわち {wi>(1+θ)・W} &{|hi−H|≦θ・H} の条件を満たした矩形は接触文字矩形とする。
ステップ(23)の意味するところは、領域矩形の高さ
は標準高さに十分近いが、幅が小さいことを示し、すな
わち、 {wi<(1−θ)・W} &{|hi−H|≦θ・H} の条件を満たした矩形は左右分離文字矩形とする。
ステップ(24)の意味するところは、領域矩形の幅は
標準幅に十分近いが、高さが小さいことを示し、すなわ
ち、 {|wi−W|≦θ・W} &{Hi<(1−θ)・H} の条件を満たした矩形は上下分離文字矩形とする。
第3図の領域矩形テーブル(20)から検出した文字矩
形候補を第5図に示す。この第5図の例では、「東京動
物」と「公」の一部である「ノ」からなる矩形と、
「公」の一部である「、」と「園」からなる矩形とが接
触文字矩形、「公」の一部である「ム」が上下分離文字
矩形としてそれぞれ検出されている。
基準文字矩形検出手段(19)は、上述した文字矩形候
補検出手段(18)において検出された文字矩形候補に対
して、後の文字配列評価値算出手段(5)において文字
配列マスクとのマッチングをとる際にマスクをずらす基
準とする文字矩形である「基準文字矩形」を検出する。
この「基準文字矩形」の検出は、第6図に示すアルゴ
リズムによって行う。すなわち、文字矩形の属性によっ
て、1文字矩形、接触文字矩形、左右分離文字矩形の順
に優先度付けを行い、より優先度の高い文字矩形候補を
基準文字矩形とする。第5図の例では、1文字矩形が存
在しないので、、の接触文字矩形が基準文字矩形と
なる。
この後、周辺分布値算出手段(3)は、検出された基
準文字矩形群が存在する上下方向の範囲で従来の装置と
同様にして周辺分布値を算出する。第5図の例では、基
準文字矩形の上端の座標“26"と、基準文字矩形の
下端の座標“91"との範囲が走査範囲となり、第7図に
示すように、週辺分布値の算出範囲(25)と、その周辺
分布値(26)が得られる。
文字配列評価値算出手段(5)は、各基準文字矩形と
文字配列マスクの各ブロックを対応させたときを基準と
して従来例と同様にしてずらしマッチングを行い文字配
列評価値を求める。この例では、第8図に示すように、
各々の基準文字矩形(27)の左端(27a1)、(27a2)と
文字配列マスク(28)の各ブロックの左端(28a1)〜
(28a6)、各々の基準文字矩形(27)の右端(27b1)、
(27b2)と文字配列マスク(28)の各ブロックの右端
(28b1)〜(28b6)をそれぞれ対応させたときを基準と
して文字配列評価値を求める。
この後は、従来例と同様に上記文字配列評価値が最大
となる文字配列とその位置を決定し、個々の文字パター
ンの切り出しを行う。この例で、最終的に切り出した文
字パターンを第9図に示す。
この様に、文字配列マスク情報による文字切り出しを
行う前に、文字となる候補の検出及び基準文字の検出を
行うことにより、文字列パターン(イメージ)にノイズ
がのっていたり、枠が含まれている場合でも、正確に1
文字づつ文字パターンを切り出すことができる。
なお、上記実施例では文字矩形配列辞書記憶手段(4
A)の文字矩形情報及び文字配列マスク情報に単一の情
報のみを格納して文字を切り出す場合について説明した
が、上記文字矩形配列辞書記憶手段(4A)に複数種類の
文字矩形情報及び文字配列マスク情報を格納してこれら
の全情報を用いて切り出すことも可能であり、同様の動
作及び効果を期待できる。
また、上記実施の文字配列評価値を算出する式は、周
辺分布値を2値化したものを用いても所期の目的を達成
し得ることはいうまでもない。
さらに、文字配列カテゴリに文字の高さが異なるもの
がある場合は、文字列の高さで正規化すると精度が向上
する。また、文字カテゴリに第10図に示すように「竹ノ
塚」の「ノ」の様に、他の文字と異なる大きさの文字が
存在する場合は、マスクを2次元にし、マスク(29)内
の黒画素数を加え、マスク(29)の外接矩形(30)から
マスク(29)を除いた領域の黒画素数を減ずるように文
字配列評価値を設定すると精度が向上する。また、文字
配列カテゴリの文字数が異なる場合は、マスクの文字部
と背景部の領域の大きさで正規化すると、精度が向上す
る。さらに、背景部にも着目し、背景部に白画素がある
場合は白画素数を加え、文字部に白画素がある場合は白
画素数を減ずるように文字配列価値に追加、変更しても
良い。
ところで上記説明では、横書きの文字列に利用する場
合について述べたが、縦書きの文字列パターンから文字
パターンを切り出す場合にも利用できることはいうまで
もない。
この発明の一実施例は、上述したように、領域矩形検
出手段(17)で検出された文字列イメージの領域矩形に
ついて、文字の候補となる矩形を検出し、さらに基準矩
形を検出した上で、文字配列マスクと周辺分布値をマッ
チングさせて文字配列評価値を求めて文字パターンを切
り出すように構成したので、文字列イメージにノイズが
のっていたり、枠が含まれていたりしている場合でも正
しく文字を切り出すことができ、個々の文字を常に高い
精度で切り出すことができるという効果を奏する。例え
ば、従来例で困難であった第15図(A)に示す文字列パ
ターンに対しても、第11図に示すように、正しく文字を
切り出すことができる。
[発明の効果」 この発明は、以上説明したとおり、列状に配置された
文字とその背景部分にそれぞれ対応した黒画素と白画素
の2値の画素からなる文字列パターンを2次元マトリク
ス状に記憶する撮像画像記録手段と、前記文字列パター
ンを走査して黒画素が連結する領域を検出し、その領域
に外接する矩形を求めそれらの幅と高さ及び座標情報を
領域矩形テーブルに格納する領域矩形検出手段と、切り
出し対象の文字配列の標準幅、及び標準高さを含む文字
矩形情報、並びに文字配列マスク情報を予め格納した文
字矩形配列辞書記憶手段と、前記領域矩形テーブルに格
納された各領域矩形の幅と高さを前記文字矩形情報中の
前記標準幅と前記標準高さと比較することにより、前記
領域矩形テーブルから1文字矩形、接触文字矩形、左右
分離文字矩形、上下分離文字矩形を検出し、それぞれ文
字矩形候補として文字矩形候補テーブルに格納する文字
矩形候補検出手段と、前記文字矩形候補テーブルに格納
された文字矩形候補の中から予め矩形種別毎に定めたお
いて優先度が最も高いものを選択して、その各々を基準
文字矩形群として検出する基準文字矩形検出手段と、前
記基準文字矩形群が存在する上下方向の範囲で前記黒画
素の数を求めて周辺分布値を算出する周辺分布値算出手
段と、前記文字配列マスク情報及び前記周辺分布値を用
いて、前記各基準文字矩形と文字配列マスクの各ブロッ
クを対応させたときを基準としてずらしマッチングを行
い前記周辺分布値との一致度を表す文字配列評価値を算
出する文字配列評価値算出手段と、前記文字配列評価値
が最大となるような文字配列マスクとの整合位置を文字
配列と決定する文字配列決定手段と、前記決定された文
字配列の情報に基づいて前記撮像画像記憶手段に格納さ
れた文字列パターンから1文字づつ文字パターンを切り
出す文字パターンを切り出し手段とを備えたので、文字
列パターンにノイズがのっていたり、分離文字が含まれ
ている場合でも、1つ1つの文字を正しく切り出すこと
ができるという効果を奏する。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
はこの発明の一実施例の対象である文字列パターンを示
す説明図、第3図はこの発明の一実施例の領域矩形テー
ブルを示すテーブル図、第4図はこの発明の一実施例の
文字矩形候補を検出する方法を示すフローチャート図、
第5図はこの発明の一実施例の文字矩形候補を示すテー
ブル図、第6図はこの発明の一実施例の基準文字矩形を
検出するアルゴリズムを示すフローチャート図、第7
図、第8図、第9図、第10図及び第11図はこの発明の一
実施例の動作を示す説明図、第12図は従来の文字パター
ン切り出し装置を示すブロック図、第13図、第14図及び
第15図は従来の文字パターン切り出し装置の動作を示す
説明図である。 図において、 (1)……撮像手段、 (2)……撮像画像記憶手段、 (3)……周辺分布値算出手段、 (4A)……文字矩形配列辞書記憶手段、 (5)……文字配列評価値算出手段、 (6)……文字配列決定手段、 (7)……文字パターン切り出し手段、 (17)……領域矩形検出手段、 (18)……文字矩形候補検出手段、 (19)……基準文字矩形検出手段である。 なお、各図中、同一符号は同一、又は相当部分を示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】列状に配置された文字とその背景部分にそ
    れぞれ対応した黒画素と白画素の2値の画素からなる文
    字列パターンを2次元マトリスク状に記憶する撮像画像
    記憶手段と、 前記文字列パターンを走査して黒画素が連結する領域を
    検出し、その領域に外接する矩形を求めそれらの幅と高
    さ及び座標情報を領域矩形テーブルに格納する領域矩形
    検出手段と、 切り出し対象の文字配列の標準幅、及び標準高さを含む
    文字矩形情報、並びに文字配列マスク情報を予め格納し
    た文字矩形配列辞書記憶手段と、 前記領域矩形テーブルに格納された各領域矩形の幅と高
    さを前記文字矩形情報中の前記標準幅と前記標準高さと
    比較することにより、前記領域矩形テーブルから1文字
    矩形、接触文字矩形、左右分離文字矩形、上下分離文字
    矩形を検出し、それぞれ文字矩形候補として文字矩形候
    補テーブルに格納する文字矩形候補検出手段と、 前記文字矩形候補テーブルに格納された文字矩形候補の
    中から予め矩形種別毎に定めておいた優先度が最も高い
    ものを選択して、その各々を基準文字矩形群として検出
    する基準文字矩形検出手段と、 前記基準文字矩形群が存在する上下方向で範囲で前記黒
    画素の数を求めて周辺分布値を算出する周辺分布値算出
    手段と、 前記文字配列マスク情報及び前記周辺分布値を用いて、
    前記各基準文字矩形と文字配列マスクの各ブロックを対
    応させたときに基準としてずらしマッチングを行い前記
    周辺分布値との一致度を表す文字配列評価値を算出する
    文字配列評価値算出手段と、 前記文字配列評価値が最大となるような文字配列マスク
    との整合位置を文字配列と決定する文字配列決定手段
    と、 前記決定された文字配列の情報に基づいて前記撮像画像
    記憶手段に格納された文字列パターンから1文字づつ文
    字パターンを切り出す文字パターン切り出し手段と を備えたことを特徴とする文字パターン切り出し装置。
JP2013650A 1990-01-25 1990-01-25 文字パタ―ン切り出し装置 Expired - Fee Related JP2505605B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013650A JP2505605B2 (ja) 1990-01-25 1990-01-25 文字パタ―ン切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013650A JP2505605B2 (ja) 1990-01-25 1990-01-25 文字パタ―ン切り出し装置

Publications (2)

Publication Number Publication Date
JPH03219382A JPH03219382A (ja) 1991-09-26
JP2505605B2 true JP2505605B2 (ja) 1996-06-12

Family

ID=11839103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013650A Expired - Fee Related JP2505605B2 (ja) 1990-01-25 1990-01-25 文字パタ―ン切り出し装置

Country Status (1)

Country Link
JP (1) JP2505605B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63208990A (ja) * 1987-02-26 1988-08-30 Mitsubishi Electric Corp 文字パタ−ン切り出し装置

Also Published As

Publication number Publication date
JPH03219382A (ja) 1991-09-26

Similar Documents

Publication Publication Date Title
JP2835274B2 (ja) 画像認識装置
US9158986B2 (en) Character segmentation device and character segmentation method
EP1061469B1 (en) Method and apparatus for selecting text and/or non-text blocks in a stored document
Shivakumara et al. An efficient edge based technique for text detection in video frames
US9324001B2 (en) Character recognition device and character segmentation method
US20040020989A1 (en) Two-dimensional code reading apparatus, two-dimensional code reading process, two-dimensional code reading program and recording medium for said program, portable terminal and digital camera
JP2001109895A (ja) 複数のディジタル画像の処理方法
JPH05242298A (ja) 記号列の認識方法
US5081690A (en) Row-by-row segmentation and thresholding for optical character recognition
US6473524B1 (en) Optical object recognition method and system
JPH09311905A (ja) 行検出方法および文字認識装置
EP0717365B1 (en) Linear line detection apparatus using projection image of character string including linear line
JP2505605B2 (ja) 文字パタ―ン切り出し装置
JP2898562B2 (ja) ナンバープレート決定方法
JP5624702B2 (ja) 画像特徴量算出装置および画像特徴量算出プログラム
JP4228592B2 (ja) 文字認識装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JP3442847B2 (ja) 文字読取装置
JP2861860B2 (ja) 宛名行抽出装置
JP2827960B2 (ja) 宛名行抽出装置
JP2000357287A (ja) ナンバープレート認識方法および認識装置
JP3957471B2 (ja) 分離文字列統合装置
JPH07160810A (ja) 文字認識装置
JP2723075B2 (ja) 表認識装置及び表枠線の途切れ補間方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees