JPH02264385A - パターンの切り出し方法 - Google Patents

パターンの切り出し方法

Info

Publication number
JPH02264385A
JPH02264385A JP1084716A JP8471689A JPH02264385A JP H02264385 A JPH02264385 A JP H02264385A JP 1084716 A JP1084716 A JP 1084716A JP 8471689 A JP8471689 A JP 8471689A JP H02264385 A JPH02264385 A JP H02264385A
Authority
JP
Japan
Prior art keywords
black pixel
block
character
pattern
representative value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1084716A
Other languages
English (en)
Inventor
Takayuki Fujikawa
藤川 孝之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP1084716A priority Critical patent/JPH02264385A/ja
Publication of JPH02264385A publication Critical patent/JPH02264385A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、例えば光学文字読み取り(OCR)等による
文字認識装置の文字パターン等の切り出し方法に関する
ものである。
〔発明の概要〕
本発明は、パターン列をスキャンしてパターンを構成す
る画素の連続した画素列を検出し、他の画素列と所定の
連結条件を満たさないとき画素列に対してブロック識別
情報及び代表値を付与し、連結条件を満たすとき画素列
を1つのブロックにまとめ、代表値を更新することによ
り、文字の書体に関係なく文字パターンを切り出すこと
のできる方法を提供するものである。
〔従来の技術〕
従来の文字認識装置に用いられる文字パターンの切り出
し方法においては、例えば文字認識の対象ファイルの白
黒の2値化されたイメージ読み取りデータから行方向の
ヒストグラムをとって文字列信号を切り出し、この切り
出された文字列信号(各行)に対して行方向と直角方向
のヒストグラムをとって各文字に対応する矩形領域を切
り出すことで文字の認識を行っている。
上述の方法の場合、例えば、和文文字(漢字、かな文字
等)を含んでいる印刷文書の文字列から各文字を認識す
る場合、一般に和文文字は一文字一文字が略完全に分離
されているために、文字認識が行い易い、ただし、和文
文字特有の問題として、いわゆる分離文字(例えば、r
川」、「い」等)を正確に認識する必要があるが、本件
出願人が先に開示する例えば特開昭62−74181号
公報、或いは特開昭62−74184号公報等に記載さ
れた技術により解決可能である。
〔発明が解決しようとする課題〕
これに対して、アルファベット文字、ギリシャ文字、数
字文字等でなる文字(これを英文文字と呼ぶ)も、実用
上1図形1文字を前提条件として文字信号を切り出すこ
とができる。しかし、英文文字列の場合は、各語間以外
は文字間隔が比較的狭いために、原稿読み取り部から出
力されるイメージ読取データメ基づいて和文文字と同様
の手法で読み取ることができるとは限らず、例えば第2
図に示すイタリック体の英文文字(“F6”の部分)の
ように隣合う2つの文字が互いに重なっているか或いは
接触している文字を正確に分離して切り出すことができ
るようにする必要がある。
このように、隣合う2つの文字が互いに重なっているか
或いは接触している場合に文字の認識を確実に行える方
法はあまり無いが、隣合っている文字が接触している場
合の文字vA識については、例えば前述した特開昭62
−74181号公報、或いは特開昭62−74184号
公報等に記載された技術により解決可能である。しかし
、特に重なった文字を正しく切り出すことについては提
案されていない。
本発明は、上述のような実情に鑑みて提案されたもので
あって、普通の英文は勿論のこと、イタリック体、添字
、文字間の狭い文字列(文字パターン列)或いは文字の
重なった文字列等の書体に関係なく文字パターンを正確
に切り出すパターンの切り出し方法を提供することを目
的とするものである。
〔課題を解決するための手段〕
本発明のパターンの切り出し方法は、上述の目的を達成
するために、第1図及び第2図に示すように、パターン
列を所定領域り内の任意のn番目の走査領域内で一定方
向(Y軸方向)に走査してパターンを構成する画素の連
続するものから成る画素列(黒画素ライン)Lを検出す
る工程(ステップSl)と、上記ステップS1の工程に
より検出された画素列について、他の画素列との関係が
所定の連結条件(例えば8連結結合条件)を満たすか否
かをステップS2で判別し、該連結条件を満たさない(
No)とき、上記検出された画素列に対してブロック識
別情報及び代表値を付与する工程(ステップS3)と、
上記ステップS2で連結条件を満たす(Yes)と判別
されたとき、上記他の画素列と上記検出された画素列を
1つのブロック(黒画素ブロック)Bにまとめ、代表値
を更新する工程(ステップS4)とからなることを特徴
とするものである。
ここで、上記パターンとは、前述の文字パターンのよう
に2次元的に表されるもので、例えば英文文字、和文文
字、数字、記号等を含むものである。
〔作用〕
本発明によれit、所定の連結条件を満たした画素を1
つのブロックとしており、別のブロックの画素に対して
所定の連結条件を満足すれば、ブロックの代表値を更新
し、連結する画素より成る文字パターンをブロック化し
ているため、各ブロックの分離等が容易に行える。
〔実施例〕
以下、本発明の実施例について図面を参照しながら説明
する。
先ず、第3図に示すように、文字認識の対象となる原稿
ARからスキャナにより取り込まれた文字認識対象ファ
イルに対して、行方向の切り出しを行う、すなわち、上
記原稿ARの左上を基準の原点0としてY軸方向とX軸
方向の座標系をとり、以下切り出された行の始点01.
のY座標の値をyl、、X座標の値をX□とし、その文
字の行の幅すなわち所定領域をhとする。この始点O□
から上記所定領域りの範囲内で文字等のパターンの切り
出しが開始される。なお、上述の説明においては、説明
を容易化するために原稿ARに対して切り出し走査を行
っている様に説明しているが、実際には原稿ARから読
み取られた画像データファイルに対して処理が行われて
おり、以下の説明も同様である。
ここで、第2図において文字等の2次元パターン列を所
定領域りの行内で上記パターンの切り出し開始点0□か
ら一定方向(Y軸方向)に走査して、この−走査領域の
走査終了後にX軸方向に走査領域を1つずらして順次走
査して行く、また、パターンを構成する上記−走査領域
内の例えば黒色の画素(黒画素)の同−X座標上でY軸
方向に連続したものを1つのまとまりと見なして黒画素
ラインと呼ぶことにし、この黒画素ラインを検出する。
また、上記黒画素ラインのY軸方向の始点及び終点の座
標値(Y座標の座標値y)・を記録。
保持していく、すなわちパターンの切り出し開始点O1
,から走査してn番目(nは自然数)の走査を行った際
のX座標(x=n)において、そのn番目のX座標上の
Y軸方向に存在する最初の黒画素ラインLs(n)の始
点の座標を5t(n、yo)、終点の座標をad(n、
ys)とし、さらに座標値Xが同じで座標値yが異なっ
た黒画素ラインすなわちY軸方向で次の黒画素ラインL
 、 (n)が存在すれば、その始点及び終点の座標を
5t(n+y+)+ed(n+y+)としてい(。
すなわち、一般に、x”nのX座標上で黒画素ラインが
m個存在するとき、(st(n+yo)、ed(n、y
o))+(at(n+L) +ed(n+y+)) +
 ・・+ (st(n+ya−+) +ed(n+ys
−t))なる黒画素ラインの集合ができる。これらのm
個の各黒画素ラインのそれぞれに順次通し番号0〜m−
1を付けて黒画素ラインL e (n) 〜L a−1
(n)とする。
次に、このような任意のn番目の走査領域の各黒画素ラ
インLo(n)〜L aa−+ (n)について、隣接
する走査領域、例えばn−1番目の走査領域の各黒画素
ラインとの間の連結条件を調べる。この連結条件として
、いわゆる8連結路合条件を採用する場合について説明
する。すなわち、この8連結路合条件とは、上記n番目
の走査領域内の任意の黒画素ラインL、(n)と、上記
n−1番目の走査領域内の任意の黒画素ラインL、 (
n−1)との間で、(st(n−1,yr)−1)≦e
d(n、yJ≦(ed(n−1,yr)+LL・(1)
または、 (st(n−1,yr)−1)≦5t(n、yJ≦(e
d(n−1,yr)+1)・・−(2)(q=0.1.
・・・・、ト1) (r・0,1.・・・・) を満足するとき、上記黒画素ラインL、(n)とL7(
n−1)とを連結するような条件である。
ここで、上記黒画素ラインL、(n)が隣接するn−1
番目の走査領域の黒画素ラインのいずれとも上記8連結
路合条件を満たさないとき、この黒画素ラインL、(n
)より新しい黒画素ブロックが始まると見なし、ブロッ
ク識別情報として例えばブロックが異なる毎に1つずつ
増加するようなブロック通し番号を新たに付与する。ま
た、代表値として、例えば後述する外撥方形に上、下、
左。
右の端部の座標値を付与する。
また、上記黒画素ラインLq (n)とり、 (n−1
)が上記8連結路合条件を満たすとき、これらをまとめ
て1つの黒画素ブロックとする。このまとめられた黒画
素ブロックに対し、ブロック識別情報として例えば前の
黒画素ラインL、 (n−1)の上記ブロック通し番号
をそのまま用い、代表値は変更する。なお、この時の黒
画素ブロックに付与する番号は例えば最も若い番号か或
いは他の番号を付与してもよい。
また、上述のように、黒画素ライ、ンが連結されて構成
された黒画素ブロックと、別の黒画素ラインが連結され
て構成された黒画素ブロックとが連結されるような場合
、すなわち、異なるブロック識別情報を有する2以上の
黒画素ブロックが連結する場合、連結時に与えられるブ
ロック通し番号は、例えば、これらのうちの最も若いブ
ロック通し番号が与えられる。或いは、連結される黒画
素ブロックのうちの最も大きいブロック通し番号であっ
てもよい、また、未使用の新たな番号を付してもよい。
次に、n番目の走査領域とn+を番目の走査領域との間
の上記8連結路合条件を見るとき、n番目のX座標上で
の黒画素ラインのうち、所定の黒画素ラインL、(n)
が上記第1式、第2式の関係を満足しないならば、該黒
画素ラインL、(n)に対しては、この黒画素ラインL
q(n)をもって黒画素ブロックが終了したと見なし、
黒画素ブロックの属性(各識別情報及び代表値、黒画素
ブロックが1本の黒画素ラインだけで形成された時は当
該黒画素ラインの番号)を保持し、黒画素ブロックの抽
出を完了する0例えばn+1番目のX座標、上に黒画素
ラインが1つも存在しない場合、n番目のX座標上で黒
画素ブロックが終了したと見なし、その識別情報及び代
表値の属性を保持して黒画素ブロックの抽出を終了する
ここで、検出されな各黒画素ラインの連結状態に応じた
ブロック化処理の具体例について以下にのべる。
先ず、上記パターンの切り出し開始点01.から順次走
査してい(場合、上述したように、X座標上のY軸方向
の走査の0〜に−1までの走査では上記黒画素ラインが
検出されておらず、x=にで初めて1以上の黒画素ライ
ンが検出されたものとする。
すなわち、最初にに番目のX座標上の黒画素ラインLm
(k)が走査されることになる。したがって、上記黒画
素ラインL*(k)は、他の黒画素ラインすなわち当該
に番目のX座標の走査の前に走査されるx−に−1の座
標における黒画素ラインがないため、所定の連結条件で
ある前述した8連結路合の条件を満たさないことになる
。そこで、この最初の黒画素ラインL*(k)を黒画素
ブロックB0とし、ブロック識別情報としてのブロック
通し番号(例えばO)及び代表値を付与する。この代表
値としては、例えば左端座標値XLO,右端座標X、O
上端座標(1vuo、下端座標値YLoが用いられ、′
上記x=にの走査領域の処理が終わった段階では、Xt
O=X纜0=に、 YIIO=st(k+3’*)、Y
J’aedCk*’Ja)となっている。
次に、k+1番目のX座標上に対しても同様に黒画素ラ
インLs(k+1)を調べる。ここで、該黒画素ライン
L・(k+1)と上述したに番目のX座標上の黒画素ラ
インLe(h)が上記連結条件(8連結路合条件)を満
足するとき、該黒画素ラインL、(k+1)と黒画素ラ
インLm(k)とを1つにまとめたブロックすなわち黒
画素ブロックB、と見なし、ブロック識別情報は0のま
まで代表値を更新する。この更新された代表値は、図示
のχ−に+1の走査領域の処理が終わった段階で、左端
座標値X Lo、t+、右端座標X *O−に+1 、
上11!E標値YgO−st(k+1.ye)、下端座
標値YIO−ed(k、ye)となる、このように、X
座標をずらしながら走査及び走査に伴う前述したような
一連の動作を行う。
次に、k+2番目の走査時には、8連結路合条件を満た
さない黒画素ラインLe(k+2)と、上記8連結路合
条件を満たす黒画素ラインL + (k+2)とが得ら
れている。ここで、上記8連結路合条件を満たさない黒
画素ラインL a (k+2)から新しい黒画素ブロッ
クBIが始まるとみなし、ブロック識別情報として、次
のブロック通し番号lを付与する。
この黒画素ブロックB+の代表値は、左端座標値XLI
と右端座標Xmlが共にに+2となり、上端座標値Yu
l*5t(k+2.ys)、下端座標値Ytl=ed(
k+2゜ν、)となる、また、上記8連結路合条件を満
たず黒画素ラインL + (k+2)は、前述同様に黒
画素ブロックB、にまとめられるため、代表値が更新さ
れて左端座標値XLO−k、右端座標X、O・k+2、
上端座標値YuO−st(k÷2.y+)、下端座標値
YtO冨ed(k、ye)となる。
このような走査を順次行って、第2図におけるに+8番
目の走査領域を走査し、検出された黒画素ラインLl(
k+8)の上記8連結路合条件を調べると、k+7番目
の黒画素ラインのLJk+7)とり。
(k+7)とが上記黒画素ラインL * (k+8)に
対して連結されることになる。ここで、上記黒画素ライ
ンLe(k+7)は黒画素ブロックB+にまとめられて
おり、上記黒画素ラインL + (k+7)は黒画素ブ
ロックB、にまとめられているため、前述したように、
これらの黒画素ブロックB0と81とが1つにまとめれ
られると共に、連結時に与えられるブロック通し番号は
、例えば、これらのうちの最も若いブロック通し番号す
なわち図示の例ではOが与えられて黒画素ブロックB、
とされる。なお、この場合も前述同様に最も大きいブロ
ック通し番号として例えばlが与えられてもよく、未使
用の新しい番号を使用してもよい、また、代表値も前述
同様に更新されるため、左端座標値X LO,k、右端
座標X*0=に+8 、上端座標値YuO−st(k+
2+ye)、下端座標値YtO□ed(k+y*)とな
る。
以上、上述のステップを第2図の各文字″ye    
s   “L” ・・・・のそれぞれに対して繰り返し
行い、ブロックに関連するデータが第4図のブロックテ
ーブルBTI、ブロックテーブルBT2.・・・・・・
、ブロックテーブルBTeの代表値(左端座標値XL+
右端座標値XI、上端座標値Yu+下端座標値YL)や
ブロック識別情報(上記ブロック通し番号)で示すデー
タの内部表現(データ構造)の形で例えばメモリ等に貯
蔵される。すなわち、これら各黒画素ブロックは、その
上記識別情報及び代表値等の属性をテーブルの形態で保
持しており、抽出された順番でリスト構造の形で、すな
わち、前のブロックテーブルのポインタにより次のブロ
ックテーブルを指示するような形で各属性が管理されて
いる。なお、本手法ではすべて行毎に文字が管理される
このようなブロック化を実行することにより、以下に説
明するような統合処理や重なり文字の分離が有効に行え
るようになる。
すなわち、上述のような切り出し方法では、特にriJ
、「j」、「?」、「:」等の文字は、2つ以上の黒画
素ブロックとして別々に抽出されるので、強制的に各黒
画素ブロックを統合させる必要がある。そこで、複数の
黒画素ブロックからなる文字を各黒画素ブロック間の相
対位置関係や黒画素ブロック自体の大きさ等の情報をも
とに、以下に示す5通りすなわち、 i−タイプ・・・・・・・・・ i、1等ニータイプ・
・・・・・・・・ :、;等!−タイプ・・・・・・・
・・ !、?等−タイブ・・・・・・・・・ 、′″等
%−タイプ・・・・・・・・・%等 に分け、強制統合を図る。
また、上述の5通りの強制統合とは別に、例えば“y”
が第5図に示すようにカスした文字となったことにより
形成された2つの隣合った黒画素ブロックB、、B、に
対して、包含の度合いに応じて統合処理を施す、すなわ
ち、最初に抽出された外接方形の黒画素ブロックB、の
上下左右端をYak、 YtO+ XLO,XIO、次
の外接方形の黒画素ブロックB、の上下左右端をYul
、 YLl、 XLI、 Xっ1とし、α〉0.β>O
,r >O,δ〉0を包含の度合いを表すパラメータと
する時、XLO+α>XLIかつYtO−β< Y L
 1または、LO−r<X*1かつYuO+δ> Y 
a 1を満足するならば、この2つの黒画素ブロックを
統合する。
なお、統合された黒画素ブロックの上下左右端の座標を
求め、この黒画素ブロックには例えば前述したように、
2つの黒画素ブロックのブロック通し番号の若い番号を
与え、リストにおいて2つの黒画素ブロックのデータを
除去し、また、統合された黒画素ブロックの属性データ
を挿入する。
また、2つの黒画素ブロックに与えるブロック通し番号
は前述同様に例えば最も大きな番号或いは未使用の番号
であってもよい。
上述のように統合処理を施した後、各文字の上下左右端
の座標値にしたがって文字の切り出しを行っても、特に
イタリック体等の場合、第6図aに示す文字の外接方形
10のように文字の外接方形10内に左右の文字の黒画
素部が中に入り込んでしまう場合が起こる。そこで両隣
の文字が1画素以上左右方向に重なる時、不要文字の黒
画素ラインを除去する作業を行う、各抽出された文字に
は、各行毎に黒画素ラインの通し番号、黒画素ブロック
の代表値を持つ0例えば第2図の文字“yでは、各黒画
素ラインが通し番号の0と1とのいずれかとなっており
、黒画素ブロックの識別情報としては0を保持している
。したがって、外接方形10内で黒画素ラインの通し番
号Oと1以外の値をもつ黒画素ラインを順次消去してい
けばよい。
或いは黒画素ブロックB、とB1とを残1し、黒画素ブ
ロックB、の値を持つ黒画素ラインを消去することによ
り、第6図すに示す外接方形11のように黒画素ブロッ
クB、(とBl)から成るパターン(“y”の文字)の
みが残る。除去作業が終了した第6図すのパターンにつ
いては、パターン識別部或いは文字認識部に渡して認識
を行うわけである。
なお、本実施例においては、辞書は例えば29種類のフ
ォント(字形)をベースに構築しであるが、その辞書に
対して識別を行わせた結果、リジェクト文字が生じた場
合、後でそのリジェクト文字パターンを参照しながら辞
書として追加登録できる。したがって基本的に辞書が全
(用意されていない場合でもかまわない0本実施例では
、辞書登録文字数1302で打ち切った辞書に対して、
任意の雑誌、製本より抽出した文字サンプルを実験材料
として識別させた結果99.4%以上のvl識率が得ら
れた。したがって本実施例においては重なった文字パタ
ーンが正確に認識可能となる。
〔発明の効果〕
本発明によれば、所定の連結条件を満たした画素列を1
つのブロックとし、ブロックの代表値を更新している。
このようにブロック化して分離統合を実現しているため
、普通の英文は勿論のこと、イタリック体、添字、文字
間の狭い文字や重なった文字等の書体に関係なく文字等
の2次元パターンを切り出すこが可能となった。
【図面の簡単な説明】
第1図は本発明のパターンの切り出し方法の基本動作を
説明するフローチャート、第2図はパターンの切り出し
を説明するための概略平面図、第3図は原稿からの行(
パターン列)の切り出しを説明するための概略平面図、
第4図はノくターン切り出しデータのブロック化データ
構造を示す図、第5図はカスした文字の切り出しの際の
ブロックの統合処理を説明するための概略平面図、第6
図はパターンの外接方形を示す概略平面図である。 AR・・・・・・・・原稿 B、〜B、・・・・・黒画素ブロック 10.11・・・・・外接方形 L 5(k) 、 L *(k+1) 、 L e(k
+2)、 L * (k÷2)、L*(nLL r (
n) + L t(fl) * L e(k+7) l
 L l(k+7) 、L s(k+8)・・・・・・
・・・・黒画素ライン 第5図

Claims (1)

  1. 【特許請求の範囲】 パターン列を所定領域内で一定方向に走査してパターン
    を構成する画素の連続するものから成る画素列を検出す
    る工程と、 上記工程により検出された画素列について、他の画素列
    との関係が所定の連結条件を満たさないとき、上記検出
    された画素列に対してブロック識別情報及び代表値を付
    与する工程と、 上記連結条件を満たすとき、上記他の画素列と上記検出
    された画素列を1つのブロックにまとめ、代表値を更新
    する工程とからなることを特徴とするパターンの切り出
    し方法。
JP1084716A 1989-04-05 1989-04-05 パターンの切り出し方法 Pending JPH02264385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1084716A JPH02264385A (ja) 1989-04-05 1989-04-05 パターンの切り出し方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1084716A JPH02264385A (ja) 1989-04-05 1989-04-05 パターンの切り出し方法

Publications (1)

Publication Number Publication Date
JPH02264385A true JPH02264385A (ja) 1990-10-29

Family

ID=13838401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1084716A Pending JPH02264385A (ja) 1989-04-05 1989-04-05 パターンの切り出し方法

Country Status (1)

Country Link
JP (1) JPH02264385A (ja)

Similar Documents

Publication Publication Date Title
JP2588491B2 (ja) 画像切り出し装置及びその方法
EP0434930B1 (en) Editing text in an image
EP1361544B1 (en) System and method for editing electronic images
EP0439951B1 (en) Data processing
CN102782702B (zh) 在光学字符识别(ocr)过程中的段落识别
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JPH11120293A (ja) 文字認識/修正方式
JPH0727543B2 (ja) 文字認識装置
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
JP3837193B2 (ja) 文字行抽出方法および装置
JP2005043990A (ja) 文書処理装置および文書処理方法
JP2008108114A (ja) 文書処理装置および文書処理方法
StevensÝ et al. Automatic processing of document annotations
US6094484A (en) Isomorphic pattern recognition
JPH04248687A (ja) 文書画像のレイアウト解析方法及びシステム
JPH08320914A (ja) 表認識方法および装置
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
Baloun et al. ChronSeg: Novel Dataset for Segmentation of Handwritten Historical Chronicles.
JP3904397B2 (ja) 表認識方法
JPH02264385A (ja) パターンの切り出し方法
US5894525A (en) Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation
JP2000090194A (ja) 画像処理方法および画像処理装置
JP3072126B2 (ja) 書体を識別する方法及び装置
JPH07262317A (ja) 文書処理装置