JP2571826B2 - 文字列パターン切り出し装置 - Google Patents

文字列パターン切り出し装置

Info

Publication number
JP2571826B2
JP2571826B2 JP63161294A JP16129488A JP2571826B2 JP 2571826 B2 JP2571826 B2 JP 2571826B2 JP 63161294 A JP63161294 A JP 63161294A JP 16129488 A JP16129488 A JP 16129488A JP 2571826 B2 JP2571826 B2 JP 2571826B2
Authority
JP
Japan
Prior art keywords
area
character string
feature
density
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63161294A
Other languages
English (en)
Other versions
JPH0212388A (ja
Inventor
一巳 松浦
文夫 依田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63161294A priority Critical patent/JP2571826B2/ja
Publication of JPH0212388A publication Critical patent/JPH0212388A/ja
Application granted granted Critical
Publication of JP2571826B2 publication Critical patent/JP2571826B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、文書画像から個々の文字列領域を検出す
ることにより個々の文字列パターンを自動的に切り出す
文字列パターン切り出し装置に関するものであり、特
に、文書構造(書式)上,複数の段から構成される文書
から個々の文字列パターンを切り出す文字列パターン切
り出し装置に関するものである。
[従来の技術] 第34図は例えば「手書き日本語文書からの文字切り出
し方式」(電子通信学会研究会資料SP86-35)に記載さ
れた従来の文字列パターン切り出し装置のブロック構成
図である。図において、1は入力された文書画像を記憶
する文書画像記憶手段、2は文書画像記憶手段1に記憶
された文書画像をメッシュ状に分割し、得られた各小領
域の濃度を求めて2値化したしたものを画像の特徴とし
て抽出する濃度特徴抽出手段、3は濃度特徴抽出手段2
で抽出した濃度特徴を文字列に平行な方向に走査し,黒
小領域に挟まれた短い白小領域を黒小領域に変換するこ
とにより特徴の埋込を行う濃度特徴埋込手段、4は濃度
特徴埋込手段3で得られた特徴の連結性に基づいて文字
列領域の位置を検出する文字列領域検出手段である。
又、第35図から第39図までに示す図は、上記第34図に
示した従来の文字列パターン切り出し装置の具体的な動
作例を示す図である。第35図から第39図までの図におい
て、第35図の5は文書画像記憶手段1に記憶した文書画
像、第36図の6は濃度特徴抽出手段2により文書画像5
から抽出した濃度特徴の値を画素の値として記憶した濃
度特徴画像、第37図の7は濃度特徴埋込手段3により濃
度特徴画像6に埋込を行って得られた特徴の値を画素の
値として記憶した濃度特徴埋込画層、第38図の8は文字
列領域検出手段4により濃度特徴埋込画像7の画素の連
結性に基づいて連結成分から成る領域を検出して得られ
た連結領域の外接矩形、第39図の9は連結領域の外接矩
形8の位置情報をテーブルにまとめた領域テーブルと文
字列領域検出手段4により該領域テーブルの情報を用い
て判定した文字列領域(図中で○印を付した領域)であ
る。
次に動作について説明する。
濃度特徴抽出手段2では、例えば、文書画像記憶手段
1に16画素/mmの解像度で記憶した縦が2304画素で横が1
696画素の文書画像5を、縦,横がともに8画素の小領
域から成るメッシュ状に分割し、縦が288個で横が212個
の合計61,056個の小領域を得る。次に、各小領域内の黒
画素を計数して適当な闘値で2値化し、この値を該小領
域の濃度特徴の値とする。ここでは、黒画素数が闘値以
上の小領域を黒小領域,黒画素数が闘値未満の小領域を
白小領域と呼び、濃度特徴の値は黒小領域が1で白小領
域が0とする。この濃度特徴の値を画素の値とし、小領
域の位置と対応付けて2値画像として記憶したものが第
36図に示す濃度特徴画像6である。第36図では、値が1
の画素を“□",値が0の画素を空白“ ”で示してあ
り、以降の特徴画素でも同様である。
次に、濃度特徴埋込手段3では、濃度特徴画像6を文
字列に平行な方向(本例では縦方向)に走査し、値が1
の画素(黒小領域)に挟まれる,値が0の画素(白小領
域)の連続する数が所定の闘値以下の場合は、値が0の
該画素(白小領域)の値を1(黒小領域)に変更するこ
とにより埋込を行い、濃度特徴埋込画像7を得る。
更に、文字列領域検出手段4では、濃度特徴埋込画像
7を走査して4方向で連結する画素に同一のラベルを付
けることにより、連結成分から成る領域(連結領域)を
検出する。第38図は検出した連結領域の外接矩形8を図
示しており、第39図は各連結領域の外接矩形8の上端の
Y座標,下端のY座標,左端のX座標,右端のX座標を
領域テーブル9にまとめて表示したものである。次に、
この領域テーブル9の情報を用いて、検出した連結領域
が文字列領域か否かを判定する。例えば、縦書き文字列
の場合は、各連結領域の外接矩形8の幅を領域テーブル
9の情報を用いて計算し(右端のX座標−左端のX座標
+1)、この値が所定の闘値の範囲内に存在するならば
該連結領域を文字列領域9と判定する。第39図では、連
結領域の外接矩形8の位置を文書画像5上での座標で表
わしている。即ち、文書画像5の左上端を原点(0,0)
とし,右及び下が正の向きで,単位は画素であり、以降
のテーブルでも同様である。又、文字列領域と判定した
連結領域には○印を付してある。この例では、検出した
総ての連結領域が文字列領域と判定されている。
[発明が解決しようとする課題] 従来の文字列パターン切り出し装置は以上のように構
成されているが、文書構造上複数段から成る文書からは
正しく文字列パターンを切り出すことが出来なかった。
即ち、段を分離する段セパレータには罫線と空白(スペ
ース)の場合があり、段セパレータが空白で幅が狭い場
合は、濃度特徴埋込手段3により段セパレータを挟む文
字列領域間が埋込まれるために、複数の文字列領域が1
つの文字列領域として検出されることがある。又、段セ
パレータが罫線で幅が狭い場合は、濃度特徴埋込手段3
により段セパレータと文字列領域の間が埋込まれるた
め、段セパレータと文字列領域が1つの連結領域となっ
て文字列領域を検出出来ないことがある。更に、段領域
が不明であり文書画像全体に渡って文字列領域の検出を
行うため、複数の段に存在する文字列領域が混在して検
出され、正しい順序で文字列パターンを出力することが
出来なかった。
この発明は上記のような課題を解決するためになされ
たもので、複数段から成る文書からも正しく文字列パタ
ーンを切り出すことが出来る文字列パターン切り出し装
置を得ることを目的とする。
[課題を解決するための手段] この発明に係る文字列パターン切り出し装置は、文書
構造上の段を分離する段セパレータで区切られる段領域
を特徴抽出手段で抽出した画素の連続性,数等の特徴の
値に基づいて検出する単数あるいは複数の段検出手段を
設け、この単数あるいは複数の段検出手段で検出した段
領域毎に個々の文字列領域を文字列領域検出手段で検出
するようにしたものである。
[作用] この発明においては、単数あるいは複数の段検出手段
により検出された段領域毎に文字列領域を検出すること
により、複数段から成る文書からも個々の文字列領域を
正しく検出して文字列パターンを正確に切り出すことが
出来る。
[実施例] 以下、この発明の実施例を図について説明する。
第1図はこの発明による文字列パターン切り出し装置
の一実施例を示すシステム構成図である。図において、
10はコントローラで、このコントローラ10により、各処
理の制御を行う制御手段10aと,処理結果の検定(判
定)を行う検定手段10bが実現される。11はプロセッサ
で、このプロセッサ11により、画像の特徴を抽出する特
徴抽出手段11aと,当該特徴抽出手段11aで抽出した画像
の特徴に処理(変更)を施して所望の画像を生成する特
徴処理手段11bと,当該特徴処理手段11bで生成した画像
を走査して連結成分から成る連結領域を検出する領域検
出手段11cが実現され、これらは前記コントローラ10か
らの起動によって実施される。12はメモリで、このメモ
リ12に、図示外の光電変換器等を経て入力された文章画
像12aや上記特徴抽出手段11aで抽出した画像の特徴の各
値を画素の値とした特徴画層12b及び領域検出手段11cで
検出した連結領域の位置等の情報をテーブルにまとめた
領域テーブル12cが記憶され、上記コントローラ10及び
プロセッサ11から必要に応じてアクセス(読み込み又は
書き出し)される。なお、図中、実線の矢印は処理の流
れを,点線の矢印はデータの流れを示している。又、コ
ントローラ10は汎用マイクロプロセッサ又は計算器等で
実現しており、プロセッサ11は専用あるいは汎用のマイ
クロプロセッサ又は計算器等で実現している。
第2図は、この発明による文字列パターン切り出し装
置の第1の実施例を示すブロック構成図である。なお、
前記第34図に示した従来例と同一又は相当部分には同一
符号を付してその説明は省略する。図において、13は文
書画像記憶手段1に記憶した文書画像をメッシュ状に分
割して得られた各小領域内で黒画素が連続するか否かを
調べ、黒画素が連続する小領域は直線特徴があり,黒画
素が連続しない小領域は直線特徴が無いとして各小領域
の画像の特徴を抽出する直線特徴抽出手段、14は直線特
徴抽出手段13において抽出した直線特徴を文字列に直角
な方向に走査し、短い直線特徴が有る小領域を直線特徴
が無い小領域に変更することにより直線特徴の雑音除去
を行う直線特徴雑音除去手段、15は直線特徴雑音除去手
段14で得られた直線特徴の連結性に基づいて罫線の位置
を検出することによって段領域の位置を決定する第1の
段検出手段である。
又、第3図から第14図までに示す図は上記第2図に示
した文字列パターン切り出し装置の具体的な動作例を示
す図である。第3図から第14図までの図において、第3
図の16は文書画像記憶手段1に記憶された文書画像、第
4図の17は文書画像16から直線特徴抽出手段13により抽
出した直線特徴の値を画素の値として記憶した直線特徴
画像、第5図の18は直線特徴画像17から直線特徴雑音除
去手段14により雑音を除去して得られた特徴の値を画素
の値として記憶した直線特徴雑音除去画像、第6図の19
は第1の段検出手段15によって直線特徴雑音除去画像18
の画素の連結性に基づいて連結成分から成る領域を検出
して得られた連結領域の外接矩形、第7図の20は第1の
段検出手段15によって連結領域の外接矩形19の位置情報
をテーブルにまとめた領域テーブルとこの領域テーブル
の情報から段セパレータであると判定した罫線領域(図
中で○印を付した領域)、第8図の21は第1の段検出手
段15により罫線領域20から検出した段領域をテーブルに
まとめた段領域テーブル、第9図の22は段領域テーブル
21の位置情報を用いて矩形で表示した段領域、第10図の
23は文書画像16から濃度特徴抽出手段2により抽出した
濃度特徴の値を画素の値として記憶した濃度特徴画像、
第11図の24は第1の段検出手段15によって検出した段領
域22毎に濃度特徴埋込手段3により濃度特徴画像23の埋
込を行って得られた特徴の値を画素の値として記憶した
濃度特徴埋込画像、第12図の25は上記段領域22毎に文字
列領域検出手段4によって濃度特徴埋込画像24の画素の
連結性に基づいて連結成分から成る領域を検出した連結
領域の外接矩形、第13図の26は上記段領域22の最下位に
位置する段領域において文字列領域検出手段4により検
出した連結領域の外接矩形の位置情報をテーブルにまと
めた領域テーブルとこの領域テーブルの情報から文字列
領域検出手段4により判定した文字列領域(図中で○印
を付した領域)、第14図の27は上記段領域22毎に検出し
た文字列領域をまとめて外接矩形により表示した文字列
領域である。
次に動作について説明する。
直線特徴抽出手段13では、例えば、文書画像記憶手段
1に16画素/mmの解像度で記憶した縦が2304画素で横が1
696画素の文書画像16を、縦,横がともに8画素の小領
域から成るメッシュ状に分割し、縦が288個で横が212個
の合計61,056個の小領域を得る。次に、各小領域内で文
字列と直角な方向に黒画素が連続するか否かを調べ、連
続性の有無を該小領域の直線特徴の値とする。ここで
は、文字列と直角な方向(横方向)に並ぶ8画素総てが
黒画素である行が1行以上存在する場合は直線特徴(画
素の連続性)が有り、その他の場合は直線特徴が無いと
定義する。直線特徴の値は、直線特徴の有る小領域が1
で直線特徴の無い小領域が0とする。この直線特徴の値
を画素の値とし、小領域の位置と対応付けて記憶した2
値画像が第4図に示した直線特徴画像17である。
次に、直線特徴雑音除去手段14では、直線特徴画像17
を文字列と直角な横方向に走査し、連続する値が1の画
素(直線特徴が有る小領域)の数が所定の闘値以下の場
合は、値が1の該画素(直線特徴がある小領域)の値を
0(直線特徴が無い小領域)に変更することにより雑音
の除去を行い、直線特徴雑音除去画像18を得る。
次に、第1の段検出手段15では、直線特徴雑音除去画
像18を走査し、4方向で連結する画素に同一のラベルを
付けることにより連結成分から成る領域(連結領域)を
検出する。第6図は検出した連結領域の外接矩形19を図
示しており、第7図は上記各連結領域の外接矩形19の上
端のY座標,下端のY座標,左端のX座標,右端のX座
標を領域テーブル20にまとめて表示したものである。次
に、この領域テーブル20を用いて、検出された連結領域
が段セパレータとなり得る罫線領域か否かを判定する。
例えば、縦書き文書の場合は、隣り合う連続領域nとn
−1の距離(連結領域nの上端のY座標−連結領域n−
1の下端のY座標+1)が所定の闘値の範囲内にあり、
かつ連結領域の幅(右端のX座標−左端のX座標+1)
が所定の闘値以上あり、かつ連結領域の高さ(下端のY
座標−上端のY座標+1)が所定の闘値以下ならば、該
連結領域を段セパレータとなり得る罫線領域20と判定す
る。この例では、検出した総ての連結領域が段セパレー
タになり得る罫線領域と判定されている。次にこの罫線
領域20の位置情報(上端のY座標,下端のY座標,左端
のX座標,右端のX座標)を用いて段領域を決定する。
例えば、縦書きの文書の場合は、罫線領域20又は文書の
上下左右端で区切られる文書画像の領域の位置情報(上
端のY座標,下端のY座標,左端のX座標,右端のX座
標)を求め、この領域の高さが所定の闘値以上あるなら
ば該領域を段領域と判定し、第8図に示す段領域テーブ
ル21に該領域の位置情報を格納する。第9図は段領域テ
ーブル21の位置情報を矩形で表示した段領域22である。
次に、濃度特徴抽出手段2では、文書画像記憶手段1
に記憶した上記文書画像16をメッシュ状に分割して得ら
れた上記を同一の各小領域内で黒画素数を計数して適当
な闘値で2値化し、この値を該小領域の濃度特徴の値と
する。ここでは、黒画素数が闘値以上の小領域を黒小領
域,黒画素数が闘値未満の小領域を白小領域と呼び、濃
度特徴の値は黒小領域が1で白小領域が0とする。この
濃度特徴の値を画素の値とし、小領域の位置と対応付け
て2値画像として記憶したものが第10図に示す濃度特徴
画像23である。
次に、濃度特徴埋込手段3では、第1の段検出手段15
で検出した段領域22毎に濃度特徴画像23を文字列に平行
な方向(本例では縦方向)に走査し、値が1の画素(黒
小領域)に挟まれる連続する値が0の画素(白小領域)
の数が所定の闘値以下の場合、該画素の値を1(黒小領
域)に変更することによって埋込を行い、第11図に示す
濃度特徴埋込画像24を得る。
更に、文字列領域検出手段4では、第1の段検出手段
15で検出した段領域22毎に濃度特徴埋込画像24を走査
し、4方向で連結する画素に同一のラベルを付けること
により連結成分から成る領域(連結領域)を検出する。
第12図は、検出した連結領域の外接矩形25を図示してお
り、第13図は、上記各連結領域の外接矩形25の内,第9
図に示した段領域22における最下位の段領域に属するも
のの上端のY座標,下端のY座標,左端のX座標,右端
のX座標を領域テーブル26にまとめて表示したものであ
る。次に、上記段領域22毎にまとめた領域テーブル26の
情報を用いて、検出した連結領域が文字列領域か否かを
判定する。例えば、縦書き文字列の場合は、各連結領域
の外接矩形25の幅を領域テーブル26の情報を用いて求め
(右端のX座標−左端のX座標+1)、この値が所定の
闘値の範囲内に存在するならば該連結領域を文字列領域
26と判定する。尚、第14図は段領域22毎に検出した文字
列領域をまとめて外接矩形により表示した文字列領域で
ある。
第15図は、この発明による文字列パターン切り出し装
置の第2の実施例を示すブロック構成図である。図にお
いて、28は濃度特徴抽出手段2において上記実施例と同
一の方法で抽出した濃度特徴を文字列に平行及び直角な
方向に走査し、黒小領域に挟まれる短い白小領域を黒小
領域に変更することより特徴を埋込む濃度特徴埋込手
段、29は濃度特徴埋込手段28で得られた特徴の連結性に
基づいて段領域の位置を検出する第2の段検出手段であ
る。
又、第16図から第23図までに示す図は、上記第15図に
示した文字列パターン切り出し装置の具体的な動作例を
示す図である。第16図から第23図までの図において、第
16図の30は文書画像記憶手段1に記憶した文書画像、第
17図の31は濃度特徴抽出手段2により文書画像30から抽
出した濃度特徴の値を画素の値として記憶した濃度特徴
画像、第18図の32は濃度特徴画像31に対して濃度特徴埋
込手段28により文字列と平行な方向に濃度特徴の埋込を
行って得られた特徴の値を画素の値として記憶した第1
の濃度特徴埋込画像、第19図の33は第1の濃度特徴埋込
画像32の画素の値を特徴の値として濃度特徴埋込手段28
により文字列と直角な方向に特徴の埋込を行って得られ
た特徴の値を画素の値として記憶した第2の濃度特徴埋
込画像、第20図の34は第2の濃度特徴埋込画像33の画素
の連結性に基づいて連結成分から成る領域を検出した連
結領域の外接矩形、第21図の35は連結領域の外接矩形34
の位置情報をテーブルにまとめた領域テーブルとこの領
域テーブルの情報から判定した段領域(図中で○印を付
した領域)、第22図の36は段領域35の位置情報をテーブ
ルにまとめた段領域テーブル、第23図の37は段領域テー
ブル36の情報を矩形で表示した段領域37である。
次に動作について説明する。
文書画像記憶手段1に記憶した文書画像30から上記実
施例と同様にして濃度特徴抽出手段2により濃度特徴を
抽出して濃度特徴画像31を生成する。
次に、濃度特徴埋込手段28により濃度特徴画像31を文
字列と平行な方向(本例では横方向)に走査し、値が1
の画素(黒小領域)に挟まれる連続する値が0の画素
(白小領域)の数が所定の闘値以下の場合は、値が0の
該画素(白小領域)の値を1(黒小領域)に変更するこ
とにより埋込を行い、第18図に示す第1の濃度特徴埋込
画像32を得る。このときの埋込の闘値は、段領域間を埋
込まない程度の小さな値を設定する。この後、得られた
第1の濃度特徴埋込画像32を文字列と直角な方向に走査
し、値が1の画素(黒小領域)に挟まれる連続する値が
0の画素(白小領域)の数が所定の闘値以下の場合は、
値が0の該画素(白小領域)の値を1(黒小領域)に変
更することにより埋込を行い、第19図に示す第2の濃度
特徴埋込画像33を得る。
更に、第2の段検出手段29では、第2の濃度特徴埋込
画像33を走査し、4方向で連結する画素に同一のラベル
を付けることにより連結成分から成る領域(連結領域)
を検出する。第20図は、検出した連結領域の外接矩形34
を図示しており、第21図は、上記各連結領域の外接矩形
34の上端のY座標,下端のY座標,左端のX座標,右端
のX座標を領域テーブル35にまとめて表示したものであ
る。次に領域テーブル35の情報を用いて、検出された連
結領域が段領域となり得るか否かを判定する。例えば、
横書き文書の場合は、検出した連結領域の幅(右端のX
座標−左端のX座標+1)及び高さ(下端のY座標−上
端のY座標)が所定の闘値以上あり、かつ前記第1の条
件を満たす連結領域をY軸に投影したとき,Y軸上で互い
に重なり合う連結領域が存在する場合、前記第1の条件
を満たす連結領域を段領域35と判定する。この例では、
検出した6個の連結領域の内,2個のノイズの領域を除く
4個の連結領域が段領域と判定されている。第22図は、
段領域35と判定された連結領域の位置情報をまとめた段
領域テーブル36であり、この段領域テーブル36の情報を
矩形で表示したものが第23図の段領域37である。
この後の処理は前記実施例と同一であり、濃度特徴埋
込手段3と文字列領域検出手段4により、検出した各段
領域37毎に文字列領域の検出を行う。
第24図は、この発明による文字列パターン切り出し装
置の第3の実施例を示すブロック構成図である。図にお
いて、38は濃度特徴抽出手段2において前記実施例と同
一の方法で抽出した濃度特徴を走査し、黒小領域を白小
領域に,白小領域を黒小領域に変更することによって特
徴の値を反転する濃度特徴反転手段、39は濃度特徴反転
手段38により反転された濃度反転特徴を文字列と直角な
方向に走査し、連続する短い黒小領域を白小領域に変更
することにより濃度反転特徴の雑音除去を行う濃度反転
特徴雑音除去手段、40は濃度反転特徴雑音除去手段39で
得られた特徴の連結性に基づいて段セパレータである空
白を検出することによって段領域の位置を決定する第3
の段検出手段である。
又、第25図から第32図までに示す図は、上記第24図に
示した文字列パターン切り出し装置の具体的な動作例を
示す図である。第25図から第32図までの図において、第
25図の41は文書画像記憶手段1に記憶した文書画像、第
26図の42は濃度特徴抽出手段2により文書画像41から抽
出した濃度特徴の値を画素の値として記憶した濃度特徴
画像、第27図の43は濃度特徴画像42に対して濃度特徴反
転手段38により特徴の反転を行って得られた濃度反転特
徴の値を画素の値として記憶した濃度特徴反転画像、第
28図の44は濃度特徴反転画像43から濃度反転特徴雑音除
去手段39により雑音を除去して得られた濃度反転特徴の
値を画素の値として記憶した濃度反転特徴雑音除去画
像、第29図の45は第3の段検出手段40により濃度反転特
徴雑音除去画像44の画素の連結性に基づいて連結成分か
ら成る領域を検出した連結領域の外接矩形、第30図の46
は第3の段検出手段40によって連結領域の外接矩形45の
位置情報をテーブルにまとめた領域テーブルとこの領域
テーブルの情報から段セパレータとなり得ると判定した
空白領域(図中で○印を付した領域)、第31図の47は第
3の段検出手段40によって空白領域46から検出した段領
域をテーブルにまとめた段領域テーブル、第32図の48は
段領域テーブル47の位置情報を矩形で表示した段領域で
ある。
次に動作について説明する。
文書画像記憶手段1に記憶した文書画像41から上記実
施例と同様にして濃度特徴抽出手段2により濃度特徴を
抽出して濃度特徴画像42を生成する。
次に、濃度特徴反転手段38により濃度特徴画像42を走
査し、値が1の画素(黒小領域)の値を0(白小領域)
に,値が0の画素(白小領域)の値を1(黒小領域)に
それぞれ変更することにより画素の値を反転し、第27図
に示す濃度特徴反転画像43を得る。
この後、濃度反転特徴雑音除去手段39では、得られた
濃度特徴反転画像43を文字列と直角な方向(本例では横
方向)に走査し、連続する値が1の画素(黒小領域)の
数が所定の闘値以下の場合は値が1の該画素(黒小領
域)の値を0(白小領域)に変更することにより雑音の
除去を行い、第28図に示す濃度反転特徴雑音除去画像44
を得る。
更に、第3の段検出手段40では、上記濃度反転特徴雑
音除去画像44を走査し、4方向で連続する画素に同一の
ラベルを付けることにより連結成分から成る領域(連結
領域)を検出する。第29図は、検出した連結領域の外接
矩形45を示しており、第30図は、上記各連結領域の外接
矩形45の上端のY座標,下端のY座標,左端のX座標,
右端のX座標を領域テーブル46にまとめたものである。
次に、領域テーブル46の情報を用いて、検出された連結
領域が段セパレータとなり得る空白領域か否かを判定す
る。例えば、縦書き文書の場合は、隣り合う連結領域n
とn−1の距離(連結領域nの上端のY座標−連結領域
n−1の下端のY座標+1)が所定の闘値の範囲内にあ
り、かつ連結領域の幅(右端のX座標−左端のX座標+
1)が所定の闘値以上あり、かつ連結領域の高さ(下端
のY座標−上端のY座標+1)が所定の闘値以下なら
ば、該連結領域を段セパレータとなり得る空白領域46と
判定する。この例では、検出した総ての連結領域が段セ
パレータになり得る空白領域と判定されている。次に、
この空白領域46の位置情報(上端のY座標,下端のY座
標,左端のX座標,右端のX座標)を用いて段領域を決
定する。例えば、縦書きの文書の場合は、空白領域46又
は文書の端で区切られる文書画像の領域の位置情報(上
端のY座標,下端のY座標,左端のX座標,右端のX座
標)を求め、この領域の高さが所定の闘値以上あるなら
ば該領域を段領域と判定し、第31図に示す段領域テーブ
ル47に該領域の位置情報を格納する。第32図は段領域テ
ーブル47の位置情報を矩形で表示した段領域48である。
この後の処理は前記実施例と同一であり、濃度特徴埋
込手段3と文字列領域検出手段4により、検出した各段
領域48毎に文字列領域の検出を行う。
第33図は、この発明による文字列パターン切り出し装
置の第4の実施例を示すブロック構成図である。この実
施例は、前記各実施例で説明した各手段を兼ね備えたも
のである。
次に動作について説明する。
先ず、文書画像記憶手段1に記憶した文書画像に対し
て、濃度特徴抽出手段2と直線特徴抽出手段13と直線特
徴雑音除去手段14を実施した後,第1の段検出手段15を
実施し、この結果,第1の段検出手段15で複数個の段領
域が検出出来なかった場合は、濃度特徴埋込手段28を実
施した後,第2の段検出手段29を実施する。この結果、
第2の段検出手段29で検出した連結領域の中で前記第1
の条件を満たす連結領域のY軸上への投影が互いに重な
り合わない場合は、濃度特徴反転手段38と濃度反転特徴
雑音除去手段39とを実施した後,第3の段検出手段40を
実施する。この結果、第3の段検出手段40で複数個の段
領域が検出出来なかった場合は、1つの段領域から成る
文書画像であると判定する。何れかの段検出手段で複数
個の段領域が検出されたときは何れの場合も、検出した
各段領域毎に濃度特徴埋込手段3と文字列領域検出手段
4を実施し、文字列領域を検出する。
このように、複数の段検出手段を組合せたことによ
り、段セパレータが罫線であっても空白であっても,1つ
の文書内に複数の段構成が混在していても段領域を検出
することが出来る。
尚、上記第4の実施例では、複数の段検出手段を順次
実施して段領域の検出を行うようにしたが、複数の段検
出手段を一斉に実施し,それらの結果から総合的に判定
して段領域を検出するようにしても良い。又、3種類の
段検出手段を用いるものについて説明したが、第1の段
検出手段15と第3の段検出手段40等,2種類の段検出手段
を用いても良い。
又、上記各実施例では、小領域が縦8画素,横8画素
のものについて説明したが、所望する特徴を抽出するこ
とが出来る大きさ及び形状ならば良い。また、画像の特
徴として濃度特徴や直線特徴を用いるものについて説明
したが、小領域から抽出することが出来て、かつ段領域
や文字列領域の検出に有効な特徴ならば良い。
[発明の効果] 以上のように、この発明によれば、文書構造上の段を
分離する段セパレータで区切られる段領域を特徴抽出手
段で抽出した特徴の値に基づいて検出する単数あるいは
複数の段検出手段を設け、この単数あるいは複数の段検
出手段で検出した段領域毎に個々の文字列領域を文字列
領域検出手段で検出するようにしたので、複数の段から
成る文書からも個々の文字列領域を正しく検出して文字
列パターンを正確に切り出すことが出来る。
【図面の簡単な説明】
第1図はこの発明による文字列パターン切り出し装置の
一実施例を示すシステム構成図、第2図はこの発明によ
る文字列パターン切り出し装置の第1の実施例を示すブ
ロック構成図、第3図ないし第14図は上記第2図に示す
文字列パターン切り出し装置の動作例を示す図、第15図
はこの発明による文字列パターン切り出し装置の第2の
実施例を示すブロック構成図、第16図ないし第23図は上
記第15図に示す文字列パターン切り出し装置の動作例を
示す図、第24図はこの発明による文字列パターン切り出
し装置の第3の実施例を示すブロック構成図、第25図な
いし第32図は上記第24図に示す文字列パターン切り出し
装置の動作例を示す図、第33図はこの発明による文字列
パターン切り出し装置の第4の実施例を示すブロック構
成図、第34図は従来の文字列パターン切り出し装置を示
すブロック構成図、第35図ないし第39図は従来の文字列
パターン切り出し装置の動作例を示す図である。 1は文書画像記憶手段、2は濃度特徴抽出手段、3は濃
度特徴埋込手段、4は文字列領域検出手段、10はコント
ローラ、10aは制御手段、10bは検定手段、11はプロセッ
サ、11aは特徴抽出手段、11bは特徴処理手段、11cは領
域検出手段、12はメモリ、12aは文書画像、12bは特徴画
像、12cは領域テーブル、13は直線特徴抽出手段、14は
直線特徴雑音除去手段、15は第1の段検出手段、28は濃
度特徴埋込手段、29は第2の段検出手段、38は濃度特徴
反転手段、39は濃度反転特徴雑音除去手段、40は第3の
段検出手段。 尚、図中、同一符号は同一又は相当部分を示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文書を光学的に走査し、光電変換して得ら
    れた文書画像をメッシュ状に分割して、この分割された
    各小領域内にある画素の連続性,数等の特徴に基づいて
    該小領域の特徴を抽出する特徴抽出手段を備え、個々の
    文字列領域を検出することにより個々の文字列パターン
    を切り出す文字列パターン切り出し装置において、 上記特徴抽出手段で抽出した画素の連続性,数等の特徴
    に基づいて、文書構造上の段を分離する段セパレータで
    区切られる段領域を検出する単数あるいは複数の段検出
    手段と、この検出した各段領域内における個々の文字列
    領域を、上記特徴抽出手段で抽出した画素の連続性,数
    等の特徴に基づいて検出する文字列領域検出手段とを備
    えたことを特徴とする文字列パターン切り出し装置。
JP63161294A 1988-06-29 1988-06-29 文字列パターン切り出し装置 Expired - Lifetime JP2571826B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63161294A JP2571826B2 (ja) 1988-06-29 1988-06-29 文字列パターン切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63161294A JP2571826B2 (ja) 1988-06-29 1988-06-29 文字列パターン切り出し装置

Publications (2)

Publication Number Publication Date
JPH0212388A JPH0212388A (ja) 1990-01-17
JP2571826B2 true JP2571826B2 (ja) 1997-01-16

Family

ID=15732375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63161294A Expired - Lifetime JP2571826B2 (ja) 1988-06-29 1988-06-29 文字列パターン切り出し装置

Country Status (1)

Country Link
JP (1) JP2571826B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61175875A (ja) * 1985-01-31 1986-08-07 Mitsubishi Electric Corp 文書読取り装置

Also Published As

Publication number Publication date
JPH0212388A (ja) 1990-01-17

Similar Documents

Publication Publication Date Title
US5680479A (en) Method and apparatus for character recognition
JP3278471B2 (ja) 領域分割方法
CN104008359B (zh) 一种用于qr码识别的精确网格采样方法
US20120219220A1 (en) Method and system for preprocessing an image for optical character recognition
CN115661848A (zh) 一种基于深度学习的表格提取和识别方法及系统
RU2626656C2 (ru) Способ и система определения ориентации изображения текста
JPH0721310A (ja) 文書認識装置
JP4392907B2 (ja) 文字切出し方法
JP2571826B2 (ja) 文字列パターン切り出し装置
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
JP3187895B2 (ja) 文字領域抽出方法
JPH0548510B2 (ja)
JPS63304387A (ja) 文書読取装置
JPH0713994A (ja) 文字認識装置
JP7283756B2 (ja) 情報処理装置、及びプログラム
JP3153439B2 (ja) 文書画像傾き検出方法
JP3064391B2 (ja) 文字認識方法
JPH07160810A (ja) 文字認識装置
JPH0697470B2 (ja) 文字列抽出装置
JP2003317107A (ja) 罫線抽出方法及び装置
JPS6254380A (ja) 文字認識装置
JPS61175880A (ja) 破線抽出装置
JP3104355B2 (ja) 特徴抽出装置
JPH04288690A (ja) 文書画像の縦書き・横書き判定方法
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071024

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 12