JP2725859B2 - 文字行検出方式 - Google Patents

文字行検出方式

Info

Publication number
JP2725859B2
JP2725859B2 JP1252842A JP25284289A JP2725859B2 JP 2725859 B2 JP2725859 B2 JP 2725859B2 JP 1252842 A JP1252842 A JP 1252842A JP 25284289 A JP25284289 A JP 25284289A JP 2725859 B2 JP2725859 B2 JP 2725859B2
Authority
JP
Japan
Prior art keywords
character
image data
line
vertical
horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1252842A
Other languages
English (en)
Other versions
JPH03113687A (ja
Inventor
晃 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Denki Co Ltd
Original Assignee
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Denki Co Ltd filed Critical Sanyo Denki Co Ltd
Priority to JP1252842A priority Critical patent/JP2725859B2/ja
Publication of JPH03113687A publication Critical patent/JPH03113687A/ja
Application granted granted Critical
Publication of JP2725859B2 publication Critical patent/JP2725859B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は、文字認識装置において、認識対象の文字行
を検出する文字行検出方式に関する。
(ロ)従来の技術 一般に、文字認識装置においては、観測部により入力
原稿を走査光電変換して、黒ドット及び白ドットより成
る2値の画像データを得、該画像データを水平方向に走
査して水平射影を生成し、この水平射影から認識対象の
文字行を検出する。
その後、検出された文字行の画像データを垂直方向に
走査して垂直射影を生成し、この垂直射影に基づき文字
の切出しを行っていた。
しかしながら、このような一般的な方式では、入力原
稿に文字と同様の読取り可能な色で表枠が記入されてい
る場合、表枠内の文字を切出すことはできず、従って、
表枠内の文字を認識することはできなかった。
そこで、特開昭63−137383号公報に開示されているよ
うに、認識に先立ち、表枠内に文字が記入されていない
未記入原稿を先ず走査光電変換して、表枠のみの画像デ
ータを予め記憶しておき、次に、表枠内に文字が記入さ
れた入力原稿を走査光電変換し、得られた入力画像デー
タと記憶しておいた表枠画像データを比較することによ
り、表枠内の文字データを抽出する方式が、提案される
ようになった。
(ハ)発明が解決しようとする課題 上記公報に開示された方式は、記入された表枠のフォ
ーマットが固定である場合には、有効であるが、新聞や
文献等のように、記入される表枠のフォーマットが固定
でない場合には、わざわざ表枠のみの未記入原稿を作成
しなければならず、その作業が極めて煩雑であって、実
用性に乏しいものであった。
更に、上記方式では、入力原稿の画像データと未記入
原稿の画像データとを比較することから、画像データを
記憶するためのメモリ容量が増加し、且つ、処理が複雑
になるという課題があった。
(ニ)課題を解決するための手段 本発明は、文字と共に読取り可能な縦罫線が記入され
た原稿を走査光電変換し、得られた画像データに基づき
文字の認識を行う装置において、前記画像データにおけ
る黒ドットの垂直方向の連続性を判定して、所定長以上
黒ドットが連続する位置を特定し、該特定された位置も
しくはその近傍位置のデータを除いて前記画像データの
水平射影を生成し、該生成された水平射影から認識対象
の文字行を検出することにより、上記課題を解決するも
のである。
又、本発明は、縦罫線及び横罫線より成る読取り可能
な表枠内に文字が記入された原稿を、走査光電変換して
画像データを得、得られた画像データに基づき文字の認
識を行う装置において、前記画像データにおける黒ドッ
トの垂直方向の連続性を判定して、所定長以上黒ドット
が連続する位置を特定し、該特定された位置もしくはそ
の近傍位置のデータを除いて前記画像データの水平射影
を生成し、該生成された水平射影のうち、有効長が所定
長以上の水平射影から認識対象の文字行を検出すること
により、上記課題を解決するものである。
尚、ここで、黒ドットとは、記入された罫線及び文字
に対応する画像データを示し、白ドットは空白に対応す
る。
(ホ)作用 本発明では、画像データにおいて所定長以上黒ドット
が連続する位置が特定されることにより、画像データ中
の縦罫線の位置が検出され、この位置もしくはその近傍
位置のデータを除いて画像データの水平射影が生成され
るため、縦罫線データもしくはその近傍データが除外さ
れた文字のみのデータについて水平射影が生成され、従
って、この水平射影から文字行の検出が可能となる。
又、本発明では、横罫線の水平射影の有効長が所定長
以下になることを考慮して、更に、上記生成された水平
射影のうちその有効長が所定長以上の水平射影から文字
行を検出するので、横罫線を含む場合もその横罫線は除
外され、従って、表枠内の文字のみのデータから成る文
字行が検出可能となる。
(ヘ)実施例 第2図は、本発明の方式を実現する文字認識装置の構
成を示すブロック図であり、(1)は縦罫線及び横罫線
より成る読取り可能な表枠内に文字が印刷された原稿、
(2)は原稿(1)を走査光電変換して画像データを得
る画像観測部、(3)は画像観測部(2)により得られ
た画像データを記憶する画像メモリ、(4)は画像メモ
リ(3)から認識対象文字を一文字づつ切出す文字切出
し部、(5)は切出された文字パターンから特徴パター
ンを抽出し、抽出した特徴パターンを、標準パターンメ
モリ(6)に予め記憶された標準パターンと照合して、
認識を行う認識部である、そして、この文字切出し部
(4)は、文字行検出部(7)、縦罫線検出部(8)、
文字行再検出部(9)、文字切出し制御部(10)より構
成されている。
以下、第1図のフローチャート及び第3図〜第5図を
参照して、文字切出し部(4)の処理内容を詳しく説明
する。
ここでは、原稿(1)には、第3図に示すように、表
枠(11)内に文字が印刷され、且つ、表枠外の第1行目
にも文字が印刷されているものとする。
さて、原稿(1)の画像データが画像メモリ(3)に
記憶されると、文字切出し部(4)内の文字行検出部
(7)が先ず動作し、画像データを水平方向に走査し
て、各水平ドットライン毎に、ライン内の全ドットをOR
演算することにより、水平射影(12)を生成する。この
水平射影(12)の生成は、水平射影の黒部分の長さ(以
下、有効長という)Lが、所定長Loに達するか、もしく
は、達する以前に途切れるまで実行され、本実施例で
は、この所定長Loを、文字サイズNの2.5倍の2.5Nに設
定している。そして、文字行検出部(7)は、この水平
射影の有効長Lが所定長Loに達したときは、文字行検出
不能と判断し、所定長Loより短かければ文字行検出可能
と判断する。
第3図の原稿(1)の第1行目には、文字のみが印刷
されているため、その水平射影(12a)の有効長LはN
以下となって、所定長Loより短かくなり、文字行検出可
能と判断される。このような場合は、従来と同様、水平
射影(12a)の先端(100)と後端(101)の垂直座標で
囲まれた画像データを、認識対象の文字行として検出
し、文字切出し制御部(10)に処理が移る。この制御部
(10)では、第4図に示すように、検出した文字行(1
3)中の画像データを垂直方向に走査し、各垂直ドット
ライン毎に、ライン内の全ドットをOR演算することによ
り、垂直射影(14)を生成し、この垂直射影(14)に基
づき文字の切出しを行う。
一方、1行目の文字の切出し後、次の画像データにつ
いて水平射影を生成すると、縦罫線の存在により、水平
射影(12b)の有効長Lは第3図に示すように、所定長L
oに達してしまい、文字行検出不能と判断される。この
場合、文字行検出部(7)は処理を縦罫線検出部(8)
へ移す。
縦罫線検出部(8)では、文字行検出不能と判断され
た領域(15)内の画像データに対し、黒ドットの垂直方
向の連続性を判定して、黒ドットが所定長Lo連続するデ
ータの水平位置を特定する。具体的には、領域(15)内
の画像データを垂直方向に走査して、各垂直ドットライ
ン毎に、ライン内の全ドットをAND演算し、このAND結果
が「1」である垂直ドットラインの水平座標を記憶す
る。以下、このAND演算により得られた結果を垂直積算
射影と呼び、第5図においては、(16)で示している。
つまり、この垂直積算射影(16)は、文字成分を取り除
いて表枠(11)を構成する縦罫線の成分のみを抽出した
結果であり、従って、この垂直積算射影(16)の存在す
る位置により、縦罫線の位置が検出される。
縦罫線位置の検出後、処理は文字行再切出部(9)に
移り、領域(15)の画像データに対し、水平射影の再生
成が行われる。但し、この場合は、縦罫線検出部(8)
で検出された位置情報に基づき、第5図斜線で示す縦罫
線及びその近傍領域(17a)(17b)(17c)(17d)内の
データを除いて、水平射影が生成されるものであり、従
って、この処理により、表枠(11)内の文字及び横罫線
の射影が、第5図に示すように浮かび上がる。更に、文
字行再切出部(9)は、再生成された水平射影の有効長
が所定長L1(例えば、文字サイズNの1/5程度)より長
いか否か判定し、所定長L1以上の水平射影のみを文字行
の水平射影とする。これにより文字に比べて有効長がか
なり短かい横罫線の水平射影は無視されることとなる。
依って、第5図の場合、横罫線(18)の水平射影(12
c)は無視され、次の水平射影(12d)の先端(102)と
後端(103)の垂直座標により囲まれた画像データが、
表枠(11)内の第1行の文字行として検出される。その
後、処理は文字切出し制御部(10)に移り、上述した垂
直射影の生成により、文字の切出しが実行される。
以下、検出された文字行(19)以降の画像データにつ
いて、第1図フローチャートに示す同様の処理を繰り返
せば、表枠(11)内の第2行,第3行,………最終行に
ついても、順次文字行の検出及び文字行内の文字切出し
が可能となる。
(ト)発明の効果 本発明に依れば、認識原稿を観測部に入力するだけ
で、縦罫線を含む文字行あるいは表枠内の文字行を確実
に検出でき、これら文字行内の文字の認識が可能とな
る。従って、表枠のみの未記入原稿の作成及び入力とい
う煩しい作業は一切不要となり、フォーマットが固定さ
れていない印刷物の文字認識においては、極めて効果が
大なるものである。
更に、未記入原稿画像データと認識原稿画像データの
比較を行わないため、処理が簡単になると共に、メモリ
容量を増加させる必要がなくなる。
【図面の簡単な説明】
第1図は本発明の実施例の処理内容を示すフローチャー
ト、第2図は実施例の構成を示すブロック図、第3図乃
至第5図は実施例の処理内容を説明するための説明図で
ある。 (1)…原稿、(2)…画像観測部、(3)…画像メモ
リ、(4)…文字切出し部、(7)…文字行検出部、
(8)…縦罫線検出部、(9)…文字行再検出部、(1
0)…文字切出し制御部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】縦罫線及び横罫線より成る読取り可能な表
    示枠内に文字が記入された原稿を、走査光電変換して画
    像データを得、得られた画像データに基づき文字の認識
    を行う装置において、前記画像データにおける記入され
    た罫線及び文字行に相当する黒ドットの垂直方向の連続
    性を判定して、所定長以上黒ドットが連続する位置を特
    定し、該特定された位置もしくはその近傍位置のデータ
    を除いて前記画像データの水平射影を生成し、文字と共
    に読取り可能な縦罫線が記入された原稿を走査光電変換
    し、当該表示枠内の横罫線を無視して、認識対象の文字
    行を検出することを特徴とした文字行検出方式。
JP1252842A 1989-09-28 1989-09-28 文字行検出方式 Expired - Lifetime JP2725859B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1252842A JP2725859B2 (ja) 1989-09-28 1989-09-28 文字行検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1252842A JP2725859B2 (ja) 1989-09-28 1989-09-28 文字行検出方式

Publications (2)

Publication Number Publication Date
JPH03113687A JPH03113687A (ja) 1991-05-15
JP2725859B2 true JP2725859B2 (ja) 1998-03-11

Family

ID=17242943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1252842A Expired - Lifetime JP2725859B2 (ja) 1989-09-28 1989-09-28 文字行検出方式

Country Status (1)

Country Link
JP (1) JP2725859B2 (ja)

Also Published As

Publication number Publication date
JPH03113687A (ja) 1991-05-15

Similar Documents

Publication Publication Date Title
US6393150B1 (en) Region-based image binarization system
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US8229214B2 (en) Image processing apparatus and image processing method
JP4613397B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2021044803A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2725859B2 (ja) 文字行検出方式
US6983077B2 (en) Image processor
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP7341758B2 (ja) 画像処理装置、画像処理方法、及びプログラム
EP0476873A2 (en) Method of and apparatus for separating image regions
US6813382B2 (en) Image outline determination method, image outline determination apparatus, image outline determination program storage medium, image input apparatus and image input program storage medium
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3883341B2 (ja) 画像処理方法、装置及び記録媒体
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JP3382254B2 (ja) 画像処理装置
JP2923004B2 (ja) 画像生成装置
JP3210378B2 (ja) 画像入力装置
JP2747136B2 (ja) 文字認識装置
JP4230478B2 (ja) 文書処理装置、方法およびプログラム
JPH0962782A (ja) 文書読取装置
JPH0728934A (ja) 文書画像処理装置
JPH05174179A (ja) 文書画像処理装置
JP2863671B2 (ja) 印字フォーマット作成装置