JP3753354B2 - Broken line identification device and recording medium - Google Patents

Broken line identification device and recording medium Download PDF

Info

Publication number
JP3753354B2
JP3753354B2 JP13791198A JP13791198A JP3753354B2 JP 3753354 B2 JP3753354 B2 JP 3753354B2 JP 13791198 A JP13791198 A JP 13791198A JP 13791198 A JP13791198 A JP 13791198A JP 3753354 B2 JP3753354 B2 JP 3753354B2
Authority
JP
Japan
Prior art keywords
broken line
rectangle
line
pseudo
broken
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP13791198A
Other languages
Japanese (ja)
Other versions
JPH1145339A (en
Inventor
裕子 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP13791198A priority Critical patent/JP3753354B2/en
Publication of JPH1145339A publication Critical patent/JPH1145339A/en
Application granted granted Critical
Publication of JP3753354B2 publication Critical patent/JP3753354B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、破線と擬似破線を精度よく識別する破線識別装置および記録媒体に関する。
【0002】
【従来の技術】
表を構成する点線罫線を認識する方法として、例えば特開平7−230525号公報に記載された罫線認識方法がある。この方法は、所定の閾値以下の矩形を点線要素として抽出し、該要素間の間隔が所定の閾値以内の要素同士を統合した矩形を点線罫線として抽出する。また、矩形の大きさおよび矩形間の間隔のそれぞれの分散値を基に罫線としての妥当性も判断している。
【0003】
【発明が解決しようとする課題】
しかし、上記したように矩形の抽出処理を所定の閾値で行うと、例えば、文字を構成している矩形を、破線の構成要素として誤って抽出する可能性がある。また、画像がスキューしていたり、ノイズがある場合には、正しく破線を抽出することできないという問題がある。
【0004】
本発明の目的は、破線識別処理後、または処理中に破線を構成している要素の大きさと要素間距離(破線間隔)のバラツキ量(分散などの統計量)を計算し、そのバラツキ量が所定の閾値以上のものは擬似破線として除去することにより、破線の識別精度を向上させた破線識別装置および記録媒体を提供することにある。
【0005】
【課題を解決するための手段】
前記目的を達成するために、請求項1記載の発明では、文書画像から黒画素連結成分を統合した矩形を抽出する矩形抽出手段と、該抽出された矩形から破線を構成する矩形(以下、破線要素)を抽出する破線抽出手段と、該破線要素を基に破線であるか、文字矩形の一部から構成されている擬似破線であるかを識別する破線識別手段を備えた破線識別装置であって、前記破線識別手段は、前記破線の位置情報と文字矩形の位置情報との差を基に破線であるか擬似破線であるかを識別することを特徴としている。
【0006】
請求項2記載の発明では、文書画像から黒画素連結成分を統合した矩形を抽出する矩形抽出手段と、該抽出された矩形から破線を構成する矩形(以下、破線要素)を抽出する破 線抽出手段と、該破線要素を基に破線であるか、文字矩形の一部から構成されている擬似破線であるかを識別する破線識別手段を備えた破線識別装置であって、前記破線識別手段は、前記破線要素の位置情報と文字矩形の位置情報との差を基に破線であるか擬似破線であるかを識別することを特徴としている。
【0007】
請求項3記載の発明では、請求項1または2記載の破線識別装置の各手段として、コンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。
【0014】
【発明の実施の形態】
以下、本発明の一実施例を図面を用いて具体的に説明する。
本発明の各実施例を説明する前に、まず、本発明で使用する用語を定義する。 矩形/矩形抽出:
画像中に、連続している画像、または所定の閾値以上、連続している画像部分(例えば、2値画像であれば連続黒画素部、もしくは連続白画像部)を一塊として、それらが包含されるように外接四角形で囲んだ範囲を矩形とし、その位置座標を抽出することを矩形抽出と定義する。
【0015】
破線/破線要素/擬似破線:
実線以外の線を破線と定義する。すなわち、破線とは、点線、一点鎖線、二点鎖線などを含む総称である。破線を構成する矩形を破線要素とする。例えば、2値画像であれば黒画素の矩形を指す。破線でないにも係らず、破線として誤って識別された破線を擬似破線と呼ぶ。例えば文字を構成している矩形の一部が破線識別処理の対象となって、誤認識された結果、抽出された破線がこの擬似破線に相当する。
【0016】
要素間距離:
破線を構成している要素と要素の間の距離である。この距離は、例えば要素と要素の位置座標の差や、要素が黒画素で構成されている2値画像であれば、黒画素要素間の連続白画像部の長さを表わす。
【0017】
図1は、本発明の実施例1から5に共通する構成を示す。また、図2は、本発明の実施例1から5に共通する全体の処理フローチャートである。2値画像入力部100は、例えばスキャナのような画像入力部である。ここでは、2値画像として取り込むが、多値画像でもよい。2値画像入力部100から入力された画像は、2値イメージメモリ110に格納される(ステップ1)。
【0018】
次に、矩形抽出部120は、この2値イメージメモリ110のデータを使用して矩形を抽出し、矩形メモリ130に格納する(ステップ2)。破線罫線抽出部140では、このメモリ130内の矩形情報を利用して破線を抽出する(ステップ3)。破線抽出処理は、破線を識別する方法であれば、何れの方法を用いてもよい。破線罫線抽出部140で抽出された破線は、破線罫線メモリ150に格納され(ステップ4)、抽出されなければ処理が終了する。この段階では、擬似破線も破線として含まれている。以下詳述するように、破線判断部160では、この擬似破線を除去して擬似破線と真の破線とに選別する(ステップ5)。この擬似破線の除去処理を、抽出した全ての破線について行う(ステップ6)。
【0019】
破線判断部160は、分散計算部161、比率計算部162、一定情報量占有率の計算部163、矩形位置と破線位置の比較計算部164、矩形位置と破線要素位置の比較計算部165を備えている。破線判断部160で擬似破線を除去した残りの真の破線を破線罫線メモリ170に格納する。ここで、破線罫線メモリとしてメモリ170を専用に設けているが、メモリ150を共用してもよい。
【0020】
また、図1では処理順序として、破線抽出部140で破線を抽出した後に、破線判断部160で破線を判断しているが、破線を抽出しながら判断する処理順序を採ってもよい。
【0021】
〈実施例1〉
実施例1では、破線判断部160の分散計算部161のみが機能する。分散計算部161では、破線罫線メモリ150内の抽出された破線、もしくは抽出中の破線の要素の幅と高さと要素間距離のバラツキを計算する。バラツキを示すものとしてここでは、例えば統計処理の分散を例にとって説明する。
【0022】
図3は、実施例1に係る破線判断部160の処理フローチャートである。破線判断部160は、破線罫線メモリ150から破線を構成している要素矩形を取り出し(ステップ11)、分散計算部161は、要素矩形の高さ、幅、要素間距離について、それぞれの分散値A1、A2,A3(バラツキ)を算出する(ステップ12)。そして、かすれなどによるバラツキも考慮して、擬似破線であると判断できるそれぞれの閾値A1’、A2’、A3’を決定し、上記したバラツキが閾値以上であるとき、擬似破線であると判断する(ステップ13)。擬似破線と判断された破線を除去して真の破線を破線罫線メモリ170に格納する(ステップ14)。
【0023】
〈実施例2〉
上記した実施例では、除去できない擬似破線が存在する可能性がある。本実施例は、破線の識別精度を向上させたものであり、破線判断部160の比率計算部162のみが機能する。
【0024】
図4は、実施例2に係る破線判断部160の処理フローチャートである。破線判断部160は、破線罫線メモリ150から破線を構成している要素矩形を取り出し(ステップ21)、比率計算部162は、抽出された破線、もしくは抽出中の破線要素の幅と高さと要素間距離の値から、幅をW、高さをH、要素間距離をDとすると、DとW、WとH、DとHの比率B1、B2、B3をそれぞれ算出する(ステップ22)。比率の組み合わせとして全ての組み合わせを採ってもよいし、計算する値は平均値を採ってもよい。そして、一般的な擬似破線の各比率の特徴量を測定し、その特徴量を基にそれぞれの閾値B1’、B2’、B3’を決定し、上記した比率の値と閾値とを比較する。上記した比率が閾値以上のとき擬似破線であると判断して(ステップ23)、擬似破線と判断された破線を除去する(ステップ24)。
【0025】
〈実施例3〉
上記した実施例1、2では、除去できない擬似破線が存在する可能性がある。本実施例は、破線の識別精度をより向上させたものであり、破線判断部160の一定情報量占有率の計算部163のみが機能する。
【0026】
図5は、実施例3に係る破線判断部160の処理フローチャートである。破線判断部160は、破線罫線メモリ150から破線を構成している要素矩形を取り出し(ステップ31)、一定情報量占有率の計算部163は、抽出された破線、もしくは抽出中の破線要素の黒画素の比率Cを算出する(ステップ32)。
【0027】
図6は、文字矩形例と点線要素矩形例を示す。矩形の面積をSとし、矩形内の黒画素の面積(図6の例では文字aの面積)をBlackとすると、矩形の黒画素比率CをC=Black/Sと定義する。矩形が文字であれば黒画素比率は低く、破線要素であれば黒画素比率が高くなることを利用して、擬似破線か真の破線であるかを判定する。所定の閾値をC’として、破線を構成している要素矩形の黒画素比率Cまたは全要素矩形の黒画素比率の平均値Cavgを算出して、C<C’またはCavg<C’であれば(ステップ33)、要素矩形は文字矩形つまり擬似破線であると判定して除去する(ステップ34)。破線判断部160では、擬似破線と判定された破線を除去して破線罫線メモリ170に格納する。
【0028】
〈実施例4〉
上記した実施例3の処理方法を用いると、図7に示すLine2やLine4を擬似破線として簡単に除去することが可能となる。しかし、上記した実施例3の方法では、文字矩形から構成される擬似破線Line1やLine3を破線要素と区別することが難しい場合もある。そこで、本実施例は、図7に示す擬似破線Line1やLine3を除去する実施例である。
【0029】
本実施例の破線判断部160では、矩形位置と破線位置の比較計算部164を設けている。図8は、実施例4に係る破線判断部160の処理フローチャートである。比較計算部164では、抽出された破線、もしくは抽出中の破線そのものの位置情報と画像上の文字矩形の位置情報とを比較して、破線の位置と文字矩形の位置の差Dを算出し(ステップ42)、Dが所定の閾値以下D’であれば(ステップ43)、その破線は文字の矩形の一部から構成される擬似破線であると判定して除去する(ステップ44)。
【0030】
図9は、実施例4で除去する擬似点線の例(Line1)を示す。図中の点線は抽出された矩形の位置範囲を示す。上記したDは、横書きの文字の場合、矩形位置とLine1位置との横方向における距離である。このDの算出方法としては、Line1近傍に存在する任意の矩形との距離を算出するか、もしくは対象画像中に存在する全矩形との距離を算出するか、もしくはLine1近傍に存在する文字矩形と判断された矩形との距離を算出するなど、何れかの算出方法を採ればよい。本実施例では、算出された距離Dが所定の閾値以下であれば、Line1を擬似点線と判断して除去する。
【0031】
〈実施例5〉
上記した実施例1から4の処理では、除去できない擬似破線が存在する可能性がある。また、実施例4では、破線の位置情報と文字矩形の位置情報を比較判断しているだけであるので、小さい表や罫線と文字が近接しているような密な表の場合、真の破線であるにもかかわらず、擬似破線として誤って除去してしまう可能性がある。
【0032】
そこで、本実施例では、破線識別処理後または処理中に破線を構成している個々の要素矩形の画像上での位置情報と文字を構成している矩形の画像上での位置情報とを比較して、抽出された破線が文字の矩形要素から構成される擬似破線であるか否かを判定する手段を設けたものであり、これにより、破線の識別精度をさらに向上させている。
【0033】
図10は、実施例5に係る破線判断部160の処理フローチャートである。矩形位置と破線要素位置の比較計算部165は、抽出された破線、もしくは抽出中の破線要素の位置情報と文字矩形の位置情報とを比較して、破線要素の位置と文字矩形の位置の差Eを算出し(ステップ53)、差Eが所定の閾値E’以下であれば(ステップ54)、その破線要素は文字の矩形の一部から構成される擬似破線要素と判定し、カウントする(ステップ55)。
【0034】
図11は、実施例5で除去する擬似破線例である。図中のLine1は文字矩形l(エル)を破線要素として誤って識別した擬似破線を示す。実施例5では、Line1を構成している各要素に対して近傍矩形との距離Eを算出する。
【0035】
すなわち、その距離Eの算出方法は、以下に示すように両サイドの文字矩形の存在の有無を確かめる。図11の要素のl(エル)の文字矩形に注目し、l(エル)のYe座標値をbaselineとする。
【0036】
別に文字矩形として抽出されている矩形のYe座標値がdyeの範囲に存在し、かつ、
別に文字矩形として抽出されている矩形のXe座標値がdxLの範囲に、またはXs座標値がdxRの範囲に存在する。ここで、dye、dxL、dxRは所定の閾値である。
【0037】
上記の条件を破線要素数すべてについて満たしていれば、つまり、算出されたEが所定の閾値E’以下であれば、それは文字矩形(例えばl(エル)やI(アイ))であり、擬破線要素と判断できる。このようにLine1を構成している全要素に対して擬似破線要素か破線要素かの判定を行う。
【0038】
次に、Line1が擬似破線か否かの判定方法を説明する。破線の構成要素数をNとし、上記した処理で擬似破線要素と判定された数をNGnumとすると、N=NGnumまたはN=NGnum×2であれば、擬似破線と判定し(ステップ57)、擬似破線として除去する(ステップ58)。図11のLine1の構成要素数は3個であるので、擬似破線要素と判定された要素数が3個であればLine1を擬似破線と判定する。また、図11のLine3は構成要素数が6個であるので、擬似破線要素と判定される数が3個であれば、Line3を擬似破線と判定する。
【0039】
このように、本実施例では、各破線要素について擬似破線であるか否かを判定しているので、上記した実施例4に比べて確実に擬似破線を識別除外することができ、破線の抽出率が向上する。また、真の破線であっても、文字が破線の近辺に存在した場合は、実施例4の処理では誤って真の破線を擬似破線として除外してしまう可能性がある。これに対して、本実施例の処理では、破線要素の数と擬似破線要素の数を比較して判断しているために確実に擬似破線を識別し、除外することができる。
【0040】
〈実施例6〉
上記した実施例1、2では、抽出された破線を構成する要素間距離のバラツキ(分散)と比を計算しているが、本実施例ではこの計算結果を利用することによって、破線の種類を分類することが可能となる。また、本実施例では、破線の種類を分類した結果を罫線情報に加えて、罫線識別における詳細なデータを得ることができるとともに、表再現時に罫線の詳細な再現データを用いて、読み込んだ原稿に近い表を再現することができる。
【0041】
図12は、本発明の実施例6の構成を示す。図1に示す構成に、さらに、算出結果メモリ180、破線種類分別部190、罫線再現部200を設けている。他の構成要素は図1のものと同様である。図13は、実施例6の処理フローチャートである。
【0042】
分散計算部161と比率計算部162の算出結果が算出結果メモリ180に保持される。この算出結果を基に、破線種類分別部190は破線の種類を点線、一点鎖線、二点鎖線、その他に分類する(ステップ66)。
【0043】
図14は、破線種類分別部の処理フローチャートである。図15は、識別方向における破線要素の高さh、幅w、要素間距離dを示す。分類の方法は、識別された破線に対して、破線を構成している要素の高さ、幅、要素間距離のバラツキを表す値、例えば、分散値h、w、dを算出する(ステップ71)。所定の閾値をVとして、h、w、dが、h<Vかつw<Vかつd<Vの条件を満たせば(ステップ72)、破線を点線(構成要素が同じサイズである破線)と判断して、破線の種類を点線とラベリングする(ステップ73)。なお、上記所定の閾値Vはh、w、d毎に異なる場合もある。
【0044】
次いで、点線と判断されなかった場合には、一点および二点鎖線であるための条件を満たすか否かの判断条件に処理を進める。所定の閾値をV2、V3として(V2<V3)、h<V2かつd<V2かつw<V3を満たしていれば(ステップ74)、破線は一点もしくは二点鎖線であると判断して、一点、二点鎖線としてラベリングする(ステップ75)。
【0045】
一点、二点鎖線と判断された場合には、さらに詳細に分類する処理に進む。破線構成要素において、1つおきに位置している要素に対して、高さと幅の分散値h1、w1を算出する(ステップ76)。所定の閾値をV4とすると、h1<V4かつw1<V4を満たせば(ステップ77)、一点鎖線と判断してラベリングする(ステップ78)。
【0046】
次に、ラベリングされなかった場合には、2つおきに位置している要素に対して、同様に高さと幅の分散値h2、w2を算出する(ステップ79)。所定の閾値をV5とすると、h2<V5かつw2<V5を満たせば(ステップ80)、二点鎖線と判断してラベリングする(ステップ81)
また、DTPなどの罫線再現部200が罫線を再現するとき、破線種類分別部190の分類結果を用いて正しい罫線を再現することができる。
【0047】
〈実施例7〉
本実施例は、上記した各実施例を組み合わせたもので、擬似破線を精度よく除去することができ、高精度に破線を抽出することが可能となる。
【0048】
〈実施例8〉
本実施例は、上記した各実施例で擬似破線を除去し、正しく識別された破線について、その破線を構成している矩形にラベリングし、一度、識別に使用された矩形を明確化することによって、他の識別処理時の誤認を低減し、表処理構造認識と表再現処理の精度を向上させた実施例である。
【0049】
図16は、本発明の実施例8の構成を示し、図1の構成にさらに、矩形ラベリング部300、矩形メモリ310、他の識別処理部320を設けている。図17は、実施例8の処理フローチャートである。破線判断部160で正しく識別され、破線罫線メモリ170に格納されている破線について(ステップ95)、その破線を構成している矩形に対して、矩形ラベリング部300でラベリングする
(ステップ96)。
【0050】
ここで、ラベリングとは、例えば、正しく識別された破線を構成している矩形に対して、破線識別番号などを付けることを指す。また、例えば破線だけではなく、既に正しく識別されている実線などの罫線類、その他の識別処理に使用された矩形についても同様にラベリングされる。
【0051】
ラベリングされた矩形は矩形メモリ310に保持される。この矩形メモリ310としては、メモリ130を用いてもよい。破線の識別処理が終了した後、他の識別処理320を行うとき、矩形メモリ310内の矩形ラベリング情報を利用して、その矩形が罫線等の矩形であるか否かを判断し、現識別処理とは関係のない矩形を除いて識別処理を進めることができる。
【0052】
つまり、従来は、他の識別処理を行うとき、再度、2値画像の入力100→2値イメージメモリへの格納110→矩形抽出120→矩形メモリ130への格納と処理を進めるか、あるいは矩形メモリ130の矩形情報を利用しているが、本実施例では、この矩形メモリ130の矩形情報に、ラベリングされた矩形情報が追加されるため、識別処理を容易に行うことができ、これにより誤認織の低減、高速処理を実現することができる。
【0053】
〈実施例9〉
図18は、本発明の実施例9の構成を示し、ソフトウェアによって実現する実施例である。本発明をソフトウェアによって実現する場合には、図18に示すように、CPU、ROM、RAM、表示装置、ハードディスク、キーボード、CD−ROMドライブ、スキャナなどからなる汎用の処理装置を用意し、CD−ROMなどのコンピュータ読み取り可能な記録媒体には、本発明の破線識別機能を実現するプログラムが記録されている。また、スキャナなどから入力された文書などの画像は一時的にハードディスクなどに格納される。そして、該プログラムが起動されると、一時保存された画像データが読み込まれて、破線識別処理を実行し、その識別結果をディスプレイなどに出力する。
【0054】
【発明の効果】
以上、説明したように、本発明によれば、破線要素の大きさ、破線要素間の距離などの情報のバラツキを計算し、そのバラツキを基に擬似破線であるか破線であるかを識別しているので、かすれている実線などを除去することができ、正しく破線を識別することができる。
【0055】
本発明によれば、破線要素の幅、高さ、破線要素間の距離のそれぞれの比を基に擬似破線であるか破線であるかを識別しているので、精度よく擬似破線またはかすれている実線などを除去することができる。
【0056】
本発明によれば、破線要素に占める黒画素または白画素の面積率を基に擬似破線であるか破線であるかを識別しているので、精度よく擬似破線またはかすれている実線などを除去することができる。
【0057】
本発明によれば、破線の位置情報と文字矩形の位置情報との差を基に破線であるか擬似破線であるかを識別しているので、擬似破線を除去する精度が向上し、正しく破線を識別することができる。
【0058】
本発明によれば、破線要素の位置情報と文字矩形の位置情報との差を基に破線であるか擬似破線であるかを識別しているので、擬似破線を除去する精度が一層向上し、正しく破線を識別することができる。
【0059】
本発明によれば、破線の種類を点線、一点鎖線、二点鎖線などに識別可能であるので、罫線を精度よく再現することができる。
【0060】
本発明によれば、上記した各識別方法を適宜組み合わせているので、擬似破線を除去する精度がより一層向上し、高精度に破線を抽出することができる。
【0061】
本発明によれば、正しく識別された破線を構成している矩形に対してラベリングをしているので、他の識別処理時にそのラベリング情報を使用することによって、誤識別が防止され、破線の識別率が向上する。
【図面の簡単な説明】
【図1】 本発明の実施例1から5に共通する構成を示す。
【図2】 本発明の実施例1から5に共通する全体の処理フローチャートである。
【図3】 実施例1に係る破線判断部160の処理フローチャートである。
【図4】 実施例2に係る破線判断部160の処理フローチャートである。
【図5】 実施例3に係る破線判断部160の処理フローチャートである。
【図6】 文字矩形例と点線要素矩形例を示す。
【図7】 擬似破線の例を示す。
【図8】 実施例4に係る破線判断部160の処理フローチャートである。
【図9】 実施例4で除去する擬似破線の例を示す。
【図10】 実施例5に係る破線判断部160の処理フローチャートである。
【図11】 実施例5で除去する擬似破線例である。
【図12】 本発明の実施例6の構成を示す。
【図13】 実施例6の処理フローチャートである。
【図14】 破線種類分別部の処理フローチャートである。
【図15】 識別方向における破線要素の高さh、幅w、要素間距離dを示す。
【図16】 本発明の実施例8の構成を示す。
【図17】 実施例8の処理フローチャートである。
【図18】 本発明の実施例9の構成を示す。
【符号の説明】
100 2値画像入力部
110 2値イメージメモリ
120 矩形抽出部
130 矩形メモリ
140 破線罫線抽出部
150 破線罫線メモリ
160 破線判断部
161 分散計算部
162 比率計算部
163 一定情報量占有率の計算部
164 矩形位置と破線位置の比較計算部
165 矩形位置と破線要素位置の比較計算部
170 破線罫線メモリ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a broken line identifying device and a recording medium that accurately identify a broken line and a pseudo broken line.
[0002]
[Prior art]
As a method for recognizing dotted ruled lines constituting a table, for example, there is a ruled line recognition method described in JP-A-7-230525. In this method, a rectangle having a predetermined threshold value or less is extracted as a dotted line element, and a rectangle obtained by integrating elements whose interval between the elements is within a predetermined threshold value is extracted as a dotted ruled line. Also, the validity of the ruled line is determined based on the respective variance values of the size of the rectangle and the interval between the rectangles.
[0003]
[Problems to be solved by the invention]
However, if the rectangle extraction process is performed with a predetermined threshold as described above, there is a possibility that, for example, a rectangle forming a character is erroneously extracted as a broken line component. In addition, there is a problem that a broken line cannot be extracted correctly when the image is skewed or there is noise.
[0004]
An object of the present invention is to calculate the amount of variation (statistics such as variance) of the size and the distance between the elements (interval between broken lines) of the elements constituting the broken line after or during the broken line identification process. It is an object of the present invention to provide a broken line identification device and a recording medium in which the identification accuracy of a broken line is improved by removing those above a predetermined threshold value as pseudo broken lines.
[0005]
[Means for Solving the Problems]
In order to achieve the above object, according to the first aspect of the present invention, a rectangle extracting means for extracting a rectangle in which black pixel connected components are integrated from a document image, and a rectangle constituting a broken line from the extracted rectangle (hereinafter, a broken line). A broken line identifying device comprising: a broken line extracting means for extracting (element); and a broken line identifying means for identifying whether the broken line element is a broken line or a pseudo broken line composed of a part of a character rectangle based on the broken line element. The broken line identifying means identifies whether the line is a broken line or a pseudo broken line based on the difference between the position information of the broken line and the position information of the character rectangle.
[0006]
In the second aspect of the present invention, a rectangle extraction means for extracting a rectangle that integrates the black pixel connected component from the document image, the rectangle which constitutes the broken line from the extracted rectangle (hereinafter, broken line element) dashed line to extract the extract And a broken line identifying device comprising a broken line identifying means for identifying whether the broken line is based on the broken line element or a pseudo broken line composed of a part of a character rectangle. it is characterized by identifying whether the pseudo dashed or a broken line based on the difference between the position information and the character rectangle position information of the broken line element.
[0007]
The invention described in claim 3 is characterized in that each means of the broken line identifying device described in claim 1 or 2 is a computer-readable recording medium recording a program for causing a computer to function.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
Before describing each embodiment of the present invention, first, terms used in the present invention will be defined. Rectangle / Rectangle extraction:
The image includes a continuous image, or a continuous image portion that is equal to or greater than a predetermined threshold (for example, a continuous black pixel portion or a continuous white image portion for a binary image) as a lump. In this way, the range surrounded by the circumscribed rectangle is defined as a rectangle, and extracting the position coordinates is defined as rectangle extraction.
[0015]
Dashed line / dashed line element / pseudo-dashed line:
Lines other than solid lines are defined as broken lines. That is, the broken line is a general term including a dotted line, a one-dot chain line, a two-dot chain line, and the like. A rectangle constituting the broken line is defined as a broken line element. For example, in the case of a binary image, it refers to a black pixel rectangle. A broken line mistakenly identified as a broken line, regardless of whether it is not a broken line, is called a pseudo-broken line. For example, a part of a rectangle constituting a character is a target of broken line identification processing, and the broken line extracted as a result of erroneous recognition is equivalent to this pseudo broken line.
[0016]
Distance between elements:
This is the distance between the elements constituting the broken line. This distance represents, for example, the difference between the position coordinates of the elements and the length of the continuous white image portion between the black pixel elements if the element is a binary image composed of black pixels.
[0017]
FIG. 1 shows a configuration common to the first to fifth embodiments of the present invention. FIG. 2 is an overall process flowchart common to the first to fifth embodiments of the present invention. The binary image input unit 100 is an image input unit such as a scanner. Although it is captured here as a binary image, it may be a multi-valued image. The image input from the binary image input unit 100 is stored in the binary image memory 110 (step 1).
[0018]
Next, the rectangle extraction unit 120 extracts a rectangle using the data of the binary image memory 110 and stores it in the rectangle memory 130 (step 2). The broken line ruled line extraction unit 140 extracts broken lines using the rectangular information in the memory 130 (step 3). As long as the broken line extraction process is a method for identifying a broken line, any method may be used. The broken line extracted by the broken line ruled line extraction unit 140 is stored in the broken line ruled line memory 150 (step 4). If it is not extracted, the process ends. At this stage, a pseudo broken line is also included as a broken line. As will be described in detail below, the broken line determination unit 160 removes the pseudo broken line and sorts it into a pseudo broken line and a true broken line (step 5). This pseudo broken line removal process is performed for all the extracted broken lines (step 6).
[0019]
The broken line determination unit 160 includes a variance calculation unit 161, a ratio calculation unit 162, a constant information amount occupation rate calculation unit 163, a rectangular position and broken line position comparison calculation unit 164, and a rectangular position and broken line element position comparison calculation unit 165. ing. The remaining true broken line from which the pseudo broken line is removed by the broken line determination unit 160 is stored in the broken line ruled line memory 170. Here, the memory 170 is provided exclusively as a broken line memory, but the memory 150 may be shared.
[0020]
In FIG. 1, the broken line is extracted by the broken line extraction unit 140 and then the broken line is determined by the broken line determination unit 160. However, the processing order may be determined while extracting the broken line.
[0021]
<Example 1>
In the first embodiment, only the variance calculation unit 161 of the broken line determination unit 160 functions. The variance calculation unit 161 calculates variations in the width and height of the extracted broken line in the broken line ruled line memory 150 or the broken line element being extracted and the distance between elements. Here, as an example showing the variation, for example, the distribution of statistical processing will be described.
[0022]
FIG. 3 is a process flowchart of the broken line determination unit 160 according to the first embodiment. The broken line determination unit 160 takes out the element rectangle constituting the broken line from the broken line ruled line memory 150 (step 11), and the variance calculation unit 161 sets the respective variance values A1 for the height, width, and inter-element distance of the element rectangle. , A2, A3 (variation) are calculated (step 12). Then, taking into account variations due to blurring, etc., the respective threshold values A1 ′, A2 ′, A3 ′ that can be determined to be pseudo-broken lines are determined, and when the above-described variations are greater than or equal to the threshold values, it is determined to be pseudo-broken lines (Step 13). The broken line determined to be a pseudo broken line is removed and the true broken line is stored in the broken line ruled line memory 170 (step 14).
[0023]
<Example 2>
In the embodiment described above, there may be a pseudo-dashed line that cannot be removed. In this embodiment, the identification accuracy of the broken line is improved, and only the ratio calculation unit 162 of the broken line determination unit 160 functions.
[0024]
FIG. 4 is a process flowchart of the broken line determination unit 160 according to the second embodiment. The broken line determination unit 160 takes out the element rectangle constituting the broken line from the broken line ruled line memory 150 (step 21), and the ratio calculation unit 162 calculates the width and height of the extracted broken line or the broken line element being extracted and the distance between the elements. From the distance values, if the width is W, the height is H, and the distance between elements is D, D and W, W and H, and D and H ratios B1, B2, and B3 are calculated (step 22). All combinations may be adopted as the combination of ratios, and the calculated value may be an average value. Then, the characteristic amount of each ratio of the general pseudo broken line is measured, the respective threshold values B1 ′, B2 ′, and B3 ′ are determined based on the characteristic amount, and the above-described ratio value and the threshold value are compared. When the above ratio is equal to or greater than the threshold value, it is determined that it is a pseudo broken line (step 23), and the broken line determined to be a pseudo broken line is removed (step 24).
[0025]
<Example 3>
In the first and second embodiments described above, there may be a pseudo-dashed line that cannot be removed. In the present embodiment, the identification accuracy of the broken line is further improved, and only the constant information amount occupation rate calculation unit 163 of the broken line determination unit 160 functions.
[0026]
FIG. 5 is a process flowchart of the broken line determination unit 160 according to the third embodiment. The broken line determination unit 160 takes out the element rectangle constituting the broken line from the broken line ruled line memory 150 (step 31), and the constant information amount occupation rate calculation unit 163 calculates the black line of the extracted broken line or the broken line element being extracted. A pixel ratio C is calculated (step 32).
[0027]
FIG. 6 shows a character rectangle example and a dotted line element rectangle example. When the area of the rectangle is S and the area of the black pixel in the rectangle (the area of the character a in the example of FIG. 6) is Black, the rectangular black pixel ratio C is defined as C = Black / S. If the rectangle is a character, the black pixel ratio is low, and if it is a broken line element, the black pixel ratio is high, and it is determined whether it is a pseudo broken line or a true broken line. When C ′ is a predetermined threshold value, an average value Cavg of the black pixel ratios of the element rectangles constituting the broken lines or the black pixel ratios of all the element rectangles is calculated, and if C <C ′ or Cavg <C ′. (Step 33), it is determined that the element rectangle is a character rectangle, that is, a pseudo-dashed line, and is removed (Step 34). The broken line determination unit 160 removes the broken line determined to be a pseudo broken line and stores it in the broken line ruled line memory 170.
[0028]
<Example 4>
If the processing method of Example 3 described above is used, Line 2 and Line 4 shown in FIG. 7 can be easily removed as pseudo-broken lines. However, in the above-described method according to the third embodiment, it may be difficult to distinguish the pseudo-dashed lines Line1 and Line3 formed from character rectangles from the broken-line elements. Therefore, the present embodiment is an embodiment in which the pseudo broken lines Line1 and Line3 shown in FIG. 7 are removed.
[0029]
In the broken line determination unit 160 of the present embodiment, a comparison calculation unit 164 between the rectangular position and the broken line position is provided. FIG. 8 is a process flowchart of the broken line determination unit 160 according to the fourth embodiment. The comparison calculation unit 164 compares the position information of the extracted broken line or the extracted broken line itself with the position information of the character rectangle on the image, and calculates the difference D between the position of the broken line and the position of the character rectangle ( Step 42) If D is equal to or less than a predetermined threshold value D '(step 43), the broken line is determined to be a pseudo broken line composed of a part of a character rectangle and removed (step 44).
[0030]
FIG. 9 shows an example (Line 1) of the pseudo dotted line removed in the fourth embodiment. The dotted line in the figure indicates the extracted rectangular position range. In the case of horizontally written characters, the above D is the distance in the horizontal direction between the rectangular position and the Line1 position. As a calculation method of D, a distance from an arbitrary rectangle existing near Line 1 is calculated, a distance from all rectangles existing in the target image is calculated, or a character rectangle existing near Line 1 is calculated. Any calculation method may be employed, such as calculating the distance to the determined rectangle. In this embodiment, if the calculated distance D is equal to or less than a predetermined threshold, Line 1 is determined to be a pseudo dotted line and removed.
[0031]
<Example 5>
In the processes of the first to fourth embodiments described above, there may be a pseudo broken line that cannot be removed. In the fourth embodiment, since only the position information of the broken line and the position information of the character rectangle are compared and determined, the true broken line is obtained in the case of a small table or a dense table where the ruled line is close to the character. In spite of this, there is a possibility that it is erroneously removed as a pseudo broken line.
[0032]
Therefore, in the present embodiment, after the broken line identification process or during the process, the position information on the individual element rectangle image constituting the broken line is compared with the position information on the rectangular image constituting the character. Thus, there is provided means for determining whether or not the extracted broken line is a pseudo broken line composed of rectangular elements of characters, thereby further improving the identification accuracy of the broken line.
[0033]
FIG. 10 is a process flowchart of the broken line determination unit 160 according to the fifth embodiment. The comparison calculation unit 165 of the rectangle position and the broken line element position compares the position information of the extracted broken line or the broken line element being extracted with the position information of the character rectangle, and the difference between the position of the broken line element and the position of the character rectangle E is calculated (step 53), and if the difference E is equal to or smaller than a predetermined threshold E ′ (step 54), the broken line element is determined to be a pseudo broken line element composed of a part of a character rectangle and counted ( Step 55).
[0034]
FIG. 11 is an example of a pseudo broken line to be removed in the fifth embodiment. Line 1 in the figure indicates a pseudo broken line in which the character rectangle l (el) is erroneously identified as a broken line element. In the fifth embodiment, a distance E between each element constituting Line 1 and a nearby rectangle is calculated.
[0035]
That is, the calculation method of the distance E confirms the presence or absence of character rectangles on both sides as shown below. Attention is paid to the l (el) character rectangle of the element of FIG. 11, and the Ye coordinate value of l (el) is assumed to be baseline.
[0036]
Separately, the Ye coordinate value of a rectangle extracted as a character rectangle exists in the range of dye, and
Separately, a rectangle extracted as a character rectangle has an Xe coordinate value in the range of dxL, or an Xs coordinate value in the range of dxR. Here, dye, dxL, and dxR are predetermined threshold values.
[0037]
If the above condition is satisfied for all the numbers of broken line elements, that is, if the calculated E is equal to or less than the predetermined threshold value E ′, it is a character rectangle (for example, l (el) or I (eye)), and pseudo It can be determined as a broken line element. In this way, it is determined whether all the elements constituting Line1 are pseudo broken line elements or broken line elements.
[0038]
Next, a method for determining whether Line1 is a pseudo-dashed line will be described. Assuming that the number of broken line components is N and the number determined as a pseudo broken line element in the above processing is NGnum, if N = NGnum or N = NGnum × 2, the line is determined to be a pseudo broken line (step 57). It is removed as a broken line (step 58). Since the number of components of Line 1 in FIG. 11 is 3, if the number of elements determined to be a pseudo broken line element is 3, Line 1 is determined to be a pseudo broken line. In addition, since Line 3 in FIG. 11 has six constituent elements, Line 3 is determined to be a pseudo broken line if the number determined to be a pseudo broken line element is three.
[0039]
As described above, in this embodiment, since it is determined whether or not each broken line element is a pseudo broken line, it is possible to reliably identify and exclude the pseudo broken line as compared with the above-described fourth embodiment, and to extract the broken line. The rate is improved. Even if it is a true broken line, if the character exists in the vicinity of the broken line, there is a possibility that the true broken line is erroneously excluded as a pseudo broken line in the processing of the fourth embodiment. On the other hand, in the process of the present embodiment, since the number of broken line elements and the number of pseudo broken line elements are compared and determined, the pseudo broken lines can be identified and excluded reliably.
[0040]
<Example 6>
In the first and second embodiments described above, the variation (dispersion) and ratio of the distances between the elements constituting the extracted broken line are calculated. In this embodiment, the type of the broken line is determined by using this calculation result. It becomes possible to classify. In addition, in this embodiment, the result of classifying the types of broken lines can be added to the ruled line information to obtain detailed data for ruled line identification, and the read original using the detailed reproduced data of the ruled lines during table reproduction A table close to can be reproduced.
[0041]
FIG. 12 shows the configuration of Embodiment 6 of the present invention. In addition to the configuration shown in FIG. 1, a calculation result memory 180, a broken line type classification unit 190, and a ruled line reproduction unit 200 are further provided. Other components are the same as those in FIG. FIG. 13 is a processing flowchart of the sixth embodiment.
[0042]
Calculation results of the variance calculation unit 161 and the ratio calculation unit 162 are held in the calculation result memory 180. Based on the calculation result, the broken line type classification unit 190 classifies the broken line types into a dotted line, a one-dot chain line, a two-dot chain line, and others (step 66).
[0043]
FIG. 14 is a processing flowchart of the broken line type classification unit. FIG. 15 shows the height h, width w, and inter-element distance d of the broken line element in the identification direction. In the classification method, for the identified broken line, values representing variations in the height, width, and distance between elements constituting the broken line, for example, variance values h, w, and d are calculated (step 71). ). If h, w, and d satisfy the conditions of h <V and w <V and d <V with a predetermined threshold value V (step 72), the broken line is determined to be a dotted line (a broken line whose components are the same size). Then, the type of the broken line is labeled as a dotted line (step 73). The predetermined threshold V may be different for each of h, w, and d.
[0044]
Next, when it is not determined as a dotted line, the process proceeds to a determination condition as to whether or not a condition for being a one-point and two-dot chain line is satisfied. If the predetermined threshold values are V2 and V3 (V2 <V3), and h <V2, d <V2 and w <V3 are satisfied (step 74), it is determined that the broken line is a one-point or two-dot chain line. , And label as a two-dot chain line (step 75).
[0045]
If it is determined to be a one-point or two-dot chain line, the process proceeds to a more detailed classification process. In the broken line constituent elements, height and width dispersion values h1 and w1 are calculated for every other element (step 76). Assuming that the predetermined threshold value is V4, if h1 <V4 and w1 <V4 are satisfied (step 77), it is determined as a one-dot chain line and is labeled (step 78).
[0046]
Next, when the labeling is not performed, the variance values h2 and w2 of the height and the width are similarly calculated for every other element (step 79). Assuming that the predetermined threshold value is V5, if h2 <V5 and w2 <V5 are satisfied (step 80), a two-dot chain line is determined and labeling is performed (step 81).
Further, when the ruled line reproduction unit 200 such as DTP reproduces the ruled line, the correct ruled line can be reproduced using the classification result of the broken line type classifying unit 190.
[0047]
<Example 7>
The present embodiment is a combination of the above-described embodiments. The pseudo broken line can be accurately removed, and the broken line can be extracted with high accuracy.
[0048]
<Example 8>
In this embodiment, the pseudo-broken line is removed in each of the above-described embodiments, and the correctly identified broken line is labeled to the rectangle constituting the broken line, and once the rectangle used for identification is clarified. This is an embodiment in which the misrecognition during other identification processing is reduced and the accuracy of the table processing structure recognition and the table reproduction processing is improved.
[0049]
FIG. 16 shows the configuration of the eighth embodiment of the present invention. In addition to the configuration of FIG. 1, a rectangular labeling unit 300, a rectangular memory 310, and another identification processing unit 320 are provided. FIG. 17 is a process flowchart of the eighth embodiment. With respect to the broken lines correctly identified by the broken line determination unit 160 and stored in the broken line ruled line memory 170 (step 95), the rectangles constituting the broken lines are labeled by the rectangular labeling unit 300 (step 96).
[0050]
Here, labeling refers to, for example, attaching a broken line identification number or the like to a rectangle that forms a correctly identified broken line. For example, not only broken lines but also ruled lines such as solid lines that have already been correctly identified and rectangles used for other identification processes are similarly labeled.
[0051]
The labeled rectangle is held in the rectangle memory 310. As the rectangular memory 310, the memory 130 may be used. When another identification process 320 is performed after the broken line identification process is completed, it is determined whether or not the rectangle is a rectangle such as a ruled line using the rectangular labeling information in the rectangular memory 310, and the current identification process is performed. It is possible to proceed with the identification process except for rectangles that are unrelated to.
[0052]
In other words, conventionally, when another identification process is performed, the process of the binary image input 100 → the storage in the binary image memory 110 → the rectangular extraction 120 → the storage in the rectangular memory 130 or the process proceeds again. In this embodiment, since the labeled rectangular information is added to the rectangular information in the rectangular memory 130, the identification process can be easily performed. Reduction and high-speed processing can be realized.
[0053]
<Example 9>
FIG. 18 shows the configuration of the ninth embodiment of the present invention, which is an embodiment realized by software. When the present invention is realized by software, as shown in FIG. 18, a general-purpose processing device including a CPU, a ROM, a RAM, a display device, a hard disk, a keyboard, a CD-ROM drive, a scanner, and the like is prepared. A computer readable recording medium such as a ROM records a program for realizing the broken line identification function of the present invention. An image such as a document input from a scanner or the like is temporarily stored in a hard disk or the like. When the program is started, the temporarily stored image data is read, a broken line identification process is executed, and the identification result is output to a display or the like.
[0054]
【The invention's effect】
As described above, according to the present invention , the variation in information such as the size of the broken line element and the distance between the broken line elements is calculated, and whether it is a pseudo broken line or a broken line is identified based on the variation. Therefore, it is possible to remove a faint solid line and correctly identify a broken line.
[0055]
According to the present invention , since the pseudo broken line or the broken line is identified based on the ratios of the width, the height of the broken line element, and the distance between the broken line elements, the pseudo broken line or the blurred line is accurately obtained. Solid lines can be removed.
[0056]
According to the present invention , since the pseudo broken line or the broken line is identified based on the area ratio of the black pixel or the white pixel occupied in the broken line element, the pseudo broken line or the solid line that is blurred is accurately removed. be able to.
[0057]
According to the present invention , since it is identified whether it is a broken line or a pseudo broken line based on the difference between the position information of the broken line and the position information of the character rectangle, the accuracy of removing the pseudo broken line is improved, and the broken line is correctly Can be identified.
[0058]
According to the present invention , since the broken line or the pseudo broken line is identified based on the difference between the position information of the broken line element and the position information of the character rectangle, the accuracy of removing the pseudo broken line is further improved, The broken line can be correctly identified.
[0059]
According to the present invention , the type of broken line can be identified as a dotted line, a one-dot chain line, a two-dot chain line, etc., so that a ruled line can be accurately reproduced.
[0060]
According to the present invention , since the above-described identification methods are appropriately combined, the accuracy of removing the pseudo broken line is further improved, and the broken line can be extracted with high accuracy.
[0061]
According to the present invention , since the rectangles constituting the correctly identified broken lines are labeled, the misidentification is prevented by using the labeling information during other identification processing, and the broken line identification is performed. The rate is improved.
[Brief description of the drawings]
FIG. 1 shows a configuration common to Embodiments 1 to 5 of the present invention.
FIG. 2 is an overall process flowchart common to Embodiments 1 to 5 of the present invention.
FIG. 3 is a process flowchart of a broken line determination unit 160 according to the first embodiment.
FIG. 4 is a process flowchart of a broken line determination unit 160 according to the second embodiment.
FIG. 5 is a process flowchart of a broken line determination unit 160 according to the third embodiment.
FIG. 6 shows an example of a character rectangle and an example of a dotted line element rectangle.
FIG. 7 shows an example of a pseudo broken line.
FIG. 8 is a process flowchart of a broken line determination unit 160 according to the fourth embodiment.
FIG. 9 shows an example of a pseudo broken line to be removed in the fourth embodiment.
FIG. 10 is a process flowchart of a broken line determination unit 160 according to the fifth embodiment.
FIG. 11 is an example of a pseudo broken line to be removed in the fifth embodiment.
FIG. 12 shows a configuration of Example 6 of the present invention.
FIG. 13 is a process flowchart of Embodiment 6.
FIG. 14 is a processing flowchart of a broken line type classification unit;
FIG. 15 shows the height h, width w, and inter-element distance d of broken line elements in the identification direction.
FIG. 16 shows a configuration of an eighth embodiment of the present invention.
FIG. 17 is a processing flowchart of the eighth embodiment.
FIG. 18 shows a configuration of Example 9 of the present invention.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 100 Binary image input part 110 Binary image memory 120 Rectangle extraction part 130 Rectangle memory 140 Broken line ruled line extraction part 150 Broken line ruled line memory 160 Broken line judgment part 161 Variance calculation part 162 Ratio calculation part 163 Constant information amount occupation ratio calculation part 164 Rectangle Position and broken line position comparison calculation unit 165 Comparison calculation unit between rectangular position and broken line element position 170 Broken line ruled line memory

Claims (3)

文書画像から黒画素連結成分を統合した矩形を抽出する矩形抽出手段と、該抽出された矩形から破線を構成する矩形(以下、破線要素)を抽出する破線抽出手段と、該破線要素を基に破線であるか、文字矩形の一部から構成されている擬似破線であるかを識別する破線識別手段を備えた破線識別装置であって、前記破線識別手段は、前記破線の位置情報と文字矩形の位置情報との差を基に破線であるか擬似破線であるかを識別することを特徴とする破線識別装置 A block extracting means for extracting a rectangle that integrates the black pixel connected component from the document image, the rectangle which constitutes the broken line from the extracted rectangle (hereinafter, broken line element) and the broken line extracting means for extracting, based on該破line elements A broken line identifying device comprising a broken line identifying means for identifying whether it is a broken line or a pseudo broken line composed of a part of a character rectangle, wherein the broken line identifying means includes position information of the broken line and a character rectangle A broken line identifying device that identifies whether the line is a broken line or a pseudo broken line based on a difference from the position information. 文書画像から黒画素連結成分を統合した矩形を抽出する矩形抽出手段と、該抽出された矩形から破線を構成する矩形(以下、破線要素)を抽出する破線抽出手段と、該破線要素を基に破線であるか、文字矩形の一部から構成されている擬似破線であるかを識別する破線識別手段を備えた破線識別装置であって、前記破線識別手段は、前記破線要素の位置情報と文字矩形の位置情報との差を基に破線であるか擬似破線であるかを識別することを特徴とする破線識別装置 Rectangle extraction means for extracting a rectangle in which black pixel connected components are integrated from a document image, broken line extraction means for extracting a rectangle constituting a broken line (hereinafter, a broken line element) from the extracted rectangle, and based on the broken line element A broken line identification device comprising a broken line identifying means for identifying whether a broken line or a pseudo broken line composed of a part of a character rectangle, wherein the broken line identifying means includes position information and characters of the broken line element A broken line identifying apparatus that identifies whether a broken line or a pseudo broken line based on a difference from rectangular position information. 請求項1または2記載の破線識別装置の各手段として、コンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。A computer-readable recording medium recording a program for causing a computer to function as each means of the broken line identifying device according to claim 1 .
JP13791198A 1997-05-30 1998-05-20 Broken line identification device and recording medium Expired - Lifetime JP3753354B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13791198A JP3753354B2 (en) 1997-05-30 1998-05-20 Broken line identification device and recording medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP14135597 1997-05-30
JP9-141355 1997-05-30
JP13791198A JP3753354B2 (en) 1997-05-30 1998-05-20 Broken line identification device and recording medium

Publications (2)

Publication Number Publication Date
JPH1145339A JPH1145339A (en) 1999-02-16
JP3753354B2 true JP3753354B2 (en) 2006-03-08

Family

ID=26471074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13791198A Expired - Lifetime JP3753354B2 (en) 1997-05-30 1998-05-20 Broken line identification device and recording medium

Country Status (1)

Country Link
JP (1) JP3753354B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4791295B2 (en) * 2006-08-31 2011-10-12 富士通株式会社 Ruled line extraction program, ruled line extraction device, ruled line extraction method
US9367899B1 (en) * 2015-05-29 2016-06-14 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method

Also Published As

Publication number Publication date
JPH1145339A (en) 1999-02-16

Similar Documents

Publication Publication Date Title
JP3904840B2 (en) Ruled line extraction device for extracting ruled lines from multi-valued images
Gllavata et al. A robust algorithm for text detection in images
KR100480781B1 (en) Method of extracting teeth area from teeth image and personal identification method and apparatus using teeth image
KR20010110416A (en) Video stream classifiable symbol isolation method and system
JP2000207489A (en) Character extracting method and device and record medium
CN113688838B (en) Red handwriting extraction method and system, readable storage medium and computer equipment
JP4049560B2 (en) Halftone dot removal method and system
JP3416058B2 (en) Character extraction method of gray image and recording medium recording the program
JP3753354B2 (en) Broken line identification device and recording medium
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JPH08190690A (en) Method for determining number plate
JP2005250786A (en) Image recognition method
JP3835652B2 (en) Method for determining Japanese / English of document image and recording medium
JP4409713B2 (en) Document image recognition apparatus and recording medium
JP3423889B2 (en) Pattern recognition method and recording medium recording pattern recognition program
JP3462727B2 (en) Character string binarization device
JP7277879B2 (en) License plate recognition program and license plate recognition device
JP4732626B2 (en) Form processing method, apparatus, and program
JP3411795B2 (en) Character recognition device
JP4248700B2 (en) Ruled line identification method, ruled line identification apparatus and recording medium
JP3412441B2 (en) Image processing device
JP3756660B2 (en) Image recognition method, apparatus and recording medium
JPH10154191A (en) Business form identification method and device, and medium recording business form identification program
JP3734614B2 (en) Image processing method, apparatus, and recording medium
CN112132141A (en) Character merging method and device, electronic equipment and storage medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051209

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131222

Year of fee payment: 8

EXPY Cancellation because of completion of term