JPH06203165A - 画像情報処理方法及び装置 - Google Patents

画像情報処理方法及び装置

Info

Publication number
JPH06203165A
JPH06203165A JP5001229A JP122993A JPH06203165A JP H06203165 A JPH06203165 A JP H06203165A JP 5001229 A JP5001229 A JP 5001229A JP 122993 A JP122993 A JP 122993A JP H06203165 A JPH06203165 A JP H06203165A
Authority
JP
Japan
Prior art keywords
image information
pattern
intersection
position coordinates
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5001229A
Other languages
English (en)
Inventor
Akihiro Matsumoto
昭浩 松本
Toru Futaki
徹 二木
Tadanori Nakatsuka
忠則 中塚
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5001229A priority Critical patent/JPH06203165A/ja
Publication of JPH06203165A publication Critical patent/JPH06203165A/ja
Priority to US08/685,779 priority patent/US5774584A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 入力画像において、表の水平及び垂直方向に帯状の小規
模な範囲におけるヒストグラムをとることによりピーク
位置座標を求め、それをもとに表内の交点座標を探した
り、交点でパターンを切り出して辞書パターンと比較す
ることによってその交点の種類を識別することによって
セル領域を指定する技術。これにより、表内のセル領域
指定の際に、処理時間の短縮及びかすれにより表罫線の
切れているものや変形した表においても、より高精度に
セル領域の指定が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、表領域であると認識さ
れている画像データから表内のセル領域を識別し得る画
像情報処理方法及び装置に関するものである。
【0002】
【従来の技術】従来の画像処理装置では領域分割手段に
よって、表領域であると認識された領域において表内部
のセル領域を求める場合には、輪郭線追跡によって罫線
の連続性を調べて行き、水平及び垂直方向のつながり具
合から表内の交点の位置座標を探して、セル領域を確定
する方法などが取られていた。
【0003】
【発明が解決しようとする課題】しかしながら、上述の
ような従来技術では、処理時間にかなりの時間を要し、
また原画像において表の罫線の一部がかすれ等によって
切れていた場合には、そこにおいて罫線の連続性が失わ
れ、輪郭線追跡では正しく表内のセル領域を確定できな
い場合が生ずるなどの問題点があった。
【0004】本発明の目的は、上述の点を鑑みて、表内
のセル領域を指定する際の処理時間の短縮及びセル領域
指定の精度向上を図った画像処理装置を提供することに
ある。
【0005】
【課題を解決するための手段】上記課題を解決するため
に、本発明は画像情報を入力し、前記入力した画像情報
において、水平及び垂直方向に射影をとり、ヒストグラ
ムを作成し、前記作成したヒストグラムよりピーク位置
座標とピーク幅を求め、前記ピーク幅から表罫線の平均
幅を求め、該表罫線平均幅から求めた幅で、前記求めた
ピーク位置座標を基準として水平及び垂直方向にそれぞ
れ小ヒストグラムを作成し、該小ヒストグラムよりピー
ク位置座標を決定することを特徴とする画像情報処理方
法及び装置を提供する。
【0006】上記課題を解決するために、本発明は画像
情報を入力し、前記入力した画像情報において、水平及
び垂直方向に射影をとり、ヒストグラムを作成し、前記
作成したヒストグラムよりピーク位置座標とピーク幅を
求め、前記ピーク幅から表罫線の平均幅を求め、該表罫
線平均幅から交点で切り出すパターンの大きさを決定
し、前記求めた水平及び垂直方向のピーク位置座標を用
いて表内の交点位置座標を予測し、前記予測された交点
位置座標で前記入力した画像情報からパターンを切り出
し、前記切り出されたパターンから交点の種類を決定す
ることを特徴とする画像情報処理方法及び装置を提供す
る。
【0007】上記課題を解決するために、本発明は好ま
しくは前記交点の種類の決定は、パターン辞書と比較す
ることにより行う。
【0008】上記課題を解決するために、本発明は好ま
しくは前記パターン辞書は、前記決定された切り出しパ
ターンの大きさで作成する。
【0009】上記課題を解決するために、本発明は好ま
しくは前記切り出したパターンを正規化してから前記パ
ターン辞書との比較を行う。
【0010】
【作用】本発明によれば、表の交点が存在すると思われ
る座標付近で水平方向及び垂直方向に帯状の小規模な範
囲のヒストグラムをとることにより、ピーク位置座標が
求められ、表内の交点座標が得られ、セル領域を指定し
得る。
【0011】本発明によれば、表の水平及び垂直方向の
ヒストグラムから得られたピーク位置座標とピーク幅よ
り交点座標と切り出しパターンの面積を求めて、実際に
切り出された表内の交点パターンと作成した交点パター
ン辞書とを比較することにより、表内の交点パターンの
種類を決定して、この交点パターンに含まれる交点位置
座標をもとに表内セル領域を確定して行くものである。
【0012】
【実施例】以下、図を参照して本発明の実施例を詳細に
説明する。
【0013】図1は本発明の一実施例の画像処理装置の
概略構成を示す。本図において、101は画像データの
入力部である。102は記憶部103に格納された制御
プログラムに従って装置の制御や各部処理の演算を行う
演算処理部(CPU)である。103は後述するフロー
チャートの制御プログラムや後に説明する交点パターン
作成情報などの各種データを記憶しておく記憶部であ
り、ROM、RAMを含む。107は演算処理結果や画
像処理結果、及び画像データを出力する出力部であり、
ホストコンピュータへの送信、プリンタによる印字のた
めの出力等を行う。104は同じくそれらを表示する。
例えばCRTである。105は入力部101から入力さ
れた画像データを解析し、文字や表、図の区別等、領域
分割処理全体を行う領域分割部である。106は105
において表として取られた領域の画像データにおいて、
その表内のセル領域を指定する表内セル指定部である。
108は、画像データから表の交点部分を切り出す交点
パターンの大きさを均一にする正規化部である。109
は切り出された交点パターンの特徴ベクトルを抽出する
ところである。110は実際に求めた特徴ベクトルと辞
書の納められた学習ベクトルとの距離を計算するところ
である。111は各種辞書を格納する辞書部である。
【0014】〈小規模ヒストグラムによるセル領域の指
定〉表内セル指定部による小規模ヒストグラムでセル領
域を指定する処理の流れを図2のフローチャートに示
し、これに沿って説明して行く。
【0015】図3の点線で示す表領域Aは、本画像処理
装置の有する領域分割部により表であると判断された領
域である。図3は表領域Aの1点を基準点として、領域
Aの範囲内で水平及び垂直方向に画素のヒストグラムを
とったものである(201)。例えば水平・垂直方向に
m×nのピークが現われたとするとそれぞれに予め定め
ておいた適当な高さの閾値Ha、Hb以上のピーク位置
座標a(a1,2 ,…,am),b(b1 ,b2 ,…,
n )とピーク幅Wa,Wbを求めて、その領域Aに対
応するピークデータとして記憶部103に記憶しておく
(202)。ここで、水平・垂直方向それぞれにピーク
位置が等間隔で且つ高さが等しければ、表内の罫線の交
点は計算で求めることが可能である。しかし、一般には
図3のような表も数多く存在し、単純に計算だけでは表
内のセル領域を確定することはできない。そこでまず図
3で求めたピーク幅Wa,Wbの平均をとり線幅平均W
を求める(203)。求められた線幅平均Wを参考にし
てWにある値を加えたMを定める。MはM>Wであり、
Wとの割合で定めても、また、予め定めてある値を加え
て定めても良い。そして、記憶しておいた水平・垂直方
向のピーク位置座標a,bを基準に図4に示すように、
幅M(M>W)ドットの帯状に画像データをとり出し、
水平・垂直方向に画素の部分ヒストグラムを作成する
(204)。そして、予めピーク位置座標a,bにより
予測される交点座標の領域za,zb及び適当な高さの
閾値ha,hbを定めて置き、それらの範囲内において
それぞれのピーク位置aij,bijを求める(ピーク
位置がないものに関してはゼロとしておく)(20
5)。次に添字i,jの組み合わせの等しいもの同士に
ついて(図4においてはa21とb12)それらの間の距離
lを計算する。その距離lが予め定めてある適当なしき
い値L(>0)より小さければ、すなわち、 0≦1≦L であればaij=bijとみなして、その平均位置Ai
j((Xa+Xb)/2,(Ya+Yb)/2)を表内
の交点座標と確定する。ここで、一方にピーク位置がな
いもの(位置座標=0)については交点がないものとし
てAijにはゼロを代入する(206〜209)。
【0016】このようにして一つ一つ求めた交点座標の
例A11〜A54を図5に示す。これら求めた交点座標
は、表領域Aのデータとして記憶部103に記憶され
る。次に、図5に示すように求めた交点座標Aijにお
いて列の若い番号を基準にして、水平・垂直方向の隣合
う点、例えば1列目の一番若いA11を基準にして水平
・垂直方向にそれぞれ隣合う点はA12,A51であ
る。(A21〜A41には交点がないのでゼロとなって
おり無視する。)従って、交点A11,A12,A51
で囲まれる矩形を表内のひとつのセル領域とする。1列
目はA51が最終点であるので次は2列目のA12を基
準にA14,A22に囲まれる領域、A22を基準にA
23,A32に囲まれる領域、…という要領でセル領域
を決定して行けばよい(210)。これら決定されたセ
ル領域は、セルごとに交点座標データと、セル番号とと
もに記憶部103に記憶される。
【0017】ここから、図6に示すような、閉じていな
い表についての処理を説明する。
【0018】実際の文書画像では図3に示すような閉じ
た表ばかりではなく、かなり変形した表も数多く存在す
る。図6の(1)、(2)にその代表例を示す。
【0019】図6に示すようにまず、表領域Bに対して
水平・垂直方向に射影をとりヒストグラムを作成し、ピ
ークの座標及び幅を垂直方向に(a1,wa1),(a
2,wa2),(a3,wa3),…と垂直方向に(b
1,wb1),(b2,wb2),(b3,wb3)…
と求めるところまでは前記の図3の表の処理と同様であ
る(201、202)。ここで、水平方向と垂直方向の
それぞれの最初のピーク位置a1,b1の距離sを計算
してこれがしきい値S(>0)以内であれば同一点であ
るとみなす。すなわち、この時には表にコーナーがある
と判断するわけである。もしもこの表にコーナーが存在
しなければ変形型であると判断する。もっと厳密に判断
したい場合には四隅に対してコーナーの有無を調べれば
よい(211、212)。
【0020】ここで、変形型だと判断された場合(21
4)には垂直・水平方向のヒストグラムの始点と終点
(図6のPs,Pe,Qs,Qe)より図7に示すよう
にコーナーC11,C14,C41,C44を求め、波
線で示すような仮想表枠を設定する(215)。後は前
記実施例と同様に、水平方向にはC11,a12,a1
3,C14を基準に、垂直方向にはC11,b21,b
31,c41を基準に、線幅から割だした適当な幅Mの
帯状にそれぞれヒストグラムを求めて、それらの平均的
な交点座標Cijを決める。また、変形型の場合、コー
ナーの座標はC11〜C44を利用し、a1やb1の様
に外枠の点において平均する相手がない場合にはa1や
b1をその平均的交点として代用する。これで表内の交
点座標が決まったので前記と同様にC11から列の若い
順に水平・垂直方向に隣合う点で囲まれる範囲をセル領
域として確定していく。
【0021】〈交点から切り出したパターンを辞書と比
較することによるセル領域の指定〉表内セル指定部10
6による交点からパターンを切り出し辞書と比較するこ
とによりセル領域を指定する処理の流れを図8のフロー
チャートに示し、これに沿って説明していく。
【0022】図3に示した表領域Aの表データからセル
領域を指定する場合の線幅平均Wを求め、格納するまで
の処理は既に説明してあるのでここでは省略する。一般
に、水平線、垂直線、対角線で構成される表において
は、交点パターンの種類は限られている。そこで、前記
求めた平均的線幅Wをもとに、交点において切り出すパ
ターンの大きさを決定し(803)、図4に示すように
ひとつのパターンに付き(203)で決定されたd×g
ドットの適当な大きさで、予め準備し、記憶部103に
記憶しておいた交点パターン作成情報をもとに幾つかの
交点パターンを作成し、交点パターン辞書として記憶部
103に記憶して置く(804)。次に(202)で求
め、記憶部103に記憶しておいた水平・垂直方向のピ
ーク位置a,bにより予想される交点座標位置Cij
(i:行、j:列でともに1,2,3,…と続く。図1
1参照)を計算しておく。その交点を基準点として、d
×gドットの交点パターンを画像データから切抜き、
(204)で作成した交点パターン辞書と比較する(8
05)。具体的には図10に示すように、交点パターン
辞書(図10(1))と実際の交点パターン(図10
(2))の同じ位置に対して、インクルーシブORをと
り、最終的にd×gドット内に残った黒画素の数で全ド
ット数を割り、重なり度Dを求める。すなわち、 重なり度D=全ドット数(d×g)/残った黒画素の数 とする。ひとつの交点パターンに対して、全ての辞書パ
ターンと比較して、最も重なり度の大きいものをその交
点での交点パターンとする(806)。ここまでで、交
点座標と交点パターンが決まったので、次に、それらを
用いて表内のセル領域を確定して行く。まず、列を基準
に若い順にその点から水平方向に隣合う点の交点パター
ンを観る(807)。このパターンが実際に交点を持つ
パターンであれば、次にその点を基準に垂直方向に隣合
う点を観る(交点を持つパターンとは、図9の(a)〜
(p)の様に実際に交点のあるもの)。初めの点から見
て対角点にあたるこの点の交点パターンが始点での交点
パターンの対角点での交点パターンに成り得るかどうか
判断する(809)。すなわち、始点での交点パターン
が決まれば自ずとその対角線上に来る対角パターンは限
定されてくる。例えば、図9において、パターン(a)
に対する対角パターンとして(f)は有り得るが(e)
は有り得ない。この情報を予め記憶部に記憶しておき判
断するので有る。実際の例を図11によって示す。ま
ず、C11を基準に水平方向に隣合う点C12の交点パ
ターンを観る。これは交点の持つパターンであるので、
次にその点より垂直に隣合う点C22を観る。この交点
パターンは始点C11の交点パターンに成り得るのでC
11、C12、C22で囲まれる領域をひとつのセル領
域とする(811)。次にC21を基準に水平方向の隣
接点C22を観る。これは交点を含むからその点より垂
直方向の隣接点C32に進む。しかし、C32は始点C
21の交点パターンの対角線上の交点パターンには成り
得ないのでその点は無視して次に、点C42に進む(8
10)。この点のパターンはC21に対する交点パター
ンと成り得るので、従って、C21、C22、C42で
囲まれる領域をひとつのセル領域とする。これで最終行
第4行まで進んだので、次は、第2列目のC12を基準
にする。ここでC12に対する水平方向の隣接点C13
の交点パターンには交点が含まれない(808)。従っ
て、この点は無視されさらに隣の点C14に進む。これ
には交点が含まれるので、この点より垂直方向の隣接点
C24を観る。この点はC12の対角線上の交点パター
ンとなり得るのでC12、C14、C22に囲まれる領
域をセル領域とする。あとは同じ要領でC22、C2
3、C33に囲まれる領域、C32、C33、C43に
囲まれる領域…と言う具合いに順次セル領域を指定して
行く。これら決定されたセル領域は、セルごとに交点座
標データと、順次定めるセル管理番号とともに記憶部1
03に記憶される。
【0023】次に、図6(1)、(2)に示すような変
形型の場合のセル領域を上記の方法で求める処理を説明
する。図7に示すようにまず、表領域Bに対して水平・
垂直方向に射影をとりヒストグラムを作成し、ピークの
座標及び幅を垂直方向に(a1,wa1),(a2,w
a2),(a3,wa3),…と垂直方向に(b1,w
b1),(b2,wb2),(b3,wb3),…と求
めるところまでは前記と同様である(201、202)
ここで、それぞれの最初のピーク位置a1,b1の距離
sを計算してこれがしきい値S(>0)以内であれば同
一点であるとみなす。すなわち、この時には表にコーナ
ーがあると判断するわけである。もしもこの表にコーナ
ーが存在しなければ変形型であると判断する。もっと厳
密に判断したい場合には四隅に対してコーナーの有無を
調べればよいことは言うまでもない(811、81
2)。
【0024】図2のフローチャートにおける(211、
212)と同様にコーナーを調べることにより、変形型
だと判断された場合(214)には垂直・水平方向のヒ
ストグラムの始点と終点(図6のPs,Pe,Qs,Q
e)より、図12に示すようにコーナーC11,C1
4,C41,C44を求め、波線で示すような仮想表枠
を設定する(816)。後は前記実施例と同様に、水平
方向にはC11,a1,a1,C14を基準に、垂直方
向にはC11,b1,b1,C41を基準に、交点座標
の位置を計算から求めて、それらの点を中心とするd×
gドットのパターンと交点パターン辞書との比較から実
際の交点パターンを割り出して、それを元に表内セル領
域を指定して行く。ここで、図6の様な変形型まで含め
て表内のセル領域を指定しようとすると、さらに図13
の様な交点パターンも作成し、交点パターン辞書に加え
なければならない。
【0025】〈交点から切り出すパターンを正規化する
処理〉表内セル指定部106による交点から切り出すパ
ターンを正規化する処理の流れを図14のフローチャー
トに示し、これに沿って説明して行く。
【0026】図3に示した表領域Aの表データからセル
領域を指定する場合の、図4に示すように原画像の交点
パターンを切り出すための適当な大きさ(d×gドッ
ト)を決める(803)までの処理は既に説明してある
ので、ここでは省略する。次に、前記求めた水平・垂直
方向のピーク位置a,bにより予想される交点座標位置
Cij(i:行、j:列でともに1,2,3,…と続
く。図11参照)を計算しておき、その交点を基準点と
して、d×gドットの交点パターンを切抜く。この切抜
かれた交点パターンを辞書と比較するために、正規化部
によりd×gドットをD×Gドットの大きさに正規化す
る(404)。次に特徴抽出部により、特徴ベクトルを
求める(405)。特徴抽出方法としては公知の事実と
していろいろな方法が考案されているがここでは、切り
出された原画の輪郭線に対してN方向の方向指数ヒスト
グラムを求めて、それを特徴ベクトルにする方法を用い
ることにする。最後に、識別計算部により、前記特徴ベ
クトルと交点パターン辞書の特徴ベクトルの距離計算を
して、距離が最も小さなものをその点の交点パターンを
確定する(406〜407)。ここで、距離計算には次
式を用いる。
【0027】d=Σ(Xi−Mi)2 n:次元数 Xi:入力ベクトル Mi:学習ベクトル
【0028】次に、前記求めた交点座標Cijと交点パ
ターンにより表内のセル領域を求める方法を説明する。
まず、列を基準に若い順にその点から水平方向に隣合う
点の交点パターンを観る(408)。このパターンが実
際に交点を持つパターンであれば、次にその点を基準に
垂直方向に隣合う点を観る。(交点を持つパターンと
は、図4の(a)〜(p)の様に実際に交点のあるも
の。)初めの点から見て対角点にあたるこの点の交点パ
ターンが始点での交点パターンの対角点での交点パター
ンに成り得るかどうか判断する(410)。すなわち、
始点での交点パターンが決まれば自ずとその対角線上に
来る交点パターンは限定されてくる。例えば、図9にお
いて、パターン(a)に対する対角パターンとして
(f)はあり得るが(e)はあり得ない。この情報を予
め交点パターン辞書に記憶しておき判断するのである。
実際の例を図11によって示す。まず、C11を基準に
水平方向に隣合う点C12の交点パターンを観る。これ
は交点を持つパターンであるので、次にその点より垂直
に隣合う点C22を観る。この交点パターンは始点C1
1の交点パターンに成り得るのでC11、C12、C2
2で囲まれる領域をひとつのセル領域とする(21
2)。次にC21を基準に水平方向の隣接点C22を観
る。これは交点を含むからその点より垂直方向の隣接点
C32に進む。しかし、C32は始点C21の交点パタ
ーンの対角線上の交点パターンには成り得ないのでその
点は無視して次に点C42に進む(211)。この点の
パターンはC21に対する交点パターンと成り得るの
で、従って、C21、C22、C42で囲まれる領域を
ひとつのセル領域とする。これで最終行第4行まで進ん
だので、次は、第2列目のC12を基準にする。ここで
C12に対する水平方向の隣接点C13の交点パターン
には交点が含まれない。従って、この点は無視され、さ
らに隣の点C14に進む(409)。これには交点が含
まれるので、この点より垂直方向の隣接点C24を観
る。この点はC12の対角線上の交点パターンと成り得
るのでC12、C14、C24に囲まれる領域をセル領
域とする。あとは同じ要領で、C22、C23、C33
に囲まれる領域、C32、C33、C43に囲まれる領
域…という具合に順次セル領域を指定して行く。
【0029】
【発明の効果】以上説明したように、本発明によれば、
原画像の交点パターンを利用する方法であるので、かす
れのひどいものや変形した表においても、より高精度に
セル領域の指定が可能となる。
【図面の簡単な説明】
【図1】実施例の画像処理装置のブロック構成図。
【図2】実施例の動作処理手順を示す第1のフローチャ
ート。
【図3】ある表領域に対して、水平及び垂直方向にヒス
トグラムをとった例示図。
【図4】小規模な範囲のヒストグラムにおけるピーク位
置座標から交点座標を求める例示図。
【図5】求めた交点座標からセル領域を指定して行く過
程の図。
【図6】変形型の表の例示図。
【図7】変形型の表に対して、仮想表枠を設けて交点座
標を求める例示図。
【図8】実施例の動作処理手順を示す第2のフローチャ
ート。
【図9】作成する交点パターン辞書の例示図。
【図10】交点パターン辞書と原画から切り出した交点
パターンの第1の例示図。
【図11】求めた交点パターンに含まれる交点座標から
セル領域を指定して行く過程の図。
【図12】変形型の表に対して、仮想表枠を付けた例示
図。
【図13】変形型の表のために辞書を付け加えるべき交
点パターンの例示図。
【図14】実施例の動作処理手順を示す第3のフローチ
ャート。
【図15】交点パターン辞書と原画から切り出した正規
化された交点パターンの第2の例示図。
フロントページの続き (72)発明者 齋藤 和之 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 画像情報を入力し、 前記入力した画像情報において、水平及び垂直方向に射
    影をとり、ヒストグラムを形成し、 前記作成したヒストグラムよりピーク位置座標とピーク
    幅を求め、 前記ピーク幅から表罫線の平均幅を求め、 該表罫線平均幅から求めた幅で、前記求めたピーク位置
    座標を基準として水平および垂直方向にそれぞれ小ヒス
    トグラムを作成し、 該小ヒストグラムよりピーク位置座標を決定することを
    特徴とする画像情報処理方法。
  2. 【請求項2】 前記決定したピーク位置座標から該画像
    情報の表のセル領域を識別することを特徴とする請求項
    1に記載の画像情報処理方法。
  3. 【請求項3】 画像情報を入力し、 前記入力した画像情報において、水平及び垂直方向に射
    影をとり、ヒストグラムを作成し、 前記作成したヒストグラムよりピーク位置座標とピーク
    幅を求め、 前記ピーク幅から表罫線の平均幅を求め、 該表罫線平均幅から交点で切り出すパターンの大きさを
    決定し、 前記求めた水平及び垂直方向のピーク位置座標を用いて
    表内の交点位置座標を予測し、 前記予測された交点位置座標で前記入力した画像情報か
    らパターンを切り出し、 前記切り出されたパターンから交点の種類を決定するこ
    とを特徴とする画像情報処理方法。
  4. 【請求項4】 前記交点の種類の決定は、パターン辞書
    と比較することにより行うことを特徴とする請求項3に
    記載の画像情報処理方法。
  5. 【請求項5】 前記パターン辞書は、前記決定された切
    り出しパターンの大きさで作成することを特徴とする請
    求項4に記載の画像情報処理方法。
  6. 【請求項6】 前記切り出したパターンを正規化してか
    ら前記パターン辞書との比較を行うことを特徴とする請
    求項4に記載の画像情報処理方法。
  7. 【請求項7】 画像情報を入力する入力手段と、 前記入力した画像情報において、水平及び垂直方向に射
    影をとり、ヒストグラムを作成する手段と、 前記作成したヒストグラムよりピーク位置座標とピーク
    幅を求める手段と、 前記ピーク幅から表罫線の平均幅を求める手段と、 該表罫線平均幅から求めた幅で、前記求めたピーク位置
    座標を基準として水平及び垂直方向にそれぞれ小ヒスト
    グラムを作成する手段と、 該小ヒストグラムよりピーク位置座標を決定する手段と
    を有することを特徴とする画像情報処理装置。
  8. 【請求項8】 前記決定したピーク位置座標から該画像
    情報の表のセル領域を識別する手段を有することを特徴
    とする請求項7に記載の画像情報処理装置。
  9. 【請求項9】 画像情報を入力する入力手段と、 前記入力した画像情報において、水平及び垂直方向に射
    影をとり、ヒストグラムを作成する手段と、 前記作成したヒストグラムよりピーク位置座標とピーク
    幅を求める手段と、 前記ピーク幅から表罫線の平均幅を求める手段と、 該表罫線平均幅から交点で切り出すパターンの大きさを
    決定する手段と、 前記求めた水平及び垂直方向のピーク位置座標を用いて
    表内の交点位置座標を予測する手段と、 前記予測された交点位置座標で前記入力した画像情報か
    らパターンを切り出す手段と、 前記切り出されたパターンから交点の種類を決定する手
    段とを有することを特徴とする画像情報処理装置。
  10. 【請求項10】 前記交点の種類の決定は、パターン辞
    書と比較することにより行うことを特徴とする請求項9
    に記載の画像情報処理装置。
  11. 【請求項11】 前記パターン辞書は、前記決定された
    切り出しパターンの大きさで作成することを特徴とする
    請求項10に記載の画像情報処理装置。
  12. 【請求項12】 前記切り出したパターンを正規化して
    から前記パターン辞書との比較を行うことを特徴とする
    請求項10に記載の画像情報処理装置。
JP5001229A 1993-01-07 1993-01-07 画像情報処理方法及び装置 Pending JPH06203165A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5001229A JPH06203165A (ja) 1993-01-07 1993-01-07 画像情報処理方法及び装置
US08/685,779 US5774584A (en) 1993-01-07 1996-07-24 Method and apparatus for identifying table areas in documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5001229A JPH06203165A (ja) 1993-01-07 1993-01-07 画像情報処理方法及び装置

Publications (1)

Publication Number Publication Date
JPH06203165A true JPH06203165A (ja) 1994-07-22

Family

ID=11495647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5001229A Pending JPH06203165A (ja) 1993-01-07 1993-01-07 画像情報処理方法及び装置

Country Status (2)

Country Link
US (1) US5774584A (ja)
JP (1) JPH06203165A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704450B2 (en) 1996-12-27 2004-03-09 Fujitsu Limited Apparatus and method for extracting management information from image
US7440618B2 (en) 2000-08-15 2008-10-21 Fujitsu Limited Apparatus for extracting rules line from multiple-valued image
CN104346320A (zh) * 2013-08-09 2015-02-11 株式会社东芝 手写文档处理装置、手写文档处理方法和手写文档处理程序

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6018593A (en) * 1996-09-11 2000-01-25 Ricoh Company, Ltd. Method and system for correcting image position based upon predetermined pattern portions
DE60204066T2 (de) * 2001-02-22 2006-02-02 Oce Print Logic Technologies S.A. Automatische Lokalisierung von Tabellen in Dokumenten
EP1237115B1 (en) * 2001-02-22 2005-05-11 Océ Print Logic Technologies S.A. Automatic table location in documents
US6871319B2 (en) * 2001-03-27 2005-03-22 Microsoft Corporation Table styles inference engine
US7366978B1 (en) * 2003-02-13 2008-04-29 Microsoft Corporation Method and system for creating a grid-like coordinate system for addressing data contained in an irregular computer-generated table
US7463770B2 (en) * 2003-07-21 2008-12-09 Lockheed Martin Corporation Methods and systems for detection of repeating patterns of features
US7426690B1 (en) 2003-12-09 2008-09-16 Microsoft Corporation Extensible markup language markup cloning on table rows and cells in a software application document
KR100726438B1 (ko) * 2005-10-10 2007-06-11 삼성전자주식회사 예비 비트를 이용한 오류 제어 방법 및 장치
US7583841B2 (en) * 2005-12-21 2009-09-01 Microsoft Corporation Table detection in ink notes
US7664325B2 (en) * 2005-12-21 2010-02-16 Microsoft Corporation Framework for detecting a structured handwritten object
US7707488B2 (en) * 2006-02-09 2010-04-27 Microsoft Corporation Analyzing lines to detect tables in documents
JP4240107B2 (ja) * 2006-10-27 2009-03-18 コニカミノルタビジネステクノロジーズ株式会社 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
JP5222126B2 (ja) * 2008-12-25 2013-06-26 キヤノン株式会社 画像処理方法、画像処理装置及びプログラム
WO2011012455A1 (en) * 2009-07-30 2011-02-03 Oce-Technologies B.V. Automatic table location in documents
CN108845153B (zh) * 2018-05-07 2020-01-07 江苏康尚生物医疗科技有限公司 一种白细胞粒子分析系统及方法
CN112906532B (zh) * 2021-02-07 2024-01-05 杭州睿胜软件有限公司 图像处理方法和装置、电子设备和存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4688088A (en) * 1984-04-20 1987-08-18 Canon Kabushiki Kaisha Position detecting device and method
GB2190778B (en) * 1986-05-19 1990-04-25 Ricoh Kk Character recognition with variable subdivisions of a character region
JPH07120385B2 (ja) * 1987-07-24 1995-12-20 シャープ株式会社 光学的読取り方法
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus
EP0358815B1 (en) * 1988-09-12 1993-05-26 Océ-Nederland B.V. System and method for automatic segmentation
FR2656700B1 (fr) * 1989-12-28 1992-08-07 Aerospatiale Procede de restitution du mouvement d'un mobile par observation d'un symbole forme sur ce dernier et dispositifs pour la mise en óoeuvre du procede.
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
JPH04270485A (ja) * 1991-02-26 1992-09-25 Sony Corp 印刷文字認識装置
JPH0592646A (ja) * 1991-09-30 1993-04-16 Ezel Inc 印刷物検査方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6704450B2 (en) 1996-12-27 2004-03-09 Fujitsu Limited Apparatus and method for extracting management information from image
US7440618B2 (en) 2000-08-15 2008-10-21 Fujitsu Limited Apparatus for extracting rules line from multiple-valued image
CN104346320A (zh) * 2013-08-09 2015-02-11 株式会社东芝 手写文档处理装置、手写文档处理方法和手写文档处理程序
US20150042661A1 (en) * 2013-08-09 2015-02-12 Kabushiki Kaisha Toshiba Handwritten document processing device, handwritten document processing method, and handwritten document processing program

Also Published As

Publication number Publication date
US5774584A (en) 1998-06-30

Similar Documents

Publication Publication Date Title
JPH06203165A (ja) 画像情報処理方法及び装置
US7376270B2 (en) Detecting human faces and detecting red eyes
US7437001B2 (en) Method and device for recognition of a handwritten pattern
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JPH05242292A (ja) 分離方法
US8340433B2 (en) Image processing apparatus, electronic medium, and image processing method
JP3155616B2 (ja) 文字認識方法及び装置
EP0810542A2 (en) Bitmap comparison apparatus and method
JP2000076378A (ja) 文字認識方法
JPH0728935A (ja) 文書画像処理装置
JP2732752B2 (ja) ファジィパターン認識装置
JP2995818B2 (ja) 文字切り出し方法
JPH05182028A (ja) 文字認識装置
JP2755299B2 (ja) 画像処理方法
JP2732753B2 (ja) ファジィパターン認識装置
JP2925303B2 (ja) 画像処理方法及び装置
JPH03212782A (ja) パターン認識方式
JPH0225985A (ja) 筆跡鑑定装置
JPH1021332A (ja) 非線形正規化方法
JPH03126188A (ja) 文字認識装置
JP2732748B2 (ja) ファジィパターン認識装置
JPS63131287A (ja) 文字認識方式
JPH02250194A (ja) 手書文字認識装置
JPH05114048A (ja) 文字認識方法及びその装置
JPS5969875A (ja) 文字認識方式