JPH04233093A - 画像切り出し装置及びその方法 - Google Patents

画像切り出し装置及びその方法

Info

Publication number
JPH04233093A
JPH04233093A JP3165286A JP16528691A JPH04233093A JP H04233093 A JPH04233093 A JP H04233093A JP 3165286 A JP3165286 A JP 3165286A JP 16528691 A JP16528691 A JP 16528691A JP H04233093 A JPH04233093 A JP H04233093A
Authority
JP
Japan
Prior art keywords
rectangle
node
coordinate
image
rectangles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3165286A
Other languages
English (en)
Other versions
JP2588491B2 (ja
Inventor
Henry S Baird
ヘンリー スパルディング ベアード
Steven J Fortune
スティーブン ジョナサン フォーチュン
Susan E Jones
スーザン エリザベス ジョーンズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
American Telephone and Telegraph Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Telephone and Telegraph Co Inc filed Critical American Telephone and Telegraph Co Inc
Publication of JPH04233093A publication Critical patent/JPH04233093A/ja
Application granted granted Critical
Publication of JP2588491B2 publication Critical patent/JP2588491B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、広義には画素の群とし
て表わされている画像から情報を抽出する技術に関し、
特には画像からの情報抽出を簡単にするためにそのよう
な画像を切り出す技術に関する。
【0002】
【発明の背景】本発明の方法及び装置は、1988年5
月16日に出願され本出願人に譲渡されたヘンリー・エ
ス・ベアド(Henry  S.  Baird)氏の
米国特許出願第07/194686号、「文書画像のス
キュー制御装置及び方法(Apparatus  an
d  Method  for  Skew  Con
trol  ofDocument  Images)
」に記載されている技術を使用して履行することができ
る。コンピュータ技術においては、画素の群として表わ
されている画像から情報(画素の輝度の値)を抽出する
問題の重要性が増している。コンピュータ技術によって
、一方では文書画像の獲得、蓄積、伝送の自動化がうま
く進んでおり、他方ではテキスト文字を表わすディジタ
ル符号列によって表わされた情報の蓄積、操作の自動化
がそれ以上にうまく進んでいる。
【0003】未だ十分にうまく自動化が進んでいないも
のに、画像の中の文字情報から文字列データへの変換が
ある。しばしば、紙片上の文字情報を文字列データへ変
換するのに使用された技術と同じ技術が使用されている
。すなわち、データ入力作業者が画像を読み取り、キー
ボードを使用してその画像上の情報と等価な文字列デー
タをデータ・ベースに入力する。これらの手続きには種
々の困難があることは明らかである。すなわち、これら
の手続きは、コストが高く、速度が遅く、間違いが起こ
り易い。
【0004】画像から情報を抽出する技術の重要な要素
に画像切り出し、すなわち種々の属性を持つ部分への画
像切り出しが有る。図1は、画像から文字情報を抽出す
るシステム101において、画像切り出しを行なう装置
が使用される方法を図示している。画像103はデータ
処理システムのメモリーの中に画素の群として表わされ
ている画像である。画像103はデータ処理システムの
プロセッサーの中で実行されるプログラムである画像切
り出しプログラム107への入力としての働きを持つ。
【0005】画像切り出しプログラム107は画像10
3の分割切り出しを行ない、この切り出しによってテキ
スト・カラム105が非テキスト部分106から分離さ
れる。ここでの関連では、「テキスト・カラム」は一行
以上のテキスト部分を指している。複数行を持つカラム
の場合は、そのカラムを構成している各行はカラムの垂
直線に関して配列されている。非テキスト部分106は
空白であるか,或いは挿絵、飾り縁、模様、またはその
他同種のものであることができる。
【0006】画像切り出しプログラム107から、画像
103のうちテキスト・カラム105のみを含む部分で
あるテキスト・カラム画像109が出力される。テキス
ト・カラム画像109は続いて、データ処理システムの
プロセッサーの中で実行される別のプログラムであるテ
キスト・カラム解析プログラム111への入力として使
用される。テキスト・カラムの画像が与えられると、テ
キスト・カラム解析プログラム111はそれら画像を文
字、単語、行として判断し、テキスト画像の中のテキス
トに対応するディジタル文字符号113を出力すること
ができる。
【0007】続いてディジタル文字符号113は一般的
にはテキスト・ファイル115へ出力される。テキスト
・カラム解析プログラム111によって生じたディジタ
ル文字符号は、勿論データ処理システムにより同じ方法
で他の何らかの文字符号として操作することができる。
【0008】従来のテキスト・カラム解析プログラム1
11は、1988年9月12日から14日にフランスの
ポンタ・ムッセンで開催された「図形構造及び構造的パ
ターン認識に関するIAPR研究会議事録(Proce
edings  of  theIAPR  Work
shop  on  Syntactic  and 
 Structural  Pattern  Rec
ognition)」に有る、ヘンリー・エス・ベアド
氏の論文「全体から局部へのレイアウト解析(Glob
al−to−Local  Layout  Anal
ysis)」に記述されている。
【0009】テキスト・カラム解析プログラム111は
、それが受け取っている画像がテキストの一つのカラム
を正確に表わすように想定されているので、画像切り出
しプログラム107はシステム101の必須要素である
。従って、テキスト・カラム解析プログラム111は、
もしテキスト・カラム105或いは非テキスト・スペー
ス106を二以上入力として受けると動作しないことが
ある。もしその入力が複数のテキスト・カラム105で
ある場合には、テキスト・カラム解析プログラム111
はテキストの行の位置を捜し出すことができないかもし
れず、もしできるとしてもテキスト・カラム解析プログ
ラム111はそれらの行を正しい順序で読み取ることが
できないであろう。
【0010】もしその入力が非テキスト・スペース10
6である場合には、テキスト・カラム解析プログラム1
11は挿絵、飾り縁、他の非テキスト資料、或いは汚れ
の斑点でさえも、テキストとして判断してしまうことが
ある。最良の場合には、テキスト・カラム解析プログラ
ム111は動作せず、単に時間と処理資源とをそれにあ
てることとなろう。最悪の場合には、テキスト・カラム
解析プログラム111は動作することとなろう。このよ
うなことが起きると、テキスト・カラム解析プログラム
111はその画像から抽出されているテキストに存在し
ない文字を加えたり、或いはその画像の中のテキストを
完全に誤って判断することさえ有るかもしれない。
【0011】
【従来の技術】テキストを含む画像を切り出す技術に関
する最近の調査によると、1986年10月にフランス
のパリーで開催された「パターン認識に関する第八回国
際会議議事録(Proceedings,  8th 
 International  Conferenc
e  on  Pattern  Recogniti
on)」に有る、エス・エヌ・スリハリ(S.N.Sr
ihari)氏とジー・ダブリュ・ザック(G.W.Z
ack)氏の共同論文「文書画像解析(Documen
t  Image  Analysis)」では、完全
自動画像切り出し手法が二つの広いカテゴリー、すなわ
ち、下降型手法と上昇型手法とに分けられている。
【0012】下降型手法は、画像の中のテキストの位置
の周囲に高レベルの推量を標すことによって開始する(
例えば、そのテキストではこの推量は一つのヘッダーを
伴なう二列カラム構成テキストであることができる)。 これら下降型手法では続いて高レベルの推量に基づいて
低レベルの推量の木が作成され、このようにして文書画
像を調べることによって推量の正しさを判定することが
できるレベルに達するまで推量レベルの下降が継続され
る。
【0013】もし文書画像がその推量を支持しないとき
は、下降型手法はそれらが文書画像によって誤りを明示
されなかったレベルに達するまで木の中で上方へ戻り、
その木の別の枝を試みる。上記の記述から明らかな如く
、もし高レベルの推量とその文書の実際の形状との間で
照合不良があるときは、テキストの位置を判定するため
に下降型手法を使用するプログラムを極めて長時間(多
分、永久にさえ)に亘って実行することとなろう。
【0014】上昇型手法は、文字の画像の位置を捜し出
すことによって開始する。上昇型手法では続いて文字か
ら単語への組み立て、単語から行への組み立て、行から
カラムへの組み立て等が行なわれる。この上昇型手法に
伴なう問題には、これら手法が文書の中のテキストに対
する全体的視野を持たず、従って文字から単語への組み
立て、単語から行への組み立て、行からカラムへの組み
立て等に関してしばしば誤りを生じることがある。
【0015】
【発明が解決しようとする課題】本発明の一つの目的は
ディジタル画像の改善された処理方法を提供することで
ある。本発明の別の目的は画像の切り出しを行なう改善
された処理装置及び処理方法を提供することである。本
発明の更に別の目的は或る部類の画像に対する特性であ
る形状情報を使用する画像切り出しを行なう改善された
処理装置及び処理方法を提供することである。  本発
明の更に別の目的は画像の中にある最大空白矩形を捜し
出すための方法を提供することである。
【0016】
【課題を解決するための手段】本技術は、或る部類の誤
りを防止するための「規則」を使用することによってこ
れらの問題を解決することを試みたものである。本出願
で開示される装置及び方法によって、上昇型手法が持つ
簡易性及び高速性と下降型手法が持つ全体的視野とを組
み合わせた画像切り出し技術が提供される。
【0017】一般的な表現では、本発明は対象とされる
画像が属する部類がその部類に属する画像の要素の形状
によって決められる画像の切り出しを行なう方法であり
、この方法は画像の第一の要素の第一の組みの位置を捜
し出すステップと、画像の、各々が前記第一要素の何れ
をも含まず或いはそれらの何れとも重なり合うことがな
い要素である第二の要素の第二の組みの位置を捜し出す
ステップと、画像の部類の形状情報特性を使用する前記
第二の組みの解析によって画像の切り出しを行なうステ
ップとを有する。
【0018】画像切り出しを行なう装置は、画像の第一
の要素の第一の組みの位置を捜し出す手段と、画像の、
各々が前記第一要素の何れをも含まず或いはそれらの何
れとも重なり合うことがない要素である第二の要素の第
二の組みの位置を捜し出す手段と、画像の部類の形状情
報特性を使用する前記第二の組みの解析によって画像切
り出しを行なう手段とを有する。
【0019】本発明の一態様では、本技術は第一要素と
第二要素とを有し、第一要素がテキスト文字を囲む矩形
であり、第二要素がテキスト文字を囲む何れの矩形とも
重ならず或いはそのような矩形を囲んでいない画像の中
に構成することができる局部的に最大の矩形である画像
に適用される。この態様での形状情報は、特に画像の非
テキスト部分に対する特性である第二要素を描写する形
状情報である。この態様が特に旨く適合する画像の部類
はマンハッタン・レイアウト部類である。このマンハッ
タン・レイアウト部類では、形状情報は高いアスペクト
比を持つ第二要素を描写する。
【0020】本発明の別の態様では、この態様における
第二要素が画像の中にある更新された最大空白矩形を捜
し出すための方法を用いて得られる。それら方法のうち
の一つは対角点で定められている最大空白矩形を捜し出
すために使用することができ、他の方法は矩形で定めら
れている最大空白矩形を捜し出すために使用することが
できる。
【0021】
【実施例】好ましい実施例についての以下の詳細な説明
では、最初に、一般的なマンハッタン・レイアウトを持
つ文書の画像切り出しを実行する実施例の概観を述べ、
続いて最大空白矩形を捜し出すために本実施例で使用さ
れている新規な技術を論じ、次ぎにこの好ましい実施例
の画像切り出しプログラム107で使用されているこの
技術の適用を論じ、続いてマンハッタン・レイアウトか
ら得られた最大空白矩形がそのマンハッタン・レイアウ
トの中の非テキスト・スペース106を定めるカバー・
セットを得るために形状によって分類される方法を示す
【0022】マンハッタン・レイアウト(図2及び図3
、参照) マンハッタン・レイアウトは、一組の垂直及び水平の線
状セグメントによって画像切り出しを行なうことができ
るレイアウトである。この定義から明らかなように、殆
どの標準的な書籍、雑誌、新聞のレイアウトは、殆どの
業務用通信文及び業務用書式がそうであるように、この
部類のレイアウトに属している。
【0023】図2はマンハッタン・レイアウトの一例、
すなわち米国特許第4,866,714号の第一頁の一
部分を示している。以下の説明のために、マンハッタン
・レイアウト201の次ぎの要素、すなわち、単一の印
刷書体文字、この例では「U」を囲んでいる文字矩形2
03、一組の文字矩形203によって表わされている単
語211、カラムの中の一つの水平線上の一組の単語か
ら成る行209、互いに上下に位置する一組の行209
から成るカラム207、最大空白矩形205(a)〜2
05(c)に分けることができる。
【0024】最大空白矩形は、マンハッタン・レイアウ
ト201の中で、矩形の四辺の各々がマンハッタン・レ
イアウトの角部或いは文字矩形の角部で接するように描
くことができる矩形である。
【0025】以下で更に詳しく記述されるように、この
好ましい実施例の画像切り出しプログラム107は、マ
ンハッタン・レイアウト201の中で一組の最大空白矩
形205を得、これらの最大空白矩形205を形状に従
って分類し、マンハッタン・レイアウト201のうちテ
キストの行及びカラムで占められている全ての部分を覆
うカバー・セットを得るために細分化された一組の分類
された最大空白矩形を組み合わせることによって働く。
【0026】図3は図2のマンハッタン・レイアウト2
01に対するカバー・セット301を示す。図3の中で
、図3の文字、行、カラムを囲んでいる枠外の空白の全
てがカバー・セット301に属する。
【0027】好ましい実施例の画像切り出しプログラム
107の概観(図4参照) 図4は、本発明の原理を使用している図1の画像切り出
しプログラム107の実施例である画像切り出しプログ
ラム401を示すブロック・ダイヤグラムである。画像
切り出しプログラム401はテキスト画像103を入力
として受け、テキスト・カラム画像109を出力として
生じる。好ましい実施例では、テキスト画像103はマ
ンハッタン・レイアウト201を持ち、テキスト・カラ
ム画像109はマンハッタン・レイアウト201からの
カラム207である。
【0028】画像切り出しプログラム401の最初の要
素は文字矩形位置捜し出しプログラム402であり、こ
の文字矩形位置捜し出しプログラム402は画像103
の中の文字を囲んでいる矩形203のリスト403を生
じる。矩形203はそれらの下方左側角部と上方右側角
部のx、y座標によって描写され、リスト403はy、
xに関して次ぎのように整理される。すなわち、所定の
矩形203の中に有り、リスト403の中での矩形の順
序を判定するために用いられる画素は、全ての画素がy
、xによって辞書編纂的に整理されるときの最後の画素
であり、リスト403の中のこれら画素の順序が再びy
、xによって辞書編纂的に整理される。
【0029】文字矩形リスト403は最大空白矩形位置
捜し出しプログラム(MERロケータ)405への入力
であり、この最大空白矩形位置捜し出しプログラム40
5は画像103の中の最大空白矩形205の位置を捜し
出し、それらの位置を最大空白矩形リスト407へ出力
する。このリスト407の中の最大空白矩形は再びそれ
らの下方左側角部と上方右側角部の座標によって描写さ
れる。最大空白矩形リスト407は、このリスト407
の中の最大空白矩形205を画像103の特徴である形
状によって分類する形状指向分類プログラム(SDソー
タ)409への入力として使用される。
【0030】好ましい実施例では、マンハッタン・レイ
アウト201に対する特徴的形状は高いアスペクト比の
矩形である。分類されたリストの中の所定の細分化され
た組の最大空白矩形205はカバー・セット301を形
成するために併合される。続いてカバー・セット301
と画像103とはテキスト抽出プログラム411へ入力
される。画像103のうちカバー・セット301に属し
ていない部分は、もちろん画像103の行209とカラ
ム207であり、これらはテキスト・カラム画像109
としてテキスト・カラム解析プログラム111へ出力さ
れる。
【0031】上記記述から分かるように、画像103の
処理では、画像切り出しプログラム401が以下のステ
ップ、すなわち、画像103の中の文字を含む矩形20
3のリストを作成するステップ、矩形203を用いて画
像103の中の上記一組の最大空白矩形205を判定す
るステップ、この一組の最大空白矩形205を形状によ
って、この例ではアスペクト比によって分類するステッ
プ、所定の細分化された組の分類された最大空白矩形を
組み合わせてカバー・セット301を生成するステップ
、画像103と共にカバー・セット301を使用して画
像103の中のテキストの行209及びカラム207の
位置を捜し出すステップを実行する。画像切り出しプロ
グラム401の要素を次に詳細に説明する。
【0032】文字矩形位置捜し出しプログラム402(
図5参照) 文字矩形位置捜し出しプログラム402は画像103を
解析して文字矩形の位置を捜し出す。この最初のステッ
プでは文字の位置を捜し出しが行われる。この位置捜し
出しステップは次のようにして行われる。最初に、その
画像を解析してそのテキストのために画像の中で使用さ
れている色彩を持つ画像成分が互いに繋がっている「し
み」が見付けられる。画像の「繋がっている成分」は画
素成分であって互いに直接または間接に接しているもの
である。
【0033】好ましい実施例では、これらの繋がってい
る成分は8字状に繋げられ、すなわち、各画素が水平、
垂直、対角線の何れの方法でも接することが可能である
。他の実施例では、他の度合いの繋がり状態を使用する
ことができる。繋がり状態の解析方法は従来どおりの方
法である。この解析を実行する一つの技術が、1984
年に英国ハーフォードシャ(Hertfordshir
e)州レッチワース(Letchworth)のリサー
チ・スタディース・プレス(Rearch  Stud
ies  Press)社から発行された、ロンセ・シ
ー(Ronse,C.)氏とデビヴァー・ピー(Dev
ijver,P.)氏による著書「2値画像における繋
がった要素とその検出の問題(Connected  
Components  in  Binary  I
mages:The  Detection  Pro
blem)」に記述されている。
【0034】図5は文字503に対する繋がり状態の解
析の結果を示す。文字503の各画素501は8字状に
繋がれており、この結果、文字503は「しみ」である
【0035】次のステップでは、しみ状態の文字503
が黒く埋められた矩形507に理想化される。黒く埋め
られた矩形507はしみ状の文字503を、従って文字
を十分に囲む大きさを有する。黒く埋められた矩形50
7でテキスト文字を囲むには大き過ぎるものや小さ過ぎ
るものは全て無視される。図5において、509は8字
状に繋がっている文字ではないしみ状態の画素であり、
511は理想化され且つテキスト文字を囲むには小さ過
ぎるために排除される黒く埋められた矩形である。
【0036】次のステップでは、画像103の中のスキ
ュー歪み、すなわち、ずり歪みが訂正される。このよう
な訂正を行なうための技術分野で知られている幾つかの
方法が有る。好ましい実施例で使用されている方法は、
1987年5月20〜21日にニューヨーク(NY)州
ロチェスター(Rochester)で開催された「写
真科学者及び写真技術者協会の1987年会議議事録(
Proceedings,  1987  Confe
rence  of  the  Photograp
hic  Scientists  and  Eng
ineers)」における、ヘンリー・エス・ベアド氏
の論文「印刷文書のスキュー角(The  Skew 
 Angle  of  Printed  Docu
ments)」に記述されている。
【0037】一旦、その歪み訂正が成されると、画像1
03の中の黒く埋められた全矩形507の正しいx、y
座標が判明し、文字矩形リスト403を上記で述べたよ
うに構成することができる。
【0038】最大空白矩形位置捜し出しプログラム40
5 最大空白矩形位置捜し出しプログラム405に関する以
下の記述は、画像の中の対角点iによって定められた最
大空白矩形205の位置を捜し出す新規なアルゴリズム
の記述から開始され、続いてこのアルゴリズムが文字矩
形203によって定められた最大空白矩形205の位置
を捜し出すために適用される方法を明らかにする。
【0039】最大空白矩形の位置捜しだし(図6〜図8
) 図6は、xmin からxmax 及びymin から
ymaxに亘るx、y座標が割付けられた画像601を
示す。その画像上には三点(x1,y1)、(x2,y
3)、(x3,y2)が有る。図6の中の最大空白矩形
は、四辺が上記三点のうちの一つか或いはその画像の境
界線のうちの一つによって境界を定められる。従って、
最大空白矩形605はy軸及び上記三点(x1,y1)
、(x2,y3)、(x3,y2)によって境界を定め
られている。 ここ以降においては、最大空白矩形はそれらの下方左側
角部と上方右側角部の座標によって特定されるものとす
る。最大空白矩形605の場合では、それらの座標は(
xmin ,y1;x3,y3)である。
【0040】x軸上の所定の点で、活性な矩形はその右
辺が未だ境界と回合していない矩形である。従って、点
x3では矩形607は依然として活性である。ここ以降
においては、活性な矩形はその左辺のx座標とy軸上の
区間603を示す二個のy座標によって特定されるもの
とする。活性な矩形607は、例えば(xmin ,[
y3,ymax ])によって特定されている。
【0041】以下で説明するアルゴリズムは、何れの点
も他の点とは同じx座標或いはy座標を持たない最大空
白矩形に適用される。概念上、このアルゴリズムはその
画像をy軸と平行な線に沿って左から右へ走査すること
によって最大空白矩形の位置を捜し出す。その画像の中
で一つの点が回合される毎に、この新しい点でそれらの
右辺の境界が定められる活性な矩形が最大空白矩形リス
トへ出力され、一組の更新された活性な矩形が開始され
る。これらの更新された活性な矩形はそれらの上辺、底
辺或いは左辺がその新たな点によって定められる矩形で
ある。
【0042】例えば、xmin から点x1の間での走
査の初めには、一個の活性な矩形(xmin ,[ym
in ,ymax ])が有る。この走査で点(x1,
y1)に回合すると、活性な矩形(xmin ,[ym
in ,ymax ])の第四辺が定まり、その最大空
白矩形(xmin ,ymin ;x1,ymax )
が最大空白矩形リストへ出力される。x1とx2との間
には三個の活性な矩形、すなわち(xmin,[ymi
n ,y1])、(xmin ,[y1,ymax ]
)、(x1,[ymin ,ymax ])が有る。
【0043】上記アルゴリズムは、図7及び図8に示さ
れる論理木によって実効される。これらの木の中の各ノ
ード701は活性な矩形を表わし、各木はそれらがx軸
上の所定の二点間に存在しているとき活性な矩形を表わ
している。木703はxmin とx1との間に存在す
る活性な矩形を表わし、木705はx1とx2との間に
存在する活性な矩形を表わし、木707はx2とx3と
の間に存在する活性な矩形を表わし、木801はx3と
xmax との間に存在する活性な矩形を表わしている
【0044】これらの木の構造は木707によって最も
良く理解することができる。木707は子ノードを持た
ない葉ノード709と常に二個の子ノードを持つ内部ノ
ード717とで構成されている。内部ノード717は単
一の根ノード719を有する。木707には更に、葉ノ
ード709と根ノード719との間に三つのレベル71
1が有る。葉ノード709は、xmin に左辺がある
全ての活性な矩形を表わしている。次に上のレベルは最
初の点、この例ではx1に左辺がある全ての活性な矩形
を表わし、その次のレベルは次の点、この例ではx2に
左辺がある全ての活性な矩形を表わしている。
【0045】木707はx2とx3との間の活性な矩形
を表わしているので、より高いレベルは存在しない。或
るレベルでは、ノードがymin で始まりymax 
で終わるy区間によって整列されている。レベルx(k
)での内部ノード717の子ノードは、レベルx(n<
k)での、y区間が二つの属性、すなわち、互いに重な
り合わず、且つ全て内部ノード717のy区間の中に入
る属性を持つ活性な矩形を表わしている。
【0046】従って、活性な矩形(x1,[ymin 
,y3])を表わしている内部ノード717はその子ノ
ードとして活性な矩形(xmin ,[ymin ,y
1])、(xmin ,[y1,y3])を表わしてい
る葉ノードを有し、その一方で活性な矩形(x2,[y
min ,ymax ])を表わしている内部ノード7
17はその子ノードとして活性な矩形(x1,[ymi
n ,y3])を表わしている内部ノード717と(x
min ,[y3,ymax ])を表わしている葉ノ
ードを有する。
【0047】このアルゴリズムの動作の様子は、図6〜
図8を参照することによって理解することができる。x
軸に沿う左から右への行の走査は、x座標によって整列
されている点のリストによって表わされている。各点は
順にそのx座標の前の活性な矩形を表わしている木に与
えられる。xmin からx1までの間には一個の活性
な矩形(xmin ,[ymin ,ymax ])が
有り、その木はその活性な矩形に対して一個の葉ノード
を含む木703の形態を持っている。
【0048】走査が点(x1,y1)に達すると、木7
03によって表わされている活性な矩形は右辺を確定さ
れ、最大空白矩形(xmin ,ymin;x1,ym
ax )としてそのリストへ出力される。点(x1,y
1)の後には、木705から理解できるように三個の活
性な矩形が有る。木の操作によって、点(x1,y1)
が木703に与えられると、その結果ノード701が二
つに分割されて、左辺がxmin に在る二個の活性な
矩形が現に存在し、左辺がx1に在る上記更新された活
性な矩形に対して新たなノードが形成されている事実が
表わされる。
【0049】走査が点(x2,y3)に達すると、y3
を含んでいたy区間を持つ活性な矩形の右辺が確定され
、上記リストへ出力される。これらの更新された最大空
白矩形は、 (xmin ,y1;x2,ymax )(x1,ym
in ;x2,ymax )である。
【0050】上記更新された活性な矩形は、(xmin
 ,[y1,y3]) (xmin ,[y3,ymax ])(x1,[ym
in ,y3]) (xmin ,[ymin ,ymax ])である。
【0051】最大空白矩形を生成する一般的なアルゴリ
ズムは以下のとおりである。x座標によって分類された
点のリスト上の各点に対して、このアルゴリズムは以下
の操作をする。すなわち、その木を根ノードから現在の
点のy座標を含むy区間を持つ各ノードに対応する最大
空白矩形を出力する葉ノードへ走査し、新たな点のy座
標を含むy区間を持つ葉ノードを分割する。
【0052】更にこのアルゴリズムは、三個の潜在的な
子ノード(親ノードのx座標より小さなx座標を持ち、
親ノードのy区間に含まれていて重なりの無いy区間を
持つ子ノード)を有する親ノードを用いて、以下の操作
をする。すなわち、その親ノードのy区間を一つの境界
としてその新たな点のy座標を持ち且つ上記潜在的な子
ノードのうち二個の子ノードの間のy区間を含む新たな
y区間にリセットし、第三の上記潜在的な子ノードを上
記親ノードの親ノードの潜在的な子ノードになし、これ
らの操作をリセットされている区間を持つ上記親ノード
が親ノードを持たなくなるまで上記親ノードの親ノード
に対して繰り返す。
【0053】更にこのアルゴリズムは、上記新たな点の
x座標とy区間[ymin ,ymax ]を持つ新た
な根ノードを作成し、上記ステップ1、2の操作から得
られた二つの部分木の根ノードを上記新たな根ノードの
子ノードにする。
【0054】このアルゴリズムを木705から木707
への変換に適用すると、最初のステップではそれらノー
ドが上から下へ走査され、続いて左から右へ走査され、
上記各最大空白矩形が上記に示された順に出力される。 次いで、葉ノード(xmin ,[y1,ymax ]
)を分割して新たな葉ノード(xmin ,[y1,y
3])、(xmin ,[y3,ymax ])を生成
することにより、木705が木707に変換される。こ
のとき根ノード(x1,[ymin ,ymax ])
は三個の子ノード、(xmin ,[ymin ,y1
])(xmin ,[y1,y3]) (xmin ,[y3,ymax ])を持つ。
【0055】この根ノードのy区間は、上記三個の潜在
的な子ノードのうち単に二個の子ノードのy区間、この
例では(xmin ,[ymin ,y1])及び(x
min ,[y1,y3])を含むように縮小され、こ
れら二個のノードがこの根ノードの実際の子ノードに成
される。この時点では、二つの木、すなわち部分木71
5と部分木713が存在する。上記根ノードは親ノード
を持っていないので、次のステップで新たな根ノード(
x2,[ymin ,ymax ])が作成され、且つ
部分木715及び713がこの新たな根ノードの子ノー
ドに成される。
【0056】上記アルゴリズムは以下のようにして木7
07を木801に変換する。すなわち、根ノードから葉
ノードへの走査によって次の最大空白矩形、(xmin
 ,y1;x2,y3) (x1,ymin ;x3,y3) (x2,ymin ;x3,ymax )が出力される
【0057】次いで、上記葉ノード(xmin ,[y
1,y3])が分割されて親ノード(x1,[ymin
 ,y3])に三個の潜在的な子ノードを与える。この
親ノードのy区間が[ymin ,y2]に調節され、
y区間[ymin ,y1]及び[y1,y2]を持つ
二個の子ノードが実際の子ノードに成される。上記潜在
的な子ノード(xmin ,[y2,y3])は、ノー
ド(x1,[ymin ,y2])の親ノード、すなわ
ちこのときは三個の子ノード(x1,[ymin ,y
2])、(xmin ,[y2,y3])、(xmin
 ,[y3,ymax ])を持つ木707の根ノード
(x2,[ymin ,ymax ])の潜在的な子ノ
ードに成される。
【0058】続いて、上記アルゴリズムのうち三個の子
ノードを持つノードを処理する部分が木707の根ノー
ドに適用され、その結果根ノード(x1,[ymin 
,y2])及び(x2,[y2,ymax ])を持つ
二つの部分木が生成される。それらの根ノードは次いで
木801の新たな根ノードの子ノードに成る。
【0059】上記で記述したばかりのアルゴリズムは画
像の中の対角点の位置を捜し出す周知な方法及び論理木
をデータ構造として表わしそのようなデータ構造を操作
する周知な方法を用いて容易に履行することができる。
【0060】文字矩形203によって定められている最
大空白矩形205の捜し出し図6の各点が文字矩形20
3のような矩形に置換されるとき、これらの矩形が幅と
高さを持つ事実によって最大空白矩形を見付けだす問題
がかなり複雑になる。点を用いることによって、その点
との回合によって得られる全ての最大空白矩形205及
び全ての更新された活性な矩形607がこの回合に基づ
いて直ちに生成される。
【0061】これらの更新された活性な矩形607は三
つの部類、すなわちその点で底辺を持つもの、その点で
上辺を持つもの、その点で左辺を持つものに区分される
。矩形を用いることによって、文字矩形203の左辺と
回合するとき最大空白矩形205と最初の二つの部類の
更新された活性な矩形607が生成されるが、しかし文
字矩形203の右辺によって定められている左辺を持つ
上記更新された活性な矩形607は文字矩形203の右
辺と回合するまで生成することができない。
【0062】さらに、所定の文字矩形203が、より高
いx座標を持つ左辺を有する他の文字矩形が上記所定の
文字矩形203の左辺の影響に取って代わる影響を持つ
まで活性な矩形の生成に影響を及ぼし続ける。この理由
で、所定の文字矩形203はその右辺が回合した後でさ
え「活性」状態に止まっている。従って、所定の文字矩
形の左辺が回合したとき最大空白矩形が出力されなけれ
ばならず、且つ上記所定の文字矩形203と接する上辺
及び底辺を持つ更新された活性な矩形が出力されなけれ
ばならず、且つどの文字矩形がその左辺によって不活性
に成されたか否かが判定されなければならない。上記所
定の文字矩形203の右辺が回合するとき、上記所定の
文字矩形203の右辺と接する左辺を持つ更新された活
性な矩形が生成されなければならない。
【0063】以下において、画像切り出しプログム40
1の好ましい実施例で使用されているアルゴリズムを、
四個の文字矩形203を持つ簡単な画像の例を用いて詳
細に説明する。このアルゴリズムは相当に多くの文字矩
形203を持つ画像の例を使用して説明した方法で動作
する。
【0064】画像切り出しプログム401の好ましい実
施例は、典型的には2000個の文字矩形203を持つ
印刷書体のアルファベットの画像から大版の辞典類の頁
の画像を含み15000個に近い文字矩形203を持つ
画像に亘る画像に使用された。
【0065】画像例(図9参照) 図9は画像例901を示す。この画像例901は四個の
文字矩形203(0)〜203(3)を含んでいる。こ
れら四個の文字矩形203(0)〜203(3)は非テ
キスト・スペース106によって囲まれている。図9の
中の最大空白矩形605は、その四辺の各々がこの画像
の縁部または文字矩形203の一辺と接している矩形で
ある。
【0066】同様に、図9の中の活性な矩形607はそ
の左辺、上辺、底辺が文字矩形203の一辺または画像
901の左縁、上縁、底縁と接しているが、しかしその
右辺は文字矩形203の左辺または画像901の右縁に
は未だ達していない。
【0067】各文字矩形203は左辺905と右辺90
7を持っている。x軸と垂直な線が画像901を横切っ
て走査するとき、それまでの活性な矩形607は文字矩
形203の左辺905と回合する毎に最大空白矩形60
5と成り、文字矩形203の左辺905または右辺90
7と回合する毎に更新された活性な矩形607が生成さ
れる。左辺905または右辺907とのこのような回合
を本明細書では「イベント(event:出来事)」と
呼ぶ。もし走査線が図9の中のx4で起きているように
左辺905と右辺907とに回合すると、その結果各辺
に一つづつ二つのイベントが生じる。
【0068】好ましい実施例では、イベントは五個の情
報、すなわちそのイベントが起きたときの走査線のx軸
上の位置、回合した辺を持つ矩形の数、回合した辺は左
辺905であるか、回合した辺は右辺907であるか、
その辺の位置、によって特定される。辺の位置は三個の
区間、すなわちymin から辺の開始位置まで、辺の
開始位置から辺の終了位置まで、辺の終了位置からym
axまでの各区間によって表わされる。
【0069】文字矩形203(0)の右辺に対する各区
間は、図9では909、911、912で特定されてい
る。このようにして、走査線が文字矩形203(0)の
右辺にx7で回合するときに起きるイベントは次の値、
x7、0、右、[ymin ,y5]、[y5,y6]
、[y6,ymax ]によって特定される。
【0070】図10は、x1での画像901の活性な矩
形を表わす論理木1001を示す。上記に記述されてい
るように、文字矩形203は、それらの左辺が回合して
いる位置からそれらの左辺が最早活性な矩形の生成に影
響を及ぼすことが無い位置まで活性である。従って、論
理木1001は非テキスト・スペース106の活性な矩
形に対するノードのみならず、文字矩形203に対する
ノードを有し、最早論理木ではない。
【0071】活性な非テキスト矩形607は、ノード1
003の中では次の値、すなわち活性な非テキスト矩形
607を示すW、この矩形607の左辺のx座標、この
矩形607の左辺に対応するy軸上の区間、によって表
わされる。活性な文字矩形203は次の値、すなわち文
字矩形203を示すB、文字矩形203の右辺に達して
いないことを示すxmax (もしそれが達していれば
、xmax はその右辺のx座標で置換される)、文字
矩形203の左辺に対応するy軸上の区間、によって表
わされる。
【0072】前述の如く、或るノードの子ノードは重な
り合わず、且つそれらの親ノードに対して特定されたy
区間の中に入っている範囲のy区間を有し、これら子ノ
ードはそれらの左辺がそれらの親ノードが持つ左辺のx
軸上の位置より低いx軸上の位置に在る活性な矩形を表
わしている。左辺側のイベントではこのイベントのx座
標で開始している更新された活性な非テキスト矩形60
7を生成することが無いので、根ノード1002は活性
な矩形を特定しない。
【0073】好ましい実施例におけるリスト及び木の表
示(図11〜図14参照) 図11は、好ましい実施例における文字矩形リスト40
3及び最大空白矩形リスト407を履行するために用い
られるデータ構造を示す。両リストは矩形を表わすレコ
ードによって履行される。各レコードは一群のポインタ
ーによって指示され、これら一群のポインターは文字矩
形リスト403を管理するために必要な情報を有するヘ
ッダーによって指示される。リストの細目はリスト40
3についてのみ図示されている。
【0074】先ずレコードに関して、文字矩形レコード
(CRR)1117はフィールド1119の中の上記一
群のポインターによって表わされる文字矩形の左下方の
角部のx、y座標及びフィールド1121の中の右上方
の角部の座標を有する。文字矩形群(CRA)1113
は、文字矩形レコード1117に対する一群のポインタ
ー(CRRPTR)1115である。
【0075】最後に、文字矩形ヘッダー1103は文字
矩形群1113に対するポインター(CRAPTR)1
107と最新の数の文字矩形レコード1117(CRR
CT1105)を含む管理情報に対するフィールド、文
字矩形群1113(CRAECT1109)の中のエン
トリーの総数、文字矩形群1113が拡張されるとき文
字矩形群1113に加えられるべきCRAINC111
1の量とを有する。
【0076】最大空白矩形リスト407も、最大空白矩
形レコード(MERR)1123がフィールド1125
、1127の中の左下方と右上方の角部の座標の他にフ
ィールド1129の中で分類する目的で用いられる寸法
値を有することを除いて、同様に履行される。
【0077】図12は、イベント・リストの中のノード
及び活性な矩形の木の中のノードを履行するために好ま
しい実施例で使用されるデータ構造を示す。これらのフ
ィールドは、x軸上の点においてx軸と垂直な線上に区
間を定める区間寸法(IDIM)フィールド1205と
、区間が左辺であるか右辺であるか或いは何れでもない
かを指摘する区間種別フィールド1213と、区間の色
彩とを有する。後でより詳細に説明されるように、これ
らのフィールドの中の値の組み合わせによって、データ
構造によって表わされるノードの種類が判定される。 従って、これらのフィールドは一緒にノード種類情報1
203を組み立てている。
【0078】次に、これらのフィールドの詳細を説明す
ると、Xフィールド1207は画像103のx軸上の点
を示し、TYフィールド1209はy軸上の点のうち高
い位置のものを示し、BYフィールド1211はy軸上
の点のうち低い位置のものを示し、これらのフィールド
が一緒にy区間を特定する。SIDE1215はノード
が左辺を表わしているか、右辺を表わしているか、或い
は何れをも表わしていないかを特定し、COLOR12
17はノードによって表わされている辺または矩形が非
テキスト・スペース106の中に在るのかまたは文字矩
形203の中に在るのかを特定する。
【0079】DPTR1219はリストまたは木の中の
低い位置にあるノード1201に対するポインターであ
り、NPTR1221はリストまたは木の中の同じ位置
にあるノード1201に対するポインターである。CR
I1114は、文字矩形群1113の中の矩形のうち、
ノード1201によって表わされた文字矩形203を表
わしている文字矩形レコード1117に対するポインタ
ーを持つ矩形に対する指標である。
【0080】図13はイベント・リスト1301を示す
。イベント・リスト1301は、上記記述のように画像
が概念上線によって走査されたとき、最大空白矩形60
5及び活性な矩形607を生じるイベントのリストであ
る。好ましい実施例では、イベント・リスト1301は
文字矩形リスト403を分類して文字矩形203の左辺
及び右辺のx座標及びy座標を得ることによって作成さ
れる。イベント・リスト1301の中では、x座標が増
大する順及び辺によって各辺が整列されている。所定の
x座標に対して、下位のy座標が増大する順に全ての右
辺が列挙され、続いて下位のy座標が増大する順に全て
の左辺が列挙されている。
【0081】好ましい実施例では、イベント・リスト1
301は各辺を表わすノードを用いて履行される。各イ
ベントに対して、そのイベントを表わすノード1201
のイベント列1307が有る。このイベント列1307
はイベント・ヘッダー・ノード1303と少くとも三個
の区間ノード1305とから成っている。イベント・ヘ
ッダー・ノード1303はそのイベントのx座標、その
イベントを生じる文字矩形203の文字矩形レコード1
117に対するポインターのCRA1113の中の指標
、そのイベントを生じる文字矩形203の辺を示す。 この情報はノード1201の期待フィールドの中に含ま
れている。
【0082】イベント・ヘッダー・ノード1303は、
ポインターNPTR1221によって互いに結合されて
いる区間ノードのうち最初の区間ノードにポインターD
PTR1219を介して結合され、それらの区間ノード
のうち最後の区間ノードは同じポインターによって次の
イベント・ヘッダー・ノード1303に結合されている
。上記区間ノード1305はyの値によって整列されて
おり、各区間ノードはその色彩、そのイベントのx座標
、yの値を特定する。
【0083】図13のイベント・リスト1301は図9
に対するイベント・リストの部分を示す。従って、その
最初のヘッダー・ノードは文字矩形203(3)の左辺
に対するイベント列1307を開始し、よってその最初
のヘッダー・ノードはx1、x3、Lを特定する。x1
には単に一個の左辺が有り、その結果三個の区間ノード
、すなわち非テキスト区間[ymin ,y2]に対す
る区間ノード、文字矩形203(3)の左辺[y2,y
3]に対する区間ノード、非テキスト区間[y3,ym
ax ]に対する区間ノードのみが存在する。イベント
・リストの残り部分は単に略記されているに過ぎないが
同様に構成されている。
【0084】このようにして、次のイベント列1307
はx2、すなわち文字矩形203(2)の左辺の位置で
開始され、更にその次のイベント列1307はx3、す
なわち文字矩形203(2)の右辺の位置で開始される
。x4では二個のイベント列1307、すなわち文字矩
形203(0)の右辺に対するイベント列と文字矩形2
03(3)の左辺に対するイベント列が有る。
【0085】図14は図10の論理木1001がノード
1201を用いて履行される様子を示す。活性な矩形の
木1401は四種類のノード、すなわち根ノード140
3、活性な非テキスト矩形ノード1405、活性な矩形
ノード1409、ラベル・ノード1407を持っている
。根ノード1403は論理木1401の根ノードであり
、これは何れの活性な矩形も表わしていない。各ノード
1405は活性な非テキスト矩形607を表わし、各ノ
ード1409は活性な文字矩形203を表わしている。 各ラベル・ノード1407は子ノードを持たない活性な
非テキスト矩形ノード1405を明示している。
【0086】ノード間の関係は以下のとおりである。す
なわち、所定の活性な非テキスト矩形ノード1405か
ら派生しているノードには、この所定の活性な非テキス
ト矩形ノード1405のy区間の中に入っているy区間
を持つ全てのノード1405、1409が含まれる。活
性な非テキスト矩形ノード1409は子ノードを持って
いない。
【0087】兄弟ノード(同じ親ノードを持つ子ノード
)間の順序はy区間に関して左から右に並んでいる。 それらノード間の関係はノード1201の中のポインタ
ーDPTR1219及びNPTR1221によって表わ
されている。兄弟ノードはポインターNPTR1221
によって結合され、一群の兄弟ノードのうち最も左側の
ものはその親ノードが持つポインターDPTR1219
によってその親ノードに結合され、同様にこのポインタ
ーDPTR1219は子ノードを持たない活性な非テキ
スト矩形ノード1405をそのラベル・ノード1407
に結合している。
【0088】NTYフィールド1203の内容はノード
の種類を識別する。よって、根ノード1403は座標値
xmax ,[ymin ,ymax]によって識別さ
れ、活性な非テキスト矩形ノード1405は色彩値Wに
よって明示され、活性な非テキスト矩形ノード1409
は色彩値Bによって明示され、ラベル・ノード1407
はその色彩値B及びそれらが明示している葉ノードと同
じx座標値とy座標値を持っている。
【0089】最大空白矩形位置捜し出しプログラム(M
ERロケータ)405の動作(図15〜図18参照)好
ましい実施例では、最大空白矩形位置捜し出しプログラ
ム405がその画像に対するイベント・リスト1301
からのイベント列1307を最新の活性な矩形の木14
01へ適用することによって最大空白矩形の位置を捜し
出す。
【0090】概括的な表現では、最大空白矩形位置捜し
出しプログラム405は先ず根ノードから葉ノードへの
活性な矩形の木1401を読み取ってどれらの活性な非
テキスト矩形607が第四の辺を受けその結果最大空白
矩形リスト407ヘ書込まれなければならないかを判定
し、続いて最大空白矩形位置捜し出しプログラム405
が活性な矩形の木1401を葉ノードから枝へ走査して
最早活性な非テキスト矩形を表わしていないノード14
05を除去し、最大空白矩形605の生成のそれ以上の
影響を持たないであろう文字矩形に対するノードを除去
し、イベント列1307によって表わされているイベン
トから得られた更新された活性な矩形を表わしているノ
ード1405及び1409を加える。
【0091】上記動作は二つの例を用いて図9に基づき
、より詳細に説明することができる。最初の例は最大空
白矩形位置捜し出しプログラム405が当初の活性な矩
形木から区間x1、x2の中に活性な矩形木を生成する
仕方を示し、第二の例は最大空白矩形位置捜し出しプロ
グラム405がx5で起きるイベントに応じて区間x5
、x6の中に活性な矩形木を生成する仕方を示す。
【0092】先ず最初の例を説明すると、この例は図1
5に図示されており、x1で起きるイベントは文字矩形
203(3)が左辺905と回合することである。この
イベントに対するイベント列1307は1505で示さ
れている。ヘッダー・ノード1303はそのイベントが
x1で起きたこと及びそれが左辺であったことを示し、
残るノードは以前に指摘した如くその左辺の境界を定め
る。
【0093】イベント列1505が与えられている活性
な矩形の木1401は木1503として現われている。 この木1503は、ノード1405が子ノードを持って
いないので根ノード1403と活性な矩形(xmin 
,[ymin ,ymax ])を特定している単一の
活性な非テキスト矩形ノード1405とから成っている
【0094】x1で起きているイベントを処理する最初
のステップとして、更新された左辺によって境界を定め
られた最大空白矩形605の判定が為される。最大空白
矩形位置捜し出しプログラム405が、木1503を根
ノードから葉ノードへ下り、ここで更新された左辺と重
なり合うy区間を持つノード1405を捜し出すことに
よってこの判定を行なう。そのような各ノードに対して
、最大空白矩形位置捜し出しプログラム405は最大空
白矩形605に対する最大空白矩形レコード1123を
最大空白矩形リスト407へ出力する。
【0095】木1503の中では、この木1503の単
一のノード1405がイベント列1505からの空白区
間[y2,y3]を含むy区間[ymin ,ymax
 ]を持っている。この結果、最大空白矩形位置捜し出
しプログラム405は単一の最大空白矩形レコード11
23を最大空白矩形リスト407に加える。この更新さ
れた最大空白矩形605の大きさは(xmin ,ym
in ;x1,ymax )である。
【0096】木1503の単一の葉ノードに達したとき
、最大空白矩形位置捜し出しプログラム405は木15
07の作成を開始する。x1に続いて、関わりを持つべ
き三個の活性な矩形、すなわちそれぞれ[ymin ,
y2]、[y3,ymax ]のy区間を持つ二個の活
性な非テキスト矩形と[y2,y3]のy区間を持つ一
個の活性な文字矩形が存在する。
【0097】図15からわかるように、これらの矩形は
元の木1503の単一の葉ノードの位置を占める兄弟ノ
ードによって表わされている。その兄弟ノードのうちの
二個は、活性な非テキスト矩形を表わすノード1405
であり、第三のノード1509は一個の活性な文字矩形
を表わす。
【0098】活性な文字矩形1509の中のx座標xm
ax は、最大空白矩形位置捜し出しプログラム405
がこの活性な文字矩形1509の左辺と既に回合してい
るが、しかし未だその右辺とは回合していないことを示
している。木1507は、根ノード1403を除き全て
のノードを含む木1503の部分木を複製することによ
って作成される。これらのノードが複製されるので、そ
れらのノードが有するy区間が、更新された左辺によっ
て必要とされるように設定される。続いて、それら複製
された木が根ノード1403に結合され、最終的には活
性な文字矩形203(3)を表わすノード1509が二
個の複製された木の間に挿入されて木1507を生じる
【0099】次ぎに第二の例を説明すると、図16は区
間x4,x5の中で現れるときのこの活性な矩形の木1
401を示し、図17は区間x5,x6の中で現れると
きのこの活性な矩形の木1401を示す。木1601は
幾つかの特に興味を引く特徴を持っている。先ず、16
05の符号が与えられている三個のノードが有り、これ
らのノードの各々が、文字矩形203の高さを定めてい
るy区間の全体または一部分が活性な非テキスト矩形6
07の生成に依然として影響を及ぼしているので、右辺
が既に回合されているが依然として活性状態にある文字
矩形203を表わしている。
【0100】各ノード1605の内容には、色彩、右辺
のx座標、活性な非テキスト矩形の生成に依然として影
響を及ぼしているy区間の部分が含まれている。もしそ
のような部分が二個以上有れば、各部分にノード160
5が存在する。従って、文字矩形203(3)に対して
一個のノード1605が有り、文字矩形203(2)に
対して二個のノード1605が存在する。
【0101】文字矩形203(2)の区間[y5,y6
]は文字矩形203(0)の左辺によってカバーされ、
その結果活性な非テキスト矩形の生成に最早影響を及ぼ
さないので、二個のノード1605が必要となっている
。文字矩形203(2)に対する二個のノード1605
は、文字矩形203(0)の左辺がx4で回合されたと
きに区間[y4,y7]を表わしている一個のノード1
605から作成されたものである。
【0102】以上の説明からわかるように、所定の文字
矩形203に対応する各ノード1506は他の文字矩形
203は、上記所定の文字矩形203が次ぎの活性な非
テキスト矩形607の生成に与える影響を完全に阻止す
るように一緒に働くそれらのy区間と回合し終わるまで
木1401の中に止まっている。例えば、文字矩形20
3(1)の左辺は文字矩形203(3)のy区間の全体
をカバーし、その結果文字矩形203(3)のy区間は
x5を越える範囲には最早影響を持っていない。
【0103】更に、文字矩形203(1)の上辺が文字
矩形203(2)の底辺と同じy座標y4を有し、その
結果文字矩形203(2)のy区間[y4,y5]はx
5を越える範囲には最早影響を持っていない。後で行な
う説明からわかるであろうが、文字矩形203(1)の
左辺との回合による一つの影響として、木1601から
の文字矩形203(3)のy区間[y2,y3]及び文
字矩形203(2)のy区間[y4,y5]を表わして
いるノードが除去される。
【0104】所定のノード1605と木1401の他の
ノードとの関係は以下の如く説明される。すなわち、上
記所定のノード1605が同一の文字矩形203に対す
るノード1509と入れ替わる。従ってこの所定のノー
ド1605は同一の兄弟ノードを有する。この所定のノ
ード1605及びその兄弟ノードの全てが、この所定の
ノード1605によって表わされている右辺でのイベン
トの結果として作られた活性な非テキスト矩形607を
表わしている新たなノード1405の子ノードである。
【0105】従って、木1601の部分木1607の中
の、(B,x3,[y6,y7])なる内容を持つノー
ド1605は(W,x3,[y6,ymax ])なる
内容を持つノード1405の子ノードであり、(W,x
min ,[y7,ymax ])なる内容を持つ単一
の兄弟ノードを右方側に持っている。
【0106】部分木1607とy区間[y3,y5]に
対するノード1605を持つその対応する部分木160
9とは文字矩形203(0)の左辺がx3で回合された
ときに作られたものである。このイベントの結果、親ノ
ード(W,x3,[y3,ymax )と兄弟ノード(
W,xmin ,[y3,y4)、(B,x3,[y4
,y7)、(W,xmin ,[y7,ymax )と
を有する部分木が、再帰的に先ずノード(B,x3,[
y4,y7)を用いて複製され、次ぎにノード(W,x
3,[y3,ymax )を用いて複製されている。次
いで、複製された各部分木の中のy区間が文字矩形20
3(0)の左辺によって必要とされるように設定され、
複製された各部分の親ノードがこの親ノードのy区間に
よって必要とされる兄弟ノードに結合されている。
【0107】最大空白矩形位置捜し出しプログラム40
5は、走査線が文字矩形203(1)の左辺と回合する
ことを表わすイベント列1307に応答して木1601
から木1701を生成する。それらのノードの内容を除
き、イベント列1307は図15のイベント列1505
と同一であるので図示を省略されている。
【0108】上記から明らかなように、最初のステップ
ではそのイベントの結果生じた何らかの最大空白矩形6
05を出力するために、木1601を根ノードから葉ノ
ードへ移動する。その結果、最初にノード(W,x4,
[ymin ,y5])によって表わされている活性な
非テキスト矩形607から最大空白矩形605の出力(
x4,ymin ;x5,y5)が生じ、次ぎにノード
(W,xmin ,[ymin ,y2])によって表
わされている活性な非テキスト矩形607から最大空白
矩形605の出力(xmin ,ymin ;x5,y
2)が生じ、以降、同様に最大空白矩形605の出力が
生じる。
【0109】最大空白矩形リスト407に加えられてい
る最大空白矩形605の完全なリストは、(x4,ym
in ;x5,y5) (xmin ,ymin ;x5,y2)(x3,y3
;x5,y5) (xmin ,y3;x5,y4) である。
【0110】次ぎのステップでは、再び木1601の最
も左側の枝の末端へ下り、木1701の作成を開始する
。この新たな木1701は、先ず縦方法に末端から上端
へ、次いで左から右へ作成される。ここでの最初のステ
ップでは、y1とy4との間に入るノードは最大空白矩
形605となっている活性な非テキスト矩形607か或
いは活性な非テキスト矩形607の生成に最早何ら影響
を持っていない文字矩形203の何れかを表わしている
から、このような全てのノードが取り除かれる。木18
01はこの取り除きの結果を示す。
【0111】次ぎのステップでは、木1801が再帰的
に複製され、複製された木のy区間が既に説明されたよ
うに調節されて図18に示される内容を持つ木1803
が作られる。更に次ぎのステップでは、ノード1613
を二個の新たなノード1805、1807で置き換えて
木1809が作られる。最後のステップでは、文字矩形
203(1)を表わすノード1813をノード1805
とノード1807の間に挿入して木1311が作られる
【0112】木1401を改変する際に用いられた説明
は、これまでは文字矩形203の左辺との回合によって
生じる改変のみを取り扱ってきたが、右辺との回合によ
って生じる改変は遥かに単純であり、そのような回合の
結果、活性な文字矩形に対するノード1509がノード
1605へ置き換えられ、且つx座標でその回合状態に
ある左辺を持つ活性な非テキスト矩形607を表わす新
たなノード1405が生成される。この新たなノード1
405は根ノード1403の子ノードになり、この新た
なノード1405のy区間の中に含まれているy区間を
持つ根ノード1403の以前の子ノードの全てがこの新
たなノード1405の子ノードになる。
【0113】最大空白矩形位置捜し出しプログラム40
5の動作の概要 最大空白矩形位置捜し出しプログラム405の動作は以
下のように要約することができる。すなわち、イベント
・リスト1301の中の各イベント列1307に対して
、なお、もしこのイベント列1307が左辺に対するも
のである場合は各左辺に対して、先ずその左辺のy区間
と重なり合うy区間を持つ活性な非テキスト矩形607
を表わしているノードを捜し出すために、その木を縦方
向に根ノードから葉ノードへ走査し、そのような回合が
為されたノードに対して最大空白矩形605を出力する
【0114】末端の左から開始してその木の各枝をその
枝の末端左側の葉ノードからその根ノードへ上る。各枝
では、その左辺のy区間と重なり合うy区間を持つ活性
な矩形を表わしている最初のノードを親ノードにまで上
る。その枝を上って行く途中で、その新たな左辺と重な
り合うy区間を持つ兄弟ノードを全て取り除き、その親
ノードより下位の枝の中に残っているノードを複製する
【0115】それらノードが複製されるときその新たな
左辺によって必要とされるようにそれらのy区間を設定
し、もしその親ノードが根ノード1403でなければそ
の親ノードを複製された木と置き換え、もしその親ノー
ドが根ノード1403であればそれら複製された木を根
ノード1403の子にし、その新たな左辺に対して新た
なノードを作成してその新たなノードをそれら複製され
た木の間に挿入する。
【0116】もしイベント列1307が右辺に対するも
のである場合は各右辺に対して、その右辺が属する文字
矩形203に対してノード1509が見出だされるまで
その木の上端から末端へ走査し、ノード1509を対応
するノード1605と置き換え、その木の中にその右辺
から開始しているものと同等な活性な非テキスト矩形6
07を表わしているノードが既に有るか否かを判定し、
もし有ればノード1605とその兄弟ノードをそのノー
ドの子にし、もし無ければそのノードを作ってそれを根
ノード1403に結合し、ノード1605とその兄弟ノ
ードをその新たなノードの子にする。
【0117】最大空白矩形リスト407からのカバー・
セット301の生成(図19)今ほど述べたようにして
、最大空白矩形位置捜し出しプログラム405によって
一旦最大空白矩形リスト407が生成されると、このリ
スト407は形状指向分類プログラム409により処理
してカバー・セット301を生成することができ、この
カバー・セット301をテキスト抽出プログラム411
により処理して画像103からテキスト・カラム画像1
09を抽出することができる。
【0118】図19は形状指向分類プログラム409と
テキスト抽出プログラム411を示すブロック・ダイヤ
グラムである。以下の説明では先ず形状指向分類プログ
ラム409が取り扱われ、次いでテキスト抽出プログラ
ム411が取り扱われる。
【0119】形状指向分類プログラム409既に説明し
たように、本発明の重要な面は画像の非テキスト領域を
分類するために切り出しされている画像の部類に対して
特質的な形状情報を使用することにある。この後で説明
される実施例では、最大空白矩形を分類するために使用
される特質的な形状情報が、マンハッタン・レイアウト
の中のカラムが非テキスト・スペース106の細長い矩
形によって区画される傾向を有するという観察から引き
出されている。
【0120】幾何学的表現では,マンハッタン・レイア
ウトの中のカラムを定めるために顕著な最大空白矩形は
高いアスペクト比(矩形の長辺の長さ対その短辺の長さ
の比)を持つ矩形である。他方で、マンハッタン・レイ
アウトでは極端に高いアスペクト比を持つ矩形がカラム
の中の行間或いはカラムの中で隣接している行同士の文
字間に置かれやすく、従ってカラム自体の位置に関して
は顕著ではないことがやはり観察されている。
【0121】好ましい実施例では、これらの観察が形状
指向分類プログラム409のSIZE要素1901に組
み入れられている。SIZE要素1901は最大空白矩
形リスト407の中の各最大空白矩形605について以
下のステップを実行する。すなわち、SIZE要素19
01は長辺を短辺で除してアスペクト比を得、もしこの
アスペクト比が16を超える大きさであれば16に縮小
する。分類目的のため、最大空白矩形605の大きさを
式[面積×log(アスペクト+1)]によって計算す
る。但し、式の中の「面積」は最大空白矩形605の面
積であり、「アスペクト」は最大空白矩形605のアス
ペクト比である。
【0122】こうして各最大空白矩形605の寸法値が
算出された後、その値が最大空白矩形605に対する最
大空白矩形レコード1123のSIZE領域1129に
格納される。次いで、SORT要素1903がSIZE
領域1129の値により最大空白矩形リスト407を分
類し、分類された最大空白矩形リスト1905を生成す
る。最大の大きさを持つ最大空白矩形605に対する最
大空白矩形レコード1123は分類された最大空白矩形
リスト1905の表面に現われている。
【0123】分類された最大空白矩形リスト1905の
形式は、図9の最大空白矩形605がSIZE要素19
01及びSORT要素1903を通過するときに生じる
最大空白矩形の下記の分類されたリストから理解するこ
とができる。各エントリーは最大空白矩形の角部の座標
及びSIZE要素1901によって算出されたその大き
さを特定している。
【0124】 (x1,y3;x2,y7)643.77516(x6
,y1;x7,y5)643.77516(x1,y1
;x5,y2)643.77516(x3,y6;x7
,y7)643.77516(x1,y3;x5,y4
)610.05446(x3,y3;x4,y7)61
0.05446(x3,y4;x7,y5)610.0
5446(x4,y1;x5,y5)610.0544
6(x3,y3;x5,y5)250.22613
【0
125】上記リストが作成される前は、座標(x1,y
1;x7,y7)を持つ矩形が文字矩形203の回りに
形成されており、その結果、その分類の結果が最小と最
大のx座標位置とy座標位置を生じる矩形によって歪め
られていた。
【0126】次ぎのステップでは、カバー・セット30
1の算出に使用するために分類された最大空白矩形リス
ト1905のサブセット1904を選択する。好ましい
実施例では、このサブセットは単に分類された最大空白
矩形リスト1905のうち高々1%を取ることによって
選択され、他の実施例では、カバー・セット301は先
ず分類された最大空白矩形リスト1905上の僅かな最
大空白矩形605から組み立てることができ、さもなけ
れば分類された最大空白矩形リスト1905のどの部分
がサブセット1904のために選択されるかを、この分
類された最大空白矩形リスト1905上の矩形の特徴を
観察することによって決定することができる。
【0127】テキスト抽出プログラム411は二つの要
素、すなわちOR要素1909と補数(Complem
ent)要素1911とを有する。OR要素1909は
サブセット1904の最大空白矩形の論理和を取ってカ
バー・セット301を生成し、補数要素1911はカバ
ー・セット301の補数の座標を用いてテキスト・カラ
ム画像109を生成しそのテキスト・カラムの位置を画
像103の中で捜し出す。
【0128】最大空白矩形の論理和を取る手法及びその
補数を見出だす手法はこの技術分野で周知である。特に
最大空白矩形の論理和を取る手法は1985年6月に発
行された「IEEE、コンピュータの設計及びテスト(
IEEE  Design  and  Test  
of  Computer´s)」誌、第2巻、第3号
、64〜72頁に掲載されているシマンスキー・ティ・
ジー(Szymanski,T.G.)氏とヴァン・ワ
イク・シー・ジェイ(van  Wyk,C.J.)氏
の論文、「GOALIE:(超大規模集積回路)作図作
業解析のためのスペース効率化システム(A  Spa
ce  Efficient  System  fo
r  VLSI  Artwork  Analysi
s)」に記載されている。
【0129】結論 上記の「詳細な説明」では、この分野の技術者に対して
、本発明の原理を具現しテキストのカラムの位置をマン
ハッタン・レイアウトを持つ画像の中で捜し出すことが
できる画像切り出しプログラムを有する文書読み取り装
置を構成することができる方法を開示している。しかし
ながら、ここで開示された原理はマンハッタン・レイア
ウトに限定されず、画像の非テキスト部分が特有な形状
を持つどのような部類の画像にも適用することができる
【0130】同様に、上記「詳細な説明」では、画像の
中に対角点で定められた最大空白矩形と画像の中に矩形
で定められた最大空白矩形との位置を捜し出す方法を開
示している。これらの方法はこのような状況においてだ
けでなく、画像の中に有る最大空白矩形を判定すること
が必要とされるような状況においても使用可能である。
【0131】上記のことが実情であるから、上記「詳細
な説明」は全ての点で模範例であるがそれに限定される
べきものではないことが理解されるべきであり、本発明
の範囲は「詳細な説明」からではなく、むしろ「詳細な
説明」及び均等の原則を参酌して解釈されるような付帯
請求項から判断されるべきである。
【0132】
【発明の効果】以上述べたごとく、本発明によれば、上
昇型手法が持つ簡易性及び高速性と下降型手法が持つ全
体的視野とを組み合わせた画像切り出し技術を提供する
ことができる。
【図面の簡単な説明】
【図1】画像から文字情報を抽出するシステムを示すブ
ロック・ダイヤグラムである。
【図2】マンハッタン・レイアウトの一例を示す図であ
る。
【図3】図2の例の中のカバー・セットを示す図である
【図4】本発明を使用することができる画像切り出しプ
ログラムを示すブロック・ダイヤグラムである。
【図5】文字と文字矩形との間の関係を示す図である。
【図6】一組の点を有する画像を示す図である。
【図7】活性な矩形を有する数個の木を示す図である。
【図8】活性な矩形を持つ一個の木を示す図である。
【図9】一組の文字矩形を有する画像を示す図である。
【図10】活性な非テキスト矩形と活性な文字矩形との
論理木を示す図である。
【図11】文字矩形と最大空白矩形を表わすために使用
されるデータ構造を示す図である。
【図12】リスト及び木の中のノードを表わすために使
用されるデータ構造を示す図である。
【図13】事象リストを示す図である。
【図14】活性な非テキスト矩形と活性な文字矩形の論
理木の履行を示す図である。
【図15】最大空白矩形位置捜し出しプログラムの第一
の動作例を示す図である。
【図16】最大空白矩形位置捜し出しプログラムの第二
の動作例を示す第一の図である。
【図17】最大空白矩形位置捜し出しプログラムの第二
の動作例を示す第二の図である。
【図18】最大空白矩形位置捜し出しプログラムの第二
の動作例を示す第三の図である。
【図19】SD分類プログラム409及びテキスト抽出
プログラム411を示すブロック・ダイヤグラムである
【符号の説明】
101  文字情報抽出システム 103  画像 105  テキスト・カラム 106  非テキスト・スペース 107  画像切り出しプログラム 109  テキスト・カラム画像 111  テキスト・カラム解析プログラム113  
ディジタル文字符号 115  テキスト・ファイル 201  マンハッタン・レイアウト 203  文字矩形 205(a)〜(c)  最大空白矩形207  カラ
ム 209  行 211  単語 301  カバー・セット 401  画像切り出しプログラム 402  文字矩形位置捜し出しプログラム403  
文字矩形リスト 405  最大空白矩形位置捜し出しプログラム407
  最大空白矩形リスト 409  形状指向分類プログラム 411  テキスト抽出プログラム 501  画素 503  文字 507  矩形 509  8字状に繋がっているしみ状態の画素511
  テキスト文字を囲むには小さ過ぎるために排除され
る黒く埋められた矩形 601  画像 603  区間 605  最大空白矩形 607  矩形 701  ノード 703  木 705  木 707  木 709  葉ノード 711  レベル 713  部分木 715  部分木 717  内部ノード 719  根ノード 801  木 901  画像例 905  左辺 907  右辺 909  文字矩形の右辺に対する区間911  文字
矩形の右辺に対する区間912  文字矩形の右辺に対
する区間913  文字矩形の右辺に対する区間100
1  論理木 1003  ノード 1103  文字矩形ヘッダー 1105  CRRCT 1107  ポインターCRAPTR 1109  CRAECT 1111  CRAINC 1113  文字矩形群 1114  CRI 1115  ポインターCRRPTR 1117  文字矩形レコード 1119  フィールド 1121  フィールド 1123  最大空白矩形レコード 1125  フィールド 1127  フィールド 1129  フィールド 1201  ノード 1203  ノード種類情報 1205  区間寸法フィールド 1207  Xフィールド 1209  TYフィールド 1211  BYフィールド 1213  区間種別フィールド 1215  SIDE 1217  COLOR 1219  ポインターDPTR 1221  ポインターNPTR 1301  イベント・リスト 1303  イベント・ヘッダー・ノード1305  
区間ノード 1307  イベント列 1401  活性な矩形の木 1403  根ノード 1405  活性な非テキスト矩形ノード1407  
ラベル・ノード 1409  活性な矩形ノード 1501  イベント例 1503  木 1505  イベント列 1507  木 1509  活性な文字矩形 1601  木 1605  ノード 1607  部分木 1609  部分木 1611  ノード 1613  ノード 1701  木 1801  木 1803  木 1805  ノード 1807  ノード 1809  木 1901  SIZE要素 1903  SORT要素 1904  サブセット 1905  最大空白矩形リスト 1909  OR要素 1911  補数要素

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】  部類が画像の構成部分の形状によって
    定められている或る部類に属する画像を切り出す方法に
    おいて、この方法は、画像の全てが第一の種類の内容を
    有する第一の構成部分の第一の組みの位置を捜し出すス
    テップと、画像の、各々が前記第一の種類の内容を含ま
    ず且つ第一の構成部分の何れをも含まず或いは何れとも
    重なり合うことがない構成部分である第二の構成部分の
    第二の組みの位置を捜し出すステップと、画像が持つ部
    類の形状情報特性を使用する前記第二の組みの解析によ
    って画像切り出しを行なうステップとから成ることを特
    徴とする方法。
  2. 【請求項2】  更に、前記画像の一面に亘り前記画像
    切り出しを行なうことによって前記第一の構成部分の少
    なくとも一つを含む前記画像の一部の位置を捜し出すス
    テップを有することを特徴とする、請求項1記載の方法
  3. 【請求項3】  前記第一の構成部分がテキスト文字を
    囲むことを特徴とする、請求項1または2記載の方法。
  4. 【請求項4】  前記第一の構成部分が第一の矩形であ
    り、前記第二の構成部分が、前記第一の矩形画像の何れ
    をも含まず或いは何れとも重なり合うことがない前記画
    像の最大の矩形であることを特徴とする、請求項1また
    は2記載の方法。
  5. 【請求項5】  前記画像切り出しを行なうステップが
    、前記第二の組みをアスペクト比によって整列させて、
    前記第二の組みの細分化された組みを選択するステップ
    と、前記画像切り出しを行なうために、前記矩形を前記
    細分化された組みに組み合わせるステップと、を有する
    ことを特徴とする、請求項4記載の方法。
  6. 【請求項6】  前記第一の矩形が印刷文字を囲むこと
    を特徴とする、請求項5記載の方法。
  7. 【請求項7】  前記画像がマンハッタン・レイアウト
    (ManhattanLayout)の画像であり、前
    記第二の組みをアスペクト比によって整列させるステッ
    プが、前記第二の組みを高いアスペクト比を持つ矩形が
    低いアスペクト比を持つ矩形に先行するように整列させ
    ることを特徴とする、請求項6記載の方法。
  8. 【請求項8】  前記画像の中にx座標及びy座標を指
    示し、第二の構成部分を位置決めするステップでは、前
    記第一の矩形の垂直辺の表示をこの垂直辺のx座標を増
    加する順に与える手段と、前記第二の矩形の表示の第一
    のリストと、左辺が現在のx座標より小さい第一のx座
    標を持ち、且つ前記第一の矩形の一つの矩形の右辺若し
    くは前記画像の左方の境界と境を接し、前記第一の矩形
    の何れについてもそれらの如何なる部分も含まず、右辺
    が前記第一の矩形のうち現在のx座標より小さいx座標
    を持つ矩形の左辺と境を接していない第三の矩形全体の
    表示とが使用され、第二の構成部分の位置を捜し出すス
    テップが、垂直辺の表示を与える前記手段から各垂直辺
    の表示を受け取るステップと、受け取られた垂直辺のx
    座標に現在のx座標を設定するステップと、もし前記第
    三の矩形のうち現在のx座標で第二の矩形になるものが
    有れば現在のx座標を設定する毎に第二の矩形になるそ
    れら第三の矩形を前記第三の矩形全体の表示から判定す
    るステップと、そのような第二の矩形の表示を前記第一
    リストに加えるステップと、現在のx座標の次の設定よ
    り小さい第一のx座標を持つ前記第三の矩形を表わすた
    めに前記第三の矩形全体の表示を整列し直すステップと
    を有することを特徴とする、請求項4記載の方法。
  9. 【請求項9】  垂直辺の表示を与える前記手段が前記
    第一の矩形の表示の第二リストであり、各表示が前記垂
    直辺のうちの一つの垂直辺のx座標及びy区間を有し、
    且つそれらの表示がx座標が増加する順に整列され、所
    定のx座標に対して右辺が左辺に先立って整列され、且
    つこの所定のx座標に対して右辺或いは左辺がy区間が
    増加する順に整列され、前記第三の矩形の全ての表示が
    、少なくとも一つの根ノードと一つ以上の第一ノードを
    有する木であり、これら第一ノードの各々が前記第三の
    矩形のうちの一つの矩形を表わし、更にしばしば一つ以
    上の第二ノードを有し、これら第二ノードの各々が前記
    現在のx座標より小さいx座標を持つ右辺と前記現在の
    x座標より大きいx座標を有する第一の矩形とを表わし
    、更に一つ以上の第三ノードを有し、これら第三ノード
    の各々が前記現在のx座標より小さいx座標を持つ右辺
    を有するが従前通り前記第三の矩形に影響を及ぼす第一
    の矩形を表わし、各第一ノードが前記第三の矩形の左辺
    のx座標及びこの左辺のy区間を有し、各第二ノードが
    前記第一の矩形の左辺のy区間を有し、各第三ノードが
    前記第一の矩形の左辺のy区間及び前記右辺のx座標を
    有し、前記第二ノード及び第三ノードが子ノードを持た
    ず、前記木は、親ノードである第一ノードの子ノードが
    、前記親ノードのx座標より小さいx座標にある左辺と
    前記親ノードのy区間とに重なり合ったり或いはこのy
    区間に含まれたりしていないy区間を有する第一及び第
    三の矩形を表わし、且つこれらの子ノードが左から右へ
    y区間が増加する順に整列されるように、整列され、前
    記第三の矩形のうちで第二の矩形に成るものを判定する
    ステップと、前記第二の矩形の表示を前記第一のリスト
    に加えるステップと、前記第三の矩形の全ての表示を整
    列し直すステップとが、垂直辺の各仕様に対して、もし
    これら各仕様が左辺に対するものであれば、先ず縦方向
    に木の根ノードから葉ノードへ走査して前記左辺のy区
    間と重なり合うy区間を有する第一ノードを捜し出し、
    第二の矩形をそのような第一ノードに対してそのリスト
    に加え、末端左側から開始して前記木の各枝をこの枝の
    前記末端左側の葉ノードから根ノードへ上昇し、各枝に
    おいて前記左辺のy区間と重なるy区間を有する前記第
    一ノードの親ノードへ上昇し、前記枝を上昇する途中で
    、前記左辺のy区間と重なるy区間を有する全ての兄弟
    ノードを取り除き、前記親ノード以下の前記枝に残って
    いるノードから成る部分木を複製し、この部分木が複製
    されるときに前記左辺のy区間によって要求されるよう
    な前記複製された部分木の前記ノードに前記y区間を設
    定し、もし前記根ノードでなければ、前記複製された部
    分木を前記根ノードの子ノードになし、その新しい左辺
    に対して新しい第二ノードを作成してこの新しい第二ノ
    ードを前記複製された部分木の間に挿入し、もし前記仕
    様が右辺に対するものであれば、この右辺が属する前記
    第一の矩形を表わす第二ノードが捜し出されるまで、前
    記木を上端から末端へ走査し、前記第二ノードを前記第
    一の矩形を表わしている第三の矩形と置換し、前記右辺
    のx座標で開始している前記第三の矩形と同一な第三の
    矩形を表わしている前記木に既に第一ノードが存在して
    いるか否かを判定し、もし存在していれば前記第三ノー
    ド及びその兄弟ノードをその第一ノードの子ノードにな
    し、もし存在していなければ前記第一ノードを作成して
    前記第一ノードを前記根ノードに結合し、且つ前記第三
    ノード及びその兄弟ノードを前記新しい第一ノードの子
    ノードにすることを特徴とする、請求項8記載の方法。
  10. 【請求項10】  前記第三の矩形の全ての表示が、少
    なくとも一つの根ノードと前記第三の矩形を表わす一つ
    以上の第一ノードを有し、更にしばしば前記第三の矩形
    の生成に従前通り影響を及ぼすy区間を有する木であり
    、もし前記第三の矩形のうちで現在のx座標で第二の矩
    形になるものが有れば現在のx座標を設定する毎に第二
    の矩形になるそれら第三の矩形を前記第三の矩形の全て
    の表示から判定する前記ステップには、左辺を特定する
    垂直辺の各表示に対して、前記特定された左辺との回合
    の結果前記第三の矩形のうちどれらが第二の矩形になっ
    たかを判定するために、前記木を根ノードから葉ノード
    へ走査するステップを有し、前記第三の矩形全体の表示
    を整列し直す前記ステップが、前記回合の結果、前記第
    二の矩形になった前記第三の矩形を表わしている前記第
    一ノードと前記回合の結果第三の矩形が生成されること
    には最早影響を及ぼすことがないy区間を有する前記第
    二の矩形とを除去し、且つ前記回合の結果生じた新しい
    活性な矩形を表わす第一ノードを前記特定された左辺に
    加えるために、前記木を根ノードから葉ノードへ走査す
    るステップを有し、右辺を特定する垂直辺の各表示に対
    して、第一ノードを、前記右辺との回合の結果生じた新
    しい第三の矩形を表わす前記木に加えるステップを有す
    ることを特徴とする、請求項8記載の方法。
JP3165286A 1990-06-15 1991-06-11 画像切り出し装置及びその方法 Expired - Fee Related JP2588491B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US53896290A 1990-06-15 1990-06-15
US538962 1990-06-15

Publications (2)

Publication Number Publication Date
JPH04233093A true JPH04233093A (ja) 1992-08-21
JP2588491B2 JP2588491B2 (ja) 1997-03-05

Family

ID=24149172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3165286A Expired - Fee Related JP2588491B2 (ja) 1990-06-15 1991-06-11 画像切り出し装置及びその方法

Country Status (4)

Country Link
US (2) US5430808A (ja)
EP (1) EP0461817A3 (ja)
JP (1) JP2588491B2 (ja)
CA (1) CA2044513A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530789A (ja) * 2006-03-23 2009-08-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 発光素子

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3373008B2 (ja) * 1993-10-20 2003-02-04 オリンパス光学工業株式会社 画像像域分離装置
US5548664A (en) * 1994-06-29 1996-08-20 Wang Laboratories, Inc. Automatic determination of blank pages and binary images' bounding boxes
US5555556A (en) * 1994-09-30 1996-09-10 Xerox Corporation Method and apparatus for document segmentation by background analysis
US5574802A (en) * 1994-09-30 1996-11-12 Xerox Corporation Method and apparatus for document element classification by analysis of major white region geometry
US5987171A (en) * 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
JPH0965119A (ja) * 1995-06-14 1997-03-07 Minolta Co Ltd 画像処理装置
US5781655A (en) * 1995-12-15 1998-07-14 Macmillan Bloedel Limited Strand dimension sensing
US5815595A (en) * 1995-12-29 1998-09-29 Seiko Epson Corporation Method and apparatus for identifying text fields and checkboxes in digitized images
US6201894B1 (en) * 1996-01-23 2001-03-13 Canon Kabushiki Kaisha Method and apparatus for extracting ruled lines or region surrounding ruled lines
US5893127A (en) * 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US5974199A (en) * 1997-03-31 1999-10-26 Eastman Kodak Company Method for scanning and detecting multiple photographs and removing edge artifacts
US6023534A (en) * 1997-08-04 2000-02-08 Xerox Corporation Method of extracting image data from an area generated with a halftone pattern
US6035072A (en) * 1997-12-08 2000-03-07 Read; Robert Lee Mapping defects or dirt dynamically affecting an image acquisition device
JP3748164B2 (ja) * 1998-02-06 2006-02-22 富士通株式会社 パターン抽出装置
US6741737B1 (en) 1999-03-18 2004-05-25 Choicepoint Asset Company System and method for the secure data entry from document images
US6400845B1 (en) 1999-04-23 2002-06-04 Computer Services, Inc. System and method for data extraction from digital images
EP1089163B1 (en) * 1999-09-30 2003-04-23 Brother Kogyo Kabushiki Kaisha Data processing for arranging text and image data on a substrate
JP3476185B2 (ja) * 1999-12-27 2003-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体
US20020116420A1 (en) * 2000-09-28 2002-08-22 Allam Scott Gerald Method and apparatus for displaying and viewing electronic information
JP4505701B2 (ja) * 2000-10-31 2010-07-21 ソニー株式会社 情報処理装置および情報処理方法、プログラム記録媒体
US20020101614A1 (en) * 2001-01-29 2002-08-01 Imes Edward Peter Text only feature for a digital copier
US20040008223A1 (en) * 2002-03-16 2004-01-15 Catherine Britton Electronic healthcare management form navigation
US7590932B2 (en) * 2002-03-16 2009-09-15 Siemens Medical Solutions Usa, Inc. Electronic healthcare management form creation
US20040139400A1 (en) * 2002-10-23 2004-07-15 Allam Scott Gerald Method and apparatus for displaying and viewing information
JP4538214B2 (ja) * 2002-11-22 2010-09-08 オセ−テクノロジーズ・ベー・ヴエー グラフによる画像分割
US7668404B2 (en) * 2004-06-30 2010-02-23 Lexmark International, Inc. Method and system of deskewing an image using monochrome conversion to separate foreground from background
JP2006085665A (ja) * 2004-08-18 2006-03-30 Ricoh Co Ltd 画像処理装置、画像処理プログラム、記憶媒体、画像処理方法および画像形成装置
JP2006253842A (ja) * 2005-03-08 2006-09-21 Ricoh Co Ltd 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法
US20060241977A1 (en) * 2005-04-22 2006-10-26 Fitzgerald Loretta A Patient medical data graphical presentation system
US7596270B2 (en) * 2005-09-23 2009-09-29 Dynacomware Taiwan Inc. Method of shuffling text in an Asian document image
JP4768451B2 (ja) * 2006-01-18 2011-09-07 株式会社リコー 画像処理装置、画像形成装置、プログラムおよび画像処理方法
US8254669B2 (en) * 2007-09-19 2012-08-28 Ricoh Company, Ltd. Data processing apparatus, computer program product, and data processing method for predicting an optimum function based on a case database and image feature values calculated by a feature-value calculating unit
CN101576932B (zh) 2009-06-16 2012-07-04 阿里巴巴集团控股有限公司 近重复图片的计算机查找方法和装置
JP5276541B2 (ja) * 2009-07-27 2013-08-28 キヤノン株式会社 画像処理方法及び画像処理装置及びプログラム
US9058352B2 (en) 2011-09-22 2015-06-16 Cerner Innovation, Inc. System for dynamically and quickly generating a report and request for quotation
EP3433816A1 (en) * 2016-03-22 2019-01-30 URU, Inc. Apparatus, systems, and methods for integrating digital media content into other digital media content

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57176482A (en) * 1981-04-03 1982-10-29 Siemens Ag Method and device for automatically recognizing form
JPS6310282A (ja) * 1986-07-02 1988-01-16 Ricoh Co Ltd 文書画像の構造抽出方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2089165B (en) * 1980-10-30 1985-10-09 Canon Kk Character and image processing
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
JPH0785254B2 (ja) * 1985-09-27 1995-09-13 株式会社東芝 文字画像読取装置
US4899394A (en) * 1986-05-09 1990-02-06 Prodigy Systems Corporation Apparatus and method for image compression
DE3620381A1 (de) * 1986-06-18 1988-01-14 Schultz Wolfgang Druckaufschlussapparatur fuer die analytische chemie
US4903313A (en) * 1986-07-03 1990-02-20 Ricoh Company, Ltd. Character recognition method
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JPH01183784A (ja) * 1988-01-19 1989-07-21 Toshiba Corp 文書画像処理装置
JP2597006B2 (ja) * 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5119433A (en) * 1990-03-12 1992-06-02 International Business Machines Corporation Method and system for locating the amount field on a document
US5050222A (en) * 1990-05-21 1991-09-17 Eastman Kodak Company Polygon-based technique for the automatic classification of text and graphics components from digitized paper-based forms
US5285504A (en) * 1991-09-27 1994-02-08 Research Foundation Of The State University Of New York Page segmentation with tilt compensation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57176482A (en) * 1981-04-03 1982-10-29 Siemens Ag Method and device for automatically recognizing form
JPS6310282A (ja) * 1986-07-02 1988-01-16 Ricoh Co Ltd 文書画像の構造抽出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530789A (ja) * 2006-03-23 2009-08-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 発光素子

Also Published As

Publication number Publication date
EP0461817A3 (en) 1993-11-18
EP0461817A2 (en) 1991-12-18
JP2588491B2 (ja) 1997-03-05
US5647021A (en) 1997-07-08
US5430808A (en) 1995-07-04
CA2044513A1 (en) 1991-12-16

Similar Documents

Publication Publication Date Title
JPH04233093A (ja) 画像切り出し装置及びその方法
EP0434930B1 (en) Editing text in an image
US6081620A (en) System and method for pattern recognition
US6466694B2 (en) Document image processing device and method thereof
JP2726568B2 (ja) 文字認識方法及び装置
EP0439951B1 (en) Data processing
JP2973944B2 (ja) 文書処理装置および文書処理方法
US5907631A (en) Document image processing method and system having function of determining body text region reading order
JP3425408B2 (ja) 文書読取装置
EP1457917B1 (en) Apparatus and methods for converting network drawings from raster format to vector format
EP0654751B1 (en) Method of analyzing data defining an image
RU2643465C2 (ru) Устройства и способы, которые используют иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы
JP3452774B2 (ja) 文字認識方法
JP2002279433A (ja) 映像中の文字検索方法及び装置
US5394484A (en) Image recognition apparatus
JP2006244309A (ja) 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法
RU2640322C2 (ru) Способы и системы эффективного автоматического распознавания символов
US5265171A (en) Optical character reading apparatus for performing spelling check
JPH06176188A (ja) 認識文字の情報作成方法及び装置
JPH0256708B2 (ja)
RU2625533C1 (ru) Устройства и способы, которые строят иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы
Saitoh et al. Document image segmentation and text area ordering
JP2008108114A (ja) 文書処理装置および文書処理方法
Saitoh et al. Document image segmentation and layout analysis
RU2625020C1 (ru) Устройства и способы, которые порождают параметризованные символы для преобразования изображений документов в электронные документы

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees