JPH07200837A - 画像データ解析方法 - Google Patents

画像データ解析方法

Info

Publication number
JPH07200837A
JPH07200837A JP6281647A JP28164794A JPH07200837A JP H07200837 A JPH07200837 A JP H07200837A JP 6281647 A JP6281647 A JP 6281647A JP 28164794 A JP28164794 A JP 28164794A JP H07200837 A JPH07200837 A JP H07200837A
Authority
JP
Japan
Prior art keywords
data
image
graphical representation
category
box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6281647A
Other languages
English (en)
Inventor
James V Mahoney
ヴィー.マホニー ジェームズ
Satyajit Rao
ラオ サティヤジット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH07200837A publication Critical patent/JPH07200837A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 画像を定義するデータを解析するための方法
を提供すること。 【構成】 グラフィカル表現12を示す入力画像10は
人間が生成した画像であってもよく、且つ該グラフィカ
ル表現12はスケッチを得るために用紙や他の媒体など
をマーキングすることによって作成されてもよい。入力
画像10を定義するデータを受け取るマシンは入力画像
10がカテゴリXにおいてグラフィカル表現を表すこと
を示すカテゴリデータ20を自動的に得ることによって
応答することができ、且つ該マシンはグラフィカル表現
12が値Yを表現する構成を有することを示す内容デー
タ30を得るためにカテゴリデータ20を自動的に使用
することができる。次いで、該マシンはカテゴリX内に
あり且つ値Yを表現するグラフィカル表現42を示す出
力画像40を定義するデータを得るために内容データ3
0を使用することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像を定義するデータを
解析するための技術に関する。
【0002】
【従来の技術】米国特許第 5,228,100号において、タケ
ダその他は、ブランクフィールドを有するフォームディ
スプレイとプログラムを文書画像から生成して、データ
をブランクフィールドへ入力するための技術を開示して
いる。その特許では、図2に関して図示して且つ説明し
たように、文書フォーマット認識ステップは、フォーマ
ット情報項目を決定するために文書フォーマットの画像
を認識し、文書構築ステップは文書フォーマットに対応
する文書内容データを発生し、システムは得られたフォ
ーマットと内容データに基づいて文書データに対する出
力データを生成し、且つ文書出力ステップはプリントフ
ォーム上に出力文書データを印刷するか又はそれをデー
タファイル内に記憶する。
【0003】
【発明が解決しようとする課題】本発明は、グラフィカ
ル(図形)表現が二つのタイプの情報を含んでいるよう
にビューされる(見える)という観測に基づいている。
本明細書中で「カテゴリ」と呼ばれる一つのタイプの情
報は、有向グラフ、棒グラフ、パイ図表、その他のよう
なグラフィカル表現の多数の容認されたカテゴリの内の
一つを示す。本明細書中で「内容」と呼ばれる他のタイ
プの情報は、容認されたカテゴリの内の一つの特定の用
例によって表現される情報を示す。
【0004】この点において、グラフィカル表現は、線
やカーブなどの単純なグラフィカルエレメント(要素)
とは異なっている。即ち、これらの要素のグラフィカル
な形状は、長さ、厚み(太さ)、曲率、その他のような
それら自体に関する内因性の情報を含んでいるが、(こ
れらの要素のグラフィカルな形状は)それらが組み合わ
されなければ、通常は、容認されたカテゴリの内の一つ
においてグラフィカル表現を形成するためにそれら自体
に関する外因性の情報を表現する為に使用されない。グ
ラフィカル表現はまた、文字及び数字のようなシンボル
(記号)とも異なっている。即ち、これらのシンボルの
グラフィカルな形状は、一般に、一つのカテゴリのみを
伝達するために使用される。要するに、本明細書中にお
いては、「構成(コンフィギュレーション)」と呼ばれ
るグラフィカル表現における要素同士の間の空間的関係
が、カテゴリ以外の情報を伝達することの容認された方
法を提供する。
【0005】グラフィカル表現が解釈される方法は、そ
のカテゴリに依存する。従って、グラフィカル表現のカ
テゴリは、その内容を抽出する方法に関する情報を得る
ために使用され得る。各カテゴリを識別するために使用
される基準は、本明細書中では、集合的に、カテゴリの
「モデル」と呼ばれる。一組のグラフィカル表現のカテ
ゴリのモデルは、これらのカテゴリが確実に識別され且
つ効率的に抽出され得るように選択され得る。
【0006】
【課題を解決するための手段】本発明はこの観測を利用
する技術の開示にさらに基づいている。この技術は出力
グラフィカル表現を示す入力画像に応答する。この技術
はグラフィカル表現のカテゴリを得るためにこの画像を
使用し、且つ入力グラフィカル表現の構成によって表現
される情報を得るためにこのカテゴリを使用する。次い
で、この技術はカテゴリ内にあり且つ情報を表現する構
成を有する出力グラフィカル表現を示す出力画像を得
る。
【0007】上記の技術は、それがグラフィカル表現の
モデルベースの解析を提供する点で有利である。結果的
に、グラフィカル表現のカテゴリがその全体的なグラフ
ィカル構成から認識され得る場合、その内容を抽出する
方法に関する多くの情報が判明するのである。これによ
って、グラフィカル表現のスケッチのより正確に形成さ
れたバージョンが生成され、グラフィカル表現中の異な
るカテゴリ内のグラフィカル表現の内容を示す出力画像
が生成され、又はグラフィカル表現に基づくシステムへ
制御信号が提供されるのが可能となる。従って、単純な
スケッチから複雑な表現が得られる。さらに、この技術
はグラフィカル表現内の追加のカテゴリへ簡単にエクス
テンド(拡張)され得る。
【0008】本発明は、構成が情報を表現する入力グラ
フィカル表現を示す入力画像を定義する入力画像データ
を得るステップを有し、グラフィカル表現のカテゴリを
示すカテゴリデータを得るために前記入力画像データを
使用するステップを有し、前記入力グラフィカル表現の
前記構成によって表現された情報を示す内容データを得
るために前記カテゴリデータを使用するステップを有
し、出力グラフィカル表現を含む出力画像を定義する出
力画像データを得るために前記内容データを使用するス
テップを有し、前記出力グラフィカル表現が前記内容デ
ータによって示された前記情報を表現する構成を有して
いる、画像データ解析方法である。
【0009】
【実施例】「グラフィカル表現のカテゴリ」は、例え
ば、有向グラフ、無向グラフ、ツリー、フローチャー
ト、回線図、又は状態遷移図のようなノード−リンク構
造や、例えば、棒グラフ、ヒストグラム、ガント・チャ
ート、タイミング・チャート、又はタイムラインのよう
な平行長グラフや、例えば、パイ図表又は全棒グラフの
ような比例部分グラフや、例えば、表、マトリックス、
アレイ、カレンダー、2次元連結図、パズル、又はゲー
ム図のような行/列表現や、例えば、ベン図若しくはセ
ット・メンバシップ図又は等高地図のような周辺関係表
現や、例えば、線グラフ又は散布図のような2次元グラ
フなどのグラフィカル表現の容認されるカテゴリであ
る。一般に、各カテゴリ内のグラフィカル表現は、グラ
フィカル表現内の要素間の一組の構成又は空間関係のう
ちの一つを有し得る。従って、グラフィカル表現のカテ
ゴリ内の各グラフィカル表現は、このカテゴリの特徴で
ある方法において情報を表現する構成を有している。
【0010】用語「内容」はグラフィカル表現の構成
(コンフィギュレーション)によって表現される情報を
指す。そのグラフィカル表現がグラフィカル表現の容認
されたカテゴリの内の一つのインスタンスである場合、
その構成はカテゴリの特徴的な方法においてその情報を
表現する。
【0011】図1は、グラフィカル表現の画像が、カテ
ゴリデータ、内容データ、及び内容を表現する構成を有
する他のグラフィカル表現の画像を定義するデータを得
るためにいかにして使用され得るかを概略的に示してい
る。図2は、カテゴリデータ、内容データ、及び内容を
表現する構成を有する他のグラフィカル表現の画像を定
義するデータを得るためにグラフィカル表現を示す画像
を定義するデータを使用する時の一般的な動作を示して
いる。図3は、ソフトウェア製品と、ソフトウェア製品
が使用され得るマシンの一般的な構成要素を示してい
る。
【0012】図1において、入力画像10はグラフィカ
ル表現12を示す。入力画像10は人間が生成した画像
であってもよいし、且つグラフィカル表現12は、スケ
ッチを得るため、例えば、用紙や他のマーキング媒体を
マーキングすることによって作成されてもよい。入力画
像10を定義するデータを受け取るマシンは、入力画像
10がカテゴリXにおいてグラフィカル表現を表すこと
を示すカテゴリデータ20を自動的に得ることによって
応答することができる。次いで、このマシンは、グラフ
ィカル表現12が値Yを表現する構成を有することを示
す内容データ30を得るためにカテゴリデータ20を自
動的に使用することができる。次いで、このマシンは、
カテゴリX内にあり且つ値Yを表現するグラフィカル表
現42を示す出力画像40を定義するデータを得るため
に内容データ30を使用することができる。
【0013】図2における一般的な動作は、ボックス5
0において、入力グラフィカル表現を示す入力画像を定
義する入力画像データを得ることによって開始される。
これに応答して、ボックス52における動作は、グラフ
ィカル表現のカテゴリを表すカテゴリデータを得るため
に入力画像データを使用する。次いで、ボックス54に
おける動作は、入力グラフィカル表現の構成によって表
現される情報を示す内容データを得るためにこのカテゴ
リデータを使用する。ボックス56における動作は、示
されたカテゴリ又は他のカテゴリ内にあり、且つ示され
た情報を表現する構成を有する、出力グラフィカル表現
を含む出力画像を定義する出力画像データを得るために
内容データを使用する。
【0014】図3は、ソフトウェア製品60、即ち図3
に示した構成要素のような構成要素を含むシステムにお
いて使用され得る製造の品目を示す。ソフトウェア製品
60は、記憶媒体アクセスデバイス64によってアクセ
スされ得るデータ記憶媒体62を含む。例えば、データ
記憶媒体62は、一つ又はそれより多くのテープ、ディ
スケット、若しくはフロッピディスクのセットのような
磁気媒体か、一つ又はそれより多くのCD−ROMのセ
ットのような光学的媒体か、又はデータを記憶するため
のあらゆる他の適切な媒体であってもよい。
【0015】データ記憶媒体62は、記憶媒体アクセス
デバイス64がプロセッサ66へ提供することができる
データを記憶する。プロセッサ66は、プロセッサ66
が実行できる命令を示すデータを記憶するプログラムメ
モリと共に、これらの命令を実行するときにプロセッサ
66がアクセスできるデータを記憶するデータメモリ
も、有し得るメモリ68へアクセスするために接続され
ている。
【0016】プロセッサ66はまた画像入力サーキット
リ70からの画像を定義するデータを受け取るために接
続されている。データは、ファクシミリ(ファクス)マ
シン72、スキャナー74、キーボード及びマウス又は
ペン型若しくはスタイラスベースの入力デバイスによっ
て制御されるフォルムズ(書式)エディタ又は他のイン
タラクティブ画像エディタであってもよいエディタ7
6、又は画像を定義するデータを転送することが可能な
ローカルエリアネットワーク又は他のネットワークであ
ってもよいネットワーク78から得ることができる。
【0017】ディスプレイ記憶媒体62に加えて、ソフ
トウェア製品60は記憶媒体62によって記憶されるデ
ータを含む。記憶されたデータは、図2における動作の
ような動作を実行するため、プロセッサ66が実行する
ことができる画像処理命令80を示すデータを含む。命
令80を実行するにあたって、プロセッサ66は画像入
力回路70からの入力画像セットを定義する入力画像デ
ータを受け取る。入力画像セットは入力グラフィカル表
現を示す。プロセッサ66は、グラフィカル表現のカテ
ゴリをカテゴリデータを得るために入力画像データを使
用する。次いで、プロセッサ66は、このカテゴリデー
タを使用して、入力グラフィカル表現の構成によって表
現された情報を示す内容データを得る。プロセッサ66
は、この内容データを使用して、示された情報を表現す
る構成を有する示されたカテゴリ内に出力グラフィカル
表現を有する出力画像を定義する出力画像データを得
る。
【0018】プロセッサ66はまた、出力画像データを
画像出力サーキットリ90へ提供するために接続され得
る。この出力画像は、入力スケッチのより正確に形成さ
れたバージョンを示すことができるか、又は、異なる特
定カテゴリ内、例えば、異なる総称カテゴリ内ではない
同じ総称カテゴリ内に表現を示すことができる。この出
力画像データは、画像出力サーキットリ90へ提供され
得て、且つファックスマシン92、プリンタ94、ディ
スプレイ96、又はネットワーク98へ提供され得る。
【0019】内容データは、制御信号を提供するために
も使用され得る。例えば、メモリ68は、プロセッサ6
6が実行可能な制御命令を記憶することができて、制御
信号を定義する制御データを得るためにこの内容データ
を使用する。この制御データは、制御信号をシステム1
02へ提供することによって応答し得る制御出力サーキ
ットリ100へ提供され得る。
【0020】内容データは、直接使用されるのではな
く、起こり得る今後の使用の為にメモリ68に記憶され
てもよい。これは、例えば、入力画像がセット中の一つ
であり、且つその画像のセット上で実行されるべき動作
を示す情報が、入力画像を定義するデータが受け取られ
ている時に得られなかった場合に有用である。
【0021】図4は、ユーザがグラフィカル表現の手描
きスケッチを示す画像を提供し得る方法を示す。図5
は、ユーザがマシンと対話することによってグラフィカ
ル表現を示す画像を提供し得る方法を示す。
【0022】図4は、グラフィカル表現を示す画像のい
くつかの例を左側に示している。画像100は垂直棒図
表を示し、画像102は水平棒図表を示し、画像104
は線グラフを示し、画像106は散布図を示し、画像1
08は表を示し、画像110はアレイ(配列)を示し、
画像112は状態遷移図のような有向グラフを示し、画
像114はフローチャートを示し、画像116はツリー
を示し、画像118は、中心成分と、境界や中心成分と
連結していないスポークと、を有するパイ図表を示し、
画像120は境界と連結し且つ中心で相互連結している
スポークを有するパイ図表を示し、且つ画像122はベ
ン(Venn)図表を示す。図4におけるあらゆる画像は、
手によってマーキング媒体上で実行されるマーキング動
作により作成されるスケッチを示す人間が生成した画像
であってもよい。さもなければ、画像はあらゆる他の適
切な方法で得られてもよい。
【0023】マーキング媒体がシートである場合、スキ
ャナー130はシートを受け取ることができる。スキャ
ナー130はグラフィカル表現を示す画像を定義するデ
ータを提供するためにシート上で動作する。
【0024】マーキング媒体がマークを感知できる電子
的デバイスのマーキング面である場合、エンコーダ13
2は、この電子的デバイスから信号を受け取り、且つこ
の信号をグラフィカル表現を示す画像を定義するデータ
を得るために使用することができる。次いで、このデー
タは、マークがプリントされるシートを得るためにプリ
ンタ134へ提供され得て、且つこのシートはスキャナ
ー130へ提供され得る。スキャナー130はグラフィ
カル表現を示す画像を定義するデータを提供する。
【0025】図4はまた、エンコーダ132からのデー
タがグラフィカル表現を示す画像を定義するデータとし
て直接使用され得ることを示す。これは、エンコーダ1
32がマーキング動作に応答して画像を定義するデータ
を提供し得る場合に適切である。
【0026】図5はパーソナルコンピュータ、ワークス
テーション、又は他のデータ処理システムであってもよ
いマシン150を示す。マシン150は、プロセッサ1
52、ディスプレイ154、キーボード156、マウス
で示されているポインティングデバイス158、及びス
タイラスで示されているスクリーン位置指示デバイス1
60を含む。ユーザは信号をプロセッサ152へ送るた
めにキーボード156及びポインティングデバイス15
8を操作することができる。そうでなければ、ユーザ
は、信号をプロセッサ152へ送るためにディスプレイ
154の表面上にスクリーン位置表示デバイス160に
よってマーキング動作を実行することができる。これに
応答して、プロセッサ152はディスプレイ154上に
画像162を提供し且つ変更し、これによってユーザ
は、画像162が所望されるグラフィカル表現を示すま
で信号を送り続けることができる。次いで、ユーザは、
プロセッサ152が画像162を定義するデータを提供
することを要求する信号を提供し得る。
【0027】プロセッサ152はユーザが上記の方法で
画像を生成するのを可能とするために多数のタイプのソ
フトウェアを実行することができる。プロセッサ152
は例えば文書編集ソフトウェア又は画像編集ソフトウェ
アを実行することができる。
【0028】上記の一般的な機能を実行するにあたっ
て、グラフィカル表現を示す画像は図4及び図5に示し
たあらゆる方法又は他のあらゆる適切な方法で生成され
得る。グラフィカル表現の画像を生成するにあたって、
ユーザは表現がカテゴリ制約条件及び内容制約条件を満
たすことを確実し得る。次いで、画像を定義するデータ
を受け取るマシンは、これらの制約条件に適している基
準を適用したり又は計測を行うことにより、カテゴリデ
ータ及び内容データを自動的に得ることができる。
【0029】図6は上記の一般的な機能が実行されてい
るシステムを示す。図7は、第1の実行において図6に
おける分類/レンダリング命令を実行するときに行われ
る動作を示す。図8は第2の実行において図6の分類/
レンダリング命令を実行するときに行われる動作を示
す。
【0030】図6におけるシステム180はワークステ
ーション182、サンスパークステーション10のワー
クステーション(Sun SPARKCStation 10 workstatio
n)を含む。スキャナ184はゼロックスデータコピー
GSプラススキャナ(Xerox Datacopy GS Plus scanne
r)のような従来のスキャナーでもよい。プリンタ18
6はXerox Laser Printer のような従来のプリンタであ
ってもよい。ネットワーク188は、エサーネット(Et
hernet)プロトコルのようなスタンダードプロトコルに
よって動作する従来のネットワークでもよい。
【0031】ワークステーションCPU190は、スキ
ャナー184及びネットワーク188からデータを受け
取るために接続されており且つプリンタ186及びネッ
トワーク188へデータを提供するために接続されてい
る。例えば、CPU190は図4に関して上記に説明さ
れているようにスキャナー184から手描きスケッチを
示す人間が生成した画像を定義するデータを受け取るこ
とができる。同様に、CPU190は図5に関して上記
に説明されているようにして得られた人間が生成した画
像を定義するデータをネットワーク188から受け取る
ことができる。さらに、ワークステーションCPU19
0はプログラムメモリ192及びデータメモリ194並
びにその他の従来のワークステーション周辺機器(図示
しない)へアクセスするために接続されている。データ
メモリ194は図のようにグラフィカル表現を示す画像
を定義する入力画像データ196を記憶している。
【0032】プログラムメモリ192は、図2における
一般的な動作を実行する演算を実行するためにCPU1
90が実行可能な命令を記憶する。CPU190はユニ
ックス(Unix)オペレーティングシステム又は他の適切
なオペレーティングシステムを提供するオペレーティン
グシステム命令200を実行する。プログラムメモリ1
92によって記憶された他のセットの命令の各々は、従
来のコンパイラ又はインタープリタ技術を有するLisp、
C 、その他のような従来のプログラミング言語における
ソースコードから得ることができる。実行されると、こ
れらの他の命令は、従来の方法でオペレーティングシス
テム命令200を呼び出す。概して、命令はオブジェク
トコードを生成する従来のコンパイラ又はインタープリ
タ技術を有するLisp、C 、その他のような従来のプログ
ラミング言語におけるソースコードから得ることができ
る。マシンは、図3に関して上記に説明されているよう
に、ソフトウェア製品を製造する時にデータ記憶媒体上
でソースコード又は得られたオブジェクトコードを示す
データを記憶することができ、且つソースコード又は得
られたオブジェクトコードはソフトウェア製品がシステ
ム180のようなマシンにおいて使用される時に記憶媒
体アクセス装置によってアクセスするために記憶されて
いる。
【0033】画像受け取り命令202を実行するにあた
って、画像データ196によって図示したように、CP
U190は画像を定義するデータを受け取り且つデータ
メモリ194内にそれを記憶する。画像を定義するデー
タはスキャナー184又はネットワーク188から受け
取られてもよい。
【0034】画像処理命令204を実行するにあたっ
て、CPU190は、分類/レンダリング命令206を
呼び出すことができる。分類/レンダリング命令206
を実行するにあたって、CPU190は、入力画像デー
タ196によって定義された画像内に示されるグラフィ
カル表現の基本的な幾何学的解析を実行するために解析
命令208を呼び出し、且つグラフィカル表現のカテゴ
リを示すカテゴリデータ220、グラフィカル表現の構
成によって表現される情報を示す内容データ222、及
び示されたカテゴリ又は他のカテゴリ内のグラフィカル
表現を有し且つこの示された情報を表現する構成を有す
る出力画像を示す出力画像データ224を生成する。
【0035】概して、図7及び図8における動作は、各
々が画像を定義するデータの項目上で実行されてきた。
各項目は「データ画像」と呼ばれる。いくつかのデータ
画像は他のデータ画像を得るときに使用され得る。概し
て、データ画像の全ては、同数の画素を有する画像を定
義し、且つ各動作は同数の画素を有する画像を生成す
る。二つの画像上の動作は、一般に、各ペアごとに、生
成されている画像内の画素値を生成するためにペアの画
素の値を使用する。各ペアの内、一つの画素は各画像か
ら生成され、且つペアの二つの画素は共に、生成されて
いる画像内の画素値と同じ位置にある。
【0036】図7のボックス250における動作は、グ
ラフィカル表現がX−Yグラフ基準を満たしているか否
かを決定することによって開始される。X−Yグラフ基
準を満たしている場合、ボックス252における動作
は、グラフィカル表現が垂直棒グラフ基準を満たしてい
るか否か決定する。グラフィカル表現が両方の基準を満
たしている場合、この表現は垂直棒グラフ上の制約条件
を満たす。従って、ボックス254における動作は、棒
グラフ内の棒の高さを示す内容データを得て、次いで、
ボックス256における動作は、ボックス254からの
高さを用いて垂直棒グラフをレンダリング(描画)す
る。ボックス252における動作がグラフィカル表現が
垂直棒グラフではないことを決定する場合、ボックス2
58における動作は、この実行がX−Yグラフ基準を満
たしている他のタイプのグラフィカル表現を解析するこ
とはできないので、故障メッセージを提供する。
【0037】ボックス250における動作がX−Yグラ
フ基準を満たしていないと決定した場合、ボックス26
0における動作は、グラフィカル表現が第1のパイ図表
基準を満たしているか否かを決定する。グラフィカル表
現がこの基準を満たしている場合、その表現はパイ図表
の第1のカテゴリ上の制約条件を満たす。従って、ボッ
クス262における動作はパイ図表における方向を示す
内容データを得て、次いで、ボックス264における動
作はボックス262からの方向を用いてパイ図表をレン
ダリングする。
【0038】ボックス260における動作が、グラフィ
カル表現が第1のパイ図表基準を満たしていないことを
決定する場合、ボックス270における動作はグラフィ
カル表現が第2のパイ図表基準を満たしているか否かを
決定する。グラフィカル表現がこの基準を満たしている
場合、グラフィカル表現はパイ図表の第2のカテゴリ上
の制約条件を満たす。従って、ボックス272における
動作は、パイ図表における角度サイド方向を示す内容デ
ータを得て、次いで、ボックス274における動作は、
ボックス272からの角度サイド方向を用いてパイ図表
をレンダリングする。
【0039】ボックス270における動作がグラフィカ
ル表現が第2のパイ図表基準を満たしていないことを決
定する場合、ボックス280における動作は、グラフィ
カル表現が有向グラフ基準を満たしているか否かを決定
する。グラフィカル表現がこの基準を満たしている場
合、それは有向グラフ上の制約条件を満たす。従って、
ボックス282における動作は、どの連結成分が有向グ
ラフ内の頂点及びエッジであるかを示す内容データを得
て、且つその内容データを用いて有向グラフをレンダリ
ングする。
【0040】ボックス280における動作は、グラフィ
カル表現がノード及びリンクに対する基準を満たしてい
るか否かを決定することによって、このグラフィカル表
現が有向グラフであるか否かを示すカテゴリデータを得
ることができる。ボックス280における動作は、類似
ノードデータ画像と類似リンクデータ画像を得ることに
よって、次いで、ノード−リンク構造上の制約条件を満
たす類似ノード及び類似リンクデータ画像において示さ
れた部分のサブセットを繰り返して得ることによって、
実行されることができる。次いで、ノード及びリンクに
対する基準が適用され得る。
【0041】ボックス282における動作は、ボックス
280における動作によって得られたノード及びリンク
を用いて実行され得る。
【0042】ボックス280における動作がグラフィカ
ル表現が有向グラフ基準を満たしていないと決定した場
合、ボックス284における動作は、図7に示した実行
が他のカテゴリ内のグラフィカル表現を解析できないの
で、故障メッセージを提供する。
【0043】図8に示した実行は、比例部分グラフ及び
平行長グラフの多数のカテゴリの内の一つを示すカテゴ
リ・データを得る。この実行は、最初に、カテゴリごと
に、一つ又はそれより多くの特徴候補データ画像を得
て、次いで、この特徴候補データ画像がそのカテゴリに
対する基準を満たしているか否かをテストする。この特
徴候補データ画像がそのカテゴリに対する基準を満たし
ている場合、グラフィカル表現はカテゴリに対する制約
条件を満たし、これによって、この実行は、内容データ
を得て、且つこの内容データにおける情報の正確に形成
されたグラフィカル表現をレンダリングする。
【0044】ボックス300における動作は、第1の平
行長グラフ(PLG)カテゴリに対する特徴候補データ
画像を得ることによって開始される。
【0045】ボックス302における動作は、平行長グ
ラフ(PLG)基準を特徴候補データ画像に適用する。
ボックス302における動作は、伸び基準及び平行度基
準を満たす特徴候補を示す平行特徴データ画像を得るた
め、特徴候補データ画像を使用することができる。ボッ
クス302における動作は、あらゆる特徴候補が伸び基
準及び平行度基準を満たしているか否かを決定するため
に平行特徴データ画像を論理和(OR)演算することが
できる。あらゆる特徴候補がこれらの基準を満たしてい
る場合、ボックス302における動作は、ベースデータ
画像を得ることができ、ベース点の位置合わせを測定す
ることができ、且つこの位置合わせが位置合わせ基準を
満たしているか否かを決定することができる。
【0046】伸び、平行度、及び位置合わせ基準がすべ
て合った場合、グラフィカル表現がPLG基準を満た
す。従って、ボックス304における動作は、長(レン
グス)データを得ることができる。次いで、ボックス3
06における動作は、図7に関して上記に示したよう
に、正確に形成された平行長グラフを得るためにこの長
データを使用することができる。
【0047】ダッシュラインによって示したように、ボ
ックス300、302、304、及び306における動
作と類似する動作が、他のPLGカテゴリの各々に対し
ても実行され得る。
【0048】ボックス310における動作は、第1の比
例部分グラフ(PPG)カテゴリに対する特徴候補デー
タ画像を得る。
【0049】ボックス312における動作は、比例部分
グラフ(PPG)基準を特徴候補データ画像へ適用す
る。ボックス312における動作は、PPGカテゴリに
適しているように、方向ユニット基準又は角度ユニット
基準のいづれかを満たす特徴候補を示す分割された特徴
データ画像を得るために特徴候補データ画像を使用する
ことができる。ボックス312における動作は、方向ユ
ニット(単位)によって又は角度ユニットへ分割された
特徴がセグメント数の基準を満たす二つ又はそれより多
くのユニットを含むか否かをテストすることができる。
【0050】方向ユニット又は角度ユニット基準のうち
の一つが合っており、且つセグメント数の基準が合って
いる場合、グラフィカル表現はPPG基準を満たす。従
って、ボックス314における動作は、比例データを得
ることができる。次いで、ボックス316における動作
は、図7に関して上記に説明したように、正確に形成さ
れた比例部分グラフを得るために比例データを使用する
ことができる。
【0051】ダッシュラインによって示したように、ボ
ックス310、312、314、及び316における動
作と類似する動作は、他のPLGカテゴリの各々に対し
て実行され得る。
【0052】グラフィカル表現がPLG基準又はPPG
基準のいづれも満たしていない場合、ボックス320に
おける動作は、図7のボックス284におけるように、
故障メッセージをリターンする。
【0053】図8の方式が棒グラフのために非常に有用
であることが発見されている。グルーピング(グループ
化)技術が、距離、サイズ、伸び、その他に基づいて、
入力画像の部分を簡単にグループ化するために使用され
ることができ、これによって、ボックス300における
ように、各グルーピングが棒候補上の制約条件を満た
す。次いで、グルーピングは、ボックス302における
ように、PLG基準を用いることによってテストされ得
る。PLG基準は、棒が互いに平行でなければならない
こと及びそれらのベースが位置合わせされてなければな
らないことなどがが例としてあげられる。
【0054】この方式はまた、パイ図表のいくつかのカ
テゴリに対して有用である。パイ図表が最も大きな円形
の成分のような基準を提供する成分を含んでいる場合、
ボックス310におけるように、中心基準を満たす中心
候補及び方向候補又は角度候補がその基準成分を用いて
簡単に得られる。次いでこれらの候補は、ボックス31
2におけるように、PPG基準を用いることによってテ
ストされ得る。しかし、基準成分がない場合、中心候補
及び方向候補又は角度候補を得ることは難しいかもしれ
ない。
【0055】図9におけるシステム390は、ネットワ
ーク392、ワークステーション394、記憶装置サー
バ396、及び画像処理サーバ398を有する。ユーザ
はスキャナー又は他のソースなどからの画像を定義する
データを記憶するための要求をネットワーク392へ提
供するようにワークステーション394を動作すること
ができる。これに応答して、記憶装置サーバ396はデ
ータを記憶することができる。次いで、ユーザは上記に
説明した動作のような画像処理動作を要求するためにワ
ークステーション394を動作することができる。これ
に応答して、画像処理サーバ398は要求された動作を
実行して、且つ図6に関して上記に示したような命令を
実行することができる。
【0056】上記の実行は、表現の手描きスケッチに基
づいて、グラフィカル表現の上手にレンダリングされた
グラフィカル原稿を迅速に組み立てるためのツール(道
具)を提供する。このタイプのツールは、例えば、ポス
タのレイアウト又は書類の挿絵ページを有する会議や実
験用スライドを生成するために有用である。このツール
は手描きスケッチからスタートし、且つ、このツールは
上記の実行において文字又は数字の認識を含まないの
で、内容において質的には正確であるが量的には不正確
であるかもしれない正確に描かれた画像を生成する。こ
のようにして生成された画像を定義するデータは、ユー
ザによって引き続き編集されて、質的に正確なイラスト
を量的に正確なイラストへ変換することができる。
【0057】図10は本発明がファックスサーバとして
動作し得るパソコンにおいていかにして用いられ得るか
を示す。図11は本発明が複写機においていかにして用
いられ得るかを示す。
【0058】図10におけるシステム400はCPU4
02を含み、且つこのCPU402は、IBM(アイビ
ーエム社)のパソコン(PC)と互換可能な装置のよう
なパソコンのCPUであってもよい。CPU402は、
キーボード404及びマウス406からユーザ入力信号
を受け取るように接続されており、且つディスプレイ4
08を介してユーザへ画像を提供し得る。CPU402
は、図示するように、ディスクドライブ410、モデム
412、スキャナ414、及びプリンタ416を含む多
数の他の周辺機器装置とも接続されている。
【0059】プログラムメモリ420は、DOSのバー
ジョンであってもよいオペレーティングシステム(O
S)命令422、ユーザインターフェース命令424、
ファックスサーバ命令426、画像処理命令428、編
集命令430、及び画像処理命令432を記憶する。フ
ァックスサーバ命令426は、ゼロックスコーポレーシ
ョン(Xerox Corporation )のソフトウェア製品"Paper
Works (ペーパーワークス)(登録商標)" と同様であ
ってもよい。画像処理命令428は、図6に関して上記
に示したように、画像処理命令204、分類/レンダリ
ング命令206、及び解析命令208と同様に実行され
てもよいし、且つファックスサーバ命令426によって
呼び出されて画像解析を実行することができる。ファッ
クスサーバ命令426及び画像処理命令428は、フロ
ッピディスク、ディスケット、又はCD−ROM上に記
憶されるソフトウェア製品の形状で得られ、且つディス
クドライブ410によってプログラムメモリ420へ記
憶するためにアクセスされ得る。
【0060】データメモリ430は、図6に関して上記
に説明したように、入力画像データ432、カテゴリデ
ータ434、内容データ436、及び出力画像データ4
38を記憶する。
【0061】システム400は多くの方法でグラフィカ
ル表現を示す画像セットを定義する入力画像データ44
2を得ることができる。グラフィカル表現を示す画像を
定義するデータは、図5に関して上記に示したように、
ユーザインタフェース命令424を実行したりして対話
的に生成され得る。ペンベースの技術を含むあらゆる適
切なユーザインタフェース技術が使用され得る。グラフ
ィカル表現を示す前もって生成された画像を定義するデ
ータは、ディスクドライブ410により記憶媒体から検
索され得る。グラフィカル表現を示す画像を定義するデ
ータは、図4に関して上記に示したように、スキャナー
414から得ることができる。ユーザはあらゆる場所で
グラフィカル表現を示す画像を定義するデータを生成す
ることができ且つ例えば、モデム412へファクシミリ
送信を行うことによって、モデム412を介してこのデ
ータをシステム400へ提供し得る。
【0062】CPU402はモデム412を介してファ
クシミリ転送によって受け取られた要求に応答してファ
ックスサーバ命令426を実行することができる。この
要求は、画像処理動作を示し、さらにファックス装置又
はプリンタ416のような出力画像の宛て先を示す形態
を有し得る。この要求はさらに、グラフィカル表現を表
す画像を定義するデータを含むこともできるし、又はシ
ステム400によって前もって得られた画像を示すこと
もできる。
【0063】ファックスサーバ426は、図7又は図8
に示した動作のような動作を実行するために画像処理命
令428に対する呼び出しを含む。ファックスサーバ命
令426の実行は、図7におけるボックス256、26
4、274、及び282の内の一つにおいて又は図8に
おけるボックス306及び316の内の一つにおいて生
成されたレンダリングされた画像を定義するデータをさ
らに提供することができる。このレンダリングされた画
像を定義するデータは、ファクシミリ送信のためにモデ
ム412へ提供されるか又はプリントのためにプリンタ
416へ提供され得る。
【0064】図11において、複写機460はディジタ
ルコピア(複写機)又は他の電子写真印刷システムであ
ってもよい。走査サーキットリ462はグラフィカル表
現のスケッチ466を示す画像464を定義するデータ
を得る。ユーザインタフェースサーキットリ470は、
タッチ感知デバイス472を含む。このタッチ感知デバ
イス472は、押しボタン、熱又は圧力感知素子、容量
性感知素子、又は他の接触動作感知装置が用いられても
よい。ユーザがデバイス472にタッチすると、ユーザ
インタフェースサーキットリ470は、デバイス472
がタッチされたことを示すタッチデータを提供する。
【0065】処理サーキットリ480はタッチデータを
使用して、画像処理動作に対する要求を示す要求データ
を得る。次いで、この要求に応答して、処理サーキット
リ480は画像464を定義するデータを使用して、グ
ラフィカル表現のカテゴリを示すカテゴリデータを自動
的に得る。処理サーキットリ480は、カテゴリデータ
と画像464を定義するデータを使用して、スケッチ4
66によって示される情報を示す内容データを自動的に
得る。この内容データを使用して、処理サーキットリ4
80は、カテゴリデータによって示されるがスケッチ4
66より正確に形成されたカテゴリにおいてグラフィカ
ル表現を有するレンダリングされた画像を定義するデー
タを自動的に得る。このデータは、正確に形成されたグ
ラフィカル表現494と共に画像492を印刷するため
に印刷サーキットリ490へ提供される。
【0066】
【発明の効果】本発明は画像を定義するデータを解析す
るための方法を提供する。
【図面の簡単な説明】
【図1】グラフィカル表現を示す画像が、カテゴリデー
タ、内容データ、及び構成が同一内容を表現する他のグ
ラフィカル表現を示す出力画像を定義するデータを得る
ためにいかにして使用され得るかを概略的に示す図であ
る。
【図2】グラフィカル表現を示す画像が、カテゴリデー
タ、内容データ、及び構成が同一内容を表現する他のグ
ラフィカル表現を示す出力画像を定義するデータを得る
ためにグラフィカル表現の画像を使用するときの一般的
な動作を示すフローチャートである。
【図3】ソフトウェア製品とソフトウェア製品が図2の
一般的な動作を実行するために使用され得るマシンの一
般的な構成要素を示すブロック図である。
【図4】種々のカテゴリ内のグラフィカル表現と、手描
きにより作成したグラフィカル表現を示す画像を定義す
るデータをユーザが提供し得る方法を概略的に示すブロ
ック図である。
【図5】マシンによって対話的に生成されたグラフィカ
ル表現を示す画像を定義するデータをユーザがいかにし
て提供し得るかを概略的に示すブロック図である。
【図6】グラフィカル表現を示す画像を解析することが
できるマシンを概略的に示すブロック図である。
【図7】第1の実行において図6のマシンによって実行
され得る動作を示すフローチャートである。
【図8】第2の実行において図6のマシンによって実行
され得る動作を示すフローチャートである。
【図9】画像処理サーバによる実行を概略的に示すブロ
ック図である。
【図10】ファックス・サーバ・アプリケーションを概
略的に示すブロック図である。
【図11】複写機アプリケーションを概略的に示すブロ
ック図である。
【符号の説明】
10 入力画像 12、42 グラフィカル表現 20 カテゴリデータ 30 内容データ 40 出力画像
───────────────────────────────────────────────────── フロントページの続き (72)発明者 サティヤジット ラオ アメリカ合衆国 マサチューセッツ州 02139ケンブリッジ メモリアル ドライ ヴ 550 アパートメント 17エイ2

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 構成が情報を表現する入力グラフィカル
    表現を示す入力画像を定義する入力画像データを得るス
    テップを有し、 グラフィカル表現のカテゴリを示すカテゴリデータを得
    るために前記入力画像データを使用するステップを有
    し、 前記入力グラフィカル表現の前記構成によって表現され
    た情報を示す内容データを得るために前記カテゴリデー
    タを使用するステップを有し、 出力グラフィカル表現を含む出力画像を定義する出力画
    像データを得るための前記内容データを使用するステッ
    プを有し、前記出力グラフィカル表現が前記内容データ
    によって示された前記情報を表現する構成を有してい
    る、 画像データ解析方法。
JP6281647A 1993-11-24 1994-11-16 画像データ解析方法 Pending JPH07200837A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US158063 1993-11-24
US08/158,063 US5544267A (en) 1993-11-24 1993-11-24 Using a category to analyze an image showing a graphical representation

Publications (1)

Publication Number Publication Date
JPH07200837A true JPH07200837A (ja) 1995-08-04

Family

ID=22566547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6281647A Pending JPH07200837A (ja) 1993-11-24 1994-11-16 画像データ解析方法

Country Status (4)

Country Link
US (1) US5544267A (ja)
EP (1) EP0654750A3 (ja)
JP (1) JPH07200837A (ja)
CA (1) CA2118344C (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015162748A1 (ja) * 2014-04-24 2015-10-29 株式会社日立製作所 データ変換装置およびデータ変換方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3693691B2 (ja) * 1993-12-30 2005-09-07 株式会社リコー 画像処理装置
US5966126A (en) * 1996-12-23 1999-10-12 Szabo; Andrew J. Graphic user interface for database system
DE69924698T2 (de) * 1999-01-08 2006-03-09 Hewlett-Packard Development Co., L.P., Houston System und Verfahren zur automatischen Graphensyntaxanalyse
US6502105B1 (en) * 1999-01-15 2002-12-31 Koninklijke Philips Electronics N.V. Region-based image archiving and retrieving system
US6631211B1 (en) * 1999-07-08 2003-10-07 Perkinelmer Las, Inc. Interactive system for analyzing scatter plots
US20020052933A1 (en) * 2000-01-14 2002-05-02 Gerd Leonhard Method and apparatus for licensing media over a network
US7165973B2 (en) * 2000-09-21 2007-01-23 Cantor Michael B Method for non-verbal assessment of human competence
US7139004B2 (en) 2002-01-25 2006-11-21 Xerox Corporation Method and apparatus to convert bitmapped images for use in a structured text/graphics editor
US7136082B2 (en) 2002-01-25 2006-11-14 Xerox Corporation Method and apparatus to convert digital ink images for use in a structured text/graphics editor
US6972762B2 (en) * 2002-05-21 2005-12-06 Microsoft Corporation System and method for interactive grouping of pie chart slices
US7167587B2 (en) * 2002-08-30 2007-01-23 Lockheed Martin Corporation Sequential classifier for use in pattern recognition system
US7224847B2 (en) * 2003-02-24 2007-05-29 Microsoft Corp. System and method for real-time whiteboard streaming
US7526930B2 (en) * 2005-04-22 2009-05-05 Schlumberger Technology Corporation Method system and program storage device for synchronizing displays relative to a point in time
US7664325B2 (en) 2005-12-21 2010-02-16 Microsoft Corporation Framework for detecting a structured handwritten object
US7583841B2 (en) * 2005-12-21 2009-09-01 Microsoft Corporation Table detection in ink notes
US7913225B2 (en) * 2006-04-28 2011-03-22 Microsoft Corporation Error handling using declarative constraints in a graphical modeling tool
US20100169326A1 (en) * 2008-12-31 2010-07-01 Nokia Corporation Method, apparatus and computer program product for providing analysis and visualization of content items association
GB2469436A (en) * 2009-02-09 2010-10-20 Inzpire Ltd Method and apparatus for generating and storing graph representation data
US20100204923A1 (en) * 2009-02-10 2010-08-12 Bruce Alan White Comparing Accuracies Of Lie Detection Methods
US8249394B2 (en) * 2009-03-12 2012-08-21 Shmuel Peleg Method and system for shift-map image editing
US9633110B2 (en) * 2011-11-15 2017-04-25 Microsoft Technology Licensing, Llc Enrichment of data using a semantic auto-discovery of reference and visual data

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4110736A (en) * 1974-04-24 1978-08-29 Agency Of Industrial Science & Technology Shape recognition system
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
JP2735187B2 (ja) * 1987-03-17 1998-04-02 株式会社東芝 情報検索方法
JPH061482B2 (ja) * 1987-09-03 1994-01-05 シャープ株式会社 図形入力方式
EP0407935B1 (en) * 1989-07-10 1999-10-06 Hitachi, Ltd. Document data processing apparatus using image data
US5202933A (en) * 1989-12-08 1993-04-13 Xerox Corporation Segmentation of text and graphics
JPH0484377A (ja) * 1990-07-27 1992-03-17 Ricoh Co Ltd 画像生成装置
US5159647A (en) * 1991-03-04 1992-10-27 David Sarnoff Research Center, Inc. Fast and efficient search method for graphical data
JPH04309186A (ja) * 1991-04-08 1992-10-30 Matsushita Electric Ind Co Ltd 棒グラフ認識装置
US5263097A (en) * 1991-07-24 1993-11-16 Texas Instruments Incorporated Parameter normalized features for classification procedures, systems and methods
US5282052A (en) * 1992-03-20 1994-01-25 Xerox Corporation Techniques for automatic form creation by combining partial operations
US5392130A (en) * 1993-11-24 1995-02-21 Xerox Corporation Analyzing an image showing a row/column representation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015162748A1 (ja) * 2014-04-24 2015-10-29 株式会社日立製作所 データ変換装置およびデータ変換方法

Also Published As

Publication number Publication date
CA2118344C (en) 1999-09-07
EP0654750A2 (en) 1995-05-24
CA2118344A1 (en) 1995-05-25
EP0654750A3 (en) 1995-12-06
US5544267A (en) 1996-08-06

Similar Documents

Publication Publication Date Title
JPH07200837A (ja) 画像データ解析方法
EP0654766B1 (en) Method, system and article of manufacture for analyzing data defining an image
US5522022A (en) Analyzing an image showing a node-link structure
US5850490A (en) Analyzing an image of a document using alternative positionings of a class of segments
US5513271A (en) Analyzing an image showing a proportioned parts graph
JP4339602B2 (ja) デジタルインクイメージを構造化テキスト/図形エディタで利用すべく変換するシステム
JP4340076B2 (ja) ビットマップ化イメージを構造化テキスト/図形エディタで利用すべく変換するシステム
JP3940491B2 (ja) 文書処理装置および文書処理方法
Ablameyko et al. Machine Interpretation of Line Drawing Images: Technical Drawings, Maps and Diagrams
US6687404B1 (en) Automatic training of layout parameters in a 2D image model
EP0654754B1 (en) Method of analyzing data defining an image
KR20190095651A (ko) 문자 학습 트레이닝 데이터 생성 장치 및 그 방법
US5392130A (en) Analyzing an image showing a row/column representation
KR20110081099A (ko) 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체
JP2007095102A (ja) 文書処理装置および文書処理方法
JP3683925B2 (ja) 電子ファイリング装置
US20240212381A1 (en) Systems and methods for automatic detection of features on a sheet
CN116610304A (zh) 页面代码生成方法、装置、设备和存储介质
JP2008282149A (ja) 画像処理装置、画像処理方法、画像処理プログラム
US20080049258A1 (en) Printing Digital Documents
JPH07200838A (ja) 画像データ解析方法
JP4574347B2 (ja) 画像処理装置、方法及びプログラム
JP4405604B2 (ja) 情報処理装置及び定義方法
JPH10222688A (ja) 画像処理方法
Dibble Didact: a document image data analysis and capture toolkit

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040203