JP6151802B2 - 文書の可視オブジェクト検索のためのプレフィルタリング - Google Patents

文書の可視オブジェクト検索のためのプレフィルタリング Download PDF

Info

Publication number
JP6151802B2
JP6151802B2 JP2015555998A JP2015555998A JP6151802B2 JP 6151802 B2 JP6151802 B2 JP 6151802B2 JP 2015555998 A JP2015555998 A JP 2015555998A JP 2015555998 A JP2015555998 A JP 2015555998A JP 6151802 B2 JP6151802 B2 JP 6151802B2
Authority
JP
Japan
Prior art keywords
document
visible
template
filtered
raster image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015555998A
Other languages
English (en)
Other versions
JP2016505187A (ja
Inventor
トゥドゥシウク、クリスティアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bluebeam Inc
Original Assignee
Bluebeam Software Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bluebeam Software Inc filed Critical Bluebeam Software Inc
Publication of JP2016505187A publication Critical patent/JP2016505187A/ja
Application granted granted Critical
Publication of JP6151802B2 publication Critical patent/JP6151802B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Description

本発明は、一般に、コンピュータ化された検索に関し、より詳細には、文書の可視オブジェクト検索のための、色およびサイズベースのプレフィルタリングのための方法に関する。
情報の作成、配布、および管理は、ビジネスの中核をなす機能である。情報またはコンテンツは、ワード・プロセッシング文書、スプレッドシート、グラフィックス、写真、設計図、建築計画などを含む、様々な異なる様態で提示され得る。電子形態において、これらは、一般に、文書と呼ばれ、それらの文書に特有のコンピュータ・ソフトウェア・アプリケーションによって生成され、操作されることが可能である。企業における通常のワークフローには、そのような文書を協力して作成し、点検し、さらに/または編集する、しばしば、別々の地理的場所にわたる、様々なスタッフが関与する。
多種多様なオペレーティング・システム、アプリケーション・プログラム、ならびに処理能力およびグラフィック表示能力を有する、異なる多くのコンピューティング・プラットフォームの存在のため、デバイスに依存せず、解像度に依存しないファイル・フォーマットが、そのような交換を円滑にするのに必要であることが当業者によって認識されてきた。この必要性に応えて、競合するフォーマットの中でもとりわけ、PDF(Portable Document Format)が開発された。
PDF標準は、簡略化されたPostScriptインタプリタ・サブシステム、フォント埋め込みサブシステム、およびストレージ・サブシステムを含む、いくつかの技術の組合せである。当業者には認識されるとおり、PostScriptは、文書のレイアウトおよびグラフィックスを生成するためのページ記述言語である。さらに、PDFストレージ・サブシステムの要件に則って、本明細書でひとまとめにしてグラフィック要素と呼ばれる、テキスト、ベクトル・グラフィックス、およびラスタ(ビットマップ)グラフィックスを含む、その文書のすべての要素が、単一のファイルの中にカプセル化される。グラフィック要素は、特定のオペレーティング・システム、ソフトウェア・アプリケーション、またはハードウェアに対して符号化されるのではなく、そのようなデータを書き込む、または読み取るシステムと関係する特定性にかかわらず同一の様態でレンダリングされるように設計される。PDFのクロスプラットフォーム能力は、PDFの幅広い採用を助け、今や、事実上の文書交換標準である。当初はプロプライエタリであったが、PDFは、ISO/IEC3200−1:2008として国際標準化機構(ISO)によって公開されたオープン標準としてリリースされている。現在、PDFは、主としてテキストからなるもの、および主としてベクトル・グラフィックスおよびラスタ・グラフィックスからなるものを含む、多種多様な文書タイプを符号化するのに利用される。PDFの多機能性および汎用性のため、PDFフォーマットのファイルの方が、しばしば、特定のアプリケーションのより専用化されたファイル・フォーマットより選好される。その汎用性および一般性に起因して、PDFフォーマットのファイルは、特定のアプリケーションのより特定的なされたファイル・フォーマットよりも好ましいことが多い。そのため、文書がPDFフォーマットへ変換されることが多い。
PDFフォーマットの電子文書などの電子文書で作業することの有意な利点のうちの1つは、短時間で大量の情報を検索する能力である。非電子文書または紙の文書を用いる場合、ある情報を検索することは、たとえ最良のカタログツールおよび他のインデックスツールを用いても、困難で骨の折れるプロセスであることが分かっている。一般に、従来の
電子文書の検索は、ユーザが単純な単語クエリを入力し、そのクエリされた1つまたは複数の単語が見つかる場所が識別されるテキストベースの方法に限定されてきた。書式設定などの付加的な検索パラメータも特定され得る。ブール検索技法および自然言語検索技法も知られているが、典型的には、文書のデータベースや、ワールドワイドウェブのウェブページなどを検索するために利用される。しかしながら、結局のところ、これらはテキストベースのクエリを伴う。
PDFファイルに格納され、PDFファイルとして交換される情報/主題は、より複雑になりつつあり、幅広い文書が、ペーパーレスオフィス化傾向の一環としてデジタル化されている。実際に、エンジニアリング図、建設計画、配線図などは、PDF文書に保存され、PDF文書を介して共有されることが多い。文書において、特に、上記に挙げられたタイプの文書において、グラフィックの使用がますます増加するにつれて、そのような要素についてのクエリは、望ましい機能である。例えば、建築図面は、その図面からは即座に分からない関連する参照情報、その図面または文書の他の部分へのリンクなどを、見る人に様々に提供する記号を含む。記号に関連付けられるそのようなリンクはアクティブにされる場合があり、または特定の記号を数えることが必要になる場合がある。現在、これは手動で行われており、非常に時間がかかる。
グラフィック自体のコンテンツを検索するよりもむしろ、別の従来の技法は、メタデータをグラフィックと関連付け、メタデータのテキストベースの検索を使用することを伴う。主題またはコンテンツのキーワード、カテゴリのキーワード、場所のキーワードなどの多様な情報が、メタデータにおいて特定され得る。種々の画像またはグラフィックのカタログにおいて、そのようなテキストメタデータ検索は、適切であり得る。しかし、ある大きな文書中のあらゆるグラフィックをカタログ化することは、特に、その文書のデータ構造がカタログ化に順応しない場合には、不可能であり得る。
人間が、ある文書上の特定のグラフィック情報の発生を検索する場合、そのグラフィックのフィーチャ・セットに基づく記述が、直感的に形成される。これらのフィーチャは、典型的には、対象物のサイズ、形状、および色、ならびに当該対象物と文書内に含まれる他のグラフィックとの間の関係である。一般にテンプレートと呼ばれる、フィーチャの記述は、一致する候補を識別するために、文書の種々のセグメントと比較される。そのような一見したところ直感的であるが複雑な精神的プロセスを、データプロセッサによって実行され得る別個のプロセスとして実装することに関連付けられる、有意な課題が存在する。様々な技法およびアルゴリズムが開発されてきたが、それらは大量のデータに対する数学的な集約的演算を伴う傾向がある。したがって、改善された精度および速度における重要な要因は、生データの処理能力における改善に起因する。
視覚的な検索のための1つの技法は、本願譲受人にも譲渡され、その開示の全体が本願明細書に全て援用される、「A method for multiple pass symbol and components−based visual object searching for documents」と題された同時係属中の米国特許出願第13/018,299号
において想定される。この技法は、文書が検索されるラスタテンプレートの選択および定義を伴う。文書ラスタ画像表現が生成され、一致する候補は、連続的な詳細レベルで生成および縮小される。
人間の精神は、ある省略または遮蔽された詳細部を補うことができるため、たとえ部分的に隠されている場合でも、グラフィック要素を識別することが可能である。しかしながら、前述のラスタ画像ベースの検索のいくつかの使用例においては、このような部分的に隠されたグラフィック要素が識別されないことがある。建築業界、エンジニアリング業界
、および建設業界において、生成される典型的なPDF文書は、いくつかの重複する情報の層を含み得る。さらに、これらの産業界は、複数のユーザが文書にコメントし、様々な注釈(アノテーション)を付ける、高度に協調的なワークフロープロセスを伴う傾向がある。文書のラスタ化画像の検索は、そのような遮蔽されたコンテンツをうまく識別し得ない。また、このような複雑な文書は、前述の視覚検索モダリティを減速させる傾向がある、データ集約的なラスタ画像を生み出す傾向がある。
したがって、本技術分野においては、改善された速度および精度を有する、文書の可視オブジェクト検索のための、色およびサイズベースのプレフィルタリングのための方法の必要がある。
様々な実施形態によれば、可視オブジェクトのコンピュータ化された検索のために文書上の可視オブジェクトをプレフィルタリングする方法が開示される。前処理動作は、検索速度および結果の品質を実質的に改善するために想定される。なぜならば、特に、文書がベクトル成分からなる場合には、後続のラスタベースの視覚検索のためのデータセットが低減されるからである。さらに、多数のオーバーレイを有する複雑な文書であっても、一致するものの正確な識別が可能である。
本方法の第1の実施形態は、文書のサブセクションからのテンプレート可視オブジェクトの選択を受け取る工程を含むことができる。テンプレート可視オブジェクトは、1つまたは複数のオブジェクト構成要素によって定義され得る。これに加えて、テンプレート可視オブジェクトのフィーチャ・セットを得る工程が存在してもよい。フィーチャ・セットは、前記オブジェクト構成要素を定義する色の色リストと、前記オブジェクト構成要素の境界定義と、補助ラスタ成分交差フラグとのうちの少なくとも1つを含み得る。これらの全てがフィーチャ・セットを構成するにもかかわらず、様々な実施形態では、1つのみを有し得る。本方法は、文書上の可視オブジェクトから、プレフィルタリングされた可視オブジェクトのサブセットを生成する工程をさらに備えてよい。プレフィルタリングされた可視オブジェクトは、フィーチャ・セットの色リストと、前記境界定義と、前記補助ラスタ成分交差フラグとのうちの少なくとも1つに基づく所定の基準のうちの少なくとも1つに一致し得る。この場合においても、異なる実施形態では、これらのうちの1つのみが所定の基準の基礎となる可能性も想定される。また、文書からプレフィルタリングされた文書ラスタ画像を生成する工程が存在してもよい。プレフィルタリング文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み得る。画素セットは、プレフィルタリングされた可視オブジェクトのサブセットに対応し得る。
本開示の第2の実施形態では、文書上の可視オブジェクトのコンピュータ化された検索のために、可視オブジェクトをプレフィルタリングする方法も想定される。この方法は、文書のサブセクションからのテンプレート可視オブジェクト領域の選択を受け取る工程を含み得る。テンプレート可視オブジェクト領域は、連結された画素の1つまたは複数のシーケンスによって定義され、画素は各々色値を有し得る。この方法は、テンプレート可視オブジェクト領域内の画素の各々からの色値のヒストグラムを生成する工程に続いてもよい。これに加えて、文書からプレフィルタリングされた文書ラスタ画像を生成する工程が存在してもよい。プレフィルタリングされた文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み得る。さらにまた、プレフィルタリングされた文書ラスタ画像における画素は、色値のピークの所定の範囲内に存在し得る。1より多くのピークが特定されてもよいことが理解される。
前述の方法は、データ処理装置によって実行可能な一連の工程として実装され、非一時的なプログラム記憶媒体において具現化され得る。現在想定される実施形態は、添付の図面と共に読まれる場合、以下の詳細な説明を参照することによって、最も良く理解されるであろう。
本明細書において開示される様々な実施形態のこれらおよび他の特徴および利点は、以下の説明および図面に関してより良く理解されるであろう。
ディスプレイ・デバイスを含む、本発明の態様と共に使用するための機能を実行することが可能であり得る例示的なコンピュータ・システムの図。 図1の例示的なコンピュータ・システムのシステム構成要素のブロック図。 可視オブジェクトをプレフィルタリングする想定される方法の様々な態様を実装する文書レビュー・ソフトウェア・アプリケーションの例示的なユーザ・インタフェースの図。 テンプレート可視オブジェクトと文書可視オブジェクトがベクトルデータを含む文書上の可視オブジェクトをプレフィルタリングするための方法の第1の実施形態を例示するフローチャート。 テンプレート可視オブジェクト領域のビットマップデータが使用される文書上の可視オブジェクトをプレフィルタリングするための方法の第2の実施形態を例示するフローチャート。 例示的なテンプレート可視オブジェクトのベクトルをグラフで表現した図。 図5に示される、ベクトルをグラフで表現した図のデータ構造図。 図5に示される例示的なテンプレート可視オブジェクトと均等な簡略化されたラスタをグラフで表現した図。 本開示の様々な実施形態に係るフィーチャ・セットのデータ構造図。 例示的なプレフィルタリングされた文書ラスタ画像の図。 色に基づくプレフィルタリング方法の実行前の例の図。 色に基づくプレフィルタリング方法の実行後の例の図。 サイズに基づくプレフィルタリング方法の実行前の例の図。 サイズに基づくプレフィルタリング方法の実行後の例の図。 補助ラスタ成分交差フラグに基づくプレフィルタリング方法の実行後の例を示す図。 ベクトル空間色選択機能を実証するためのテンプレート可視オブジェクトを定義する文書からの別の選択領域を示す図。 テンプレート可視オブジェクトの異なる色がプレフィルタリングのために選択される色選択ダイアログウィンドウのインスタンスの図。 テンプレート可視オブジェクトの異なる色がプレフィルタリングのために選択される色選択ダイアログウィンドウのインスタンスの図。 テンプレート可視オブジェクトの異なる色がプレフィルタリングのために選択される色選択ダイアログウィンドウのインスタンスの図。 図7に示されるラスタ画像の画素色値と対応する個数とを描く例示的なヒストグラム。 プレフィルタリング方法の第2の実施形態の適用後の、例示的なプレフィルタリングされた文書ラスタ画像の図。 ヒストグラム操作インタフェースを含む色選択ダイアログウィンドウの別のインスタンスの図。
図面および詳細な説明の全体を通じて、同じ要素を示すために共通の参照符号が使用さ
れる。
添付の図面に関連して以下に示される詳細な説明は、コンピュータ化された検索のプレフィルタリング方法の現在好適な実施形態の説明として意図されるものであり、本方法が開発または利用され得る唯一の形態を表すことを意図されるものではない。本説明は、例示される実施形態に関連して本発明を開発および動作させるための機能および工程のシーケンスを示す。しかしながら、同じまたは均等な機能およびシーケンスは、異なる実施形態によって達成されることができ、当該異なる実施形態も、本発明の精神および範囲内に包含されることが意図されることが理解されるべきである。第1、第2などの関係後の使用は、ある実体と別の実体との間の実際のそのような関係または順序を必ずしも要求または暗示することなく、ある実体を別の実体と区別するためだけに使用されることがさらに理解される。
図1は、文書管理および文書配置の企図される方法の様々な態様が実施され得る例示的なハードウェア環境を示す。一般に、システム・ユニット12と、ディスプレイ・デバイス14とを有するコンピュータ・システム10が存在する。ディスプレイ・デバイス14は、システム・ユニット12によって実行されたデータ処理動作からのグラフィック出力をもたらした。例えば、キーボード16およびマウス18を含む入力デバイスが、データ処理動作に対する対応する入力を生成するようにユーザによって操作されることが可能であり、ポート20を介してシステム・ユニット12に接続される。他の様々な入力デバイスおよび出力デバイスが、システム・ユニット12に接続されることが可能であり、様々な相互接続モードが、当技術分野において知られている。
図2のブロック図に示されるとおり、システム・ユニット12は、任意の従来のタイプであり得るプロセッサ(CPU)22を含む。システム・メモリ(RAM)24が、CPU22によって実行されたデータ処理動作の結果を一時的に記憶し、通常、専用のメモリ・チャネル26を介してCPU22と互いに接続される。システム・ユニット12は、入出力(I/O)バス30を介してCPU22とやはり通信状態にある、ハード・ドライブ28などの永久ストレージ・デバイスをさらに含み得る。グラフィックス・モジュール32が、ビデオ・バス34を介してCPU22にやはり接続されることが可能であり、表示データを表す信号をディスプレイ・デバイス14に送信する。前段で示されるとおり、キーボード16およびマウス18が、ポート20を介してシステム・ユニット12に接続される。ポート20がUSBタイプである実施形態において、ポート20を介して接続された外部周辺装置のために、CPU22に対するデータおよび命令、ならびにCPU22からのデータおよび命令を変換するUSBコントローラ36が存在することが可能である。プリンタ、マイクロフォン、スピーカなどのさらなるデバイスが、ポート20によってシステム・ユニット12に接続され得る。
一実施形態によれば、ユーザは、コンピュータ・システム10、および、特に、ディスプレイ・デバイス14上に生成されるグラフィックと、マウス18を介して対話することができる。ディスプレイ・デバイス14上に生成されるカーソルの動きは、マウス18の動きに結び付けられ、さらなる対話は、マウスボタンからの入力により提供される。キーボード16からの入力も、コンピュータ・システム10との対話を提供する。本開示のいくつかの特徴は、そのような入力能力および出力能力を有するコンピュータ・システムに関して説明されるが、その詳細は、例として提示されるに過ぎず、限定として提示されない。例えば、以下の説明は、マウスボタンを「クリックすること」、カーソルを「合わせること」、画面上のオブジェクトを「ドラッグする」ためにマウスボタンを「押さえること」などに言及する。そのような用語は、本明細書において示される例示的なユーザ・インタフェースとの対話に関連する、充分に理解されている意味を有する。ただし、タッチ・インタフェースおよびペン/デジタイザ・インタフェースなどの、任意の代替的なグラフィカル・ユーザ・インタフェースが、代わりに使用されてもよい。それらの機能の類似
物は、同じ機能性を実現しつつ、これらの代替的なインタフェースに順応するための適切な変形と共に、容易に認識されるであろう。
このような方向に沿って、前述のコンピュータ・システム10は、本開示の態様を実装するのに適切な多くの他の装置のうちの1つの例示的な装置のみを表し、コンピュータ・システム10の構成要素のうちの最も基本的なもののみが説明されている。コンピュータ・システム10は、本明細書において説明されない付加的な構成要素を含んでもよく、異なる構成およびアーキテクチャを有してもよいことが理解されるべきである。そのようないかなる代替物も、本開示の範囲内にあるとみなされる。
ここで図3を参照すると、プレフィルタリングする方法の様々な実施形態が実装され得る文書編集ソフトウェア・アプリケーションの例示的なグラフィカル・ユーザ・インタフェース38が示されている。本明細書において、文書という用語は、対応する文書レビュー・ソフトウェア・アプリケーションによって、開かれ、レンダリングされ、および/または編集され得る電子ファイルまたはデータのスタンドアロン表現をいう。したがって、文書は、その要素が一貫してレンダリングされ得るように、特定の手法で書式設定および構築され得る。本明細書において議論される例示的な実施形態において、文書レビュー・ソフトウェア・アプリケーションはPDF文書を取扱い、コンピュータ化された検索方法の以下の説明はPDF文書に関連するであろう。しかしながら、任意の他のソフトウェア・アプリケーションを用いて編集可能な任意の他のフォーマットの文書が代わりに使用されてもよいことが、当業者によって認識されるであろう。ソフトウェア・アプリケーションは、ウィンドウシステム上で実行され、したがって、ウィンドウシステムのためのアプリケーションに共通する多数のインタフェース要素を有する。
グラフィカル・ユーザ・インタフェース38の機能的な、対話フィーチャは、メインウィンドウ40を様々に最小化し、最大化し、閉じる基本ウィンドウ制御44と共にタイトルバー42を含むメインウィンドウ40内に含まれる。また、メインウィンドウ40は、メニューバー46を含み、このメニューバー46からは、文書編集ソフトウェア・アプリケーションの様々な機能がプルダウンメニューを介して呼び出され得る。ファイルを開くこと、現在開かれているファイルに対する変更を保存することなどの、よく利用される機能が容易にアクセス可能となるように、ツールバー48も存在する。メインウィンドウ40内にはワークスペースウィンドウ50が存在し、ワークスペースウィンドウ50は、開かれている文書ファイルの名前「example.pdf」と、基本ウィンドウ制御44とを有するサブタイトルバー52を含む。
ワークスペースウィンドウ50内にレンダリングされる文書54が存在する。図示の例において、文書54は、様々なグラフィック要素56から成る建築図面である。図面の一部として、または文書54に添付されるものとして、いくつかのオーバーレイされるアノテーション・オブジェクト58が存在し得る。具体的には、特に、第1のアノテーション58a、第2のアノテーション58b、および第3のアノテーション58cが存在する。例として、第1のアノテーション58aは、第1のアノテーション58aによって囲まれるグラフィック要素56へ注意を向けるコールアウトクラウドであると理解される。第2のアノテーション58bは、第1のアノテーション58aのさらなる説明として付加されたテキストコメントであり得る。第3のアノテーション58cは、その下にあるグラフィック要素56を部分的に遮蔽する。
グラフィック要素56およびアノテーション58は、一般に、文書54の可視オブジェクト60として同様に呼ばれ得る。各可視オブジェクト60は、文書54内に配置される特定のロケーションに対応する関連付けられる位置値を有すると理解される。位置値は、文書54に参照される座標に関連し得る。さらに、可視オブジェクト60は、ラスタビッ
トマップ、すなわち、画素値のセットだけでなく、開始点座標と終了点座標とを有するベクトル成分の観点からも定義され得る。本開示の様々な実施形態は、改善された検索のために、いくつかの可視オブジェクト60のプレフィルタリングを想定する。可視オブジェクト60の特定の外観およびコンテンツは、例として提示されるに過ぎず、文書54内に含まれ得る多くの他のタイプの可視オブジェクト60が存在することが認識されるであろう。
メインウィンドウ40は、ワークスペースウィンドウ50の右側に位置するツールパネルウィンドウ62も含む。本開示の一実施形態に従って検索機能も想定され、そのため、ツールパネル62は、双眼鏡を描くアイコンによって示されるように、検索機能固有のタブ64を有する。他の機能は、異なるタブを介してアクセス可能であり得るが、簡潔さのために、そのような他のタブは図示されない。従来の文書レビュー・ソフトウェア・アプリケーションと同様に、テキストベースの検索が可能である。第1のラジオボタン66を選択することにより、そのようなテキストベース検索機能がアクティブ化され、文書54において検索されるテキストは、テキストボックス68内に入力される。第2のラジオボタン70を選択することにより、以下にさらに詳細に説明されるような可視オブジェクトベース検索が呼び出される。
第1のラジオボタン66(テキストベース検索)または第2のラジオボタン70(可視オブジェクトベース検索)のいずれかの選択により、付加的な検索パラメータが特定され得る。第1のプルダウンメニュー72は、検索対象の文書54の選択を可能にする。図3は、このパラメータを現在の文書に設定されるものとして例示し、これは、ワークスペースウィンドウ50において現在レビューされている文書に検索を限定する。多くの文書がソフトウェア・アプリケーションにおいて一度に開かれ得ることが想定されるため、このパラメータの別の設定は、文書を全て開くように設定され得る。
ソフトウェア・アプリケーションにおいて開かれるファイルを超えて、ファイルシステムに記憶される複数の文書を検索するオプションも存在する。第1のプルダウンメニュー72において、このオプションは「フォルダ」と称され得る。検索されるべき最上位のディレクトリは、パス入力テキストボックス74において特定される。他のグラフィカル・ユーザ・インタフェースにおいて実装されるように、ファイルシステムを視覚的にナビゲートするためのダイアログボックスを呼び出すファイルシステムブラウザボタン76が存在する。チェックボックス78は、選択された最上位のディレクトリのサブディレクトリが検索されるべきかを特定する。パス入力テキストボックス74およびチェックボックス78は、複数の文書を検索するオプションが選択される場合、つまり、第1のプルダウンメニュー72が「フォルダ」に設定される場合には、アクティブであると理解される。他の場合には、パス入力テキストボックス74、ファイルシステムブラウザボタン76、チェックボックス78、およびその関連付けられる説明文は、薄暗くされ、非アクティブにされ得る。
プレフィルタリングする方法は1つの文書を検索することに言及するが、本方法は複数の文書に同様に適用可能であることが理解される。そのような複数文書のプレフィルタリングおよび後続の検索は、そのためのパラメータを上述されたように設定することによって呼び出され得る。
いくつかある目的の中でも、本開示は、視覚検索において操作される無関係なデータを最小化し、そのような視覚検索に付随するラスタ化工程に先立って、部分的または全体的に遮蔽される可視(ビジュアル)文書を識別することを可能とするために、文書54上の可視オブジェクトをプレフィルタリングすることを想定する。上述されたように、PDF標準は、文書54のコンテンツ、すなわち、可視オブジェクト60の記憶および提示を、
オブジェクトのオブジェクトタイプ、色、連結成分の座標値などを含む、可視オブジェクトの特性を定義するベクトルデータのセットとして収容する。プレフィルタリング方法の第1の実施形態は、そのようなベクトルデータを伴い、プレフィルタリング方法の第1の実施形態の工程は、図4Aのフローチャートに示される。代替的に、PDF標準は、可視オブジェクト60、および、実際には、文書54全体の記憶も、各々が色値を有する画素の多次元のアレイによって定義されるラスタまたはビットマップとして収容する。また、プレフィルタリング方法の第2の実施形態は、そのようなラスタデータを伴い、プレフィルタリング方法の第2の実施形態の工程は、図4Bのフローチャートに示される。これらの実施形態の両方は、順番に議論されるであろう。
両実施形態は、可視オブジェクトのテンプレートをキャプチャする工程を想定する。図4Aのフローチャートに示されるように、ベクトルデータを伴う、プレフィルタリング方法の第1の実施形態は、テンプレート可視オブジェクトの選択を受け取る工程300を想定する。同様に、図4Bのフローチャートに示されるように、ラスタデータを伴う、プレフィルタリング方法の第2の実施形態は、テンプレート可視オブジェクト領域の選択を受け取る工程400を含む。
図3に示される文書レビュー・ソフトウェア・アプリケーションを利用すると、両方の場合において、これは、ツールパネルウィンドウ62の選択ボタン80をアクティブ化することを含み得る。次に、カーソル82が、第1の位置84から第2の位置86までドラッグされ得、これによって、可視オブジェクト60、つまり、トイレを描くグラフィック要素56を取り囲む選択領域88を定義する。テンプレート可視オブジェクト90が選択される特定の技法が説明されたが、本開示の範囲から逸脱することなく、異なるインタフェースを伴う他の技法が代わりに使用されてもよいことが認識されるであろう。
プレフィルタリング方法の第1の実施形態において、この選択された可視オブジェクト60は、テンプレート可視オブジェクト90とも呼ばれるであろう。図5を参照すると、このグラフィック要素56は、(属性の中でも)特定の大きさ、位置、および色を有する、数学的に定義される一連の幾何プリミティブまたはオブジェクト構成要素92として表現され得る。図示される例においては、第1の長方形92a、第2の長方形92b、正方形92c、第1の斜線92d、および第2の斜線92eが存在する。これらの構造は、例として提示されるに過ぎず、一連の直線および曲線などの任意の他の適切な定義も利用され得る。図6のデータ構造図に示されるように、各オブジェクト構成要素92は、オブジェクトタイプ属性93a、色属性93b、および座標属性93cを含む、1つまたは複数の属性93によって定義される。これらの属性93の各々と他の属性とが、対応するオブジェクト構成要素92の視覚的外観および位置を定義し、オブジェクト構成要素92は、組み合わされると、テンプレート可視オブジェクト90の視覚的外観および位置を定義する。したがって、工程300に従った、可視オブジェクト60の選択は、各オブジェクト構成要素92の様々な属性93を一時記憶装置に収めるものと理解される。
他方では、プレフィルタリング方法の第2の実施形態における、前述された同じ対話は、文書54のサブセクションである領域を選択するものと理解される。図7は、前述の選択領域88のラスタ表現を例示する。文書54の全体、または文書54の少なくとも関連する部分は、複数の行96および複数の列98において配列される画素94の多次元のアレイによって定義される。選択領域88、および、したがって、テンプレート可視オブジェクト領域100は、グラフィック要素56を構成する画素94を含む。各画素94は、様々な色強度値または画素強度値を有すると理解される。同様の強度を有し互いに隣接する画素94は、1つの連結されたシーケンスにグループ化され得る。本明細書においては、第1の画素と第2の画素とが直接隣接し、または、上方向、下方向、左方向、もしくは右方向の関係において少なくとも所定の距離内で隣接し、かつ、所定の閾値未満であるそ
れぞれの強度における差を有する場合、第1の画素は第2の画素に連結されている。これにしたがって、連結画素のチェーンまたはシーケンスが定義され得る。任意の所与のテンプレート可視オブジェクト90について、隣接する画素の1つまたは複数の連結されたシーケンスからなるセットが存在し得る。このため、テンプレート可視オブジェクト領域100の選択を受け取る工程400は、画素強度および座標値の各々を一時記憶装置内にコピーすることを伴う。
ベクトル形式かラスタ形式かは、テンプレートとして指定され、ツールパネルウィンドウ62のテンプレートプレビュー102が更新される。テンプレートプレビュー102は、工程300または400において予め選択されたテンプレート可視オブジェクト90またはテンプレート可視オブジェクト領域100のいずれかの表現であると理解される。この点について、プレフィルタリングおよび/または検索を開始することに先立って、そのパラメータを見ることができる。
可視オブジェクトをプレフィルタリングする方法は、ツールパネルウィンドウ62の検索ボタン104をアクティブ化すると、継続し得る。図4Aのフローチャートを参照すると、本方法の第1の実施形態は、テンプレート可視オブジェクト90のフィーチャ・セットを得る工程302に続く。図8のデータ構造図に最も良く示されるように、フィーチャ・セット106は、テンプレート可視オブジェクト90のテンプレート・オブジェクト構成要素92の各々の色属性93bを含む、色リスト110を含み得る。例えば、グラフィック要素56が、黒色のテンプレート・オブジェクト構成要素92と灰色のテンプレート・オブジェクト構成要素92とから成る場合、黒色および灰色が、色リスト110に載せられる。以下にさらに詳細に説明されるように、プレフィルタリングの目的の1つは、色リスト110に載せられた色属性を有する可視オブジェクトのみが保持の候補となり得るように、テンプレート可視オブジェクト90と類似しない、いかなる可視オブジェクト60も除去することである。
フィーチャ・セット106は、テンプレート可視オブジェクト90のサイズに関連する境界定義112も含み得る。正確な数値は、テンプレート可視オブジェクト90のオブジェクト構成要素92の各々の座標値93cから計算され得る。さらに詳細には、境界定義112は、境界の全ての高さおよび幅のうちで最大である最大長114を設定する。文書54上で回転される可能性がある可視オブジェクト60に順応するために、最大長は、回転許容係数116によって乗算され得る。随意的であるが、好適には、回転許容係数116は、1.5である。入力された選択領域88におけるテンプレート可視オブジェクト90のサイズはより小さくなり得るため、境界定義112は、入力された選択領域88と同等である必要はないことが理解される。この場合も、プレフィルタリングの目的の1つは、テンプレート可視オブジェクト90と非類似のいかなる可視オブジェクト60も除去することであり、境界定義112によって定義されるものと等しいか、または境界定義112によって定義されるものよりも小さいもののみが保持される。
フィーチャ・セット106の別の考え得る部分は、補助ラスタ成分交差フラグ118である。これは、選択されたテンプレート可視オブジェクト90と交差する任意のラスタ成分またはビットマップ成分が存在するかを判定するものと理解される。「ビットマップ状の(bitmap like)」データとは、ビットマップ、すなわち、個々の画素のアレイとして定義される任意の他の可視オブジェクト60、または、そのようなビットマップを含むアノテーションをいう。
再び図4Aのフローチャートおよび図9のブロック図を参照する。フィーチャ・セット106が得られると、本方法は、文書54上の可視オブジェクト60からプレフィルタリングされた可視オブジェクトのサブセットを生成する工程304に続き得る。これは、フ
ィーチャ・セット106の前述の部分のうちの1つまたは複数に基づく所定の基準を使用して生成される。上記に示されるように、これらの基準のうちの1つは、関連付けられる色リスト110において示されるような、テンプレート可視オブジェクト90の色と一致する任意の可視オブジェクト60の色である。この基準は、色によるフィルタリングとも称され得る。別の基準は、境界定義112において特定される最大長以下である、任意の可視オブジェクト60の大きさ/長さであり、任意の可視オブジェクト60の長さは、その可視オブジェクト60の高さと幅とのうちの大きい方として定義される。この基準は、サイズによるフィルタリングとも称され得る。また別の基準は、可視オブジェクト60上にオーバーレイされるビットマップ状の情報の存在である。
ユーザは、フィルタ基準のうちのどの1つまたは複数を適用すべきかを選択することができ、任意の1つまたは複数が、本開示の実施形態に従って選択され得る。言い換えれば、プレフィルタリングされた可視オブジェクトは、色に関してのみ、サイズに関してのみ、補助ラスタ成分交差フラグ118に関してのみ、またはこれらの任意の組み合わせに関して、テンプレート可視オブジェクト90と一致し得る。
図3に最も良く例示されるように、そのような選択は、ツールパネルウィンドウ62のオプションサブパネル120を介して可能である。色によってフィルタリングするための色チェックボックス122が存在し、サイズによってフィルタリングするためのサイズチェックボックス124が存在し、両方が、上述された色リスト110と境界定義112との得られたフィーチャ・セットに従っている。この実施形態においては、補助ラスタ成分交差フラグに基づくフィルタリングを選択し、または選択を解除するためのオプションは、最初に指定される選択領域88の特性に主に基づくため、存在しないことが理解される。色チェックボックス122は初期設定で設定され、サイズチェックボックス124も同様である。
チェックボックス122、124の選択は、検索ボタン104をアクティブ化することによって工程302を呼び出す前に行われるため、プレフィルタリング方法は、プレフィルタリングされた可視オブジェクトのサブセットを生成するために使用されるフィーチャ・セット106の部分のみを得ることができる。例えば、色チェックボックス122のみが選択される場合、境界定義112を得る必要はないことがある。なぜならば、境界定義112は、サイズフィルタ基準の一部とならないためである。しかしながら、前述の工程302は、どのフィルタ基準が設定されるかにかかわらず、フィーチャ・セット106の各部分を得ることを含むことができ、そのような選択は、ラスタ画像が生成される後続の工程への到達時に関連することが当業者によって認識されるであろう。
本方法は、上記に示された所定の基準を満たすプレフィルタリングされた可視オブジェクトのサブセットのプレフィルタリングされた文書ラスタ画像を生成する工程306に続く。ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み、これらの画素は、示された基準を満たすプレフィルタリングされた可視オブジェクト60に対応すると理解される。したがって、現在想定されるプレフィルタリング方法は、選択されたテンプレート可視オブジェクト90と同様の特性を有する可視オブジェクト60のみをラスタ化する。プレフィルタリングされた可視オブジェクト60に対応しない他の全ての画素は、取り除かれ、そもそもラスタ化されず、または、そうでない場合、結果として得られるプレフィルタリングされた文書ラスタ画像上に存在しない。これは、後続のラスタ画像ベースの視覚検索方法において操作されるデータセットを減少させるものと理解される。
プレフィルタリング方法の別の態様によれば、プレフィルタリングされた文書ラスタ画像を生成する上述された工程は、膨張(dilation)操作をさらに含み得る。随意
的であるが、好適には、膨張では、3×3演算子を利用する。当業者は、膨張とは、拡張対象となる可視オブジェクト60の輪郭を拡張する基本的なモルフォロジー演算であることを認識するであろう。したがって、差異を考慮するために、若干異なるオフセットを用いて可視オブジェクト60を複数回ラスタ化する必要がない。さらに、アンチエイリアシングに由来する誤差も低減され得る。上記に示されるように、プレフィルタリング方法の目的の1つは、視覚検索のために文書ラスタ画像を生成することである。テンプレート可視オブジェクト90も、この目的のためにラスタ化され、そのため、同じ膨張操作が、テンプレート可視オブジェクト90に適用され得る。
一般に、視覚検索方法は、文書54上の可視オブジェクト60の一致候補サブセットと、より詳細には、プレフィルタリングされた可視オブジェクトのみが残っているプレフィルタリングされた文書ラスタ画像とを生成することを伴う。これは、ラスタ化されたテンプレート可視オブジェクト90とプレフィルタリングされた文書ラスタ画像との比較に基づき得る。この点について、プレフィルタリング方法は、テンプレート可視オブジェクトのラスタ画像を生成する工程308も含み得る。この工程は、プレフィルタリングされた文書ラスタ画像を生成することの前または後に発生し得る。ただし、いずれの場合においても、工程300においてテンプレート可視オブジェクト90の選択が受け取られた後のどこかの時点である。プレフィルタリング方法の様々な実施形態の全ての工程が規定の順序に従って説明されてきたが、これは例に過ぎず、限定ではない。当業者は、ある工程の詳細が別の工程からのデータまたは他の要素に依存する場合の順序を考慮しつつ、種々の工程が異なる手法で順序付けられ得ることを認識するであろう。
視覚検索の精度をさらに改善するために、各々がわずかな角度オフセットを有する、複数のバージョンのテンプレート可視オブジェクト90がラスタ化され得る。一実施形態において、角度オフセットは、45度、90度、135度、180度、225度、270度、および315度における、異なるバージョンのテンプレート可視オブジェクト90が存在するように、45度ずつインクリメントされ得る。また、反転操作だけでなく、ミラーリング操作も、テンプレート可視オブジェクト90に適用され得る。この機能は、文書54上の回転された可視オブジェクト60を検出するものと理解される。このプロセスは計算の必要性を増加させるため、当該プロセスは、複数の回転を検索チェックボックス125を介してアクティブ化または非アクティブ化され得るオプションである。
図3に示される例示的な文書54について続けると、トイレを描く、3つのインスタンスのグラフィック要素56a〜56cが存在し、これらの各々は、黒色に着色され得る。青色に着色される線状のグラフィック要素56dなどの他の可視オブジェクト60が存在してもよい。図9に示されるように、テンプレート可視オブジェクト90の選択が、いかなるビットマップ状のオーバーレイも含まないトイレのグラフィック要素56である場合、3つのインスタンスのグラフィック要素56a〜56cの全ては、プレフィルタリングされた可視オブジェクト60であり、そのため、プレフィルタリングされた文書ラスタ画像126にラスタ化される。テンプレート可視オブジェクト90から得られるフィーチャ・セット106は、例として黒色を示すため、前述の青色の線状のグラフィック要素56dなどの任意の他の要素は存在しない。さらに、境界定義112もテンプレート可視オブジェクト90のものであり、任意の他のより大きな可視オブジェクト60も同様に省略されている。フィーチャ・セット106の補助ラスタ成分交差フラグ118が設定されないため、不透明な、さもなければ、第1のインスタンスのグラフィック要素56a上にオーバーレイされるマークアップも不在である。
また、色フィルタリング機能を例示するために、より簡略化された例が、図10Aおよび図10Bに示される。黒色に着色された第1の長方形のグラフィック要素128aと、白色に着色された第2の円形のグラフィック要素128bと、白色でも黒色でもない中間
色に着色された第3の円形のグラフィック要素128cと、黒色に着色された第4の円形のグラフィック要素128dとが存在する。円形で黒色のテンプレート可視オブジェクト90を用いると、色に基づくプレフィルタリング方法の適用は、図10Bに示されるプレフィルタリングされた文書ラスタ画像126をもたらす。図示されるように、黒色によって定義されるものは第1の長方形のグラフィック要素128aおよび第4の円形のグラフィック要素128dのみであるため、第1の長方形のグラフィック要素128aおよび第4の円形のグラフィック要素128dのみが残存する。色のみの基準は、クエリされている可視オブジェクト60がより大きなオブジェクトのサブ部分である場合に有益である。
図10A〜図10Bに類似する図11A〜図11Bの簡略化された例は、サイズフィルタリング機能を実証するために参照されるであろう。この場合も、黒色に着色された第1の長方形のグラフィック要素128aと、白色に着色された第2の円形のグラフィック要素128bと、白色でも黒色でもない中間色に着色された第3の円形のグラフィック要素128cと、黒色に着色された第4の円形のグラフィック要素128dとが存在する。さらに、テンプレート可視オブジェクト90は円形で黒色である。プレフィルタリングする方法の実行の後に結果として得られるプレフィルタリングされた文書ラスタ画像126は、色にかかわらず、同様のサイズを有する円形のグラフィック要素128b〜128cのみを有する図11Bに示される。このサイズのみの基準は、クエリされている可視オブジェクト60が異なる色を有する場合に有益である。
図12に示される例は、色フィルタとサイズフィルタとの両方が非アクティブ化され、補助ラスタ成分交差フラグ118のみに基づいてフィルタリングされた結果を例示する。文書54は、図3に示されるものと同じであり、テンプレート可視オブジェクト90も同様である。テンプレート可視オブジェクト90上にはオーバーレイされるビットマップデータが存在しないため、得られたフィーチャ・セット106の対応する補助ラスタ成分交差フラグ118は設定されない。そのため、遮蔽的な第3のアノテーション58cは、プレフィルタリングされた文書ラスタ画像126には現れない。
図3の文書54をなお参照すると、いくつかの場合において、第2の選択領域130と同様に、第2のアノテーション58bおよびグラフィック要素56eなどの、同様のサイズの複数の可視オブジェクト60が存在する。この例において、第2のアノテーション58bは、グラフィック要素56eとは異なる色を有し得る。例えば、グラフィック要素56eがピンク色に着色される一方で、第2のアノテーション58bは黒色に着色され得る。本開示の様々な実施形態によれば、フィーチャ・セット106における色リスト110の色の選択をより絞り込み、プレフィルタリングされる可視オブジェクト60およびプレフィルタリングされない可視オブジェクト60をさらに限定することが可能である。図13に示されるように、選択領域130を入力すると、選択領域130は、前述された工程の通りに、テンプレート可視オブジェクト90として設定される。したがって、グラフィック要素56eと第2のアノテーション58bとの組み合わせは、その結果、テンプレート可視オブジェクト90を定義し、1つの可視オブジェクト60は複数のものからなり得ることが明確に想定される。
次に、ツールパネルウィンドウ62の色を絞り込むボタン132がアクティブ化される。図14Aに示される例を参照すると、これは、色選択ダイアログウィンドウ132を呼び出し、この色選択ダイアログウィンドウ132は、一般に、ソース・テンプレート・セクション134と、選択プレビュー・セクション136と、色選択入力セクション138とに分離される。その名前によって示唆されるように、ソース・テンプレート・セクション134は、グラフィック要素56eと第2のアノテーション58bとを含む、より以前に指定されたテンプレート可視オブジェクト90の全体を元の色で表示する。色選択入力セクション138においては、テンプレート可視オブジェクト90に含まれる色の各々の
リスト140が存在し、テンプレート可視オブジェクト90から得られたフィーチャ・セット106の色リスト110に対応するものと理解される。上記の例を続けて見ると、グラフィック要素56eはピンク色に着色されており、そのため、リスト140は、ピンクについてのエントリ140aを含む。さらに、第2のアノテーション58bは、黒色に着色されており、そのため、リスト140は、黒色についてのエントリ140bを含む。各エントリは、独立してアクティブ化または非アクティブ化され得るチェックボックス142を含む。
ここで図14Bの例を参照すると、第1のエントリ140aに対応する第1のチェックボックス142bが非アクティブ化される(ピンク色が選択されないことを意味する)一方で、第2のエントリ140bに対応する第2のチェックボックス142bがアクティブ化される(黒色が選択されることを意味する)。色選択プレビュー・セクション136に示されるように、非アクティブ化された色を有する可視オブジェクト、すなわち、グラフィック要素56eは取り除かれ、第2のアノテーション58bのみが表示される。取消ボタン146をアクティブ化することは、プレフィルタリングプロセスに対するさらなる絞り込みを破棄し、色選択ダイアログウィンドウ132を閉じる一方で、OKボタン144をアクティブ化することは、プレフィルタリングプロセスに対してさらなる絞り込みを適用する。
図14Cは、第2のエントリ140bに対応する第2のチェックボックス142bが非アクティブ化される(黒色が選択されないことを意味する)一方で、第1のエントリ140aに対応する第1のチェックボックス142aがアクティブ化される(ピンク色が選択されることを意味する)例示的な場合を例示する。色選択プレビュー・セクション136に示されるように、選択を解除された黒色を有する第2のアノテーション58bは隠される一方で、選択されるピンク色を有するグラフィック要素56eのみが示される。
ベクトルのグラフィクス操作を伴う前述の機能のうちの一部は、プレフィルタリング方法の第1の実施形態に固有のものであると理解される。しかしながら、プレフィルタリング方法の第2の実施形態によれば、文書54および文書54上の様々な可視オブジェクト60は、ビットマップ、すなわち、列と行とに配置される画素のアレイとして表現される。文書54、および、特に、このタイプのPDFファイルは、物理的な紙の文書をスキャンした結果として生成され、または、JPEG(Joint Photographic
Experts Group)標準ファイルもしくは任意の他のビットマップフォーマットなどの別のラスタ画像から作成され得る。想定される工程400に対応する、テンプレート可視オブジェクト領域100の選択は、図4Bのフローチャートを参照しつつ、さらに詳細に上述された。
当該第2の実施形態の議論を継続し、また、図15を付加的に参照すると、本方法は、ビットマップ内の画素の各色値の頻度を描くヒストグラム148を生成する工程402に進む。図15の例は、第1の色値(例えば、黒色)の第1の画素94aと、第2の色値(例えば、白色と黒色との中間の色合い)の第2の画素94bとを含む、図7に示されるテンプレート可視オブジェクト領域100に適用するものと理解される。ヒストグラム148のx軸150は、画素94が取り得る色の全範囲を描き、y軸152には、ビットマップ内の画素のカウントすなわち数がプロットされている。一般に、ヒストグラム148は、ラスタ画像の最も支配的な色をグラフを使って例示するものと理解される。第1の画素94a(黒色)は、第1のプロット154aに対応し、第2の画素94b(中間の色合い)は、第2のプロット154bに対応する。簡略化されたビットマップヒストグラムのみが提示されたが、任意の色の深さおよび複雑度のラスタ画像が利用されてもよいことが認識するであろう。
本開示のいくつかの実施形態によれば、テンプレート可視オブジェクト領域100は、ヒストグラム148を生成する工程402に先立って、まず、グレースケールに変換され得る。この点について、前述の色は、そのような変換された画像のグレースケールレベルまたは画素強度値にも言及するものと理解される。そのため、色およびグレースケールレベルという用語は、ほとんど同じ意味で言及される。
テンプレート可視オブジェクト領域100内において、所望のオブジェクトの画素色値または検索演算子は支配的になるであろうという仮定がなされる。つまり、ヒストグラム148上のピークの垂直プロットは、所望のオブジェクトの垂直プロットに対応するものと理解される。この情報を得ると、ピークの垂直プロットに対応するものを除いて、または、文書54の少なくとも所定の範囲外の、全ての無関係な色を文書54から取り除くことが可能になる。これは、後続の視覚検索方法が処理しなければならない無関係なデータの量を最小限にするものと理解される。再び図4Bのフローチャートおよび図16の例を参照すると、本方法は、プレフィルタリングされた文書ラスタ画像156を生成する工程404に続く。任意のそのようなタイプの画像と同様に、プレフィルタリングされた文書ラスタ画像156は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットから成り得る。プレフィルタリングされた文書ラスタ画像156内の残りの画素は、色値のピークの所定の範囲内の画素、すなわち、所望の可視オブジェクトの色に近い画素であると理解される。図示の例においては、ピーク色値カウント(例えば、黒色)を有する可視オブジェクト60が保持される。
図17に示される色選択ダイアログウィンドウ132の異なる実施形態を参照すると、ヒストグラム148における色値のピークの所定の範囲158は、ヒストグラム操作インタフェース159を介して調整可能であることが想定される。範囲最大値160および範囲最小値162が存在し、各々が、水平バー166に沿って移動可能である、対応するスライダ164a、164bを有する。入力される範囲最小値は、プレフィルタリングされた文書ラスタ画像156に含まれる色の連続体に沿った最低値を表すと理解される一方で、入力される範囲最大値160は、プレフィルタリングされた文書ラスタ画像156に含まれるであろう色の連続体に沿った最高値を表すものと理解される。色値の範囲158外に存在する画素は、破棄されるものと理解される。したがって、スライダ164を使用することで、文書54のラスタ画像のより多くの画素またはより少ない画素が、プレフィルタリングされた文書ラスタ画像156から除外され得る。これらの調整のプレビュー結果は、色選択プレビュー・セクション136において示され得る。スライダ164を所望の位置に調整した後、対応するラスタ化パラメータを提供するために、OKボタン144がアクティブ化され得る。さもなければ、色選択ダイアログウィンドウを閉じるために、取消ボタン146がアクティブ化され得る。ヒストグラム148の軸に沿った色値は、別様に順序付けられ、配置され得るため、「最高」および「最低」色値という用語は、相対的な意味のみが意図されるに過ぎない。
複数の局所的なピークおよび対応する色値の範囲は、ヒストグラム操作インタフェース159を介して定義され得ることが明確に想定される。さらなる最大値スライダおよび最小値スライダ164は、例えば、既存の範囲158内ではない、ヒストグラム148の異なる部分をクリックすることによって、付加され得る。認識されるように、付加的に定義される範囲外の色値を有する画素の同じプレフィルタリングは、上記に議論された手法と同じ手法で破棄され得る。
この場合も、これらの工程は、文書54をラスタ画像ベースの視覚検索のために準備するためのものと理解される。したがって、プレフィルタリング方法の目的の1つは、テンプレート可視オブジェクト領域100に存在する色のために検索構成要素へ渡されるラスタ画像、つまり、視覚検索のオペランドの調整である。この目的を達成するために、結果
として得られるプレフィルタリングされた文書ラスタ画像156に対して前述の膨張工程を適用することも可能である。
本明細書において示される詳細は、例であり、本発明の実施形態の例示的な議論の目的のために過ぎず、プレフィルタリング方法の原理および概念的態様の最も有益なかつ容易に理解される説明であると信じられるものを提供するために提示される。この点について、本開示の基本的な理解のために必要である以上の詳細を示す試みは行われておらず、本説明を図面と共に読めば、ここに開示される方法のいくつかの形態が実際にはどのように具現化され得るかが、当業者には明らかとなる。

Claims (22)

  1. 文書上の可視オブジェクトのコンピュータ化された検索のために、可視オブジェクトをプレフィルタリングする方法であって、
    コンピュータが前記文書のサブセクションからのテンプレート可視オブジェクトの選択を受け取る工程であって、前記テンプレート可視オブジェクトは、1つまたは複数のオブジェクト構成要素によって定義される、工程と、
    前記コンピュータが前記テンプレート可視オブジェクトのフィーチャ・セットを得る工程であって、前記フィーチャ・セットは、前記オブジェクト構成要素を定義する色の色リストと、前記オブジェクト構成要素の境界定義と、補助ラスタ成分交差フラグとのうちの少なくとも1つを含む、工程と、
    前記コンピュータが前記文書上の前記可視オブジェクトから、プレフィルタリングされた可視オブジェクトのサブセットを生成する工程であって、前記プレフィルタリングされた可視オブジェクトは、前記フィーチャ・セットの前記色リストと、前記境界定義と、前記補助ラスタ成分交差フラグとのうちの少なくとも1つに基づく所定の基準のうちの少なくとも1つに一致する、工程と、
    前記コンピュータが前記文書からプレフィルタリングされた文書ラスタ画像を生成する工程であって、前記文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み、前記画素セットは、前記プレフィルタリングされた可視オブジェクトの前記サブセットに対応する、工程と、
    を備える方法。
  2. 前記コンピュータが前記テンプレート可視オブジェクトからテンプレート・ラスタ画像を生成する工程であって、前記テンプレート・ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなるテンプレート画素セットを含む、工程をさらに備え、
    前記フィーチャ・セットは前記テンプレート・ラスタ画像から得られる、
    請求項1に記載の方法。
  3. 前記コンピュータが前記テンプレート・ラスタ画像と前記プレフィルタリングされた文書ラスタ画像との比較に基づいて、前記文書上の前記可視オブジェクトの一致候補サブセ
    ットを生成する工程をさらに備える、請求項2に記載の方法。
  4. 前記コンピュータが前記テンプレート・ラスタ画像と前記プレフィルタリングされた文書ラスタ画像との前記画素の膨張処理を行う工程をさらに備える、請求項2に記載の方法。
  5. 前記プレフィルタリングされた可視オブジェクトの前記サブセット内に存在しない可視オブジェクトに対応する画素セットは、前記プレフィルタリングされた文書ラスタ画像から除去される、請求項1に記載の方法。
  6. 前記所定の基準のうちの1つは、前記可視オブジェクトが前記フィーチャ・セットの前記色リスト中の前記色のうちの1つに対応する色値を有することである、請求項1に記載の方法。
  7. 前記コンピュータが前記色リスト中の前記色のうちの1つの選択を受け取る工程をさらに備え、
    前記所定の基準は、前記可視オブジェクトが前記色リスト中の前記色のうちの選択された前記1つに対応する色値を有することである、
    請求項6に記載の方法。
  8. 前記所定の基準のうちの1つは、前記可視オブジェクトが前記フィーチャ・セットの前記境界定義以下の長さを有することである、請求項1に記載の方法。
  9. 前記境界定義は、前記対応するオブジェクト構成要素の長さと高さとのうちの大きい方である、請求項8に記載の方法。
  10. 前記境界定義に回転許容係数が乗算される、請求項8に記載の方法。
  11. 前記所定の基準のうちの1つは、前記可視オブジェクトがラスタ成分を含むことであり、前記可視オブジェクトは前記ラスタ成分により前記補助ラスタ成分交差フラグを設定することについて評価される、請求項1に記載の方法。
  12. 前記コンピュータが前記テンプレート可視オブジェクトから異なる角度オフセットで複数の回転されたテンプレート可視オブジェクトを生成する工程をさらに備える、請求項1に記載の方法。
  13. 前記コンピュータが前記プレフィルタリングされた文書ラスタ画像と前記プレフィルタリングされた文書ラスタ画像との前記画素の膨張処理を行う工程をさらに備える、請求項1に記載の方法。
  14. 文書上の可視オブジェクトのコンピュータ化された検索のために、可視オブジェクトをプレフィルタリングする方法であって、
    コンピュータが前記文書のサブセクションからのテンプレート可視オブジェクト領域の選択を受け取る工程であって、前記テンプレート可視オブジェクト領域は、連結された画素の1つまたは複数のシーケンスによって定義され、画素は各々色値を有する、工程と、
    前記コンピュータが前記テンプレート可視オブジェクト領域内の前記画素の各々からの前記色値のヒストグラムを生成する工程と、
    前記コンピュータが前記文書からプレフィルタリングされた文書ラスタ画像を生成する工程であって、前記文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み、前記プレフィルタリングされた文書ラスタ画像におけ
    る前記画素は、前記色値のピークの所定の範囲内に存在する、工程と、
    を備える、方法。
  15. 前記コンピュータが前記テンプレート可視オブジェクト領域および前記文書をグレースケールに変換する工程であって、前記色値の各々は強度値に換算される、工程をさらに備える、請求項14に記載の方法。
  16. 前記コンピュータが前記色値の前記ピークの前記所定の範囲を再定義する入力を受け取る工程をさらに備える、請求項14に記載の方法。
  17. 前記コンピュータが前記テンプレート可視オブジェクト領域と前記プレフィルタリングされた文書ラスタ画像との前記画素の膨張処理を行う工程をさらに備える、請求項14に記載の方法。
  18. 前記コンピュータが、前記テンプレート可視オブジェクト領域と前記プレフィルタリングされた文書ラスタ画像との比較に基づいて、前記文書上の前記可視オブジェクトの一致候補サブセットを生成する工程をさらに備える、請求項14に記載の方法。
  19. 文書上の可視オブジェクトのコンピュータ化された検索のために、可視オブジェクトをプレフィルタリングする方法であって、
    コンピュータが前記文書のサブセクションからのテンプレート可視オブジェクトの選択を受け取る工程であって、前記テンプレート可視オブジェクトは、1つまたは複数のオブジェクト構成要素によって定義される、工程と、
    前記コンピュータが前記テンプレート可視オブジェクトのフィーチャ・セットを得る工程であって、前記フィーチャ・セットは、前記オブジェクト構成要素を定義する色の色リストを含む、工程と、
    前記コンピュータが前記文書上の前記可視オブジェクトから、プレフィルタリングされた可視オブジェクトのサブセットを生成する工程であって、前記プレフィルタリングされた可視オブジェクトは、前記色リストに基づく所定の基準に一致する、工程と、
    前記コンピュータが前記文書からプレフィルタリングされた文書ラスタ画像を生成する工程であって、前記文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み、前記画素セットは、前記プレフィルタリングされた可視オブジェクトの前記サブセットに対応する、工程と、
    を備える方法。
  20. 文書上の可視オブジェクトのコンピュータ化された検索のために、可視オブジェクトをプレフィルタリングする方法であって、
    コンピュータが前記文書のサブセクションからのテンプレート可視オブジェクトの選択を受け取る工程であって、前記テンプレート可視オブジェクトは、1つまたは複数のオブジェクト構成要素によって定義される、工程と、
    前記コンピュータが前記テンプレート可視オブジェクトのフィーチャ・セットを得る工程であって、前記フィーチャ・セットは、前記オブジェクト構成要素の境界定義を含む、工程と、
    前記コンピュータが、前記文書上の前記可視オブジェクトから、プレフィルタリングされた可視オブジェクトのサブセットを生成する工程であって、前記プレフィルタリングされた可視オブジェクトは、前記境界定義に基づく所定の基準に一致する、工程と、
    前記コンピュータが前記文書からプレフィルタリングされた文書ラスタ画像を生成する工程であって、前記文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み、前記画素セットは、前記プレフィルタリングされた可視オブジェクトの前記サブセットに対応する、工程と、
    を備える方法。
  21. 文書上の可視オブジェクトのコンピュータ化された検索のために、可視オブジェクトをプレフィルタリングする方法であって、
    コンピュータが前記文書のサブセクションからのテンプレート可視オブジェクトの選択を受け取る工程であって、前記テンプレート可視オブジェクトは、1つまたは複数のオブジェクト構成要素によって定義される、工程と、
    前記コンピュータが前記テンプレート可視オブジェクトのフィーチャ・セットを得る工程であって、前記フィーチャ・セットは、補助ラスタ成分交差フラグを含む、工程と、
    前記コンピュータが、前記文書上の前記可視オブジェクトから、プレフィルタリングされた可視オブジェクトのサブセットを生成する工程であって、前記プレフィルタリングされた可視オブジェクトは、前記フィーチャ・セットの前記補助ラスタ成分交差フラグに基づく所定の基準に一致する、工程と、
    前記コンピュータが前記文書からプレフィルタリングされた文書ラスタ画像を生成する工程であって、前記文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み、前記画素セットは、前記プレフィルタリングされた可視オブジェクトの前記サブセットに対応する、工程と、
    を備える方法。
  22. データ処理装置によって読取可能な非一時的なプログラム記憶媒体であって、前記媒体は、文書上の可視オブジェクトのコンピュータ化された検索のために、可視オブジェクトをプレフィルタリングする方法を実行するように前記データ処理装置によって実行可能な命令からなる1つまたは複数のプログラムを含み、前記方法は、
    前記文書のサブセクションからのテンプレート可視オブジェクトの選択を受け取る工程であって、前記テンプレート可視オブジェクトは、1つまたは複数のオブジェクト構成要素によって定義される、工程と、
    前記テンプレート可視オブジェクトのフィーチャ・セットを得る工程であって、前記フィーチャ・セットは、前記オブジェクト構成要素を定義する色の色リストと、前記オブジェクト構成要素の境界定義と、補助ラスタ成分交差フラグとのうちの少なくとも1つを含む、工程と、
    前記文書上の前記可視オブジェクトから、プレフィルタリングされた可視オブジェクトのサブセットを生成する工程であって、前記プレフィルタリングされた可視オブジェクトは、前記フィーチャ・セットの前記色リストと、前記境界定義と、前記補助ラスタ成分交差フラグとのうちの少なくとも1つに基づく所定の基準のうちの少なくとも1つに一致する、工程と、
    前記文書からプレフィルタリングされた文書ラスタ画像を生成する工程であって、前記文書ラスタ画像は、隣接する画素の1つまたは複数の連結されたシーケンスからなる画素セットを含み、前記画素セットは、前記プレフィルタリングされた可視オブジェクトの前記サブセットに対応する、工程と、
    を備えるプログラム記憶媒体
JP2015555998A 2013-01-31 2013-11-21 文書の可視オブジェクト検索のためのプレフィルタリング Active JP6151802B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/756,299 2013-01-31
US13/756,299 US9846707B2 (en) 2013-01-31 2013-01-31 Method for color and size based pre-filtering for visual object searching of documents
PCT/US2013/071302 WO2014120330A1 (en) 2013-01-31 2013-11-21 Pre-filtering for visual object searching of documents

Publications (2)

Publication Number Publication Date
JP2016505187A JP2016505187A (ja) 2016-02-18
JP6151802B2 true JP6151802B2 (ja) 2017-06-21

Family

ID=51224164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015555998A Active JP6151802B2 (ja) 2013-01-31 2013-11-21 文書の可視オブジェクト検索のためのプレフィルタリング

Country Status (6)

Country Link
US (1) US9846707B2 (ja)
EP (1) EP2951757A4 (ja)
JP (1) JP6151802B2 (ja)
AU (2) AU2013376863B2 (ja)
CA (1) CA2898806C (ja)
WO (1) WO2014120330A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10409900B2 (en) * 2013-02-11 2019-09-10 Ipquants Limited Method and system for displaying and searching information in an electronic document
US20160259819A1 (en) 2013-06-18 2016-09-08 Blink Forward, L.L.C. Error identification, indexing and linking construction documents
US9292510B2 (en) 2013-06-18 2016-03-22 Blink Forward, L.L.C. Systems and methods for indexing and linking electronic documents
US9990340B2 (en) * 2014-02-03 2018-06-05 Bluebeam, Inc. Batch generation of links to documents based on document name and page content matching
US10713015B2 (en) * 2016-05-15 2020-07-14 Servicenow, Inc. Visual programming system

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611622B1 (en) * 1999-11-23 2003-08-26 Microsoft Corporation Object recognition system and process for identifying people and objects in an image of a scene
US7149356B2 (en) * 2002-07-10 2006-12-12 Northrop Grumman Corporation System and method for template matching of candidates within a two-dimensional image
US7162084B2 (en) * 2003-01-29 2007-01-09 Microsoft Corporation System and method for automatically detecting and extracting objects in digital image data
GB0326374D0 (en) 2003-11-12 2003-12-17 British Telecomm Object detection in images
US20050227217A1 (en) * 2004-03-31 2005-10-13 Wilson Andrew D Template matching on interactive surface
JP2006221525A (ja) * 2005-02-14 2006-08-24 Chuden Gijutsu Consultant Kk オブジェクト検索システムおよび方法
US8732025B2 (en) * 2005-05-09 2014-05-20 Google Inc. System and method for enabling image recognition and searching of remote content on display
TWI403912B (zh) 2006-06-08 2013-08-01 Univ Nat Chiao Tung 圖像檢索之方法及系統
US8219543B2 (en) 2006-06-12 2012-07-10 Etrial Communications, Inc. Electronic documentation
WO2008064378A1 (en) 2006-11-21 2008-05-29 Cameron Telfer Howie A method of retrieving information from a digital image
US8098936B2 (en) * 2007-01-12 2012-01-17 Seiko Epson Corporation Method and apparatus for detecting objects in an image
US8508823B2 (en) 2007-03-28 2013-08-13 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image forming apparatus, and recording medium
US7899248B2 (en) 2007-08-30 2011-03-01 Seiko Epson Corporation Fast segmentation of images
US20090112861A1 (en) 2007-10-30 2009-04-30 Honeywell International, Inc. Non-word or non-number search
US8131018B2 (en) * 2008-02-08 2012-03-06 Tk Holdings Inc. Object detection and recognition system
US7925653B2 (en) * 2008-02-27 2011-04-12 General Electric Company Method and system for accessing a group of objects in an electronic document
US20110078552A1 (en) 2009-09-29 2011-03-31 John William Lumley Transclusion Process
EP2395452A1 (en) 2010-06-11 2011-12-14 Toyota Motor Europe NV/SA Detection of objects in an image using self similarities
US8285074B2 (en) 2010-09-01 2012-10-09 Palo Alto Research Center Incorporated Finding low variance regions in document images for generating image anchor templates for content anchoring, data extraction, and document classification
US8737746B2 (en) * 2011-01-31 2014-05-27 Bluebeam Software, Inc. Method for multiple pass symbol and components-based visual object searching of documents
US9036925B2 (en) 2011-04-14 2015-05-19 Qualcomm Incorporated Robust feature matching for visual search

Also Published As

Publication number Publication date
CA2898806C (en) 2019-04-02
EP2951757A1 (en) 2015-12-09
AU2019229348A1 (en) 2019-10-03
US20140214864A1 (en) 2014-07-31
CA2898806A1 (en) 2014-08-07
US9846707B2 (en) 2017-12-19
AU2013376863B2 (en) 2019-06-20
JP2016505187A (ja) 2016-02-18
AU2013376863A1 (en) 2015-07-30
AU2019229348B2 (en) 2021-07-15
WO2014120330A1 (en) 2014-08-07
EP2951757A4 (en) 2016-11-02

Similar Documents

Publication Publication Date Title
AU2019229348B2 (en) Pre-filtering for visual object searching of documents
US8823744B2 (en) Method for indicating annotations associated with a particular display view of a three-dimensional model independent of any display view
CA2903818C (en) Method for emphasizing differences in graphical appearance between an original document and a modified document with annotations
JP5532740B2 (ja) 文書処理装置、及び文書処理プログラム
US20210200397A1 (en) Method for automatically indexing an electronic document
AU2011357672B2 (en) A method for multiple pass symbol and components-based visual object searching of documents
US10936172B2 (en) Method of computerized presentation of a document set view for auditing information and managing sets of multiple documents and pages
JP2013008170A (ja) ページレイアウト編集方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170321

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170525

R150 Certificate of patent or registration of utility model

Ref document number: 6151802

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S633 Written request for registration of reclamation of name

Free format text: JAPANESE INTERMEDIATE CODE: R313633

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250