JP2011028749A - レイアウトに基づく文書検索およびランク付けのためのスケーラブルな索引付け - Google Patents

レイアウトに基づく文書検索およびランク付けのためのスケーラブルな索引付け Download PDF

Info

Publication number
JP2011028749A
JP2011028749A JP2010162601A JP2010162601A JP2011028749A JP 2011028749 A JP2011028749 A JP 2011028749A JP 2010162601 A JP2010162601 A JP 2010162601A JP 2010162601 A JP2010162601 A JP 2010162601A JP 2011028749 A JP2011028749 A JP 2011028749A
Authority
JP
Japan
Prior art keywords
document
index
layout
block
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010162601A
Other languages
English (en)
Other versions
JP2011028749A5 (ja
JP5378315B2 (ja
Inventor
Loic Lecerf
レセルフ ロイック
Boris Chidlovskii
チドロフスキー ボリス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2011028749A publication Critical patent/JP2011028749A/ja
Publication of JP2011028749A5 publication Critical patent/JP2011028749A5/ja
Application granted granted Critical
Publication of JP5378315B2 publication Critical patent/JP5378315B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】順序付きリストを関連付けされたクライアント端末に出力するシステムを提供する。
【解決手段】複数の文書をコンピュータメモリに提供するステップと、提供された文書からレイアウトブロックを抽出するステップと、コンピュータプロセッサを用いて、レイアウトブロックを複数のレイアウトブロッククラスタにクラスタリングするステップと、レイアウトブロッククラスタの各々に対して代表ブロックを計算するステップと、文書のレイアウトブロックおよび計算された代表ブロックに基づいて各々の提供された文書に対して文書索引を生成するステップと、生成された文書索引を複数の文書索引クラスタにクラスタリングするステップと、文書索引クラスタの各々に対して代表クラスタ索引を生成するステップと、生成された文書索引、代表ブロック、文書索引クラスタ、および代表クラスタ索引をメモリへ出力するステップと、を含む方法とする。
【選択図】図6

Description

この例示的な実施形態は、文書に対する索引付けおよび問い合わせに関する。これは特に、文書レイアウトに基づく中〜大規模文書データベースへの問い合わせに用途があり、以下では特にこの用途に言及しながら説明を行なう。
今日多くの情報が電子形式で利用可能であって、個人、イントラネット、およびインターネット環境における文書群に格納されている。過去20年にわたり、フルテキストの索引付けおよび検索の分野において重要な発展が成し遂げられてきた。情報検索の最新技術により、ユーザーは1個または複数のキーワードを用いて文書群に問い合わせを行ない、関連する文書を取得してランク付けすることができる。ワールドワイドウェブ(ウェブ)において利用可能な文書の場合、Google、Yahoo、MSN等の検索エンジンがウェブを探索してPDFやWord文書と同様にウェブページに索引付けを行なう。検索エンジンは全ての文書タイプに対して、関連する文書を検索してランク付けするために、当該文書に含まれるテキストおよびリンク情報を利用する。しかし、文書に含まれるレイアウト情報は無視される。
米国特許第7,099,861号明細書 米国特許第7,475,061号明細書
上記にもかかわらず、ユーザーがテキスト情報ではなく視覚的情報を所有する場合、あるいはクエリをキーワードで表現することが困難または不可能な場合に、文書レイアウトを用いて文書群に問い合わせを行なうことは極めて有用であろう。これは、文書が請求書、伝票、定型書式、カタログ、履歴書、手紙等の一般的な構造を有する場合が多いオフィス環境において特に成り立つ。事務担当者にとって、レイアウトが所定の文書に類似した文書を探すことは好都合であろう。
実例に基づく問い合わせは、コンテンツに基づく画像取得との関連で広く用いられている。しかし、画像は本質的に複雑であるため、画像の解釈および意味論的索引付けは、完全画像マッチング、ロゴ認識等の特化したクエリタイプ、および空、花、または二輪車画像の認識等、よりカテゴリー化されたタスクに限定される。文書レイアウトによる問い合わせは、実例に基づくクエリの一形式と見なすことができる。しかし、それらの(意味論的)類似度による画像の正確な関連度のランク付けは、依然として現行システムの能力をはるかに超えている。
レイアウトによる文書群への問い合わせを行なう既存の方法は、各ペア(文書、クエリ)毎に、クエリと文書群内の各文書を2次元的に整列させる処理を含む高負荷な処理を必要とする。この整列アルゴリズムは時間が掛かり、従って整列に基づく手法は小〜中規模の文書群に限定される。極めて大規模な文書群では、ユーザーは多くの場合、関連する上位k個の文書を取得することに関心があるため、文書とクエリを網羅的に整列させるのは不要且つ時間の無駄である。
一態様において、文書群に対して文書レイアウトに従い索引の集合を生成するコンピュータ実装された方法を提供する。本方法は、複数の文書をコンピュータメモリに与えるステップと、提供された文書からコンピュータプロセッサを用いてレイアウトブロックを抽出するステップと、レイアウトブロックを複数のレイアウトブロッククラスタにクラスタリングするステップと、各レイアウトブロッククラスタに対して代表ブロックを計算するステップと、当該文書のレイアウトブロックおよび計算された代表ブロックに基づいて各提供された文書に対して文書索引を生成するステップと、生成された文書索引を複数の文書索引クラスタにクラスタリングするステップと、各文書索引クラスタに対して代表クラスタ索引を生成するステップと、生成された文書索引、代表ブロック、文書索引クラスタ、および代表クラスタ索引をメモリに出力するステップとを含んでいる。
本方法の一態様において、生成された文書索引を文書索引クラスタにクラスタリングするステップは、生成された文書索引をm’個の文書索引クラスタにクラスタリングするステップを含んでおり、ここに
Figure 2011028749
であって、Nはコンピュータメモリに与えられた文書の数である。
生成された文書索引を文書索引クラスタにクラスタリングするステップおよびレイアウトブロックをレイアウトブロッククラスタにクラスタリングするステップの少なくとも一方は、以下のアルゴリズム、すなわちk平均クラスタリングアルゴリズム、および/または階層的クラスタリングアルゴリズムの1個を使用するステップを含んでいてよい。
各代表文書索引は、代表文書索引が計算される文書索引クラスタ内の全ての文書索引に対して平均化関数を用いて計算することができる。
提供された文書からレイアウトブロックを抽出するステップは、文書ページ上の各レイアウトブロックの大きさおよび位置を定義する位置情報を抽出するステップを含んでいてよい。
各レイアウトブロックは矩形であってよく、当該文書内のテキストまたは画像のブロックの境界を定義する最小の高さおよび幅を有していてよい。
各レイアウトブロッククラスタに対して代表ブロックを計算するステップは、共に代表ブロックの位置および形状を定義する第1の位置および第2の位置を計算するステップを含んでいてよく、代表ブロックの第1の位置はクラスタ内の各レイアウトブロックの第1の位置の関数として計算され、代表ブロックの第2の位置はクラスタ内の各レイアウトブロックの第2の位置の関数として計算され、各レイアウトブロックの第1の位置および第2の位置は合わせてレイアウトブロックの位置および形状を定義する。
計算された類似度に基づいて文書索引を生成するステップは、以下の関数の一方を使用するステップを含んでいてよい。
Figure 2011028749
および
Figure 2011028749
ここに、nは文書内のレイアウトブロックの数、mは代表ブロックの数、i=1〜n、j=1〜m、vijは値のベクトルであって、各値はレイアウトブロックと代表ブロックと間の計算された類似度を表し、文書索引はm個の要素を含むベクトルであって、各要素はw(j=1〜m)に等しい。
文書索引内の値は、各代表ブロックに関連付けされたブロックの相対的な数の関数として重み付けされていてよい。
提供された文書内のレイアウトブロックと代表ブロックとの類似度を計算するステップは、当該レイアウトブロックと代表ブロックとの間の距離尺度を計算するステップを含んでいてよい。
距離尺度を計算するステップは、レイアウトブロックを定義する第1の位置とこれに対応して代表ブロックを定義する第1の位置との間、およびレイアウトブロックを定義する第2の位置とこれに対応して代表ブロックを定義する第2の位置との間のマンハッタン距離の関数を計算するステップを含んでいてよい。
提供された文書内の各レイアウトブロックと各代表ブロックとの類似度を計算するステップは、レイアウトブロックと代表ブロックの重なりの範囲を決定するステップを含んでいてよい。
属性値は、レイアウトブロックの形状比に基づく第1の属性値、レイアウトブロックと代表ブロックとの間の重なり距離に基づく第2の属性値、ブロックの種類に基づく第3の属性、およびこれらの組合せから選択されていてよい。
別の態様において、文書レイアウトに従い文書群への問い合わせを行なうコンピュータ実装された方法を提供する。本方法は、各代表ブロックが文書群内の文書から抽出されたレイアウトブロックの各クラスタを代表している代表ブロックの集合、各文書索引が文書群内の各文書のレイアウトブロックを代表すると共に各文書索引が文書索引クラスタの集合の1個づつに割り当てられている文書索引の集合、および各代表文書索引が文書索引クラスタに割り当てられた文書索引から導出されている各文書索引クラスタに対する代表文書索引をコンピュータメモリに提供するステップと、入力文書レイアウトクエリからレイアウトブロックを抽出するステップと、文書レイアウトクエリから抽出されたレイアウトブロックを代表ブロックの集合に射影させてクエリ文書索引を生成するステップと、コンピュータプロセッサを用いて、クエリ文書索引と代表文書索引の集合内の代表文書索引との類似度を計算するステップと、クエリ文書索引との類似度が最大であると判定された代表文書索引を含む最上位文書索引クラスタを識別するステップと、最上位文書索引クラスタ内の各文書索引とクエリ索引との類似度を計算して類似度が最大である文書の集合を識別するステップと、類似度が最大である文書の集合内の文書に関する情報を出力するステップとを含む。
別の態様において、文書レイアウトに従い文書群への問い合わせを行なうコンピュータ搭載されたシステムを提供する。本システムは、文書索引の集合、代表ブロックの集合、文書索引クラスタの集合、代表索引の集合、および文書レイアウトクエリをメモリに受け入れるべく構成されたデータ入力モジュールと、文書レイアウトクエリからレイアウトブロックを抽出し、文書レイアウトクエリから抽出されたレイアウトブロックを代表ブロックの集合に射影させてクエリ索引を生成し、ランク付け関数を用いてクエリ索引と文書索引クラスタの集合内の各代表索引との類似度を計算し、類似度が最大である代表索引を含む文書索引クラスタを最上位文書索引クラスタとして識別し、ランク付け関数を用いて最上位文書索引クラスタ内の各文書索引とクエリ索引との類似度を計算すべく構成された文書クエリモジュールと、最上位文書索引クラスタ内の各文書索引とクエリ索引の間で計算された類似度に基づいて上位k個の文書の順序付きリストを保持して、当該順序付きリストを出力すべく構成された文書ランク付けモジュールとを含む。
一態様において、本システムは順序付きリストを関連付けされたクライアント端末に出力することができる。
クライアント端末は、システムに対し順序付きリストから取得する少なくとも1個の文書を識別することができ、本システムはクライアント端末に少なくとも1個の文書を提供する。
本システムは更に、タッチスクリーンを含んでいてよく、文書レイアウトクエリはタッチスクリーンを用いて生成することができる。
索引付けを行なう文書群の一部である入力電子文書のページの一例を示す概念図である。 例示的な実施形態と整合すべくテキストおよび画像ブロックの概要を表す図1の入力文書を示す概念図である。 テキストおよび画像コンテンツを除外した状態で図2の入力文書を示す概念図であり、ブロックは次いで索引付けアルゴリズムに入力される。 文書レイアウト索引付けシステムの機能ブロック図である。 図4の文書レイアウト索引付けシステムと連動して利用できる、文書クエリおよびランク付けシステムの機能ブロック図である。 文書レイアウトの文書群への索引付けを行なう方法を示すフロー図である。 図6の方法で実行可能な、抽出されたレイアウトブロックの集合から代表ブロックを生成する方法を示す詳細フロー図である。 所与の文書レイアウトに基づいて文書への問い合わせおよびランク付けを行なう方法を示すフロー図である。 図4の文書レイアウト索引付けシステムにより生成されたブロッククラスタおよび代表ブロックのグラフである。 図4の文書レイアウト索引付けシステムにより生成されたブロッククラスタおよび代表ブロックのグラフである。 クライアント端末と文書クエリシステムとの間の通信用の機能ブロック図である。
この例示的な実施形態の態様は、文書レイアウトに従い文書の索引付けおよびクエリを行なうシステムおよび方法に関する。クラスタリングおよび「代表ブロック」の概念を用いることにより、本方法は全ての索引付けされた文書に対してクエリ文書を比較することを回避できる。
本明細書で用いる「文書」という用語は、PDF、TIFF、BMPまたはMicrosoft Office(登録商標)文書等、任意の適当な形式の電子文書であってよく、画像、テキスト、またはこれらの組合せを含んでいてよい。画像は、写真、グラフィックス等であってよい。
以下により詳細に述べるように、各文書の整列に基づいて文書群に索引付けを行なう例示的な方法は以下を含んでいてよい。
最初に、文書群の各文書のレイアウトを当該文書から抽出する。レイアウトは、所与の文書内のテキストおよび画像の配列により定義される。概念的には、レイアウトとは1個の文書に配置された1個以上の「ブロック」であって、各ブロックが隣接するテキストおよび/または画像を含んでいるものと見なすことができる。各ブロックは、当該ブロックに含まれるテキストまたは画像の境界を完全に定義するのに必要な最小の領域を有している。このように、第1のステップは、文書群の各文書から全ての「ブロック」を抽出するステップを含んでいて、各ブロックは当該ブロックの大きさおよびページ位置を定義するのに十分な位置情報、例えば左上および右下隅を表す2個の点の組、を含んでいる。レイアウトの抽出は、1文書内の全ての視覚的に表示された情報を各ブロックに割り当てることを意図している。一般に、各ページは少なくとも2個、一般的には少なくとも3個のブロックを含んでいる。ブロックの数は1ページ当たり最大約50個まであってよい。
次に、抽出されたレイアウトブロックのグループ全体を、位置情報に基づいてクラスタリングアルゴリズムに従い所定の数のクラスタにグループ化する。所定の数は、文書群の大きさや所望の結果等の各種の要因に応じて異なっていてよい。データをクラスタリングする適当な方法としてk平均および/または階層的クラスタリングアルゴリズム等の例示的なクラスタリングアルゴリズムを用いてよい。階層的クラスタリングアルゴリズムを用いている方法ではクラスタの階層が構成される。http://en.wikipedia.org/wiki/Hierarchical_clusteringを参照されたい。k平均法ではクラスタの数mを選択する。mは例えば約10〜30の範囲であってよい。しかし、現在使用されているかまたは将来考案される他の任意のクラスタリングアルゴリズムを用いてもよい。
各レイアウトブロッククラスタは、異なる文書から抽出された複数のブロックを含むことになる。速度および効率を向上させるべく、クラスタ内の全てのレイアウトブロックを数学的に代表する「代表ブロック」を各クラスタについて計算する。各レイアウトブロッククラスタはちょうど1個の代表ブロックを有することになる。
次いで、代表ブロックの文書群に関して文書群内の各文書について文書索引Dを生成する。文書索引は、特に当該文書内の各ブロックと各代表ブロックとの間の距離または類似度を射影または測定することにより生成され、同一ブロック間の距離はゼロである。2個のブロック間の距離に対して任意の適当な尺度を考慮することができる。関心対象ブロックをb=(p11,p12)、代表ブロックをb=(p21,p22)と表すことができ、ここにp11は第1ブロックの第1の位置(すなわち左上位置)、p21は第2ブロックの第1の位置、p12は第1ブロックの第2の位置(すなわち右下位置)、p22は第2ブロックの第2の位置である。
例示的な距離尺度の一つとしてマンハッタン距離があり、以下のように定義できる。
Figure 2011028749
ここに、d(p,p)=|x−x|+|y−y|は2個の位置p,p間のマンハッタン距離であり、各位置pは2個の座標(x,y)により定義される。
別の適当な距離尺度として、2個のブロック間の重なり距離があり、以下のように両者の重なり面積により与えられる。
Figure 2011028749
ここに、演算(b^b)は2個のブロックbとbの重なりを与え、area(p,p)=|x−x|×|y−y|である。
別の適切な距離尺度は、ブロック位置を取り、位置情報および少なくとも1個の属性要素のシーケンスを含むタプル(集合)を生成することにより、形状、タイプ等の他の属性と共に拡張する。例えば、ov、ra、およびtpの全を考慮する場合、1個のブロックを表すタプルtは以下の形式で与えることができる。
Figure 2011028749
ここに、x ,y ,x ,y は正規化されたx,y,x,yの値、例えば[0,1]の範囲に正規化された値である。
raは|x−x|/|y−y|で与えられる形状比であって、正方形の形状は0.5である一方、垂直および水平ブロックは各々0および1となるように正規化されていう。
ovは重なり距離d(b1,b2)、但しdは重なり距離尺度関数ある。
tpはブロックの種類である。例えばテキストブロックは0、画像ブロックは1である。
以下で理解されるように、タプルには3個より多いまたは少ない属性要素、例えば1、2、4個またはそれより多くの属性要素を含んでいてよい。2個のブロックbおよびbの場合、両者の間のタプル距離を、両者のタプルtおよびtに対して標準の余弦関数を用いて評価できる。ベクトル間の距離を測定するのに適している他の距離尺度を考慮してもよい。
これらの距離機能の任意のものを例示的な実施形態に用いて各ブロックの距離尺度を生成することができる。文書索引は、文書内の各ブロックと各代表ブロックとの全ての距離尺度を含む連接(concatenation)またはマトリクスであってよい。
また、文書索引の集合は、それ自体クラスタリングアルゴリズムを用いてクラスタ化され、各文書索引クラスタ(Dクラスタ)に対して「代表文書索引」が計算される。代表文書索引は、クラスタ内の全ての文書索引の数学的表現である。文書索引のクラスタ毎に1個の代表文書索引が存在する。ブロックのクラスタリングに関して、文書索引クラスタの数m’は、文書の数の二乗根のように文書群内の文書数に基づいて選択できる。
文書レイアウトクエリに従い文書の問い合わせおよびランク付けを行なう例示的な方法は以下のステップを含んでいてよい。
最初に、マッチングすべきサンプル文書またはレイアウトクエリQを受け取り、そこからレイアウトブロックを抽出する。レイアウトクエリは、ユーザー(人間その他)が文書群内で探したいブロックを表しているデータの集合である。レイアウトブロックは、任意の適当な方法でコンピュータシステムに入力されてよい。例えば、ユーザーがタッチスクリーン等の適当な装置の上にブロックを描画することによりレイアウトクエリを作成したり、ユーザーがマウス等のコンピュータ入力装置を用いてレイアウトブロックを描画することができる。あるいは、ユーザーが各ブロックの2個の位置のx、y座標等の位置情報を入力することができる。別の実施形態において、ユーザーが文書をスキャンしてメモリに入力し、システムがスキャンされた文書から境界ブロックを抽出して、抽出されたブロックをレイアウトクエリとして使用可能にすることができる。
次に、Qから抽出されたレイアウトブロックb、b等は以下に詳述するように、索引付け方法で文書群から生成された代表ブロックへ射影される。この結果、クエリレイアウトと類似した文書レイアウトの検索に使用できるクエリ文書索引が得られる。
クエリ文書索引は次いで、後述するようにランク付け関数を用いて各代表文書索引と比較される。クエリ索引との類似度が最大であると判定された代表文書索引を有する文書索引クラスタが選択される。次いで、選択された文書索引クラスタ内の全ての文書索引を、上で用いたランク付け関数を介してクエリ索引と比較される。各々の比較を行なわれるにつれて、(類似度の順に)最上位のランク付けされた文書索引がクエリの結果として返されるように順序付きリストが保持される。
例示的な実施形態の態様を説明すべく、図1に文書群400(図4)に含まれるサンプル文書100を示す。サンプル文書100は単一ページで構成され、任意の仕方で配置されたテキスト110および画像112の両方を含んでいてよい。実施形態を例示的するために複数ページの文書を複数の個別ページ100に分割している。
図2、3に、レイアウトブロック102、104が計算された後の図1のサンプル文書100を示す。この計算は、文書から境界ブロックを抽出するのに適した任意の装置により実行可能である。例えば、PDFからXMLへの標準的な変換ソフトウェア、並びに他のPDF、Word、およびPostScriptソフトウェアパッケージ等、そのような処理を実行可能な多くのソフトウェアソリューションが存在する。また、これらのソフトウェアパッケージは、空白、ボックス型(画像対テキスト)、色、テキストサイズ等の複数のパラメータに基づいてレイアウトブロック102を計算すべく調整可能である。これら例示的なレイアウトブロックは常に矩形であって、互いに重なり合っていてよい。
数学的表現として、Sは文書レイアウトの文書群を表し、各文書レイアウトDが矩形ブロックの集合により与えられ、各ブロックはテキストまたは少なくとも1個の画像のいずれかを含んでいて、その位置、形状、大きさ、ブロックコンテンツ(すなわち画像またはテキスト)等の1個以上により定義される。各文書レイアウトDはブロックの集合D={b,...,b)により与えられ、各ブロックbは2個の位置(p,p)により定義される。この例示的な実施形態において、2個の位置はブロックbの左上および右下隅を表し、ここにp=(x,y)且つp=(x,y)であって一例としてブロック104に示す。xおよびyは各々当該文書の水平および垂直座標であって、当該文書の左上隅等の固定位置から測定されてよい。
図4に、文書群400に含まれる文書からのレイアウトブロックに索引付けする例示的なシステム404を示す。システム404は、文書群400を受信するための入力装置402を含んでいる。
システム404は、処理されている入力文書群400(またはその一部)を格納するデータメモリ418を含んでいる。本システムの主メモリ406は、ブロック抽出モジュール408、ブロッククラスタリングモジュール409、代表ブロック計算モジュール410、文書索引付けモジュール412、および索引クラスタリングモジュール413を格納する。ブロック抽出モジュール408は、文書群400内の各文書100からレイアウトブロック102、104を抽出する。ブロック抽出モジュール408は、境界ブロックを文書から抽出するのに適した任意のモジュールであってよい。あるいは、カスタムブロック抽出モジュールが実装されていてもよい。ブロッククラスタリングモジュール409は、ブロック抽出モジュール408から抽出されたブロック102、104を所定の数であるk個クラスタにクラスタリング(すなわち「グループ化」)する。代表ブロック計算モジュール410は、ブロッククラスタリングモジュール409により生成された各クラスタ(図9、10の項目900)に対する代表ブロック(図9、10の項目904)を計算する。文書索引付けモジュール412は、文書内のブロック102、104を代表ブロック計算モジュール410により生成された各代表ブロック(図9、10の項目904)と比較することにより、文書群400からの各文書100に対して文書索引を生成する。索引クラスタリングモジュール413は次いで、文書索引付けモジュール412により計算された文書索引を将来使用すべくクラスタリングする。ブロック抽出モジュール408、ブロッククラスタリングモジュール409、代表ブロック計算モジュール410、文書索引付けモジュール412、および索引クラスタリングモジュール413は、ハードウェアまたはソフトウェアあるいはその組合せとして実装されていてよい。この例示的な実施形態において、これらの構成要素408、409、410、412、413は主メモリ406に保存されたソフトウェア命令の形式であって、メモリ406と通信状態にあるコンピュータプロセッサ416により実行される。コンピュータのCPU等であるプロセッサ416は、メモリ406に保存された処理命令を実行することによりコンピュータシステム404の動作全体を制御することができる。コンピュータシステムの構成要素406、416、418は、データ制御バス414を介して接続されていてよい。
例示的なシステム404は出力装置420を含んでいて、メモリ406に常駐するモジュール408、409、410、410、412、413により生成された文書索引の集合422を出力する。文書群内の文書の文書索引の集合422は、RAMメモリ406、418にローカルに保存されていても、あるいはハードディスクまたはデータベース等の記憶装置に保存されて、索引が生成された各文書に何らかの方法でリンクされていてもよい。
図5に、入力文書レイアウトDに基づいて文書への問い合わせおよびランク付けを行なう例示的なシステム506を示す。システム506は、レイアウトクエリQ500と、文書索引、代表ブロック、文書索引クラスタ(Dクラスタ)、および代表文書索引の集合422の両方を受信する入力装置504を含んでいる。レイアウトクエリ500を入力する前に、当該文書群の文書索引の集合、代表ブロック、Dクラスタ、および代表索引422は、ROMまたはRAMドライブ等の任意の適当な物理的媒体に格納されて、あるいは例えばインターネットまたはネットワークを介した搬送波の形式で本システムに入力されてもよい。あるいは、レイアウトクエリ500および文書索引、代表ブロック、索引Dクラスタ、および代表索引の集合422は、計算装置506自体(すなわち、装置506は文書レイアウト索引付けシステム404を含んでいてよい)の内部で生成される。入力装置504は、モデム接続、有線または無線接続、USBポート、フロッピー(登録商標)またはハードディスクのスロット等を含んでいてよい。
システム506は、入力されたレイアウトクエリ500が処理される間にこれを格納するデータメモリ522を含んでいる。文書索引、代表ブロック、Dクラスタ、および代表索引422の集合はまた、メモリ522または別個のメモリ等のコンピュータメモリに保存される。本システムの主メモリ508は、文書クエリモジュール510および文書ランク付けモジュール512を格納する。文書クエリモジュール510は、入力されたレイアウトクエリ500に類似する文書を表す可能性のある文書索引422の集合から1個以上の索引を識別する。文書ランク付けモジュール512は、1個以上のランク付け関数に従い、文書クエリモジュール510により識別された索引のランク付けを行なう。文書クエリモジュール510および文書ランク付けモジュール512は、ハードウェアまたはソフトウェアあるいはその組合せとして実装されていてよい。本実施形態において、文書クエリモジュール510および文書ランク付けモジュール512は、主メモリ508に保存されたソフトウェア命令を含んでいて、メモリ508へアクセス可能なコンピュータプロセッサ516により実行される。コンピュータのCPU等のプロセッサ516は、メモリ508に保存された処理命令を実行することにより、コンピュータシステム506の動作全体を制御することができる。コンピュータシステムの構成要素508、516、518は、データ制御バス514を介して接続されていてよい。
図5の例示的なシステム506は、出力装置518を含んでいて、レイアウトクエリ500に類似したレイアウトを有するとシステム506が認識したランク付けされた文書のリスト520を出力する。例示的な出力518は、画面またはモニタ等のディスプレイ524、ランク付けされた文書のリスト520を格納できるメモリストレージ、またはクライアント端末1100の1個以上へ有線または無線接続により接続されている。クエリを入力しているユーザーは、取得された文書をディスプレイ画面上で見て、それらが検索クエリに対応するものであるか否かを判定できる。対応していない場合、ユーザーはレイアウトクエリに属性を追加すること選択できる。
図4、5に示す例示的なシステム404、506は、単一の一体型システムとして組み合わされていてよい。
図6に、図4のシステムにより実行可能な、文書群内の複数の文書の索引を生成する方法を示す。本方法はS600から開始される。
S602において、文書群400からN個の文書100が入力装置402に与えられる(それらが既にシステム404へ入力されていない場合)。N個の文書100は、処理のためにシステムメモリ418またはデータメモリ406に取り込まれる。
S604において、ブロック抽出モジュール408は各文書100からレイアウトブロック102、104等を抽出して、集約されたブロックデータ(すなわち、全ての文書からの全てのブロック)をメモリ406、418に保存する。
S606において、ブロッククラスタリングモジュール409は代表ブロック計算モジュール410と連動して、ブロック抽出モジュール408により、メモリ406、418に格納された集約ブロックデータをクラスタリングして、各クラスタに対して代表ブロック904を生成する。代表ブロック904は、所与のクラスタ900内の全てのブロックの平均を表す場合がある。
S608において、文書100に含まれるレイアウトブロック102、104を代表ブロック904に射影することにより、文書群400内の各文書100に対して文書索引Dを生成する。
S608を説明するために、ブロック102、104の集合により文書レイアウトDが与えられると仮定する。ここに
Figure 2011028749
であり、nはレイアウト内のブロックの数である。各ブロックbに対して、代表ブロック
Figure 2011028749
(Bは代表ブロックBの集合内のブロックである)に対する類似度は、上述の式(2)または(3)の一方のようにブロック距離機能Dを用いて測定される。これによりマトリクス
Figure 2011028749
が得られ、ここにvij=1−D(b,B)、mはブロッククラスタ(または代表ブロック)の数である。以下のようにマトリクスV(d)をBに射影する2通りの方法がある。
第1の方法は、所与の代表ブロックBとのページブロックの全ての「重なり」を集約する機能を使用する。
Figure 2011028749
すなわち、所与のクラスタに対してV(d)マトリクスに含まれる全ての距離を合計して単一の値を求める。
第2の関数は、各代表ブロックBに対して最も近いブロックを決定し、索引値を選択されたページブロックと代表ブロックとの間の距離として設定する。
Figure 2011028749
Figure 2011028749
を計算し(文書のブロックを設定されたBに射影することにより)、オプションとしてより詳細な情報を用いて文書索引を拡張することができる。例えば、テキスト文書の索引付けに用いられる、一般的に用いられる「用語出現頻度―逆文書出現頻度」モデル(TF−IDF)と互換性を有する情報を追加することができる。TF−IDFモデルの説明はhttp://en.wikipedia.org/wiki/Tf−idfを参照されたい。本明細書に記述する例示的な実施形態において、(上で計算した)vijは、テキスト文書内の用語出現頻度と同様に代表ブロックB に関する代表ブロック
Figure 2011028749
の重みである。
このように、文書群400内のB の重要性に追加的な重みを与えることができる。bfが、ブロックbf=|C|)に関連付けられたブロックの数により与えられる代表ブロック頻度(BF)を表す場合、ブロック重み逆ブロック出現頻度(BWIBF)モデルを用いてレイアウトD内において次式のようにブロックbに重みbwibfijを割り当てることができる。
Figure 2011028749
ここに、Nは文書群400内の文書数であり、
i=1〜n、
j=1〜m、
nはクラスタ内のブロックの数、
mはブロッククラスタの数である。
更に、BWIBF索引値は式(4)または(5)を式(6)に適用して式(7)を導くことにより得られる。
Figure 2011028749
ここに、w’はwがBWIBF値により重み付けされた後のクラスタjに関する索引値である。
S610において、索引クラスタリングモジュール413は、ステップS608で生成された文書索引をm’個の文書索引クラスタ(Dクラスタ)にクラスタリングする。ここに、
Figure 2011028749
である。この例示的な実施形態において、モジュール413は、k平均法または階層的クラスタリングアルゴリズムのいずれかによりクラスタリングを実行するが、任意のクラスタリングアルゴリズムを用いてよい。
S612において、索引クラスタリングモジュール413により生成されたm’個のDクラスタ各々に対して代表索引を計算する。この索引は、Dクラスタ内の全ての索引の重心(例:平均)を計算することにより生成される。例えば、あるDクラスタが2個の索引、すなわち索引1={2、6、10、5}および索引2={6、12、8、11}を含んでいる場合、Dクラスタの代表索引は{4、9、9、8}となるであろう。
S614において、文書索引、代表ブロック、Dクラスタ、および代表Dクラスタ索引はメモリ406、418に格納されるかまたは記憶装置422へ出力される。
本方法はS616において終了する。
S606の特定の態様を図7に示し、以下に更に詳細に述べる。
ステップS606を実行する前に、文書群400からのN個の文書100がシステムメモリ406またはデータメモリ418に取り込まれていて、全てのレイアウトブロック102、104がメモリ406、418内のN個の文書100から抽出されている。ステップS700において、ブロッククラスタリングモジュール409は、メモリ406、418に含まれる全てのブロックに対してクラスタリングアルゴリズムを実行する。数学的表現として、Bは文書群400の文書のレイアウトSにおける全てのブロック102、104の集合を表し、すなわち
Figure 2011028749
である。Bに対して実行されるクラスタリングは例えば、所定のクラスタ数mを用いてk平均法アルゴリズムにより実行可能である。所定のクラスタ数mは、文書群の大きさ、抽出されるブロックの数、ブロック内での統計的変動等の要因に基づいて選択される。クラスタリングアルゴリズムが安定解に収束したならば、ブロックのクラスタ
Figure 2011028749
が得られる。
大多数のブロックが一意であって索引付けのために直接使用できず、異なるレイアウトに索引付けを行なうためにB内の個々のブロック全てを使用することは現実的でないため、代表ブロックの集合RBが構成される(1クラスタ毎に1個の代表ブロック)。S702に示すように、各クラスタ900、C={b}、に対して
Figure 2011028749
を用いて重心904が計算される。重心904は、クラスタ904内の各ブロックb902の対応する位置の本質的に平均である2個の位置(p1およびp2)で構成される。重心904が計算された後で、クラスタ900の代表ブロックB として設定される。図9、10に、サンプル文書群400から取られたブロック902のクラスタ900および対応する重心(すなわち代表ブロック)904の例を示す。
表1は、図6、7の文書索引付け処理を要約した例示的なアルゴリズムを含んでいる。
Figure 2011028749
図8に、入力クエリレイアウトを処理して、上位k個の一致する文書索引または対応する文書を生成する処理を示す。図に示す方法は、図5で記述したシステムにより実行可能である。本方法はS800から開始される。
S802において、レイアウトクエリ500と、文書索引、代表ブロック、索引Dクラスタおよび代表索引の集合422が入力装置504に与えられる(既にシステム506に入力されていない場合)。入力500、422は、処理のためにシステムメモリ508またはデータメモリ522に取り込まれる。
S804において、文書クエリモジュール510は、レイアウトクエリ500からレイアウトブロック102、104を抽出する。図2、3に関して上述したように、このステップは、文書から境界ブロックを抽出するのに適した任意の装置により実行可能である。例えば、PDFからXMLへの標準変換ソフトウェア、並びに他のPDF、Word、およびPostScriptソフトウェアパッケージ等、そのような処理を実行可能な多くのソフトウェアソリューションが存在する。また、これらのソフトウェアパッケージは、空白、ボックス型(画像対テキスト)、色、テキストサイズ等の複数のパラメータに基づいてレイアウトブロック102、104を計算すべく調整可能である。これら例示的なレイアウトブロックは常に矩形であって、互いに重なり合っていてよい。
S806において、文書クエリモジュール510は、レイアウトクエリ500に含まれる抽出されたレイアウトブロック102、104を、メモリに入力された代表ブロック904の集合に射影することにより、クエリレイアウトの索引Qを計算する。当該投影アルゴリズムは、S608の文書群索引に関して上述したものと同一である。クエリ索引Qが得られたならば、これを索引Dと比較することによりレイアウトクエリ500とDが表す文書100の類似度を判定することができる。数学的表現として、クエリQと文書Dの類似度は、代表ブロックの集合B、すなわち
Figure 2011028749
へのそれらの射影により近似される。ここに、クエリおよび文書索引はベクトル
Figure 2011028749
である。rank(Q,D)関数は単に標準の余弦関数として定義可能である。
Figure 2011028749
余弦関数は全ての文書に1(最適一致)と0の間の値を与えることにより、それらのランク付けを行なう。ある場合には、上式(8)を用いて文書DとクエリQの距離を近似することにより、以下の例に示すような若干の不規則性が生じることがある。簡便のため、k=2且つクエリ索引Q={0.86,0.0}であると仮定する。そのようなまばらなクエリ索引を用いれば、2個の文書D ={0.96,0.0}およびD ={0.46,0.0}は同じ余弦値1を与える一方でD は明らかにD より良いランク付けをなされるはずである。問題は、k次元空間において、2個の索引ベクトル間の角度はそれらの類似度の一部しか反映しないという事実から生じる。まばらな索引は特にこの問題の影響を受けやすい。
一実施形態において、まばらな索引の問題は、余弦に基づくランク付け関数を修正して索引の絶対値を積分することにより対処される。以下の関数は、クエリと文書ベクトルの差異により余弦を因数分解する。
Figure 2011028749
関数rankは完全一致の場合、1を与える。しかし、同じクエリ索引に対して、2個の文書D ={0.96,0.0}およびD ={0.76,0.0}が依然として同一ランクを割り当てることが判明している。従って、rank関数は更に次式のように修正することができる。
Figure 2011028749
但し、要素に基づく差異は高い方の値へバイアスされている。
Figure 2011028749
式(8)、(9)の最初の2個の関数とは異なり、式(10)、(11)における最後のランク関数が非対称である点に注意されたい。
従って、式(8)、(9)、および(10)のどのランク付け関数を用いてもレイアウト索引の類似度を比較可能であるが、ランク付け関数(10)がより良い結果をもたらす場合もある。
S808において、文書クエリモジュール510は、上述のランク関数(8)、(9)、および(10)の1個で用いて、レイアウトクエリ索引QとS802で入力された各々のDクラスタ代表索引(S612により計算済み)との間の距離(類似度)を計算する。文書クエリモジュール510はまた、類似度が最大であるDクラスタ代表索引を追跡して、対応するDクラスタを「最上位Dクラスタ」として指定する。最上位Dクラスタは、レイアウトクエリ索引Qと最も類似していると判定された索引Dのクラスタを含んでいる。
S810において、レイアウトクエリQに関して最上位Dクラスタ内の各Dのランクを計算する文書ランク付けモジュール512に制御が渡される。同時に、文書ランク付けモジュール512は、計算されたランクに応じて文書索引Dの順序付きリストを保持する。
S812において、文書ランク付けモジュール512は入出力装置518を介して、S810で生成された順序付きリストに従い上位k個の文書520のリスト等の応答文書を、ディスプレイ524、クライアント端末1100その他の人間可読インターフェースの1個以上に出力する。あるいは、文書ランク付けモジュールは上位k個の文書のリスト520ではなく、上位k個の文書100を出力してもよい。
本方法はS814において終了する。
表2は、図8の文書索引付け処理を要約したアルゴリズムを含んでいる。
Figure 2011028749
図9、10は、各々レイアウトブロック902のクラスタ900を示す。ここに、代表ブロック904はクラスタ900内の全てのブロック902の平均(ここで算術平均)として計算されている。
図11に、文書レイアウトにより文書クエリシステムへの問い合わせを行なう例示的なシステムを示す。本システムは、文書クエリシステム506、クライアント端末1100、ネットワーク接続1106、およびネットワークメッセージ500、520、1104、1102を含んでいる。文書クエリシステム506は、ネットワーク接続1106を介して少なくとも1個のクライアント端末1100に接続している。ネットワーク接続1106は、有線または無線であっても、恒久的接続または一時的接続であっても、あるいは共有バスを介したクライアント端末1100と文書クエリシステム506との間の直接接続であってもよい。文書クエリシステム506は更に、文書レイアウト索引付けシステム404を含んでいてよい。この例示的な実施形態において、クライアント端末1100のユーザーは、ネットワーク1106を介してレイアウトクエリ500を文書クエリシステム506へ送信する。文書クエリシステム506は次いで、レイアウトクエリ500を処理して、レイアウトクエリ500に最も良く一致するランク付けされたk個の文書520のリストを返す。クライアント端末1100は次いで、ユーザーが取得(または閲覧)したいと思われる文書100を示すネットワークメッセージ1104を文書クエリシステム506へ送信する。文書クエリシステムは次いで、要求された文書1104を取得して、ユーザーが使用すべくネットワーク1106を介してクライアント端末1100へ送る。クライアント端末は、取得された文書および/またはそのレイアウトを表示するための、およびクエリを作成するためのディスプレイ画面を含んでいてよい。
100 サンプル文書、102,104 レイアウトブロック、110 テキスト、112 画像、400 文書群、402 入力装置、404 文書レイアウト索引付けシステム、406 メモリ、408 ブロック抽出モジュール、409 ブロッククラスタリングモジュール、410 代表ブロック計算モジュール、412 文書索引付けモジュール、413 索引クラスタリングモジュール、414 バス、416 コンピュータプロセッサ、418 データメモリ、420 出力装置、422 文書索引,代表ブロック,索引Dクラスタ,および代表索引の集合、500 レイアウトクエリ、504 入力装置、506 文書問い合わせおよびランク付けシステム、508 メモリ、510 文書クエリモジュール、512 文書ランク付けモジュール、514 バス、516 コンピュータプロセッサ、519 出力装置、520 ランク付けされた文書のリスト、524 ディスプレイ、900 クラスタ、902 ブロック、904 重心、1100 クライアント端末、1102,1104 ネットワークメッセージ、1106 ネットワーク接続、P,P 位置。

Claims (4)

  1. 文書レイアウトに従い文書群の索引の集合を生成するコンピュータ実装された方法であって、
    複数の文書をコンピュータメモリに提供するステップと、
    前記提供された文書からレイアウトブロックを抽出するステップと、
    コンピュータプロセッサを用いて、前記レイアウトブロックを複数のレイアウトブロッククラスタにクラスタリングするステップと、
    前記レイアウトブロッククラスタの各々に対して代表ブロックを計算するステップと、
    前記文書のレイアウトブロックおよび前記計算された代表ブロックに基づいて各々の提供された文書に対して文書索引を生成するステップと、
    前記生成された文書索引を複数の文書索引クラスタにクラスタリングするステップと、
    前記文書索引クラスタの各々に対して代表クラスタ索引を生成するステップと、
    前記生成された文書索引、代表ブロック、文書索引クラスタ、および代表クラスタ索引をメモリへ出力するステップと、を含む方法。
  2. 文書索引を生成するステップが、
    各レイアウトブロック用のタプルおよび各代表ブロック用のタプルであって各々が各ブロックの位置情報および各ブロックの少なくとも1個の属性値を含むタプルを生成するステップ、および
    前記レイアウトブロックタプルと前記代表ブロックタプルとの間の距離尺度を計算するステップ、
    を含むアクションの集合を実行することにより、前記提供された文書内の各レイアウトブロックと各代表ブロックとの類似度を計算するステップと、
    前記計算された類似度に基づいて各々の提供された文書に対する文書索引を生成するステップと、を含む、請求項1に記載の方法。
  3. 文書レイアウトに従い文書群への問い合わせを行なうコンピュータ実装された方法であって、
    コンピュータメモリに、
    各々の代表ブロックが前記文書群内の文書から抽出されたレイアウトブロックの各クラスタを代表する代表ブロックの集合と、
    各々の文書索引が前記文書群内の各文書のレイアウトブロックを代表し、各々の文書索引が文書索引クラスタの集合の各1個に割り当てられている文書索引の集合と、
    各文書索引クラスタの代表文書索引であって各々が前記文書索引クラスタに割り当てられた文書索引から導出された代表文書索引と、を与えるステップと、
    入力文書レイアウトクエリからレイアウトブロックを抽出するステップと、
    前記文書レイアウトクエリから抽出されたレイアウトブロックを前記代表ブロックの集合に射影してクエリ文書索引を生成するステップと、
    コンピュータプロセッサを用いて、前記クエリ文書索引と前記代表文書索引の集合内の各代表文書索引との類似度を計算するステップと、
    前記クエリ文書索引との類似度が最大であると判定された代表文書索引を含む最上位文書索引クラスタを識別するステップと、
    前記最上位文書索引クラスタ内の各文書索引と前記クエリ索引との類似度を計算して、類似度が最大である文書の集合を識別するステップと、
    前記類似度が最大である文書の集合内の文書に関する情報を出力するステップと、を含む方法。
  4. 文書レイアウトに従い文書群への問い合わせを行なうコンピュータ搭載されたシステムであって、
    (i)文書索引の集合と、
    代表ブロックの集合と、
    文書索引クラスタの集合と、
    代表索引の集合と、
    文書レイアウトクエリと、
    をメモリに受け入れるべく構成されたデータ入力モジュールと、
    (ii)前記文書レイアウトクエリからレイアウトブロックを抽出し、
    前記文書レイアウトクエリから抽出されたレイアウトブロックを前記代表ブロックの集合に射影してクエリ索引を生成し、
    ランク付け関数を用いて、前記クエリ索引と前記文書索引クラスタの集合内の各代表索引との類似度を計算し、
    類似度が最大である代表索引を含む文書索引クラスタを最上位文書索引クラスタとして識別して、
    前記ランク付け関数を用いて、前記最上位文書索引クラスタ内の各文書索引と前記クエリ索引との類似度を計算すべく構成された文書クエリモジュールと、
    (iii)前記最上位文書索引クラスタ内の各文書索引と前記クエリ索引との間の前記計算された類似度に基づいて上位k個の文書の順序付きリストを保持して、
    前記順序付きリストを出力すべく設定された文書ランク付けモジュールとを含むシステム。
JP2010162601A 2009-07-22 2010-07-20 レイアウトに基づく文書検索およびランク付けのためのスケーラブルな索引付け Expired - Fee Related JP5378315B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US22749409P 2009-07-22 2009-07-22
US61/227,494 2009-07-22
US12/556,098 US7953679B2 (en) 2009-07-22 2009-09-09 Scalable indexing for layout based document retrieval and ranking
US12/556,098 2009-09-09

Publications (3)

Publication Number Publication Date
JP2011028749A true JP2011028749A (ja) 2011-02-10
JP2011028749A5 JP2011028749A5 (ja) 2013-08-29
JP5378315B2 JP5378315B2 (ja) 2013-12-25

Family

ID=43078142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010162601A Expired - Fee Related JP5378315B2 (ja) 2009-07-22 2010-07-20 レイアウトに基づく文書検索およびランク付けのためのスケーラブルな索引付け

Country Status (3)

Country Link
US (1) US7953679B2 (ja)
EP (1) EP2278498B1 (ja)
JP (1) JP5378315B2 (ja)

Families Citing this family (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8166042B1 (en) * 2008-04-14 2012-04-24 Google Inc. Height based indexing
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
TWI410265B (zh) * 2009-04-03 2013-10-01 Academia Sinica Multimedia game automatic recording and configuration of the image method
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8713021B2 (en) * 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US20120013640A1 (en) * 2010-07-15 2012-01-19 Academia Sinica Graphical representation of events
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8699789B2 (en) 2011-09-12 2014-04-15 Xerox Corporation Document classification using multiple views
US8732192B2 (en) 2012-02-28 2014-05-20 International Business Machines Corporation Searching for web pages based on user-recalled web page appearance
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US20140090045A1 (en) * 2012-09-11 2014-03-27 First Data Corporation Systems and methods for facilitating login aid functionality in mobile commerce
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8930353B2 (en) * 2013-01-04 2015-01-06 International Business Machines Corporation System and method for reflective searching of previous search results
CN113470641B (zh) 2013-02-07 2023-12-15 苹果公司 数字助理的语音触发器
EP2965227A4 (en) * 2013-03-07 2016-08-17 Elateral Inc METADATA OF A TEMPLATE
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101772152B1 (ko) 2013-06-09 2017-08-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
GB2520936A (en) 2013-12-03 2015-06-10 Ibm Method and system for performing search queries using and building a block-level index
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
WO2015184186A1 (en) 2014-05-30 2015-12-03 Apple Inc. Multi-command single utterance input method
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10108695B1 (en) * 2015-08-03 2018-10-23 Amazon Technologies, Inc. Multi-level clustering for associating semantic classifiers with content regions
US10176175B2 (en) * 2015-08-19 2019-01-08 International Business Machines Corporation System and method for identifying candidates for back-of-book index
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
RU2643467C1 (ru) * 2017-05-30 2018-02-01 Общество с ограниченной ответственностью "Аби Девелопмент" Сопоставление разметки для похожих документов
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970510A1 (en) 2019-05-31 2021-02-11 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
CN111046636B (zh) * 2019-12-12 2024-04-12 深圳前海环融联易信息科技服务有限公司 筛选pdf文件信息的方法、装置、计算机设备及存储介质
CN111078956B (zh) * 2019-12-17 2022-08-05 安徽中科大国祯信息科技有限责任公司 一种智慧管网巡检轨迹分布缩量存储查询方法
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11544727B2 (en) * 2020-05-13 2023-01-03 Capital One Services, Llc System and method for generating financing structures using clustering
CN116097250A (zh) * 2020-12-22 2023-05-09 谷歌有限责任公司 用于多模式文档理解的布局感知多模式预训练
US11475610B1 (en) 2021-04-30 2022-10-18 Mobeus Industries, Inc. Controlling interactivity of digital content overlaid onto displayed data via graphics processing circuitry using a frame buffer
US20220350650A1 (en) * 2021-04-30 2022-11-03 Mobeus Industries, Inc. Integrating overlaid digital content into displayed data via processing circuitry using a computing memory and an operating system memory
US11682101B2 (en) 2021-04-30 2023-06-20 Mobeus Industries, Inc. Overlaying displayed digital content transmitted over a communication network via graphics processing circuitry using a frame buffer

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065763A (ja) * 2005-08-29 2007-03-15 Sharp Corp 画像データ検索装置、画像データ検索方法、プログラム及び記録媒体
JP2008077382A (ja) * 2006-09-21 2008-04-03 Kyocera Mita Corp 電子ファイル管理装置、電子ファイル検索方法及び電子ファイル検索プログラム
WO2009087815A1 (ja) * 2008-01-09 2009-07-16 Nec Corporation 類似文書検索システム、類似文書検索方法および記録媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999664A (en) * 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US6542635B1 (en) * 1999-09-08 2003-04-01 Lucent Technologies Inc. Method for document comparison and classification using document image layout
KR100403714B1 (ko) * 2000-06-10 2003-11-01 씨씨알 주식회사 웹문서 레이아웃 이미지 및 웹사이트 구조를 제공하여인터넷 검색을 용이하게 할 수 있는 시스템 및 방법
US7209906B2 (en) * 2002-01-14 2007-04-24 International Business Machines Corporation System and method for implementing a metrics engine for tracking relationships over time
US7734627B1 (en) * 2003-06-17 2010-06-08 Google Inc. Document similarity detection
GB0322600D0 (en) * 2003-09-26 2003-10-29 Univ Ulster Thematic retrieval in heterogeneous data repositories
US7475061B2 (en) 2004-01-15 2009-01-06 Microsoft Corporation Image-based document indexing and retrieval
US7707157B1 (en) * 2004-03-25 2010-04-27 Google Inc. Document near-duplicate detection
US7844566B2 (en) * 2005-04-26 2010-11-30 Content Analyst Company, Llc Latent semantic clustering
US7836406B1 (en) * 2005-12-19 2010-11-16 Intuit Inc. Method and apparatus for displaying a user interface enabling selection and instant display and access of pages
US7856411B2 (en) * 2006-03-21 2010-12-21 21St Century Technologies, Inc. Social network aware pattern detection
JP4274221B2 (ja) * 2006-10-02 2009-06-03 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
US7809718B2 (en) * 2007-01-29 2010-10-05 Siemens Corporation Method and apparatus for incorporating metadata in data clustering
US7711668B2 (en) * 2007-02-26 2010-05-04 Siemens Corporation Online document clustering using TFIDF and predefined time windows
US7836108B1 (en) * 2008-03-31 2010-11-16 Google Inc. Clustering by previous representative

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065763A (ja) * 2005-08-29 2007-03-15 Sharp Corp 画像データ検索装置、画像データ検索方法、プログラム及び記録媒体
JP2008077382A (ja) * 2006-09-21 2008-04-03 Kyocera Mita Corp 電子ファイル管理装置、電子ファイル検索方法及び電子ファイル検索プログラム
WO2009087815A1 (ja) * 2008-01-09 2009-07-16 Nec Corporation 類似文書検索システム、類似文書検索方法および記録媒体

Also Published As

Publication number Publication date
EP2278498A2 (en) 2011-01-26
US20110022599A1 (en) 2011-01-27
EP2278498B1 (en) 2016-10-12
JP5378315B2 (ja) 2013-12-25
EP2278498A3 (en) 2011-06-15
US7953679B2 (en) 2011-05-31

Similar Documents

Publication Publication Date Title
JP5378315B2 (ja) レイアウトに基づく文書検索およびランク付けのためのスケーラブルな索引付け
US20190340194A1 (en) Associating still images and videos
Wu et al. A framework for efficient spatial web object retrieval
RU2390833C2 (ru) Способ и система для идентификации связанности изображения, используя анализ ссылок и компоновки страницы
US9372920B2 (en) Identifying textual terms in response to a visual query
Fisher et al. Characterizing structural relationships in scenes using graph kernels
Demner-Fushman et al. Design and development of a multimodal biomedical information retrieval system
US8429173B1 (en) Method, system, and computer readable medium for identifying result images based on an image query
US8606789B2 (en) Method for layout based document zone querying
WO2013059521A1 (en) Visual search using multiple visual input modalities
JP2013515977A (ja) 複数のウェブサイトからデータを収集及びランク付けするためのシステム及び方法
US9977816B1 (en) Link-based ranking of objects that do not include explicitly defined links
WO2011001584A1 (ja) 情報分類装置、情報分類方法及び情報分類プログラム
US20150169725A1 (en) Clustering Queries For Image Search
JP2010224625A (ja) キーワード二次元可視化方法およびキーワード二次元可視化プログラム
Zhang et al. Picture semantic similarity search based on bipartite network of picture-tag type
JP2011227633A (ja) コンテンツ管理装置,情報関連度算出方法および情報関連度算出プログラム
Zhao et al. Scalable Top-Spatial Image Search on Road Networks
Braveen et al. Evaluation of content based image retrieval systems based on color feature
Godil et al. Benchmarks, performance evaluation and contests for 3D shape retrieval
Vijayarajan et al. A review on ontology based document and image retrieval methods
US12100077B2 (en) Visual database system for multidimensional data representation
JP2006048711A (ja) 画像検索システム、画像検索プログラムおよび記憶媒体、並びに画像検索方法
Kao Shape-based 3D model retrieval system
Kasture et al. Internet Image Search Based On User Intention

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130717

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20130717

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20130905

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130925

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees