JP4708436B2 - 信頼性のある文書の識別 - Google Patents
信頼性のある文書の識別 Download PDFInfo
- Publication number
- JP4708436B2 JP4708436B2 JP2007549632A JP2007549632A JP4708436B2 JP 4708436 B2 JP4708436 B2 JP 4708436B2 JP 2007549632 A JP2007549632 A JP 2007549632A JP 2007549632 A JP2007549632 A JP 2007549632A JP 4708436 B2 JP4708436 B2 JP 4708436B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate document
- candidate
- document
- documents
- identifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Description
発明の技術分野
ここに説明する実施形態は、全体として情報の取得、より詳細には場所についての文書の信頼性の識別に関する。
最新のコンピュータネットワーク、特にインターネットにより、大量の情報を広範に、かつ簡単に利用することが可能になった。たとえばインターネットのサーチエンジンは、インターネットにリンクされた数百万のウェブ文書を検索する。インターネットに接続している使用者は、簡単な検索クエリを入力し、検索クエリに関連するウェブ文書を素早く見つけることができる。
一態様では、コンピュータ可読の媒体が、場所に関連する文書を識別するための命令、文書と関連する信号のセットを決定するための命令、および信号に基づき場所についての文書の信頼性を決定するための命令を含む、コンピュータが実行可能な命令を記憶することが可能である。
以下の本発明の詳細な説明では、添付の図面を参照する。異なる図において同一の符号が使用される場合は、同じまたは類似の要素を示す。また、以下の詳細な説明は発明を限定するものではない。
図1は、本発明の原理に従う構想を示す例示的な図である。場所に関する文書のコーパス100を想定する。文書は、特定の地理的な場所に関連するという意味において場所に関するが、必ずしも同じ地理的領域には限られない。たとえば企業別のリストは、その企業の特定の住所に関連するため、場所関連文書としてみなされることが可能である。
文書は、その場所における企業、企業の住所、および/またはその企業と関連する電話番号について触れていることが可能である。セット内の1つの文書は、他の文書よりその場所に関してより信頼できるものである可能性がある。たとえば、その場所のレストランのホームページに対応する文書は、レストランの批評に対応する文書よりも場所に関してより信頼できると考えることができる。本発明の原理に従うシステムおよび方法は、場所に関連する文書の信頼性を決定することが可能である。
図2は、本発明の原理に従うシステムおよび方法を実施できるネットワーク200の例示的な図である。ネットワーク200は、ネットワーク250を介してマルチサーバ220から240に接続されるマルチクライアント210を含むことが可能である。簡潔にするため、2つのクライアント210と、3つのサーバ220から240がネットワーク250に接続されて示されているが、実際にはクライアントおよびサーバの数はこれより多い、または少ない可能性がある。また、場合によってはクライアントがサーバの機能を行い、サーバがクライアントの機能を行うことが可能である。
ターネット、メモリ装置、またはネットワークの組み合わせを含むことができる。クライアント210およびサーバ220から240は、有線、無線、および/または光学的接続を介して接続できる。
図3は、本発明の原理に従う実施形態による1つまたは複数のクライアント210および/またはサーバ220から240に対応することができるクライアントまたはサーバのエンティティ(以後「クライアント/サーバエンティティ」と称する)の例示的な図である。クライアント/サーバエンティティは、バス310と、プロセッサ320と、メインメモリ330と、読み出し専用メモリ(ROM)340と、記憶装置350と、入力装置360と、出力装置370と、通信インタフェース380とを含むことが可能である。バス310は、クライアント/サーバエンティティの要素間の通信を可能にするパスを含むことができる。
図4は、本発明の原理に従う実施形態による、場所に関する文書の信頼性を決定するための例示的な処理を示すフローチャートである。一実施形態では、図4の処理はサーバ2
20(図2)により実行される。別の実施形態では、図4の処理が別の装置、または装置のグループにより実行される。
Shop」というバイグラムはニューヨーク市領域ではまれであると仮定すると、これはニューヨーク市領域では重要度が低くなる。
は対照的に)に関連している場合、高められることが可能である。一部の候補文書は、異なる場所を示すテキストの断片を含むが、同じ文書に言及(たとえばリンク)していることがある。たとえば、1つの候補文書は場所Aに言及し、文書Aにリンクしており、その一方で別の候補文書が場所Bに言及するとともに同様に文書Aにリンクしているかもしれない。また、一部の候補文書は、多数の場所に関連している可能性がある。たとえば、候補文書が、たとえば多数の場所にある企業の場合など、場所AおよびBに言及していることがある。1つの場所に特定される候補文書の信頼性スコアは高められる。
図6は、本発明の原理に従う実施形態により文書の信頼性を識別する際に考慮できる信号の例示的な図である。図6に示されるように、文書610はペンシルバニア州 15302 オークモント 123 メインストリート所在のBig Nick’s Pizza Jointに関連する場所について信頼できる(すなわち、高い信頼性スコアを得る)と決定できる。上述の通り、文書610を場所に関して信頼できると識別するために、信号の組み合わせが使用できる。
Pizza Jointに関連する場所に対して高い信頼性スコアを得ることが可能である。
本発明の原理に従うシステムおよび方法は、場所に関連する文書の信頼性を決定することができる。ここで使用される「場所」とは、住所および/またはその住所に所在の企業を指す。
開示される特定の形態に限定する性質のものではない。修正および変形は、上述の教示に照らして、または発明の実施により習得されることが可能である。
Claims (26)
- サーバに関連する1つ以上のプロセッサによって実現される方法であって、
同一の地理的な場所に関連する文書のセットを候補文書として識別することと、
他の前記候補文書を示す、前記候補文書からのアウトリンクの数、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書を示すリンクに関連するアンカーテキスト、前記地理的な場所における企業の名称の全体または一部に一致する、前記候補文書のタイトル、または、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書に関連するドメイン名、のうちの少なくとも1つに関連付けられ、前記候補文書と関連する信号を、前記サーバに関連する1つ以上のプロセッサにより識別することと、
前記信号に基づき前記地理的な場所における前記企業の前記候補文書の信頼性の指標を、前記サーバに関連する1つ以上のプロセッサにより算出することと、
前記サーバに関連する1つ以上のプロセッサにより、別の1つの前記候補文書に関して、1つの前記候補文書に、前記地理的な場所における前記企業に関するこれらの信頼性の指標に基づき順位を付けることとを含む方法。 - 文書のセットを識別することは、
前記サーバに関連する1つ以上のプロセッサにより、前記場所に関連する情報を含むテキストの断片を識別するために文書コーパス内の文書を分析することと、
前記サーバに関連する1つ以上のプロセッサにより、前記テキストの断片を含む文書を候補文書として識別することとを含む、請求項1に記載の方法。 - 前記地理的な場所に関連する前記情報が、前記地理的な場所の住所の全体または一部、前記地理的な場所に関連する電話番号の全体または一部、または前記地理的な場所における前記企業の名称の全体または一部のうち少なくとも1つを含む、請求項2に記載の方法。
- 文書のセットを識別することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書がリンクしている文書を識別することと、
前記サーバに関連する1つ以上のプロセッサにより、前記識別された文書を候補文書として識別することとをさらに含む、請求項2に記載の方法。 - 文書のセットを識別することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書のアドレスの一部を削除することにより追加の文書を識別することと、
前記サーバに関連する1つ以上のプロセッサにより、前記追加の文書を候補文書として識別することとをさらに含む、請求項4に記載の方法。 - 前記候補文書に関連する信号を識別することは、
前記サーバに関連する1つ以上のプロセッサにより、他の前記候補文書を示す前記候補文書からのアウトリンクの数を識別することを含み、
前記候補文書の信頼性の指標を算出することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書を示す別の前記候補文書からの前記アウトリンクの数に基づき、前記候補文書の信頼性スコアを生成することを含む、請求項1に記載の方法。 - 前記候補文書と関連する信号を識別することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書を示す前記リンクに関連する前記アンカーテキストを識別することを含み、
前記候補文書の信頼性の指標を算出することは、
前記サーバに関連する1つ以上のプロセッサにより、アンカーテキストが前記場所における前記企業の前記名称の全体または一部に一致している前記候補文書が、1つまたは複数のリンクにより示されているか否かに基づいて、1つの前記候補文書の信頼性スコアを生成することを含む、請求項1に記載の方法。 - 前記候補文書に関連する信号を識別することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書の前記タイトルを識別することを含み、
前記候補文書の信頼性の指標を算出することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書に関連するタイトルが前記地理的な場所における前記企業の前記名称の全体または一部に一致するか否かに基づき、1つの前記候補文書の信頼性スコアを生成することを含む、請求項1に記載の方法。 - 前記候補文書に関連する信号を識別することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書に関連する前記ドメイン名を識別することを含み、
前記候補文書の信頼性の指標を算出することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書に関連するドメイン名が前記地理的な場所における前記企業の前記名称の全体または一部に一致するか否かに基づき、1つの前記候補文書の信頼性スコアを生成することを含む、請求項1に記載の方法。 - 前記候補文書に関連する信号を識別することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書が関連している場所を識別することを含み、
前記候補文書の信頼性の指標を算出することは、
前記サーバに関連する1つ以上のプロセッサにより、前記候補文書が単一の地理的な場所と関連しているか否かに基づいて1つの前記候補文書の前記信頼性の指標を高めることをさらに含む、請求項1に記載の方法。 - 前記信号は、前記候補文書に関連する複数の異なる種類のデータに関連付けられ、他の前記候補文書を示す、前記候補文書からのアウトリンクの数、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書を示すリンクに関連するアンカーテキスト、前記地理的な場所における企業の名称の全体または一部に一致する、前記候補文書のタイトル、または、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書に関連するドメイン名を含み、前記方法は、
前記異なる種類のデータを評価することと、
前記候補文書用の前記評価されたデータを組み合わせることと、
前記組み合わされた評価データに基づき前記候補文書に信頼性スコアを割り当てることとをさらに含む、請求項1に記載の方法。 - 同一の企業に関連する文書のセットを候補文書として識別する手段と、
他の前記候補文書を示す、前記候補文書からのアウトリンクの数、前記同一の企業の名称の全体または一部に一致し、前記候補文書を示すリンクに関連するアンカーテキスト、前記同一の企業の名称の全体または一部に一致する、前記候補文書のタイトル、または、前記同一の企業の名称の全体または一部に一致し、前記候補文書に関連するドメイン名、の複数に関連付けられ、各前記候補文書と関連する複数の信号を識別する手段と、
前記信号に基づき前記同一の企業に関する前記候補文書の信頼性の指標を算出する手段と、
別の1つの前記候補文書に関して、1つの前記候補文書に、前記同一の企業の信頼性の指標に基づき順位を付けるための手段とを備えるシステム。 - 命令を記憶するメモリと、
前記メモリ内の前記命令を実行するプロセッサとを備え、前記プロセッサは、
同一の地理的な場所に関連する一組の文書を、候補文書として識別し、
他の前記候補文書を示す、前記候補文書からのアウトリンクの数、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書を示すリンクに関連するアンカーテキスト、前記地理的な場所における企業の名称の全体または一部に一致する、前記候補文書のタイトル、または、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書に関連するドメイン名、のうちの少なくとも1つに関連づけられ、各前記候補文書に関連する複数の信号を識別し、
前記信号に基づき前記候補文書に信頼性スコアを割り当て、前記信頼性スコアは前記地理的な場所における企業についての前記候補文書の信頼性の指標を示し、
前記信頼性スコアに基づき前記候補文書を処理するシステム。 - 前記一組の文書を識別するときに、前記プロセッサは、前記地理的な場所に関連する情報を有するテキストの断片を含む文書を検知するために、文書コーパス内において、文書を分析するように構成されている、請求項13に記載のシステム。
- 前記地理的な場所に関連する前記情報は、前記地理的な場所の住所の全体または一部、前記地理的な場所に関連する電話番号の全体または一部、または前記地理的な場所における前記企業の名称の全体または一部のうち少なくとも1つを含む、請求項14に記載のシステム。
- 前記一組の文書を識別するとき、前記プロセッサはさらに、前記候補文書によりリンクされる文書を候補文書として識別するように構成される、請求項14に記載のシステム。
- 前記一組の文書を識別するとき、前記プロセッサはさらに、前記候補文書のアドレスの一部を削除することにより、文書を候補文書として識別するように構成される、請求項16に記載のシステム。
- 複数の信号を識別するとき、前記プロセッサは、前記他の候補文書を示す前記候補文書からの前記アウトリンクの数を決定するように構成され、
前記候補文書の信頼性スコアを割り当てるとき、前記プロセッサは、1つの前記候補文書を示す他の候補文書からのアウトリンクの数に基づき前記1つの前記候補文書の信頼性スコアを生成するように構成される、請求項13に記載のシステム。 - 前記複数の信号を識別するとき、前記プロセッサは、前記候補文書へのリンクに関連する前記アンカーテキストを識別するように構成され、
前記候補文書の信頼性スコアを割り当てるとき、前記プロセッサは、前記地理的な場所における前記企業の名称の全体または一部にアンカーテキストが一致する前記候補文書への1つまたは複数のリンクに基づき1つの前記文書の信頼性スコアを生成するように構成される、請求項13に記載のシステム。 - 複数の信号を識別するとき、前記プロセッサは、前記候補文書のタイトルを識別するように構成され、
前記候補文書に信頼性スコアを割り当てるとき、前記プロセッサは、前記地理的な場所における前記企業の名称の全体または一部に一致するタイトルを前記候補文書が含むか否かに基づき、1つの前記候補文書の信頼性スコアを生成するように構成される、請求項13に記載のシステム。 - 複数の信号を識別するとき、前記プロセッサは、前記候補文書に関連するドメイン名を識別するように構成され、
前記候補文書に信頼性スコアを割り当てるとき、前記プロセッサは、前記地理的な場所における前記企業の名称の全体または一部に一致するドメイン名に1つの前記候補文書が関連するか否かに基づき、前記1つの前記候補文書の信頼性スコアを生成するように構成される、請求項13に記載のシステム。 - 複数の信号を識別するとき、前記プロセッサは、前記候補文書が関連している前記地理的な場所を決定するように構成され、
前記候補文書に信頼性スコアを割り当てるとき、前記プロセッサは、1つの前記候補文書が単一の場所に関連している場合に前記1つの前記候補文書に割り当てられている前記信頼性スコアを高めるように構成される、請求項13に記載のシステム。 - 前記信号は、前記候補文書に関連する複数の異なる種類のデータに関連付けられており、他の前記候補文書を示す、前記候補文書からのアウトリンクの数、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書を示すリンクに関連するアンカーテキスト、前記地理的な場所における企業の名称の全体または一部に一致する、前記候補文書のタイトル、または、前記地理的な場所における企業の名称の全体または一部に一致し、前記候補文書に関連するドメイン名を含み、
前記候補文書に信頼性スコアを割り当てるときに、前記プロセッサは、
前記異なる種類のデータを評価し、
前記候補文書についての前記評価されたデータを組み合わせ、
前記組み合わせた評価されたデータに基づき前記候補文書に信頼性スコアを生成するように構成される、請求項13に記載のシステム。 - 前記候補文書の処理のとき、前記プロセッサは、1つの前記候補文書をその信頼性スコアに基づき、少なくとも別の1つの前記候補文書に関して順位付けるように構成される、請求項13に記載のシステム。
- 請求項1に記載の方法を実行するための命令を含む、コンピュータにより読み取り可能な媒体。
- サーバに関連する1つ以上のプロセッサによって実現される方法であって、
同一の地理的な場所に関連する文書のセットを候補文書として、前記サーバに関連する1つ以上のプロセッサにより識別することと、
各前記候補文書用に、前記候補文書を示す1つまたは複数の前記候補文書からのアウトリンクの数に基づき第1信号を、前記サーバに関連する1つ以上のプロセッサにより識別することと、
各前記候補文書用に、前記地理的な場所に関連する企業の企業名称の全体または一部に一致するアンカーテキストがあるか否かに基づき前記候補文書を示すリンクに関連する第2信号を、前記サーバに関連する1つ以上のプロセッサにより識別することと、
各前記候補文書用に、前記候補文書のタイトルが前記企業名称の全体または一部に一致するか否かに基づき第3信号を、前記サーバに関連する1つ以上のプロセッサにより識別することと、
各前記候補文書用に、前記候補文書に関連するドメイン名が前記企業名称の全体または一部に一致するか否かに基づき第4信号を、前記サーバに関連する1つ以上のプロセッサにより識別することと、
各前記候補文書用に、前記候補文書が単一の場所に関連するか否かに基づき第5信号を、前記サーバに関連する1つ以上のプロセッサにより識別することと、
前記第1、第2、第3、第4および第5信号を、前記サーバに関連する1つ以上のプロセッサにより評価することと、
各前記候補文書についてスコアを生成するために、前記評価された第1、第2、第3、第4、第5信号を、前記サーバに関連する1つ以上のプロセッサにより組み合わせることと、
前記スコアに基づき前記候補文書を、前記サーバに関連する1つ以上のプロセッサにより処理することとを含む方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/024,967 US20060149800A1 (en) | 2004-12-30 | 2004-12-30 | Authoritative document identification |
US11/024,967 | 2004-12-30 | ||
PCT/US2005/047400 WO2006074056A1 (en) | 2004-12-30 | 2005-12-30 | Authoritative document identification |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008527505A JP2008527505A (ja) | 2008-07-24 |
JP4708436B2 true JP4708436B2 (ja) | 2011-06-22 |
Family
ID=36101575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007549632A Expired - Fee Related JP4708436B2 (ja) | 2004-12-30 | 2005-12-30 | 信頼性のある文書の識別 |
Country Status (7)
Country | Link |
---|---|
US (2) | US20060149800A1 (ja) |
EP (1) | EP1859367A1 (ja) |
JP (1) | JP4708436B2 (ja) |
KR (1) | KR100974906B1 (ja) |
CN (1) | CN101128822A (ja) |
CA (1) | CA2593424A1 (ja) |
WO (1) | WO2006074056A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7769579B2 (en) | 2005-05-31 | 2010-08-03 | Google Inc. | Learning facts from semi-structured text |
US9208229B2 (en) * | 2005-03-31 | 2015-12-08 | Google Inc. | Anchor text summarization for corroboration |
US7962462B1 (en) * | 2005-05-31 | 2011-06-14 | Google Inc. | Deriving and using document and site quality signals from search query streams |
US7933890B2 (en) * | 2006-03-31 | 2011-04-26 | Google Inc. | Propagating useful information among related web pages, such as web pages of a website |
US20080065694A1 (en) * | 2006-09-08 | 2008-03-13 | Google Inc. | Local Search Using Address Completion |
US8122026B1 (en) | 2006-10-20 | 2012-02-21 | Google Inc. | Finding and disambiguating references to entities on web pages |
US20140188919A1 (en) * | 2007-01-26 | 2014-07-03 | Google Inc. | Duplicate document detection |
US8347202B1 (en) | 2007-03-14 | 2013-01-01 | Google Inc. | Determining geographic locations for place names in a fact repository |
US8312010B1 (en) * | 2007-08-16 | 2012-11-13 | Google Inc. | Local business ranking using mapping information |
US20090164449A1 (en) * | 2007-12-20 | 2009-06-25 | Yahoo! Inc. | Search techniques for chat content |
JP4518168B2 (ja) * | 2008-03-21 | 2010-08-04 | 富士ゼロックス株式会社 | 関連文書提示システム及びプログラム |
US8271195B2 (en) | 2009-01-30 | 2012-09-18 | Navteq B.V. | Method for representing linear features in a location content management system |
US20100198503A1 (en) * | 2009-01-30 | 2010-08-05 | Navteq North America, Llc | Method and System for Assessing Quality of Location Content |
US8554871B2 (en) | 2009-01-30 | 2013-10-08 | Navteq B.V. | Method and system for exchanging location content data in different data formats |
US8775074B2 (en) * | 2009-01-30 | 2014-07-08 | Navteq B.V. | Method and system for refreshing location code data |
US8898173B1 (en) | 2010-05-14 | 2014-11-25 | Google Inc. | Ranking location search results based on multiple distance measures |
US20150169626A1 (en) * | 2012-01-09 | 2015-06-18 | Google Inc. | System and method for identifying a new geographical area name |
US10789417B1 (en) * | 2012-05-24 | 2020-09-29 | The Boeing Company | Method and apparatus for identifying relationships between documents |
US9418156B2 (en) * | 2012-08-10 | 2016-08-16 | Google Inc. | Providing local data with search results |
JP5544401B2 (ja) * | 2012-08-15 | 2014-07-09 | 株式会社ゼンリンデータコム | 文書データ評価方法、文書データ評価装置、文書データ選択方法、文書データ選択装置、データベース生成方法、データベース生成装置、およびコンピュータプログラム |
US9009197B2 (en) * | 2012-11-05 | 2015-04-14 | Unified Compliance Framework (Network Frontiers) | Methods and systems for a compliance framework database schema |
US9659064B1 (en) | 2013-03-15 | 2017-05-23 | Google Inc. | Obtaining authoritative search results |
US9058374B2 (en) * | 2013-09-26 | 2015-06-16 | International Business Machines Corporation | Concept driven automatic section identification |
WO2016171927A1 (en) | 2015-04-20 | 2016-10-27 | Unified Compliance Framework (Network Frontiers) | Structured dictionary |
US10614075B2 (en) * | 2015-12-28 | 2020-04-07 | Verizon Patent and Licencing Inc. | Systems and methods for scoring and using popularity of entities in a media-content-based social network to provide a media service |
US10679088B1 (en) * | 2017-02-10 | 2020-06-09 | Proofpoint, Inc. | Visual domain detection systems and methods |
US10769379B1 (en) | 2019-07-01 | 2020-09-08 | Unified Compliance Framework (Network Frontiers) | Automatic compliance tools |
US10824817B1 (en) | 2019-07-01 | 2020-11-03 | Unified Compliance Framework (Network Frontiers) | Automatic compliance tools for substituting authority document synonyms |
US11120227B1 (en) | 2019-07-01 | 2021-09-14 | Unified Compliance Framework (Network Frontiers) | Automatic compliance tools |
WO2022047252A1 (en) | 2020-08-27 | 2022-03-03 | Unified Compliance Framework (Network Frontiers) | Automatically identifying multi-word expressions |
US20220084091A1 (en) * | 2020-09-17 | 2022-03-17 | Mastercard International Incorporated | Continuous learning for seller disambiguation, assessment, and onboarding to electronic marketplaces |
US20230031040A1 (en) | 2021-07-20 | 2023-02-02 | Unified Compliance Framework (Network Frontiers) | Retrieval interface for content, such as compliance-related content |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250931A (ja) * | 1999-03-01 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 位置情報の自動抽出装置および自動抽出方法と記録媒体 |
JP2000348041A (ja) * | 1999-06-03 | 2000-12-15 | Nec Corp | 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体 |
WO2001063479A1 (en) * | 2000-02-22 | 2001-08-30 | Metacarta, Inc. | Spatially coding and displaying information |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
JP2003173280A (ja) * | 2001-12-05 | 2003-06-20 | Nippon Telegr & Teleph Corp <Ntt> | データベース生成装置、データベース生成方法及びデータベース生成プログラム |
JP2004227165A (ja) * | 2003-01-21 | 2004-08-12 | Nippon Telegr & Teleph Corp <Ntt> | ドキュメントスコア計算方法及び装置並びにプログラム |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5875446A (en) * | 1997-02-24 | 1999-02-23 | International Business Machines Corporation | System and method for hierarchically grouping and ranking a set of objects in a query context based on one or more relationships |
US6701307B2 (en) * | 1998-10-28 | 2004-03-02 | Microsoft Corporation | Method and apparatus of expanding web searching capabilities |
US6393415B1 (en) * | 1999-03-31 | 2002-05-21 | Verizon Laboratories Inc. | Adaptive partitioning techniques in performing query requests and request routing |
US6493702B1 (en) * | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks |
WO2001065410A2 (en) * | 2000-02-28 | 2001-09-07 | Geocontent, Inc. | Search engine for spatial data indexing |
AU2001253161A1 (en) * | 2000-04-04 | 2001-10-15 | Stick Networks, Inc. | Method and apparatus for scheduling presentation of digital content on a personal communication device |
US7487112B2 (en) * | 2000-06-29 | 2009-02-03 | Barnes Jr Melvin L | System, method, and computer program product for providing location based services and mobile e-commerce |
US7233942B2 (en) * | 2000-10-10 | 2007-06-19 | Truelocal Inc. | Method and apparatus for providing geographically authenticated electronic documents |
US7356530B2 (en) * | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
US20020133374A1 (en) * | 2001-03-13 | 2002-09-19 | Agoni Anthony Angelo | System and method for facilitating services |
US20040030741A1 (en) * | 2001-04-02 | 2004-02-12 | Wolton Richard Ernest | Method and apparatus for search, visual navigation, analysis and retrieval of information from networks with remote notification and content delivery |
CA2519236A1 (en) * | 2003-03-18 | 2004-09-30 | Metacarta, Inc. | Corpus clustering, confidence refinement, and ranking for geographic text search and information retrieval |
US7848945B2 (en) * | 2003-07-03 | 2010-12-07 | Travelweb Llc | System and method for indexing travel accommodations in a network environment |
US20050216362A1 (en) * | 2003-12-09 | 2005-09-29 | Rajesh Navar | Method of and system for providing an online marketplace having global reach and local focus |
US20050203924A1 (en) * | 2004-03-13 | 2005-09-15 | Rosenberg Gerald B. | System and methods for analytic research and literate reporting of authoritative document collections |
US7257577B2 (en) * | 2004-05-07 | 2007-08-14 | International Business Machines Corporation | System, method and service for ranking search results using a modular scoring system |
US7231405B2 (en) * | 2004-05-08 | 2007-06-12 | Doug Norman, Interchange Corp. | Method and apparatus of indexing web pages of a web site for geographical searchine based on user location |
US7464076B2 (en) * | 2004-05-15 | 2008-12-09 | International Business Machines Corporation | System and method and computer program product for ranking logical directories |
US7991755B2 (en) * | 2004-12-17 | 2011-08-02 | International Business Machines Corporation | Dynamically ranking nodes and labels in a hyperlinked database |
-
2004
- 2004-12-30 US US11/024,967 patent/US20060149800A1/en not_active Abandoned
-
2005
- 2005-12-30 CA CA002593424A patent/CA2593424A1/en not_active Abandoned
- 2005-12-30 WO PCT/US2005/047400 patent/WO2006074056A1/en active Application Filing
- 2005-12-30 CN CNA2005800486432A patent/CN101128822A/zh active Pending
- 2005-12-30 EP EP05855891A patent/EP1859367A1/en not_active Withdrawn
- 2005-12-30 KR KR1020077017453A patent/KR100974906B1/ko not_active IP Right Cessation
- 2005-12-30 JP JP2007549632A patent/JP4708436B2/ja not_active Expired - Fee Related
-
2012
- 2012-03-09 US US13/417,026 patent/US8650197B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250931A (ja) * | 1999-03-01 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 位置情報の自動抽出装置および自動抽出方法と記録媒体 |
JP2000348041A (ja) * | 1999-06-03 | 2000-12-15 | Nec Corp | 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体 |
WO2001063479A1 (en) * | 2000-02-22 | 2001-08-30 | Metacarta, Inc. | Spatially coding and displaying information |
JP2003524259A (ja) * | 2000-02-22 | 2003-08-12 | メタカルタ インコーポレイテッド | 情報の空間符号化及び表示 |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
JP2003173280A (ja) * | 2001-12-05 | 2003-06-20 | Nippon Telegr & Teleph Corp <Ntt> | データベース生成装置、データベース生成方法及びデータベース生成プログラム |
JP2004227165A (ja) * | 2003-01-21 | 2004-08-12 | Nippon Telegr & Teleph Corp <Ntt> | ドキュメントスコア計算方法及び装置並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20120173544A1 (en) | 2012-07-05 |
KR20070094941A (ko) | 2007-09-27 |
EP1859367A1 (en) | 2007-11-28 |
US20060149800A1 (en) | 2006-07-06 |
WO2006074056A1 (en) | 2006-07-13 |
CA2593424A1 (en) | 2006-07-13 |
KR100974906B1 (ko) | 2010-08-09 |
CN101128822A (zh) | 2008-02-20 |
JP2008527505A (ja) | 2008-07-24 |
US8650197B2 (en) | 2014-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4708436B2 (ja) | 信頼性のある文書の識別 | |
KR100944744B1 (ko) | 원하는 레포지토리의 결정 | |
JP4633803B2 (ja) | 曖昧な地理的参照の分類 | |
JP4850845B2 (ja) | 方法、システムおよびメモリ装置 | |
US9418128B2 (en) | Linking documents with entities, actions and applications | |
JP5069285B2 (ja) | ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬 | |
US8255386B1 (en) | Selection of documents to place in search index | |
KR101037144B1 (ko) | 검색 결과의 향상 | |
KR101016683B1 (ko) | 검색 결과를 제공하기 위한 시스템 및 방법 | |
KR20070092755A (ko) | 로컬 항목 추출 | |
JP2009508267A (ja) | ブログ文書のランク付け | |
US8713071B1 (en) | Detecting mirrors on the web | |
JP2007520788A (ja) | ウェブページに対する地理的位置識別子の割当て | |
US8521746B1 (en) | Detection of bounce pad sites | |
US7836108B1 (en) | Clustering by previous representative | |
US8661069B1 (en) | Predictive-based clustering with representative redirect targets | |
US20130086083A1 (en) | Transferring ranking signals from equivalent pages | |
US20080033953A1 (en) | Method to search transactional web pages | |
JP6707410B2 (ja) | 文献検索装置、文献検索方法およびコンピュータプログラム | |
JP2018005759A (ja) | 引用マップ生成装置、引用マップ生成方法およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100615 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100914 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100922 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101007 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101209 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110316 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |