JP2006107467A - 複数の検索セッションを分析してその中の意図ベースのクラスタを識別する方法及び記録媒体 - Google Patents
複数の検索セッションを分析してその中の意図ベースのクラスタを識別する方法及び記録媒体 Download PDFInfo
- Publication number
- JP2006107467A JP2006107467A JP2005257894A JP2005257894A JP2006107467A JP 2006107467 A JP2006107467 A JP 2006107467A JP 2005257894 A JP2005257894 A JP 2005257894A JP 2005257894 A JP2005257894 A JP 2005257894A JP 2006107467 A JP2006107467 A JP 2006107467A
- Authority
- JP
- Japan
- Prior art keywords
- sessions
- search
- session
- cluster
- commonality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 各セッションは、ユーザから受信された少なくとも1つのクエリ、および対応する1組の戻された検索結果を含み、検索結果の各組は、少なくとも1つの内容を含むか、それを参照する。各クラスタは、共通の目的を表すものとして認識され、共通の1組の検索結果にマッピングすることができる1群の類似の検索セッションを表す。この方法では、検索セッションごとに、その受信された各クエリ、対応する1組の検索結果、および検索結果の任意の特定個の内容が対応する検索セッションに応答するものとしてユーザに許容可能であったかどうかが識別される。その後、検索セッションはクラスタに分けられる。
【選択図】 図2
Description
図1および以下の説明は、本発明および/またはその一部を実施できる適したコンピューティング環境の簡単な概説を提供するためのものである。必須ではないが、本発明は、クライアントワークステーションやサーバなど、コンピュータによって実行されるプログラムモジュールなどのコンピュータ実行可能命令の一般的な状況で説明する。一般にプログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、構成要素、データ構造などを含む。さらに、本発明および/またはその一部は、ハンドヘルド装置、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラム可能家庭用電化製品、ネットワークPC(personal computer)、ミニコンピュータ、メインフレームコンピュータなどを含む他のコンピュータシステム構成で実施できることを理解されたい。また、本発明は、タスクが通信ネットワークによってリンクされているリモート処理装置によって実行される分散コンピューティング環境でも実施することができる。分散コンピューティング環境では、プログラムモジュールを、ローカルおよびリモートのメモリ記憶装置に置くことができる。
予備的に、また用語の問題として、本発明との関連で使用されるものなどの検索エンジンとの関連で、検索エンジンにアクセスする各ユーザは、おそらくブール演算子とともに1つまたは複数の検索用語を含む検索文字列を含むクエリを入力することによって検索を要求することを理解されたい。それに応答して、検索エンジンは、それに基づいて1組の検索結果を生成し、こうした検索結果を要求側ユーザに戻す。戻された検索結果が検索要求に関連していると思われる内容の特定の項目を含んでいる場合もあるが、代わりに内容の特定の各項目は、検索結果内の対応するリンクによってアクセスされる可能性が高い。
クエリ1(Q1):「コンピュータの保護」
リンク1(L1):内容1(C1)で満足
セッション2(S)
クエリ2(Q2):「Basicでの印刷」
リンク2(L2):内容2(C2)では不満足
リンク3(L3):内容3(C3)では不満足
クエリ3(Q3):「Basicでの複数の文書の印刷」
リンク4(L4):内容4(C4)で満足
セッション3(S3)
クエリ4(Q4):「ファイアウォール」
リンク5(L5):内容5(C5)では不満足
リンク6(L6):内容6(C6)では不満足
クエリ5(Q5):「ファイアウォールを使用可能にする」
リンク7(L7):内容7(C7)では不満足
リンク8(L8):内容1(C1)で満足
セッション4(S4)
クエリ6(Q6):「Basicの印刷」
リンク9(L9):内容8(C8)では不満足
リンク10(R10):内容9(C9)で満足
本発明の一実施形態で、ステップ303のように、識別された全セッション12のそれぞれをクラスタ22に分類するために、まずその各エントリが1対のセッション12を表し、各セッション12が表内の他のすべてのセッション12と一度対になるように表が構築される(ステップ303a)。上記に基づいたこうした表の例は、次の通りである。
本発明は、任意のタイプまたはサイズの検索エンジンとの関連で、意図ベースのクラスタ22を構築し、使用することに関して実施することができる。本発明では、本明細書に記載したように、検索文字列14は、インデックスデータベース内の検索だけではなく、意図ベースのクラスタ22およびそれにマッピングされるリンク18および/または内容20によって表される検索文字列14の意図の判断に基づいて応答されることを理解されたい。
12 全検索セッション
14 検索文字列
16 検索結果
18 リンク
20 内容
22 クラスタ
24 クエリアナライザ
Claims (19)
- 複数の検索セッションを分析してその中の意図ベースのクラスタを識別する方法であって、各セッションはユーザから受信された少なくとも1つのクエリおよび対応する1組の戻された検索結果を含み、検索結果の各組は少なくとも1つの内容を含むか、それを参照し、各クラスタは、共通の目的を表すものとして認識され、共通の1組の検索結果にマッピングすることができる1群の類似の検索セッションを表し、前記方法は、
検索セッションごとに、その受信された各クエリ、前記対応する1組の検索結果、および前記検索結果の任意の特定個の内容が前記対応する検索結果に応答するものとして前記ユーザに許容可能であったかどうかを識別するステップと、
クエリ内のテキストの共通性、および検索結果についての判断の共通性のうちの少なくとも一方に基づいて検索セッションをクラスタに分類するステップであって、
各セッションが前記表内の他のすべてのセッションと単一回対となるように一意の対のセッションをそれぞれ表す複数のエントリを含む表を構築するステップと、
前記表のエントリごとに、そのセッションの前記1対の共通性の強度を判断するステップと、
強度の高い順に前記表内の前記エントリを再配列するステップと、
再配列のときに前記表内の各エントリを調べて、前記判断されたその強度に基づいて、その各セッションを意図ベースのクラスタに割り当てるかどうか、またそうである場合はどのようにして割り当てるかを決定するステップと
を含むステップと
を備えることを特徴とする方法。 - 前記ユーザが前記1つの内容にアクセスしたかどうか、および前記ユーザがこうした1つの内容を調べるのにどのぐらいの時間を費やしたかを含む要因に基づいて前記ユーザに許容可能な前記検索結果の任意の特定個の内容を識別するステップを備えることを特徴とする請求項1に記載の方法。
- 前記表のエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、より大きい強度はより高い値として表されるステップを備えることを特徴とする請求項1に記載の方法。
- 前記デーブルのエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、各強度はテキスト値の重み付きの共通性と判断値の重み付きの共通性との合計として計算されるステップを備えることを特徴とする請求項1に記載の方法。
- 前記表のエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、各強度は、前記1対のセッションが両方のセッションで類似の判断を呼び出すことが判明した同じまたは類似の内容をもたらしたかどうかに少なくとも一部分基づくステップを備えることを特徴とする請求項1に記載の方法。
- 前記表のエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、各強度は、前記1対のセッションが同じまたは類似のクエリを有していたかどうかに少なくとも一部分基づくステップを備えることを特徴とする請求項1に記載の方法。
- 再配列のときに前記表内の各エントリを調べて、定義された閾値を上回る判断済みの強度を有することによって、その前記セッションが最低限の共通性を有することが判明しているかどうかを前記表内のエントリごとに決定し、そうである場合は、
前記セッションのうちの一方がすでにクラスタに割り当てられている場合、他方のセッションは同じクラスタに割り当てられる
セッションがすでにクラスタにない場合、こうしたセッションは新しいクラスタに割り当てられる
両方のセッションがすでに個別のクラスタにある場合、何もしない
というルールに従ってクラスタに前記エントリのこうしたセッションの両方を割り当てることによって、各セッションを意図ベースのクラスタに割り当てるかどうかを決定するステップを備えることを特徴とする請求項1に記載の方法。 - 各クラスタを、そのようなクラスタの前記共通の目的を満たすと思われる共通の1組の検索結果にマッピングし、それにより同じ共通の目的を持つすべてのクエリがそのようなクラスタに基づいて正しくマッピングされるようにするステップをさらに備えることを特徴とする請求項1に記載の方法。
- クエリ内のテキストの共通性、および検索結果についての判断の共通性のうちの少なくとも一方に基づいて検索セッションをクラスタに分類するステップを備えることを特徴とする請求項1に記載の方法。
- 複数の検索セッションを分析して、その中の意図ベースのクラスタを識別する方法を実行するコンピュータ実行可能命令を格納するコンピュータ読み取り可能な記録媒体であって、各セッションはユーザから受信された少なくとも1つのクエリおよび対応する1組の戻された検索結果を含み、検索結果の各組は少なくとも1つの内容を含むか、それを参照し、各クラスタは、共通の目的を表すものとして認識され、共通の1組の検索結果にマッピングすることができる1群の類似の検索セッションを表し、前記方法は、
検索セッションごとに、その受信された各クエリ、前記対応する1組の検索結果、および前記検索結果の任意の特定個の内容が前記対応する検索結果に応答するものとして前記ユーザに許容可能であったかどうかを識別するステップと、
クエリ内のテキストの共通性、および検索結果についての判断の共通性のうちの少なくとも一方に基づいて検索セッションをクラスタに分類するステップであって、
各セッションが前記表内の他のすべてのセッションと単一回で対となるように一意の1対のセッションをそれぞれ表す複数のエントリを含む表を構築するステップと、
前記表のエントリごとに、前記1対のセッションの共通性の強度を判断するステップと、
強度の高い順に前記表内の前記エントリを再配列するステップと、
再配列のときに前記表内の各エントリを調べて、前記判断されたその強度に基づいて、その各セッションを意図ベースのクラスタに割り当てるかどうか、またそうである場合はどのようにして割り当てるかを決定するステップと
を含むステップと
を含むことを特徴とするコンピュータ読み取り可能なコンピュータ読み取り可能な記録媒体。 - 前記方法は、前記ユーザが前記1つの内容にアクセスしたかどうか、および前記ユーザがこうした1つの内容を調べるのにどのぐらいの時間を費やしたかを含む要因に基づいて前記ユーザに許容可能な前記検索結果の任意の特定個の内容を識別するステップを含むことを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 前記方法は、前記表のエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、より大きい強度はより高い値として表されるステップを含むことを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 前記方法は、前記デーブルのエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、各強度はテキスト値の重み付きの共通性と判断値の重み付きの共通性との合計として計算されるステップを備えることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 前記方法は、前記表のエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、各強度は、前記1対のセッションが両方のセッションで類似の判断を呼び出すことが判明した同じまたは類似の内容をもたらしたかどうかに少なくとも一部分基づくステップを備えることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 前記方法は、前記表のエントリごとに、その前記1対のセッションの共通性の強度を判断するステップであって、各強度は、前記1対のセッションが同じまたは類似のクエリを有していたかどうかに少なくとも一部分基づくステップを備えることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 前記方法は、再配列のときに前記表内の各エントリを調べて、定義された閾値を上回る判断済みの強度を有することによって、その前記セッションが最低限の共通性を有することが判明しているかどうかを前記表内のエントリごとに決定し、そうである場合は、
前記セッションのうちの一方がすでにクラスタに割り当てられている場合、他方のセッションは同じクラスタに割り当てられる
セッションがすでにクラスタにない場合、こうしたセッションは新しいクラスタに割り当てられる
両方のセッションがすでに個別のクラスタにある場合、何もしない
というルールに従ってクラスタに前記エントリのこうしたセッションの両方を割り当てることによって、各セッションを意図ベースのクラスタに割り当てるかどうかを決定するステップを備えることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。 - 前記方法は、各クラスタを、こうしたクラスタの前記共通の目的を満たすと思われる共通の1組の検索結果にマッピングし、したがって同じ共通の目的を持つすべてのクエリがこうしたクラスタに基づいて正しくマッピングされるようにするステップをさらに備えることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- 前記方法は、クエリ内のテキストの共通性、および検索結果についての判断の共通性のうちの少なくとも一方に基づいて検索セッションをクラスタに分類するステップを備えることを特徴とする請求項10に記載のコンピュータ読み取り可能な記録媒体。
- クラスタの内容へのマッピングに基づいて受信されたクエリに応答する方法であって、各クラスタは、共通の目的を表すものとして認識され、共通の1組の検索結果にマッピングすることができる1群の類似の検索セッションを表し、各セッションはユーザから受信された少なくとも1つのクエリおよび対応する1組の戻された検索結果を含み、検索結果の各組は少なくとも1つの内容を含むか、それを参照し、前記方法は、
前記受信されたクエリをクラスタのセッションの以前のクエリと比較することによって前記受信されたクエリを分析して前記受信されたクエリが一致する以前のクエリを判定するステップと、
前記一致した以前のクエリの前記セッションを識別するステップと、
前記識別されたセッションの前記クラスタを識別するステップと、
前記識別されたクラスタの前記マッピング先内容を識別するステップと、
前記受信されたクエリに応答を戻すのに前記マッピング先内容を使用するステップと
を備えることを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/955,593 US7657519B2 (en) | 2004-09-30 | 2004-09-30 | Forming intent-based clusters and employing same by search |
US10/955,593 | 2004-09-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006107467A true JP2006107467A (ja) | 2006-04-20 |
JP4806238B2 JP4806238B2 (ja) | 2011-11-02 |
Family
ID=35517494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005257894A Expired - Fee Related JP4806238B2 (ja) | 2004-09-30 | 2005-09-06 | 複数の検索セッションを分析してその中の意図ベースのクラスタを識別する方法及び記録媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7657519B2 (ja) |
EP (1) | EP1643390A1 (ja) |
JP (1) | JP4806238B2 (ja) |
KR (1) | KR101213897B1 (ja) |
CN (1) | CN1755687A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011085992A (ja) * | 2009-10-13 | 2011-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置、文書検索方法、文書検索プログラム |
WO2016147401A1 (ja) * | 2015-03-19 | 2016-09-22 | 株式会社 東芝 | 分類装置、方法及びプログラム |
JP2020102035A (ja) * | 2018-12-21 | 2020-07-02 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7325159B2 (en) * | 2004-02-04 | 2008-01-29 | Network Appliance, Inc. | Method and system for data recovery in a continuous data protection system |
US20080066107A1 (en) | 2006-09-12 | 2008-03-13 | Google Inc. | Using Viewing Signals in Targeted Video Advertising |
US8667532B2 (en) | 2007-04-18 | 2014-03-04 | Google Inc. | Content recognition for targeting video advertisements |
CN100495408C (zh) * | 2007-06-22 | 2009-06-03 | 中国科学院研究生院 | 一种文本聚类元学习方法及装置 |
US20080319975A1 (en) * | 2007-06-22 | 2008-12-25 | Microsoft Corporation | Exploratory Search Technique |
US20090006358A1 (en) * | 2007-06-27 | 2009-01-01 | Microsoft Corporation | Search results |
US8433611B2 (en) * | 2007-06-27 | 2013-04-30 | Google Inc. | Selection of advertisements for placement with content |
US8037046B2 (en) * | 2007-06-29 | 2011-10-11 | Microsoft Corporation | Collecting and presenting temporal-based action information |
US9064024B2 (en) | 2007-08-21 | 2015-06-23 | Google Inc. | Bundle generation |
US9824372B1 (en) | 2008-02-11 | 2017-11-21 | Google Llc | Associating advertisements with videos |
US9330165B2 (en) * | 2009-02-13 | 2016-05-03 | Microsoft Technology Licensing, Llc | Context-aware query suggestion by mining log data |
US8190601B2 (en) * | 2009-05-22 | 2012-05-29 | Microsoft Corporation | Identifying task groups for organizing search results |
US8745039B2 (en) | 2009-09-25 | 2014-06-03 | International Business Machines Corporation | Method and system for user guided search navigation |
US9152708B1 (en) | 2009-12-14 | 2015-10-06 | Google Inc. | Target-video specific co-watched video clusters |
US20110208730A1 (en) * | 2010-02-23 | 2011-08-25 | Microsoft Corporation | Context-aware searching |
US8868548B2 (en) * | 2010-07-22 | 2014-10-21 | Google Inc. | Determining user intent from query patterns |
CN102479223B (zh) * | 2010-11-25 | 2014-06-04 | 中国移动通信集团浙江有限公司 | 数据查询方法及系统 |
US9460419B2 (en) | 2010-12-17 | 2016-10-04 | Microsoft Technology Licensing, Llc | Structuring unstructured web data using crowdsourcing |
US9043350B2 (en) | 2011-09-22 | 2015-05-26 | Microsoft Technology Licensing, Llc | Providing topic based search guidance |
CN103136223B (zh) * | 2011-11-24 | 2016-11-16 | 北京百度网讯科技有限公司 | 一种挖掘具有相似需求的查询的方法及装置 |
US9659093B1 (en) * | 2012-04-02 | 2017-05-23 | Google Inc. | Adaptive recommendations of user-generated mediasets |
US9183310B2 (en) * | 2012-06-12 | 2015-11-10 | Microsoft Technology Licensing, Llc | Disambiguating intents within search engine result pages |
US9104905B2 (en) * | 2013-05-02 | 2015-08-11 | Emotient, Inc. | Automatic analysis of individual preferences for attractiveness |
US10346753B2 (en) | 2013-10-28 | 2019-07-09 | Nant Holdings Ip, Llc | Intent engines, systems and method |
US9286410B2 (en) | 2013-11-07 | 2016-03-15 | Ricoh Company, Ltd. | Electronic document retrieval and reporting using pre-specified word/operator combinations |
US9600479B2 (en) * | 2014-01-31 | 2017-03-21 | Ricoh Company, Ltd. | Electronic document retrieval and reporting with review cost and/or time estimation |
WO2015106287A1 (en) | 2014-01-13 | 2015-07-16 | Nant Holdings Ip, Llc | Sentiments based transaction systems and methods |
US9449000B2 (en) | 2014-01-31 | 2016-09-20 | Ricoh Company, Ltd. | Electronic document retrieval and reporting using tagging analysis and/or logical custodians |
US9348917B2 (en) | 2014-01-31 | 2016-05-24 | Ricoh Company, Ltd. | Electronic document retrieval and reporting using intelligent advanced searching |
US9934306B2 (en) * | 2014-05-12 | 2018-04-03 | Microsoft Technology Licensing, Llc | Identifying query intent |
US10242088B2 (en) * | 2014-09-18 | 2019-03-26 | Microsoft Technology Licensing, Llc | Multi-source search |
US20170293625A1 (en) * | 2014-10-02 | 2017-10-12 | Hewlett-Packard Development Company, L.P. | Intent based clustering |
US10289961B2 (en) | 2014-11-24 | 2019-05-14 | International Business Machines Corporation | Presenting anticipated user search query results prompted by a trigger |
US9892167B2 (en) * | 2015-03-31 | 2018-02-13 | Rovi Guides, Inc. | Methods and systems for generating cluster-based search results |
CN107315731A (zh) * | 2016-04-27 | 2017-11-03 | 北京京东尚科信息技术有限公司 | 文本相似度计算方法 |
US10503739B2 (en) * | 2017-04-20 | 2019-12-10 | Breville USA, Inc. | Crowdsourcing responses in a query processing system |
CN108024142B (zh) * | 2017-12-05 | 2020-10-30 | 深圳市茁壮网络股份有限公司 | 一种视频流检测方法及系统 |
US11481558B2 (en) | 2018-09-12 | 2022-10-25 | Samsung Electroncis Co., Ltd. | System and method for a scene builder |
CN112035626A (zh) * | 2020-07-06 | 2020-12-04 | 北海淇诚信息科技有限公司 | 一种大规模意图的快速识别方法、装置和电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1055369A (ja) * | 1996-08-09 | 1998-02-24 | Fuji Xerox Co Ltd | 情報検索システム及び情報検索方法 |
JP2001344276A (ja) * | 2000-06-02 | 2001-12-14 | Hitachi Ltd | 文書検索方法および装置並びにその処理プログラムを記録した記録媒体 |
JP2002140361A (ja) * | 2000-10-31 | 2002-05-17 | Hitachi Ltd | 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体 |
JP2002236699A (ja) * | 2001-02-09 | 2002-08-23 | Asahi Kasei Corp | 情報検索システム及び管理用サーバ並びに制御用プログラム |
JP2004078618A (ja) * | 2002-08-19 | 2004-03-11 | Nippon Telegr & Teleph Corp <Ntt> | 入力単語候補を推薦する情報検索システム |
JP2004252911A (ja) * | 2002-08-23 | 2004-09-09 | Toshiba Corp | 検索キーワード分析プログラム及びシステム並びに方法 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6076051A (en) * | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US6012053A (en) * | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
ATE263988T1 (de) * | 1998-06-08 | 2004-04-15 | Kcsl Inc | Methode und verfahren um relevante dokumente in einer datenbank zu finden |
IL126373A (en) * | 1998-09-27 | 2003-06-24 | Haim Zvi Melman | Apparatus and method for search and retrieval of documents |
US6347313B1 (en) * | 1999-03-01 | 2002-02-12 | Hewlett-Packard Company | Information embedding based on user relevance feedback for object retrieval |
US6636853B1 (en) * | 1999-08-30 | 2003-10-21 | Morphism, Llc | Method and apparatus for representing and navigating search results |
US6324534B1 (en) * | 1999-09-10 | 2001-11-27 | Requisite Technology, Inc. | Sequential subset catalog search engine |
US6681247B1 (en) * | 1999-10-18 | 2004-01-20 | Hrl Laboratories, Llc | Collaborator discovery method and system |
US6487553B1 (en) * | 2000-01-05 | 2002-11-26 | International Business Machines Corporation | Method for reducing search results by manually or automatically excluding previously presented search results |
US6556983B1 (en) * | 2000-01-12 | 2003-04-29 | Microsoft Corporation | Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space |
US6546388B1 (en) * | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6311194B1 (en) * | 2000-03-15 | 2001-10-30 | Taalee, Inc. | System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising |
US6728932B1 (en) * | 2000-03-22 | 2004-04-27 | Hewlett-Packard Development Company, L.P. | Document clustering method and system |
US6499029B1 (en) * | 2000-03-29 | 2002-12-24 | Koninklijke Philips Electronics N.V. | User interface providing automatic organization and filtering of search criteria |
US6671681B1 (en) * | 2000-05-31 | 2003-12-30 | International Business Machines Corporation | System and technique for suggesting alternate query expressions based on prior user selections and their query strings |
US6640218B1 (en) * | 2000-06-02 | 2003-10-28 | Lycos, Inc. | Estimating the usefulness of an item in a collection of information |
US6687696B2 (en) * | 2000-07-26 | 2004-02-03 | Recommind Inc. | System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models |
US6832218B1 (en) * | 2000-09-22 | 2004-12-14 | International Business Machines Corporation | System and method for associating search results |
US7194454B2 (en) | 2001-03-12 | 2007-03-20 | Lucent Technologies | Method for organizing records of database search activity by topical relevance |
US20020169770A1 (en) * | 2001-04-27 | 2002-11-14 | Kim Brian Seong-Gon | Apparatus and method that categorize a collection of documents into a hierarchy of categories that are defined by the collection of documents |
US6741990B2 (en) * | 2001-05-23 | 2004-05-25 | Intel Corporation | System and method for efficient and adaptive web accesses filtering |
US6901411B2 (en) * | 2002-02-11 | 2005-05-31 | Microsoft Corporation | Statistical bigram correlation model for image retrieval |
US6944612B2 (en) * | 2002-11-13 | 2005-09-13 | Xerox Corporation | Structured contextual clustering method and system in a federated search engine |
US20050060287A1 (en) * | 2003-05-16 | 2005-03-17 | Hellman Ziv Z. | System and method for automatic clustering, sub-clustering and cluster hierarchization of search results in cross-referenced databases using articulation nodes |
US7617202B2 (en) * | 2003-06-16 | 2009-11-10 | Microsoft Corporation | Systems and methods that employ a distributional analysis on a query log to improve search results |
US7225184B2 (en) * | 2003-07-18 | 2007-05-29 | Overture Services, Inc. | Disambiguation of search phrases using interpretation clusters |
US8346770B2 (en) * | 2003-09-22 | 2013-01-01 | Google Inc. | Systems and methods for clustering search results |
GB0322877D0 (en) * | 2003-09-30 | 2003-10-29 | British Telecomm | Search system and method |
US7451131B2 (en) * | 2003-12-08 | 2008-11-11 | Iac Search & Media, Inc. | Methods and systems for providing a response to a query |
US7181447B2 (en) * | 2003-12-08 | 2007-02-20 | Iac Search And Media, Inc. | Methods and systems for conceptually organizing and presenting information |
US7617176B2 (en) * | 2004-07-13 | 2009-11-10 | Microsoft Corporation | Query-based snippet clustering for search result grouping |
US8572233B2 (en) * | 2004-07-15 | 2013-10-29 | Hewlett-Packard Development Company, L.P. | Method and system for site path evaluation using web session clustering |
-
2004
- 2004-09-30 US US10/955,593 patent/US7657519B2/en active Active
-
2005
- 2005-08-12 KR KR1020050074251A patent/KR101213897B1/ko active IP Right Grant
- 2005-08-31 CN CNA200510099126XA patent/CN1755687A/zh active Pending
- 2005-09-06 JP JP2005257894A patent/JP4806238B2/ja not_active Expired - Fee Related
- 2005-09-14 EP EP05108420A patent/EP1643390A1/en not_active Ceased
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1055369A (ja) * | 1996-08-09 | 1998-02-24 | Fuji Xerox Co Ltd | 情報検索システム及び情報検索方法 |
JP2001344276A (ja) * | 2000-06-02 | 2001-12-14 | Hitachi Ltd | 文書検索方法および装置並びにその処理プログラムを記録した記録媒体 |
JP2002140361A (ja) * | 2000-10-31 | 2002-05-17 | Hitachi Ltd | 文書検索方法、文書検索装置及び文書検索プログラムの記憶媒体 |
JP2002236699A (ja) * | 2001-02-09 | 2002-08-23 | Asahi Kasei Corp | 情報検索システム及び管理用サーバ並びに制御用プログラム |
JP2004078618A (ja) * | 2002-08-19 | 2004-03-11 | Nippon Telegr & Teleph Corp <Ntt> | 入力単語候補を推薦する情報検索システム |
JP2004252911A (ja) * | 2002-08-23 | 2004-09-09 | Toshiba Corp | 検索キーワード分析プログラム及びシステム並びに方法 |
Non-Patent Citations (5)
Title |
---|
大塚 真吾、外2名: "ウェブコミュニティを用いたパネルログ解析システムの構築", 電子情報通信学会技術研究報告, vol. 第103巻,192号, JPN6010074472, 18 July 2003 (2003-07-18), JP, pages 79 - 84, ISSN: 0001983983 * |
川前 徳章、外2名: "ユーザ履歴を活用した検索システム", 情報処理学会研究報告, vol. 第2000巻,第69号, JPN6010074470, 26 July 2000 (2000-07-26), JP, pages 113 - 120, ISSN: 0001983981 * |
戸田 誠二、外1名: "LCSを用いたWebログ解析におけるスケーラビリティの向上", 情報処理学会研究報告, vol. 第2003巻,第72号, JPN6010074473, 18 July 2003 (2003-07-18), JP, pages 93 - 100, ISSN: 0001983984 * |
神嶌 敏弘: "データマイニング分野のクラスタリング手法(1)", 人工知能学会誌, vol. 第18巻,第1号, JPN6010074471, 1 January 2003 (2003-01-01), JP, pages 59 - 65, ISSN: 0001983982 * |
高橋 克巳、外2名: "位置指向のWebログマイニング", 情報処理学会研究報告, vol. 第2004巻,第71号, JPN6010074475, 13 July 2004 (2004-07-13), JP, pages 9 - 15, ISSN: 0001983985 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011085992A (ja) * | 2009-10-13 | 2011-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置、文書検索方法、文書検索プログラム |
WO2016147401A1 (ja) * | 2015-03-19 | 2016-09-22 | 株式会社 東芝 | 分類装置、方法及びプログラム |
JPWO2016147401A1 (ja) * | 2015-03-19 | 2017-06-08 | 株式会社東芝 | 分類装置、方法及びプログラム |
US11163812B2 (en) | 2015-03-19 | 2021-11-02 | Kabushiki Kaisha Toshiba | Classification apparatus and classification method |
JP2020102035A (ja) * | 2018-12-21 | 2020-07-02 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7346818B2 (ja) | 2018-12-21 | 2023-09-20 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1643390A1 (en) | 2006-04-05 |
CN1755687A (zh) | 2006-04-05 |
US20060074902A1 (en) | 2006-04-06 |
US7657519B2 (en) | 2010-02-02 |
JP4806238B2 (ja) | 2011-11-02 |
KR101213897B1 (ko) | 2012-12-18 |
KR20060050440A (ko) | 2006-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4806238B2 (ja) | 複数の検索セッションを分析してその中の意図ベースのクラスタを識別する方法及び記録媒体 | |
US8868559B2 (en) | Representative document selection for a set of duplicate documents | |
US6560588B1 (en) | Method and apparatus for identifying items of information from a multi-user information system | |
US6424973B1 (en) | Search system and method based on multiple ontologies | |
US8661034B2 (en) | Bimodal recommendation engine for recommending items and peers | |
US7496567B1 (en) | System and method for document categorization | |
JP4627656B2 (ja) | 動的コンテンツクラスタリング | |
US8949256B2 (en) | System and method for identifying an owner of a web page on the World-Wide Web | |
EP1600861A2 (en) | Query to task mapping | |
US7895210B2 (en) | Methods and apparatuses for information analysis on shared and distributed computing systems | |
US20040078359A1 (en) | System and method for presenting a query expressed in terms of an object model | |
JPH11338881A (ja) | 求人求職仲介システム | |
JP2006120129A (ja) | 検索システムまたはその類似物からの動作データおよびその他のデータの分析 | |
US8392422B2 (en) | Automated boolean expression generation for computerized search and indexing | |
US9424340B1 (en) | Detection of proxy pad sites | |
JP2010514026A (ja) | ウェブページの分類とそのコンテンツの整理をするための方法 | |
JPH11338882A (ja) | 求職者が求人データベースを検索する際の入力案内プロセスに特徴を有する求人求職仲介システム | |
Oyama et al. | Keyword spices: A new method for building domain-specific web search engines | |
Glover et al. | Recommending web documents based on user preferences | |
JPH11338880A (ja) | 求人求職仲介システム | |
CN111222032A (zh) | 舆情分析方法及相关设备 | |
Vasilyeva et al. | Leveraging flexible data management with graph databases | |
US20040117357A1 (en) | Method, system and program product for identifying similar user profiles in a collection | |
US20050071333A1 (en) | Method for determining synthetic term senses using reference text | |
US7657417B2 (en) | Method, system and machine readable medium for publishing documents using an ontological modeling system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110328 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20110411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110805 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110812 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4806238 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |