JP5679993B2 - クエリを実行する方法およびクエリシステム - Google Patents

クエリを実行する方法およびクエリシステム Download PDF

Info

Publication number
JP5679993B2
JP5679993B2 JP2011545381A JP2011545381A JP5679993B2 JP 5679993 B2 JP5679993 B2 JP 5679993B2 JP 2011545381 A JP2011545381 A JP 2011545381A JP 2011545381 A JP2011545381 A JP 2011545381A JP 5679993 B2 JP5679993 B2 JP 5679993B2
Authority
JP
Japan
Prior art keywords
query
user
words
keywords
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011545381A
Other languages
English (en)
Other versions
JP2012515379A (ja
JP2012515379A5 (ja
Inventor
シエ・ユヘン
オウ・ウェンウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2012515379A publication Critical patent/JP2012515379A/ja
Publication of JP2012515379A5 publication Critical patent/JP2012515379A5/ja
Application granted granted Critical
Publication of JP5679993B2 publication Critical patent/JP5679993B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は、データ処理技術に関し、特に、単語マッチングおよび情報クエリのための方法および装置に関する。
潜在的語義とは、通常、単語または句の潜在的な意味を指し、通常、1または複数の単語または句で表現されうる。なお、以下では中文をC1〜C42の符号で記し、中文と符号との対応関係は末尾の表1に示す。例えば、「C1」(fridge:冷蔵庫の短縮語)の潜在的語義は、一般に、「C2」(refrigerator:冷蔵庫)を指し、「C3」(cotton slippers:綿スリッパ)の潜在的語義は、一般に、「C4」(all−cotton slippers:純綿スリッパ)を指すなどである。
潜在的意味の自動検索に関して多くの研究が行われており、それらのほとんどは、単語の共出現および関係性を用いて類義語を見つけようとするものである。一部の既存の技術は、同義語を用いて、単語の間の関係を決定する。しかしながら、手作業で分類されたコーパスに基づいて得られる見出し語の数は限られており、同義語の自動発見の効果を保証することは難しい場合がある。
検索エンジンのインデックスモードは、通常、単独語検索(separate word search)、単語分割インデックス方式(word partitioning indexing)、および、ハイブリッドインデックス方式を含む。単独語インデックス方式の技術を用いる場合、通常、ファイル内での単独語間の距離が算出される必要がある。したがって、効率が悪いことが多く、精度が低いことが多い。この問題は、単語間に自然な単語区切り文字(例えば、スペース)を持たない言語(中国語など)で特に顕著である。例えば、「C5」(pesticides:農薬)、「C6」(Shen Nong pharmaceuticals:神衣薬品)、および、「C7」(Shen Nong pesticides factory:神衣農薬工場)の間の差異は、単独語インデックス方式を用いると容易に区別できない。逆に、単語分割検索技術は、より高い精度を有すると共に高速であるが、再現率は低いことが多い。例えば、その技術で「C1」(fridge)を検索すると、「C1」(fridge)の結果のみを見出すことが可能であり、「C2」(refrigerator)の結果を見出すことはできない。単独語インデックス方式と単語分割インデックス方式とを組み合わせたハイブリッドインデックス方法では、通常、最初に単語分割インデックス方式の技術に従ってクエリを行い、その後、単独語インデックス方式の技術に従ってクエリを行う。例えば、「C8」(glass bottle:ガラス瓶)をクエリすると、単語分割インデックス方式に従って「C8」(glass bottle)が見つかり、その後、単独語インデックス方式に従って別の結果が見つかる。これは、上述の2つの方法の欠点を補うが、単独語インデックス方式に従って「C9」(glass bottles:ガラス瓶(複数))が見つけられ、検索エンジンは、「C9」(glass bottles)と「C10」(causing bottle neck:瓶首を作る)との区別ができないため、精度に影響がある。したがって、より効果的な検索技術が求められている。
クエリ処理システムの一実施形態を示すブロック図。 クエリを実行するための処理の一実施形態を示すフローチャート。 クエリ処理システムの一実施形態を示すブロック図。 マッチングモジュールの一実施形態を示すブロック図。 第1クエリキーワード取得モジュールの一実施形態を示すブロック図。 単語マッチングのための処理の一実施形態を示すフローチャート。 単語マッチングのための装置の一実施形態を示すブロック図。
本発明は、処理、装置、システム、物質の組成、コンピュータ読み取り可能な格納媒体上に具現化されたコンピュータプログラム製品、および/または、プロセッサ(プロセッサに接続されたメモリに格納および/またはそのメモリによって提供される命令を実行するよう構成されたプロセッサ)を含め、様々な形態で実装されうる。本明細書では、これらの実装または本発明が取りうる任意の他の形態を、技術と呼ぶ。一般に、開示された処理の工程の順序は、本発明の範囲内で変更されてもよい。特に言及しない限り、タスクを実行するよう構成されるものとして記載されたプロセッサまたはメモリなどの構成要素は、ある時間にタスクを実行するよう一時的に構成された一般的な構成要素として、または、タスクを実行するよう製造された特定の構成要素として実装されてよい。本明細書では、「プロセッサ」という用語は、1または複数のデバイス、回路、および/または、コンピュータプログラム命令などのデータを処理するよう構成された処理コアを指すものとする。
以下では、本発明の原理を示す図面を参照しつつ、本発明の1または複数の実施形態の詳細な説明を行う。本発明は、かかる実施形態に関連して説明されているが、どの実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定されるものであり、多くの代替物、変形物、および、等価物を含む。以下の説明では、本発明の完全な理解を提供するために、多くの具体的な詳細事項が記載されている。これらの詳細事項は、例示を目的としたものであり、本発明は、これらの具体的な詳細事項の一部または全てがなくとも特許請求の範囲に従って実施可能である。簡単のために、本発明に関連する技術分野で周知の技術事項については、本発明が必要以上にわかりにくくならないように、詳細には説明していない。
図1Aは、クエリ処理システムの一実施形態を示すブロック図である。図の例において、クエリ処理システム150は、クエリ処理サーバ1512を備えており、クエリ処理サーバ152は、いくつかの実施形態において、1または複数のメモリに接続された1または複数のプロセッサを有する1または複数のデバイスを備える。クエリ処理サーバ152は、ユーザ入力を受信するよう構成された1または複数のインターフェースを備える。ユーザ入力は、例えば、ネットワーク155(インターネットまたはその他の通信ネットワークであってよい)を介してクライアントデバイス(154など)によって送信されたユーザ入力である。通信インターフェースの例としては、ポート、ケーブル、有線または無線ネットワークインターフェースカードなどの外部接続、および、通信バスなどの内部接続が挙げられるが、これらに限定されない。いくつかの実施形態では、クライアントデバイスは、ネットワーク機能を有するコンピュータまたは携帯デバイスなどのコンピュータデバイスである。クエリ処理サーバ152は、ユーザフィードバックログを格納するユーザフィードバックデータベース156にアクセスできる。
後に詳述するように、ユーザ入力を受信すると、クエリ処理サーバは、ユーザ入力を処理して、ユーザ入力およびユーザフィードバックログに基づいてクエリキーワードを生成する。いくつかの実施形態では、クエリキーワードは、クエリキーワードに基づいて検索を実行し検索結果を返す検索エンジン158に送信される。いくつかの実施形態では、検索エンジンは、データベースに格納された特定のコンテンツ(電子商取引ウェブサイト上の製品情報など)を検索するよう構成される。いくつかの実施形態では、検索エンジンは、インターネット上のコンテンツを検索する汎用の検索エンジンとして構成される。キーワード検索エンジンおよびクエリ処理サーバの機能は、いくつかの実施形態では統合されており、その場合、クエリ処理サーバは、キーワードを用いて検索を行い、直接的に結果を返す。検索結果、および、検索結果に対するユーザの応答(ユーザ選択、クリックスルーなど)は、ユーザフィードバックデータベース内で更新される。
図1Bは、クエリを実行するための処理の一実施形態を示すフローチャートである。処理100は、システム(150など)上で実行されてよい。工程102において、複数のシンボルを含むユーザ入力が受信される。いくつかの実施形態では、ユーザ入力は、クライアントデバイス(154など)からウェブブラウザまたはその他のユーザインターフェースツールによってクエリ処理サーバに送信される。本明細書で用いられているように、シンボルとは、文字(character or letter)を指す。複数の文字(charactersまたはletters)が単語を形成する。
工程104において、第1の組のクエリキーワードが、ユーザ入力に基づいて決定される。第1の組のクエリキーワードは、1または複数の単語を含んでよい。いくつかの実施形態では、ユーザ入力は、第1の組のクエリキーワードとして直接的に利用される。いくつかの実施形態では、ユーザ入力は分割され、分割された単語が、第1の組のクエリキーワードとして利用される。いくつかの場合、ユーザ入力は、文字(letter)ベースの言語(英語など)であり、単語は、スペースによって必然的に区切られる。したがって、ユーザ入力は、文脈ベースの処理を必要とせず、第1の組のクエリキーワードは、ユーザ入力内の単語および/または語幹入力単語を含む。一部の例では、漢字ベースの言語(中国語など)が、ユーザ入力言語として用いられる。かかる言語には特定の区切り文字がないため、入力シンボルは、文脈に基づいて単語に分割され、第1の組のクエリキーワードは、分割された単語を含む。いくつかの実施形態では、第1の組のクエリキーワードは、さらに、ユーザ入力内の文字(character)を含み、それらの文字は分割することなしに利用可能である。
工程106において、ユーザフィードバックログが、第1の組のクエリキーワードに基づいて取得される。ユーザフィードバックログは、いくつかの実施形態では、データベース(156など)から取得され、第1の組のクエリキーワードをクエリの対象(または、目標)として用いた履歴クエリ結果と、ユーザによる選択頻度(クリックスルー率とも呼ぶ)とを含む。様々な実施形態において、選択頻度は、以前のクエリ結果に対する選択頻度および/または以前の結果のコンテンツに対する選択頻度を含みうる。ユーザフィードバックログは、検索エンジンによって収集される。いくつかの実施形態では、ユーザによるキーワード入力、過去のクエリ結果(例えば、ウェブページファイル識別子/ユニバーサルリソースロケータ(URL))、過去のクエリ結果に対するクリック頻度、過去のクエリ結果の表示頻度などが、検索エンジンによって収集されて格納される。例えば、第1の組のクエリキーワードが、単語「western medicine:西洋医学」すなわち「C11」を含むとすると、ユーザフィードバックログは、ユーザが以前に単語「western medicine」すなわち「C11」を用いてクエリを行った時に返された結果のすべてまたは一部の記録を含む。
工程108において、ユーザフィードバックログに基づいて第1の組のクエリキーワードに一致する第2の組のクエリキーワードが決定される。いくつかの実施形態では、第2の組のクエリキーワードは、ユーザフィードバックログに基づいて導出された潜在的語義を持つ単語を含む。潜在的語義を確立するために、以前の記録のすべてまたは一部(ランダムに選択された部分など)が利用されてよい。潜在的意味を有する潜在単語の自動発見とは、元の単語と関連する意味または同様の意味を有する1または複数の単語(または、句)を見つけることを指す。ユーザフィードバックログに基づいて、クエリ単語と、ユーザの意図を具体化する履歴クエリ結果との間の潜在的語義の関係を、高い信頼性で自動的に見つけることができる。潜在的語義の関係は、次いで、検索エンジンの精度およびインテリジェンスを改善するために用いられる。したがって、ユーザフィードバックログは、第1の組のクエリキーワードを検索対象として用いている以前の全履歴クエリ結果と、履歴クエリ結果に対するユーザによる以前の全クリック選択頻度とを含みうる。
いくつかの実施形態では、第2の組のクエリキーワードを決定する工程は、第1の組のキーワードの履歴クエリ結果のコンテンツを取得する工程と、履歴クエリ結果のコンテンツを分割して1組の分割単語を取得する工程と、分割単語の選択頻度に基づいて第2の組のクエリキーワードを決定する工程と、を含む。
工程110において、第2の組のクエリキーワードの少なくとも一部を用いてクエリが実行され、クエリ結果が取得される。いくつかの実施形態では、クエリキーワードは、クエリ結果を取得するために、検索エンジンに入力される。
工程112において、第2の組のクエリキーワードに基づいたクエリ結果を用いて、ユーザフィードバックログの取得先であるユーザフィードバックデータベースが更新される。
様々な実施形態において、第1の組のクエリキーワードは、以下のタイプの内の1または複数に属する:
タイプ1:分割単語に隣接する単語。説明のため、以下では、かかる場合の選択頻度に関連する統計結果をP1とする。
タイプ2:分割単語の一部分を含む単語。以下では、かかる場合の選択頻度に関連する統計結果をP2とする。
タイプ3:分割単語を含む単語。以下では、かかる場合の選択頻度に関連する統計結果をP3とする。
ユーザフィードバックログは、履歴クエリ結果、クリック頻度、および、履歴クエリ結果の表示頻度など、クエリ単語に対応する情報を記録するよう適合される。例えば、クエリ結果は、ウェブページであってよい。与えられたクエリ単語について、結果として生じるウェブページが高い選択頻度を有していれば、クエリ単語との関連性が高いと見なされる。単語の潜在的語義とは、元の単語の同義語、類義語、または、部分的な同義語である別の単語を意味するものであり、一例では、「C8」と「C9」(「glass bottle」と「glass bottles」)、別の例では、「C12」と「C13」と「C14」(「double bed:ダブルベッド」と「single bed:シングルベッド」と「mattress bed:マットレスベッド」)であり、後者の例では、すべての単語が、人の寝る場所である「C15」(「bed:ベッド」)という潜在的語義を有しているが、「C16」(「flower bed:花壇」)は、「C15」(「bed」)という潜在的語義を有していない。
本願の様々な実施形態では、少なくとも3タイプの潜在的語義が用いられる。第1のタイプの潜在的語義は、対で現れることが多い単語であり、例えば、「Motorola:モトローラ」および「company:社」(「C17」および「C18」)、「Motorola」および「mobile phone:携帯電話」(「C17」および「C19」)である。かかる関係は、2つの単語の間の相関関係を示す。換言すれば、単語分割後のいくつかの単語は、クエリ単語に(少なくとも意味において)隣接すると見なされる。単語の第2のタイプの潜在的語義は、特定の順序で現れる複数の単語を含む。例えば、クエリキーワード「glass bottle」は、対応する潜在単語「glass」および「bottle」を有しており、「C8」は、潜在的語義単語「C20」および「C21」を有しており、「C22」(beauty)は、対応する潜在単語「C23」(beautiful:美しい)、「C24」(woman:女性)を有する。つまり、分割単語は、単語分割後のクエリ単語の少なくとも一部分を含む。第3のタイプの潜在的語義は、別の単語を形成する単語または文字である。例えば、「C25」(shrimp:エビ)および「C26」(prawns:テナガエビ)、「C27」(alcohol:酒)および「C28」(beer:ビール)であり、すなわち、分割単語は、クエリキーワードを含む。クリック頻度などのユーザフィードバックを用いて自動的に見出された潜在的語義は、通常、ユーザによって入力された検索キーワードの意図を表し、検索エンジンの精度を改善するために利用可能である。例えば、ユーザが、「C15」(「bed」)を検索する場合、ユーザの実際の意図は、通常、「C16」(「flower bed」)などの一般的な支持構造、または、ある種の機械「C30」(「lathe:旋盤」)ではなく、就寝のためのベッド、例えば、「C13」(「single bed」)、「C12」(「double bed」)、および、「C29」(「wooden bed:木製ベッド」)である。表示された検索結果の選択などのユーザフィードバックに基づいて、「C13」(「single bed」)、「C12」(「double bed」)、および、「C29」(「wooden bed」)が、「C15」(bed for sleeping:就寝用のベッド)という潜在的語義を持ち、「C16」(「flower bed」)が、「C15」という潜在的語義を持たないことを決定できる。
いくつかの実施形態では、第1の組のクエリキーワードが、工程102および104に従って取得され、履歴クエリ結果(ウェブページURL、ファイルIDなど)、クリック頻度、および、履歴クエリ結果の表示頻度、もしくは、これらの組み合わせが、工程106に従って取得される。単語分割が、第1の組のクエリキーワードに対して実行される。第1の組のクエリキーワードが複数の単語を含む場合、クエリ単語のユーザフィードバックログに含まれる対応する履歴クエリ結果および関連情報が、各分割単語に対応する各ユーザフィードバックログに追加される。したがって、各分割単語は、自身の対応する履歴クエリ結果を有する。処理の結果として、ユーザフィードバックログの各クエリは、独立した分割単語になる。P1、P2、P3に関連する上述の処理は、それぞれ、各分割単語または分割単語の部分に対して実行され、履歴クエリ結果の選択は、総クエリ回数、クリック回数、履歴クエリ結果の公開回数、または、それらの組み合わせの情報に従って決定されてよい。分割単語に対応する履歴クエリ結果は、それぞれ処理される。分割単語に完全にマッチする文字列すべてが、ユーザフィードバックログの履歴クエリ結果内で見出され(ここで、完全に一致することとは、分割単語が文字列の部分列であることを意味する)、文字列の長さは、分割単語を含む文の長さ、または、分割単語を含む文の長さのM倍であってよい(ただし、Mは2以上の任意の整数であってよい)。分割単語のタイプに応じて、対応する統計結果P1、P2、または、P3が、各分割単語について算出される。説明のために、以下の実施形態では、ファイルをクエリ結果として用いるが、URLまたはその他の適切な検索オブジェクトなど、他の結果を用いてもよい。実装例において、クエリ結果の選択頻度および/またはクエリ結果のコンテンツの選択頻度が考慮されてよい。
いくつかの実施形態では、第1の組のクエリキーワードが、工程102および104に従ってユーザ入力に基づいて取得され、履歴クエリ結果(ウェブページURL、ファイルIDなど)、クリック頻度、および、履歴クエリ結果の表示頻度、もしくは、これらの組み合わせが、工程106に従ってユーザフィードバックログから取得される。一方、クエリ辞書が、随意的に事前構成されてもよく、異なる検索単語に対応する情報(履歴クエリ結果(ウェブページURL、ファイルIDなど)、クリック頻度、および、履歴クエリ結果の表示頻度、もしくは、これらの組み合わせ)が、事前に入力されてよい。このように、第1の組のクエリキーワードが入力された時に、第2の組のクエリキーワードは、クエリ辞書を用いて迅速かつ容易に取得されうる。すなわち、以前のユーザフィードバックログのコンテンツは、クエリのために事前に格納されており、クエリ辞書は、新しいユーザフィードバックログに従って更新されてもよいが、ユーザフィードバックログは、第1のクエリキーワードが入力された後に呼び出されてもよい。
異なるタイプの分割単語の処理について説明する。
タイプ1:分割単語が第1の組のクエリキーワードに隣接する。第1の組のクエリキーワードが文字列の分割単語を含む場合、例えば、第1のクエリキーワードが「C22」であり、ユーザフィードバックログ内の履歴クエリ結果が、コンテンツ「C31、C32」(Chinese|ancient|beauty|Xishi|named|Yiguan|,born|during|Chunqiu|Zhanguo|period)を含むファイルである場合である(ここで、「|」は、単語分割が起きる位置を示す)。ここで、クエリ結果文字列内でクエリキーワードに直接隣接する分割単語の出現回数(T)に、クエリ結果のクリック頻度および/または表示頻度を掛けて、その積を重み付け係数(回数重み(1)と呼ぶ)として、全クエリ結果のカウントP1に加える。P1は、各単語が第1のクエリキーワードの前または後ろに出現する回数の重み(1)を含む。例えば、この例では、ファイルの重みが0.5である場合、P1における「C33」(ancient)および「C34」(Xishi)に対応する結果(ここで、2つの単語はクエリキーワードに直接隣接し、T=1である)は、それに応じて0.5だけ増大される。
タイプ2:分割単語が第1の組のクエリキーワードの部分を含む。第1の組のクエリキーワードが、複数の隣接する単語分割結果に含まれる場合である。例えば、第1のクエリキーワードが「C22」(beauty)であり、ユーザフィードバックログ内の履歴クエリ結果が、分割されたコンテンツ「C35」(Xishi|is|a|beautiful|woman|)を有する場合である。この時、第1のクエリキーワードを含む分割単語の出現回数に、クエリ結果のクリック頻度および/または表示頻度を掛けて、その積を重み付け係数(回数重み(2)と呼ぶ)として、全クエリ結果のカウントP2に加える。P2は、第1の組のクエリキーワードの複数の分割単語が同じ順序で出現する回数の重み(2)を含む。したがって、この例では、ファイルの重みが0.3の場合、P2における「C36」に対応する結果は、0.3だけ増大される。
タイプ3:分割単語が第1の組のクエリキーワードを含む。第1のクエリキーワードが分割単語の部分列である場合、例えば、クエリ単語が「C1」(fridge)であり、ユーザフィードバックログ内の履歴クエリ結果が、分割されたコンテンツ「C37」(refrigerator|air conditioning|maintenance|and|repair)を有する場合。この時、第1のクエリキーワードを含む分割単語の出現回数に、クエリ結果のクリック頻度および/または表示頻度を掛けて、その積を重み付け係数(回数重み(3)と呼ぶ)として、全クエリ結果のカウントP3に加える。なお、P3は、クエリ結果内に第1のクエリキーワードを含む分割単語の出現回数の重み(3)である。したがって、この例では、ファイルの重みが0.8の場合、P3における「C2」(refrigerator)に対応する結果は、0.8だけ増大される。
処理工程は、ユーザフィードバックログ内の履歴クエリ結果の分割単語がすべて処理されるまで繰り返される。分割単語がP1に従って出現する回数の加重和に基づいて、回数重みの合計が第1の閾値よりも大きい分割単語を、クエリ単語の第1の潜在的語義関係とする。同様に、分割単語がP2およびP3で出現する回数の加重和に従って、回数重みの合計がそれぞれ第2の閾値および第3の閾値よりも大きい分割単語を、単語の第2の潜在的語義関係および第3の潜在的語義関係とする。
様々な実施形態において、潜在的語義の内の1または複数が処理される。第1、第2、および、第3の閾値は、固定の閾値であってもよいし、クエリ単語の全クエリ結果に従って動的に調整されてもよい。例えば、一致した文字列を含むすべてのクエリ結果ファイルに加重和を実行し、次いで、得られた結果に係数を掛ける。なお、係数は、クエリ結果に従って動的に設定されてよい。閾値を設定することにより、クエリ単語の一部の潜在的語義を有する単語は、無条件のフィードバックになるのではなく、選択的に決定される。
いくつかの実施形態において、第1の組のクエリキーワードに一致する第2の組のクエリキーワードが、履歴クエリ結果および選択頻度に従って決定される時に、選択頻度が所定の閾値よりも大きい必要があってよく、選択頻度は、履歴クエリ結果に対するユーザの選択頻度であってよく、また、履歴クエリ結果のコンテンツに対するユーザの選択頻度であってもよい。ファイルまたはそのコンテンツのクリック頻度および/または表示頻度を重み係数とする。その係数は、クリック頻度および表示頻度の一方または両方であってよく、係数の値は、クリックおよび表示頻度と線形または非線形の関係を有しうる。例えば、両方の頻度が所定の閾値よりも大きい場合に係数は1に設定され、そうでない場合に係数は0に設定されるか、もしくは、最大のクリック頻度および表示頻度を有する係数は1であり、他の係数は、最大値で割ることによって[0,1]に正規化される。選択頻度を選択する目的は、選択頻度を用いて潜在的語義を見つけることである。低い選択頻度を有する一部の情報は、所定の閾値によってフィルタリングされるため、それにより、潜在的語義の発見速度を向上させると同時に、いくつかの情報の干渉を避けることができる。
様々な実施形態において、選択頻度は、以下の内の1または複数を含む:履歴クエリ結果のクリック頻度、履歴クエリ結果の表示頻度、履歴クエリ結果の閲覧時間(reading time)、および、履歴クエリ結果の重要度。ファイルのクリック頻度および表示頻度(または、それらの内の一方)は、重み付け係数と見なされ、その係数は、ファイルの他の情報、例えば、ユーザがそのファイルを読むのに費やした時間、重要度、クリック頻度、および、表示頻度の組み合わせであってもよい。
実施例において、クエリ単語とその潜在的語義との間の関係は、交換可能である。例えば、「C38」(glass|bottles)は、「C8」(glass bottle)の潜在的語義であり、「C8」(glass bottle)は、「C38」(glass|bottles)の潜在的語義であり、また、「C2」(refrigerator)は、「C1」(fridge)の潜在的語義であり、「C1」(fridge)は、「C2」(refrigerator)の潜在的語義である。
工程104において第1の組のクエリキーワードを決定するために、様々な技術を用いることができる。1つの技術は、ユーザによって入力された情報コンテンツに対して、単語分割を最初に実行し、分割された単語を用いて、クエリキーワードを取得することを含む。別の技術では、情報コンテンツは文字に分解され、各文字がクエリキーワードとして利用される。異なるキーワード決定方法が、同時に実行されてもよいし、組み合わされてもよい。組み合わせ技術では、ユーザが入力したクエリ単語に対して、最初に単語分割が実行される。分割された単語を用いて、単語分割結果のクエリが実行される。クエリ単語の分割単語の潜在的意味を用いて、さらなるクエリが実行され、最終的に単独語のクエリが実行されてよい。単語分割結果のクエリとは、相関のある結果が、クエリ単語の単語分割結果に従って単語分割インデックスからクエリされることを指しており、単独語のクエリとは、単独語インデックス化から結果がクエリされることを指しており、潜在的意味のクエリとは、クエリ単語の潜在的語義を用いてクエリ結果が取得されることを指す。
第1の潜在的語義を有する単語については、「クエリ単語+第1の潜在的語義を有する単語」によって、相関する結果がクエリされる。クエリ単語が「C17」(Motorola)である場合、第1の潜在的語義を有する対応する単語は、「C39」(Motorola company)および「C40」(Motorola mobile phone)であり、ここで、「C17」(Motorola)の第1のタイプの潜在的語義は、「C18」(company)および「C19」(mobile phone)である。第2のタイプの潜在的語義を有する単語については、第2の潜在的語義を有する「隣接するクエリ単語」を用いてクエリ結果が取得される。例えば、「C8」(glass)の第2の潜在的語義を有する対応する単語は、「C38」(glass|bottles)である。第3のタイプの潜在的語義を有する単語については、第3の潜在的語義を有する単語によってクエリ結果が取得される。例えば、「C2」(refrigerator)がクエリされた場合、第3の潜在的語義を有する単語は、「C1」(fridge)である。
クエリ単語とファイルとの間の相関度が、潜在的語義クエリのクエリ結果に基づいて算出される場合、それは、単独語クエリで得られた結果の相関度よりも高いことが好ましい。相関度の値は、(相関度およびウェブページの重要度などに従った)クエリ結果の順序付けに影響する。
いくつかの実施形態において、第1の組のクエリキーワードが工程104で取得される時に、第1の組のクエリキーワードを入力するユーザのユーザ特性も取得されてよい。すなわち、ユーザが第1の組のクエリキーワードを入力する時に、ユーザのユーザ特性が取得されてよい。
したがって、ユーザフィードバックログが工程106で取得される時に、ユーザフィードバックログは、ユーザ特性に従って取得されてもよい。
もしくは、ユーザフィードバックログが取得される時に、取得されるユーザフィードバックログは、第1の組のクエリキーワード内の単語を対象とする履歴クエリ結果と、履歴クエリ結果に対するユーザの選択頻度とを含み、これらの履歴クエリ結果は、ユーザ特性を含む。
もしくは、ユーザフィードバックログに従って第2の組のクエリキーワードを決定する時に、第2の組のクエリキーワードは、ユーザ特性に従って決定されてもよい。
すなわち、第2の組のクエリキーワードがユーザフィードバックログに従ってマッチングされる時に、第1の組のクエリキーワードを入力したユーザのユーザ特性に従って、異なる第2の組のクエリキーワードが決定されてもよい。ユーザ特性を用いてユーザフィードバックログを選択することにより、第1の組のクエリキーワードの潜在的語義をさらに見つけることが好ましい。例えば、上述の実施形態によると、ユーザが、「C15」を検索する場合、ユーザの実際の意図は、「C41」または「C30」(lathe)などの機械設備ではなく、ほとんどの場合、就寝のためのベッド、例えば、「C13」(single bed)、「C12」(double bed)、および、「C29」(wooden bed)である。この時、前出の検索語が「C15」(bed)の潜在的語義を有し、潜在的語義が「C41」(lathe)などを含まないことが、就寝用ベッドに関するコンテンツのユーザ選択など、ユーザのフィードバックに基づいて推測されてよい。しかしながら、同じクエリキーワード「C15」(bed)について、ユーザが機械設備の分野の技術者である場合には、潜在的語義は、「C13」(single bed)、「C12」(double bed)、および、「C29」(wooden bed)などではなく、「C41」(lathe)であることが好まししい。この実施形態では、「機械設備の分野の技術者」がユーザ特性となり、単語の潜在的語義をより良好に見つけるために、ユーザフィードバックログを分類するために用いられる。
別の例では、入力された第1の組のクエリキーワードは「C42」(apple:アップル)であり、ユーザ特性がコンピュータ関係の労働者である場合には、コンピュータのカテゴリの第2の組のクエリキーワードが、マッチングセットとして利用され、ユーザ特性が食品産業の労働者または農業労働者である場合には、果物のカテゴリの第2のキーワードがマッチングセットとして利用される。具体的な実施の際には、ユーザ特性は、ユーザの地域(例えば、国、地域、および、町)、ユーザが頻繁にブラウズしていた以前のウェブページ、ユーザが最近ブラウズしたウェブページ、ユーザが入力した以前の検索キーワード、ユーザの性別、年齢、職業、および、好みなどを含んでよい。ユーザ特性の解析および分類のために、IPアドレス解析、ユーザ側ブラウザ履歴データ解析、ユーザ側COOKIEデータ解析、および、ユーザウェブ登録情報の解析などの技術的手段が、必要に応じて利用されてよく、これは、当業者にとって容易に理解されうる。
同じ発明概念に基づいて、本願は、さらに、単語マッチングのための方法および装置、ならびに、情報クエリのための装置を提供する。単語マッチングのための方法および装置、情報クエリのための装置、ならびに、情報クエリのための方法は、同じ発明概念に基づいているため、それらは同様の原理を有する。したがって、単語マッチングのための方法および装置ならびに情報クエリのための装置の実施例では、情報クエリのための方法の実施例を参照することができるため、本明細書では、繰り返しの部分は省略する。
クエリ処理システムの一実施形態の実装について以下で説明する。システムは、複数のモジュールを備え、モジュールは、サブモジュールまたはユニットを備える。これらのモジュール/サブモジュール/ユニットは、1または複数のプロセッサ上で実行されるソフトウェアコンポーネントとして、特定の機能を実行するよう設計されたプログラム可能論理デバイスおよび/または特定用途向け集積回路などのハードウェアとして、もしくは、それらの組み合わせとして実装することができる。いくつかの実施形態において、モジュールは、コンピュータデバイス(パーソナルコンピュータ、サーバ、ネットワーク装置など)に本発明の実施形態に記載された方法を実行させるための複数の命令など、不揮発性記憶媒体(光学ディスク、フラッシュ記憶装置、携帯用ハードディスクなど)に格納することができるソフトウェア製品の形態で具現化されてよい。モジュール/サブモジュール/ユニットは、単一のデバイス上に実装されてもよいし、複数のデバイスにわたって分散されてもよい。モジュールの機能は、互いに統合されてもよいし、複数のサブモジュールにさらに分割されてもよい。
図2は、クエリ処理システムの一実施形態を示すブロック図である。図に示すように、システムは、ユーザ入力に基づいて第1の組のクエリキーワードを取得するための第1クエリキーワード取得モジュール201と、第1の組のクエリキーワードのユーザフィードバックログを取得するためのユーザフィードバックログ取得モジュール202と、ユーザフィードバックログに従って第1の組のクエリキーワードに一致する第2の組のクエリキーワードを決定するためのマッチングモジュール203と、第2の組のクエリキーワードを対象とするクエリ結果をフィードバックするためのクエリ結果フィードバックモジュール204と、を備える。
実装例において、ユーザフィードバックログ取得モジュールは、さらに、ユーザフィードバックログを取得するよう適合されてよく、ユーザフィードバックログは、第1の組のクエリキーワードに含まれる単語を検索対象とした以前の全履歴クエリ結果と、ユーザによる履歴クエリ結果の以前の全選択頻度とを含む。
マッチングモジュールは、さらに、ユーザフィードバックログ内の履歴クエリ結果および選択頻度に従って、第1の組のクエリキーワードにマッチする第2の組のクエリキーワードを決定するよう適合されてよい。
実装例において、ユーザフィードバックログ取得モジュールは、さらに、選択頻度として、履歴クエリ結果に対する選択頻度および/または履歴クエリ結果のコンテンツに対する選択頻度を取得するよう適合されてよい。
図3は、マッチングモジュールの一実施形態を示すブロック図である。図に示すように、マッチングモジュールは、第1の組のキーワードに対応する履歴クエリ結果のコンテンツを取得するためのコンテンツ取得ユニット2031と、履歴クエリ結果のコンテンツに対して単語分割を実行して単語分割後の単語を取得するための単語分割ユニット2032と、単語分割後の単語の選択頻度に従って、第1の組のクエリキーワードにマッチする第2の組のクエリキーワードを決定するためのマッチングユニット2033と、を備える。
実装例において、単語分割ユニットは、さらに、単語分割後に、以下のタイプの内の1または複数のタイプの単語を取得するよう適合されてよい。単語分割後に第1の組のクエリキーワードに隣接する単語、単語分割後に第1の組のクエリキーワードを含む単語、および、単語分割後に第1の組のクエリキーワードの構成部分を含む単語。
実装例において、マッチングモジュールは、さらに、履歴クエリ結果および選択頻度に従って、第1の組のクエリキーワードにマッチする第2の組のクエリキーワードを決定するよう適合されてよく、選択頻度は、所定の閾値よりも大きい。
図4は、第1クエリキーワード取得モジュールの一実施形態を示すブロック図である。図に示すように、第1クエリキーワード取得モジュールは、ユーザが入力する情報コンテンツを取得するための情報コンテンツ取得ユニット2011と、情報コンテンツに対して単語分割を実行した後に単語分割後の単語を取得する、および/または、情報コンテンツを文字に分解するための単語分割/分解ユニット2012と、単語分割後の単語および/または文字を第1の組のクエリキーワードとして選択するための第1クエリキーワード決定ユニット2013と、を備えてよい。
いくつかの実施形態において、ユーザフィードバックログ取得モジュールは、さらに、選択頻度として、以下の内の1つまたは組み合わせを取得するよう適合されてよい。履歴クエリ結果のクリック頻度、履歴クエリ結果の表示頻度、履歴クエリ結果の閲覧時間、および、履歴クエリ結果の重要度。
いくつかの実施形態において、第1クエリキーワード取得モジュールは、さらに、ユーザが第1の組のクエリキーワードを入力する時にユーザのユーザ特性を取得するよう適合されてよく、ユーザフィードバックログ取得モジュールは、さらに、ユーザ特性に従ってユーザフィードバックログを取得するよう適合されてよい。
いくつかの実施形態において、第1クエリキーワード取得モジュールは、さらに、ユーザが第1の組のクエリキーワードを入力する時にユーザのユーザ特性を取得するよう適合されてよい。
ユーザフィードバックログ取得モジュールは、さらに、ユーザフィードバックログを取得する時に、マッチング対象単語を対象とした履歴クエリ結果と、履歴クエリ結果に対するユーザの選択頻度とを含むユーザフィードバックログを取得するよう適合されてよく、履歴クエリ結果はユーザ特性を含む。
いくつかの実施形態において、第1クエリキーワード取得モジュールは、さらに、ユーザが第1の組のクエリキーワードを入力する時にユーザのユーザ特性を取得するよう適合されてもよい。マッチングモジュールは、さらに、ユーザフィードバックログに従って第2の組のクエリキーワードを決定する時に、ユーザ特性に従って第2の組のクエリキーワードを決定するよう適合されてよい。
図5は、単語マッチングのための処理の一実施形態を示すフローチャートである。図に示すように、その処理は、単語マッチングが実行される際に以下の工程を含んでよい。第1の組のクエリキーワードなど、マッチング対象単語を取得する工程501、マッチング対象単語に従ってユーザフィードバックログを取得する工程であって、ユーザフィードバックログは、マッチング対象単語を対象とした以前の全履歴クエリ結果と、履歴クエリ結果に対するユーザの以前の全選択頻度とを含む工程502、および、履歴クエリ結果および選択頻度に従って、マッチング対象単語にマッチする単語を決定する工程503。
いくつかの実施形態において、選択頻度は、履歴クエリ結果に対する選択頻度および/または履歴クエリ結果のコンテンツに対する選択頻度を含む。
いくつかの実施形態において、履歴クエリ結果のコンテンツに対する選択頻度に従って、マッチング対象単語にマッチする単語を決定する工程は:マッチング対象単語の履歴クエリ結果のコンテンツを取得する工程と;履歴クエリ結果のコンテンツに対して単語分割を実行し、単語分割後の単語を取得する工程と;単語分割後の単語の選択頻度に従って、マッチング対象単語にマッチする単語を決定する工程と、を備える。
様々な実施形態において、単語分割後の単語とは、以下タイプの内の1または複数のタイプの単語を指す:単語分割後にマッチング対象単語に隣接する単語;単語分割後にマッチング対象単語を含む単語;および、単語分割後にマッチング対象単語の構成部分を含む単語。
いくつかの実施形態において、マッチング対象単語にマッチする単語が、履歴クエリ結果および選択頻度に従って決定される場合、選択頻度は、所定の閾値よりも大きい。
マッチング対象キーワードを取得する工程は、以下の工程を含んでよい。ユーザが入力した情報コンテンツを取得する工程、情報コンテンツに対して単語分割を実行した後に単語分割後の単語を取得する、および/または、情報コンテンツを文字に分解する工程、および、単語分割後の単語および/または文字を、マッチング対象単語として選択する工程。
いくつかの実施形態において、選択頻度は、以下の内の1または組み合わせを含んでよい。履歴クエリ結果のクリック頻度、履歴クエリ結果の表示頻度、履歴クエリ結果の閲覧時間、および、履歴クエリ結果の重要度。
いくつかの実施形態において、方法は、さらに、ユーザがマッチング対象単語を入力する時にユーザのユーザ特性を取得する工程と、ユーザフィードバックログを取得する時にユーザ特性に従ってユーザフィードバックログを取得する工程と、を備えてよい。
いくつかの実施形態において、方法は、ユーザがマッチング対象単語を入力する時にユーザのユーザ特性を取得する工程と、ユーザフィードバックログを取得する工程とを備えてよく、取得されるユーザフィードバックログは、マッチング対象単語を対象とした履歴クエリ結果と、履歴クエリ結果に対するユーザの選択頻度とを含み、履歴クエリ結果はユーザ特性を含んでも良い。
いくつかの実施形態において、方法は、さらに、ユーザがマッチング対象単語を入力する時にユーザのユーザ特性を取得する工程と、ユーザフィードバックログに従って、マッチング対象単語にマッチする単語を決定する時に、ユーザ特性に従って、マッチング対象単語にマッチする単語を決定する工程と、を備えてよい。
図6は、単語マッチングのための装置の一実施形態を示すブロック図である。図に示すように、装置は、マッチング対象単語を取得するためのマッチング対象単語取得モジュール601と、マッチング対象単語に従ってユーザフィードバックログを取得するためのユーザフィードバックログ取得モジュール602と、ユーザフィードバックログに従って、マッチング対象単語にマッチする単語を決定するためのマッチングモジュール603と、を備える。
いくつかの実施形態において、ユーザフィードバックログ取得モジュールは、さらに、マッチング対象単語を対象とした以前の全履歴クエリ結果と、履歴クエリ結果に対するユーザの以前の全選択頻度とを含むユーザフィードバックログを取得するよう適合されてよく、マッチングモジュールは、さらに、ユーザフィードバックログ内の履歴クエリ結果および選択頻度に従って、マッチング対象単語にマッチする単語を決定するよう適合されてよい。
ユーザフィードバックログ取得モジュールは、さらに、選択頻度として、履歴クエリ結果に対する選択頻度および/または履歴クエリ結果のコンテンツに対する選択頻度を取得するよう適合されてよい。
いくつかの実施形態において、マッチングモジュールは:マッチング対象単語の履歴クエリ結果のコンテンツを取得するためのコンテンツ取得ユニットと、履歴クエリ結果のコンテンツに対して単語分割を実行して単語分割後の単語を取得するための単語分割ユニットと、単語分割後の単語の選択頻度に従って、マッチング対象単語にマッチする単語を決定するためのマッチングユニットと、を備える。
単語分割ユニットは、さらに、単語分割後に、以下のモードまたはそれらを組み合わせたモードの単語を取得するよう適合されてよい。単語分割後にマッチング対象単語に隣接する単語、単語分割後にマッチング対象単語を含む単語、および、単語分割後にマッチング対象単語の構成部分を含む単語。
マッチングモジュールは、さらに、履歴クエリ結果および選択頻度に従って、マッチング対象単語にマッチする単語を決定するよう適合されてよく、選択頻度は、所定の閾値よりも大きくても良い。
マッチング対象単語取得モジュールは、ユーザが入力する情報コンテンツを取得するための情報コンテンツ取得ユニットと、情報コンテンツに対して単語分割を実行した後に単語分割後の単語を取得する、および/または、情報コンテンツを文字に分解するための単語分割/分解ユニットと、単語分割後の単語および/または文字をマッチング対象単語として選択するためのマッチング対象単語決定ユニットと、を備えてよい。
ユーザフィードバックログ取得モジュールは、さらに、選択頻度として、以下の内の1つまたは組み合わせを取得するよう適合されてよい。履歴クエリ結果のクリック頻度、履歴クエリ結果の表示頻度、履歴クエリ結果の閲覧時間、および、履歴クエリ結果の重要度。
いくつかの実施形態において、マッチング対象単語取得モジュールは、さらに、ユーザがマッチング対象単語を入力する時にユーザのユーザ特性を取得するよう適合され、ユーザフィードバックログ取得モジュールは、さらに、ユーザ特性に従ってユーザフィードバックログを取得するよう適合されても良い。
いくつかの実施形態において、マッチング対象単語取得モジュールは、さらに、ユーザがマッチング対象単語を入力する時にユーザのユーザ特性を取得するよう適合されてよく、ユーザフィードバックログ取得モジュールは、さらに、ユーザフィードバックログを取得する時に、マッチング対象単語を対象とした履歴クエリ結果と、履歴クエリ結果に対するユーザの選択頻度とを含むユーザフィードバックログを取得するよう適合されてよく、履歴クエリ結果はユーザ特性を含んでも良い。
いくつかの実施形態において、マッチング対象単語取得モジュールは、さらに、ユーザがマッチング対象単語を入力する時にユーザのユーザ特性を取得するよう適合されてよく、マッチングモジュールは、さらに、ユーザフィードバックログに従って、マッチング対象単語にマッチする単語を決定する時に、ユーザ特性に従って、マッチング対象単語にマッチする単語を決定するよう適合されてよい。
上述の実施形態によると、ユーザフィードバックログの解析に基づいて、単語の潜在的意味を自動的に見つけることができ、単語間の隠れた関係性を正確に見つけられることがわかる。さらに、自動的に見つけられた単語の潜在的意味と、クエリされる単語の相関する意味とを用いて、検索エンジンの効果を改善することができる。さらに、クエリ単語の潜在的語義が自動的に見つけられる時に、単語分割結果だけではなく、検索文字列内でクエリ単語に直接隣接する単独語の単語頻度に従っても、同様の効果を得ることができる。したがって、本願の一実施形態によると、自動的に見つけられた単語の潜在的語義により、検索エンジンの性能を改善することができる。従来の技術と比べて、検索精度および効率を改善することができる。
説明しやすいように、上記のシステムについては、機能に従って様々なモジュールまたはユニットに分けて、それぞれを説明してきた。しかしながら、本発明の実施の際には、各モジュールまたはユニットの機能は、1または複数のソフトウェアおよび/またはハードウェアで実現されうる。
当業者であれば、本願の実施形態は、方法、システム、または、コンピュータプログラム製品として提供されうることを理解できる。したがって、本願は、完全にハードウェア的な実施形態、完全にソフトウェア的な実施形態、または、その組み合わせの形態を取りうる。さらに、本願は、コンピュータ利用可能なプログラムコードを含む1または複数のコンピュータ利用可能な記憶媒体(磁気ディスクストレージ、CD−ROM、および、光学ストレージを含むが、これらに限定されない)に実装されたコンピュータプログラム製品の形態を取ってもよい。
本願は、本願の実施形態に従った方法、装置(システム)、および、コンピュータプログラム製品のフローチャートおよび/またはブロック図を参照して説明されている。フローチャートおよび/またはブロック図内の各フローおよび/またはブロック、ならびに、フローチャートおよび/またはブロック図内のフローおよび/またはブロックの組み合わせは、コンピュータプログラム命令によって実現されうることを理解されたい。かかるコンピュータプログラム命令は、マシンを生成するために、汎用コンピュータ、専用コンピュータ、内蔵プロセッサ、または、他のプログラム可能なデータ処理デバイスのプロセッサに供給され、その結果、コンピュータまたはその他のプログラム可能なデータ処理デバイスのプロセッサによって実行された命令が、フローチャート内の1または複数のフローおよび/またはブロック図内の1または複数のブロックに記載された機能を実現するためのデバイスを生成しうる。
かかるコンピュータプログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理デバイスが特定のモードで機能するよう導くことができるコンピュータ読み取り可能な記憶装置に格納されてもよく、それにより、コンピュータ読み取り可能な記憶装置に格納された命令は、命令装置を含む製品を生成することが可能であり、命令装置は、フローチャート内の1または複数のフローおよびブロック図内の1または複数のブロックに記載された機能を実現することができる。
かかるコンピュータプログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理デバイスにロードされてもよく、そうすれば、一連の動作処理をコンピュータまたはその他のプログラム可能なデバイスで実行して、コンピュータで処理を実現することが可能になり、それにより、コンピュータまたはその他のプログラム可能なデバイスで実行された命令は、フローチャート内の1または複数のフローおよび/またはブロック図内の1または複数のブロックに記載された機能を実現するための処理を提供しうる。
本願の好ましい実施形態について上述したが、当業者であれば、基本的な創造概念の教示内で他の変更例および変形例を実現することが可能である。したがって、好ましい実施形態と、これらの変更例および変形例はすべて、添付の特許請求の範囲に含まれるものである。
当業者は、本発明の精神および範囲から逸脱することなく、本発明に様々な変形および変更を施すことができることを理解されたい。したがって、本発明に対するこれらの変形例および変更例が、本発明の請求項およびその等価物の範囲に属している場合には、本発明は、これらの変形例および変更例を含むものである。
適用例1:クエリを実行する方法であって、ユーザ入力を受信し、前記ユーザ入力に少なくとも部分的に基づいて第1の組のクエリキーワードを決定し、前記第1の組のクエリキーワードの少なくとも一部に基づいて、履歴クエリ結果を含むユーザフィードバックログを取得し、前記ユーザフィードバックログに基づいて、第2の組のクエリキーワードを決定し、前記第2の組のクエリキーワードの少なくとも一部に基づいてクエリを実行する、ことを備える、方法。
適用例2:適用例1に記載の方法はさらに、クエリ結果を返信し、前記クエリ結果を用いてユーザフィードバックデータベースを更新する、ことを備える、方法。
適用例3:適用例1に記載の方法において、前記ユーザ入力は、文脈に基づいて複数の分割単語に分割され、前記第1の組のクエリキーワードは、前記複数の分割単語を含む、方法。
適用例4:適用例3に記載の方法において、前記第1の組のクエリキーワードは、前記複数の分割単語の内の少なくとも一部に隣接する1または複数の単語、前記複数の分割単語の少なくとも一部分を含む1または複数の単語、前記複数の分割単語の内の少なくとも1つの分割単語を含む1または複数の単語、または、これらの組み合わせを含む、方法。
適用例5:適用例1に記載の方法において、前記ユーザフィードバックログは、前記第1の組のクエリキーワードの少なくとも一部をクエリ対象として用いて取得された履歴クエリ結果を含む、方法。
適用例6:適用例1に記載の方法において、前記ユーザフィードバックログは、選択頻度を含む、方法。
適用例7:適用例6に記載の方法において、前記選択頻度は、前記履歴クエリ結果のクリック頻度、前記履歴クエリ結果の表示頻度、前記履歴クエリ結果の閲覧時間、前記履歴クエリ結果の重要度、または、これらの組み合わせ、に少なくとも部分的に基づいて決定される、方法。
適用例8:適用例1に記載の方法において、前記第2の組のクエリキーワードは、前記第1の組のクエリキーワードに対応する1または複数の潜在単語を含み、前記潜在単語は、前記第1の組のクエリキーワードに関する潜在的意味を有する、方法。
適用例9:適用例1に記載の方法において、前記第2の組のクエリキーワードの少なくとも一部に基づくクエリの実行は、前記第2の組のクエリキーワードの少なくとも一部を検索エンジンに送信することを含む、方法。
適用例10:適用例1に記載の方法はさらに、前記ユーザ入力を生成したユーザのユーザ特性を取得することを備え、前記ユーザフィードバックログは、前記ユーザ特性に少なくとも部分的に従って取得される、方法。
適用例11:適用例1に記載の方法はさらに、前記ユーザ入力を生成したユーザのユーザ特性を取得することを備え、前記第2の組のクエリキーワードは、前記ユーザ特性に少なくとも部分的に従って取得される、方法。
適用例12:クエリシステムであって、ユーザ入力を受信するよう構成されたインターフェースと、前記インターフェースに接続された1または複数のプロセッサであって、前記ユーザ入力に少なくとも部分的に基づいて第1の組のクエリキーワードを決定し、前記第1の組のクエリキーワードの少なくとも一部に基づいて、履歴クエリ結果を含むユーザフィードバックログを取得し、前記ユーザフィードバックログに基づいて、第2の組のクエリキーワードを決定し、前記第2の組のクエリキーワードの少なくとも一部に基づいてクエリを実行するよう構成された、1または複数のプロセッサと、
前記1または複数のプロセッサに接続され、前記プロセッサに命令を提供するよう構成された1または複数のメモリと、を備える、システム。
適用例13:適用例12に記載のシステムにおいて、前記プロセッサは、クエリ結果を返信し、前記クエリ結果を用いてユーザフィードバックデータベースを更新するように構成されている、システム。
適用例14:適用例12に記載のシステムにおいて、前記ユーザ入力は、文脈に基づいて複数の分割単語に分割され、前記第1の組のクエリキーワードは、前記複数の分割単語を含む、システム。
適用例15:適用例14に記載のシステムにおいて、前記第1の組のクエリキーワードは、前記複数の分割単語の内の少なくとも一部に隣接する1または複数の単語、前記複数の分割単語の少なくとも一部分を含む1または複数の単語、前記複数の分割単語の内の少なくとも1つの分割単語を含む1または複数の単語、または、これらの組み合わせを含む、システム。
適用例16:適用例12に記載のシステムにおいて、前記ユーザフィードバックログは、前記第1の組のクエリキーワードの少なくとも一部をクエリ対象として用いて取得された履歴クエリ結果を含む、システム。
適用例17:適用例12に記載のシステムにおいて、前記ユーザフィードバックログは、選択頻度を含む、システム。
適用例18:適用例17に記載のシステムにおいて、前記選択頻度は、前記履歴クエリ結果のクリック頻度、前記履歴クエリ結果の表示頻度、前記履歴クエリ結果の閲覧時間、前記履歴クエリ結果の重要度、または、これらの組み合わせ、に少なくとも部分的に基づいて決定される、システム。
適用例19:適用例12に記載のシステムにおいて、前記第2の組のクエリキーワードは、前記第1の組のクエリキーワードに対応する1または複数の潜在単語を含み、前記潜在単語は、前記第1の組のクエリキーワードに関する潜在的意味を有する、システム。
適用例20:適用例12に記載のシステムにおいて、前記第2の組のクエリキーワードの少なくとも一部に基づいくクエリの実行は、前記第2の組のクエリキーワードの少なくとも一部を検索エンジンに送信することを含む、システム。
適用例21:適用例12に記載のシステムにおいて、前記プロセッサは、さらに、前記ユーザ入力を生成したユーザのユーザ特性を取得するよう構成され、前記ユーザフィードバックログは、前記ユーザ特性に少なくとも部分的に従って取得される、システム。
適用例22:適用例12に記載のシステムにおいて、前記プロセッサは、さらに、前記ユーザ入力を生成したユーザのユーザ特性を取得するよう構成され、前記第2の組のクエリキーワードは、前記ユーザ特性に少なくとも部分的に従って取得される、システム。
Figure 0005679993

Claims (15)

  1. クエリを実行する方法であって、
    ユーザ入力を受信し、
    前記ユーザ入力に少なくとも部分的に基づいて第1の組のクエリキーワードを決定し、
    前記第1の組のクエリキーワードの少なくとも一部に基づいて、前記第1の組のクエリーワードを用いて以前に生成されたクエリに応じた履歴クエリ結果および前記履歴クエリ結果の選択頻度を含むユーザフィードバックログを取得し、
    前記ユーザフィードバックログに少なくとも部分的に基づいて、第2の組のクエリキーワードを決定し、前記第2の組のクエリキーワードの決定は、前記ユーザフィードバックログに少なくとも部分的に基づいて前記第1の組のクエリキーワードの1または複数の潜在単語を選択することを含み、
    前記第2の組のクエリキーワードの少なくとも一部に基づいてクエリを実行する、
    ことを備え、
    前記履歴クエリ結果は文脈に基づいて複数の分割単語に分割され、前記第2の組のクエリキーワードは前記複数の分割単語を含み、
    前記第2の組のクエリキーワードは、前記複数の分割単語の内の少なくとも一部に隣接する1または複数の単語、前記複数の分割単語の少なくとも一部分を含む1または複数の単語、前記複数の分割単語の内の少なくとも1つの分割単語を含む1または複数の単語、または、これらの組み合わせを含み、
    前記第2の組のクエリキーワードは、前記第1の組のクエリキーワードに対応する前記1または複数の潜在単語を含み、前記1または複数の潜在単語は、前記第1の組のクエリキーワードに関する潜在的語義を有し、前記潜在的語義は、対で出現する単語、特定の順序で出現する複数の単語、別の単語を形成する単語または文字、あるいはこれらの任意の組合せを含む、方法。
  2. 請求項1に記載の方法はさらに、
    クエリ結果を返信し、
    前記クエリ結果を用いてユーザフィードバックデータベースを更新する、
    ことを備える、方法。
  3. 請求項1に記載の方法において、前記ユーザフィードバックログは、前記第1の組のクエリキーワードの少なくとも一部をクエリ対象として用いて取得された履歴クエリ結果を含む、方法。
  4. 請求項1に記載の方法において、前記選択頻度は、前記履歴クエリ結果のクリック頻度、前記履歴クエリ結果の表示頻度、前記履歴クエリ結果の閲覧時間、および、前記履歴クエリ結果の重要度、の少なくともいずれか一つに基づいて決定される、方法。
  5. 請求項1に記載の方法において、前記第2の組のクエリキーワードの少なくとも一部に基づくクエリの実行は、前記第2の組のクエリキーワードの少なくとも一部を検索エンジンに送信することを含む、方法。
  6. 請求項1に記載の方法はさらに、前記ユーザ入力を生成したユーザのユーザ特性を取得することを備え、前記ユーザフィードバックログは、前記ユーザ特性に少なくとも部分的に従って取得される、方法。
  7. 請求項1に記載の方法はさらに、前記ユーザ入力を生成したユーザのユーザ特性を取得することを備え、前記第2の組のクエリキーワードは、前記ユーザ特性に少なくとも部分的に従って取得される、方法。
  8. クエリシステムであって、
    ユーザ入力を受信するよう構成されたインターフェースと、
    前記インターフェースに接続された1または複数のプロセッサであって、
    前記ユーザ入力に少なくとも部分的に基づいて第1の組のクエリキーワードを決定し、
    前記第1の組のクエリキーワードの少なくとも一部に基づいて、前記第1の組のクエリーワードを用いて以前に生成されたクエリに応じた履歴クエリ結果および前記履歴クエリ結果の選択頻度を含むユーザフィードバックログを取得し、
    前記ユーザフィードバックログに少なくとも部分的に基づいて、第2の組のクエリキーワードを決定し、前記第2の組のクエリキーワードの決定は、前記ユーザフィードバックログに少なくとも部分的に基づいて前記第1の組のクエリキーワードの1または複数の潜在単語を選択することを含み、
    前記第2の組のクエリキーワードの少なくとも一部に基づいてクエリを実行するよう構成された、1または複数のプロセッサと、
    前記履歴クエリ結果は文脈に基づいて複数の分割単語に分割され、前記第2の組のクエリキーワードは前記複数の分割単語を含み、
    前記第2の組のクエリキーワードは、前記複数の分割単語の内の少なくとも一部に隣接する1または複数の単語、前記複数の分割単語の少なくとも一部分を含む1または複数の単語、前記複数の分割単語の内の少なくとも1つの分割単語を含む1または複数の単語、または、これらの組み合わせを含み、
    前記第2の組のクエリキーワードは、前記第1の組のクエリキーワードに対応する前記1または複数の潜在単語を含み、前記1または複数の潜在単語は、前記第1の組のクエリキーワードに関する潜在的語義を有し、前記潜在的語義は、対で出現する単語、特定の順序で出現する複数の単語、別の単語を形成する単語または文字、あるいはこれらの任意の組合せを含み、
    前記1または複数のプロセッサに接続され、前記プロセッサに命令を提供するよう構成された1または複数のメモリと、
    を備える、システム。
  9. 請求項に記載のシステムにおいて、前記プロセッサはさらに、
    クエリ結果を返信し、
    前記クエリ結果を用いてユーザフィードバックデータベースを更新するように構成されている、システム。
  10. 請求項に記載のシステムにおいて、前記ユーザフィードバックログは、前記第1の組のクエリキーワードの少なくとも一部をクエリ対象として用いて取得された履歴クエリ結果を含む、システム。
  11. 請求項に記載のシステムにおいて、前記選択頻度は、前記履歴クエリ結果のクリック頻度、前記履歴クエリ結果の表示頻度、前記履歴クエリ結果の閲覧時間、および、前記履歴クエリ結果の重要度、の少なくともいずれか一つに少なくとも部分的に基づいて決定される、システム。
  12. 請求項に記載のシステムにおいて、前記第2の組のクエリキーワードの少なくとも一部に基づいくクエリの実行は、前記第2の組のクエリキーワードの少なくとも一部を検索エンジンに送信することを含む、システム。
  13. 請求項に記載のシステムにおいて、前記プロセッサは、さらに、前記ユーザ入力を生成したユーザのユーザ特性を取得するよう構成され、前記ユーザフィードバックログは、前記ユーザ特性に少なくとも部分的に従って取得される、システム。
  14. 請求項に記載のシステムにおいて、前記プロセッサは、さらに、前記ユーザ入力を生成したユーザのユーザ特性を取得するよう構成され、前記第2の組のクエリキーワードは、前記ユーザ特性に少なくとも部分的に従って取得される、システム。
  15. 請求項1に記載の方法において、
    前記第2の組のクエリキーワードを決定することは、IPアドレス、ユーザ側ブラウザ履歴データ、ユーザ側クッキーデータ、ユーザウェブ登録情報、またはこれらの任意の組合せを解析することを含む、方法。
JP2011545381A 2009-01-12 2010-01-12 クエリを実行する方法およびクエリシステム Expired - Fee Related JP5679993B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CNA2009100015557A CN101464897A (zh) 2009-01-12 2009-01-12 一种词匹配及信息查询方法及装置
CN200910001555.7 2009-01-12
US12/655,980 2010-01-11
US12/655,980 US8898180B2 (en) 2009-01-12 2010-01-11 Method and system for querying information
PCT/US2010/000075 WO2010080719A1 (en) 2009-01-12 2010-01-12 Search engine for refining context-based queries based upon historical user feedback

Publications (3)

Publication Number Publication Date
JP2012515379A JP2012515379A (ja) 2012-07-05
JP2012515379A5 JP2012515379A5 (ja) 2013-02-21
JP5679993B2 true JP5679993B2 (ja) 2015-03-04

Family

ID=40805472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011545381A Expired - Fee Related JP5679993B2 (ja) 2009-01-12 2010-01-12 クエリを実行する方法およびクエリシステム

Country Status (5)

Country Link
US (2) US8898180B2 (ja)
EP (1) EP2382534A4 (ja)
JP (1) JP5679993B2 (ja)
CN (1) CN101464897A (ja)
WO (1) WO2010080719A1 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100131513A1 (en) 2008-10-23 2010-05-27 Lundberg Steven W Patent mapping
US8666972B2 (en) * 2009-02-12 2014-03-04 International Business Machines Corporation System and method for content management and determination of search conditions
CN101833570A (zh) * 2010-03-23 2010-09-15 深圳市五巨科技有限公司 一种移动终端页面推送优化的方法和装置
US8548981B1 (en) * 2010-06-23 2013-10-01 Google Inc. Providing relevance- and diversity-influenced advertisements including filtering
CN102567408B (zh) * 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
US9904726B2 (en) 2011-05-04 2018-02-27 Black Hills IP Holdings, LLC. Apparatus and method for automated and assisted patent claim mapping and expense planning
US8880532B2 (en) 2011-06-29 2014-11-04 International Business Machines Corporation Interestingness of data
CN102855252B (zh) * 2011-06-30 2015-09-09 北京百度网讯科技有限公司 一种基于需求的数据检索方法和装置
US20130085946A1 (en) 2011-10-03 2013-04-04 Steven W. Lundberg Systems, methods and user interfaces in a patent management system
CN103034665B (zh) * 2011-10-10 2016-01-06 阿里巴巴集团控股有限公司 信息查询方法和装置
CN103207881B (zh) * 2012-01-17 2016-03-02 阿里巴巴集团控股有限公司 查询方法和装置
US9043248B2 (en) 2012-03-29 2015-05-26 International Business Machines Corporation Learning rewrite rules for search database systems using query logs
US9313330B1 (en) * 2012-09-27 2016-04-12 West Corporation Identifying recorded call data segments of interest
US10395215B2 (en) * 2012-10-19 2019-08-27 International Business Machines Corporation Interpretation of statistical results
TW201435627A (zh) * 2013-03-12 2014-09-16 Hon Hai Prec Ind Co Ltd 搜索優化系統及方法
CN103207906B (zh) * 2013-03-28 2016-12-28 百度在线网络技术(北京)有限公司 搜索结果的提供方法和搜索引擎
US20140317078A1 (en) * 2013-04-18 2014-10-23 SkillPages Holdings Limited Method and system for retrieving information
CN104346160B (zh) * 2013-08-09 2018-02-27 联想(北京)有限公司 信息处理的方法及电子设备
CN104636403B (zh) * 2013-11-15 2019-03-26 腾讯科技(深圳)有限公司 处理查询请求的方法及装置
CN104063454A (zh) * 2014-06-24 2014-09-24 北京奇虎科技有限公司 一种挖掘用户需求的搜索推送方法和装置
CN105389314B (zh) * 2014-09-04 2019-07-23 中芯国际集成电路制造(上海)有限公司 一种日志文件查询系统及查询方法
CN104281702B (zh) * 2014-10-22 2017-07-11 国家电网公司 基于电力关键词分词的数据检索方法及装置
CN104462552B (zh) * 2014-12-25 2018-07-17 北京奇虎科技有限公司 问答页面核心词提取方法和装置
CN104462553B (zh) * 2014-12-25 2019-02-26 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置
CN104462556B (zh) * 2014-12-25 2018-02-23 北京奇虎科技有限公司 问答页面相关问题推荐方法和装置
CN104899322B (zh) 2015-06-18 2021-09-17 百度在线网络技术(北京)有限公司 搜索引擎及其实现方法
EP3821906A1 (en) 2015-07-07 2021-05-19 Janssen Vaccines & Prevention B.V. Vaccine against rsv comprising modified f polypeptide
CN106844372B (zh) * 2015-12-04 2021-09-24 菜鸟智能物流控股有限公司 一种物流信息查询方法和装置
CN107291685B (zh) * 2016-04-13 2020-10-13 北京大学 语义识别方法和语义识别系统
MY194419A (en) 2016-05-30 2022-11-30 Janssen Vaccines & Prevention Bv Stabilized pre-fusion rsv f proteins
CN106227891A (zh) * 2016-08-24 2016-12-14 广东华邦云计算股份有限公司 一种基于模式的商品查询短文本语义处理方法
CN108427686A (zh) * 2017-02-15 2018-08-21 北京国双科技有限公司 文本数据查询方法及装置
US10692157B2 (en) * 2017-03-28 2020-06-23 International Business Machines Corporation Selection of information sources based on social activities
CN107222526B (zh) * 2017-05-16 2020-09-29 百度在线网络技术(北京)有限公司 推送推广信息的方法、装置、设备和计算机存储介质
CN107622054B (zh) * 2017-09-26 2020-12-22 科大讯飞股份有限公司 文本数据的纠错方法及装置
CN110147426B (zh) * 2017-12-01 2021-08-13 北京搜狗科技发展有限公司 一种查询文本的分类标签确定方法及相关装置
CN108984582B (zh) * 2018-05-04 2023-07-28 中国信息安全研究院有限公司 一种查询请求处理方法
CN108897843B (zh) * 2018-06-27 2021-12-24 吉安职业技术学院 一种基于中心法的文本自适应推荐方法
CN109597986A (zh) * 2018-10-16 2019-04-09 深圳壹账通智能科技有限公司 异常问题的定位方法、装置、设备及存储介质
CN111324805B (zh) * 2018-12-13 2024-02-13 北京搜狗科技发展有限公司 查询意图确定方法及装置、搜索方法及搜索引擎
CN109726226A (zh) * 2019-01-03 2019-05-07 中国联合网络通信集团有限公司 群组对话框排序方法及装置
CN109933645B (zh) * 2019-01-28 2024-01-23 平安科技(深圳)有限公司 信息查询方法、装置、计算机设备及存储介质
CN109978498B (zh) * 2019-03-15 2020-06-09 河北冀联人力资源服务集团有限公司 任务信息处理方法及装置
US11281640B2 (en) * 2019-07-02 2022-03-22 Walmart Apollo, Llc Systems and methods for interleaving search results
CN111079421B (zh) * 2019-11-25 2023-09-26 北京小米智能科技有限公司 一种文本信息分词处理的方法、装置、终端及存储介质
JP6948425B2 (ja) * 2020-03-19 2021-10-13 ヤフー株式会社 判定装置、判定方法及び判定プログラム
JP7127080B2 (ja) * 2020-03-19 2022-08-29 ヤフー株式会社 判定装置、判定方法及び判定プログラム
CN112182193B (zh) * 2020-10-19 2023-01-13 山东旗帜信息有限公司 一种交通行业中日志获取方法、设备及介质
CN112925882B (zh) * 2021-02-18 2024-10-18 联想(北京)有限公司 一种信息处理方法及装置
CN115077159A (zh) * 2021-03-10 2022-09-20 松下电器研究开发(苏州)有限公司 冰箱及智能冰箱系统
US11860884B2 (en) * 2021-03-30 2024-01-02 Snap Inc. Search query modification database
CN113360743A (zh) * 2021-07-09 2021-09-07 南方电网数字电网研究院有限公司 查询数据过滤方法、装置、计算机设备和存储介质

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219957A (ja) 1994-01-28 1995-08-18 Matsushita Electric Ind Co Ltd 情報分類装置、情報検索装置及び情報収集装置
US6567797B1 (en) * 1999-01-26 2003-05-20 Xerox Corporation System and method for providing recommendations based on multi-modal user clusters
US6502091B1 (en) * 2000-02-23 2002-12-31 Hewlett-Packard Company Apparatus and method for discovering context groups and document categories by mining usage logs
JP2002092033A (ja) 2000-09-12 2002-03-29 Sanyo Electric Co Ltd 情報検索装置
US6845374B1 (en) * 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US7149804B2 (en) * 2001-04-30 2006-12-12 Sony Computer Entertainment America Inc. Method and system for providing evaluation of text-based products
US7028024B1 (en) * 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
US7092936B1 (en) * 2001-08-22 2006-08-15 Oracle International Corporation System and method for search and recommendation based on usage mining
JP4003468B2 (ja) * 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
EP1860579A1 (en) * 2002-08-30 2007-11-28 Sony Deutschland Gmbh Method to split a multiuser profile
JP2005031949A (ja) 2003-07-11 2005-02-03 Canon Inc 情報検索方法、情報検索装置およびプログラム
US8086619B2 (en) * 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US7451131B2 (en) * 2003-12-08 2008-11-11 Iac Search & Media, Inc. Methods and systems for providing a response to a query
US7890526B1 (en) * 2003-12-30 2011-02-15 Microsoft Corporation Incremental query refinement
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
GB0414332D0 (en) * 2004-06-25 2004-07-28 British Telecomm Data storage and retrieval
US7707220B2 (en) * 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
US20060129531A1 (en) * 2004-12-09 2006-06-15 International Business Machines Corporation Method and system for suggesting search engine keywords
JP4461233B2 (ja) 2005-03-30 2010-05-12 独立行政法人情報通信研究機構 メディアデータ選択装置、メディアデータ選択方法、メディアデータ選択プログラムおよびそのプログラムを記録した記録媒体
US8438142B2 (en) * 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US8200687B2 (en) * 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US7577665B2 (en) * 2005-09-14 2009-08-18 Jumptap, Inc. User characteristic influenced search results
US7627548B2 (en) * 2005-11-22 2009-12-01 Google Inc. Inferring search category synonyms from user logs
US7756855B2 (en) * 2006-10-11 2010-07-13 Collarity, Inc. Search phrase refinement by search term replacement
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US8073860B2 (en) 2006-03-30 2011-12-06 Veveo, Inc. Method and system for incrementally selecting and providing relevant search engines in response to a user query
CN100495398C (zh) * 2006-03-30 2009-06-03 国际商业机器公司 文件系统中搜索排序的方法及相关搜索引擎
JP4958476B2 (ja) * 2006-05-24 2012-06-20 株式会社日立製作所 検索装置
US7840538B2 (en) * 2006-12-20 2010-11-23 Yahoo! Inc. Discovering query intent from search queries and concept networks
US7725453B1 (en) * 2006-12-29 2010-05-25 Google Inc. Custom search index
JP4909748B2 (ja) 2007-01-22 2012-04-04 ヤフー株式会社 ページ移動操作の履歴情報に基づいてWebページへの参照元のWebページに関する情報を推薦する方法及びサーバ
US20080222119A1 (en) * 2007-03-08 2008-09-11 Microsoft Corporation Detecting a user's location, local intent and travel intent from search queries
JP2008293211A (ja) * 2007-05-23 2008-12-04 Hitachi Ltd アイテム推薦システム
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US7818320B2 (en) * 2007-05-31 2010-10-19 Yahoo! Inc. Enhanced search results based on user feedback relating to search result abstracts
CN101436186B (zh) 2007-11-12 2012-09-05 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
JP4962967B2 (ja) 2008-01-11 2012-06-27 ヤフー株式会社 Webページ検索サーバ及びクエリ推薦方法
US8005828B2 (en) * 2008-02-05 2011-08-23 Yahoo! Inc. Learning query rewrite policies
CN101241512B (zh) * 2008-03-10 2012-01-11 北京搜狗科技发展有限公司 一种重新定义查询词的搜索方法及装置
US20090259646A1 (en) * 2008-04-09 2009-10-15 Yahoo!, Inc. Method for Calculating Score for Search Query
US7890516B2 (en) * 2008-05-30 2011-02-15 Microsoft Corporation Recommending queries when searching against keywords
JP4869292B2 (ja) 2008-06-20 2012-02-08 ヤフー株式会社 検索キーワードを推薦するサーバ、方法、およびプログラム
CN101751422A (zh) 2008-12-08 2010-06-23 北京摩软科技有限公司 一种移动终端智能搜索的方法、移动终端和服务器
CN101751437A (zh) 2008-12-17 2010-06-23 中国科学院自动化研究所 基于强化学习的网页页面主动式检索系统
JP2010146366A (ja) * 2008-12-19 2010-07-01 Toshiba Corp 情報提供サーバ
US8515966B2 (en) * 2009-01-09 2013-08-20 Ebay Inc. Analyzing queries to generate product intention rules
US8719249B2 (en) * 2009-05-12 2014-05-06 Microsoft Corporation Query classification
US8423568B2 (en) * 2009-09-16 2013-04-16 Microsoft Corporation Query classification using implicit labels
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US20110208730A1 (en) * 2010-02-23 2011-08-25 Microsoft Corporation Context-aware searching
US9177045B2 (en) * 2010-06-02 2015-11-03 Microsoft Technology Licensing, Llc Topical search engines and query context models
US8612432B2 (en) * 2010-06-16 2013-12-17 Microsoft Corporation Determining query intent
WO2012040872A1 (en) * 2010-09-29 2012-04-05 Yahoo! Inc. Training search query intent classifier using wiki article titles and search click log

Also Published As

Publication number Publication date
JP2012515379A (ja) 2012-07-05
US20100179948A1 (en) 2010-07-15
EP2382534A4 (en) 2013-02-13
US8898180B2 (en) 2014-11-25
US20150066888A1 (en) 2015-03-05
WO2010080719A1 (en) 2010-07-15
US9430568B2 (en) 2016-08-30
EP2382534A1 (en) 2011-11-02
CN101464897A (zh) 2009-06-24

Similar Documents

Publication Publication Date Title
JP5679993B2 (ja) クエリを実行する方法およびクエリシステム
JP5727512B2 (ja) 検索提案のクラスタ化及び提示
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US7519588B2 (en) Keyword characterization and application
KR101793222B1 (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
US8458198B1 (en) Document analysis and multi-word term detector
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
JP6073349B2 (ja) 広告キャンペーンの生成
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
JP7023865B2 (ja) ランディングページ生成の改良
JP2006004411A (ja) ウェブデータベースのスキーママッチングの方法およびシステム
US10592841B2 (en) Automatic clustering by topic and prioritizing online feed items
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
CN109564573A (zh) 来自计算机应用元数据的平台支持集群
US8793120B1 (en) Behavior-driven multilingual stemming
US20180089193A1 (en) Category-based data analysis system for processing stored data-units and calculating their relevance to a subject domain with exemplary precision, and a computer-implemented method for identifying from a broad range of data sources, social entities that perform the function of Social Influencers
US20140201185A1 (en) Hybrid method of building topic ontologies for publisher and marketer content and ad recommendations
JP2017220204A (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
JP2007256992A (ja) コンテンツ特定方法及び装置
CN108280081B (zh) 生成网页的方法和装置
US20130332440A1 (en) Refinements in Document Analysis
JP6320465B2 (ja) 1人以上のユーザに関心ある情報を提供する方法及び装置
RU2589856C2 (ru) Способ обработки целевого сообщения, способ обработки нового целевого сообщения и сервер (варианты)
JP2002157270A (ja) 興味記事配信システム及び興味記事配信方法
WO2019218151A1 (zh) 一种资料搜寻方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131015

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140107

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150106

R150 Certificate of patent or registration of utility model

Ref document number: 5679993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees