JP5256273B2 - 意図抽出装置、方法及びプログラム - Google Patents

意図抽出装置、方法及びプログラム Download PDF

Info

Publication number
JP5256273B2
JP5256273B2 JP2010261360A JP2010261360A JP5256273B2 JP 5256273 B2 JP5256273 B2 JP 5256273B2 JP 2010261360 A JP2010261360 A JP 2010261360A JP 2010261360 A JP2010261360 A JP 2010261360A JP 5256273 B2 JP5256273 B2 JP 5256273B2
Authority
JP
Japan
Prior art keywords
query
occurrence
search
common
queries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010261360A
Other languages
English (en)
Other versions
JP2012113486A (ja
Inventor
学 颯々野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010261360A priority Critical patent/JP5256273B2/ja
Publication of JP2012113486A publication Critical patent/JP2012113486A/ja
Application granted granted Critical
Publication of JP5256273B2 publication Critical patent/JP5256273B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ウェブ検索に関する。
従来、情報技術分野において、テキストを入力したユーザの意図を解析する試みが多数なされている。例えば、ウェブ検索の分野でも、検索者の検索意図に合致した検索結果を提示するために様々なアプローチがなされている。例えば、特許文献1は、漏れのない検索を支援するために検索クエリを類語に拡張する提案で、ユーザ類語辞書に登録されたキーワード又は類語をユーザが入力すると、制御装置が、互いに関係付けられたキーワード及び類語を検索キーワードとして文書の検索を行うものである。
特開平05−181912号公報
しかし、検索クエリ自体が多義的な場合も考えられ、例えば「HB」と検索者が入力した場合、これは鉛筆の芯の硬さか、ホームベーカリーの略称か、どの「HB」を指すのかが曖昧である。同様の例は「FP」に対し、「ファイナンシャルプランナー」と「フードプロセッサー」などがある。従来、このような多義的な検索クエリの場合、特許文献1のような類語の拡張だけではどの意味で入力されているかの検索意図が判別できず、検索精度の十分な改善が困難という問題があった。
上記の課題に対し、本発明の目的は、入力された検索クエリで直接表現されていない検索意図を抽出することである。
上記の目的をふまえ、本発明の一態様(1)である意図抽出装置は、検索クエリの入力を受け付けるクエリ受付手段と、受け付けられた前記検索クエリに基づいて共起クエリのグループを複数取得する共起取得手段と、取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出する共通クエリ抽出手段と、を有することを特徴とする。
本発明の他の態様(7)である意図抽出方法は、上記態様を方法のカテゴリで捉えたもので、コンピュータが、検索クエリの入力を受け付けるクエリ受付処理と、コンピュータが、受け付けられた前記検索クエリに基づいて共起クエリのグループを複数取得する共起取得処理と、コンピュータが、取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出する共通クエリ抽出処理と、を含むことを特徴とする。
本発明の他の態様(8)である意図抽出プログラムは、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、コンピュータに、検索クエリの入力を受け付けさせ、コンピュータに、受け付けられた前記検索クエリに基づいて共起クエリのグループを複数取得させ、コンピュータに、取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出させることを特徴とする。
本発明の他の態様(9)は、上記態様を端末側で実現する場合に関するもので、サーバ装置に通信ネットワークでアクセスするコンピュータで実現する意図抽出装置であって、前記サーバ装置へ送信する検索クエリの入力を受け付けるクエリ受付手段と、受け付けられた前記検索クエリに基づいて、共起クエリを表わす所定のデータ又は所定のウェブ検索ログにアクセスすることにより、共起クエリのグループを複数取得する共起取得手段と、取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出する共通クエリ抽出手段と、を有することを特徴とする。
このように、入力された一又は二以上の検索クエリに基づいて、その検索クエリと直接又は間接にAND検索されるような共起クエリのグループを複数取得し、グループ間で交わる共通クエリを抽出すれば、この共通クエリは、入力された検索クエリから間接的な共起関係が複数存在する語であるから、ユーザの隠れた検索意図であって入力された検索クエリで直接表現されていない検索意図を抽出できたことになる。
本発明の他の態様(2)は、上記いずれかの態様において、前記クエリ受付手段は、複数の前記検索クエリの入力を受け付け、前記共起取得手段は、受け付けられた複数の前記検索クエリからそれぞれ共起クエリのグループを取得することを特徴とする。
このように、複数の検索クエリごとに、それぞれ共起クエリのグループを取得し、その共通クエリを抽出することにより、隠れた検索意図を表す共通クエリを複数の検索クエリから多面的に特定でき、優れた精度で検索意図が抽出できる。なお、本発明は、組み合わせて入力された複数の検索クエリ同士が、たまたま同じ共起クエリのグループに含まれている場合を排除するものではない。
本発明の他の態様(3)は、上記いずれかの態様において、前記クエリ受付手段は、一の前記検索クエリの入力を受け付け、前記共起取得手段は、受け付けられた一の前記検索クエリを基に、その検索クエリの共起クエリを一次共起クエリとして複数取得し、個々の一次共起クエリに対するさらなる共起クエリのグループを取得することを特徴とする。
このように、入力された検索クエリが一つでも、それをもとに生成した複数の一次共起クエリからさらに二次的に共起クエリのグループを複数取得し、その二次的な共起クエリのグループを共通クエリ取得の対象とすることにより、複数の間接的共起関係の経路に基づいて優れた精度で検索意図を抽出することができる。
本発明の他の態様(4)は、上記いずれかの態様において、前記共通クエリ抽出手段により抽出された前記共通クエリに基づいて、前記検索クエリに関連する関連検索ワードの提示を行う関連提示手段を有することを特徴とする。
このように、入力された検索クエリとAND検索されるような関連検索ワードの提示に、ユーザの隠れた検索意図を表す共通クエリを活用することにより、検索意図に適合した検索結果が得られるので、ウェブ検索の精度が効果的に改善できる。
本発明の他の態様(5)は、上記いずれかの態様において、前記共通クエリ抽出手段により抽出された前記共通クエリに基づいて、検索連動型広告を出力する広告出力手段を有することを特徴とする。
このように、検索連動型広告のマッチング(引当て)に、ユーザの隠れた検索意図を表す共通クエリを活用することにより、ユーザの検索意図に適合した広告が表示できるので、CTRなどの広告効果が改善できる。
本発明の他の態様(6)は、上記いずれかの態様において、前記共通クエリ抽出手段により抽出された前記共通クエリに基づいて、キーワード広告に係る関連入札ワードの提示を行う入札提示手段を有することを特徴とする。
このように、検索連動型やコンテンツマッチなどのキーワード広告の入稿時に入札ワードを指定する際、広告主等の入力した入札ワードに限らず、その隠れた検索意図を表す共通クエリを活用して関連入札ワードの候補として提示することにより、広告を見るユーザにアピールできる語をより広範に指定できるので、キーワード広告の効果を改善できる。
なお、上記の各態様とは異なるカテゴリ(装置に対し方法、方法に対しプログラムなど)や、以下に説明するさらに具体的な各態様も本発明に含まれる。異なるカテゴリについては、「手段」を「処理」又は「ステップ」のように適宜読み替えるものとする。また、処理やステップの実行順序は以上記述したものに限定されず、その作用原理に反しない範囲で、適宜入れ替えたりまとめて処理するなど、変更可能である。
本発明によれば、入力された検索クエリで直接表現されていない検索意図を抽出することができる。
本発明の実施形態の構成を示す機能ブロック図。 本発明の実施形態で用いる情報(データ)を例示する図。 本発明の実施形態における処理手順を示すフローチャート。 本発明の実施形態における共通クエリの抽出の一例を示す概念図。 本発明の実施形態における共通クエリの抽出の一例を示す概念図。 本発明の実施形態における関連検索ワードの表示例を示す図。 本発明の実施形態における検索連動型広告の表示例を示す図。 本発明の実施形態における検索連動型広告の入稿画面を例示する図。
次に、本発明を実施するための形態(「実施形態」と呼ぶ)について、図に沿って説明する。なお、背景技術や課題などで既に述べた内容と共通の前提事項については適宜省略する。
〔1.構成〕
本実施形態は、本発明の意図抽出装置を、図1に示す検索サーバ1(以下「本装置1」又は「本装置」とも呼ぶ)として実現したものである。本装置1は、通信ネットワークN(インターネット、携帯電話網、LANなど)を経てアクセスしてくるユーザ端末T1に、ウェブ検索(ネット検索)のサービスを提供するものである。また、ユーザ端末T1などの端末T(T1,T2)は、パーソナル・コンピュータ(PC)、スマートフォンやタブレットPCといったモバイル機器などの情報処理装置で、図1では一つを模式的に例示するが、実際は、ユーザや広告主などの数に応じて多数存在する。
本装置1は、一般的なコンピュータ(電子計算機)の構成として少なくとも、CPUなどの演算制御部6と、記憶装置7(主メモリ、フラッシュメモリ、HDD等)と、通信ネットワークNとの通信手段8(LANアダプタや通信ゲートウェイ装置など)と、を有する。また、本装置1では、記憶装置7に予め記憶(インストール)した図示しない所定のコンピュータ・プログラムが演算制御部6を制御することで、図1に示す各手段などの要素(10,11など)を実現する。これら各要素のうち情報の記憶手段は、記憶装置7において各種のデータベース(「DB」とも表す)やファイル、配列等の変数、各種スタックやレジスタ、システム設定値など任意の形式で実現できる。
このような記憶手段のうち、索引記憶手段10は、ウェブ検索に用いる索引データ(インデックスデータ)を記憶している手段であり、索引データは従来に準じたものでよい。検索ログ記憶手段15は、本装置1が処理したウェブ検索の検索ログ(履歴)として、検索ごとに入力された検索クエリを記憶している手段であり、その最も単純な例は、単に時間順に
「HB 硬さ」
「オリンピック」
「ドーナツ」
・・・
のように、検索クエリの文字列を羅列したものである。
しかし、記憶するデータ項目など具体的なデータ構成は自由であり、例えば、検索ログの一環として又は検索ログに代えて、図2(1)に例示するように、個々の語である検索クエリごと(例えば「HB」に対し)に、一以上の共起クエリ(例えば「パン」及び「鉛筆」)と、それぞれの使われた回数(度数)やシンプソン係数その他の指標と、を共起クエリデータとして記憶しておけば、共起クエリの取得ごとに集計処理などで共起クエリを絞り込むなどの処理が不要となり、共起クエリの取得が容易になる。
また、広告記憶手段20は、図2(2)に例示するように、ウェブ検索結果画面に表示する検索連動型広告(単に「広告」とも呼ぶ)ごとに、広告表示の条件とする入札ワード、入札単価、広告文、広告文のハイパーリンクの遷移先とするURLなどを、広告データとして記憶する手段である。なお、記憶手段以外の各手段は、以下のような情報処理の機能・作用を実現・実行する処理手段である。
〔2.作用及び効果〕
上記のように構成された本装置1においては、従来に準じたウェブ検索の処理として、図示はしないが、ユーザ端末T1からクエリ受付手段11が受け付けた検索クエリを基に、検索手段14が索引記憶手段10を参照してウェブ検索を行い、その結果を検索結果送信手段16がユーザ端末T1に送信して表示させる。一方、本発明に特有の処理として、検索クエリから検索意図を抽出する処理手順を図3のフローチャートに示す。
〔2−1.作用の概要〕
まず、その概要としては、クエリ受付手段11が、ユーザ端末T1から検索クエリの入力を受け付けると(ステップS1)、共起取得手段12が、受け付けられた検索クエリに基づいて、検索ログ記憶手段15を参照して、共起クエリのグループを検索ログや共起クエリデータなどから複数取得し(図3において破線の矩形で示すステップS2)、共通クエリ抽出手段13が、取得された共起クエリの複数の前記グループから、グループ間で共通する共起クエリを共通クエリとして抽出する(ステップS3)。
このように、入力された一又は二以上の検索クエリに基づいて、その検索クエリと直接又は間接にAND検索されるような共起クエリのグループを複数取得し、グループ間で交わる共通クエリを抽出すれば、この共通クエリは、入力された検索クエリから間接的な共起関係が複数存在する語であるから、ユーザの隠れた検索意図であって入力された検索クエリで直接表現されていない検索意図を抽出できたことになる。
そして、上記のように抽出された、検索意図を表す共通クエリは、後に例示するような情報処理に利用される(ステップS4)。なお、検索クエリから共起クエリのグループを複数取得する処理(ステップS2)は、より具体的には、検索クエリが複数か単数かで次のように異なる(ステップS21〜S24)。
〔2−2.検索クエリが複数の場合〕
まず、クエリ受付手段11が受け付けた検索クエリが(ステップS1)、空白で区切られたり「AND」などの論理演算子で結合されるなど複数であった場合は(ステップS21:「YES」)、共起取得手段12は、受け付けられた複数の検索クエリからそれぞれ共起クエリのグループを取得すればよい(ステップS22)。
例えば、図4の概念図に示す例では、「HB 硬さ」のように組み合わせて一度に入力された二つの検索クエリ「HB」「硬さ」のそれぞれから(図4(1))、共起クエリのグループG1とG2を取得し(図4(2))、両グループG1とG2間で共通する共起クエリ「鉛筆」を共通クエリとして抽出している(図4(3))。
このように、複数の検索クエリごとに、それぞれ共起クエリのグループを取得し、その共通クエリを抽出することにより、隠れた検索意図を表す共通クエリを複数の検索クエリから多面的に特定でき、優れた精度で検索意図が抽出できる。なお、本発明は、組み合わせて入力された複数の検索クエリ同士が、たまたま同じ共起クエリのグループに含まれている場合を排除するものではない。そのような場合、各検索クエリに基づくグループ間で共通している他の共起クエリを抽出することができる。
〔2−3.検索クエリが単一の場合〕
一方、クエリ受付手段11が受け付けた検索クエリが(ステップS1)、空白や論理演算子で区切られたり結合されておらず、単語や複合語など一の検索クエリであった場合(ステップS21:「NO」)、共起取得手段12は、まず、受け付けられた一の検索クエリを基に、その検索クエリの共起クエリを一次共起クエリとして複数取得したうえ(ステップS23)、個々の一次共起クエリに対するさらなる共起クエリのグループを取得する(ステップS24)。
例えば、図5の概念図に示す例では、単一の語である「HB」という検索クエリから(図5(1))、検索クエリ「HB」の複数の共起クエリ「硬さ」及び「蒸し方」を一次共起クエリとして取得し(図5(2))、これら個々の一次共起クエリ「硬さ」及び「蒸し方」に対するさらなる共起クエリのグループG21及びG22を取得したとする(図5(3))。一方、入力された検索クエリ「HB」に対する他の共起クエリを、グループG1として取得したとする(図5(3))。
そして、共通クエリ抽出手段13は、以上のように取得された共起クエリの複数のグループG1,G21及びG22から、グループ間で共通する共起クエリを共通クエリとして抽出する。この場合、グループG21とG22間の共通クエリを抽出してもよいが、ここでは、図5(3)において破線で示すように、グループG1とG21間、G1とG22間でそれぞれ共通する共起クエリ「鉛筆」及び「パン」を、共通クエリとして抽出している(図5(4))。
このように、入力された検索クエリが一つでも、それをもとに生成した複数の一次共起クエリからさらに二次的に共起クエリのグループを複数取得し、その二次的な共起クエリのグループを共通クエリ取得の対象とすることにより、複数の間接的共起関係の経路に基づいて優れた精度で検索意図を抽出することができる。
〔2−4.共通クエリの用途〕
以上のように抽出された共通クエリについて、情報処理(ステップS4)における用途は自由であるが、代表例として、以下の三つを挙げることができる。
〔2−4−1.関連検索ワードの提示〕
第一に、共通クエリ抽出手段13により抽出された共通クエリに基づいて、関連提示手段21が、検索クエリに関連する関連検索ワードの提示を行うことが考えられる。例えば、図6に示すウェブ検索画面の例では、入力欄Fに入力された「HB 硬さ」という検索クエリに基づいて抽出された共通クエリである「鉛筆」を、もとの検索クエリの語「HB」「硬さ」と組み合わせ、又は単独で用いる検索クエリ(「関連検索ワード」と呼ぶこととする)Qが、検索結果画面において検索結果に先立って表示され、この検索クエリQのいずれかの操作することでそれに基づく検索結果に表示を切り替えることができる。
このように、入力された検索クエリとAND検索されるような関連検索ワードの提示に、ユーザの隠れた検索意図を表す共通クエリを活用することにより、検索意図に適合した検索結果が得られるので、ウェブ検索の精度が効果的に改善できる。
〔2−4−2.検索連動広告の出力〕
第二に、共通クエリ抽出手段13により抽出された共通クエリに基づいて、広告出力手段22が、検索連動型広告を出力することが考えられる。検索連動型広告は、検索で入力された検索クエリに関する広告を検索結果画面に表示するもので、従来、広告の入稿時に広告主等が、広告表示の条件とする検索クエリであるキーワード(「入札ワード」などとも呼ぶ)を指定し、任意の広告単価で入札しておくと、その入札ワードが入力された検索の結果画面に、広告単価の高い順に所定数の広告がハイパーリンクなどの形で表示されるものであった。
本実施形態における図7の例では、入力された検索クエリ「HB 硬さ」に基づく検索結果画面に、入札ワードとして「鉛筆」を指定している広告Aを表示している。入札ワード「鉛筆」は、検索クエリ「HB 硬さ」に含まれるキーワード「HB」「硬さ」のいずれとも異なるうえ、シノニム(同意語)にも含まれないので、従来、検索クエリ「HB 硬さ」の検索結果画面に検索連動型広告として表示されることはなかった。これに対して、本実施形態では、検索クエリ「HB 硬さ」に基づいて、図4に例示したように抽出された共通クエリ「鉛筆」を活用することにより、表示されている検索連動型広告Aには、図2(2)に例示した広告データで「鉛筆」を指定している広告B456も含まれている。
このように、本実施形態では、検索連動型広告のマッチング(引当て)に、ユーザの隠れた検索意図を表す共通クエリを活用することにより、ユーザの検索意図に適合した広告が表示できるので、CTRなどの広告効果が改善できる。
〔2−4−3.関連入札ワードの提示〕
第三に、共通クエリ抽出手段13により抽出された共通クエリに基づいて、入札提示手段23が、キーワード広告に係る関連入札ワードの提示を行うことが考えられる。関連入札ワードは、広告主などに検索連動型広告を広告主端末T2などから入稿すなわち入力してもらう際に、広告主等の指定した入札ワードに関連する語を、入札提示手段23が、入札ワードに関連する他の候補すなわち関連入札ワードの候補として表示するものである。
例えば、図8に例示する検索連動型広告の入稿画面では、入札ワード入力欄F1に「HB 硬さ」のように入札ワードを入力して、グラフィック表示されている「検索」ボタンB1を操作すると、それを与えられた検索クエリとみなして、図4に例示したように共通クエリ(例えば「鉛筆」)を抽出し、もとの入札ワード「HB」「硬さ」と組み合わせた関連入札ワードの候補Cを、関連入札ワード候補欄F2に表示する。図8の例では、各候補Cにそれぞれ対応して表示されている「追加」ボタンB3を操作すると、その関連入札ワードの候補が、新たな入札ワードとして入札ワード入力欄F1に追加される。このように一又は二以上の入札ワードが入札ワード入力欄F1に表示されている状態で「設定」ボタンB2を操作すると、入札ワード入力欄F1に表示されている全ての入札ワードを指定している広告として、広告単価その他の情報を指定したり確認する画面(図示省略)へ遷移する。
このように、検索連動型やコンテンツマッチなどのキーワード広告の入稿時に入札ワードを指定する際、広告主等の入力した入札ワードに限らず、その隠れた検索意図を表す共通クエリを活用して関連入札ワードの候補として提示することにより、広告を見るユーザにアピールできる語をより広範に指定できるので、キーワード広告の効果を改善できる。
〔3.他の実施形態〕
なお、上記各実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、抽出した共通クエリの用途として、表示する広告の選択に限らず、他の任意の情報の選択も考えられる。例えば、検索結果に関連して検索結果と共に表示する情報であって、推奨する商品又はサービス、ニュース記事その他のコンテンツなどに関する「この商品がオススメ!」「こんな耳より情報も!」のようなレコメンド情報であってもよい。このように、本発明をいわゆるレコメンド情報に適用することにより、各種コンテンツへのアクセス誘導や販売促進などウェブ利用促進効果を期待することが可能となる。
また、本発明の意図抽出装置は、端末で処理を行うツールバー・プログラムなどとして実現する態様も考えられる。この態様は、サーバ装置に通信ネットワークでアクセスするコンピュータで実現する意図検索装置であって、各手段は端末上に実現され動作する。すなわち、クエリ受付手段が、サーバ装置へ送信する検索クエリの入力を受け付けると、共起取得手段が、受け付けられた前記検索クエリに基づいて、共起クエリを表わす所定のデータ又は所定のウェブ検索ログにアクセスすることにより、共起クエリのグループを複数取得する。これら共起クエリのデータやウェブ検索ログは、サーバなどに記憶されているものを通信ネットワーク経由で参照してもよいし、端末上に格納しておいてもよい。そして、共通クエリ抽出手段が、取得された共起クエリの複数の前記グループから、グループ間で共通する共起クエリを共通クエリとして抽出する。
このように端末側で抽出した共通クエリの用途も自由である。一例として、インプットメソッド(IME(インプット・メソッド・エディタ)やFEP(フロント・エンド・プロセッサ)などとも呼ばれる)など日本語入力システムの変換候補や、ウェブ検索サイトにおける関連検索ワードの候補のように、ユーザの入力した部分までの語句を検索クエリとみなしてリアルタイムに抽出した共通クエリを入力欄の近傍に表示することもできる。例えば、入力欄にアルファベットを2文字「HB」まで入力した時点で、入力欄の近傍に「HB(全角)」「HB(半角)」「パン」「鉛筆」のように、抽出した共通クエリを含めた候補を表示し、カーソルやポインタで指定できるようにするなどが考えられる。
また、本発明に関する手段などの各要素は、コンピュータの演算制御部に限らず、ワイヤードロジック等に基づく電子回路など他の情報処理機構で実現してもよい。また、各構成図、データの図、フローチャートの図などは例示に過ぎず、各要素の有無、その配置順序や各処理の実行順序、具体的内容などは適宜変更可能である。
また、本装置は、構成要素となるサーバなどの装置を複数用いて実現することができ、個々の記憶手段を別個独立のサーバ装置やシステムで実現したり、個々の処理手段を複数のサーバの組合せで実現する構成も一般的である。また、機能によっては、外部のプラットフォーム等をAPI(アプリケーション・プログラム・インタフェース)やネットワークコンピューティング(いわゆるクラウドなど)で呼び出して実現するなど、構成は柔軟に変更できる。
1 検索サーバ(本装置)
6 演算制御部
7 記憶装置
8 通信手段
10 索引記憶手段
11 クエリ受付手段
12 共起取得手段
13 共通クエリ抽出手段
15 検索ログ記憶手段
16 検索結果送信手段
20 広告記憶手段
21 関連提示手段
22 広告出力手段
23 入札提示手段
A 検索連動型広告
B1〜B3 ボタン
C 候補
F 入力欄
F1 入札ワード入力欄
F2 関連入札ワード候補欄
G(G1,G21,G22) グループ
N 通信ネットワーク
Q 検索クエリ
T(T1,T2) 端末

Claims (9)

  1. 検索クエリの入力を受け付けるクエリ受付手段と、
    受け付けられた前記検索クエリに基づいて共起クエリのグループを複数取得する共起取得手段と、
    取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出する共通クエリ抽出手段と、
    を有することを特徴とする意図抽出装置。
  2. 前記クエリ受付手段は、複数の前記検索クエリの入力を受け付け、
    前記共起取得手段は、受け付けられた複数の前記検索クエリからそれぞれ共起クエリのグループを取得する
    ことを特徴とする請求項1記載の意図抽出装置。
  3. 前記クエリ受付手段は、一の前記検索クエリの入力を受け付け、
    前記共起取得手段は、受け付けられた一の前記検索クエリを基に、その検索クエリの共起クエリを一次共起クエリとして複数取得し、個々の一次共起クエリに対するさらなる共起クエリのグループを取得する
    ことを特徴とする請求項1記載の意図抽出装置。
  4. 前記共通クエリ抽出手段により抽出された前記共通クエリに基づいて、前記検索クエリに関連する関連検索ワードの提示を行う関連提示手段を有する
    ことを特徴とする請求項1から3のいずれか一項に記載の意図抽出装置。
  5. 前記共通クエリ抽出手段により抽出された前記共通クエリに基づいて、検索連動型広告を出力する広告出力手段を有する
    ことを特徴とする請求項1から4のいずれか一項に記載の意図抽出装置。
  6. 前記共通クエリ抽出手段により抽出された前記共通クエリに基づいて、キーワード広告に係る関連入札ワードの提示を行う入札提示手段を有する
    ことを特徴とする請求項1から5のいずれか一項に記載の意図抽出装置。
  7. コンピュータが、検索クエリの入力を受け付けるクエリ受付処理と、
    コンピュータが、受け付けられた前記検索クエリに基づいて共起クエリのグループを複数取得する共起取得処理と、
    コンピュータが、取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出する共通クエリ抽出処理と、
    を含むことを特徴とする意図抽出方法。
  8. コンピュータに、検索クエリの入力を受け付けさせ、
    コンピュータに、受け付けられた前記検索クエリに基づいて共起クエリのグループを複数取得させ、
    コンピュータに、取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出させる
    ことを特徴とする意図抽出プログラム。
  9. サーバ装置に通信ネットワークでアクセスするコンピュータで実現する意図抽出装置であって、
    前記サーバ装置へ送信する検索クエリの入力を受け付けるクエリ受付手段と、
    受け付けられた前記検索クエリに基づいて、共起クエリを表わす所定のデータ又は所定のウェブ検索ログにアクセスすることにより、共起クエリのグループを複数取得する共起取得手段と、
    取得された共起クエリの複数の前記グループから、該複数のグループのうち異なるグループ間で共通する共起クエリを共通クエリとして抽出する共通クエリ抽出手段と、
    を有することを特徴とする意図抽出装置。
JP2010261360A 2010-11-24 2010-11-24 意図抽出装置、方法及びプログラム Active JP5256273B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010261360A JP5256273B2 (ja) 2010-11-24 2010-11-24 意図抽出装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010261360A JP5256273B2 (ja) 2010-11-24 2010-11-24 意図抽出装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012113486A JP2012113486A (ja) 2012-06-14
JP5256273B2 true JP5256273B2 (ja) 2013-08-07

Family

ID=46497644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010261360A Active JP5256273B2 (ja) 2010-11-24 2010-11-24 意図抽出装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5256273B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5577385B2 (ja) * 2012-06-26 2014-08-20 ヤフー株式会社 コンテンツ配信装置
JP5558539B2 (ja) * 2012-09-24 2014-07-23 ヤフー株式会社 検索システム、検索方法およびプログラム
CN106164889A (zh) * 2013-12-02 2016-11-23 丘贝斯有限责任公司 用于内存数据库搜索的系统和方法
JP6281381B2 (ja) * 2014-03-31 2018-02-21 大日本印刷株式会社 サーバ装置、プログラム及び推薦情報提供方法
JP6728445B1 (ja) * 2019-05-28 2020-07-22 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4366062B2 (ja) * 2002-09-18 2009-11-18 株式会社野村総合研究所 連想検索システム
JP2009043125A (ja) * 2007-08-10 2009-02-26 Kddi Corp ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法およびプログラム
JP4999796B2 (ja) * 2008-07-18 2012-08-15 ヤフー株式会社 配信された広告に関する情報を蓄積するサーバ、方法及びプログラム
JP5494493B2 (ja) * 2008-11-28 2014-05-14 日本電気株式会社 情報検索装置、情報検索方法、及びプログラム

Also Published As

Publication number Publication date
JP2012113486A (ja) 2012-06-14

Similar Documents

Publication Publication Date Title
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US9087108B2 (en) Determination of category information using multiple stages
US20140278939A1 (en) Advertisement extraction device and advertisement extraction method
US9990442B2 (en) Method for determining relevant search results
US9552415B2 (en) Category classification processing device and method
JP5256273B2 (ja) 意図抽出装置、方法及びプログラム
US9542491B2 (en) Utilizing keystroke logging to determine items for presentation
JP5480058B2 (ja) 広告マッチング装置、方法及びプログラム
JP2012008610A (ja) 検索装置、方法及びプログラム
US11170039B2 (en) Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium
JP2015203961A (ja) 文書抽出システム
JP5130340B2 (ja) 情報選択装置、方法及びプログラム
JP2013020462A (ja) 関連度算出装置及び方法
JP2019175212A (ja) 情報表示装置、記事ページ生成装置、情報処理装置、情報表示システム及びプログラム
JP6167029B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法
CN112597760A (zh) 文档中的领域词提取方法和装置
JP2017004260A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
WO2019218151A1 (zh) 一种资料搜寻方法
JP2016192067A (ja) 検索装置
US11003659B2 (en) Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium
JP7203398B1 (ja) ページ生成装置、ウェブページの生産方法、およびプログラム
JP6050273B2 (ja) 検索機能リンク作成装置、方法、ユーザ端末、および広告配信方法
JP5762480B2 (ja) 情報処理装置及び方法
JP2012068687A (ja) 情報処理装置、方法及びプログラム
JP5908338B2 (ja) 特徴語選定サーバ及び特徴語選定方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20121204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130422

R150 Certificate of patent or registration of utility model

Ref document number: 5256273

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250