JP2015022528A - トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム - Google Patents

トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム Download PDF

Info

Publication number
JP2015022528A
JP2015022528A JP2013150275A JP2013150275A JP2015022528A JP 2015022528 A JP2015022528 A JP 2015022528A JP 2013150275 A JP2013150275 A JP 2013150275A JP 2013150275 A JP2013150275 A JP 2013150275A JP 2015022528 A JP2015022528 A JP 2015022528A
Authority
JP
Japan
Prior art keywords
query
search
trigger
node
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013150275A
Other languages
English (en)
Other versions
JP5787941B2 (ja
Inventor
藤田 澄男
Sumio Fujita
澄男 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013150275A priority Critical patent/JP5787941B2/ja
Priority to US14/319,382 priority patent/US9940408B2/en
Publication of JP2015022528A publication Critical patent/JP2015022528A/ja
Application granted granted Critical
Publication of JP5787941B2 publication Critical patent/JP5787941B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】従来、あるカテゴリのキーワードを取得する場合に、人手で網羅的にキーワードを取得することは困難であるという問題があった。【解決手段】2個の検索ログが有する検索クエリそれぞれに対応するノードと、一方のノードから、他方のノードまでのリンクとを有する最小有向グラフを作成するグラフ作成手段102と、最小有向グラフから構成される有向グラフのノードごとに、シードクエリを用いて、スコアを算出するスコア算出手段104と、スコアが、条件を満たすノードに対応する検索クエリであるトリガクエリを取得するトリガクエリ取得手段105と、そのトリガクエリを出力する出力手段107とを具備するトリガクエリ取得装置1により、クエリのログを用いて、あるカテゴリに対応するキーワードを自動で取得できる。【選択図】図1

Description

本発明は、トリガクエリを取得するトリガクエリ取得装置等に関するものである。
近年、インターネットにおいて検索エンジンが日常的に用いられている。その検索エンジンは、検索に用いられる1以上のキーワードを有するクエリが入力された場合に、そのクエリに対応する検索結果を出力する。一方、その入力されたクエリは、検索以外にも用いられることがある。例えば、キーワードターゲティング広告のように、入力されたクエリに対応した広告配信が行われることもある(例えば、特許文献1参照)。そのようなキーワードターゲティング広告では、あらかじめ設定している広告キーワードに応じたクエリが入力された場合に、その広告キーワードに対応した広告が配信されることになる。
特開2013−84264号公報
キーワードターゲティング広告の場合、広告キーワードの数が少ないとその広告があまり表示されないという問題がある。例えば、キーワードターゲティング広告では、八百屋の広告キーワードとして、「キャベツ」と「レタス」をあらかじめ設定していると、広告キーワードではない「トマト」に対しては広告を表示できない。このように、提示する情報に対応するキーワードは多い方が良いが、そのようなキーワードを人手で網羅的に取得することは、難しいという問題があった。
一般的にいえば、あるカテゴリのキーワードを取得する場合に、人手で網羅的にキーワードを取得することは困難であるという問題があった。
上記問題に対し、本発明の目的は、検索に用いられたクエリのログを用いて、あるカテゴリに対応するキーワードを自動で取得することである。
本第一の発明のトリガクエリ取得装置等は、ウェブページを取得する検索に用いられた、1以上のキーワードを有するクエリである検索クエリを含む2以上の検索ログのうち、関連を有する2個の検索ログが有する検索クエリそれぞれに対応するノードと、一方のノードから、他方のノードまでのリンクとを有する最小単位の有向グラフである最小有向グラフを作成するグラフ作成手段と、グラフ作成手段で作成された最小有向グラフによって構成される有向グラフのノードごとに、特定のカテゴリに属するキーワードを含むクエリであるシードクエリからノードのスコアを伝播して、シードクエリとの関連度に関するリンク解析に基づいたスコアを算出するスコア算出手段と、スコア算出手段が算出したスコアが、あらかじめ決められた条件を満たすノードに対応する検索クエリであり、シードクエリが有するキーワードと同じカテゴリに関するキーワードを含む検索クエリであるトリガクエリを取得するトリガクエリ取得手段と、トリガクエリ取得手段が取得したトリガクエリを出力する出力手段とを具備するトリガクエリ取得装置である。
また、本第二の発明のトリガクエリ取得装置は、第一の発明に対して、グラフ作成手段は、2個の検索ログが有する検索クエリそれぞれに対応するノードと、2個のノードのうち、検索される範囲が広い検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、トリガクエリ取得装置である。
また、本第三の発明のトリガクエリ取得装置は、第一または第二の発明に対して、検索ログは、検索ログに含まれる検索クエリに応じた検索結果のうち、ユーザが選択したウェブページを識別するウェブページ識別情報をさらに含む情報であり、グラフ作成手段は、同一のウェブページ識別情報を含む2個の検索ログであり、少なくとも一方が、2以上の検索ログにおいて、ウェブページ識別情報が最も多く選択されている検索クエリを有する検索ログである2個の検索ログに含まれる検索クエリそれぞれに対応するノードと、2個のノードのうち、一方のノードから、ウェブページ識別情報が最も多く選択されている検索クエリに対応する他方のノードまでのリンクとを有する最小有向グラフを作成する、トリガクエリ取得装置である。
また、本第四の発明のトリガクエリ取得装置は、第一から第三のいずれか一項の発明に対して、検索ログは、検索ログに含まれる検索クエリに応じた検索結果のうち、ユーザが選択したウェブページを識別するウェブページ識別情報をさらに含む情報であり、グラフ作成手段は、同一のウェブページ識別情報を有する2個の検索ログであって、検索クエリが包含関係にある2個の検索ログが有する検索クエリそれぞれに対応するノードと、2個のノードのうち、一方の検索クエリに包含される検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、トリガクエリ取得装置である。
また、本第五の発明のトリガクエリ取得装置は、第一から第四のいずれか一項の発明に対して、検索ログは、検索ログに含まれる検索クエリに応じた検索結果のうち、ユーザが選択したウェブページを識別するウェブページ識別情報と、ウェブページ識別情報の検索結果における順位を示す順位情報とをさらに含み、グラフ作成手段は、同一のウェブページ識別情報を含む2個の検索ログであり、少なくとも一方が最も高い順位情報を有する検索ログである2個の検索ログに含まれる検索クエリそれぞれに対応するノードと、2個のノードのうち、一方のノードから、最も高い順位情報を有する検索ログに含まれる検索クエリに対応する他方のノードまでのリンクとを有する最小有向グラフを作成する、トリガクエリ取得装置である。
また、本第六の発明のトリガクエリ取得装置は、第一から第五のいずれか一項の発明に対して、グラフ作成手段は、検索クエリが包含関係にある2個の検索ログが有する検索クエリそれぞれに対応するノードと、2個のノードのうち、一方の検索クエリに包含される検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、トリガクエリ取得装置である。
また、本第七の発明のトリガクエリ取得装置は、第一から第六のいずれか一項の発明に対して、検索ログは、検索ログに含まれる検索クエリが検索に用いられた時点に関する時点情報と、検索クエリを入力したユーザを識別するユーザ識別情報とをさらに含み、グラフ作成手段は、時点情報が示す時点が所定の期間以内である2個の検索ログが有する検索クエリそれぞれに対応するノードと、2個のノードのうち、古い時点を示す時点情報を有する検索ログに含まれる検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、トリガクエリ取得装置である。
また、本第八の発明のトリガクエリ取得装置は、第一から第七のいずれか一項の発明に対して、トリガクエリが格納されるトリガクエリ格納手段と、端末装置から、検索に用いるキーワードを含むクエリである新規クエリを受信するクエリ受信手段と、新規クエリが、トリガクエリのいずれかと一致した場合に、トリガクエリを取得するのに用いたシードクエリに含まれるキーワードのカテゴリに応じたトリガクエリ専用の検索結果を取得し、出力する専用検索結果出力手段とをさらに具備し、出力手段は、トリガクエリ格納手段にトリガクエリを蓄積する、トリガクエリ取得装置である。
本発明によるトリガクエリ取得装置等によれば、検索に用いられたクエリのログを用いて、あるカテゴリに対応するキーワードを自動で取得できる。
実施の形態1におけるトリガクエリ取得装置のブロック図 同実施の形態におけるグラフ作成手段が作成する最小有向グラフによって構成される有向グラフの一例を示す図 同実施の形態におけるトリガクエリ取得装置の動作を示すフローチャート 同実施の形態における検索ログ格納手段に格納されている検索ログの一例を示す図 同実施の形態におけるシードクエリ格納手段に格納されているシードクエリの一例を示す図 同実施の形態におけるカテゴリの情報と専門検索の種類の対応の一例を示す図 同実施の形態におけるトリガクエリ格納手段に格納されているトリガクエリの一例を示す図 同実施の形態の端末装置における表示例を示す図 同実施の形態におけるコンピュータシステムの外観の一例を示す図 同実施の形態におけるコンピュータシステムの構成の一例を示す図
以下、トリガクエリ取得装置等の実施の形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、検索ログを用いて有向グラフを作成し、その有向グラフを用いてトリガクエリを取得するトリガクエリ取得装置1について説明する。
図1は、本実施の形態におけるトリガクエリ取得装置1のブロック図である。トリガクエリ取得装置1は、検索ログ格納手段101、グラフ作成手段102、シードクエリ格納手段103、スコア算出手段104、トリガクエリ取得手段105、トリガクエリ格納手段106、出力手段107、クエリ受信手段108、検索結果取得手段109、専用検索結果出力手段110、および送信手段111を備える。また、トリガクエリ取得装置1は、ネットワーク100を介して1または2以上の端末装置2と接続されていても良い。ネットワーク100は、有線、または無線の通信回線であり、例えば、インターネットやイントラネット、LAN(Local Area Network)、公衆電話回線等である。端末装置2は、ネットワーク100に接続可能な端末であれば何でも良い。例えば、端末装置2は、デスクトップパソコン、ノートパソコン、スマートフォン、またはPDA等であっても良い。
検索ログ格納手段101には、1または2以上のキーワードを有するクエリである検索クエリを含む検索ログが2以上格納される。検索クエリは、ウェブページを取得する検索に用いられたクエリである。検索クエリに2以上のキーワードが含まれている場合において、キーワードの順番が異なる2個の検索クエリは、同じ検索クエリとして扱われても良く、異なる検索クエリとして扱われても良い。つまり、検索クエリ「キーワードA キーワードB」と「キーワードB キーワードA」とは、同じ検索クエリとして扱われても良く、異なる検索クエリとして扱われても良い。以下、2以上のキーワードを有するクエリ間において、完全に一致しているかどうか、一部が一致しているかどうか、または包含しているかどうか等の判断を行う場合は、同様に、キーワードの順番を考慮しても良く、考慮しなくても良い。検索ログは、検索クエリ以外の情報を含んでいても良く、含んでいなくても良い。検索ログに含まれる検索クエリ以外の情報は、例えば、ウェブページ識別情報であっても良く、順位情報であっても良く、時点情報であっても良く、ユーザ識別情報であっても良く、それらの任意の2以上の情報であっても良い。以下、「検索クエリを有する検索ログに含まれる時点情報」等の検索ログに含まれる情報を指定する場合は、「検索クエリに対応する時点情報」等のように記載することもある。
ウェブページ識別情報とは、そのウェブページ識別情報を有する検索ログに含まれる検索クエリに応じた検索結果のうち、ユーザが選択したウェブページを識別する情報である。検索クエリに応じた検索結果とは、検索クエリに含まれるキーワードを用いて行ったウェブ検索の結果であり、そのキーワードを含むウェブページを識別する情報のリストである。ウェブページ識別情報は、URLであっても良く、IPアドレスであっても良く、ウェブページのID等であっても良い。ウェブページのIDは、例えば、図示しない格納手段、または、図示しない外部の装置で格納されている情報によって、ウェブページのURLやIPアドレス等の情報と対応付けられている情報であっても良い。
また、順位情報とは、その順位情報を有する検索ログに含まれる検索クエリに応じた検索結果であるウェブページのリストにおける、ユーザが選択したウェブページ識別情報の順位を示す情報である。ウェブページ識別情報の順位は、ウェブページを取得する検索エンジンが検索クエリに応じて取得したリストの順序における順位であっても良く、検索結果を含む情報が表示された際の順序における順位であっても良い。検索結果を含む情報は、例えば、通常の検索結果と専門の検索結果とを含む情報等である。
また、時点情報とは、その時点情報を有する検索ログに含まれる検索クエリが検索に用いられた時点に関する情報である。時点情報は、例えば、ウェブページを取得する検索エンジンを有する装置に検索クエリが受け付けられた時点を示す情報であっても良く、その検索エンジンによる検索が開始された時点を示す情報であっても良く、その検索エンジンによる検索が終了した時点を示す情報であっても良く、その検索エンジンを有する装置が検索結果を出力した時点を示す情報であっても良く、その検索結果を受け付けた端末装置を用いるユーザが、検索結果から任意のウェブページ識別情報を選択した時点を示す情報であっても良い。
また、ユーザ識別情報とは、そのユーザ識別情報を有する検索ログに含まれる検索クエリを入力したユーザを識別する情報である。ユーザ識別情報は、例えば、IPアドレス、セッションID、またはユーザのログイン情報等であっても良い。なお、セッションIDは、Cookieで管理されている情報であっても良く、他の方法で管理されている情報であっても良い。
検索ログ格納手段101に検索ログが蓄積される過程は問わない。例えば、記録媒体を介して検索ログが検索ログ格納手段101で蓄積されるようになっても良く、通信回線等を介して送信された検索ログが検索ログ格納手段101で蓄積されるようになっても良く、あるいは、入力デバイスを介して入力された検索ログが検索ログ格納手段101で蓄積されるようになっても良い。なお、検索ログ格納手段101には、クエリ受信手段108等の受信手段が受信したクエリが検索に用いられた場合に、そのクエリである検索クエリを含む検索ログが蓄積されるようになっても良い。
グラフ作成手段102は、最小単位の有向グラフである最小有向グラフを作成する。最小有向グラフとは、2個のノードとそのノード間をつなぐ向きを有するリンクを有するグラフである。グラフ作成手段102が作成する最小有向グラフは、関連を有する2個の検索ログが有する検索クエリそれぞれに対応するノードと、一方のノードから、他方のノードまでのリンクとを有する有向グラフである。例えば、グラフ作成手段102は、2個の検索ログが有する検索クエリそれぞれに対応するノードと、その2個のノードのうち、検索される範囲が広い検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成しても良い。検索される範囲は、検索した結果得られる情報の範囲と言い換えても良い。具体的には、最小有向グラフは、(「辞書」→「電子辞書」)や、(「家電製品」→「電子レンジ」)等である。グラフ作成手段102は、2個のノードをと、その2個のノードに対するリンクとを生成することで、最小有効グラフを作成しても良い。グラフ作成手段102は、例えば、(1)最頻検索基準を用いた共クリック条件を満たす最小有向グラフを作成しても良く、(2)文字列拡張基準を用いた共クリック条件を満たす最小有向グラフを作成しても良く、(3)最良検索基準を用いた共クリック条件を満たす最小有向グラフを作成しても良く、(4)共クエリ条件を満たす最小有向グラフを作成しても良く、(5)共ユーザ条件を満たす最小有向グラフを作成しても良い。グラフ作成手段102は、上記(1)から(5)のうちいずれか1以上の条件を用いて最小有向グラフを作成しても良い。以下、上記各条件を満たす最小有向グラフを作成する方法について詳細に説明する。なお、各条件の説明に際して、検索ログ格納手段101には、図4に示す検索ログが格納されているものとする。なお、図4のテーブルは、検索ログIDと検索クエリとウェブページ識別情報と順位情報とユーザ識別情報と時点情報とを有している。例えば、検索ログID「100」の検索ログは、検索クエリ「×××本」、ウェブページ識別情報「http://aaa.web」、順位情報「3」、ユーザ識別情報「Session100」、および時点情報「12:00」を有している。なお、条件によっては、一部の情報が検索ログに含まれていなくても良い。
(1)最頻検索基準を用いた共クリック条件を満たす最小有向グラフ
最頻検索基準を用いた共クリック条件は、検索クエリとウェブページ識別情報とが、検索ログに含まれている場合、かつ、同一の検索クエリによるそのウェブページ識別情報の選択回数を取得できる場合に用いることができる条件である。なお、選択回数は、検索ログに含まれていても良く、検索ログに含まれていなくても良い。選択回数が検索ログに含まれない場合は、選択回数は、検索ログを用いて算出されても良い。検索ログを用いて選択回数を算出する場合は、グラフ作成手段102は、例えば、検索クエリAとウェブページ識別情報Bとを含む検索ログの個数を取得しても良い。この場合その検索ログログの個数が選択回数となる。最頻検索基準を用いた共クリック条件を用いて最小有向グラフを作成する場合は、グラフ作成手段102は、同一のウェブページ識別情報を含む2個の検索ログであり、少なくとも一方が、2以上の検索ログにおいて、ウェブページ識別情報が最も多く選択されている検索クエリを有する検索ログである2個の検索ログに含まれる検索クエリそれぞれに対応するノードと、2個のノードのうち、一方のノードから、ウェブページ識別情報が最も多く選択されている検索クエリに対応する他方のノードまでのリンクとを有する最小有向グラフを作成しても良い。グラフ作成手段102は、最も頻度が高く特定のウェブページ識別情報を選択された検索クエリに対応するノードへ、そのウェブページ識別情報を選択した他の検索クエリに対応するノードからそれぞれリンクする複数の最小有向グラフを作成しても良い。なお、2以上の検索ログは、同一のウェブページ識別情報を含む2個の検索ログのことであっても良く、検索ログ格納手段101に格納されている検索ログのことであっても良い。グラフ作成手段102は、具体的には、図2のように、検索ログID「100」と検索ログID「101」および「106」を用いて、最小有向グラフ(「×××本」→「漫画×××」)を作成する。(「×××本」→「漫画×××」)は、検索ログID「100」と検索ログID「101」とにおいて、ウェブページ識別情報「http://aaa.web」が共通し、かつ、検索クエリ「×××本」を有する検索ログが、検索ログID「100」の1個、検索クエリ「漫画×××」を有する検索ログが、検索ログID「101」および「106」の2個であり、後者の選択回数が最も多いため、作成される。
(2)文字列拡張基準を用いた共クリック条件を満たす最小有向グラフ
文字列拡張基準を用いた共クリック条件は、検索クエリとウェブページ識別情報とが、検索ログに含まれている場合に用いることができる条件である。文字列拡張基準を用いた共クリック条件を用いて最小有向グラフを作成する場合は、グラフ作成手段102は、同一のウェブページ識別情報を有する2個の検索ログであって、検索クエリが包含関係にある2個の検索ログが有する検索クエリそれぞれに対応するノードと、その2個のノードのうち、一方の検索クエリに包含される検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する。「検索クエリが包含関係にある」とは、ある検索クエリと、その検索クエリに含まれるすべてのキーワードを含み、かつ、その検索クエリに含まれるいずれかのキーワードと完全に一致しないキーワードを有する検索クエリとの関係を示す。その場合は、前者の検索クエリが、前者の検索クエリが包含されることになる。検索クエリの包含関係は、例えば、キーワードと、そのキーワードを拡張したキーワードとの関係であっても良く、キーワードと、そのキーワードおよび別の1以上のキーワードとの関係であっても良い。なお、包含関係の判断において、キーワードの数、キーワードの順番、およびキーワードの区切り方は、問わない。また、ここでいう包含関係は、完全に一致する場合を含まないものとする。検索クエリの包含関係は、具体的には、検索クエリ「×××本」と検索クエリ「●●×××本」とのようにキーワードを拡張した関係であっても良く、検索クエリ「×××本」と検索クエリ「×××本 通販」とのように、キーワードとは別の1以上のキーワードを追加した関係であっても良く、検索クエリ「×××本 通販」と検索クエリ「●●×××本 通販価格」とのような関係であっても良い。なお、ここでは、「空白(スペース)」をキーワードの区切り表現に用いている。グラフ作成手段102は、具体的には、図2のように、検索ログID「100」と検索ログID「102」を用いて、最小有向グラフ(「×××本」→「●●×××本」)を作成する。(「×××本」→「●●×××本」)は、検索ログID「100」と検索ログID「102」とにおいて、ウェブページ識別情報「http://aaa.web」が共通し、かつ、検索ログID「100」の検索クエリ「×××本」を、検索ログID「102」の検索クエリ「●●×××本」が包含しているため、作成される。
(3)最良検索基準を用いた共クリック条件を満たす最小有向グラフ
最良検索基準を用いた共クリック条件は、検索クエリとウェブページ識別情報と順位情報とが、検索ログに含まれている場合に用いることができる条件である。最良検索基準を用いた共クリック条件を用いて最小有向グラフを作成する場合は、グラフ作成手段102は、同一のウェブページ識別情報を含む2個の検索ログであり、少なくとも一方が最も高い順位情報を有する検索ログである2個の検索ログに含まれる検索クエリそれぞれに対応するノードと、2個のノードのうち、一方のノードから、最も高い順位情報を有する検索ログに含まれる検索クエリに対応する他方のノードまでのリンクとを有する最小有向グラフを作成する。グラフ作成手段102は、具体的には、図2のように、検索ログID「100」と検索ログID「103」を用いて、最小有向グラフ(「×××本」→「△△△本」)を作成する。(「×××本」→「△△△本」)は、検索ログID「100」と検索ログID「103」とにおいて、ウェブページ識別情報「http://aaa.web」が共通し、かつ、検索ログID「103」の順位情報「1」が最も高い順位情報を有しているため、作成される。
(4)共クエリ条件を満たす最小有向グラフ
共クエリ条件を用いて最小有向グラフを作成する場合は、グラフ作成手段102は、検索クエリが包含関係にある2個の検索ログが有する検索クエリそれぞれに対応するノードと、その2個のノードのうち、一方の検索クエリに包含される検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する。「検索クエリが包含関係にある」に関する説明は、上記「(2)文字列拡張基準を用いた共クリック条件を満たす最小有向グラフ」で説明した内容と同じものである。グラフ作成手段102は、具体的には、図2のように、検索ログID「100」と検索ログID「104」を用いて、最小有向グラフ(「×××本」→「×××本 通販」)を作成する。(「×××本」→「×××本 通販」)は、検索ログID「100」と検索ログID「104」とにおいて、検索ログID「100」の検索クエリ「×××本」を、検索ログID「104」の検索クエリ「×××本 通販」が包含しているため、作成される。
(5)共ユーザ条件を満たす最小有向グラフ
共ユーザ条件は、検索クエリとユーザ識別情報と時点情報とが、検索ログに含まれている場合に用いることができる条件である。共ユーザ条件を用いて最小有向グラフを作成する場合は、グラフ作成手段102は、時点情報が示す時点が所定の期間以内である2個の検索ログが有する検索クエリそれぞれに対応するノードと、その2個のノードのうち、古い時点を示す時点情報を有する検索ログに含まれる検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する。所定の期間は、数分程度が好適と考えられるが、数時間等であっても良い。所定の期間は、図示しない受付部がユーザから受け付けた指示に応じて図示しない設定手段によって設定されても良い。なお、その設定は、変更であっても良い。グラフ作成手段102は、ある検索ログに含まれる時点情報を起点として、所定の期間以内の時点情報を有する直後の検索ログとの関係のみを用いて最小有向グラフを作成しても良く、所定の期間以内の時点情報を有する複数の検索ログそれぞれとの関係を用いて最小有向グラフを作成しても良い。グラフ作成手段102は、具体的には、所定の期間が10分間等である場合に、図2のように、検索ログID「100」と検索ログID「105」を用いて、最小有向グラフ(「×××本」→「○○○本」)を作成する。(「×××本」→「○○○本」)は、検索ログID「100」と検索ログID「105」とにおいて、ユーザ識別情報「Session100」が共通し、かつ、検索ログID「100」の時点情報「12:00」から、検索ログID「104」の時点情報「12:03」までが10分以内であるため、作成される。
なお、上記各条件は、図示しない格納手段に格納されていても良い。グラフ作成手段102は、上記条件のうち、一部の条件を用いて最小有向グラフを作成しても良く、すべての条件を用いて最小有向グラフを作成しても良い。
シードクエリ格納手段103には、特定のカテゴリに属する1または2以上のキーワードを含むクエリであるシードクエリが1以上格納される。シードクエリは、スコア算出手段104において、特定のノードに重みを付けるために用いるクエリである。シードクエリは、トリガクエリの一部となり得るクエリであり、そのトリガクエリを取得するための元になるクエリである。なお、シードクエリは、多くの場合に、人手で作成される情報である。特定のカテゴリは、例えば、「果物」であっても良く、「自動車」であっても良く、「本」等であっても良い。カテゴリが「果物」である場合のシードクエリは、例えば、「スイカ」、「みかん」または、「いちご」等であっても良い。なお、このようなシードクエリを用いて取得できるトリガクエリは、例えば、「メロン」、「ネーブル」、または「ドラゴンフルーツ」等である。シードクエリ格納手段103には、1種類のカテゴリに対応するシードクエリのみが格納されていても良く、2種類以上のカテゴリそれぞれに対応するシードクエリが格納されていても良い。シードクエリ格納手段103に2種類以上のカテゴリそれぞれに対応するシードクエリが格納される場合は、シードクエリ格納手段103には、シードクエリに対応するカテゴリを識別する情報であるカテゴリ識別情報をさらに含んでいることが好適である。なお、カテゴリ識別情報は、カテゴリを示す情報であっても良く、図示しない格納手段、または外部の装置に格納されているカテゴリを示す情報を識別するID等であっても良い。
シードクエリ格納手段103にシードクエリが蓄積される過程は問わない。例えば、記録媒体を介してシードクエリがシードクエリ格納手段103で蓄積されるようになっても良く、通信回線等を介して送信されたシードクエリがシードクエリ格納手段103で蓄積されるようになっても良く、あるいは、入力デバイスを介して入力されたシードクエリがシードクエリ格納手段103で蓄積されるようになっても良い。なお、シードクエリ格納手段103は、図示しない受付手段が受け付けたシードクエリが一時的に格納される格納手段であっても良い。この場合のシードクエリ格納手段103に格納されるシードクエリは、ユーザの入力によって更新可能な情報であっても良い。
スコア算出手段104は、グラフ作成手段102で作成された最小有向グラフによって構成される有向グラフのノードごとに、シードクエリからノードのスコアを伝播して、シードクエリとの関連度に関するリンク解析に基づいたスコアを算出する。複数の最小有向グラフによって構成される有向グラフとは、それぞれの最小有向グラフのノードに対応する検索クエリのうち、同一の検索クエリに対応するノードを同じノードと見なした有向グラフである。スコア算出手段104が算出するスコアは、結果として、ノードに対応する検索クエリが有するキーワードが、シードクエリが有するキーワードと同じカテゴリに属する場合に大きな値となるスコアであっても良く、小さな値となるスコアであっても良い。つまり、スコアは、シードクエリと意味的に近ければ大きな値となり、意味的に遠ければ小さな値となる情報であっても良く、シードクエリと意味的に近ければ小さな値となり、意味的に遠ければ大きな値となる情報であっても良い。
「シードクエリからノードのスコアを伝播して、シードクエリとの関連度に関するリンク解析に基づいたスコアを算出する」とは、Biased−PageRankやPersonalized−PageRank、またはノードに対して重み付けを行ったHITS等のような、特定のノードに重みをつけてリンク解析を行う手法を用いて算出することであっても良く、上記手法を用いて算出した値に対して四則演算を行って算出することであっても良い。シードクエリは、例えば、重みを設定する特定のノードを指定するために用いられる。例えば、スコア算出手段104は、シードクエリと一致する検索クエリに対応するノードに対して重みを設定しても良い。Biased−PageRankについては、特開2011−28509号等を参考にされたい。Biased−PageRank、およびPersonalized−PageRank等は公知技術であるため、詳細な説明は省略する。また、スコア算出手段104は、リンク解析時に、リンクに重みを設定しても良い。スコア算出手段104は、類義語辞書等のキーワード間の類似性を判断できる情報を用いて、類似する検索クエリに対応するノード間ほど、遷移確率を上げるようにリンクに重みを設定しても良く、共通のウェブページ識別情報を選択している回数が多いほど、遷移確率を上げるようにリンクに重みを設定しても良く、機械学習を用いてリンクに重みを設定しても良い。スコア算出手段104が機械学習を用いる場合は、例えば、スコア算出手段104は、2個の検索クエリにおける共通のウェブページ識別情報が選択された回数や、そのうちの一方の検索クエリのそのウェブページ識別情報が選択された回数等、様々な条件におけるウェブページ識別情報が選択された回数やその割合を素性とし、共クリック条件、共クエリ条件、および共ユーザ条件のうち、1以上の条件を組み合わせた条件を満たすクエリの組を遷移確率が高い正解データとした機械学習を行い、その学習結果を適用してリンクの重みを設定しても良い。あるいは、2個の検索クエリにおける共通のウェブページ識別情報が選択された回数、そのうちの一方の検索クエリのそのウェブページ識別情報が選択された回数、様々な条件におけるウェブページ識別情報が選択された回数やその割合、共クリック条件を満たす度合い、共クエリ条件を満たす度合い、および共ユーザ条件を満たす度合い等のうち、1以上の組み合わせを素性として、クエリ間の関連度に関する外部から与えられる教師情報を用いて機械学習を行い、その学習結果を適用してリンクの重みを設定しても良い。
なお、スコア算出手段104は、シードクエリ格納手段103に、複数のカテゴリそれぞれに対応するシードクエリが格納されている場合は、有向グラフに含まれるそれぞれのノードに対して、カテゴリ毎のスコアを算出しても良い。
トリガクエリ取得手段105は、スコア算出手段104が算出したスコアが、あらかじめ決められた条件を満たすノードに対応する検索クエリであるトリガクエリを取得する。トリガクエリは、シードクエリが有するキーワードと同じカテゴリに関するキーワードを含む情報である。トリガクエリとは、専用検索結果出力手段110で、専用検索を呼び出すためのトリガとなるクエリである。なお、トリガクエリ取得手段105が取得するトリガクエリは、スコア算出手段104で用いたシードクエリに含まれるキーワードと同じカテゴリのキーワードを含むクエリである。あらかじめ決められた条件は、スコアが、シードクエリと意味的に近ければ大きな値となる場合に、スコアの値があらかじめ決められた条件を満たすほど高いことであっても良い。この場合のあらかじめ決められた条件は、あらかじめ決められた閾値より高いことであっても良く、スコアの平均に1より大きな数を掛けた値である閾値より高いことであっても良く、上位からN件のスコアという条件であっても良く、上位からRパーセント以内のスコアという条件であっても良い。なお、Nは、1以上の任意の自然数であるものとし、Rは、0より大きく100より小さい実数であるものとする。また、あらかじめ決められた条件は、スコアが、シードクエリと意味的に近ければ小さな値となる場合に、スコアの値があらかじめ決められた条件を満たすほど低いことであっても良い。この場合のあらかじめ決められた条件は、あらかじめ決められた閾値より低いことであっても良く、スコアの平均に1より小さな数を掛けた値である閾値より低いことであっても良く、下位からM件のスコアという条件であっても良く、下位からLパーセント以内のスコアという条件であっても良い。なお、Mは、1以上の任意の自然数であるものとし、Lは、0より大きく100より小さい実数であるものとする。
トリガクエリ格納手段106には、1または2以上のトリガクエリが格納される。なお、トリガクエリ格納手段106は、1種類のカテゴリに対応するトリガクエリのみが格納されていても良く、2種類以上のカテゴリにそれぞれ対応するトリガクエリが格納されていても良い。なお、2種類以上のカテゴリにそれぞれ対応するトリガクエリが格納される場合は、トリガクエリ格納手段106には、カテゴリを識別するカテゴリ識別情報が、トリガクエリと対応付けて格納されていても良い。なお、トリガクエリ格納手段106には、出力手段107を介してトリガクエリが格納される。
出力手段107は、トリガクエリ取得手段105が取得したトリガクエリを出力する。本実施の形態では、出力手段107は、トリガクエリ格納手段106にトリガクエリを蓄積するものとする。なお、出力手段107は、トリガクエリの蓄積に代えて、トリガクエリの外部の装置への送信、他の処理装置や他のプログラム等へのトリガクエリの引渡し等を行っても良い。
クエリ受信手段108は、端末装置2から、検索に用いる1または2以上のキーワードを含むクエリである新規クエリを受信する。なお、クエリ受信手段108は、受信した新規クエリを、検索クエリとして検索ログ格納手段101に蓄積しても良い。なお、検索ログが時点情報を含む場合は、クエリ受信手段108は、新規クエリを、その新規クエリを受信した時点に関する時点情報と対応付けて蓄積しても良い。クエリ受信手段108は、通常、無線または有線の通信手段で実現される。
検索結果取得手段109は、クエリ受信手段108が受信した新規クエリを用いたウェブ検索を行った検索結果を取得する。検索結果は、新規クエリに含まれるキーワードを含むウェブページのリストである。検索結果取得手段109は、図示しない格納手段、または外部の格納装置に格納されているウェブページの情報を用いて検索結果を取得しても良く、外部の検索装置に新規クエリを送信し、その検索装置から検索結果を取得しても良い。検索結果取得手段109が実行するウェブ検索は、一般的に行われているいわゆるウェブ検索であり、その技術は公知であるため、詳細な説明を省略する。
新規クエリが、トリガクエリのいずれかと一致した場合に、専用検索結果出力手段110は、トリガクエリ専用の検索結果を取得し、その検索結果を出力する。専用検索結果出力手段110が取得する検索結果は、トリガクエリを取得するのに用いたシードクエリに含まれるキーワードのカテゴリに応じた検索結果である。この検索結果は、カテゴリに応じた検索を行った結果取得されたページを識別する情報や画像等のリストであっても良く、そのウェブページ識別情報や画像等を表示するページを識別する情報であっても良い。「トリガクエリのいずれかと一致した場合」とは、完全に一致した場合が好適であるが、一部が一致した場合であっても良い。一部が一致した場合とは、例えば、新規クエリとトリガクエリのいずれかとが包含関係にある場合であっても良い。
専用検索とは、通常のウェブページを取得するウェブ検索と異なる検索である。例えば、専用検索は、地図検索であっても良く、価格検索であっても良く、商品検索であっても良く、その他の検索であっても良い。また、専用検索は、特定のトリガクエリを用いた検索によって取得される1つのウェブページを取得することであっても良い。専用検索に含まれるそれぞれの検索は、公知技術であるため、それぞれの詳細な説明を省略する。専用検索結果出力手段110が行う専用検索の種類は、カテゴリと専用検索の種類とを対応させるカテゴリ処理対応情報を用いて選択されても良い。専用検索結果出力手段110は、図示しない格納手段、または外部の格納装置に格納されている情報を用いて専用の検索結果を取得しても良く、外部の検索装置に新規クエリを送信し、その検索装置から専用の検索結果を取得しても良い。なお、新規クエリが、トリガクエリのいずれとも一致しなかった場合は、専用検索結果出力手段110は、専用の検索結果を取得しなくても良い。
送信手段111は、検索結果取得手段109が取得した検索結果に専用検索結果出力手段110が出力した専用の検索結果を含めた、新規クエリに対する結果情報を送信しても良い。なお、専用検索結果出力手段110が専用の検索結果を取得していない場合は、検索結果取得手段109が取得した検索結果のみを送信しても良い。なお、送信手段111は、検索結果を取得するのに用いた新規クエリを送信した端末装置2に対して検索結果を送信しても良い。送信手段111は、通常、無線または有線の通信手段で実現される。
検索ログ格納手段101、シードクエリ格納手段103、およびトリガクエリ格納手段106は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
グラフ作成手段102、スコア算出手段104、トリガクエリ取得手段105、出力手段107、クエリ受信手段108、検索結果取得手段109、専用検索結果出力手段110、および送信手段111は、通常、MPUやメモリ等から実現され得る。グラフ作成手段102の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
次に、トリガクエリ取得装置1の動作について図3のフローチャートを用いて説明する。
(ステップS201)グラフ作成手段102は、トリガクエリの取得を開始するかどうかを判断する。トリガクエリの取得を開始する場合は、ステップS202へ進み、トリガクエリを取得しない場合は、ステップS206へ進む。なお、ステップS201において、グラフ作成手段102は、図示しない受付手段を介して、ユーザからトリガクエリを取得する指示を受け付けた場合にトリガクエリの取得を開始すると判断しても良い。また、グラフ作成手段102は、前回のトリガクエリを取得した時点から一定の期間が経過した場合にトリガクエリの取得を開始すると判断しても良い。また、グラフ作成手段102は、トリガクエリ格納手段106にトリガクエリが格納されていない場合にトリガクエリの取得を開始すると判断しても良い。
(ステップS202)グラフ作成手段102は、検索ログを用いて最小有向グラフを作成する。なお、グラフ作成手段102は、1または2以上の条件を用いて、検索ログ格納手段101に格納されている検索ログから、可能な限り最小有向グラフを作成しても良い。
(ステップS203)スコア算出手段104は、ステップS202で作成した最小有向グラフを有する有向グラフと、シードクエリ格納手段103に格納されているシードクエリを用いて各ノードのスコアを算出する。
(ステップS204)トリガクエリ取得手段105は、ステップS203で算出したスコアが高いノードに対応する検索クエリであるトリガクエリを取得する。
(ステップS205)出力手段107は、ステップS204で取得したトリガクエリをトリガクエリ格納手段106に蓄積する。そして、ステップS201へ戻る。なお、シードクエリ格納手段103に2以上のカテゴリに対応するシードクエリが格納されている場合は、そのカテゴリごとにステップS203からステップS205を繰り返しても良い。
(ステップS206)クエリ受信手段108は、新規クエリを受信したかどうかを判断する。新規クエリを受信した場合は、ステップS207へ進み、新規クエリを受信しなかった場合は、ステップS201へ戻る。
(ステップS207)検索結果取得手段109は、ステップS206で受信した新規クエリに対するウェブ検索の検索結果を取得する。
(ステップS208)専用検索結果出力手段110は、ステップS206で受信した新規クエリと一致するトリガクエリが、トリガクエリ格納手段106に格納されているかどうかを判断する。新規クエリと一致するトリガクエリが格納されていた場合は、ステップS209へ進み、格納されていなかった場合は、ステップS210へ進む。
(ステップS209)専用検索結果出力手段110は、ステップS206で受信した新規クエリに対する専用検索の検索結果を取得する。
(ステップS210)送信手段111は、ステップS207で取得した検索結果、または、その検索結果と、ステップS209で取得した検索結果とをマージした検索結果を送信する。そして、ステップS201へ戻る。
なお、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
以下、本実施の形態におけるトリガクエリ取得装置1の具体的な動作について説明する。本具体例において、初期状態では、トリガクエリ格納手段106には、トリガクエリが格納されていないものとする。また、本具体例において、カテゴリ識別情報は、カテゴリを示すカテゴリ情報としている。
本具体例において、検索ログ格納手段101に格納されている検索ログは、図4に示されているものとする。図4のテーブルは、検索ログIDと検索クエリとウェブページ識別情報と順位情報とユーザ識別情報と時点情報とを有している。例えば、検索ログID「100」の検索ログは、検索クエリ「×××本」、ウェブページ識別情報「http://aaa.web」、順位情報「3」、ユーザ識別情報「Session100」、および時点情報「12:00」とを含んでいる。
また、本具体例において、シードクエリ格納手段103に格納されているシードクエリは、図5に示されているものとする。図5のテーブルは、シードクエリIDとシードクエリとカテゴリとを有している。例えば、シードクエリID「201」は、シードクエリ「×××本」とカテゴリ情報「本」である。
また、本具体例において、図示しない格納手段に格納されているカテゴリ処理対応情報は、図6で示されているものとする。図6のテーブルは、カテゴリ情報と専門検索の種類とを有している。例えば、カテゴリ処理対応情報は、カテゴリ情報「本」と専門検索の種類「ショッピング検索」とを対応付けている。
管理者が電源をONにすることで、トリガクエリ取得装置1が起動したとする。すると、グラフ作成手段102は、トリガクエリ格納手段106にトリガクエリが格納されていないため、最小有向グラフを作成する(ステップS201からステップS202)。最小有向グラフが作成されるとスコア算出手段104は、カテゴリ情報「本」と対応するシードクエリと一致するノードの重みを設定し、各ノードのスコアを算出する(ステップS203)。スコアが算出されると、そのスコアを用いてトリガクエリ取得手段105がトリガクエリを取得する(ステップS204)。トリガクエリが取得されると出力手段107は、トリガクエリ格納手段106に、そのトリガクエリを蓄積する(ステップS205)。すると、図7のようにトリガクエリ格納手段106にトリガクエリが格納される。なお、カテゴリ情報「自動車」についても、同様にトリガクエリを取得し、蓄積する。
トリガクエリの取得が終了した後に、クエリ受信手段108が、キーワード「×××●●本」を含む新規クエリを、端末装置2より受信したとする(ステップS206)。新規クエリが受信されると、検索結果取得手段109は、新規クエリが有するキーワード「×××●●本」を用いてウェブ検索を行った検索結果を取得する(ステップS207)。また、新規クエリが有するキーワード「×××●●本」は、トリガクエリID「3」のトリガクエリが有するキーワードと一致するため、専用検索結果出力手段110は、トリガクエリを取得する際に用いたシードクエリのカテゴリ情報「本」と対応する「ショッピング検索」の検索結果「AAA書店 1400円,BBB書房 1480円,CCC 1480円」を取得する(ステップS208からステップS209)。そして、送信手段111は、検索結果取得手段109による検索結果と、専用検索結果出力手段110による検索結果とを送信する(ステップS210)。すると端末装置2のディスプレイには、図8のように表示される。
以上、本実施の形態によれば、スコア算出手段104がスコアをシードクエリと一致する検索クエリのノードに対して重み付けを行ったスコアをノード毎に算出するため、シードクエリに対応するカテゴリに対応するクエリであるトリガクエリを取得できる。これにより、人手で収集するのが困難なトリガクエリを自動で収集できる。また、グラフ作成手段102が、検索される範囲が広い検索クエリに対応するノードから、検索される範囲が狭い検索クエリに対応するノードまでのリンクを作成することで、参照が繰り返されるほど、対応するクエリが限定される有向グラフが作成できる。これにより、リンク解析に基づいてトリガクエリを取得するためのスコアが算出できる。また、グラフ作成手段102が、最頻検索基準を用いた共クリック条件、文字列拡張基準を用いた共クリック条件、最良検索基準を用いた共クリック条件、共クエリ条件、および共ユーザ条件のいずれか1以上の条件を用いて有向グラフを作成することで、複数の手法を考慮した有向グラフが作成できる。また、専用検索結果出力手段110が、専用の検索結果を取得することで、取得したトリガクエリを有効に用いることができる。
また、トリガクエリ取得装置1で取得したトリガクエリは、専用の検索結果を取得する以外にも用いる事ができる。例えば、あらかじめ設定している広告キーワードに応じたクエリが入力された場合に、その広告キーワードに対応した広告が配信される装置の場合に、その広告キーワードとして用いる事ができる。
また、本実施の形態において、検索ログ格納手段101を含む場合について説明したが、トリガクエリ取得装置1は、検索ログ格納手段101を含まなくても良い。トリガクエリ取得装置1が検索ログ格納手段101を含まない場合は、グラフ作成手段102は、例えば、図示しない受付手段が受け付けた検索ログを用いて最小有向グラフを作成しても良く、検索ログを格納する外部の装置から取得した検索ログを用いて最小有向グラフを作成しても良い。
また、本実施の形態において、シードクエリ格納手段103を含む場合について説明したが、トリガクエリ取得装置1は、シードクエリ格納手段103を含まなくても良い。トリガクエリ取得装置1がシードクエリ格納手段103を含まない場合は、スコア算出手段104は、例えば、図示しない受付手段が受け付けたシードクエリを用いてスコアを算出しても良く、シードクエリを格納する外部の装置から取得したシードクエリを用いて最小有向グラフを作成しても良い。
また、本実施の形態において、クエリ受信手段108と検索結果取得手段109と専用検索結果出力手段110と送信手段111とを含む場合について説明したが、トリガクエリ取得装置1は、クエリ受信手段108と検索結果取得手段109と専用検索結果出力手段110と送信手段111とを含まなくても良い。クエリ受信手段108と検索結果取得手段109と専用検索結果出力手段110と送信手段111とを含まない場合は、トリガクエリ取得装置1は、取得したトリガクエリ格納手段106に蓄積する装置であっても良い。
また、本実施の形態において、トリガクエリ格納手段106を含む場合について説明したが、トリガクエリ取得装置1は、トリガクエリ格納手段106を含まなくても良い。トリガクエリ格納手段106を含まない場合は、出力手段107は、トリガクエリを外部の格納装置に出力しても良い。なお、その外部の装置は、トリガクエリ格納手段106とクエリ受信手段108と検索結果取得手段109と専用検索結果出力手段110と送信手段111とを具備した装置であっても良い。その場合は、出力手段107が送信したトリガクエリをクエリ受信手段108が受信し、受信したトリガクエリをトリガクエリ格納手段106に蓄積しても良い。
また、本実施の形態におけるトリガクエリ取得装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、プログラムは、ウェブページを取得する検索に用いられた、1以上のキーワードを有するクエリである検索クエリを含む検索ログが2以上格納される検索ログ格納手段と、特定のカテゴリに属するキーワードを含むクエリであるシードクエリが1以上格納されるシードクエリ格納手段とにアクセス可能なコンピュータを、ウェブページを取得する検索に用いられた、1以上のキーワードを有するクエリである検索クエリを含む2以上の検索ログのうち、関連を有する2個の検索ログが有する検索クエリそれぞれに対応するノードと、一方のノードから、他方のノードまでのリンクとを有する最小単位の有向グラフである最小有向グラフを作成するグラフ作成手段、グラフ作成手段で作成された最小有向グラフによって構成される有向グラフのノードごとに、特定のカテゴリに属するキーワードを含むクエリであるシードクエリからノードのスコアを伝播して、シードクエリとの関連度に関するリンク解析に基づいたスコアを算出するスコア算出手段、スコア算出手段が算出したスコアが、あらかじめ決められた条件を満たすノードに対応する検索クエリであり、シードクエリが有するキーワードと同じカテゴリに関するキーワードを含む検索クエリであるトリガクエリを取得するトリガクエリ取得手段、トリガクエリ取得手段が取得したトリガクエリを出力する出力手段として機能させるためのプログラムである。
なお、本実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されても良く、または、複数の装置によって分散処理されることによって実現されても良い。また、本実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の手段で実現されても良いことは言うまでもない。
また、本実施の形態において、各構成要素は、専用のハードウェアにより構成されても良く、または、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されても良い。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行手段が読み出して実行することによって、各構成要素が実現され得る。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得手段や、情報を出力する出力手段等におけるモデムやインターフェースカード等のハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。
図9は、上記プログラムを実行して、上記実施の形態による本発明を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムによって実現され得る。
図9において、コンピュータシステム1100は、CD−ROMドライブ1105、FDドライブ1106を含むコンピュータ1101と、キーボード1102と、マウス1103と、モニタ1104とを備える。
図10は、コンピュータシステム1100の内部構成を示す図である。図10において、コンピュータ1101は、CD−ROMドライブ1105、FDドライブ1106に加えて、MPU1111と、ブートアッププログラム等のプログラムを蓄積するためのROM1112と、MPU1111に接続され、アプリケーションプログラムの命令を一時的に蓄積すると共に、一時記憶空間を提供するRAM1113と、アプリケーションプログラム、システムプログラム、およびデータを蓄積するハードディスク1114と、MPU1111と、ROM1112等を相互に接続するバス1115とを備える。なお、コンピュータ1101は、LANへの接続を提供する図示しないネットワークカードを含んでいても良い。
コンピュータシステム1100に、上記実施の形態による本発明等の機能を実行させるプログラムは、CD−ROM1121、またはFD1122に蓄積されて、CD−ROMドライブ1105、またはFDドライブ1106に挿入され、ハードディスク1114に転送されても良い。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ1101に送信され、ハードディスク1114に蓄積されても良い。プログラムは実行の際にRAM1113にロードされる。なお、プログラムは、CD−ROM1121やFD1122、またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ1101に、上記実施の形態による本発明の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいても良い。コンピュータシステム1100がどのように動作するのかについては周知であり、詳細な説明は省略する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。また、本発明における各手段の「手段」は、「部」や「回路」と読み替えても良い。
以上のように、本発明にかかるトリガクエリ取得装置等は、検索に用いられたクエリのログを用いて、あるカテゴリに対応するキーワードを自動で取得できるという効果を有し、トリガクエリ取得装置等として有用である。
1 トリガクエリ取得装置
2 端末装置
101 検索ログ格納手段
102 グラフ作成手段
103 シードクエリ格納手段
104 スコア算出手段
105 トリガクエリ取得手段
106 トリガクエリ格納手段
107 出力手段
108 クエリ受信手段
109 検索結果取得手段
110 専用検索結果出力手段
111 送信手段

Claims (10)

  1. ウェブページを取得する検索に用いられた、1以上のキーワードを有するクエリである検索クエリを含む2以上の検索ログのうち、関連を有する2個の検索ログが有する検索クエリそれぞれに対応するノードと、一方のノードから、他方のノードまでのリンクとを有する最小単位の有向グラフである最小有向グラフを作成するグラフ作成手段と、
    前記グラフ作成手段で作成された最小有向グラフによって構成される有向グラフのノードごとに、特定のカテゴリに属するキーワードを含むクエリであるシードクエリからノードのスコアを伝播して、当該シードクエリとの関連度に関するリンク解析に基づいたスコアを算出するスコア算出手段と、
    前記スコア算出手段が算出したスコアが、あらかじめ決められた条件を満たすノードに対応する検索クエリであり、シードクエリが有するキーワードと同じカテゴリに関するキーワードを含む検索クエリであるトリガクエリを取得するトリガクエリ取得手段と、
    前記トリガクエリ取得手段が取得したトリガクエリを出力する出力手段とを具備するトリガクエリ取得装置。
  2. 前記グラフ作成手段は、
    2個の検索ログが有する検索クエリそれぞれに対応するノードと、当該2個のノードのうち、検索される範囲が広い検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、請求項1記載のトリガクエリ取得装置。
  3. 前記検索ログは、
    当該検索ログに含まれる検索クエリに応じた検索結果のうち、ユーザが選択したウェブページを識別するウェブページ識別情報をさらに含む情報であり、
    前記グラフ作成手段は、
    同一のウェブページ識別情報を含む2個の検索ログであり、少なくとも一方が、前記2以上の検索ログにおいて、当該ウェブページ識別情報が最も多く選択されている検索クエリを有する検索ログである2個の検索ログに含まれる検索クエリそれぞれに対応するノードと、当該2個のノードのうち、一方のノードから、当該ウェブページ識別情報が最も多く選択されている検索クエリに対応する他方のノードまでのリンクとを有する最小有向グラフを作成する、請求項1または請求項2記載のトリガクエリ取得装置。
  4. 前記検索ログは、
    当該検索ログに含まれる検索クエリに応じた検索結果のうち、ユーザが選択したウェブページを識別するウェブページ識別情報をさらに含む情報であり、
    前記グラフ作成手段は、
    同一のウェブページ識別情報を有する2個の検索ログであって、検索クエリが包含関係にある2個の検索ログが有する検索クエリそれぞれに対応するノードと、当該2個のノードのうち、一方の検索クエリに包含される検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、請求項1から請求項3のいずれか一項記載のトリガクエリ取得装置。
  5. 前記検索ログは、
    当該検索ログに含まれる検索クエリに応じた検索結果のうち、ユーザが選択したウェブページを識別するウェブページ識別情報と、当該ウェブページ識別情報の検索結果における順位を示す順位情報とをさらに含み、
    前記グラフ作成手段は、
    同一のウェブページ識別情報を含む2個の検索ログであり、少なくとも一方が最も高い順位情報を有する検索ログである2個の検索ログに含まれる検索クエリそれぞれに対応するノードと、当該2個のノードのうち、一方のノードから、最も高い順位情報を有する検索ログに含まれる検索クエリに対応する他方のノードまでのリンクとを有する最小有向グラフを作成する、請求項1から請求項4のいずれか一項記載のトリガクエリ取得装置。
  6. 前記グラフ作成手段は、
    検索クエリが包含関係にある2個の検索ログが有する検索クエリそれぞれに対応するノードと、当該2個のノードのうち、一方の検索クエリに包含される検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、請求項1から請求項5のいずれか一項記載のトリガクエリ取得装置。
  7. 前記検索ログは、
    当該検索ログに含まれる検索クエリが検索に用いられた時点に関する時点情報と、当該検索クエリを入力したユーザを識別するユーザ識別情報とをさらに含み、
    前記グラフ作成手段は、
    時点情報が示す時点が所定の期間以内である2個の検索ログが有する検索クエリそれぞれに対応するノードと、当該2個のノードのうち、古い時点を示す時点情報を有する検索ログに含まれる検索クエリに対応するノードから、他方のノードまでのリンクとを有する最小有向グラフを作成する、請求項1から請求項6のいずれか一項記載のトリガクエリ取得装置。
  8. 前記トリガクエリが格納されるトリガクエリ格納手段と、
    端末装置から、検索に用いるキーワードを含むクエリである新規クエリを受信するクエリ受信手段と、
    前記新規クエリが、前記トリガクエリのいずれかと一致した場合に、当該トリガクエリを取得するのに用いたシードクエリに含まれるキーワードのカテゴリに応じたトリガクエリ専用の検索結果を取得し、出力する専用検索結果出力手段とをさらに具備し、
    前記出力手段は、
    前記トリガクエリ格納手段にトリガクエリを蓄積する、請求項1から請求項7のいずれか一項記載のトリガクエリ取得装置。
  9. グラフ作成手段と、スコア算出手段と、トリガクエリ取得手段とを用いて処理されるトリガクエリ取得方法であって、
    前記グラフ作成手段が、ウェブページを取得する検索に用いられた、1以上のキーワードを有するクエリである検索クエリを含む2以上の検索ログのうち、関連を有する2個の検索ログが有する検索クエリそれぞれに対応するノードと、一方のノードから、他方のノードまでのリンクとを有する最小単位の有向グラフである最小有向グラフを作成するグラフ作成ステップと、
    前記スコア算出手段が、前記グラフ作成ステップで作成された最小有向グラフによって構成される有向グラフのノードごとに、特定のカテゴリに属するキーワードを含むクエリであるシードクエリからノードのスコアを伝播して、当該シードクエリとの関連度に関するリンク解析に基づいたスコアを算出するスコア算出ステップと、
    前記トリガクエリ取得手段が、前記スコア算出ステップで算出したスコアが、あらかじめ決められた条件を満たすノードに対応する検索クエリであり、シードクエリが有するキーワードと同じカテゴリに関するキーワードを含む検索クエリであるトリガクエリを取得するトリガクエリ取得ステップと、
    前記出力手段が、前記トリガクエリ取得ステップで取得したトリガクエリを出力する出力ステップとを具備するトリガクエリ取得方法。
  10. コンピュータを、
    ウェブページを取得する検索に用いられた、1以上のキーワードを有するクエリである検索クエリを含む2以上の検索ログのうち、関連を有する2個の検索ログが有する検索クエリそれぞれに対応するノードと、一方のノードから、他方のノードまでのリンクとを有する最小単位の有向グラフである最小有向グラフを作成するグラフ作成手段、
    前記グラフ作成手段で作成された最小有向グラフによって構成される有向グラフのノードごとに、特定のカテゴリに属するキーワードを含むクエリであるシードクエリからノードのスコアを伝播して、当該シードクエリとの関連度に関するリンク解析に基づいたスコアを算出するスコア算出手段、
    前記スコア算出手段が算出したスコアが、あらかじめ決められた条件を満たすノードに対応する検索クエリであり、シードクエリが有するキーワードと同じカテゴリに関するキーワードを含む検索クエリであるトリガクエリを取得するトリガクエリ取得手段、
    前記トリガクエリ取得手段が取得したトリガクエリを出力する出力手段として機能させるためのプログラム。
JP2013150275A 2013-07-19 2013-07-19 トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム Active JP5787941B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013150275A JP5787941B2 (ja) 2013-07-19 2013-07-19 トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム
US14/319,382 US9940408B2 (en) 2013-07-19 2014-06-30 Trigger query obtaining apparatus, trigger query obtaining method, and non-transitory computer readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013150275A JP5787941B2 (ja) 2013-07-19 2013-07-19 トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2015022528A true JP2015022528A (ja) 2015-02-02
JP5787941B2 JP5787941B2 (ja) 2015-09-30

Family

ID=52344438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013150275A Active JP5787941B2 (ja) 2013-07-19 2013-07-19 トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム

Country Status (2)

Country Link
US (1) US9940408B2 (ja)
JP (1) JP5787941B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201407150D0 (en) * 2014-04-23 2014-06-04 Majestic 12 Ltd A categorisation system
US11979309B2 (en) * 2015-11-30 2024-05-07 International Business Machines Corporation System and method for discovering ad-hoc communities over large-scale implicit networks by wave relaxation
CN108446861B (zh) * 2018-03-28 2022-02-15 南方电网科学研究院有限责任公司 基于有向图排序的电力调度系统多源数据质量评价方法
GB201911459D0 (en) 2019-08-09 2019-09-25 Majestic 12 Ltd Systems and methods for analysing information content

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005251092A (ja) * 2004-03-08 2005-09-15 Konica Minolta Holdings Inc 情報検索システム、情報検索方法および情報検索プログラム
JP2013054640A (ja) * 2011-09-06 2013-03-21 Fuji Xerox Co Ltd 検索装置及びプログラム
JP2013088923A (ja) * 2011-10-14 2013-05-13 Yahoo Japan Corp 重要クエリ抽出装置、重要クエリ抽出方法および重要クエリ抽出プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090259646A1 (en) * 2008-04-09 2009-10-15 Yahoo!, Inc. Method for Calculating Score for Search Query
US20130262485A1 (en) * 2010-12-14 2013-10-03 The Regents Of The University Of California High Efficiency Prefix Search Algorithm Supporting Interactive, Fuzzy Search on Geographical Structured Data
US20120265784A1 (en) * 2011-04-15 2012-10-18 Microsoft Corporation Ordering semantic query formulation suggestions
KR101574161B1 (ko) 2011-10-05 2015-12-04 네이버 주식회사 예약된 광고를 노출하는 시스템 및 방법
US9727594B2 (en) * 2013-01-10 2017-08-08 Microsoft Technology Licensing, Llc Adaptive range filters for range and point queries

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005251092A (ja) * 2004-03-08 2005-09-15 Konica Minolta Holdings Inc 情報検索システム、情報検索方法および情報検索プログラム
JP2013054640A (ja) * 2011-09-06 2013-03-21 Fuji Xerox Co Ltd 検索装置及びプログラム
JP2013088923A (ja) * 2011-10-14 2013-05-13 Yahoo Japan Corp 重要クエリ抽出装置、重要クエリ抽出方法および重要クエリ抽出プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015016275; 宇野 裕之: 'ランキングとレイティング' 経営の科学 オペレーションズ・リサーチ 第57巻 第6号 Communications of the Operations Research 第57巻, 20120601, 308-314ページ, 公益社団法人日本オペレーションズ・リサーチ学会 株 *

Also Published As

Publication number Publication date
US9940408B2 (en) 2018-04-10
US20150026151A1 (en) 2015-01-22
JP5787941B2 (ja) 2015-09-30

Similar Documents

Publication Publication Date Title
US10762288B2 (en) Adaptive modification of content presented in electronic forms
JP6487201B2 (ja) 推奨ページを生成するための方法及び装置
JP5679993B2 (ja) クエリを実行する方法およびクエリシステム
CN105247507B (zh) 用于确定品牌的影响力得分的方法、系统和存储介质
JP5916959B2 (ja) 動的データ取得方法およびシステム
US20090259646A1 (en) Method for Calculating Score for Search Query
US10652187B2 (en) System and method for relevance-based electronic message presentation
KR20160020429A (ko) 맥락적 모바일 애플리케이션 광고 기법
JP5493845B2 (ja) 検索支援プログラム、検索支援装置、及び検索支援方法
JP5269938B2 (ja) 急上昇ワード関連付け装置及び方法
JP5787941B2 (ja) トリガクエリ取得装置、トリガクエリ取得方法、およびプログラム
CN109726272A (zh) 审计规则推荐方法及装置
WO2013103588A1 (en) Search ranking features
JP4819628B2 (ja) ドキュメントデータを検索する方法、サーバ、およびプログラム
US9465875B2 (en) Searching based on an identifier of a searcher
US20120030021A1 (en) Selecting advertisements using same session queries
JP4824070B2 (ja) クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5524160B2 (ja) 重要クエリ抽出装置、重要クエリ抽出方法および重要クエリ抽出プログラム
JP2013131154A (ja) 情報処理装置、情報処理方法、情報処理システム、及び、プログラム
JP5589009B2 (ja) 推薦クエリ抽出装置及び方法及びプログラム
JP5411802B2 (ja) 代表語抽出装置、代表語抽出方法および代表語抽出プログラム
JP2017513155A (ja) 検索方法、装置、デバイス及び不揮発性コンピュータ記憶媒体
JP6042162B2 (ja) ウェブ検索装置、ウェブ検索方法及びプログラム
US20110231387A1 (en) Engaging content provision

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150728

R150 Certificate of patent or registration of utility model

Ref document number: 5787941

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250