JP2016189215A - 抽出装置、抽出方法および抽出プログラム - Google Patents

抽出装置、抽出方法および抽出プログラム Download PDF

Info

Publication number
JP2016189215A
JP2016189215A JP2016133381A JP2016133381A JP2016189215A JP 2016189215 A JP2016189215 A JP 2016189215A JP 2016133381 A JP2016133381 A JP 2016133381A JP 2016133381 A JP2016133381 A JP 2016133381A JP 2016189215 A JP2016189215 A JP 2016189215A
Authority
JP
Japan
Prior art keywords
search query
search
content
user terminal
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016133381A
Other languages
English (en)
Other versions
JP6310509B2 (ja
Inventor
幸 藤田
Miyuki Fujita
幸 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016133381A priority Critical patent/JP6310509B2/ja
Publication of JP2016189215A publication Critical patent/JP2016189215A/ja
Application granted granted Critical
Publication of JP6310509B2 publication Critical patent/JP6310509B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】コンテンツの訴求効果を高めること。【解決手段】本願に係る抽出装置は、算出部と、抽出部とを備える。算出部は、ユーザ端末から送信された検索クエリと、検索クエリを送信した後にユーザ端末からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値を算出する。抽出部は、算出部によって算出された指標値に基づいて、再検索クエリの中から、検索クエリに関連するキーワードを抽出する。【選択図】図2

Description

本発明は、抽出装置、抽出方法および抽出プログラムに関する。
インターネット上には膨大な情報が開示されており、ユーザは、知りたい情報を探す際には検索サイトを利用する場合が多い。かかる検索サイトでは、検索マッチング広告や検索連動広告と呼ばれる広告配信が行われることがある。
この種の広告配信において、広告主が広告の入稿時に一又は二以上の広告関連キーワードを指定する技術が知られている。この技術では、広告関連キーワードがユーザから検索キーワードとして入力された場合に、検索キーワードに応じた検索結果に隣接させて、広告関連キーワードに関連する広告を表示する。
特開2010−211777号公報
しかしながら、上記の従来技術では、コンテンツの訴求効果を高めることができるとは限らない。具体的には、上記の従来技術では、入稿されたコンテンツである広告に対して広告主が適切に広告関連キーワードを指定する手法については開示されていない。そして、検索連動型の広告配信においては、広告関連キーワードが適切に指定されなければ、適切な広告を配信することができない。これにより、配信される広告の訴求効果が十分に発揮されないおそれがある。
なお、上記では、コンテンツとして広告を例に挙げ、訴求効果を高めることができるとは限らない点について説明した。しかし、広告目的以外のコンテンツにおいても同様に、訴求効果を高めることができるとは限らない。すなわち、上記のような検索連動型の広告配信の例に限られず、キーワードに関連するコンテンツを配信する技術分野においては、キーワードが適切に指定されなければ、適切なコンテンツを配信することができず、コンテンツの訴求効果を高めることができるとは限らない。
本願に係る抽出装置は、ユーザ端末から送信された検索クエリと、当該検索クエリを送信した後に当該ユーザ端末からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値を算出する算出部と、前記算出部によって算出された指標値に基づいて、前記再検索クエリの中から、前記検索クエリに関連するキーワードを抽出する抽出部と、を備えたことを特徴とする。
実施形態の一態様によれば、コンテンツの訴求効果を高めることができるという効果を奏する。
図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。 図2は、実施形態に係る抽出処理の一例を示す図である。 図3は、実施形態に係る広告装置の構成例を示す図である。 図4は、実施形態に係る広告情報記憶部の一例を示す図である。 図5は、実施形態に係る検索情報記憶部の一例を示す図である。 図6は、実施形態に係る抽出処理の一例を示す概念図である。 図7は、実施形態に係る広告装置による抽出処理手順を示すフローチャートである。 図8は、広告装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.抽出処理〕
以下では、図1及び図2を用いて、実施形態に係る抽出処理の一例について説明する。図1及び図2では、本願に係る抽出装置に対応する広告装置100によって配信処理及び抽出処理が行われる例を示す。まず、図1を用いて、実施形態に係る広告配信の一例を説明する。図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。
図1には、実施形態に係る広告コンテンツが表示されるウェブページとして、ユーザ端末10に表示される検索結果ページ50を示す。検索結果ページ50は、ユーザから入力される検索クエリに基づいて検索されたウェブページに関する情報が表示されるウェブページである。
図1に示すように、検索結果ページ50には、検索クエリ入力部52が含まれる。検索結果ページ50を利用するユーザは、ユーザ端末10を介して、検索クエリ入力部52に検索クエリを入力する。図1では、ユーザが検索クエリ入力部52に入力した「英会話教室」という検索クエリに基づいて、検索結果ページ50に検索結果が表示される例を示す。すなわち、検索結果ページ50には、検索結果として、「英会話教室」に関連のあるウェブページのリンク等の情報が表示される。
また、検索結果ページ50には、検索結果であるウェブページの情報とは別に、広告コンテンツが表示される。例えば、広告コンテンツは、検索結果ページ50に含まれる広告枠54又は広告枠56に表示される。広告コンテンツには、広告主の業務を宣伝するテキストなどが含まれる。そして、広告コンテンツには、広告主の提供するウェブページへのリンクが張られる。このような広告コンテンツのリンク先であるウェブページは、ランディングページ(Landing Page、以下「LP」と表記する場合がある)などと呼ばれる。例えば、広告主は、広告コンテンツを表示させることで、ユーザにLPへの移動を促し、自身が提供するウェブページを閲覧させたり、ウェブページ上で商品の購入をさせたりするといった営業に活用する。
このような検索サービスと連動する広告配信サービスにおいて、広告主は、広告コンテンツを入稿する際や入稿した後に、所定のキーワードに対して入札を行う。そして、広告主は、ユーザが所定のキーワードを検索クエリとして入力した場合に、LPへのリンクが張られた広告コンテンツをユーザに配信させる権利を取得する。すなわち、広告主は、検索サービスにおいて、入札するキーワードを指定することで、キーワードと広告コンテンツとを紐づかせることができる。なお、広告コンテンツのリンク先はLPであるため、広告主は、入札するキーワードを指定することで、キーワードとLPとを紐づかせることもできる。このように、広告主は、ユーザが広告コンテンツと紐づけられたキーワードと同一又は類似のキーワードを検索クエリとして入力した場合に、検索サービスと連動して、検索結果ページ50に広告コンテンツを表示させることができる。これにより、広告主は、特定の情報への欲求がユーザに発生しているタイミングで広告コンテンツを配信させることができるので、より高い広告効果が見込める広告コンテンツの配信を行うことができる。
ここで、検索サービスと連動する広告コンテンツの配信処理の流れについて説明する。検索サービスと連動する広告コンテンツの配信処理は、広告装置100と、検索サーバ30と、ユーザ端末10とにより、図示しないネットワークN(例えば、インターネット)を介して行われる。
ユーザ端末10は、ユーザによって利用される情報処理装置である。ユーザ端末10は、例えば、スマートフォンやタブレット端末やPDA(Personal Digital Assistant)等の移動端末や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。
検索サーバ30は、検索サービスを提供するサーバ装置である。例えば、検索サーバ30は、所定の検索サイトにおいて、ユーザから検索クエリの入力を受け付ける。そして、検索サーバ30は、検索クエリに基づいた検索結果をユーザに提供する。
広告装置100は、検索サーバ30と連動して広告配信を行うサーバ装置である。広告装置100は、広告主から広告コンテンツの入稿とともに、キーワードに対する入札を受け付ける。そして、広告装置100は、以下に説明する手順により、検索サービスにおいて広告主が入札を行ったキーワード(以下、「入札キーワード」と表記する場合がある)を入力したユーザに広告コンテンツを配信する。
まず、ユーザは、ユーザ端末10を介して、検索サーバ30が提供する検索サイトにアクセスする。そして、ユーザは、検索サイトにおいて検索クエリを入力する。これにより、ユーザ端末10は、検索サーバ30に検索クエリを送信する(ステップS01)。検索サーバ30は、検索クエリに対応する検索結果を表示するウェブページである検索結果ページ50をユーザに提供する(ステップS02)。
また、検索クエリを受信した検索サーバ30は、検索クエリに関する情報を広告装置100に送信する(ステップS03)。これにより、広告装置100は、ユーザから入力された検索クエリに関する情報を取得する。そして、広告装置100は、検索クエリが入札キーワードである場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する(ステップS04)。
上述のように、検索結果ページ50には、広告枠54及び広告枠56が含まれる。そこで、ユーザ端末10は、検索結果ページ50を表示する際に、広告枠54及び広告枠56で表示する広告コンテンツを取得するために、広告装置100に広告配信の要求を行う(ステップS05)。広告配信の要求を受け付けた広告装置100は、入札キーワードに紐づく広告コンテンツをユーザ端末10に配信する(ステップS06)。これにより、例えば、「英会話教室」というキーワードに入札していた広告主が提供する広告コンテンツが、広告枠54に表示される。また、同じキーワードに入札していた他の広告主が提供する広告コンテンツが、広告枠56に表示される。このように、広告装置100は、検索サービスと連動して、広告コンテンツをユーザに配信することができる。
なお、ステップS03において、検索サーバ30がクエリ情報を広告装置100に送信する例を示したが、クエリ情報は、ユーザ端末10から広告装置100に送信されてもよい。例えば、クエリ情報は、検索結果ページ50の広告配信要求のためのスクリプトに含まれてもよい。この場合、ユーザ端末10は、広告配信の要求とともに、クエリ情報を広告装置100に送信する。そして、広告装置100は、クエリに紐づく広告コンテンツを選択し、選択された広告コンテンツをユーザ端末10に配信する。
ところで、図1の例のように、広告主は、検索結果ページ50に広告コンテンツを表示させるためには、所定のキーワードに入札を行うことになる。そして、広告主は、様々な興味を有するユーザに広告コンテンツを配信させるためには、適切な入札キーワードを複数指定するのが望ましい。しかしながら、広告主にとって、複数の適切なキーワードに入札することは容易でない。例えば、広告主は、自身が提供するLPから抽出される単語(すなわち、LP内に含まれる単語。以下では、「LP単語」と表記する場合がある)や、自身が提供する商品又はサービスの名称等について入札することが一般的には考えられる。この場合、広告主は、自身が想定するユーザの範囲にしか広告コンテンツを配信させることができないため、効率よく広告コンテンツの配信対象とするユーザの範囲を拡張させることが困難である。
上記の事情に鑑みると、検索連動型の広告配信サービスにおいて、広告主に適切な入札キーワードを提示することは有用である。また、広告配信サービスの管理者側にとっても、広告主に適切な入札キーワードを提示することにより、入札の促進につながり、サービスの活性化を図ることができる。
そこで、実施形態に係る広告装置100は、図1で示したような検索連動型の広告配信サービスにおいて、広告主にとって適切な入札キーワードを抽出する。以下、図2を用いて、実施形態に係る抽出処理を説明する。図2は、実施形態に係る抽出処理の一例を示す図である。図2では、抽出システム1を例に挙げて、抽出処理の一例を説明する。
図2に示すように、抽出システム1には、ユーザ端末10と、広告主端末20と、検索サーバ30と、広告装置100とが含まれる。広告装置100は、図示しないネットワークNを介して、ユーザ端末10、広告主端末20及び検索サーバ30と通信可能に接続される。なお、抽出システム1に含まれるユーザ端末10や、広告主端末20や、検索サーバ30の台数は、図1に示した例に限られない。例えば、抽出システム1には、複数台のユーザ端末10が含まれてもよい。
広告主端末20は、広告主によって利用される情報処理装置である。広告主端末20は、例えば、スマートフォンやタブレット端末やPDA等の移動端末や、デスクトップ型PCや、ノート型PC等である。
広告装置100は、以下に説明する抽出処理によって、広告主が入札する入札キーワードとして適切なキーワードを抽出するサーバ装置である。
まず、広告装置100は、提供する広告配信サービスにおいて、広告主端末20から広告コンテンツの入稿を受け付ける(ステップS11)。この場合、広告装置100は、広告コンテンツの入稿とともに、広告主が指定するキーワードの入札を受け付けてもよい。そして、広告装置100は、入稿された広告コンテンツに関する情報を保持する。
ここで、検索サービスを利用しようとするユーザは、ユーザ端末10を介して、検索サーバ30が提供する検索サイトにアクセスする。そして、ユーザは、検索サイトにおいて検索クエリを入力する。すなわち、ユーザ端末10は、検索サーバ30に検索クエリを送信する(ステップS12)。検索サーバ30は、検索クエリに対応する検索結果を表示する検索結果ページ50をユーザに提供する(ステップS13)。また、検索サーバ30は、検索クエリに関する情報を広告装置100に送信する(ステップS14)。
広告装置100は、取得した検索クエリが広告主が指定する入札キーワードである場合には、取得した検索クエリに対応する広告コンテンツをユーザ端末10に配信する(ステップS15)。この場合、図1で示したように、検索結果ページ50の広告枠54又は広告枠56には、広告装置100が配信した広告コンテンツが表示される。
そして、ユーザが検索結果ページ50に表示された広告コンテンツを選択した場合、ユーザ端末10には、広告主が提供するLPが表示される。このように、ユーザは、広告主が提供するLPを取得し、取得したLPを閲覧する(ステップS16)。
続いて、ユーザは、再び検索サービスを利用するものとする。例えば、ユーザは、LPを閲覧した後に、ステップS13において受信した検索結果ページ50を再び表示させる。そして、ユーザ端末10は、先に送信した検索クエリとは異なる検索要求を示すクエリ(以下では、「再検索クエリ」と表記する場合がある)を検索サーバ30に送信する(ステップS17)。検索サーバ30は、再検索クエリに関する情報を広告装置100に送信する(ステップS18)。
広告装置100は、先に受信していた検索クエリと、検索サーバ30からさらに受信した再検索クエリとに関する情報を保持する。そして、広告装置100は、検索クエリと、再検索クエリとの関連性を示す指標値を算出する(ステップS19)。詳しくは後述するが、広告装置100は、例えば、複数のユーザ端末10から送信された検索クエリと、検索クエリに対応する再検索クエリが送信された数などに応じて、検索クエリを送信したユーザがどのような内容の再検索クエリを送信したか、といった検索傾向を示す傾向値を算出する。
そして、広告装置100は、算出した傾向値に基づいて、再検索クエリの中から所定のキーワードを抽出する(ステップS20)。例えば、広告装置100は、一つの検索クエリに対して複数の再検索クエリが存在する場合に、最も高い傾向値に対応する再検索クエリを所定のキーワードとして抽出する。そして、広告装置100は、広告主が新たに入札するキーワードとして、抽出された所定のキーワードを提示する(ステップS21)。
このように、実施形態に係る広告装置100は、ユーザ端末10から送信された検索クエリと、検索クエリを送信した後にユーザ端末10からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値である傾向値を算出する。そして、広告装置100は、算出された傾向値に基づいて、再検索クエリの中から、検索クエリに基づいて抽出される広告コンテンツ又はLPに紐づかせるキーワードを抽出する。
上記のように、実施形態に係る広告装置100は、広告配信サービスにおいて、実際にユーザが入力するクエリに基づいてキーワードを抽出する。一般に、検索サービスを利用するユーザは、1回目の検索において欲する情報が入手できなかったり、さらに情報を収集することを望んだりしたために、1回目の検索と同じ意図を有しながら、異なるクエリにより2回目の検索を行う。このことから、検索クエリと再検索クエリとは、ユーザの同じ意図を反映した単語である確率が高いといえる。そこで、広告装置100は、上記の関係性に基づき、検索クエリ後の再検索クエリに対する検索傾向を求めることで、再検索クエリに含まれるキーワードであって、広告主が認知しにくいキーワードを抽出することを可能とする。言い換えれば、広告装置100は、広告主自身が入札キーワードとして想定するようなキーワードだけではなく、実際のユーザの行動履歴が反映されたキーワードを抽出することができる。そして、広告主は、広告装置100から抽出されたキーワードの提示を受けることにより、適切なキーワードに新たに入札することができる。このように、広告装置100によれば、広告配信サービスにおいて、一般に広告主が広告配信の対象として想定するユーザ以外のユーザであって、広告主が提供するLPや広告コンテンツに興味関心があると予測されるユーザに対しても、広告配信の対象を拡張することができる。すなわち、広告主は、提供する広告コンテンツに興味を持つと想定されるユーザに広告コンテンツをより多く配信させることができるようになる。結果として、実施形態に係る広告装置100によれば、配信される広告コンテンツが発揮する訴求効果などの、広告コンテンツの広告効果を高めることができる。
〔2.広告装置100の構成〕
次に、図3を用いて、実施形態に係る広告装置100の構成について説明する。図3は、実施形態に係る広告装置100の構成例を示す図である。図3に示すように、広告装置100は、通信部110と、記憶部120と、制御部130とを有する。
(通信部110について)
通信部110は、ネットワークNと有線又は無線で接続され、ユーザ端末10、広告主端末20及び検索サーバ30との間で情報の送受信を行う。例えば、通信部110は、NIC(Network Interface Card)等によって実現される。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3の例では、記憶部120は、広告情報記憶部121と、検索情報記憶部122とを有する。
(広告情報記憶部121について)
広告情報記憶部121は、広告に関する情報を記憶する。ここで、図4に、実施形態に係る広告情報記憶部121の一例を示す。図4は、実施形態に係る広告情報記憶部121の一例を示す図である。図4に示した例では、広告情報記憶部121は、「広告主ID」、「広告コンテンツ」、「LP」、「入札キーワード」といった項目を有する。
「広告主ID」は、広告主又は広告主端末20を識別するための識別情報を示す。なお、以下では、図4に示した広告主IDに記憶されている識別情報を広告主の参照符号として用いる場合がある。例えば、広告主ID「CL01」によって識別される広告主を「広告主CL01」と表記する場合がある。
「広告コンテンツ」は、広告主端末20から入稿された広告コンテンツを示す。図4で
は、「広告コンテンツ」に「AD01」や「AD02」といった概念的な情報が格納される例を示したが、実際には、広告コンテンツの宣伝内容であるテキストデータや、あるいは、これらの格納場所を示すファイルパス名などが格納される。
「LP」は、広告主が提供するLPに関する情報を示す。図4に示す「LP01」という表記は、LPを識別するための識別情報を示すとともに、LPに関する情報を概念的に表現したものである。広告情報記憶部121内に記憶されるLPに関する情報は、LPを構成するHTML(HyperText Markup Language)ファイル等であってもよいし、LPのデータが置かれたURL(Uniform Resource Locator)を示す情報であってもよい。なお、以下では、図4に示したLPの項目に記憶されている情報を、LPの参照符号として用いる場合がある。例えば、LP「LP01」によって示される情報を有するLPを「LP01」と表記する場合がある。
「入札キーワード」は、広告コンテンツに紐づけられている入札キーワードを示す。図4に示す「K001」という表記は、キーワードを識別するための識別情報を示すとともに、キーワードに関する情報を概念的に表現したものである。なお、図4に示すように、広告主は、複数のキーワードに入札することができる。また、入札キーワードは、一つの単語に限られず、複数の単語の組合せであってもよい。
例えば、図4では、広告主ID「CL01」によって識別される広告主CL01が、検索連動型の広告配信サービスにおいて、広告コンテンツ「AD01」を検索結果ページ50に表示させるために、入札キーワード「K001」、「K002」、「K003」、・・・、に入札している例を示している。また、広告コンテンツ「AD01」のリンク先は、LP「LP01」である例を示している。
(検索情報記憶部122について)
検索情報記憶部122は、検索に関する情報を記憶する。ここで、図5に、実施形態に係る検索情報記憶部122の一例を示す。図5は、実施形態に係る検索情報記憶部122の一例を示す図である。図5に示した例では、検索情報記憶部122は、「LP」、「検索クエリ」、「検索回数」、「再検索クエリ」、「傾向値」といった項目を有する。
「LP」は、図4に示すLPに対応する。「検索クエリ」は、検索サービスにおいてユーザ端末10から送信される検索要求を示す。「再検索クエリ」は、検索クエリを送信したユーザ端末10から、さらに送信される検索要求を示す。また、「検索回数」は、検索クエリ又は再検索クエリが検索された回数を示す。言い換えれば、「検索回数」は、検索クエリ又は再検索クエリがユーザ端末10から送信された回数を示す。
「傾向値」は、検索クエリを送信したユーザ端末10がどのような内容の再検索クエリを送信したか、といった検索の傾向を示す値を示す。傾向値は、後述する算出部133によってLP毎に算出される。なお、傾向値は、検索サーバ30から取得する検索クエリ及び再検索クエリに関する情報によって随時変化するため、所定のタイミングで(例えば、一時間に一回など)更新されることがある。
例えば、図5では、「LP11」で示されるウェブページは、ユーザ端末10から検索クエリ「ダイエット」が送信されることによって抽出されるウェブページであり、現時点において、検索クエリ「ダイエット」によって「20281」回だけ検索されていることを示す。また、LP11を表示したユーザ端末10は、さらに再検索クエリ「運動」や、「健康食品」や、「ヨーグルト」や、「エステ」などを送信したことを示す。例えば、再検索クエリ「運動」は、検索クエリ「ダイエット」を送信したユーザ端末10から、現時点において、「4125」回だけ送信されたことを示す。また、検索クエリ「ダイエット」を送信した結果としてLP11を表示したユーザ端末10は、さらに再検索クエリ「運動」を送信する傾向値が「0.2」であり、再検索クエリ「健康食品」を送信する傾向値が「0.2」であり、再検索クエリ「ヨーグルト」を送信する傾向値が「0.2」であり、再検索クエリ「エステ」を送信する傾向値が「0.1」である例を示している。
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告装置100内部の記憶装置に記憶されている各種プログラム(抽出プログラムの一例)がRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部130は、入稿受付部131と、取得部132と、算出部133と、抽出部134と、提示部135と、要求受付部136と、配信部137とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
(入稿受付部131について)
入稿受付部131は、広告コンテンツの入稿を受け付ける。また、入稿受付部131は、広告コンテンツの入稿とともに、広告主が指定する入札キーワードを受け付ける。そして、入稿受付部131は、受け付けた広告コンテンツや、入札キーワードを広告情報記憶部121に格納する。
(取得部132について)
取得部132は、抽出処理に用いる情報を取得する。具体的には、取得部132は、検索サーバ30から送信される検索クエリに関する情報や、再検索クエリに関する情報を取得する。そして、取得部132は、取得した情報を広告情報記憶部121又は検索情報記憶部122内に格納する。また、取得部132は、入稿受付部131が受け付けた広告コンテンツに関する情報や、広告情報記憶部121又は検索情報記憶部122内に格納された情報を適宜取得する。取得部132により取得される情報は、後述する算出処理や抽出処理に利用される。
例えば、取得部132は、検索クエリ及び再検索クエリに関する情報として、検索クエリ及び再検索クエリが送信された回数や、検索クエリ及び再検索クエリに対応するLPや広告コンテンツや、検索クエリ及び再検索クエリを送信したユーザ端末10を識別する情報などを取得する。
(算出部133について)
算出部133は、検索クエリと再検索クエリとの関連性を示す指標値を算出する。具体的には、算出部133は、検索サービスにおいて、検索クエリを送信したユーザ端末10がどのような内容の再検索クエリを送信したか、といった検索の傾向を示す値である傾向値を算出する。
例えば、算出部133は、検索クエリの送信後に再検索クエリが送信された回数に基づいて、検索クエリと再検索クエリとの関連性を示す指標値である傾向値を算出する。すなわち、算出部133は、取得部132により取得される数がより多い再検索クエリは、検索クエリを送信した後にさらに送信されやすい傾向にあるとして、かかる検索クエリに対する再検索クエリの傾向値が高くなるよう算出する。
また、算出部133は、検索クエリと、検索クエリに基づいて抽出されたコンテンツ(例えば、LPや広告コンテンツ)を取得したユーザ端末10からさらに送信される再検索クエリとの関連性を示す指標値である傾向値を算出する。言い換えれば、算出部133は、あらゆるユーザ端末10から送信される検索クエリと再検索クエリとの傾向値を算出するのではなく、検索クエリによって検索されたコンテンツを取得したユーザ端末10から送信される再検索クエリとの傾向値を算出する。これにより、算出部133は、検索サービスにより検索されたコンテンツに対応する検索クエリと再検索クエリとの傾向値を算出するので、かかるコンテンツにおける検索傾向を明確に算出することができる。
また、算出部133は、検索クエリに基づいて抽出されたコンテンツ毎に、検索クエリと再検索クエリとの傾向値を算出する。例えば、ユーザ端末10が検索サービスに対して検索クエリを送信した場合、複数のコンテンツが検索結果として抽出されうる。この場合、ユーザ端末10は、複数のコンテンツの中から選択したコンテンツ(例えば、検索結果ページ50において、リンク先をクリックしたコンテンツ)を取得する。そして、算出部133は、ユーザによって選択されたコンテンツ毎に、検索クエリと再検索クエリとの傾向値を算出する。これにより、算出部133は、検索サービスによって複数のコンテンツが抽出された場合であっても、特定のコンテンツにおける検索傾向を明確に算出することができる。
上述したように、算出部133は、検索サーバ30に検索クエリが送信された結果として抽出された所定のLPについて、再検索クエリが送信された数に基づいて、傾向値を算出する。一例として、算出部133は、所定のLPを表示するために送信された検索クエリの総数を分母とし、各々の再検索クエリが送信された数を分子とした数値を傾向値として算出する。この場合、算出される傾向値は、「0」乃至「1」の数値で表現される。あるいは、算出部133は、検索クエリに対して再検索クエリがどのくらい関連しているかを、例えば、検索クエリ及び再検索クエリが送信された数や頻度に基づいて、既知の手法によりコサイン(cosine)で表現される類似度によって算出してもよい。この場合であっても、算出される傾向値は、「0」乃至「1」の数値で表現される。あるいは、算出部は、再検索クエリが送信された数をそのまま傾向値として扱ってもよい。
そして、算出部133は、算出した傾向値をコンテンツと対応付けて、検索情報記憶部122内に格納する。なお、算出部133は、取得部132によって検索サーバ30から取得される検索クエリ及び再検索クエリに関する情報が随時変化する場合には、例えば、検索情報記憶部122内に格納した傾向値を所定のタイミングで更新するようにしてもよい。
(抽出部134について)
抽出部134は、算出部133によって算出された指標値に基づいて、再検索クエリの中から、検索クエリに基づいて抽出される所定のコンテンツに紐づかせるキーワードを抽出する。具体的には、抽出部134は、算出部133により算出された傾向値がより高い数値に対応する再検索クエリを、広告配信サービスにおいて広告コンテンツ又はLPに紐づかせるキーワードである入札キーワードの一例として抽出する。言い換えれば、抽出部134は、広告主に提示する入札キーワードの候補を抽出する。
なお、抽出部134は、算出部133が検索クエリに基づいて抽出されたコンテンツを取得したユーザ端末10からさらに送信される再検索クエリとの傾向値を算出した場合には、ユーザ端末10によって取得されたコンテンツに紐づかせるキーワードを抽出する。また、抽出部134は、算出部133が検索クエリに基づいて抽出されたコンテンツ毎に傾向値を算出した場合には、傾向値が算出されたコンテンツ毎に、コンテンツに紐づかせるキーワードを抽出する。このように、抽出部134は、算出された傾向値と、コンテンツとを対応付けてキーワードを抽出する。
抽出部134の抽出処理について、図6を用いて、具体的に説明する。図6は、実施形態に係る抽出処理の一例を示す概念図である。なお、図6で例に挙げるLPや、検索クエリや、再検索クエリは、図5で示した検索情報記憶部122内に記憶されているLPや、検索クエリや、再検索クエリを用いる。図6では、検索クエリ「ダイエット」によって抽出されたLP11を取得したユーザ端末10が、再検索クエリを送信した例を示している。
まず、ユーザ端末10は、検索サービスにおいて検索クエリ「ダイエット」を送信する。これにより、検索結果ページ50に、LP11をリンク先とする広告コンテンツ、又はウェブページの検索結果として、LP11へのリンクが表示される。ユーザ端末10は、広告コンテンツ又はリンクをクリックすることで、LP11を取得し、ユーザ端末10の表示画面に表示する。
その後、ユーザ端末10は、再び検索サービスを利用する。この場合、ユーザ端末10は、検索サービスにおいて再検索クエリを送信する。図6では、検索クエリ「ダイエット」を検索したユーザ端末10が送信した再検索クエリを、「ダイエット」と表記された円の周囲の円により示している。図6に示す円において、表記される単語は再検索クエリを示し、数値は、傾向値を示す。すなわち、「ダイエット」を検索した後のユーザ端末10が、再検索クエリとしてどのような単語を送信する傾向にあるのかを示している。図6に示す例では、検索クエリ「ダイエット」の再検索クエリとしては、「運動」、「健康食品」及び「ヨーグルト」が傾向値「0.2」であり、他の再検索クエリよりも高い数値を示している。
この場合、抽出部134は、「運動」、「健康食品」及び「ヨーグルト」の全てを、LP11に紐づかせるキーワードとして抽出してもよいし、この中から、さらに詳細に算出された傾向値に基づいて、一つだけキーワードを抽出してもよい。
なお、再検索クエリ「ヨーグルト」を送信したユーザ端末10が、再検索クエリ「ヨーグルト」によって抽出されるLP12を取得する場合がある。そして、LP12を取得したユーザ端末10がさらに再検索クエリを送信する場合がある。この場合には、LP12に対して、「ヨーグルト」は、検索クエリとして扱われる。すなわち、抽出部134は、検索クエリ「ヨーグルト」によって抽出されるLP12を取得したユーザ端末10から送信される再検索クエリに対応する傾向値に基づいて、LP12に紐づかせるキーワードを抽出する。
図6に示す例では、検索クエリ「ヨーグルト」の再検索クエリとしては、「美腸」が傾向値「0.4」であり、他の再検索クエリよりも高い数値を示している。この場合、抽出部134は、再検索クエリ「美腸」をLP12に紐づかせるキーワードとして抽出する。
なお、抽出部134は、LP11に紐づかせるキーワードとしては、再検索クエリ「美腸」を抽出しなくてもよい。すなわち、抽出部134は、検索クエリを送信したユーザ端末10がその後に送信した再検索クエリであっても、抽出処理に用いなくてもよい。言い換えれば、抽出部134は、検索クエリを送信したユーザ端末10が直後に送信した検索クエリのみを再検索クエリとして扱ってもよい。これにより、抽出部134は、検索クエリの連鎖によって関連性が低いと想定される再検索クエリがキーワードとして抽出されるのを防止することができる。
(提示部135について)
提示部135は、抽出部134によって抽出されたキーワードを提示する。具体的には、提示部135は、広告配信サービスにおいて広告コンテンツに紐づかせる入札キーワードとして、抽出部134によって抽出されたキーワードを広告主に提示する。
なお、提示部135は、抽出部134によって抽出されたキーワードであっても、入札キーワードとして広告主に提示しない場合があってもよい。例えば、提示部135は、広告コンテンツに設定されうる除外キーワードについては提示しなくてもよい。広告コンテンツに設定されうる除外キーワードとは、例えば、広告コンテンツの提供主である広告主と競合する企業名や、競合する企業が扱う製品名などが該当する。
(要求受付部136について)
要求受付部136は、広告コンテンツの配信に関する要求を受け付ける。例えば、要求受付部136は、広告コンテンツの取得要求として、ユーザ端末10が表示するウェブページに含まれるHTTP(Hypertext Transfer Protocol)リクエストを受け付ける。
(配信部137について)
配信部137は、広告コンテンツを配信する。例えば、配信部137は、要求受付部136が受け付けたHTTPリクエストに従い、ユーザ端末10に広告コンテンツを配信する。また、配信部137は、要求受付部136によって広告コンテンツの取得要求が受け付けられた場合には、配信候補の広告コンテンツを広告情報記憶部121から選択する。
ここで、配信部137は、要求受付部136が受け付けた検索クエリと入札キーワードが同一又は類似である場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する。そして、配信部137は、検索クエリを検索サーバ30に送信したユーザ端末10に、選択した広告コンテンツを配信する。
〔3.抽出処理手順〕
次に、図7を用いて、実施形態に係る広告装置100が実行する抽出処理の手順について説明する。図7は、実施形態に係る広告装置100による抽出処理手順を示すフローチャートである。
図7に示すように、広告装置100は、広告配信サービスを利用する広告主から、広告コンテンツの入稿を受け付けたか否かを判定する(ステップS101)。広告装置100は、広告コンテンツの入稿を受け付けていない場合には(ステップS101;No)、受け付けるまで待機する。
一方、広告装置100は、広告コンテンツの入稿を受け付けた場合には(ステップS101;Yes)、入稿された広告コンテンツを抽出させる検索クエリと、かかる検索クエリに対応する再検索クエリとに関する情報に基づいて、傾向値を算出する(ステップS102)。
そして、広告装置100は、検索クエリと再検索クエリとの傾向値に基づき、再検索クエリの中からキーワードを抽出する(ステップS103)。そして、広告装置100は、抽出したキーワードを、入稿された広告コンテンツに紐づくキーワードである入札キーワードとして、広告コンテンツを入稿した広告主に提示する(ステップS104)。
なお、図7では、広告装置100が、ステップS102において、広告コンテンツの入稿を受け付けた後に、広告コンテンツに対応する傾向値を算出する例を示した。しかし、この例に限られず、広告装置100は、広告コンテンツの入稿を受け付けた後に、例えば、一定量の検索クエリや再検索クエリに関する情報を蓄積する期間を設けてもよい。そして、広告装置100は、一定量の検索クエリや再検索クエリに関する情報を蓄積する期間が経過した後に、傾向値を算出してもよい。また、広告装置100は、ステップS104において、キーワードを広告主に提示した後に、さらに異なるキーワードを抽出してもよい。すなわち、広告装置100は、抽出されたキーワードに対する広告主の対応によっては、ステップS103とステップS104を繰り返し実行してもよい。例えば、広告主が提示されたキーワード以外のキーワードを所望する場合には、広告装置100は、キーワードとして先に抽出した再検索クエリに対応する傾向値よりも低い傾向値に対応する再検索クエリを抽出する。そして、広告装置100は、新たに抽出されたキーワードを広告主に提示する。
〔4.変形例〕
上述した実施形態は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、他の実施形態について説明する。
〔4−1.検索クエリ〕
上記実施形態において、広告装置100は、検索クエリと再検索クエリとの関連性を示す指標値である傾向値に基づいて、キーワードを抽出する例を示した。そして、広告装置100は、LPを抽出させる検索クエリが送信された回数と、かかる検索クエリに対応する再検索クエリが送信された回数とに基づいて、傾向値を算出する例を示した。ここで、広告装置100は、LPを抽出させる検索クエリが複数ある場合には、例えば、検索クエリごとに所定の重み値を付与することなどにより、適切な傾向値が算出されるように調整してもよい。
すなわち、広告装置100に係る算出部133は、所定のコンテンツが抽出される検索クエリが複数ある場合に、検索クエリがユーザ端末10から送信された回数に基づいて、傾向値を算出する。ここで、検索サービスにおいて、LPや広告コンテンツなどのコンテンツは、検索クエリが入札キーワードやLP単語である場合に抽出されるため、コンテンツを抽出させる検索クエリはコンテンツごとに複数存在する。このため、コンテンツに対応する各検索クエリが送信される回数にはそれぞれ差異が生じる。
この場合に、上記実施形態における傾向値の算出手法を用いた場合、分母となる検索クエリの検索回数が少ないほど、再検索クエリの検索回数に対する傾向値が上昇することになる。しかし、算出される傾向値に比べて、再検索クエリの検索回数が全体数と比して多くない場合には、かかる再検索クエリが入札キーワードとして有用なものであるとは言い難い。
そこで、算出部133は、例えば、コンテンツに対する各検索クエリのうち、例えば、検索回数の多い検索クエリの再検索クエリに対応する傾向値に所定の重み値を付与することなどにより、算出される検索クエリごとの傾向値に差異が生じないようにすることができる。また、算出部133は、コンテンツを抽出させる全検索クエリのうち、比較的検索回数の少ない検索クエリ(例えば、所定の閾値以下の検索回数の検索クエリ)については、算出処理の対象としないようにしてもよい。
また、算出部133は、コンテンツを抽出させる検索クエリに対して、比較的多数の種類の再検索クエリが存在する場合には、かかる検索クエリと再検索クエリとの傾向値について、他の検索クエリに対応する傾向値よりも値が低く算出されるような重み値を付与してもよい。例えば、検索クエリ「ダイエット」のように、比較的多数の種類の再検索クエリが存在すると想定される場合には、ユーザの検索意図が複数の意図で解釈される(ユーザの意図と、広告主が提供するLPなどの内容との齟齬が生じる可能性が高い)。このため、算出部133は、検索クエリ「ダイエット」については、各再検索クエリとの傾向値を低く算出することにより、キーワードが抽出しにくくなるように調整することができる。
〔4−2.抽出〕
上記実施形態では、抽出部134は、再検索クエリの中から、検索クエリに基づいて抽出される所定のコンテンツに紐づかせるキーワードを抽出する例を示した。しかし、抽出部134は、検索クエリの中から、再検索クエリに基づいて抽出される所定のコンテンツに紐づかせるキーワードを抽出してもよい。
例えば、検索サービスにおいて、ユーザ端末10から送信された第1の検索クエリによって広告コンテンツが抽出されなかった場合であって、その後にユーザ端末10から送信された第2の検索クエリによって広告コンテンツが抽出された場合を想定する。この場合、ユーザ端末10に係るユーザは、同じ検索意図をもって、第1及び第2の検索クエリを送信して検索を行ったものと考えられる。そこで、抽出部134は、ユーザ端末10が送信した第2の検索クエリを再検索クエリとして扱い、第1の検索クエリと再検索クエリとの関係性を示す指標値に基づいて、第1の検索クエリの中から、広告主に提示する入札キーワードの候補を抽出してもよい。
〔4−3.広告コンテンツ〕
上記実施形態において、広告装置100は、検索クエリと再検索クエリとの関連性を示す指標値である傾向値に基づいて、キーワードを抽出する例を示した。また、広告装置100は、LPを取得したユーザ端末10から、検索クエリの送信後に再検索クエリが送信された回数に基づいて、傾向値を算出する例を示した。ここで、広告装置100は、LPを取得したユーザ端末10に限らず、広告コンテンツを取得したユーザ端末10から再検索クエリが送信された回数に基づいて、傾向値を算出してもよい。この場合、検索クエリが送信された結果として、広告コンテンツはユーザ端末10に配信されており、ユーザ端末10によって取得されているため、広告装置100は、ユーザが広告コンテンツを選択(例えば、ユーザ端末10上において広告コンテンツをクリック)したか否かを判定しなくてもよい。また、広告装置100は、ユーザが広告コンテンツを選択した場合には、かかるユーザは他のユーザよりも広告主に興味関心があるものとして、かかるユーザに対応するユーザ端末10から送信される再検索クエリに所定の重み値を付与してもよい。なお、上記実施形態において、検索クエリがLP単語や入札キーワードである例を示したが、検索クエリは、広告コンテンツに含まれる単語であってもよい。
〔4−4.学習〕
また、広告装置100は、抽出部134によって抽出されたキーワードに対して広告主が入札を行った後に、かかるキーワードがユーザに入力されたことを契機として広告コンテンツが何回表示されたか、などの結果を取得してもよい。すなわち、広告装置100は、抽出処理を実行した後であっても、広告コンテンツの表示回数や、ユーザから広告コンテンツがクリックされた回数などを取得する。言い換えれば、広告装置100は、抽出したキーワードを広告主が入札キーワードとした場合の広告効果を測定する。そして、広告装置100は、取得したCTRや、CVRなどの指標をさらに用いて、上記抽出処理に利用してもよい。このように、広告装置100は、抽出したキーワードによる広告効果などの結果を測定し、かかる結果が反映された学習モデルにより、キーワードを抽出してもよい。そして、広告装置100は、処理を繰り返すことにより、よりユーザから検索されやすく、広告効果を向上させやすいキーワードを抽出することができる。このため、広告装置100は、広告コンテンツの広告効果をより高めることができる。
〔4−5.広告主〕
上記実施形態において、広告主は、広告主端末20を用いて、広告装置100に広告コンテンツを入稿する例を示した。しかし、広告主は、自ら広告装置100に広告コンテンツを入稿せずに、かかる処理を代理店に依頼する場合もある。この場合、広告装置100にかかる処理をするのは代理店となる。すなわち、「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主端末」といった表記は、広告主端末20だけでなく代理店によって利用される代理店端末を含む概念であるものとする。
〔4−6.広告配信〕
また、配信部137は、広告コンテンツの配信において、同じ入札キーワードに紐づく広告コンテンツが複数ある場合には、入札キーワードの入札価格が高い広告主や、CTRの高い広告コンテンツや、入札価格及びCTRの双方が高い広告コンテンツを優先して選択するようにしてもよい。そして、配信部137は、選択した広告コンテンツをユーザ端末10に配信する。
〔4−7.再検索クエリ〕
上記実施形態において、再検索クエリの一例として、検索サーバ30は、検索クエリを送信したユーザ端末10であって、LPを取得したユーザ端末10から再び送信される検索クエリを再検索クエリとして扱う例を示した。しかし、検索サーバ30は、他の状況において送信される検索クエリを再検索クエリとして扱ってもよい。
例えば、検索サーバ30は、ユーザ端末10から検索クエリが送信された後、所定時間内(例えば、10分以内など)に送信される検索クエリを再検索クエリとして扱ってもよい。また、検索サーバ30は、検索結果ページ50を取得したユーザ端末10において、検索結果ページ50を表示させた直後に、検索クエリ入力部52に新たに入力されることにより、検索サーバ30に送信される検索クエリを再検索クエリとして扱ってもよい。この場合、検索サーバ30は、ユーザが検索クエリによって抽出されたLPを閲覧していたか否かを判定しなくともよい。なお、検索サーバ30は、LPを取得したユーザ端末10から再び送信される検索クエリであっても、ユーザ端末10から検索クエリが送信された後、所定時間外(例えば、先の検索クエリの送信から24時間経過後)に送信される検索クエリについては、再検索クエリとして扱わないようにしてもよい。
また、検索サーバ30は、検索クエリを送信したユーザ端末10が、検索結果ページ50において広告コンテンツをクリックせず、他のウェブページのリンクをクリックした場合であっても、その後、再び検索結果ページ50を表示させたユーザ端末10から送信される検索クエリを再検索クエリとして扱ってもよい。上記のように、検索サーバ30は、ユーザが同じ検索意図をもって検索していると想定される前後の検索クエリを、検索クエリと再検索クエリとして扱うことができる。
また、広告装置100がユーザ端末10からクエリ情報を受信する場合もありうる。例えば、広告装置100は、ユーザ端末10が検索結果ページ50を表示する際に送信される広告取得要求に含まれるリクエストに基づいて、検索クエリに関する情報を取得する。この場合、広告装置100に係る算出部133は、ユーザ端末10から検索クエリが送信された後に、ユーザ端末10から所定時間内に送信される新たな検索クエリを再検索クエリとして、新たな検索クエリと、再検索クエリとの傾向値を算出してもよい。なお、ユーザ端末10の同一性は、例えば、ユーザ端末10から送信されるクッキー(Cookie)等に含まれる端末の識別情報に基づいて識別される。
〔4−8.他の用途〕
上記実施形態において、広告装置100は、検索連動型の広告配信サービスにおける入札キーワードを抽出する例を示した。しかし、広告装置100は、上記のような検索連動型以外の広告配信に利用されてもよい。例えば、広告装置100は、キーワードに対する入札を受け付け、かかるキーワードと親和性の高い内容のウェブページに広告コンテンツを配信するような、いわゆる広告コンテンツマッチ型の広告サービスに利用されてもよい。
また、上記実施形態において、コンテンツの一例として、広告コンテンツやLPを挙げ、キーワードの一例として、入札キーワードを例に挙げて説明した。しかし、広告装置100は、広告コンテンツやLPに紐づく入札キーワードを抽出するのみならず、他の用途として利用されてもよい。
例えば、広告装置100は、所定のコンテンツに含まれるテキストを検索する場合(例えば、ウェブサイトの検索サービスを利用する場合)などに、ユーザから送信される検索クエリと再検索クエリとの傾向値を算出する。そして、広告装置100は、新たなユーザから所定の検索クエリを受け付けた場合に、算出済みである既存の傾向値に基づいて、新たなユーザから受け付けた検索クエリに対応する再検索クエリの中から、キーワードを抽出する。これにより、広告装置100は、ユーザから受け付けた所定の検索クエリと関連性のあるキーワードを抽出することができる。例えば、広告装置100は、検索サービスを利用する新たなユーザに、抽出されたキーワードを提示する。このように、広告装置100は、コンテンツに関する検索において、有用な検索クエリを提示するキーワード抽出のアシストを実行する装置であってもよい。
また、上記の例において、本願に係る抽出装置が検索サーバ30に対応する場合、検索サーバ30は、検索結果ページ50に検索クエリのアシストとなるキーワードを表示してもよい。すなわち、検索サーバ30は、抽出したキーワードを、先にユーザが入力した検索クエリの代わりに、所定のウェブページを検索するための検索クエリとしてユーザに提示する。ユーザは、提示されたキーワードに基づいて検索を実行することにより、効率よく目的のウェブページを検索できる場合がある。この場合、検索サーバ30は、検索サービスを実行する制御部に加え、上記実施形態に係る取得部132、算出部133、抽出部134及び提示部135に対応する各処理部を有する。そして、算出部133は、ユーザ端末10から送信された検索クエリと、検索クエリを送信した後にユーザ端末10からさらに送信される検索クエリである再検索クエリとの傾向値を算出し、抽出部134は、算出された傾向値に基づいて、再検索クエリの中から、所定のコンテンツ(例えば、目的のウェブページ)を抽出させるためのキーワードを抽出する。
〔4−9.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図3に示した広告情報記憶部121や検索情報記憶部122は、広告装置100が保持せずに、図示しないストレージサーバ等が保持してもよい。この場合、広告装置100は、ストレージサーバから広告に関する情報等を取得する。
また、例えば、上記実施形態では、広告装置100が検索クエリなどに関する情報を取得し、取得した情報に基づいてキーワードを抽出する例を示したが、広告装置100が実行する処理は、広告装置100の機能を実現する個別の装置により実行されてもよい。例えば、上述した広告装置100は、入稿受付部131と取得部132とを有する情報取得装置と、算出部133と抽出部134とを有する抽出装置と、提示部135を有する提示装置と、要求受付部136と配信部137とを有する配信装置とに分散されてもよい。
〔5.ハードウェア構成〕
また、上述してきた実施形態に係る広告装置100は、例えば図8に示すような構成のコンピュータ1000によって実現される。以下、広告装置100を例に挙げて説明する。図8は、広告装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(ネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る広告装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
〔6.効果〕
上述してきたように、実施形態に係る広告装置100は、算出部133と、抽出部134とを有する。算出部133は、ユーザ端末10から送信された検索クエリと、検索クエリを送信した後にユーザ端末10からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値である傾向値を算出する。抽出部134は、算出部133によって算出された指標値に基づいて、再検索クエリの中から、検索クエリに基づいて抽出される所定のコンテンツ(例えば、広告コンテンツ)に紐づかせるキーワードを抽出するか、又は、検索クエリの中から、再検索クエリに基づいて抽出される所定のコンテンツに紐づかせるキーワードを抽出する。
このように、実施形態に係る広告装置100は、ユーザ端末10から送信される検索クエリと同じ検索意図を持つ再検索クエリの中から、入札キーワードとするキーワードを抽出することができる。これにより、広告装置100によれば、広告主は、自身が想定するユーザ以外の他のユーザに広告コンテンツを配信させる可能性を高めることができるので、広告コンテンツの配信対象を適切に拡張することができる。結果として、広告装置100は、より多くのユーザにコンテンツを配信することで、コンテンツが有するユーザへの訴求効果を高めることができる。
また、算出部133は、検索クエリの送信後に再検索クエリが送信された回数に基づいて、検索クエリと再検索クエリとの傾向値を算出する。
このように、実施形態に係る広告装置100は、再検索クエリがユーザ端末10から送信される回数に応じて傾向値を算出する。これにより、広告装置100は、ユーザの興味関心に沿ったキーワードを抽出することができる。
また、算出部133は、検索クエリと、検索クエリに基づいて抽出されたコンテンツを取得したユーザ端末10からさらに送信される再検索クエリとの傾向値を算出する。抽出部134は、ユーザ端末10によって取得されたコンテンツに紐づかせるキーワードを抽出する。
このように、実施形態に係る広告装置100は、単に全てのユーザ端末10から送信される再検索クエリを処理対象とするのではなく、コンテンツを取得したユーザ端末10から送信される再検索クエリを処理対象とする。これにより、広告装置100は、ユーザの意図がより明確な再検索クエリの中から、キーワードを抽出することができる。
また、算出部133は、検索クエリに基づいて抽出されたコンテンツ毎に、検索クエリと再検索クエリとの傾向値を算出する。抽出部134は、コンテンツ毎に、コンテンツに紐づかせるキーワードを抽出する。
このように、実施形態に係る広告装置100は、検索クエリによって抽出された(検索された)コンテンツの全てに対応した傾向値を算出するのでなく、コンテンツ毎に傾向値を算出する。例えば、広告装置100は、広告主が入稿した広告コンテンツに対応する傾向値に基づいてキーワードを抽出する。これにより、広告装置100は、検索サービスを利用するユーザ全体の傾向ではなく、かかるコンテンツに対応するユーザの傾向を活用するため、かかるコンテンツに紐づかせるキーワードを明確に抽出することができる。
また、算出部133は、所定のコンテンツが抽出される検索クエリが複数ある場合に、検索クエリがユーザ端末から送信された回数に基づいて傾向値を算出する。
このように、実施形態に係る広告装置100は、実際の検索状況やユーザの興味関心に沿った傾向値を算出する。このため、広告装置100は、現状に則した、適切なキーワードを抽出することができる。
また、算出部133は、ユーザ端末10から検索クエリが送信された後に、ユーザ端末10から所定時間内にさらに送信される検索クエリを再検索クエリとして、先に送信された検索クエリと再検索クエリとの傾向値を算出する。
このように、実施形態に係る広告装置100は、所定時間内にユーザから送信される検索クエリを再検索クエリとして扱うので、同じ検索意図を持つと想定されるクエリ同士を処理対象とし易くなる。これにより、広告装置100は、前後に送信される検索クエリ同士の関連性に則したキーワードを抽出することができる。
また、算出部133は、コンテンツとして、広告主が入稿する広告コンテンツ、又は前記広告コンテンツのリンク先となるウェブページを用いて傾向値を算出する。
これにより、実施形態に係る広告装置100は、例えば検索連動型など、キーワードマッチ型の広告配信サービスにおいて、適切な入札キーワードを抽出することができる。
また、実施形態に係る広告装置100は、所定のコンテンツに紐づかせるキーワードとして、抽出部134によって抽出されたキーワードをコンテンツの提供主(例えば、広告主など)に提示する提示部135をさらに備える。
このように、実施形態に係る広告装置100は、キーワードに入札する広告主に、適切なキーワードを提示する。このため、広告装置100によれば、広告主は、新たに追加する入札キーワードとして適切なキーワードを知ることができる。また、広告配信サービスの管理者側は、広告主から入札されるキーワードが増えることにより、入札の促進につながり、サービスの活性化を図ることができる。
なお、実施形態に係る広告装置100は、ユーザ端末10から送信された検索クエリと、検索クエリを送信した後にユーザ端末10からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値である傾向値を算出する算出部133と、算出部133によって算出された傾向値に基づいて、再検索クエリの中から、所定のコンテンツを抽出させるためのキーワードを抽出する抽出部134とを備えてもよい。
このように、実施形態に係る広告装置100は、検索クエリと再検索クエリとの傾向を判定することにより、コンテンツを抽出させるためのキーワードを抽出する。これにより、実施形態に係る広告装置100によれば、例えば、ユーザは、広告装置100が抽出する有用なキーワードを用いて検索サービス等を利用することができる。また、広告装置100は、検索サービス等に限られず、例えば、任意のテキストを含むドキュメントの検索等にあたって、有用なクエリを抽出することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、算出部は、算出手段や算出回路に読み替えることができる。
1 抽出システム
10 ユーザ端末
20 広告主端末
30 検索サーバ
100 広告装置
110 通信部
120 記憶部
121 広告情報記憶部
122 検索情報記憶部
130 制御部
131 入稿受付部
132 取得部
133 算出部
134 抽出部
135 提示部
136 要求受付部
137 配信部

Claims (10)

  1. ユーザ端末から送信された検索クエリと、当該検索クエリを送信した後に当該ユーザ端末からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値を算出する算出部と、
    前記算出部によって算出された指標値に基づいて、前記再検索クエリの中から、前記検索クエリに関連するキーワードを抽出する抽出部と、
    を備えることを特徴とする抽出装置。
  2. 前記算出部は、
    前記検索クエリの送信後に前記再検索クエリが送信された回数に基づいて、当該検索クエリと当該再検索クエリとの関連性を示す指標値を算出する、
    ことを特徴とする請求項1に記載の抽出装置。
  3. 前記算出部は、
    前記検索クエリと、当該検索クエリに基づいて抽出されたコンテンツを取得した前記ユーザ端末からさらに送信される再検索クエリとの関連性を示す指標値を算出し、
    前記抽出部は、
    前記検索クエリに関連するキーワードを、前記ユーザ端末によって取得されたコンテンツに紐づかせるキーワードとして抽出する、
    ことを特徴とする請求項1又は2に記載の抽出装置。
  4. 前記算出部は、
    前記検索クエリに基づいて抽出されたコンテンツ毎に、前記検索クエリと前記再検索クエリとの関連性を示す指標値を算出し、
    前記抽出部は、
    前記検索クエリに関連するキーワードを、前記コンテンツ毎に、当該コンテンツに紐づかせるキーワードとして抽出する、
    ことを特徴とする請求項3に記載の抽出装置。
  5. 前記算出部は、
    所定のコンテンツを抽出する前記検索クエリが複数ある場合に、当該検索クエリがユーザ端末から送信された回数に基づいて、前記指標値を算出する、
    ことを特徴とする請求項1〜4のいずれか一つに記載の抽出装置。
  6. 前記算出部は、
    前記ユーザ端末から前記検索クエリが送信された後に、当該ユーザ端末から所定時間内にさらに送信される検索クエリを前記再検索クエリとして、当該検索クエリと当該再検索クエリとの関連性を示す指標値を算出する、
    ことを特徴とする請求項1〜5のいずれか一つに記載の抽出装置。
  7. 前記算出部は、
    前記検索クエリ及び前記再検索クエリによって抽出されるコンテンツが、広告主が入稿する広告コンテンツ、又は前記広告コンテンツのリンク先となるウェブページである前記検索クエリと前記再検索クエリとの関連性を示す前記指標値を算出する、
    ことを特徴とする請求項1〜6のいずれか一つに記載の抽出装置。
  8. 前記検索クエリに関連するキーワードとして、前記抽出部によって抽出されたキーワードを、当該キーワードに紐づかせる所定のコンテンツの提供主に提示する提示部、
    をさらに備えたことを特徴とする請求項1〜7のいずれか一つに記載の抽出装置。
  9. コンピュータが実行する抽出方法であって、
    ユーザ端末から送信された検索クエリと、当該検索クエリを送信した後に当該ユーザ端末からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値を算出する算出工程と、
    前記算出工程によって算出された指標値に基づいて、前記再検索クエリの中から、前記検索クエリに関連するキーワードを抽出する抽出工程と、
    を含んだことを特徴とする抽出方法。
  10. ユーザ端末から送信された検索クエリと、当該検索クエリを送信した後に当該ユーザ端末からさらに送信される検索クエリである再検索クエリとの関連性を示す指標値を算出する算出手順と、
    前記算出手順によって算出された指標値に基づいて、前記再検索クエリの中から、前記検索クエリに関連するキーワードを抽出する抽出手順と、
    をコンピュータに実行させることを特徴とする抽出プログラム。
JP2016133381A 2016-07-05 2016-07-05 抽出装置、抽出方法および抽出プログラム Active JP6310509B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016133381A JP6310509B2 (ja) 2016-07-05 2016-07-05 抽出装置、抽出方法および抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016133381A JP6310509B2 (ja) 2016-07-05 2016-07-05 抽出装置、抽出方法および抽出プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014179248A Division JP5968381B2 (ja) 2014-09-03 2014-09-03 抽出装置、抽出方法および抽出プログラム

Publications (2)

Publication Number Publication Date
JP2016189215A true JP2016189215A (ja) 2016-11-04
JP6310509B2 JP6310509B2 (ja) 2018-04-11

Family

ID=57239739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016133381A Active JP6310509B2 (ja) 2016-07-05 2016-07-05 抽出装置、抽出方法および抽出プログラム

Country Status (1)

Country Link
JP (1) JP6310509B2 (ja)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02253373A (ja) * 1989-03-28 1990-10-12 Nippon Telegr & Teleph Corp <Ntt> 画像データベース作成方法
JPH11272706A (ja) * 1998-03-24 1999-10-08 Minolta Co Ltd 検索装置
JP2004145706A (ja) * 2002-10-25 2004-05-20 Canon Inc マルチメディアデータ検索システム
JP2006092251A (ja) * 2004-09-24 2006-04-06 Fuji Xerox Co Ltd キーワード付与支援装置及びキーワード付与支援方法、キーワード付与支援プログラム
JP2007515721A (ja) * 2003-12-22 2007-06-14 インターナショナル・ビジネス・マシーンズ・コーポレーション ドキュメント拡張方法
WO2008114433A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 情報検索システム、情報検索プログラムおよび情報検索方法
JP2010231344A (ja) * 2009-03-26 2010-10-14 Ntt Docomo Inc 検索用参照データ作成装置、情報検索装置、検索用参照データ作成方法及び情報検索方法
JP2010244341A (ja) * 2009-04-07 2010-10-28 Nippon Telegr & Teleph Corp <Ntt> 属性表現獲得方法及び装置及びプログラム
JP2010267001A (ja) * 2009-05-13 2010-11-25 Digital Advertising Consortium Inc 広告支援システム及び広告支援方法
US20110191175A1 (en) * 1999-09-22 2011-08-04 Google Inc. Determining a Meaning of a Knowledge Item Using Document Based Information
JP2011210000A (ja) * 2010-03-30 2011-10-20 Yahoo Japan Corp 画像検索装置
JP2012008900A (ja) * 2010-06-28 2012-01-12 Nippon Telegr & Teleph Corp <Ntt> 関連語句抽出方法、関連語句抽出装置及び関連語句抽出プログラム
JP2013232108A (ja) * 2012-04-27 2013-11-14 Rakuten Inc タグ管理装置、タグ管理方法、タグ管理プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02253373A (ja) * 1989-03-28 1990-10-12 Nippon Telegr & Teleph Corp <Ntt> 画像データベース作成方法
JPH11272706A (ja) * 1998-03-24 1999-10-08 Minolta Co Ltd 検索装置
US20110191175A1 (en) * 1999-09-22 2011-08-04 Google Inc. Determining a Meaning of a Knowledge Item Using Document Based Information
JP2004145706A (ja) * 2002-10-25 2004-05-20 Canon Inc マルチメディアデータ検索システム
JP2007515721A (ja) * 2003-12-22 2007-06-14 インターナショナル・ビジネス・マシーンズ・コーポレーション ドキュメント拡張方法
JP2006092251A (ja) * 2004-09-24 2006-04-06 Fuji Xerox Co Ltd キーワード付与支援装置及びキーワード付与支援方法、キーワード付与支援プログラム
WO2008114433A1 (ja) * 2007-03-20 2008-09-25 Fujitsu Limited 情報検索システム、情報検索プログラムおよび情報検索方法
JP2010231344A (ja) * 2009-03-26 2010-10-14 Ntt Docomo Inc 検索用参照データ作成装置、情報検索装置、検索用参照データ作成方法及び情報検索方法
JP2010244341A (ja) * 2009-04-07 2010-10-28 Nippon Telegr & Teleph Corp <Ntt> 属性表現獲得方法及び装置及びプログラム
JP2010267001A (ja) * 2009-05-13 2010-11-25 Digital Advertising Consortium Inc 広告支援システム及び広告支援方法
JP2011210000A (ja) * 2010-03-30 2011-10-20 Yahoo Japan Corp 画像検索装置
JP2012008900A (ja) * 2010-06-28 2012-01-12 Nippon Telegr & Teleph Corp <Ntt> 関連語句抽出方法、関連語句抽出装置及び関連語句抽出プログラム
JP2013232108A (ja) * 2012-04-27 2013-11-14 Rakuten Inc タグ管理装置、タグ管理方法、タグ管理プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
牧野 俊朗,他: ""検索ログを利用した概念辞書の拡張"", 情報処理学会第61回(平成12年後期)全国大会講演論文集(3), JPN6017019087, 3 October 2000 (2000-10-03), pages 3 - 105, ISSN: 0003741961 *

Also Published As

Publication number Publication date
JP6310509B2 (ja) 2018-04-11

Similar Documents

Publication Publication Date Title
JP5928920B2 (ja) お勧めデータの決定
JP7117826B2 (ja) 検索装置、検索方法及び検索プログラム
JP6023129B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP2021119488A (ja) 算出装置、算出方法及び算出プログラム
RU2757546C2 (ru) Способ и система для создания персонализированного пользовательского параметра интереса для идентификации персонализированного целевого элемента содержимого
JP6235443B2 (ja) 抽出装置、抽出方法および抽出プログラム
US10135933B2 (en) Apparatus and method for generating dynamic similarity audiences
JP2017054176A (ja) 決定装置、決定方法および決定プログラム
US10146559B2 (en) In-application recommendation of deep states of native applications
JP6698730B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP6865045B2 (ja) 検索装置、検索方法及び検索プログラム
JP6320258B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP2018088282A (ja) 抽出装置、抽出方法及び抽出プログラム
JP6866069B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
WO2017126707A1 (ja) 商品購入支援システム
JP6311052B1 (ja) 抽出装置、抽出方法及び抽出プログラム
JP5968381B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP2016177772A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP6310509B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6100741B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6355151B2 (ja) オファーリングシステム、オファーリング方法及びプログラム
JP7140561B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5693629B2 (ja) 広告抽出装置、広告抽出方法及び広告抽出プログラム
JP2017174314A (ja) 広告配信システム
JP6072739B2 (ja) 抽出装置、抽出方法および抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180316

R150 Certificate of patent or registration of utility model

Ref document number: 6310509

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250