JP6072739B2 - 抽出装置、抽出方法および抽出プログラム - Google Patents

抽出装置、抽出方法および抽出プログラム Download PDF

Info

Publication number
JP6072739B2
JP6072739B2 JP2014173956A JP2014173956A JP6072739B2 JP 6072739 B2 JP6072739 B2 JP 6072739B2 JP 2014173956 A JP2014173956 A JP 2014173956A JP 2014173956 A JP2014173956 A JP 2014173956A JP 6072739 B2 JP6072739 B2 JP 6072739B2
Authority
JP
Japan
Prior art keywords
keyword
combination
extraction
keywords
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014173956A
Other languages
English (en)
Other versions
JP2016048527A (ja
Inventor
塚本 浩司
浩司 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014173956A priority Critical patent/JP6072739B2/ja
Publication of JP2016048527A publication Critical patent/JP2016048527A/ja
Application granted granted Critical
Publication of JP6072739B2 publication Critical patent/JP6072739B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、抽出装置、抽出方法および抽出プログラムに関する。
インターネット上には膨大な情報が開示されており、ユーザは、知りたい情報を探す際には検索サイトを利用する場合が多い。かかる検索サイトでは、検索マッチング広告や検索連動広告と呼ばれる広告配信が行われることがある。
この種の広告配信において、広告主が広告の入稿時に一又は二以上の広告関連キーワードを指定する技術が知られている。この技術では、広告関連キーワードがユーザから検索キーワードとして入力された場合に、検索キーワードに応じた検索結果に隣接させて、広告関連キーワードに関連する広告を表示する。
特開2010−211777号公報
しかしながら、上記の従来技術では、広告効果を高めることができるとは限らない。具体的には、上記の従来技術では、入稿された広告に対して広告主が適切に広告関連キーワードを指定する手法については開示されていない。そして、広告関連キーワードに基づく広告配信サービスにおいては、広告関連キーワードが適切に指定されなければ、適切な広告を配信することができない。これにより、配信される広告の効果が十分に発揮されないおそれがある。
本願に係る抽出装置は、キーワードを指定した指定者毎に生成される当該キーワードの各組合せの指標値を算出する算出部と、前記算出部によって算出された前記組合せ毎の指標値に基づいて、前記キーワードの各組合せのうち新たに指定される第1キーワードを含む組合せから、当該第1キーワードと異なる第2キーワードを抽出する抽出部と、を備えたことを特徴とする。
実施形態の一態様によれば、広告効果を高めることができるという効果を奏する。
図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。 図2は、実施形態に係る抽出処理の一例を示す図である。 図3は、実施形態に係る広告装置の構成例を示す図である。 図4は、実施形態に係る広告情報記憶部の一例を示す図である。 図5は、実施形態に係る組合せ情報記憶部の一例を示す図である。 図6は、実施形態に係る算出処理の一例を示す概念図である。 図7は、実施形態に係る抽出処理の一例を示す概念図である。 図8は、実施形態に係る広告装置による抽出処理手順を示すフローチャートである。 図9は、変形例に係る広告情報記憶部の一例を示す図である。 図10は、変形例に係る組合せ情報記憶部の一例を示す図である。 図11は、広告装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.抽出処理〕
以下では、図1及び図2を用いて、実施形態に係る抽出処理の一例について説明する。図1及び図2では、本願に係る抽出装置に対応する広告装置100によって配信処理及び抽出処理が行われる例を示す。まず、図1を用いて、実施形態に係る広告配信の一例を説明する。図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。
図1には、実施形態に係る広告コンテンツが表示されるウェブページとして、ユーザ端末10に表示される検索結果ページ50を示す。検索結果ページ50は、ユーザから入力される検索クエリに基づいて検索されたウェブページに関する情報が表示されるウェブページである。
図1に示すように、検索結果ページ50には、検索クエリ入力部52が含まれる。検索結果ページ50を利用するユーザは、ユーザ端末10を介して、検索クエリ入力部52に検索クエリを入力する。図1では、ユーザが検索クエリ入力部52に入力した「英会話教室」という検索クエリに基づいて、検索結果ページ50に検索結果が表示される例を示す。すなわち、検索結果ページ50には、検索結果として、「英会話教室」に関連のあるウェブページのリンク等の情報が表示される。
また、検索結果ページ50には、検索結果であるウェブページの情報とは別に、広告コンテンツが表示される。例えば、広告コンテンツは、検索結果ページ50に含まれる広告枠54又は広告枠56に表示される。広告コンテンツには、広告主の業務を宣伝するテキストなどが含まれる。そして、広告コンテンツには、広告主の提供するウェブページへのリンクが張られる。このような広告コンテンツのリンク先であるウェブページは、ランディングページ(Landing Page、以下「LP」と表記する場合がある)などと呼ばれる。例えば、広告主は、広告コンテンツを表示させることで、ユーザにLPへの移動を促し、自身が提供するウェブページを閲覧させたり、ウェブページ上で商品の購入をさせたりするといった営業に活用する。
このような検索サービスと連動する広告配信サービスにおいて、広告主は、広告コンテンツを入稿する際に、所定のキーワードに対して入札を行う。そして、広告主は、ユーザが所定のキーワードを検索クエリとして入力した場合に、LPへのリンクが張られた広告コンテンツをユーザに配信させる権利を取得する。すなわち、広告主は、検索サービスにおいて、ユーザが広告コンテンツと紐づけられたキーワードと同一又は類似のキーワードを検索クエリとして入力した場合に、検索サービスと連動して、検索結果ページ50に広告コンテンツを表示させることができる。これにより、広告主は、特定の情報への欲求がユーザに発生しているタイミングで広告コンテンツを配信させることができるので、より高い広告効果が見込める広告コンテンツの配信を行うことができる。
ここで、検索サービスと連動する広告コンテンツの配信処理の流れについて説明する。検索サービスと連動する広告コンテンツの配信処理は、広告装置100と、検索サーバ30と、ユーザ端末10とにより、図示しないネットワークN(例えば、インターネット)を介して行われる。
ユーザ端末10は、ユーザによって利用される情報処理装置である。ユーザ端末10は、例えば、スマートフォンやタブレット端末やPDA(Personal Digital Assistant)等の移動端末や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。
検索サーバ30は、検索サービスを提供するサーバ装置である。例えば、検索サーバ30は、所定の検索サイトにおいて、ユーザから検索クエリの入力を受け付ける。そして、検索サーバ30は、検索クエリに基づいた検索結果をユーザに提供する。
広告装置100は、検索サーバ30と連動して広告配信を行うサーバ装置である。広告装置100は、広告主から広告コンテンツの入稿とともに、キーワードに対する入札を受け付ける。そして、広告装置100は、以下に説明する手順により、検索サービスにおいて広告主が入札を行ったキーワード(以下、「入札キーワード」と表記する場合がある)を入力したユーザに広告コンテンツを配信する。
まず、ユーザは、ユーザ端末10を介して、検索サーバ30が提供する検索サイトにアクセスする。そして、ユーザは、検索サイトにおいて検索クエリを入力する。これにより、ユーザ端末10は、検索サーバ30に検索クエリを送信する(ステップS01)。検索サーバ30は、検索クエリに対応する検索結果を表示するウェブページである検索結果ページ50をユーザに提供する(ステップS02)。
また、検索クエリを受信した検索サーバ30は、検索クエリに関する情報を広告装置100に送信する(ステップS03)。これにより、広告装置100は、ユーザから入力された検索クエリに関する情報を取得する。そして、広告装置100は、検索クエリが入札キーワードである場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する(ステップS04)。
上述のように、検索結果ページ50には、広告枠54及び広告枠56が含まれる。そこで、ユーザ端末10は、検索結果ページ50を表示する際に、広告枠54及び広告枠56で表示する広告コンテンツを取得するために、広告装置100に広告配信の要求を行う(ステップS05)。広告配信の要求を受け付けた広告装置100は、入札キーワードに紐づく広告コンテンツをユーザ端末10に配信する(ステップS06)。このように、広告装置100は、検索サービスと連動して、広告コンテンツをユーザに配信することができる。
なお、ステップS03において、検索サーバ30がクエリ情報を広告装置100に送信する例を示したが、クエリ情報は、ユーザ端末10から広告装置100に送信されてもよい。例えば、クエリ情報は、検索結果ページ50の広告配信要求のためのスクリプトに含まれてもよい。この場合、ユーザ端末10は、広告配信の要求とともに、クエリ情報を広告装置100に送信する。そして、広告装置100は、クエリに紐づく広告コンテンツを選択し、選択された広告コンテンツをユーザ端末10に配信する。
ところで、図1の例のように、広告主は、検索結果ページ50に広告コンテンツを表示させるためには、所定のキーワードに入札を行うことになる。そして、広告主は、様々な興味を有するユーザに広告コンテンツを配信させるためには、適切な入札キーワードを複数指定するのが望ましい。しかしながら、広告主にとって、複数の適切なキーワードに入札することは容易でない。例えば、まず、広告主は、広告コンテンツと関連性が高いキーワードに入札したとする。その後、広告主が、より広告配信の機会を増やそうとして入札キーワードを追加する場合に、キーワードについて指針となる評価を得ることは困難である。
上記の事情に鑑みると、検索連動型の広告配信サービスにおいて、広告主に適切な入札キーワードを提示することは有用である。また、広告配信サービスの管理者側にとっても、広告主に適切な入札キーワードを提示することにより、入札の促進につながり、サービスの活性化を図ることができる。
そこで、実施形態に係る広告装置100は、図1で示したような検索連動型の広告配信サービスにおいて、広告主にとって適切な入札キーワードを抽出する。以下、図2を用いて、実施形態に係る抽出処理を説明する。図2は、実施形態に係る抽出処理の一例を示す図である。図2では、抽出システム1を例に挙げて、抽出処理の一例を説明する。
図2に示すように、抽出システム1には、広告主端末20と、広告装置100とが含まれる。広告装置100は、図示しないネットワークN(例えば、インターネット)を介して、広告主端末20と通信可能に接続される。
広告主端末20は、広告主によって利用される情報処理装置である。広告主端末20は、例えば、スマートフォンやタブレット端末やPDA等の移動端末や、デスクトップ型PCや、ノート型PC等である。
広告装置100は、以下に説明する抽出処理によって、広告主が入札する入札キーワードとして適切なキーワードを抽出するサーバ装置である。
広告装置100は、提供する広告配信サービスにおいて、複数の広告主から広告コンテンツの入稿を受け付ける。この場合、広告装置100は、広告コンテンツの入稿とともに、広告主が指定するキーワードの入札を受け付ける。そして、広告装置100は、受け付けた入札キーワードに関する情報を保持する。
ここで、広告装置100は、広告主から入札を受け付けているキーワードについて、広告主毎にキーワードの組合せを生成する。例えば、広告装置100は、所定の広告主からキーワードK001と、キーワードK002と、キーワードK003について入札を受け付けている場合、キーワードの組合せとして、「(K001,K002)」と、「(K001,K003)」と、「(K002,K003)」とを生成する。なお、以下では、広告主毎に生成された組合せ(kw,kw)について、「広告主は、組合せ(kw,kw)を有する」と表記する場合がある(「kw」及び「kw」は任意のキーワードを示す)。例えば、上記の例は、「所定の広告主は、組合せ(K001,K002)と、組合せ(K001,K003)と、組合せ(K002,K003)とを有する」と表記される。
そして、広告装置100は、生成した組合せ毎に所定の指標値を算出する。詳しくは後述するが、広告装置100は、生成された組合せの数に応じて、各組合せの重み値を算出する(ステップS11)。例えば、広告装置100は、より多くの広告主が有する組合せほど重要性が高いものとして、数値が高くなるような重み値を算出する。そして、広告装置100は、算出した各組合せの重み値を保持する。
続いて、広告装置100は、新たに検索連動型の広告配信サービスを利用しようとする広告主CL10から、広告主端末20を介して、広告コンテンツの入稿を受け付ける。また、広告装置100は、入稿された広告コンテンツを検索結果ページ50で表示させるためのキーワードの入札を広告主CL10から受け付ける(ステップS12)。
ここで、広告装置100は、保持する組合せのうち、広告主CL10から受け付けた入札キーワードが含まれる組合せを抽出する。そして、広告装置100は、抽出した組合せについて、組合せの重み値を比較する(ステップS13)。例えば、広告主CL10から受け付けた入札キーワードがキーワードK001である場合、広告装置100は、組合せ(K001,kw)である全ての組合せの重み値を比較する。
そして、広告装置100は、組合せの重み値に基づいて、キーワードを抽出する(ステップS14)。例えば、広告装置100は、広告主CL10から受け付けた入札キーワードを含む各組合せの重み値のうち、重み値の最も高い組合せに含まれるキーワードを抽出する。ここで、広告装置100は、重み値の最も高い組合せに含まれるキーワードのうち、入札キーワード以外のキーワードを抽出する。
そして、広告装置100は、広告主CL10が追加する入札キーワードとして、抽出したキーワードを提示する(ステップS15)。例えば、広告装置100は、組合せ(K001,kw)のうち、組合せ(K001,K010)の重み値が最も高い場合には、キーワードK010を広告主CL10に提示する。
このように、実施形態に係る広告装置100は、キーワードを指定して入札した広告主毎に生成されるキーワードの各組合せの重み値を算出する。また、広告装置100は、算出された組合せ毎の重み値に基づいて、キーワードの各組合せのうち新たに指定される入札キーワードを含む組合せから、入札キーワードと異なるキーワードを抽出する。
上記のように、実施形態に係る広告装置100は、広告配信サービスにおいて、実際にキーワードを入札している広告主毎に生成されるキーワードの組合せを抽出処理に用いる。このため、広告装置100によれば、広告主が指定するキーワード同士の関連性についても指標に含めた上で、新たなキーワードを抽出することができる。例えば、検索連動型の広告配信サービスにおいて、単に検索クエリとして入力されやすいキーワードを広告主に提示したとしても、広告コンテンツと関連性の低いキーワードでは、十分に広告コンテンツの効果が発揮されないおそれがある。一方、実施形態に係る広告装置100は、現時点で他の広告主が入札しているキーワードの組合せを利用してキーワードを抽出する。すなわち、抽出されるキーワードは、他の広告主が入札しているキーワードと共起性を有する。これにより、広告主は、広告装置100によって抽出されるキーワードであって、自身と関連性の高い他の広告主が入札しているキーワードを、適切に入札キーワードに追加することができる。そして、適切な複数のキーワードに入札することにより、広告主は、提供する広告コンテンツに興味を持つと想定されるユーザに広告コンテンツをより多く配信させることができる。結果として、実施形態に係る広告装置100によれば、配信される広告コンテンツの広告効果を高めることができる。
〔2.広告装置100の構成〕
次に、図3を用いて、実施形態に係る広告装置100の構成について説明する。図3は、実施形態に係る広告装置100の構成例を示す図である。図3に示すように、広告装置100は、通信部110と、記憶部120と、制御部130とを有する。
(通信部110について)
通信部110は、ネットワークNと有線又は無線で接続され、ユーザ端末10、広告主端末20及び検索サーバ30との間で情報の送受信を行う。例えば、通信部110は、NIC(Network Interface Card)等によって実現される。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3の例では、記憶部120は、広告情報記憶部121と、組合せ情報記憶部122とを有する。
(広告情報記憶部121について)
広告情報記憶部121は、広告に関する情報を記憶する。ここで、図4に、実施形態に係る広告情報記憶部121の一例を示す。図4に示した例では、広告情報記憶部121は、「広告主ID」、「広告コンテンツ」、「入札キーワード」といった項目を有する。
「広告主ID」は、広告主又は広告主端末20を識別するための識別情報を示す。なお、以下では、図4に示した広告主IDに記憶されている識別情報を広告主の参照符号として用いる場合がある。例えば、広告主ID「CL01」によって識別される広告主を「広告主CL01」と表記する場合がある。
「広告コンテンツ」は、広告主端末20から入稿された広告コンテンツを示す。図4では、「広告コンテンツ」に「AD01」や「AD02」といった概念的な情報が格納される例を示したが、実際には、広告コンテンツの宣伝内容であるテキストデータや、あるいは、これらの格納場所を示すファイルパス名などが格納される。
「入札キーワード」は、広告コンテンツに紐づけられている入札キーワードを示す。図4に示すように、広告主は、複数のキーワードに入札することができる。また、入札キーワードは、一つの単語に限られず、複数の単語の組合せであってもよい。
例えば、図4では、広告主ID「CL01」によって識別される広告主CL01が、検索連動型の広告配信サービスにおいて、広告コンテンツ「AD01」を検索結果ページ50に表示させるために、入札キーワード「K001」、「K002」、「K003」、・・・、に入札している例を示している。
(組合せ情報記憶部122について)
組合せ情報記憶部122は、キーワードの組合せに関する情報を記憶する。ここで、図5に、実施形態に係る組合せ情報記憶部122の一例を示す。図5に示した例では、組合せ情報記憶部122は、「入札キーワード(1)」、「入札キーワード(2)」、「重み値」といった項目を有する。
「入札キーワード(1)」及び「入札キーワード(2)」は、図4に示した入札キーワードに対応する。なお、図5に示す例では、入札キーワード(1)に示される入札キーワードが、入札キーワード(2)に示される入札キーワードとともに組合せに含まれることを示している。
「重み値」は、キーワードの組合せの重み値を示す。重み値は、後述する算出部133によって組合せ毎に算出される。なお、重み値は、広告主から受け付ける入札キーワードによって随時変化するため、所定のタイミングで(例えば、一日に一回など)更新されることがある。
例えば、図5では、入札キーワード(1)「K001」と、入札キーワード(2)「K002」により形成される組合せ(K001,K002)の重み値は「0.6」であり、入札キーワード(1)「K001」と、入札キーワード(2)「K003」により形成される組合せ(K001,K003)の重み値は「0.3」である例を示している。
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告装置100内部の記憶装置に記憶されている各種プログラム(抽出プログラムの一例)がRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部130は、入稿受付部131と、生成部132と、算出部133と、抽出部134と、提示部135と、要求受付部136と、配信部137とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
(入稿受付部131について)
入稿受付部131は、広告コンテンツの入稿を受け付ける。また、入稿受付部131は、広告コンテンツの入稿とともに、広告主が指定する入札キーワードを受け付ける。そして、入稿受付部131は、受け付けた広告コンテンツや、入札キーワードを広告情報記憶部121に格納する。
(生成部132について)
生成部132は、入稿受付部131によって受け付けられた入札キーワードの組合せを生成する。なお、生成部132は、入札キーワードを指定した広告主毎に入札キーワードの組合せを生成する。
具体的には、生成部132は、広告主CL01が入札したキーワードK001と、キーワードK002については、組合せ(K001,K002)を生成する。一方、生成部132は、広告主CL01が入札したキーワードK001と、広告主CL02が入札したキーワードK011については、組合せ(K001,K011)を生成しない。ただし、生成部132は、広告主CL03がキーワードK001とキーワードK011とについて入札していた場合には、組合せ(K001,K011)を生成する。そして、生成部132は、生成した組合せに関する情報を組合せ情報記憶部122に格納する。
このように、生成部132は、入札されている全てのキーワードの組合せを生成するのではなく、広告主毎に入札されているキーワードの組合せを生成する。すなわち、生成部132は、一の広告主が同時に入札しているキーワードの組が多いほど、多くの組合せを生成する。例えば、キーワードK001とともにキーワードK002に入札している広告主が多いほど、生成部132は、組合せ(K001,K002)を多く生成することになる。後述する算出部133は、生成されるキーワードの組合せの数に応じて、組合せの重み値を算出する。
(算出部133について)
算出部133は、キーワードを指定した指定者毎に生成されるキーワードの各組合せの指標値を算出する。具体的には、算出部133は、広告主毎に生成される組合せであって、広告主が提供するコンテンツ(例えば、広告コンテンツ)に紐づくキーワードである入札キーワードの組合せの指標値として、組合せの重みを示す重み値を算出する。
例えば、算出部133は、生成されるキーワードの組合せの数に応じて、組合せの重み値を算出する。すなわち、算出部133は、生成される数がより多い組合せは、多くの広告主が同時に入札しているキーワード同士の組合せであるから、重要性が高いものとして重み値を高く算出する。
また、この場合、算出部133は、キーワードの組合せを正例とした線形モデルを学習することで、各組合せの重み値を算出してもよい。この点について、図6を用いて説明する。
図6は、実施形態に係る算出処理の一例を示す概念図である。図6に示すように、広告主CL01は、入札キーワードK001、入札キーワードK002、入札キーワードK003、・・・、を有する。同様に、広告主CL02は、入札キーワードK011、入札キーワードK002、入札キーワードK003、・・・、を有する。同様に、広告主CL03は、入札キーワードK001、入札キーワードK011、入札キーワードK111、・・・、を有する。
この場合、生成部132は、広告主CL01の入札キーワードに基づき、組合せ(K001,K002)、組合せ(K001,K003)、組合せ(K002,K003)を生成する。同様に、生成部132は、広告主CL02の入札キーワードに基づき、組合せ(K011,K002)、組合せ(K011,K003)、組合せ(K002,K003)を生成する。同様に、生成部132は、広告主CL03の入札キーワードに基づき、組合せ(K001,K011)、組合せ(K001,K111)、組合せ(K011,K111)を生成する。
このように、生成部132は、広告装置100にキーワードを入札している全ての広告主について、広告主毎に、キーワードの組合せを生成する。そして、算出部133は、全てのキーワードの組合せについて、キーワードの組合せを正例とした線形モデルを学習することで、各組合せの重み値を算出する。線形モデルの一例として、算出部133は、下記式(1)に示すような回帰式を求める。
y = a・x + a・x + ・・・ +a・x ・・・ (1)
上記式(1)のうち、「y」は、各組合せを有する例が存在するか否かを示す。ここでは、各組合せを有する例は広告主であり、算出部133は、キーワードの組合せを有する広告主を例として学習するため、原則として、「y」=「1」となる。
また、上記式(1)のうち、「x」(nは任意の数)は、キーワードの組合せを示す。例えば、「x」〜「x」には、キーワードの組合せ(kw,kw)が割り当てられる。図6の場合、例えば、「x」には組合せ(K001,K002)が割り当てられ、「x」には組合せ(K001,K003)が割り当てられ、「x」には組合せ(K002,K003)が割り当てられ、「x」には組合せ(K011,K002)が割り当てられ、「x」には組合せ(K011,K003)が割り当てられ、「x」には組合せ(K001,K011)が割り当てられ、「x」には組合せ(K001,K111)が割り当てられ、「x」には組合せ(K011,K111)が割り当てられる。ここでは、キーワードの組合せを正例とするため、各広告主について、キーワードの組合せ(kw,kw)が存在する場合には「xn」=「1」となり、存在しない場合には「0」となる。また、上記式(1)のうち、「a」は、「x」〜「x」の係数を示す。ここでは、「a」は、キーワードの組合せの各々を示す「x」〜「x」の重み値を示す。
そして、算出部133は、上記式(1)の重み値aをパラメータとし、例えば、SVM(Support Vector Machine)のようなパターン識別機を用いたサポートベクタ回帰などの回帰分析手法により調整を行う。すなわち、算出部133は、上記式(1)で表される全ての広告主について、上記式(1)を満たすように、重み値aの値(サンプルとなる広告主の数によっては、求められる重み値aは近似値でもよい)を求める。
例えば、算出部133は、図6に示すように、組合せ(K001,K002)の重み値として「0.6」を、組合せ(K001,K003)の重み値として「0.3」を、組合せ(K002,K003)の重み値として「0.2」等を算出する。そして、算出部133は、算出した重み値を各組合せに対応付けて、組合せ情報記憶部122に格納する。
(抽出部134について)
抽出部134は、算出部133によって算出された組合せの指標値に基づいて、キーワードの組合せのうち広告主により新たに指定される第1キーワードを含む組合せから、第1キーワードと異なる第2キーワードを抽出する。具体的には、抽出部134は、組合せの指標値として算出部133が算出した重み値に基づいて、第1キーワードの一例である新たに指定される入札キーワードを含む組合せから、第2キーワードの一例である入札キーワード以外のキーワードを抽出する。言い換えれば、抽出部134は、広告主に提示する入札キーワードの候補を抽出する。
また、抽出部134は、広告主により新たに指定される入札キーワードが複数ある場合には、新たに指定される入札キーワードと他のキーワードとの組合せの重み値の和に基づいて、組合せに含まれる他のキーワードを抽出する。例えば、抽出部134は、広告主が既に入札しているキーワードから生成される組合せのうち、新たな入札キーワードを含む複数の組合せの重み値の和が最も高くなるような複数の組合せを抽出する。そして、抽出部134は、抽出した複数の組合せに含まれるキーワードであって、入札キーワードとは異なるキーワードを抽出する。
上記の処理のうち、抽出部134は、各組合せに共通して含まれる第2キーワードと、第1キーワードとの組合せにおける指標値の和に基づいて、第2キーワードを抽出してもよい。例えば、抽出部134は、広告主が既に入札しているキーワードから生成される組合せのうち、新たな入札キーワードを含む組合せであって、入札キーワードとともに組合せに含まれる他のキーワードが共通する組合せ同士の重み値の和を比較する。そして、抽出部134は、比較した複数の組合せの重み値の和に基づいて、各組合せに共通するキーワードを抽出する。これにより、抽出部134は、入札キーワードとの共起性がより高い共通したキーワードを抽出することができる。
上記の抽出処理について、一例を挙げて説明する。例えば、抽出部134は、重み値の和に基づき抽出処理を行うため、広告主毎に、組合せの存否及び組合せの重み値を変数として生成される関数を求める。そして、抽出部134は、新たに指定される入札キーワードを含むいずれかの組合せに対応する変数を加えた場合に、関数が示す値を最適化する変数に対応する組合せの中から、入札キーワードとは異なる他のキーワードを抽出する。
例えば、抽出部134は、組合せの存否及び組合せの重み値を変数として生成される関数の一例として、下記式(2)で表される関数を求める。
広告主のスコア = Σ(w_kwij) × (kw,kw) ・・・ (2)
上記式(2)のうち、「(w_kwij)」は、組合せ(kw,kw)に対応する重み値を示す。また、「(kw,kw)」は、組合せ(kw,kw)が存在するか否かを示す。例えば、処理対象である広告主が組合せ(kw,kw)を有する場合には、「(kw,kw)」=「1」となる。一方、広告主が組合せ(kw,kw)を有しない場合には、「(kw,kw)」=「0」となる。
上記式(2)において、抽出部134は、入札キーワード「(kwα)」を含む任意の組合せ(kwα,kw)に対応する変数を加えるとする。すなわち、抽出部134は、任意の組合せ(kwα,kw)が存在することを示す「1」の値と、任意の組合せ(kwα,kw)に対応する重み値を乗算した変数を上記式(2)に加える。上記の例では、加えられる変数の値が大きいほど、他の広告主との共起性を伴う適切なキーワードが含まれる組合せを広告主が有することを示す。すなわち、広告主のスコアが大きくなるほど、広告主のスコアが改善されたといえる。そして、広告主のスコアが最大となる場合に、上記関数が示す値が最適化されたといえる。ゆえに、抽出部134は、入札キーワード「(kwα)」と、任意のキーワード「kw」とを含む組合せに対応する変数のいずれかを上記式(2)に加え、最もスコアを上昇させる変数に対応する組合せ(kwα,kw)を抽出する。そして、抽出部134は、組合せ(kwα,kw)に含まれるキーワード「kwβ」を抽出する。
抽出部134の抽出処理について、図7を用いて、具体的に説明する。図7は、実施形態に係る抽出処理の一例を示す概念図である。図7に示す例では、広告主CL10は、新たにキーワード「K001」及び「K011」を指定して、入札を行うものとする。また、各組合せの重み値は、図6で示された重み値を用いる。
抽出部134は、広告主CL10から新たに指定された入札キーワード「K001」について、算出部133によって算出された任意のキーワードとの組合せの重み値を参照する。図7に示すように、組合せ(K001,K002)の重み値は「0.6」であり、組合せ(K001,K003)の重み値は「0.3」であり、組合せ(K001,K111)の重み値は「0.15」である。また、広告主CL10から新たに指定された入札キーワード「K011」と任意のキーワードとの組合せの重み値の例としては、図7に示すように、組合せ(K011,K002)の重み値は「0.35」であり、組合せ(K011,K003)の重み値は「0.1」であり、組合せ(K011,K111)の重み値は「0.05」である。
ここで、抽出部134は、上記式(2)を用いて、広告主CL10のスコアを求める。この例では、抽出部134は、入札キーワードと異なるキーワードとして、共通する一つのキーワードを抽出するものとする。
具体的には、抽出部134は、新たにキーワード「K001」及び「K011」を含む組合せであって、共通するキーワード「K002」を含む組合せである、組合せ(K001,K002)及び組合せ(K011,K002)に対応する変数を上記式(2)に加える。この場合、抽出部134は、上記式(2)より、組合せ(K001,K002)に対応する重み値「0.6」と、組合せ(K011,K002)に対応する重み値「0.35」に基づき、広告主CL10のスコアが「0.95」だけ上昇することを求める。同様に、抽出部134は、共通するキーワード「K003」の場合には、組合せ(K001,K003)に対応する重み値「0.3」と、組合せ(K011,K003)に対応する重み値「0.1」に基づき、広告主CL10のスコアが「0.4」だけ上昇することを求める。同様に、抽出部134は、共通するキーワード「K111」の場合には、組合せ(K001,K111)に対応する重み値「0.15」と、組合せ(K011,K111)に対応する重み値「0.05」に基づき、広告主CL10のスコアが「0.2」だけ上昇することを求める。
なお、抽出部134は、図7に示す組合せ(K001,K211)と、組合せ(K011,K311)とについては、上記抽出処理に用いない。この場合、組合せ(kwα,kw)において、任意のキーワード「kw」が共通していないため、抽出部134は、組合せ同士の重み値を比較することができないからである。
そして、抽出部134は、上記結果に基づいて、広告主のスコアを最適化する組合せに共通して含まれるキーワード「K002」を抽出する。すなわち、抽出部134は、広告主CL10が新たに指定した入札キーワード「K001」及び「K011」に追加する適切な入札キーワードとして、キーワード「K002」を抽出する。
(提示部135について)
提示部135は、抽出部134によって抽出されたキーワードを、キーワードの指定者に提示する。具体的には、提示部135は、広告配信サービスにおいて広告コンテンツに紐づかせる入札キーワードとして、抽出部134によって抽出されたキーワードを広告主に提示する。
なお、提示部135は、抽出部134によって抽出されたキーワードであっても、入札キーワードとして広告主に提示しない場合があってもよい。例えば、提示部135は、広告コンテンツに設定されうる除外キーワードについては提示しなくてもよい。広告コンテンツに設定されうる除外キーワードとは、例えば、広告コンテンツの提供主である広告主と競合する企業名や、競合する企業が扱う製品名などが該当する。
(要求受付部136について)
要求受付部136は、広告コンテンツの配信に関する要求を受け付ける。例えば、要求受付部136は、広告コンテンツの取得要求として、ユーザ端末10が表示するウェブページに含まれるHTTP(Hypertext Transfer Protocol)リクエストを受け付ける。また、要求受付部136は、検索サーバ30から検索クエリに関する情報を受け付けてもよい。
(配信部137について)
配信部137は、広告コンテンツを配信する。例えば、配信部137は、要求受付部136が受け付けたHTTPリクエストに従い、ユーザ端末10に広告コンテンツを配信する。配信部137は、要求受付部136によって広告コンテンツの取得要求が受け付けられた場合に、配信候補の広告コンテンツを広告情報記憶部121から選択する。
ここで、配信部137は、要求受付部136が受け付けた検索クエリと入札キーワードが同一又は類似する場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する。そして、配信部137は、検索クエリを検索サーバ30に送信したユーザ端末10に選択した広告コンテンツを配信する。
〔3.抽出処理手順〕
次に、図8を用いて、実施形態に係る広告装置100が実行する抽出処理の手順について説明する。図8は、実施形態に係る広告装置100による抽出処理手順を示すフローチャートである。
図8に示すように、広告装置100は、既存の入札キーワードの組合せを生成する(ステップS101)。そして、広告装置100は、生成されたキーワードの各組合せの重み値を算出する(ステップS102)。
続いて、広告装置100は、広告配信サービスを利用する新規の広告主から、新たにキーワードの入札を受け付けたか否かを判定する(ステップS103)。広告装置100は、キーワードの入札を受け付けていない場合には(ステップS103;No)、受け付けるまで待機する。
一方、広告装置100は、新たにキーワードの入札を受け付けた場合には(ステップS103;Yes)、新たに指定された入札キーワードが含まれる組合せの重み値を比較する(ステップS104)。そして、広告装置100は、新たに指定された入札キーワードが含まれる組合せの重み値に基づき、入札キーワードとともに組合せに含まれるキーワードを抽出する(ステップS105)。そして、広告装置100は、抽出したキーワードを新規LPに紐づく入札キーワードとして提示する(ステップS106)。
なお、図8では、広告装置100が、既存の入札キーワードの組合せを生成した後に、新規の広告主から入札キーワードを受け付ける例を示した。しかし、この例に限られず、広告装置100は、入札キーワードを受け付けた後に、既存の入札キーワードの組合せを生成し、組合せの重み値を算出してもよい。また、広告装置100は、ステップS106において追加する入札キーワードを広告主に提示した後に、さらに異なるキーワードを抽出してもよい。すなわち、広告装置100は、抽出されたキーワードに対する広告主の対応によっては、ステップS105とステップS106を繰り返し実行してもよい。例えば、広告主が提示されたキーワード以外のキーワードを所望する場合には、広告装置100は、先に抽出した組合せの重み値よりも低い重み値を有する組合せから、さらに異なるキーワードを抽出する。そして、広告装置100は、新たに抽出されたキーワードを広告主に提示する。
〔4.変形例〕
上述した実施形態は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、他の実施形態について説明する。
〔4−1.広告コンテンツ〕
上記実施形態において、広告装置100は、既存の入札キーワードから組合せを生成し、生成した組合せの重み値を算出することにより、キーワードを抽出する例を示した。ここで、広告装置100は、既存の入札キーワードに限らず、他の情報を用いて、キーワードを抽出してもよい。例えば、広告装置100は、既存の入札キーワードに代えて、広告コンテンツや、広告主が提供するウェブページであって、広告コンテンツのリンク先であるLPを利用して、キーワードを抽出してもよい。この点について、図9及び図10を用いて説明する。
図9は、変形例に係る広告情報記憶部121の一例を示す図である。変形例に係る広告装置100は、図4に示した広告情報記憶部121の代わりに、図9に示した広告情報記憶部121を有する。図9に示すように、変形例に係る広告情報記憶部121は、図4に示した広告情報記憶部121に加えて、「LP」、「CTR(Click Through Rate)」といった項目を有する。
「LP」は、広告主が提供するLPに関する情報を示す。図9に示す「LP01」という表記は、LPを識別するための識別情報を示すとともに、LPに関する情報を概念的に表現したものである。広告情報記憶部121内に記憶されるLPに関する情報は、LPを構成するHTML(HyperText Markup Language)ファイル等であってもよいし、LPのデータが置かれたURL(Uniform Resource Locator)を示す情報であってもよい。なお、以下では、図9に示したLPの項目に記憶されている情報を、LPの参照符号として用いる場合がある。例えば、LP「LP01」によって示される情報を有するLPを「LP01」と表記する場合がある。
「CTR」は、広告コンテンツのCTRを示す。ここでは、CTRとは、広告コンテンツがユーザから選択された回数(例えば、ユーザ端末10において、ユーザから広告コンテンツがクリックされた回数)を広告コンテンツの表示回数によって除算した値を示す。なお、現時点において配信されたことがない広告コンテンツのCTRには、予め決められている固定値や、全ての広告コンテンツにおけるCTRの平均値や、同一の広告カテゴリに属する全ての広告コンテンツにおけるCTRの平均値などが記憶される。また、「CTR」には、CTRの予測モデル等から予測される予測CTRが記憶されてもよい。このような予測CTRは、例えば、広告コンテンツの種別や、広告コンテンツが表示されるウェブページの種別等によって予測される。
例えば、図9では、広告主CL01が、「LP01」をリンク先とする広告コンテンツ「AD01」を入稿しており、広告コンテンツAD01のCTRが「0.01」である例を示している。また、広告主CL01は、広告コンテンツAD01が表示されるためのキーワードとして、入札キーワード「K001」、「K002」、「K003」、・・・、に入札している例を示している。
続いて、変形例に係る生成部132について説明する。上記の通り、実施形態に係る生成部132は、既存の入札キーワードの組合せを生成したが、変形例に係る生成部132は、広告コンテンツや、LPに関する情報に基づいて、キーワードの組合せを生成する。例えば、生成部132は、広告コンテンツやLPに含まれるテキストデータについて形態素解析をすることにより、広告コンテンツやLPに含まれるテキストデータから、組合せを生成する要素となりえるキーワードを抽出する。そして、生成部132は、抽出したキーワードの組合せを生成する。生成部132は、生成した組合せを、変形例に係る組合せ情報記憶部122に格納する。
図10は、変形例に係る組合せ情報記憶部122の一例を示す図である。変形例に係る広告装置100は、図5に示した組合せ情報記憶部122の代わりに、図10に示した組合せ情報記憶部122を有する。図10に示すように、変形例に係る組合せ情報記憶部122は、図5に示した組合せ情報記憶部122に代えて、「キーワード(1)」、「キーワード(2)」といった項目を有する。
「キーワード(1)」及び「キーワード(2)」は、広告コンテンツやLPに含まれるテキストデータに含まれるキーワードを示す。なお、図10に示す例では、キーワード(1)に示されるキーワードが、キーワード(2)に示されるキーワードとともに組合せに含まれることを示している。
例えば、図10では、キーワード(1)「K201」と、キーワード(2)「K001」により形成される組合せ(K201,K001)の重み値は「0.5」である例を示している。
なお、広告コンテンツやLPに含まれるキーワードは、広告コンテンツやLPを特徴付けるキーワードであることが望ましい。この場合、生成部132は、例えば、広告コンテンツやLPのテキストデータ内に多く含まれる単語や、他の広告コンテンツやLPには出現しにくい単語などを広告コンテンツやLPを特徴付けるキーワードとして判定し、かかるキーワードを抽出する。
このように、生成部132は、広告コンテンツやLPに含まれるキーワードの組合せを生成する。そして、変形例に係る算出部133は、生成部132によって生成された組合せの重み値を算出し、算出した重み値を組合せ情報記憶部122に格納する。そして、変形例に係る抽出部134は、算出部133によって算出された重み値に基づいて、キーワードを抽出する。このように、広告装置100によれば、既存の入札キーワードに限られず、広告コンテンツやLPを用いることにより、広告主が入札する適切なキーワードを抽出することができる。
また、広告装置100は、広告コンテンツの広告効果を示す指標を用いて、上記の抽出処理を行ってもよい。例えば、算出部133は、組合せの重み値の算出処理において、CTRの高い広告コンテンツを提供する広告主について重みを重くして、組合せの重み値を算出してもよい。例えば、算出部133は、上記式(1)において、「y」の値を広告主毎に調整してもよい。この場合、算出部133は、CTRの高い広告コンテンツを提供する広告主に関して、「y」の値を高くすることにより、結果として、かかる広告主が有する各組合せの重み値を高くすることができる。これにより、抽出部134は、CTRの高い広告コンテンツを提供する広告主が指定するキーワードを抽出しやすくなる。あるいは、算出部133は、CTRの高い広告コンテンツを提供する広告主が有する組合せに対して算出した重み値に所定の値を加算してもよい。
なお、算出部133は、図9で示したCTR以外の広告効果を示す指標に基づいて重み値を算出してもよい。例えば、算出部133は、広告コンテンツが表示された回数に対して何割がコンバージョンに至るかの割合を示すCVR(Conversion Rate)などの情報に基づいて、重み値を算出してもよい。この場合、算出部133は、キーワードの組合せについて、CVRの高い広告コンテンツが反映された重み値を算出することができる。
なお、コンバージョンとは、広告主が獲得できる最終成果を示し、広告主への利益に繋がるユーザの行動が該当する。コンバージョンの例としては、ウェブページ上で商品を購入する行動や、会員登録を行う行動や、資料請求を行う行動や、商品等に関する問い合わせを行う行動等が挙げられる。また、コンバージョンには、広告コンテンツにアクセスしたユーザが、広告主のウェブページを介さずにオフライン(電話や郵送等)で商品購入、会員登録、資料請求、問い合わせ等を行う行動を含めてもよい。
また、入稿受付部131は、検索サービスにおいて、入札キーワードがユーザから入力された回数に関する情報を取得してもよい。そして、算出部133は、入札キーワードがユーザから入力された回数に関する情報に基づいて、重み値を算出してもよい。例えば、算出部133は、ユーザから入力された回数が多い入札キーワードを含む組合せほど、重み値を高く算出する。
このように、変形例に係る算出部133は、広告コンテンツやLPに紐づくキーワードがユーザから入力された回数、広告コンテンツがユーザから選択された回数又は広告コンテンツが表示されることで広告主が得た利益に関する情報の少なくとも一つに基づいて、組合せ毎の重み値を算出することができる。
これにより、広告装置100は、現状の検索サービスや広告配信の状況などに基づき、より実情に即して重み値を算出することができるので、新規の広告主に対して適切な入札キーワードを抽出することができる。
なお、算出部133は、上記で示した例以外にも、さらに異なる広告評価に関する情報を用いて重み値を算出してもよい。すなわち、算出部133は、所定の評価値以上であるコンテンツに紐づくキーワードの組合せの指標値を算出し、抽出部134は、算出部133によって算出された指標値に対応する組合せからキーワードを抽出してもよい。
例えば、算出部133は、所定の評価値として、ユーザ端末10における広告コンテンツの実際の表示回数(インプレッション数)や、広告コンテンツに対するクリックで発生する課金額であるCPC(Cost Per Click)や、広告コンテンツの1000回表示あたりの課金額であるeCPM(effective Cost Per Mill)などの広告コンテンツに関する情報を用いる。
一例として、算出部133は、検索サイトにおいてユーザから入札キーワードが入力されることによりインプレッションが少なくとも1回発生した広告コンテンツに紐づく入札キーワードのみを用いて重み値を算出してもよい。
すなわち、算出部133は、広告コンテンツに紐づくキーワードがユーザから選択されることにより、少なくとも一回は広告コンテンツが表示される契機となった入札キーワードによって生成されるキーワードの組合せの重み値を算出する。そして、抽出部134は、インプレッションを発生させた入札キーワードによって生成される組合せの中から、キーワードを抽出する。
これにより、広告装置100は、既存の広告主が極めて多くのキーワードに入札しているような場合であっても、現状の検索サービスや広告配信の状況などに基づき、インプレッションを発生させているキーワードのみに絞りこんでキーワードを抽出することができる。このため、広告装置100は、より実情に即したキーワードを抽出することができる。
上記のように、算出部133は、所定のコンテンツ(例えば、広告コンテンツやLPなどのウェブページ)に紐づかせるキーワードとして、広告主によってコンテンツに紐づけられたキーワード(すなわち、入札キーワード)、又はコンテンツから抽出されるキーワードを用いて指標値を算出することができる。
すなわち、算出部133は、処理対象とするキーワードの由来に関わらず、組合せの指標値を算出したりすることができる。例えば、算出部133は、入札キーワードと、広告コンテンツとを含むキーワードの組合せの指標値を算出してもよいし、広告コンテンツから抽出されるキーワードと、LPから抽出されるキーワードとを含むキーワードの組合せの指標値を算出してもよいし、入札キーワードと、LPから抽出されるキーワードとを含むキーワードの組合せの指標値を算出してもよい。
〔4−2.学習〕
また、広告装置100は、抽出部134によって抽出されたキーワードに対して広告主が入札を行った後に、かかるキーワードがユーザに入力されたことを契機として広告コンテンツが何回表示されたか、などの結果を取得してもよい。すなわち、広告装置100は、抽出処理を実行した後であっても、広告コンテンツの表示回数や、ユーザから広告コンテンツがクリックされた回数などを取得する。言い換えれば、広告装置100は、抽出したキーワードを広告主が入札キーワードとした場合の広告効果を測定する。そして、広告装置100は、取得したCTRや、CVRなどの指標をさらに用いて、上記抽出処理に利用してもよい。このように、広告装置100は、抽出したキーワードによる広告効果などの結果を測定し、かかる結果が反映された学習モデルにより、キーワードを抽出してもよい。そして、広告装置100は、処理を繰り返すことにより、よりユーザから検索されやすく、広告効果を向上させやすいキーワードを抽出することができる。このため、広告装置100は、広告コンテンツの広告効果をより高めることができる。
〔4−3.広告主〕
上記実施形態において、広告主は、広告主端末20を用いて、広告装置100に広告コンテンツを入稿する例を示した。しかし、広告主は、自ら広告装置100に広告コンテンツを入稿せずに、かかる処理を代理店に依頼する場合もある。この場合、広告装置100にかかる処理をするのは代理店となる。すなわち、「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主端末」といった表記は、広告主端末20だけでなく代理店によって利用される代理店端末を含む概念であるものとする。
〔4−4.広告配信〕
また、配信部137は、広告コンテンツの配信において、同じ入札キーワードに紐づく広告コンテンツが複数ある場合には、入札キーワードの入札価格が高い広告主や、CTRの高い広告コンテンツや、入札価格及びCTRの双方が高い広告コンテンツを優先して選択するようにしてもよい。そして、配信部137は、選択した広告コンテンツをユーザ端末10に配信する。
〔4−5.組合せ〕
上記実施形態においては、図5に示すように、キーワードの組合せが2つのキーワードが含まれる例を示した。しかし、キーワードの組合せには、3つ以上のキーワードが含まれてもよい。
〔4−6.他の用途〕
上記実施形態において、広告装置100は、検索連動型の広告配信サービスにおける入札キーワードを抽出する例を示した。しかし、広告装置100は、上記のような検索連動型以外の広告配信に利用されてもよい。例えば、広告装置100は、キーワードに対する入札を受け付け、かかるキーワードと親和性の高い内容のウェブページに広告コンテンツを配信するような、いわゆる広告コンテンツマッチ型の広告サービスに利用されてもよい。
また、上記実施形態において、コンテンツの一例として、広告コンテンツやLPを挙げ、キーワードの一例として、入札キーワードを例に挙げて説明した。しかし、広告装置100は、広告コンテンツやLPに紐づく入札キーワードを抽出するのみならず、他の用途として利用されてもよい。
例えば、広告装置100は、所定のテキスト文書に含まれるキーワードに基づいて、キーワードの組合せの重み値を算出する。そして、広告装置100は、ユーザから所定のキーワードを受け付けた場合に、組合せの重み値に基づいて、テキスト文書に含まれる他のキーワードを抽出する。これにより、広告装置100は、ユーザから受け付けた所定のキーワードと共起性のあるキーワードをテキスト文書から抽出することができる。このように、広告装置100は、あるドキュメントに関連するキーワード抽出のアシストを実行する装置であってもよい。
また、本願に係る抽出装置が検索サーバ30に対応する場合、検索サーバ30は、検索結果ページ50に検索クエリのアシストとなるキーワードを表示してもよい。例えば、検索サーバ30は、所定のLPに含まれるキーワードの組合せの重み値を算出する。そして、検索サーバ30は、ユーザから検索クエリを受け付けた場合に、入力された検索クエリとともに所定の組合せに含まれるキーワードを抽出する。そして、検索サーバ30は、例えば、抽出したキーワードを、先にユーザが入力した検索クエリの代わりに、所定のウェブページを検索するためのクエリとして抽出する。そして、検索サーバ30は、例えば、検索結果ページ50に、検索結果とともに抽出されたキーワードを提示してもよい。ユーザは、提示されたキーワードに基づいて検索を実行することにより、効率よく目的のウェブページを検索できる場合がある。この場合、検索サーバ30は、検索サービスを実行する制御部に加え、上記実施形態に係る生成部132、算出部133、抽出部134及び提示部135に対応する各処理部を有する。
〔4−7.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図3に示した広告情報記憶部121や組合せ情報記憶部122は、広告装置100が保持せずに、図示しないストレージサーバ等が保持してもよい。この場合、広告装置100は、ストレージサーバから広告に関する情報等を取得する。
また、例えば、上記実施形態では、広告装置100がキーワードの組合せを生成する例を示したが、組合せを生成する主体は、広告装置100と異なる所定のサーバ装置であってもよい。この場合、広告装置100は、所定のサーバ装置によって生成されたキーワードの組合せを取得し、取得した組合せに関する情報を保持する。また、例えば、上述した広告装置100は、入稿受付部131と生成部132とを有する組合せ生成装置と、算出部133と抽出部134とを有する抽出装置と、提示部135を有する提示装置と、要求受付部136と配信部137とを有する配信装置とに分散されてもよい。
〔5.ハードウェア構成〕
また、上述してきた実施形態に係る広告装置100は、例えば図11に示すような構成のコンピュータ1000によって実現される。以下、広告装置100を例に挙げて説明する。図11は、広告装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(ネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る広告装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
〔6.効果〕
上述してきたように、実施形態に係る広告装置100は、算出部133と、抽出部134とを有する。算出部133は、キーワードを指定した広告主毎に生成されるキーワードの各組合せの重み値を算出する。抽出部134は、算出部133によって算出された組合せの重み値に基づいて、キーワードの組合せのうち広告主により新たに指定される入札キーワード(第1キーワードの一例)が含まれる組合せから、入札キーワードと異なるキーワード(第2キーワードの一例)を抽出する。
このように、実施形態に係る広告装置100は、現時点で他の広告主が入札しており、効果が高いと想定されるキーワードであって、他の広告主が入札しているキーワードと共起性のあるキーワードを抽出する。これにより、広告装置100によれば、ユーザが検索サービスを利用する際に、入札キーワードに紐づく広告コンテンツを表示させやすくすることができるので、広告コンテンツの広告効果を向上させることができる。
また、算出部133は、キーワードの組合せの数に応じた重み値を算出する。このように、実施形態に係る広告装置100は、他の広告主が入札しているキーワードとの関係性に基づいて重み値を算出することができる。すなわち、広告装置100は、現時点で他の広告主が入札しているキーワードとの共起性に基づいた重み値を算出する。このため、広告装置100は、単に多くの広告主が入札しているキーワードのみならず、現時点で他の広告主が同時に入札しているキーワードとの関係に基づいて、適切なキーワードを抽出することができる。
また、抽出部134は、新たに指定される入札キーワードが複数ある場合には、入札キーワードと、異なるキーワードとの組合せの重み値の和に基づいてキーワードを抽出する。
これにより、実施形態に係る広告装置100は、極めて高い重み値を有する組合せなどに偏重されることなく、適切なキーワードを抽出することができる。
また、抽出部134は、新たに指定される入札キーワードが複数ある場合に、入札キーワードが含まれる組合せのうち、入札キーワードと異なるキーワードが共通する複数の組合せの重み値に基づいてキーワードを抽出する。
これにより、実施形態に係る広告装置100は、他の広告主が入札しているキーワードとの関係に基づいて、新たに指定した入札キーワードとの共起性がより高い共通したキーワードを抽出することができる。
また、算出部133は、キーワードとして、広告主が提供する広告コンテンツやLP(コンテンツの例)に紐づく入札キーワードを用いて組合せの重み値を算出する。抽出部134は、第1キーワードとして、コンテンツに紐づくキーワードとして広告主により新たに指定される入札キーワードを用いてキーワードを抽出する。
これにより、実施形態に係る広告装置100は、例えば検索連動型などのキーワードに関連する広告配信サービスにおいて、適切な入札キーワードを抽出することができる。
また、算出部133は、コンテンツに紐づくキーワードがユーザから入力された回数、コンテンツがユーザから選択された回数又はコンテンツが表示されることで広告主が得た利益に関する情報の少なくとも一つに基づいて、組合せ毎の重み値を算出する。
これにより、実施形態に係る広告装置100は、現状の広告効果を踏まえたうえで組合せの重み値を算出することができる。このため、広告装置100は、現状に則した、適切なキーワードを抽出することができる。
また、算出部133は、所定の評価値以上であるコンテンツに紐づくキーワードの組合せの指標値を算出する。抽出部134は、算出部133によって算出された指標値に対応する組合せからキーワードを抽出する。
これにより、実施形態に係る広告装置100は、少なくともインプレッションを発生させた広告コンテンツに紐づくキーワードの組合せの重み値を算出することができる。このため、広告装置100は、現状に則した、適切なキーワードを抽出することができる。
算出部133は、所定のコンテンツに紐づかせるキーワードとして、広告主によってコンテンツに紐づけられたキーワード、又はコンテンツから抽出されるキーワードを用いて指標値を算出する。
これにより、実施形態に係る広告装置100は、入札キーワードに限られず、現時点で他の広告主が提供している広告コンテンツやLPに基づいて、入札キーワードとして効果が高いことが想定されるキーワードを抽出することができる。
また、実施形態に係る広告装置100は、コンテンツに紐づかせるキーワードとして、抽出部134によって抽出されたキーワードを広告主に提示する提示部135をさらに備える。
このように、実施形態に係る広告装置100は、新規にキーワードに入札する広告主に、適切なキーワードを提示する。このため、広告装置100によれば、広告主は、新たに追加する入札キーワードとして適切なキーワードを知ることができる。また、広告配信サービスの管理者側は、広告主から入札されるキーワードが増えることにより、入札の促進につながり、サービスの活性化を図ることができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、算出部は、算出手段や算出回路に読み替えることができる。
1 抽出システム
10 ユーザ端末
20 広告主端末
30 検索サーバ
100 広告装置
110 通信部
120 記憶部
121 広告情報記憶部
122 組合せ情報記憶部
130 制御部
131 入稿受付部
132 生成部
133 算出部
134 抽出部
135 提示部
136 要求受付部
137 配信部

Claims (13)

  1. キーワードを指定した指定者毎に生成される当該キーワードの各組合せの指標値を算出する算出部と、
    前記算出部によって算出された前記組合せ毎の指標値に基づいて、前記キーワードの各組合せのうち新たに指定される第1キーワードを含む組合せから、当該第1キーワードと異なる第2キーワードを抽出する抽出部と
    前記抽出部によって抽出された第2キーワードを、前記指定者が提供する所定のコンテンツに紐づかせるキーワードとして、当該指定者に提示する提示部と、
    を備えたことを特徴とする抽出装置。
  2. 前記算出部は、
    前記キーワードの組合せ毎に、当該キーワードの組合せの数に応じた指標値を算出する、
    ことを特徴とする請求項1に記載の抽出装置。
  3. 前記抽出部は、
    複数の前記第1キーワードが指定された場合に、当該第1キーワードと組み合わせられた他のキーワード毎の各組合せの指標値に基づいて、当該各組合せから前記第2キーワードを抽出する、
    ことを特徴とする請求項1又は2に記載の抽出装置。
  4. 前記抽出部は、
    前記各組合せに共通して含まれる第2キーワードと、前記第1キーワードとの組合せにおける指標値の和に基づいて、前記第2キーワードを抽出する、
    ことを特徴とする請求項に記載の抽出装置。
  5. 前記算出部は、
    前記キーワードとして、前記指定者が提供するコンテンツに紐づくキーワードを用いて前記組合せの指標値を算出し、
    前記抽出部は、
    前記第1キーワードとして、所定のコンテンツに紐づくキーワードを用いて、前記第2キーワードを抽出する、
    ことを特徴とする請求項1〜4のいずれか一つに記載の抽出装置。
  6. キーワードを指定した指定者毎に生成される当該キーワードの各組合せの指標値を算出する算出部と、
    前記算出部によって算出された前記組合せ毎の指標値に基づいて、前記キーワードの各組合せのうち新たに指定される第1キーワードを含む組合せから、当該第1キーワードと異なる第2キーワードを抽出する抽出部と、を備え、
    前記算出部は、
    前記キーワードとして、前記指定者が提供するコンテンツに紐づくキーワードを用いて前記組合せの指標値を算出し、
    前記抽出部は、
    前記第1キーワードとして、所定のコンテンツに紐づくキーワードを用いて、前記第2キーワードを抽出し、さらに、
    前記所定のコンテンツに紐づかせるキーワードとして、前記抽出部によって抽出されたキーワードを前記指定者に提示する提示部、
    を備えたことを特徴とする抽出装置。
  7. 前記算出部は、
    前記コンテンツを検索するための検索クエリとして当該コンテンツに紐づくキーワードがユーザから入力された回数、前記コンテンツがユーザから選択された回数又は前記コンテンツが表示されることで前記コンテンツの提供主が得た利益に関する情報の少なくとも一つに基づいて、前記組合せ毎の指標値を算出する、
    ことを特徴とする請求項5又は6に記載の抽出装置。
  8. 前記算出部は、
    所定の評価値以上であるコンテンツに紐づくキーワードの組合せの指標値を算出し、
    前記抽出部は、
    前記算出部によって算出された指標値に対応する組合せから、前記第2キーワードを抽出する、
    ことを特徴とする請求項5〜7のいずれか一つに記載の抽出装置。
  9. 前記算出部は、
    前記所定のコンテンツに紐づかせるキーワードとして、前記指定者によって前記コンテンツに紐づけられたキーワード、又は前記コンテンツから抽出されるキーワードを用いて前記指標値を算出する、
    ことを特徴とする請求項5〜8のいずれか一つに記載の抽出装置。
  10. コンピュータが実行する抽出方法であって、
    キーワードを指定した指定者毎に生成される当該キーワードの各組合せの指標値を算出する算出工程と、
    前記算出工程によって算出された前記組合せ毎の指標値に基づいて、前記キーワードの各組合せのうち新たに指定される第1キーワードを含む組合せから、当該第1キーワードと異なる第2キーワードを抽出する抽出工程と
    前記抽出工程によって抽出された第2キーワードを、前記指定者が提供する所定のコンテンツに紐づかせるキーワードとして、当該指定者に提示する提示工程と、
    を含んだことを特徴とする抽出方法。
  11. キーワードを指定した指定者毎に生成される当該キーワードの各組合せの指標値を算出する算出手順と、
    前記算出手順によって算出された前記組合せ毎の指標値に基づいて、前記キーワードの各組合せのうち新たに指定される第1キーワードを含む組合せから、当該第1キーワードと異なる第2キーワードを抽出する抽出手順と
    前記抽出手順によって抽出された第2キーワードを、前記指定者が提供する所定のコンテンツに紐づかせるキーワードとして、当該指定者に提示する提示手順と、
    をコンピュータに実行させることを特徴とする抽出プログラム。
  12. コンピュータが実行する抽出方法であって、
    キーワードを指定した指定者毎に生成される当該キーワードの各組合せの指標値を算出する算出工程と、
    前記算出工程によって算出された前記組合せ毎の指標値に基づいて、前記キーワードの各組合せのうち新たに指定される第1キーワードを含む組合せから、当該第1キーワードと異なる第2キーワードを抽出する抽出工程と、を含み、
    前記算出工程は、
    前記キーワードとして、前記指定者が提供するコンテンツに紐づくキーワードを用いて前記組合せの指標値を算出し、
    前記抽出工程は、
    前記第1キーワードとして、所定のコンテンツに紐づくキーワードを用いて、前記第2キーワードを抽出し、さらに、
    前記所定のコンテンツに紐づかせるキーワードとして、前記抽出工程によって抽出されたキーワードを前記指定者に提示する提示工程、
    を含んだことを特徴とする抽出方法。
  13. キーワードを指定した指定者毎に生成される当該キーワードの各組合せの指標値を算出する算出手順と、
    前記算出手順によって算出された前記組合せ毎の指標値に基づいて、前記キーワードの各組合せのうち新たに指定される第1キーワードを含む組合せから、当該第1キーワードと異なる第2キーワードを抽出する抽出手順と、をコンピュータに実行させ、
    前記算出手順は、
    前記キーワードとして、前記指定者が提供するコンテンツに紐づくキーワードを用いて前記組合せの指標値を算出し、
    前記抽出手順は、
    前記第1キーワードとして、所定のコンテンツに紐づくキーワードを用いて、前記第2キーワードを抽出し、さらに、
    前記所定のコンテンツに紐づかせるキーワードとして、前記抽出手順によって抽出されたキーワードを前記指定者に提示する提示手順、
    をコンピュータに実行させることを特徴とする抽出プログラム。
JP2014173956A 2014-08-28 2014-08-28 抽出装置、抽出方法および抽出プログラム Active JP6072739B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014173956A JP6072739B2 (ja) 2014-08-28 2014-08-28 抽出装置、抽出方法および抽出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014173956A JP6072739B2 (ja) 2014-08-28 2014-08-28 抽出装置、抽出方法および抽出プログラム

Publications (2)

Publication Number Publication Date
JP2016048527A JP2016048527A (ja) 2016-04-07
JP6072739B2 true JP6072739B2 (ja) 2017-02-01

Family

ID=55649369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014173956A Active JP6072739B2 (ja) 2014-08-28 2014-08-28 抽出装置、抽出方法および抽出プログラム

Country Status (1)

Country Link
JP (1) JP6072739B2 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210565A (ja) * 1994-01-21 1995-08-11 Canon Inc 情報検索方法及び装置
US7925610B2 (en) * 1999-09-22 2011-04-12 Google Inc. Determining a meaning of a knowledge item using document-based information
JP2006226061A (ja) * 2005-02-21 2006-08-31 Shimizu Corp 地中排水工法
JP2008226061A (ja) * 2007-03-15 2008-09-25 Fujifilm Corp 画像のタグ指定装置および画像検索装置ならびにそれらの動作制御方法およびそれらのコンピュータを制御するプログラム
JP2009086771A (ja) * 2007-09-27 2009-04-23 Nomura Research Institute Ltd 検索サービス装置
US20100094673A1 (en) * 2008-10-14 2010-04-15 Ebay Inc. Computer-implemented method and system for keyword bidding
WO2010120699A2 (en) * 2009-04-16 2010-10-21 Evri Inc. Enhanced advertisement targeting
JP5426710B2 (ja) * 2012-03-19 2014-02-26 株式会社東芝 検索支援装置、検索支援方法およびプログラム

Also Published As

Publication number Publication date
JP2016048527A (ja) 2016-04-07

Similar Documents

Publication Publication Date Title
JP6271345B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP7311554B2 (ja) 算出装置、算出方法及び算出プログラム
JP5462971B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6023129B2 (ja) 抽出装置、抽出方法及び抽出プログラム
US9734503B1 (en) Hosted product recommendations
JP6235443B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP2018045553A (ja) 選択装置、選択方法および選択プログラム
JP6320258B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP6866069B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2018088282A (ja) 抽出装置、抽出方法及び抽出プログラム
JP2019003610A (ja) 抽出装置、抽出方法及び抽出プログラム
JP6043745B2 (ja) 情報提供装置、情報提供方法および情報提供プログラム
JP6100741B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6373140B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP6921922B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP6282965B2 (ja) 受付装置、受付方法及び受付プログラム
JP6072739B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6355151B2 (ja) オファーリングシステム、オファーリング方法及びプログラム
JP5968381B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6240049B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6310509B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6961653B2 (ja) 抽出装置、抽出方法及び抽出プログラム
JP6166323B2 (ja) 広告コンテンツ生成装置、広告コンテンツ生成方法及び広告コンテンツ生成プログラム
JP5847240B2 (ja) 広告コンテンツ生成装置、広告コンテンツ生成方法及び広告コンテンツ生成プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161228

R150 Certificate of patent or registration of utility model

Ref document number: 6072739

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250