JP2016048526A - Extraction device, extraction method, and extraction program - Google Patents

Extraction device, extraction method, and extraction program Download PDF

Info

Publication number
JP2016048526A
JP2016048526A JP2014173955A JP2014173955A JP2016048526A JP 2016048526 A JP2016048526 A JP 2016048526A JP 2014173955 A JP2014173955 A JP 2014173955A JP 2014173955 A JP2014173955 A JP 2014173955A JP 2016048526 A JP2016048526 A JP 2016048526A
Authority
JP
Japan
Prior art keywords
keyword
content
similarity
extraction
word vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014173955A
Other languages
Japanese (ja)
Other versions
JP6100741B2 (en
Inventor
堀田 徹
Toru Hotta
徹 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014173955A priority Critical patent/JP6100741B2/en
Publication of JP2016048526A publication Critical patent/JP2016048526A/en
Application granted granted Critical
Publication of JP6100741B2 publication Critical patent/JP6100741B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To improve customer appeal of contents related to keywords in a technical field of distributing such contents.SOLUTION: An extraction device includes a calculation part and an extraction part. The calculation part calculates similarity between feature information on first content associated with a keyword and feature information on second content including an arbitrary word (S13), where feature information is, for example, a word vector corresponding to content. The extraction part extracts a keyword corresponding to feature information calculated by the calculation part and having a similarity equal to or more than a predetermined threshold (S14).SELECTED DRAWING: Figure 2

Description

本発明は、抽出装置、抽出方法および抽出プログラムに関する。   The present invention relates to an extraction apparatus, an extraction method, and an extraction program.

インターネット上には膨大な情報が開示されており、ユーザは、知りたい情報を探す際には検索サイトを利用する場合が多い。かかる検索サイトでは、検索マッチング広告や検索連動広告と呼ばれる広告配信が行われることがある。   Enormous amounts of information are disclosed on the Internet, and users often use search sites when searching for information they want to know. In such a search site, advertisement distribution called search matching advertisement or search-linked advertisement may be performed.

この種の広告配信において、広告主が広告の入稿時に一又は二以上の広告関連キーワードを指定する技術が知られている。この技術では、広告関連キーワードがユーザから検索キーワードとして入力された場合に、検索キーワードに応じた検索結果に隣接させて、広告関連キーワードに関連する広告を表示する。   In this type of advertisement distribution, a technique is known in which an advertiser designates one or more advertisement-related keywords when submitting an advertisement. In this technique, when an advertisement-related keyword is input as a search keyword from a user, an advertisement related to the advertisement-related keyword is displayed adjacent to a search result corresponding to the search keyword.

特開2010−211777号公報JP 2010-211777 A

しかしながら、上記の従来技術では、コンテンツの訴求効果を高めることができるとは限らない。具体的には、上記の従来技術では、入稿されたコンテンツである広告に対して広告主が適切に広告関連キーワードを指定する手法については開示されていない。そして、検索連動型の広告配信においては、広告関連キーワードが適切に指定されなければ、適切な広告を配信することができない。これにより、配信される広告の訴求効果が十分に発揮されないおそれがある。   However, the above-described conventional technology cannot always enhance the appeal effect of the content. Specifically, the above-described conventional technology does not disclose a method in which an advertiser appropriately specifies an advertisement-related keyword for an advertisement that is a submitted content. In search-linked advertisement distribution, appropriate advertisements cannot be distributed unless advertisement-related keywords are appropriately specified. Thereby, there exists a possibility that the appeal effect of the advertisement distributed may not fully be exhibited.

なお、上記では、コンテンツとして広告を例に挙げて、訴求効果を高めることができるとは限らない点について説明した。しかし、広告目的以外のコンテンツにおいても同様に、訴求効果を高めることができるとは限らない。すなわち、上記のような検索連動型の広告配信の例に限られず、キーワードに関連するコンテンツを配信する技術分野においては、キーワードが適切に指定されなければ、適切なコンテンツを配信することができず、コンテンツの訴求効果を高めることができるとは限らない。   In the above, an advertisement is taken as an example of the content, and the point that the appeal effect cannot always be improved has been described. However, it is not always possible to increase the appeal effect for content other than advertising purposes. In other words, the present invention is not limited to the example of search-linked advertisement delivery as described above. In the technical field of delivering content related to a keyword, appropriate content cannot be delivered unless the keyword is appropriately specified. , It is not always possible to increase the appeal of the content.

本願に係る抽出装置は、キーワードに紐づけられた第1コンテンツの特徴情報と、任意の単語を含む第2コンテンツの特徴情報との類似度を算出する算出部と、前記算出部によって算出された類似度が所定の閾値以上の前記特徴情報に対応するキーワードを抽出する抽出部と、を備えたことを特徴とする。   The extraction device according to the present application calculates a similarity between the feature information of the first content associated with the keyword and the feature information of the second content including an arbitrary word, and is calculated by the calculation unit An extraction unit that extracts a keyword corresponding to the feature information having a similarity equal to or greater than a predetermined threshold.

実施形態の一態様によれば、コンテンツの訴求効果を高めることができるという効果を奏する。   According to one aspect of the embodiment, there is an effect that the appeal effect of the content can be enhanced.

図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。FIG. 1 is a diagram illustrating an example of a web page on which advertisement content according to the embodiment is displayed. 図2は、実施形態に係る抽出処理の一例を示す図である。FIG. 2 is a diagram illustrating an example of the extraction process according to the embodiment. 図3は、実施形態に係る広告装置の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of the advertising device according to the embodiment. 図4は、実施形態に係るLP情報記憶部の一例を示す図である。FIG. 4 is a diagram illustrating an example of the LP information storage unit according to the embodiment. 図5は、実施形態に係るキーワード情報記憶部の一例を示す図である。FIG. 5 is a diagram illustrating an example of the keyword information storage unit according to the embodiment. 図6は、実施形態に係る生成処理の一例を示す概念図である。FIG. 6 is a conceptual diagram illustrating an example of a generation process according to the embodiment. 図7は、実施形態に係る広告装置による抽出処理手順を示すフローチャートである。FIG. 7 is a flowchart illustrating an extraction processing procedure by the advertising device according to the embodiment. 図8は、変形例に係るLP情報記憶部の一例を示す図である。FIG. 8 is a diagram illustrating an example of the LP information storage unit according to the modification. 図9は、広告装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 9 is a hardware configuration diagram illustrating an example of a computer that realizes the function of the advertising device.

以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。   Hereinafter, a mode for carrying out an extraction apparatus, an extraction method, and an extraction program according to the present application (hereinafter referred to as “embodiment”) will be described in detail with reference to the drawings. Note that the extraction apparatus, the extraction method, and the extraction program according to the present application are not limited to the embodiment. Moreover, in the following embodiment, the same code | symbol is attached | subjected to the same site | part and the overlapping description is abbreviate | omitted.

〔1.抽出処理〕
以下では、図1及び図2を用いて、実施形態に係る抽出処理の一例について説明する。図1及び図2では、本願に係る抽出装置に対応する広告装置100によって配信処理及び抽出処理が行われる例を示す。まず、図1を用いて、実施形態に係る広告配信の一例を説明する。図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。
[1. (Extraction process)
Below, an example of the extraction process which concerns on embodiment is demonstrated using FIG.1 and FIG.2. 1 and 2 show an example in which distribution processing and extraction processing are performed by the advertising device 100 corresponding to the extraction device according to the present application. First, an example of advertisement distribution according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of a web page on which advertisement content according to the embodiment is displayed.

図1には、実施形態に係る広告コンテンツが表示されるウェブページとして、ユーザ端末10に表示される検索結果ページ50を示す。検索結果ページ50は、ユーザから入力される検索クエリに基づいて検索されたウェブページに関する情報が表示されるウェブページである。   FIG. 1 shows a search result page 50 displayed on the user terminal 10 as a web page on which advertisement content according to the embodiment is displayed. The search result page 50 is a web page on which information related to a web page searched based on a search query input from a user is displayed.

図1に示すように、検索結果ページ50には、検索クエリ入力部52が含まれる。検索結果ページ50を利用するユーザは、ユーザ端末10を介して、検索クエリ入力部52に検索クエリを入力する。図1では、ユーザが検索クエリ入力部52に入力した「英会話教室」という検索クエリに基づいて、検索結果ページ50に検索結果が表示される例を示す。すなわち、検索結果ページ50には、検索結果として、「英会話教室」に関連のあるウェブページのリンク等の情報が表示される。   As shown in FIG. 1, the search result page 50 includes a search query input unit 52. A user who uses the search result page 50 inputs a search query to the search query input unit 52 via the user terminal 10. FIG. 1 shows an example in which a search result is displayed on the search result page 50 based on a search query “English conversation classroom” input to the search query input unit 52 by the user. That is, the search result page 50 displays information such as a link of a web page related to “English conversation class” as a search result.

また、検索結果ページ50には、検索結果であるウェブページの情報とは別に、広告コンテンツが表示される。例えば、広告コンテンツは、検索結果ページ50に含まれる広告枠54又は広告枠56に表示される。広告コンテンツには、広告主の業務を宣伝するテキストなどが含まれる。そして、広告コンテンツには、広告主の提供するウェブページへのリンクが張られる。このような広告コンテンツのリンク先であるウェブページは、ランディングページ(Landing Page、以下「LP」と表記する場合がある)などと呼ばれる。すなわち、広告主は、広告コンテンツを表示させることで、ユーザにLPへの移動を促し、自身が提供するウェブページを閲覧させたり、ウェブページ上で商品の購入をさせたりするといった営業に活用する。   Further, on the search result page 50, advertisement content is displayed separately from the information of the web page that is the search result. For example, the advertising content is displayed in the advertising space 54 or the advertising space 56 included in the search result page 50. The advertising content includes text that advertises the business of the advertiser. The advertisement content is linked to a web page provided by the advertiser. A web page that is a link destination of such advertising content is called a landing page (hereinafter sometimes referred to as “LP”). In other words, advertisers are encouraged to move to LP by displaying advertisement content, and are used for business such as browsing web pages provided by themselves or purchasing products on web pages. .

このような検索サービスと連動する広告配信サービスにおいて、広告主は、広告コンテンツを入稿する際に、所定のキーワードに対して入札を行う。そして、広告主は、ユーザが所定のキーワードを検索クエリとして入力した場合に、LPへのリンクが張られた広告コンテンツをユーザに配信させる権利を取得する。すなわち、広告主は、検索サービスにおいて、ユーザが広告コンテンツと紐づけられたキーワードと同一又は類似のキーワードを検索クエリとして入力した場合に、検索サービスと連動して、検索結果ページ50に広告コンテンツを表示させることができる。これにより、広告主は、特定の情報への欲求がユーザに発生しているタイミングで広告コンテンツを配信させることができるので、より高い広告効果が見込める広告コンテンツの配信を行うことができる。   In such an advertisement distribution service linked to a search service, an advertiser makes a bid for a predetermined keyword when submitting advertisement content. Then, when the user inputs a predetermined keyword as a search query, the advertiser acquires the right to distribute the advertising content linked to the LP to the user. That is, in the search service, when the user inputs, as a search query, a keyword that is the same as or similar to the keyword associated with the advertising content, the advertiser links the advertising content to the search result page 50 in conjunction with the search service. Can be displayed. Thereby, since the advertiser can distribute the advertising content at the timing when the desire for specific information is generated in the user, it is possible to distribute the advertising content that can be expected to have a higher advertising effect.

ここで、検索サービスと連動する広告コンテンツの配信処理の流れについて説明する。検索サービスと連動する広告コンテンツの配信処理は、広告装置100と、検索サーバ30と、ユーザ端末10とにより、図示しないネットワークN(例えば、インターネット)を介して行われる。   Here, the flow of the advertisement content distribution process linked to the search service will be described. The distribution process of the advertising content linked to the search service is performed by the advertising device 100, the search server 30, and the user terminal 10 via a network N (not shown) (for example, the Internet).

ユーザ端末10は、ユーザによって利用される情報処理装置である。ユーザ端末10は、例えば、スマートフォンやタブレット端末やPDA(Personal Digital Assistant)等の移動端末や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。   The user terminal 10 is an information processing device used by a user. The user terminal 10 is, for example, a mobile terminal such as a smartphone, a tablet terminal, or a PDA (Personal Digital Assistant), a desktop PC (Personal Computer), a notebook PC, or the like.

検索サーバ30は、検索サービスを提供するサーバ装置である。例えば、検索サーバ30は、所定の検索サイトにおいて、ユーザから検索クエリの入力を受け付ける。そして、検索サーバ30は、検索クエリに基づいた検索結果をユーザに提供する。   The search server 30 is a server device that provides a search service. For example, the search server 30 receives an input of a search query from a user at a predetermined search site. Then, the search server 30 provides the user with a search result based on the search query.

広告装置100は、検索サーバ30と連動して広告配信を行うサーバ装置である。広告装置100は、広告主から広告コンテンツの入稿とともに、キーワードに対する入札を受け付ける。そして、広告装置100は、以下に説明する手順により、検索サービスにおいて入札キーワードを入力したユーザに広告コンテンツを配信する。   The advertising device 100 is a server device that distributes advertisements in conjunction with the search server 30. The advertising device 100 accepts bids for keywords as well as submission of advertising content from advertisers. Then, the advertising device 100 distributes the advertising content to the user who has input the bid keyword in the search service according to the procedure described below.

まず、ユーザは、ユーザ端末10を介して、検索サーバ30が提供する検索サイトにアクセスする。そして、ユーザは、検索サイトにおいて検索クエリを入力する。これにより、ユーザ端末10は、検索サーバ30に検索クエリを送信する(ステップS01)。検索サーバ30は、検索クエリに対応する検索結果を表示するウェブページである検索結果ページ50をユーザに提供する(ステップS02)。   First, the user accesses a search site provided by the search server 30 via the user terminal 10. Then, the user inputs a search query at the search site. Thereby, the user terminal 10 transmits a search query to the search server 30 (step S01). The search server 30 provides the user with a search result page 50, which is a web page that displays search results corresponding to the search query (step S02).

また、検索クエリを受信した検索サーバ30は、検索クエリに関する情報を広告装置100に送信する(ステップS03)。これにより、広告装置100は、ユーザから入力された検索クエリに関する情報を取得する。そして、広告装置100は、検索クエリが入札キーワードである場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する(ステップS04)。   The search server 30 that has received the search query transmits information related to the search query to the advertising device 100 (step S03). Thereby, advertising device 100 acquires information about a search query inputted by a user. Then, when the search query is a bid keyword, the advertising device 100 selects an advertisement content associated with the bid keyword as a distribution candidate (step S04).

上述のように、検索結果ページ50には、広告枠54及び広告枠56が含まれる。そこで、ユーザ端末10は、検索結果ページ50を表示する際に、広告装置100に広告配信の要求を行う(ステップS05)。広告配信の要求を受け付けた広告装置100は、入札キーワードに紐づく広告コンテンツをユーザ端末10に配信する(ステップS06)。これにより、例えば、「英会話教室」というキーワードに入札していた広告主が提供する広告コンテンツが、広告枠54に表示される。また、同じキーワードに入札していた他の広告主が提供する広告コンテンツが、広告枠56に表示される。このように、広告装置100は、検索サービスと連動して、広告コンテンツをユーザに配信することができる。なお、ステップS03において、検索サーバ30がクエリ情報を広告装置100に送信する例を示したが、クエリ情報は、ユーザ端末10から広告装置100に送信されてもよい。   As described above, the search result page 50 includes the advertising space 54 and the advertising space 56. Therefore, when displaying the search result page 50, the user terminal 10 makes a request for advertisement distribution to the advertising device 100 (step S05). Upon receiving the advertisement distribution request, the advertising device 100 distributes the advertisement content associated with the bid keyword to the user terminal 10 (step S06). As a result, for example, the advertising content provided by the advertiser who has bid on the keyword “English conversation classroom” is displayed in the advertising space 54. In addition, the advertising content provided by other advertisers who have bid on the same keyword is displayed in the advertising space 56. As described above, the advertising device 100 can distribute the advertising content to the user in conjunction with the search service. In addition, although the search server 30 showed the example which transmits query information to the advertising device 100 in step S03, query information may be transmitted to the advertising device 100 from the user terminal 10. FIG.

ところで、図1の例のように、広告主は、検索結果ページ50に広告コンテンツを表示させるために、所定のキーワードに入札を行うことになる。図1の例の場合、広告主は、LPをリンク先とする広告コンテンツを配信させるためには、「英会話教室」というキーワードに入札することになる。しかしながら、広告主にとって、適切なキーワードに入札することは容易でない。例えば、入札したキーワードと、広告主が提供する広告コンテンツとの対応関係が適切であり、検索結果に興味を持つユーザに対して適切な広告コンテンツが配信されているか否かを広告主が判断することは困難である。   By the way, as shown in the example of FIG. 1, the advertiser bids on a predetermined keyword in order to display the advertising content on the search result page 50. In the case of the example in FIG. 1, the advertiser bids on the keyword “English conversation classroom” in order to distribute the advertising content with the LP as the link destination. However, it is not easy for advertisers to bid on appropriate keywords. For example, the advertiser determines whether the correspondence between the bid keyword and the advertisement content provided by the advertiser is appropriate and appropriate advertisement content is distributed to users who are interested in the search results. It is difficult.

そこで、実施形態に係る広告装置100は、図1で示したような検索連動型の広告配信サービスにおいて、広告主にとって適切な入札キーワードを抽出する。以下、図2を用いて、実施形態に係る抽出処理を説明する。図2は、実施形態に係る抽出処理の一例を示す図である。図2では、抽出システム1を例に挙げて、抽出処理の一例を説明する。   Therefore, the advertising device 100 according to the embodiment extracts bid keywords suitable for the advertiser in the search-linked advertisement distribution service as shown in FIG. Hereinafter, the extraction process according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram illustrating an example of the extraction process according to the embodiment. In FIG. 2, an example of the extraction process will be described by taking the extraction system 1 as an example.

図2に示すように、抽出システム1には、広告主端末20と、広告装置100とが含まれる。広告装置100は、図示しないネットワークN(例えば、インターネット)を介して、広告主端末20と通信可能に接続される。   As shown in FIG. 2, the extraction system 1 includes an advertiser terminal 20 and an advertising device 100. The advertising device 100 is communicably connected to the advertiser terminal 20 via a network N (for example, the Internet) not shown.

広告主端末20は、広告主によって利用される情報処理装置である。広告主端末20は、例えば、スマートフォンやタブレット端末やPDA等の移動端末や、デスクトップ型PCや、ノート型PC等である。   The advertiser terminal 20 is an information processing device used by the advertiser. The advertiser terminal 20 is, for example, a mobile terminal such as a smartphone, a tablet terminal, or a PDA, a desktop PC, a notebook PC, or the like.

広告装置100は、以下に説明する抽出処理によって、広告主が入札する入札キーワードとして適切なキーワードを抽出するサーバ装置である。   The advertising device 100 is a server device that extracts an appropriate keyword as a bid keyword for an advertiser to bid by an extraction process described below.

広告装置100は、予め、既存のLPと、既存のLPに紐づく入札キーワードとに関する情報を保持する。既存のLPとは、所定の広告主によって過去に広告装置100に入稿された広告コンテンツであって、既にユーザ端末10へ配信される可能性がある広告コンテンツのリンク先を示す。例えば、広告装置100は、LPのURL(Uniform Resource Locator)に基づき、HTML(HyperText Markup Language)ファイルなどのLPに関するデータを所定のウェブサーバから収集し、収集したデータを既存のLPとして保持する。また、既存のLPに紐づく入札キーワードとは、ユーザから検索クエリとして入力された場合に、既存のLPをリンク先とする広告コンテンツが表示される契機となるキーワードであり、所定の広告主から既に入札を受け付けているキーワードである。   The advertising device 100 holds in advance information regarding existing LPs and bid keywords associated with the existing LPs. The existing LP indicates a link destination of advertisement content that has been submitted to the advertising device 100 in the past by a predetermined advertiser and that may already be distributed to the user terminal 10. For example, the advertising device 100 collects data related to the LP such as an HTML (HyperText Markup Language) file from a predetermined web server based on the URL (Uniform Resource Locator) of the LP, and holds the collected data as an existing LP. A bid keyword associated with an existing LP is a keyword that triggers the display of advertising content with the existing LP as a link destination when input from a user as a search query. This keyword has already accepted a bid.

ここで、広告装置100は、既存のLP及び入札キーワードの特徴情報を生成する。例えば、広告装置100は、特徴情報として、既存のLP及び入札キーワードの単語ベクトルを生成する(ステップS11)。まず、広告装置100は、既存のLPに対応する単語ベクトルを生成する。LPに対応する単語ベクトルとは、例えば、LPに含まれる単語の種類と出現回数とに対して所定の重みを付した上で、LPをベクトルモデルで表現したものである。このように、広告装置100は、LPに出現する単語の傾向などを単語ベクトルで表すことにより、LPの特徴情報を生成する。   Here, the advertising device 100 generates feature information of existing LPs and bid keywords. For example, the advertising device 100 generates a word vector of existing LPs and bid keywords as feature information (step S11). First, the advertising device 100 generates a word vector corresponding to an existing LP. The word vector corresponding to LP is, for example, a representation of LP by a vector model after giving a predetermined weight to the type and number of appearances of words included in LP. Thus, the advertising device 100 generates the feature information of the LP by expressing the tendency of the word appearing in the LP by the word vector.

続いて、広告装置100は、入札キーワードに対応する単語ベクトルを生成する。広告装置100は、入札キーワードに紐づく既存のLPの単語ベクトルを用いることにより、入札キーワードの単語ベクトルを生成する。例えば、広告装置100は、入札キーワードに紐づく既存のLPの単語ベクトルを入札キーワードの単語ベクトルとする。また、入札キーワードに紐づく既存のLPが複数ある場合(すなわち、複数の広告主が同じキーワードに対して入札している場合)には、広告装置100は、入札キーワードに紐づけられている複数のLPの各単語ベクトルの重心ベクトルを生成する。そして、広告装置100は、生成した重心ベクトルを入札キーワードの単語ベクトルとする。広告装置100は、生成した単語ベクトルを所定の記憶部に保持する。   Subsequently, the advertising device 100 generates a word vector corresponding to the bid keyword. The advertising device 100 generates the word vector of the bid keyword by using the existing LP word vector associated with the bid keyword. For example, the advertising device 100 sets an existing LP word vector associated with the bid keyword as the word vector of the bid keyword. In addition, when there are a plurality of existing LPs associated with the bid keyword (that is, when a plurality of advertisers are bidding on the same keyword), the advertising device 100 includes a plurality of LPs associated with the bid keyword. A barycentric vector of each word vector of LP is generated. Then, the advertising device 100 sets the generated center-of-gravity vector as the word vector of the bid keyword. The advertising device 100 holds the generated word vector in a predetermined storage unit.

そして、広告装置100は、検索連動型の広告配信サービスを利用しようとする新規の広告主CL10から、広告主端末20を介して、広告コンテンツの入稿を受け付ける(ステップS12)。また、広告装置100は、広告コンテンツの入稿の際に、広告コンテンツのリンク先のウェブページである新規LPに関する情報(例えば、新規LPのURL)を受け付ける。ここで、新規LPとは、未だ広告主からキーワードの入札を受け付けていないため、入札キーワードと紐づけられていない広告コンテンツのリンク先のウェブページをいう。   Then, the advertising device 100 accepts submission of advertising content from the new advertiser CL10 that intends to use the search-linked advertisement distribution service via the advertiser terminal 20 (step S12). In addition, the advertising device 100 receives information (for example, the URL of the new LP) related to the new LP that is the web page linked to the advertising content when the advertising content is submitted. Here, the new LP means a web page linked to the advertising content not linked to the bid keyword because the keyword bid from the advertiser has not yet been accepted.

続いて、広告装置100は、既存のLPと同様に、広告主端末20から送信された新規LPに関する情報を収集し、収集した情報を取得する。そして、広告装置100は、取得した新規LPの有する特徴情報を生成する。例えば、広告装置100は、新規LPに対応する単語ベクトルを生成する。   Subsequently, the advertising device 100 collects information on the new LP transmitted from the advertiser terminal 20 in the same manner as the existing LP, and acquires the collected information. Then, the advertising device 100 generates feature information that the acquired new LP has. For example, the advertising device 100 generates a word vector corresponding to the new LP.

そして、広告装置100は、入札キーワードの単語ベクトルと、新規LPの単語ベクトルとの類似度を算出する(ステップS13)。言い換えれば、広告装置100は、入札キーワードに紐づく既存のLPの単語ベクトルと、新規LPの単語ベクトルとの類似度を算出する。例えば、広告装置100は、類似度の一例として、単語ベクトル同士のコサイン類似度を算出することにより、単語ベクトルの類似度を算出する。そして、広告装置100は、算出された類似度が所定の閾値以上となる単語ベクトルに係るキーワードを抽出する(ステップS14)。   Then, the advertising device 100 calculates the similarity between the word vector of the bid keyword and the word vector of the new LP (step S13). In other words, the advertising device 100 calculates the similarity between the existing LP word vector associated with the bid keyword and the new LP word vector. For example, the advertising device 100 calculates the similarity between word vectors by calculating the cosine similarity between word vectors as an example of the similarity. Then, the advertising device 100 extracts a keyword related to a word vector for which the calculated similarity is equal to or greater than a predetermined threshold (step S14).

そして、広告装置100は、新規LPに紐づける入札キーワードとして、抽出されたキーワードを広告主CL10に提示する(ステップS15)。広告主CL10は、提示されたキーワードを入札キーワードとすることにより、検索サービスにおいてユーザが入札キーワードを入力して検索を行った場合に、入稿した広告コンテンツを検索結果ページ50に表示させることができる。   Then, the advertising device 100 presents the extracted keyword to the advertiser CL10 as a bid keyword associated with the new LP (step S15). The advertiser CL10 can display the submitted advertisement content on the search result page 50 when the user performs a search by inputting the bid keyword in the search service by using the presented keyword as a bid keyword. it can.

このように、実施形態に係る広告装置100は、キーワードに紐づけられた既存のLPの特徴情報と新規LPの特徴情報との類似度を算出し、算出された類似度が所定の閾値以上の特徴情報に対応するキーワードを抽出する。   As described above, the advertising device 100 according to the embodiment calculates the similarity between the feature information of the existing LP linked to the keyword and the feature information of the new LP, and the calculated similarity is equal to or greater than a predetermined threshold. A keyword corresponding to the feature information is extracted.

すなわち、実施形態に係る広告装置100は、新規LPに紐づかせるキーワードとして、新規LPと特徴が類似する既存のLPに紐づけられている入札キーワードを抽出する。また、広告装置100は、新規LPの単語ベクトルと、複数の既存のLPに係る重心ベクトルとの類似度を算出するので、特定の既存のLPに係るキーワードに偏重することなく、多くの広告主が入札しているキーワードを抽出することができる。上述のように、新たに検索連動型の広告配信サービスを利用する広告主にとっては、入札キーワードとLPとが適切に紐づけられているかを判断するのは困難である。一方、実施形態に係る広告装置100によれば、現時点において、検索連動型の広告配信サービスを利用する他の広告主が入札しているキーワードと既存のLPとの情報に基づいて、新規LPに紐づかせるキーワードを抽出することができる。これにより、新規LPを提供する広告主は、適切な入札キーワードを指定することができる。そして、広告主は、新規LPに対して適切なキーワードを入札キーワードとすることにより、広告コンテンツに興味を持つと想定されるユーザに広告コンテンツを配信させることができる。このため、実施形態に係る広告装置100によれば、配信される広告コンテンツが発揮する訴求効果などの、広告コンテンツの広告効果を高めることができる。   In other words, the advertising device 100 according to the embodiment extracts a bid keyword associated with an existing LP that is similar in characteristics to the new LP as a keyword associated with the new LP. In addition, since the advertising device 100 calculates the similarity between the word vector of the new LP and the centroid vectors related to the plurality of existing LPs, a large number of advertisers can be used without focusing on the keywords related to the specific existing LPs. Can extract the keywords that are bidding. As described above, it is difficult for an advertiser who newly uses a search-linked advertisement distribution service to determine whether or not the bid keyword and the LP are appropriately associated with each other. On the other hand, according to the advertising device 100 according to the embodiment, a new LP is created based on information on keywords currently existing by other advertisers who use the search-linked advertisement distribution service and existing LPs. Keywords to be linked can be extracted. Thereby, an advertiser who provides a new LP can specify an appropriate bid keyword. Then, the advertiser can distribute the advertising content to a user who is assumed to be interested in the advertising content by using an appropriate keyword for the new LP as a bid keyword. For this reason, according to the advertising device 100 according to the embodiment, the advertising effect of the advertising content such as the appealing effect exhibited by the distributed advertising content can be enhanced.

〔2.広告装置100の構成〕
次に、図3を用いて、実施形態に係る広告装置100の構成について説明する。図3は、実施形態に係る広告装置100の構成例を示す図である。図3に示すように、広告装置100は、通信部110と、記憶部120と、制御部130とを有する。
[2. Configuration of Advertising Device 100]
Next, the configuration of the advertising device 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of the advertising device 100 according to the embodiment. As illustrated in FIG. 3, the advertising device 100 includes a communication unit 110, a storage unit 120, and a control unit 130.

(通信部110について)
通信部110は、ネットワークNと有線又は無線で接続され、ユーザ端末10、広告主端末20及び検索サーバ30との間で情報の送受信を行う。例えば、通信部110は、NIC(Network Interface Card)等によって実現される。
(About the communication unit 110)
The communication unit 110 is connected to the network N by wire or wireless, and transmits / receives information to / from the user terminal 10, the advertiser terminal 20, and the search server 30. For example, the communication unit 110 is realized by a NIC (Network Interface Card) or the like.

(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3の例では、記憶部120は、LP情報記憶部121と、キーワード情報記憶部122とを有する。
(About the storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. In the example of FIG. 3, the storage unit 120 includes an LP information storage unit 121 and a keyword information storage unit 122.

(LP情報記憶部121について)
LP情報記憶部121は、LPに関する情報を記憶する。ここで、図4に、実施形態に係るLP情報記憶部121の一例を示す。図4に示した例では、LP情報記憶部121は、「広告主ID」、「LP」、「広告コンテンツ」、「入札キーワード」といった項目を有する。
(About LP information storage unit 121)
The LP information storage unit 121 stores information about LP. Here, FIG. 4 shows an example of the LP information storage unit 121 according to the embodiment. In the example illustrated in FIG. 4, the LP information storage unit 121 includes items such as “advertiser ID”, “LP”, “advertisement content”, and “bid keyword”.

「広告主ID」は、広告主又は広告主端末20を識別するための識別情報を示す。なお、以下では、図4に示した広告主IDに記憶されている識別情報を広告主の参照符号として用いる場合がある。例えば、広告主ID「CL01」によって識別される広告主を「広告主CL01」と表記する場合がある。   The “advertiser ID” indicates identification information for identifying the advertiser or the advertiser terminal 20. In the following, the identification information stored in the advertiser ID shown in FIG. 4 may be used as an advertiser reference code. For example, the advertiser identified by the advertiser ID “CL01” may be referred to as “advertiser CL01”.

「LP」は、広告主が提供するLPに関する情報を示す。図4に示す「LP01」という表記は、LPを識別するための識別情報を示すとともに、LPに関する情報を概念的に表現したものである。LP情報記憶部121内に記憶されるLPに関する情報は、LPを構成するHTMLファイル等であってもよいし、LPのデータが置かれたURL(Uniform Resource Locator)を示す情報であってもよい。なお、以下では、図4に示したLPの項目に記憶されている情報を、LPの参照符号として用いる場合がある。例えば、LP「LP01」によって示される情報を有するLPを「LP01」と表記する場合がある。   “LP” indicates information about LP provided by the advertiser. The notation “LP01” shown in FIG. 4 represents identification information for identifying the LP and conceptually represents information about the LP. The information regarding the LP stored in the LP information storage unit 121 may be an HTML file or the like constituting the LP, or may be information indicating a URL (Uniform Resource Locator) where the LP data is placed. . In the following, the information stored in the LP item shown in FIG. 4 may be used as the LP reference code. For example, an LP having information indicated by LP “LP01” may be expressed as “LP01”.

「広告コンテンツ」は、広告主端末20から入稿された広告コンテンツを示す。図4で
は、「広告コンテンツ」に「AD01」や「AD02」といった概念的な情報が格納される例を示したが、実際には、広告コンテンツの宣伝内容であるテキストデータや、または、これらの格納場所を示すファイルパス名などが格納される。
“Advertising content” indicates the advertising content submitted from the advertiser terminal 20. FIG. 4 shows an example in which conceptual information such as “AD01” and “AD02” is stored in “advertising content”, but in actuality, text data that is advertising content of advertising content, or these data Stores the file path name indicating the storage location.

「入札キーワード」は、各LP(すなわち、各広告コンテンツ)に紐づけられている入札キーワードを示す。図4に示すように、広告主は、一つのLPについて、複数のキーワードに入札することができる。また、入札キーワードは、一つの単語ではなく、複数の単語の組み合わせであってもよい。   “Bid keyword” indicates a bid keyword associated with each LP (that is, each advertisement content). As shown in FIG. 4, the advertiser can bid on a plurality of keywords for one LP. In addition, the bid keyword may be a combination of a plurality of words instead of a single word.

例えば、図4では、広告主ID「CL01」によって識別される広告主CL01が、「LP01」をリンク先とする広告コンテンツ「AD01」を検索結果ページ50に表示させるために、入札キーワード「K001」、「K002」、「K003」、「K004」、・・・、に入札している例を示している。   For example, in FIG. 4, in order for the advertiser CL01 identified by the advertiser ID “CL01” to display the advertising content “AD01” with “LP01” as the link destination on the search result page 50, the bid keyword “K001” is displayed. , “K002”, “K003”, “K004”,...

(キーワード情報記憶部122について)
キーワード情報記憶部122は、キーワードに関する情報を記憶する。ここで、図5に、実施形態に係るキーワード情報記憶部122の一例を示す。図5に示した例では、キーワード情報記憶部122は、「入札キーワード」、「LP」、「LP単語ベクトル」、「キーワード単語ベクトル」といった項目を有する。
(Keyword information storage unit 122)
The keyword information storage unit 122 stores information on keywords. Here, FIG. 5 shows an example of the keyword information storage unit 122 according to the embodiment. In the example illustrated in FIG. 5, the keyword information storage unit 122 includes items such as “bid keyword”, “LP”, “LP word vector”, and “keyword word vector”.

「入札キーワード」は、図4に示した入札キーワードの項目に対応する。「LP」は、図4に示したLPの項目に対応する。なお、図5における「LP」は、入札キーワードに紐づくLPを示す。   “Bid keyword” corresponds to the item of the bid keyword shown in FIG. “LP” corresponds to the item of LP shown in FIG. Note that “LP” in FIG. 5 indicates the LP associated with the bid keyword.

「LP単語ベクトル」は、各LPに対応する単語ベクトルを示す。図5に示す「V01」という表記は、単語ベクトルを概念的に表現したものである。なお、各LPに対応する単語ベクトルは、後述する生成部132によって生成され、生成部132によってキーワード情報記憶部122内に格納される。   “LP word vector” indicates a word vector corresponding to each LP. The notation “V01” shown in FIG. 5 is a conceptual representation of a word vector. A word vector corresponding to each LP is generated by the generation unit 132 described later, and is stored in the keyword information storage unit 122 by the generation unit 132.

「キーワード単語ベクトル」は、入札キーワードに対応する単語ベクトルを示す。図5に示す「G01」という表記は、単語ベクトルを概念的に表現したものである。詳しくは後述するが、入札キーワードに対応する単語ベクトルは、入札キーワードに紐づくLP単語ベクトルに基づいて生成される。   “Keyword word vector” indicates a word vector corresponding to a bid keyword. The notation “G01” shown in FIG. 5 is a conceptual representation of a word vector. As will be described in detail later, the word vector corresponding to the bid keyword is generated based on the LP word vector associated with the bid keyword.

例えば、図5では、入札キーワード「K001」は、LP「LP01」、「LP02」、「LP03」、・・・、に紐づいており、また、各LPに対応する単語ベクトルは、LP単語ベクトル「V01」、「V02」、「V03」、・・・、であり、入札キーワード「K001」に対応する単語ベクトルは、キーワード単語ベクトル「G01」である例を示している。   For example, in FIG. 5, the bid keyword “K001” is linked to LPs “LP01”, “LP02”, “LP03”,..., And the word vectors corresponding to each LP are LP word vectors. In this example, the word vector corresponding to the bid keyword “K001” is “V01”, “V02”, “V03”,.

(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告装置100内部の記憶装置に記憶されている各種プログラムがRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(About the control unit 130)
In the control unit 130, for example, various programs stored in a storage device inside the advertising device 100 are executed by using a RAM (Random Access Memory) as a work area by a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like. It is realized by doing. The control unit 130 is realized by an integrated circuit such as an application specific integrated circuit (ASIC) or a field programmable gate array (FPGA).

図3に示すように、制御部130は、入稿受付部131と、生成部132と、算出部133と、抽出部134と、提示部135と、要求受付部136と、配信部137とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。   As shown in FIG. 3, the control unit 130 includes a submission reception unit 131, a generation unit 132, a calculation unit 133, an extraction unit 134, a presentation unit 135, a request reception unit 136, and a distribution unit 137. And realizes or executes the functions and operations of information processing described below. Note that the internal configuration of the control unit 130 is not limited to the configuration illustrated in FIG. 3, and may be another configuration as long as the information processing described below is performed. Further, the connection relationship between the processing units included in the control unit 130 is not limited to the connection relationship illustrated in FIG. 3, and may be another connection relationship.

(入稿受付部131について)
入稿受付部131は、広告コンテンツの入稿を受け付ける。また、入稿受付部131は、広告コンテンツの入稿とともに、広告コンテンツのリンク先となるLPのURLや、広告コンテンツに対応する入札キーワードを受け付ける。そして、入稿受付部131は、受け付けた広告コンテンツや、LPに関する情報や、入札キーワードをLP情報記憶部121に格納する。
(About the submission acceptance part 131)
The submission accepting unit 131 accepts submission of advertisement content. In addition, the submission accepting unit 131 accepts the URL of the LP as a link destination of the advertising content and the bid keyword corresponding to the advertising content together with the submission of the advertising content. Then, the submission receiving unit 131 stores the received advertisement content, information about the LP, and the bid keyword in the LP information storage unit 121.

また、入稿受付部131は、新たに広告配信サービスを利用する広告主から、広告コンテンツの入稿を受け付ける。この場合、入稿受付部131は、受け付けた広告コンテンツのリンク先である新規LPの単語ベクトルを生成させるため、受け付けた新規LPに関する情報を生成部132に送る。   The submission accepting unit 131 accepts submission of advertisement content from an advertiser who newly uses the advertisement distribution service. In this case, the submission receiving unit 131 sends information related to the received new LP to the generating unit 132 in order to generate a word vector of the new LP that is the link destination of the received advertising content.

(生成部132について)
生成部132は、入稿受付部131によって受け付けられたLPや入札キーワードの特徴情報を生成する。例えば、生成部132は、特徴情報として、既存のLPや、新規LPや、入札キーワードに対応する単語ベクトルを生成する。そして、生成部132は、生成した単語ベクトルをキーワード情報記憶部122に格納する。
(About the generator 132)
The generation unit 132 generates feature information of LPs and bid keywords received by the submission receiving unit 131. For example, the generation unit 132 generates an existing LP, a new LP, and a word vector corresponding to a bid keyword as feature information. Then, the generation unit 132 stores the generated word vector in the keyword information storage unit 122.

生成部132は、LPに対応する単語ベクトルを生成する場合、LPのURLに基づいて、LPのデータを収集し、収集したLPのデータを取得する。そして、生成部132は、例えば、LPに含まれるテキストを形態素解析する。すなわち、生成部132は、LPに含まれるテキストを単語毎に分解する。そして、生成部132は、LPに含まれる単語の種類と、LP内の単語の出現回数に基づいて、LPに対応する単語ベクトルを生成する。例えば、生成部132は、LPに出現する単語について「1」の要素を与え、出現しない単語について「0」の要素を与えることで、LPに対応する単語ベクトルを生成する。   When generating the word vector corresponding to the LP, the generation unit 132 collects the LP data based on the LP URL, and acquires the collected LP data. Then, for example, the generation unit 132 performs morphological analysis on the text included in the LP. That is, the generation unit 132 decomposes the text included in the LP for each word. Then, the generation unit 132 generates a word vector corresponding to the LP based on the type of word included in the LP and the number of appearances of the word in the LP. For example, the generating unit 132 generates a word vector corresponding to LP by giving an element “1” for a word that appears in LP and giving an element “0” for a word that does not appear.

また、生成部132は、単語毎に重みを付与して、LPに対応する単語ベクトルを生成する。ここで、単語ベクトルの重みの付与に関しては、例えば、tf−idf(Term Frequency−Inverse Document Frequency)など既知の特徴抽出アルゴリズムにより特徴語を抽出する手法が考えられる。この場合、LPを特徴付ける特徴語として抽出された単語に関しては、生成部132は、重みを重くして単語ベクトルを生成する。これにより、生成部132は、LPの特徴を反映した単語ベクトルを生成することができる。   The generation unit 132 also assigns a weight to each word and generates a word vector corresponding to LP. Here, with respect to the weighting of the word vector, for example, a method of extracting a feature word by a known feature extraction algorithm such as tf-idf (Term Frequency-Inverse Document Frequency) can be considered. In this case, for a word extracted as a feature word that characterizes LP, the generation unit 132 generates a word vector with a higher weight. Thereby, the production | generation part 132 can produce | generate the word vector reflecting the characteristic of LP.

なお、生成部132は、上記のtf−idfではなく、tf−ilf(Term Frequency−Inverse Label Frequency)という手法を用いてもよい。上記のtf−idfにおいては、処理対象とする単語が全文書中においていくつの文書内で共通して使われているかを表す頻度としてdf(Document Frequency)を用いる(この場合、「文書」に対応するものはLPとなる)。これに対して、tf−ilfにおいては、LPに含まれる処理対象とする単語がどれくらいキーワード(すなわち、ラベル)に紐づけられているかを示す頻度(lf、Label Frequency)を用いる。   The generation unit 132 may use a technique called tf-ilf (Term Frequency-Inverse Label Frequency) instead of the above-described tf-idf. In the above-described tf-idf, df (Document Frequency) is used as a frequency indicating how many documents are commonly used in all documents (in this case, it corresponds to “document”). What you do is LP). On the other hand, in tf-ilf, a frequency (lf, Label Frequency) indicating how much a word to be processed included in LP is linked to a keyword (that is, a label) is used.

この場合、生成部132は、LPに対応する単語ベクトルについて、LP内の全ての単語の出現回数の総和、LP内に所定の単語が出現する回数及び所定の単語がキーワードと紐づく頻度に基づいて、所定の単語毎に重み付けがされた単語ベクトルを生成する。具体的には、生成部132は、LP内の全ての単語の出現回数の総和とLP内に所定の単語が出現する回数との割合(すなわち、tf。所定の単語のLP内での出現頻度を示す)と、単語がキーワードと紐づく頻度(すなわち、lf)とに基づいて、LPに対応する単語ベクトルを生成する。これにより、生成部132は、キーワードと極めて頻繁に紐づくような、ごくありふれた一般的な単語の重みが過度に重み付けられないよう、適切に重み付けのなされた単語ベクトルを生成する。このため、生成部132は、より適切にLPの特徴を示す単語ベクトルを生成することができる。   In this case, for the word vector corresponding to LP, the generation unit 132 is based on the total number of appearances of all words in the LP, the number of occurrences of the predetermined word in the LP, and the frequency with which the predetermined word is associated with the keyword. Thus, a word vector weighted for each predetermined word is generated. Specifically, the generation unit 132 calculates a ratio between the total number of appearances of all words in the LP and the number of occurrences of the predetermined word in the LP (that is, tf. Appearance frequency of the predetermined word in the LP). ) And the frequency with which the word is associated with the keyword (ie, lf), a word vector corresponding to LP is generated. As a result, the generation unit 132 generates a word vector that is appropriately weighted so that the weight of an ordinary word that is associated with a keyword very frequently is not excessively weighted. For this reason, the generation unit 132 can generate a word vector indicating the characteristics of the LP more appropriately.

また、生成部132は、入札キーワードに対応する単語ベクトルを生成する。生成部132は、入札キーワードに紐づくLPが複数ある場合には、入札キーワードに対応する単語ベクトルとして、入札キーワードに紐づけられた複数のLPに対応する各単語ベクトルの重心ベクトルを生成する。この点について、図6を用いて説明する。   In addition, the generation unit 132 generates a word vector corresponding to the bid keyword. When there are a plurality of LPs associated with the bid keyword, the generation unit 132 generates a centroid vector of each word vector corresponding to the plurality of LPs associated with the bid keyword as a word vector corresponding to the bid keyword. This point will be described with reference to FIG.

図6は、実施形態に係る生成処理の一例を示す概念図である。図6に示すように、入札キーワードK001には、LP01、LP02、LP03、・・・、が紐づけられている。生成部132は、LP01、LP02、LP03、・・・、の各々に対応する単語ベクトルV01、V02、V03、・・・、を生成する。そして、生成部132は、入札キーワードK001に対応する単語ベクトルとして、生成した各LPの単語ベクトルの重心ベクトルを生成する。すなわち、生成部132は、各LPの単語ベクトルの重心ベクトルを、入札キーワードK001の単語ベクトルG01として生成する。このように、生成部132は、紐づけられている複数のLPの各単語ベクトルの重心ベクトルを用いて入札キーワードに対応する単語ベクトルを生成するので、入札キーワードの特徴を適切に示す単語ベクトルを生成することができる。   FIG. 6 is a conceptual diagram illustrating an example of a generation process according to the embodiment. As shown in FIG. 6, LP01, LP02, LP03,... Are associated with the bid keyword K001. The generating unit 132 generates word vectors V01, V02, V03,... Corresponding to LP01, LP02, LP03,. Then, the generation unit 132 generates a centroid vector of the generated word vector of each LP as a word vector corresponding to the bid keyword K001. That is, the generation unit 132 generates the centroid vector of the word vector of each LP as the word vector G01 of the bid keyword K001. As described above, the generation unit 132 generates a word vector corresponding to the bid keyword by using the centroid vector of each word vector of the plurality of LPs linked to each other. Can be generated.

(算出部133について)
算出部133は、キーワードに紐づけられた既存のLPの特徴情報と、任意の単語を含む新規LPの特徴情報との類似度を算出する。ここで、広告装置100は、広告配信サービスにおいて、複数のキーワードの入札や、複数の広告コンテンツの入稿を受け付けているため、入札キーワードと既存のLPとの組み合わせは複数存在する。このとき、算出部133は、特徴情報の類似度の算出をキーワード毎に実行する。図5を例とすると、算出部133は、入札キーワードK001を処理対象とする場合には、入札キーワードK001と紐づけられた既存のLPであるLP01、LP02、LP03の各々の特徴情報と、新規LPの特徴情報との類似度を算出する。すなわち、算出部133は、キーワードと既存のLPが紐づけられた複数の組み合わせについて、キーワード毎に、キーワードに紐づけられた全ての既存のLPの特徴情報と、新規LPの特徴情報との類似度を算出する。
(About the calculation unit 133)
The calculation unit 133 calculates the similarity between the existing LP feature information associated with the keyword and the new LP feature information including an arbitrary word. Here, since the advertising device 100 accepts bids for a plurality of keywords and submission of a plurality of advertisement contents in the advertisement distribution service, there are a plurality of combinations of bid keywords and existing LPs. At this time, the calculation unit 133 calculates the similarity of the feature information for each keyword. Taking FIG. 5 as an example, when the bid keyword K001 is a processing target, the calculation unit 133 includes the feature information of each of LP01, LP02, and LP03, which are existing LPs associated with the bid keyword K001, and new The similarity with the LP feature information is calculated. That is, the calculation unit 133 is similar to the feature information of all the existing LPs associated with the keyword and the feature information of the new LP for each keyword for a plurality of combinations in which the keyword and the existing LP are associated. Calculate the degree.

また、算出部133は、特徴情報として、単語ベクトルを用いる。例えば、算出部133は、既存のLPの特徴情報に基づいて生成される、入札キーワードに対応する単語ベクトルと、新規LPに対応する単語ベクトルとの類似度を算出する。具体的には、算出部133は、既存のLPに紐づくキーワードに対応する単語ベクトルと、新規LPに対応する単語ベクトルとの類似度として、単語ベクトル同士のコサイン類似度を算出する。すなわち、算出部133は、算出処理の対象となる二つの単語ベクトルのコサイン類似度を算出する。上述のように、生成部132がLPに出現する単語について「1」の要素を与え、出現しない単語について「0」の要素を与えて、LPに対応する単語ベクトルを生成した場合には、算出部133は、二つの単語ベクトルのコサイン類似度として「0〜1」の範囲で示される所定の数値を算出する。   The calculation unit 133 uses a word vector as the feature information. For example, the calculation unit 133 calculates the similarity between the word vector corresponding to the bid keyword and the word vector corresponding to the new LP, which is generated based on the existing LP feature information. Specifically, the calculation unit 133 calculates the cosine similarity between the word vectors as the similarity between the word vector corresponding to the keyword associated with the existing LP and the word vector corresponding to the new LP. That is, the calculation unit 133 calculates the cosine similarity between two word vectors that are targets of calculation processing. As described above, the generation unit 132 gives an element “1” for a word that appears in LP, and gives an element “0” for a word that does not appear, and generates a word vector corresponding to LP. The unit 133 calculates a predetermined numerical value indicated in the range of “0 to 1” as the cosine similarity of two word vectors.

なお、算出部133は、類似度を算出する際に、類似度が比較的高くなると想定される単語ベクトル同士を抽出して、抽出された単語ベクトル同士の類似度を算出するようにしてもよい。例えば、算出部133は、Top−k retrieval(Top−k検索)のようなアルゴリズムを用いて処理対象を抽出する。すなわち、算出部133は、所定の手法(例えば、上述したtf−ilf)で付与されるスコアによって順序付けられた単語ベクトルの上位k個(kは任意の数)を抽出し、抽出された単語ベクトル同士の類似度を算出する。これにより、算出部133は、スコアの低い処理対象については処理をスキップするので、高速に類似度の算出を行うことができる。   Note that, when calculating the similarity, the calculation unit 133 may extract word vectors that are assumed to have a relatively high similarity, and calculate the similarity between the extracted word vectors. . For example, the calculation unit 133 extracts a processing target using an algorithm such as Top-k retry (Top-k search). That is, the calculation unit 133 extracts the top k word vectors (k is an arbitrary number) of word vectors ordered by a score given by a predetermined method (for example, tf-ilf described above), and the extracted word vectors The similarity between each other is calculated. Thereby, since the calculation part 133 skips a process about the process target with a low score, it can calculate a similarity at high speed.

また、算出部133は、キーワードに紐づけられた既存のLPが複数ある場合には、キーワードに紐づけられた複数の既存のLPに対応する各単語ベクトルの重心ベクトルと、新規LPに対応する単語ベクトルとの類似度を算出する。また、抽出部134は、算出部133によって算出された類似度が所定の閾値以上である複数の既存のLPに紐づくキーワードを抽出する。このように、算出部133は、他の広告主が入札キーワードとしている複数の既存のLPの特徴を平均化して捉える。このため、算出部133は、複数の既存のLPがキーワードに紐づく状況を加味して類似度を算出することができる。   In addition, when there are a plurality of existing LPs linked to the keyword, the calculation unit 133 corresponds to the centroid vector of each word vector corresponding to the plurality of existing LPs linked to the keyword and the new LP. The similarity with the word vector is calculated. The extraction unit 134 also extracts keywords associated with a plurality of existing LPs whose similarity calculated by the calculation unit 133 is equal to or greater than a predetermined threshold. Thus, the calculation unit 133 averages and captures the characteristics of a plurality of existing LPs that other advertisers use as bid keywords. For this reason, the calculation unit 133 can calculate the degree of similarity in consideration of a situation where a plurality of existing LPs are associated with keywords.

上記のように、算出部133は、既存のLPに紐づくキーワードが有する特徴情報と、新規LPの特徴情報との類似度を算出するので、キーワードと新規LPとの関連性を数値により示すことができる。そして、算出部133は、算出した結果を後述する抽出部134に送る。   As described above, the calculation unit 133 calculates the similarity between the feature information of the keyword associated with the existing LP and the feature information of the new LP, and thus indicates the relationship between the keyword and the new LP by a numerical value. Can do. Then, the calculation unit 133 sends the calculated result to the extraction unit 134 described later.

(抽出部134について)
抽出部134は、算出部133によって算出された特徴情報の類似度が所定の閾値以上である特徴情報に対応するキーワードを抽出する。例えば、抽出部134は、算出部133によって算出された単語ベクトルのコサイン類似度に基づき、コサイン類似度が所定の閾値以上である単語ベクトルに対応するキーワードを抽出する。
(About the extraction unit 134)
The extraction unit 134 extracts keywords corresponding to feature information whose feature information similarity calculated by the calculation unit 133 is equal to or greater than a predetermined threshold. For example, based on the cosine similarity of the word vector calculated by the calculation unit 133, the extraction unit 134 extracts a keyword corresponding to a word vector whose cosine similarity is greater than or equal to a predetermined threshold.

例えば、抽出部134は、単語ベクトル同士のコサイン類似度が高いほど(すなわち、「1」の値に近いほど)、算出対象となった単語ベクトルに対応するキーワードとLPとの関連性が高いものと判定する。そのため、抽出部134は、類似度に所定の閾値を設定し、所定の閾値以上の類似度に係る単語ベクトルに対応するキーワードを抽出する。抽出部134は、所定の閾値を任意に設定することができる。例えば、抽出部134は、抽出するキーワードの数に応じて、所定の閾値を設定する。すなわち、抽出部134は、多数のキーワードを抽出する場合には、所定の閾値を低く設定してもよい。   For example, as the cosine similarity between word vectors is higher (that is, closer to the value of “1”), the extraction unit 134 has a higher relevance between the keyword corresponding to the word vector to be calculated and LP. Is determined. Therefore, the extraction unit 134 sets a predetermined threshold for the similarity, and extracts a keyword corresponding to a word vector related to the similarity equal to or higher than the predetermined threshold. The extraction unit 134 can arbitrarily set a predetermined threshold value. For example, the extraction unit 134 sets a predetermined threshold according to the number of keywords to be extracted. That is, the extraction unit 134 may set the predetermined threshold value low when extracting a large number of keywords.

(提示部135について)
提示部135は、抽出部134によって抽出されたキーワードを新規LPの提供主である広告主に提示する。具体的には、提示部135は、検索サービスにおいてユーザに選択されることにより新規LPが表示される契機となるキーワード(すなわち、新規LPに紐づく入札キーワード)として、抽出部134によって抽出されたキーワードを広告主に提示する。
(About the presentation unit 135)
The presentation unit 135 presents the keyword extracted by the extraction unit 134 to the advertiser who is the provider of the new LP. Specifically, the presentation unit 135 is extracted by the extraction unit 134 as a keyword that triggers the display of the new LP when selected by the user in the search service (that is, a bid keyword associated with the new LP). Present keywords to advertisers.

なお、提示部135は、抽出部134によって抽出されたキーワードであっても、入札キーワードとして広告主に提示しない場合があってもよい。例えば、提示部135は、新規LPに設定されうる除外キーワードについては提示しなくてもよい。新規LPに設定されうる除外キーワードとは、例えば、新規LPの広告主と競合する企業名や、競合する企業が扱う製品名などが該当する。   Note that the presentation unit 135 may not present the keyword as a bid keyword to the advertiser even if it is the keyword extracted by the extraction unit 134. For example, the presentation unit 135 may not present the excluded keyword that can be set for the new LP. The exclusion keyword that can be set for the new LP corresponds to, for example, the name of a company competing with the advertiser of the new LP or the name of a product handled by the competing company.

(要求受付部136について)
要求受付部136は、広告コンテンツの配信に関する要求を受け付ける。例えば、要求受付部136は、広告コンテンツの取得要求として、ユーザ端末10が表示するウェブページに含まれるHTTP(Hypertext Transfer Protocol)リクエストを受け付ける。また、要求受付部136は、検索サーバ30から検索クエリに関する情報を受け付ける。
(About the request receiving unit 136)
The request reception unit 136 receives a request regarding distribution of advertisement content. For example, the request reception unit 136 receives an HTTP (Hypertext Transfer Protocol) request included in a web page displayed by the user terminal 10 as an advertisement content acquisition request. Further, the request receiving unit 136 receives information related to the search query from the search server 30.

(配信部137について)
配信部137は、広告コンテンツを配信する。例えば、配信部137は、要求受付部136が受け付けたHTTPリクエストに従い、ユーザ端末10に広告コンテンツを配信する。配信部137は、要求受付部136によって広告コンテンツの取得要求が受け付けられた場合に、配信候補の広告コンテンツをLP情報記憶部121から選択する。
(About distribution unit 137)
The distribution unit 137 distributes advertising content. For example, the distribution unit 137 distributes the advertising content to the user terminal 10 in accordance with the HTTP request received by the request reception unit 136. When the request reception unit 136 receives an advertisement content acquisition request, the distribution unit 137 selects the distribution candidate advertisement content from the LP information storage unit 121.

ここで、配信部137は、要求受付部136が受け付けた検索クエリと入札キーワードが同一又は類似する場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する。そして、配信部137は、検索クエリを検索サーバ30に送信したユーザ端末10に選択した広告コンテンツを配信する。   Here, when the search query received by the request reception unit 136 and the bid keyword are the same or similar, the distribution unit 137 selects the advertisement content associated with the bid keyword as a distribution candidate. Then, the distribution unit 137 distributes the selected advertisement content to the user terminal 10 that has transmitted the search query to the search server 30.

〔3.抽出処理手順〕
次に、図7を用いて、実施形態に係る広告装置100が実行する抽出処理の手順について説明する。図7は、実施形態に係る広告装置100による抽出処理手順を示すフローチャートである。
[3. (Extraction procedure)
Next, the procedure of the extraction process executed by the advertising device 100 according to the embodiment will be described with reference to FIG. FIG. 7 is a flowchart illustrating an extraction processing procedure by the advertising device 100 according to the embodiment.

図7に示すように、広告装置100は、既存のLPに紐づく入札キーワードの単語ベクトルを生成する(ステップS101)。そして、広告装置100は、広告配信サービスを利用する新規の広告主から、新たに広告コンテンツの入稿を受け付けたか否かを判定する(ステップS102)。広告装置100は、広告コンテンツを取得していない場合には(ステップS102;No)、取得するまで待機する。   As shown in FIG. 7, the advertising device 100 generates a word vector of a bid keyword associated with an existing LP (step S101). Then, the advertising device 100 determines whether or not new advertisement content submission has been received from a new advertiser using the advertisement distribution service (step S102). When the advertising device 100 has not acquired the advertising content (step S102; No), the advertising device 100 stands by until it is acquired.

一方、広告装置100は、新たに広告コンテンツを取得した場合には(ステップS102;Yes)、広告コンテンツのリンク先である新規LPの単語ベクトルを生成する(ステップS103)。そして、広告装置100は、入札キーワードと新規LPとの類似度を算出する(ステップS104)。   On the other hand, when the advertising device 100 newly acquires advertising content (step S102; Yes), the advertising device 100 generates a new LP word vector that is a link destination of the advertising content (step S103). Then, the advertising device 100 calculates the similarity between the bid keyword and the new LP (step S104).

続いて、広告装置100は、算出した類似度に基づいて、所定の閾値以上の類似度に係るキーワードを抽出する(ステップS105)。そして、広告装置100は、抽出したキーワードを新規LPに紐づく入札キーワードとして提示する(ステップS106)。   Subsequently, the advertising device 100 extracts keywords related to the similarity equal to or higher than a predetermined threshold based on the calculated similarity (step S105). Then, the advertising device 100 presents the extracted keyword as a bid keyword associated with the new LP (step S106).

なお、図7では、広告装置100が、既存のLPに紐づく入札キーワードの単語ベクトルを生成した後に、新規LPを取得する例を示した。しかし、この例に限られず、広告装置100は、新規LPを取得した後に、既存のLPに紐づく入札キーワードの単語ベクトルを生成してもよい。この場合、広告装置100は、生成した新規LPの単語ベクトルを所定の記憶部120内に格納する。また、広告装置100は、ステップS106において新規LPに紐づく入札キーワードを広告主に提示した後に、さらに異なるキーワードを抽出してもよい。すなわち、広告装置100は、抽出されたキーワードに対する広告主の対応によっては、ステップS105とステップS106を繰り返し実行してもよい。例えば、広告主が提示されたキーワード以外のキーワードを所望する場合には、広告装置100は、閾値の値を変更し、さらに異なるキーワードを抽出する。そして、広告装置100は、新たに抽出されたキーワードを広告主に提示する。   FIG. 7 illustrates an example in which the advertising device 100 acquires a new LP after generating a word vector of a bid keyword associated with an existing LP. However, without being limited to this example, the advertising device 100 may generate a word vector of a bid keyword associated with an existing LP after acquiring a new LP. In this case, the advertising device 100 stores the generated new LP word vector in the predetermined storage unit 120. In addition, after presenting the bid keyword associated with the new LP to the advertiser in step S106, the advertising device 100 may extract a different keyword. That is, the advertising device 100 may repeatedly execute step S105 and step S106 depending on the correspondence of the advertiser to the extracted keyword. For example, when the advertiser desires a keyword other than the keyword presented, the advertising device 100 changes the threshold value and extracts a different keyword. Then, the advertising device 100 presents the newly extracted keyword to the advertiser.

〔4.変形例〕
上述した実施形態は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、他の実施形態について説明する。
[4. (Modification)
The embodiment described above may be implemented in various different forms other than the above embodiment. Accordingly, other embodiments will be described below.

〔4−1.広告コンテンツ〕
上記実施形態において、広告装置100は、既存のLPや、既存のLPに紐づく入札キーワードや、新規LPに対応する単語ベクトルを生成し、生成した単語ベクトル同士の類似度を算出することにより、新規LPに紐づかせるキーワードを抽出する例を示した。ここで、広告装置100は、LPに限らず、他の情報を用いて、新規LPに紐づかせるキーワードを抽出してもよい。例えば、広告装置100は、LPに代えて、LPをリンク先とする広告コンテンツを利用することができる。この点について、図8を用いて説明する。
[4-1. Advertising content)
In the above embodiment, the advertising device 100 generates an existing LP, a bid keyword associated with the existing LP, a word vector corresponding to the new LP, and calculates a similarity between the generated word vectors. An example of extracting keywords to be associated with a new LP has been shown. Here, the advertising device 100 may extract a keyword associated with the new LP using other information, not limited to the LP. For example, the advertising device 100 can use advertising content that links to LP instead of LP. This point will be described with reference to FIG.

図8は、変形例に係るLP情報記憶部121の一例を示す図である。変形例に係る広告装置100は、図4に示したLP情報記憶部121の代わりに、図8に示したLP情報記憶部121を有する。図8に示すように、変形例に係るLP情報記憶部121は、図4に示したLP情報記憶部121に加えて、「CTR(Click Through Rate)」といった項目を有する。   FIG. 8 is a diagram illustrating an example of the LP information storage unit 121 according to the modification. The advertising device 100 according to the modification includes the LP information storage unit 121 illustrated in FIG. 8 instead of the LP information storage unit 121 illustrated in FIG. 4. As illustrated in FIG. 8, the LP information storage unit 121 according to the modification includes an item “CTR (Click Through Rate)” in addition to the LP information storage unit 121 illustrated in FIG. 4.

「CTR」は、広告コンテンツのCTRを示す。ここでは、CTRとは、広告コンテンツがユーザから選択された回数(例えば、ユーザ端末10においてクリックされた回数)を広告コンテンツの表示回数によって除算した値を示す。なお、現時点において配信されたことがない広告コンテンツのCTRには、予め決められている固定値や、全ての広告コンテンツにおけるCTRの平均値や、同一の広告カテゴリに属する全ての広告コンテンツにおけるCTRの平均値などが記憶される。また、「CTR」には、CTRの予測モデル等から予測される予測CTRが記憶されてもよい。このような予測CTRは、例えば、広告コンテンツの種別や、広告コンテンツが表示されるウェブページの種別等によって予測される。   “CTR” indicates the CTR of the advertising content. Here, CTR indicates a value obtained by dividing the number of times the advertisement content is selected by the user (for example, the number of times the user terminal 10 is clicked) by the number of times the advertisement content is displayed. The CTR of advertising content that has not been distributed at the present time includes a predetermined fixed value, an average value of CTR of all advertising content, or CTR of all advertising content belonging to the same advertising category. The average value is stored. Further, “CTR” may store a predicted CTR predicted from a CTR prediction model or the like. Such a predicted CTR is predicted based on, for example, the type of advertising content, the type of web page on which the advertising content is displayed, and the like.

例えば、図8では、広告主CL01が、「LP01」をリンク先とする広告コンテンツ「AD01」を入稿しており、広告コンテンツAD01のCTRが「0.01」である例を示している。また、広告主CL01は、検索結果とともに広告コンテンツAD01が表示されるためのキーワードとして、入札キーワード「K001」、「K002」、「K003」、「K004」、・・・、に入札している例を示している。   For example, FIG. 8 shows an example in which the advertiser CL01 has submitted the advertising content “AD01” with “LP01” as the link destination, and the CTR of the advertising content AD01 is “0.01”. Further, the advertiser CL01 is bidding on bid keywords “K001”, “K002”, “K003”, “K004”,... As keywords for displaying the advertisement content AD01 along with the search result. Is shown.

続いて、変形例に係る生成部132について説明する。上記の通り、実施形態に係る生成部132は、既存のLPに対応する単語ベクトルを生成したが、変形例に係る生成部132は、広告コンテンツに対応する単語ベクトルを生成する。   Subsequently, the generation unit 132 according to the modification will be described. As described above, the generation unit 132 according to the embodiment generates the word vector corresponding to the existing LP, but the generation unit 132 according to the modification generates a word vector corresponding to the advertising content.

例えば、生成部132は、実施形態と同様に、広告コンテンツに含まれるテキストデータについて形態素解析をする。そして、生成部132は、広告コンテンツに対応する単語ベクトルを生成する。また、生成部132は、広告コンテンツに対応する単語ベクトルに基づいて、広告コンテンツに紐づく入札キーワード(すなわち、LPに紐づくキーワード)に対応する単語ベクトルを生成する。   For example, the generation unit 132 performs morphological analysis on text data included in the advertising content, as in the embodiment. Then, the generation unit 132 generates a word vector corresponding to the advertising content. In addition, the generation unit 132 generates a word vector corresponding to a bid keyword associated with the advertisement content (that is, a keyword associated with LP) based on the word vector corresponding to the advertisement content.

また、生成部132は、新規LPをリンク先とする広告コンテンツに対応する単語ベクトルを生成する。そして、算出部133は、生成部132によって生成された入札キーワードに対応する単語ベクトルと、新規LPをリンク先とする広告コンテンツに対応する単語ベクトルとの類似度を算出する。そして、抽出部134は、算出部133によって算出された類似度に基づいて、所定の閾値以上の類似度に係る単語ベクトルに対応するキーワードを抽出する。このように、変形例に係る広告装置100によれば、広告コンテンツを用いて、新規LPに紐づかせるキーワードを抽出することができる。   In addition, the generation unit 132 generates a word vector corresponding to the advertising content with the new LP as a link destination. Then, the calculation unit 133 calculates the similarity between the word vector corresponding to the bid keyword generated by the generation unit 132 and the word vector corresponding to the advertising content with the new LP as a link destination. Then, based on the similarity calculated by the calculation unit 133, the extraction unit 134 extracts a keyword corresponding to the word vector related to the similarity greater than or equal to a predetermined threshold. As described above, according to the advertising device 100 according to the modification, it is possible to extract a keyword associated with the new LP using the advertising content.

また、変形例に係る広告装置100は、広告コンテンツの広告効果を示す指標を用いて、上記の抽出処理を行ってもよい。例えば、生成部132は、広告コンテンツに紐づく入札キーワードに対応する単語ベクトルの生成処理において、CTRの高い広告コンテンツほど単語ベクトルの重みを重くして、各広告コンテンツの単語ベクトルの重心ベクトルを生成する。   Further, the advertising device 100 according to the modification may perform the above extraction process using an index indicating the advertising effect of the advertising content. For example, in the generation processing of the word vector corresponding to the bid keyword associated with the advertising content, the generation unit 132 generates the barycentric vector of the word vector of each advertising content by increasing the weight of the word vector as the advertising content has a higher CTR. To do.

あるいは、生成部132は、広告コンテンツに紐づく入札キーワードに対応する単語ベクトルの生成処理において、入札キーワードに紐づけられた広告コンテンツのうちCTRの高い広告コンテンツを選出し、選出された各広告コンテンツの単語ベクトルを用いて重心ベクトルを生成してもよい。このように、変形例に係る生成部132は、広告コンテンツのCTRを反映させて単語ベクトルを生成するので、より広告効果の高い広告コンテンツの特徴が反映された単語ベクトルを生成することができる。また、変形例に係る算出部133は、より広告効果の高い広告コンテンツが反映される類似度を算出することができる。   Alternatively, the generation unit 132 selects an advertisement content having a high CTR from the advertisement content associated with the bid keyword in the generation processing of the word vector corresponding to the bid keyword associated with the advertisement content, and selects each advertisement content selected. The centroid vector may be generated using the word vector. As described above, the generation unit 132 according to the modification generates the word vector by reflecting the CTR of the advertising content, and thus can generate the word vector reflecting the characteristics of the advertising content with higher advertising effect. Further, the calculation unit 133 according to the modified example can calculate the similarity that reflects the advertising content with higher advertising effect.

なお、生成部132は、図8で示したCTR以外の広告効果を示す指標に基づいて単語ベクトルを生成してもよい。例えば、生成部132は、広告コンテンツが表示された回数に対して何割がコンバージョンに至るかの割合を示すCVR(Conversion Rate)などの情報に基づいて、単語ベクトルを生成してもよい。この場合、算出部133は、CVRの高い広告コンテンツが反映される類似度を算出することができる。   Note that the generation unit 132 may generate a word vector based on an index indicating an advertising effect other than the CTR illustrated in FIG. For example, the generation unit 132 may generate a word vector based on information such as CVR (Conversion Rate) indicating a percentage of conversion to the number of times advertisement content is displayed. In this case, the calculation unit 133 can calculate the similarity that reflects the advertising content with a high CVR.

なお、コンバージョンとは、広告主が獲得できる最終成果を示し、広告主への利益に繋がるユーザの行動が該当する。コンバージョンの例としては、ウェブページ上で商品を購入する行動や、会員登録を行う行動や、資料請求を行う行動や、商品等に関する問い合わせを行う行動等が挙げられる。また、コンバージョンには、広告コンテンツにアクセスしたユーザが、広告主のウェブページを介さずにオフライン(電話や郵送等)で商品購入、会員登録、資料請求、問い合わせ等を行う行動を含めてもよい。   Note that conversion refers to a final result that can be acquired by the advertiser, and corresponds to user behavior that leads to profits for the advertiser. Examples of conversion include an action of purchasing a product on a web page, an action of registering a member, an action of requesting a material, an action of inquiring about a product and the like. In addition, the conversion may include an action in which a user who accesses the advertising content makes a purchase, member registration, document request, inquiry, etc. offline (telephone or mail) without going through the advertiser's web page. .

また、入稿受付部131は、検索サービスにおいて、入札キーワードがユーザから入力された回数に関する情報を取得してもよい。そして、生成部132は、入札キーワードがユーザから入力された回数が多い広告コンテンツほど重みを重くして、重心ベクトルを生成してもよい。この場合、算出部133は、入札キーワードがユーザから入力された回数に基づいて、単語ベクトル同士の類似度を算出することになる。   In addition, the submission receiving unit 131 may acquire information related to the number of times a bid keyword is input from the user in the search service. Then, the generation unit 132 may generate the barycentric vector by increasing the weight of the advertising content with the larger number of times the bid keyword is input from the user. In this case, the calculation unit 133 calculates the similarity between the word vectors based on the number of times the bid keyword is input from the user.

このように、変形例に係る算出部133は、広告コンテンツ(もしくは、既存のLP)に紐づくキーワードがユーザから入力された回数、広告コンテンツがユーザから選択された回数又は広告コンテンツが表示されることで広告主が得た利益に関する情報の少なくとも一つに基づいて、類似度を算出することができる。   As described above, the calculation unit 133 according to the modified example displays the number of times the keyword associated with the advertising content (or existing LP) is input from the user, the number of times the advertising content is selected from the user, or the advertising content. Thus, the similarity can be calculated based on at least one of the information on the profit obtained by the advertiser.

これにより、広告装置100は、現状の検索サービスや広告配信の状況などに基づき、より実情に即して類似度を算出することができるので、新規LPの広告主に対して適切な入札キーワードを抽出することができる。   As a result, the advertising device 100 can calculate the similarity according to the actual situation based on the current search service and the status of the advertisement distribution, so that an appropriate bidding keyword can be selected for the advertiser of the new LP. Can be extracted.

なお、算出部133は、上記で示した例以外にも、さらに異なる広告評価に関する情報を用いて類似度を算出してもよい。例えば、算出部133は、ユーザ端末10における広告コンテンツの実際の表示回数(インプレッション数)や、広告コンテンツに対するクリックで発生する課金額であるCPC(Cost Per Click)や、広告コンテンツの1000回表示あたりの課金額であるeCPM(effective Cost Per Mill)などの広告コンテンツに関する情報を用いてもよい。   Note that the calculation unit 133 may calculate the degree of similarity using information related to different advertisement evaluations other than the example shown above. For example, the calculation unit 133 displays the actual display count (impressions) of the advertising content on the user terminal 10, CPC (Cost Per Click) that is a billing amount generated when the advertising content is clicked, Information related to advertising content such as eCPM (effective cost per mill), which is the billing amount, may be used.

また、上記例においては、広告コンテンツ同士の類似度を算出する例を示したが、類似度は、広告コンテンツの特徴情報とLPの特徴情報とによって算出されてもよい。   Moreover, although the example which calculates the similarity between advertising content was shown in the said example, the similarity may be calculated with the feature information of advertisement content, and the feature information of LP.

〔4−2.学習〕
また、広告装置100は、抽出したキーワードが新規LPに紐づけられた後に、新規LPをリンク先とする広告コンテンツが何回表示されたか、などの結果を取得してもよい。すなわち、広告装置100は、広告コンテンツの表示回数や、ユーザから広告コンテンツがクリックされた回数などを取得する。言い換えれば、広告装置100は、抽出したキーワードを広告主が入札キーワードとした場合の効果を測定する。そして、広告装置100は、取得したCTRや、CVRなどの指標をさらに用いて、上記抽出処理に利用してもよい。このように、広告装置100は、抽出したキーワードによる広告効果などの結果を測定し、かかる結果が反映された学習モデルにより、キーワードを抽出してもよい。これにより、広告装置100は、処理を繰り返すことにより、よりユーザから検索されやすく広告効果を向上させやすいキーワードを抽出することができる。このため、広告装置100は、広告コンテンツの広告効果をより高めることができる。
[4-2. Learning)
Further, after the extracted keyword is associated with the new LP, the advertising device 100 may acquire a result such as how many times the advertising content with the new LP as a link destination is displayed. That is, the advertising device 100 acquires the number of times the advertising content is displayed, the number of times the advertising content is clicked by the user, and the like. In other words, the advertising device 100 measures the effect when the advertiser uses the extracted keyword as a bid keyword. Then, the advertising device 100 may further use the acquired index, such as CTR or CVR, for the extraction process. As described above, the advertising device 100 may measure a result such as an advertisement effect by the extracted keyword, and may extract the keyword by a learning model in which the result is reflected. Thereby, the advertising device 100 can extract keywords that are more easily searched by the user and can improve the advertising effect by repeating the processing. For this reason, the advertising device 100 can further enhance the advertising effect of the advertising content.

〔4−3.広告主〕
上記実施形態において、広告主は、広告主端末20を用いて、広告装置100に広告コンテンツを入稿する例を示した。しかし、広告主は、自ら広告装置100に広告コンテンツを入稿せずに、かかる処理を代理店に依頼する場合もある。この場合、広告装置100にかかる処理をするのは代理店となる。すなわち、「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主端末」といった表記は、広告主端末20だけでなく代理店によって利用される代理店端末を含む概念であるものとする。
[4-3. Advertiser)
In the above embodiment, the advertiser has shown an example in which the advertising content is submitted to the advertising device 100 using the advertiser terminal 20. However, the advertiser may request such processing from the agency without submitting the advertising content to the advertising device 100 itself. In this case, it is an agency that performs the processing related to the advertising device 100. That is, the notation “advertiser” is a concept including not only the advertiser but also the agency, and the notation “advertiser terminal” includes not only the advertiser terminal 20 but also the agency terminal used by the agency. It is assumed to be a concept.

〔4−4.広告配信〕
また、配信部137は、広告コンテンツの配信において、同じ入札キーワードに紐づく広告コンテンツが複数ある場合には、入札キーワードの入札価格が高い広告主や、CTRの高い広告コンテンツや、入札価格及びCTRの双方が高い広告コンテンツを優先して選択するようにしてもよい。そして、配信部137は、選択した広告コンテンツをユーザ端末10に配信する。
[4-4. (Advertisement delivery)
In addition, when there are a plurality of advertisement contents associated with the same bid keyword in the distribution of the advertisement content, the distribution unit 137 displays an advertiser with a high bid price of the bid keyword, an advertisement content with a high CTR, a bid price and a CTR. It is also possible to preferentially select advertising content that is both high. Then, the distribution unit 137 distributes the selected advertisement content to the user terminal 10.

〔4−5.他の用途〕
上記実施形態において、広告装置100は、検索連動型の広告配信サービスにおける入札キーワードを抽出する例を示した。しかし、広告装置100は、上記のような検索連動型以外の広告配信に利用されてもよい。例えば、広告装置100は、キーワードに対する入札を受け付け、かかるキーワードと親和性の高い内容のウェブページに広告コンテンツを配信するような、いわゆる広告コンテンツマッチ型の広告サービスに利用されてもよい。
[4-5. Other uses)
In the above embodiment, the advertising device 100 has shown an example in which bid keywords are extracted in a search-linked advertisement distribution service. However, the advertising device 100 may be used for advertisement distribution other than the search-linked type as described above. For example, the advertising device 100 may be used for a so-called advertising content matching type advertising service that accepts bids for keywords and distributes the advertising content to web pages having high affinity with the keywords.

また、上記実施形態において、第1コンテンツ及び第2コンテンツの一例としてLP又は広告コンテンツを挙げ、キーワードの一例として入札キーワードを例に挙げて説明した。しかし、広告装置100は、LP又は広告コンテンツに紐づく入札キーワードを抽出するのみならず、他の用途として利用されてもよい。例えば、広告装置100は、所定のテキスト文書の特徴情報に基づいて、テキスト文書同士の類似度を算出し、テキスト文書に関連するキーワードを抽出するというような、あるドキュメントに関連するキーワード抽出のアシストを実行する装置であってもよい。すなわち、第1コンテンツ及び第2コンテンツは、任意の単語を含む文書のようなコンテンツであればよい。   Moreover, in the said embodiment, LP or advertisement content was mentioned as an example of 1st content and 2nd content, and the bid keyword was mentioned as an example as an example of a keyword. However, the advertising device 100 may be used not only for extracting bid keywords associated with LPs or advertising content but also for other purposes. For example, the advertising device 100 calculates keyword similarities between text documents based on feature information of a predetermined text document, and extracts keywords related to the text document. It may be a device that executes That is, the first content and the second content may be content such as a document including an arbitrary word.

また、本願に係る抽出装置が検索サーバ30に対応する場合、検索サーバ30は、検索結果ページ50に検索クエリのアシストとなるキーワードを表示してもよい。すなわち、検索サーバ30は、所定のキーワードの特徴情報と、所定のウェブページの特徴情報との類似度を算出する。そして、検索サーバ30は、算出された類似度が所定の閾値以上である特徴情報に対応するキーワードを、所定のウェブページを検索するためのキーワードとして抽出する。この場合、検索サーバ30は、検索サービスを提供するウェブページにおいて、抽出されたキーワードを提示してもよい。ユーザは、提示されたキーワードに基づいて検索を実行することにより、効率よく目的のウェブページを検索できる場合がある。この場合、検索サーバ30は、検索サービスを実行する制御部に加え、上記実施形態に係る生成部132、算出部133、抽出部134及び提示部135に対応する各処理部を有する。   When the extraction apparatus according to the present application corresponds to the search server 30, the search server 30 may display a keyword that assists the search query on the search result page 50. That is, the search server 30 calculates the similarity between the feature information of a predetermined keyword and the feature information of a predetermined web page. Then, the search server 30 extracts a keyword corresponding to the feature information whose calculated similarity is greater than or equal to a predetermined threshold as a keyword for searching a predetermined web page. In this case, the search server 30 may present the extracted keyword on the web page that provides the search service. The user may be able to efficiently search for a target web page by executing a search based on the presented keyword. In this case, the search server 30 includes processing units corresponding to the generation unit 132, the calculation unit 133, the extraction unit 134, and the presentation unit 135 according to the above embodiment, in addition to the control unit that executes the search service.

〔4−6.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-6. Others]
In addition, among the processes described in the above embodiment, all or part of the processes described as being automatically performed can be performed manually, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the document and drawings can be arbitrarily changed unless otherwise specified. For example, the various types of information illustrated in each drawing is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Further, each component of each illustrated apparatus is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured.

例えば、図3に示したLP情報記憶部121やキーワード情報記憶部122は、広告装置100が保持せずに、図示しないストレージサーバ等が保持してもよい。この場合、広告装置100は、ストレージサーバからLP情報等を取得する。   For example, the LP information storage unit 121 and the keyword information storage unit 122 illustrated in FIG. 3 may be held by a storage server or the like (not shown) without being held by the advertising device 100. In this case, the advertising device 100 acquires LP information and the like from the storage server.

また、例えば、上記実施形態では、広告装置100が単語ベクトルを生成する例を示したが、単語ベクトルを生成する主体は、広告装置100と異なる所定のサーバ装置であってもよい。この場合、広告装置100は、所定のサーバ装置によって生成された単語ベクトルを取得し、取得した単語ベクトルを保持する。また、例えば、上述した広告装置100は、入稿受付部131と生成部132とを有する単語ベクトル生成装置と、算出部133と抽出部134とを有する抽出装置と、提示部135を有する提示装置と、要求受付部136と配信部137とを有する配信装置とに分散されてもよい。   Further, for example, in the above-described embodiment, an example in which the advertising device 100 generates a word vector has been described. However, the entity that generates the word vector may be a predetermined server device different from the advertising device 100. In this case, the advertising device 100 acquires a word vector generated by a predetermined server device and holds the acquired word vector. Further, for example, the advertising device 100 described above includes a word vector generation device having a submission receiving unit 131 and a generation unit 132, an extraction device having a calculation unit 133 and an extraction unit 134, and a presentation device having a presentation unit 135. And a distribution apparatus having a request reception unit 136 and a distribution unit 137.

〔5.ハードウェア構成〕
また、上述してきた実施形態に係る広告装置100は、例えば図9に示すような構成のコンピュータ1000によって実現される。以下、広告装置100を例に挙げて説明する。図9は、広告装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[5. Hardware configuration)
Further, the advertising device 100 according to the embodiment described above is realized by a computer 1000 having a configuration as shown in FIG. 9, for example. Hereinafter, the advertisement apparatus 100 will be described as an example. FIG. 9 is a hardware configuration diagram illustrating an example of a computer 1000 that implements the functions of the advertising device 100. The computer 1000 includes a CPU 1100, RAM 1200, ROM 1300, HDD 1400, communication interface (I / F) 1500, input / output interface (I / F) 1600, and media interface (I / F) 1700.

CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。   The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400 and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(ネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。   The HDD 1400 stores a program executed by the CPU 1100, data used by the program, and the like. The communication interface 1500 receives data from other devices via the communication network 500 (corresponding to the network N) and sends the data to the CPU 1100, and transmits data generated by the CPU 1100 to other devices via the communication network 500. .

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。   The CPU 1100 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the data generated via the input / output interface 1600 to the output device.

メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 1700 reads a program or data stored in the recording medium 1800 and provides it to the CPU 1100 via the RAM 1200. The CPU 1100 loads such a program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.

例えば、コンピュータ1000が実施形態に係る広告装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。   For example, when the computer 1000 functions as the advertising device 100 according to the embodiment, the CPU 1100 of the computer 1000 implements the function of the control unit 130 by executing a program loaded on the RAM 1200. The HDD 1400 stores data in the storage unit 120. The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them, but as another example, these programs may be acquired from other devices via the communication network 500.

〔6.効果〕
上述してきたように、実施形態に係る広告装置100は、算出部133と、抽出部134とを有する。算出部133は、キーワードに紐づけられた既存のLPの特徴情報と、任意の単語を含む新規LPの特徴情報との類似度を算出する。また、抽出部134は、算出部133によって算出された類似度が所定の閾値以上である特徴情報に対応するキーワードを抽出する。
[6. effect〕
As described above, the advertising device 100 according to the embodiment includes the calculation unit 133 and the extraction unit 134. The calculation unit 133 calculates the similarity between the existing LP feature information associated with the keyword and the new LP feature information including an arbitrary word. Further, the extraction unit 134 extracts a keyword corresponding to feature information whose similarity calculated by the calculation unit 133 is equal to or greater than a predetermined threshold.

このように、実施形態に係る広告装置100は、現時点で他の広告主が入札しており、効果が高いと想定されるキーワードであって、新規LPに特徴が類似する既存のLPに紐づくキーワードを抽出する。これにより、広告装置100によれば、ユーザが検索サービスを利用する際に、入札キーワードに紐づく広告コンテンツを表示させやすくすることができるので、広告コンテンツの広告効果を向上させることができる。   As described above, the advertising device 100 according to the embodiment is a keyword that is expected to be highly effective because other advertisers are currently bidding, and is associated with an existing LP that is similar in characteristics to the new LP. Extract keywords. Thereby, according to the advertising device 100, when the user uses the search service, it is possible to easily display the advertising content associated with the bid keyword, so that the advertising effect of the advertising content can be improved.

また、算出部133は、キーワードと既存のLPが紐づけられた複数の組み合わせのうち、当該キーワード毎の特徴情報として、当該キーワードに紐づけられた全ての既存のLPの特徴情報と、新規LPの特徴情報との類似度を算出する。   In addition, the calculation unit 133 includes, as the feature information for each keyword among the plurality of combinations in which the keyword and the existing LP are associated, the feature information of all the existing LPs associated with the keyword, and the new LP Similarity with the feature information is calculated.

このように、実施形態に係る広告装置100は、複数のキーワードとLPの組み合わせのうち、キーワード毎に類似度を算出する。これにより、広告装置100は、新規LPに対する適切なキーワードを抽出することができる。   As described above, the advertising device 100 according to the embodiment calculates the degree of similarity for each keyword among the combinations of the plurality of keywords and LP. Thereby, the advertising device 100 can extract an appropriate keyword for the new LP.

また、算出部133は、特徴情報として、キーワードに紐づけられた既存のLPに対応する単語ベクトルと、新規LPに対応する単語ベクトルとの類似度を算出する。   In addition, the calculation unit 133 calculates the similarity between the word vector corresponding to the existing LP linked to the keyword and the word vector corresponding to the new LP as the feature information.

これにより、実施形態に係る広告装置100は、任意の単語が含まれたLPなどのコンテンツの特徴を表すことができるので、新規LPの特徴を正確に捉えることができる。このため、広告装置100は、新規LPに対する適切なキーワードを抽出することができる。   Thereby, since the advertising device 100 according to the embodiment can express the feature of the content such as LP including an arbitrary word, the feature of the new LP can be accurately captured. For this reason, the advertising device 100 can extract an appropriate keyword for the new LP.

また、算出部133は、キーワードに紐づけられた既存のLPに対応する単語ベクトルと、新規LPに対応する単語ベクトルとのコサイン類似度を算出する。抽出部134は、算出部133によって算出されたコサイン類似度が所定の閾値以上の単語ベクトルに対応するキーワードを抽出する。   In addition, the calculation unit 133 calculates the cosine similarity between the word vector corresponding to the existing LP linked to the keyword and the word vector corresponding to the new LP. The extraction unit 134 extracts a keyword corresponding to a word vector whose cosine similarity calculated by the calculation unit 133 is equal to or greater than a predetermined threshold.

これにより、実施形態に係る広告装置100は、LPなどが含むテキストの傾向の類似性が数値で表現することができるので、的確に単語ベクトル同士の類似性を算出することができる。このため、広告装置100は、新規LPに対する適切なキーワードを抽出することができる。   Thereby, since the advertising device 100 according to the embodiment can express the similarity of the tendency of the text included in the LP or the like with a numerical value, the similarity between the word vectors can be accurately calculated. For this reason, the advertising device 100 can extract an appropriate keyword for the new LP.

また、算出部133は、キーワードに紐づけられた既存のLPが複数ある場合には、キーワードに紐づけられた複数の既存のLPに対応する各単語ベクトルの重心ベクトルと、新規LPに対応する単語ベクトルとの類似度を算出する。また、抽出部134は、算出部133によって算出された類似度が所定の閾値以上の重心ベクトルに対応するキーワードを抽出する。   In addition, when there are a plurality of existing LPs linked to the keyword, the calculation unit 133 corresponds to the centroid vector of each word vector corresponding to the plurality of existing LPs linked to the keyword and the new LP. The similarity with the word vector is calculated. Further, the extraction unit 134 extracts a keyword corresponding to a centroid vector whose similarity calculated by the calculation unit 133 is equal to or greater than a predetermined threshold.

これにより、実施形態に係る広告装置100は、他の広告主が入札キーワードとしている複数の既存のLPの特徴を平均化して捉えることができる。このため、広告装置100は、複数の既存のLPがキーワードに紐づく状況を加味して類似度を算出できるので、新規LPに対する適切なキーワードを抽出することができる。   Thereby, the advertising device 100 according to the embodiment can average and grasp the characteristics of a plurality of existing LPs that other advertisers have set as bid keywords. For this reason, since the advertising device 100 can calculate the degree of similarity in consideration of a situation where a plurality of existing LPs are associated with keywords, it is possible to extract an appropriate keyword for the new LP.

また、実施形態に係る広告装置100は、キーワードに紐づけられた既存のLPに対応する単語ベクトル、キーワードに紐づけられた複数の既存のLPに対応する各単語ベクトルの重心ベクトル及び新規LPに対応する単語ベクトルの少なくとも一つを生成する生成部132をさらに備える。算出部133は、生成部132によって生成された単語ベクトルの少なくとも一つを用いて類似度を算出する。   In addition, the advertising device 100 according to the embodiment includes a word vector corresponding to an existing LP linked to a keyword, a centroid vector of each word vector corresponding to a plurality of existing LPs linked to the keyword, and a new LP. A generation unit 132 that generates at least one of the corresponding word vectors is further provided. The calculation unit 133 calculates the similarity using at least one of the word vectors generated by the generation unit 132.

これにより、実施形態に係る広告装置100は、LPなどコンテンツの特徴を捉えた特徴情報を用いて、それぞれのコンテンツの類似度を算出することができる。   Thereby, the advertising device 100 according to the embodiment can calculate the similarity of each content using the feature information such as LP that captures the feature of the content.

また、生成部132は、既存のLP又は新規LPに対応する単語ベクトルについて、既存のLP又は新規LP内の全ての単語の出現回数の総和、所定の単語が出現する回数及び該所定の単語がキーワードと紐づく頻度に基づいて、所定の単語毎に重み付けがされた単語ベクトルを生成する。   In addition, the generation unit 132 adds, for a word vector corresponding to an existing LP or a new LP, the total number of appearances of all the words in the existing LP or the new LP, the number of occurrences of the predetermined word, and the predetermined word A word vector weighted for each predetermined word is generated based on the frequency associated with the keyword.

これにより、実施形態に係る広告装置100は、適切な重みが付与された単語ベクトルを生成することができる。このため、広告装置100によれば、信頼性の高い類似度を算出することができるので、新規LPに対する適切なキーワードを抽出することができる。   Thereby, the advertising device 100 according to the embodiment can generate a word vector to which an appropriate weight is given. For this reason, according to the advertising device 100, since a highly reliable similarity can be calculated, an appropriate keyword for a new LP can be extracted.

また、算出部133は、第1コンテンツとして、広告主が入稿する広告コンテンツ若しくは広告コンテンツのリンク先となるウェブページ(すなわち、既存のLP)を用い、キーワードとして、広告主が入札する検索クエリである入札キーワードを用い、第2コンテンツとして、第1コンテンツに対応するコンテンツとは異なるコンテンツ(例えば、新規LP)を用いて類似度を算出する。   In addition, the calculation unit 133 uses the advertisement content submitted by the advertiser or the web page (that is, the existing LP) linked to the advertisement content as the first content, and the search query that the advertiser bids as the keyword. The bid keyword is used, and the degree of similarity is calculated using a content (for example, a new LP) different from the content corresponding to the first content as the second content.

これにより、実施形態に係る広告装置100は、検索連動型の広告配信サービスにおいて、新規LPに紐づけるキーワードを適切に抽出することができる。   Thereby, the advertising device 100 according to the embodiment can appropriately extract the keyword associated with the new LP in the search-linked advertisement distribution service.

また、算出部133は、既存のLPに紐づくキーワードがユーザから入力された回数、既存のLPをリンク先とする広告コンテンツがユーザから選択された回数又は広告コンテンツが表示されることで広告主が得た利益に関する情報の少なくとも一つに基づいて類似度を算出する。   In addition, the calculation unit 133 displays the number of times a keyword associated with an existing LP is input from the user, the number of times that the advertisement content that links to the existing LP is selected by the user, or the advertisement content is displayed. The similarity is calculated on the basis of at least one of the information on the profit obtained.

これにより、実施形態に係る広告装置100は、現状の広告効果を踏まえたうえで、既存のLPと新規LPの特徴情報の類似度を算出することができる。このため、広告装置100は、現状に則した、適切なキーワードを抽出することができる。   Thereby, the advertising device 100 according to the embodiment can calculate the similarity between the feature information of the existing LP and the new LP based on the current advertising effect. For this reason, the advertising device 100 can extract an appropriate keyword in accordance with the current situation.

また、実施形態に係る広告装置100は、新規LPに紐づかせるキーワードとして、抽出部134によって抽出されたキーワードを新規LPの提供主に提示する提示部135をさらに備える。   In addition, the advertising device 100 according to the embodiment further includes a presentation unit 135 that presents the keyword extracted by the extraction unit 134 to the provider of the new LP as a keyword associated with the new LP.

これにより、実施形態に係る広告装置100は、新規LPの提供主である広告主に、入札すべき適切なキーワードを提示することができる。このため、広告装置100によれば、広告主は、入札すべき適切なキーワードを知ることができる。また、広告配信サービスの管理者側は、広告主から入札されるキーワードが増えることにより、入札の促進につながり、サービスの活性化を図ることができる。   Thereby, the advertising device 100 according to the embodiment can present an appropriate keyword to be bid to an advertiser who is a provider of a new LP. Therefore, according to the advertising device 100, the advertiser can know an appropriate keyword to be bid. Further, the manager of the advertisement distribution service can promote bidding by increasing the number of keywords bid by the advertiser, and can activate the service.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail based on the drawings. It is possible to implement the present invention in other forms with improvements.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、算出部は、算出手段や算出回路に読み替えることができる。   In addition, the “section (module, unit)” described above can be read as “means” or “circuit”. For example, the calculation unit can be read as calculation means or a calculation circuit.

1 抽出システム
10 ユーザ端末
20 広告主端末
30 検索サーバ
100 広告装置
110 通信部
120 記憶部
121 LP情報記憶部
122 キーワード情報記憶部
130 制御部
131 入稿受付部
132 生成部
133 算出部
134 抽出部
135 提示部
136 要求受付部
137 配信部
DESCRIPTION OF SYMBOLS 1 Extraction system 10 User terminal 20 Advertiser terminal 30 Search server 100 Advertising apparatus 110 Communication part 120 Storage part 121 LP information storage part 122 Keyword information storage part 130 Control part 131 Submission acceptance part 132 Generation part 133 Calculation part 134 Extraction part 135 Presentation section 136 Request reception section 137 Distribution section

Claims (12)

キーワードに紐づけられた第1コンテンツの特徴情報と、任意の単語を含む第2コンテンツの特徴情報との類似度を算出する算出部と、
前記キーワードのうち、前記算出部によって算出された類似度が所定の閾値以上である特徴情報に対応するキーワードを抽出する抽出部と、
を備えたことを特徴とする抽出装置。
A calculation unit that calculates the similarity between the feature information of the first content linked to the keyword and the feature information of the second content including an arbitrary word;
An extraction unit that extracts a keyword corresponding to feature information having a similarity calculated by the calculation unit equal to or greater than a predetermined threshold among the keywords;
An extraction device comprising:
前記算出部は、
前記キーワードと前記第1コンテンツとが紐づけられた複数の組み合わせのうち、当該キーワード毎に、当該キーワードに紐づけられた全ての前記第1コンテンツの特徴情報と、前記第2コンテンツの特徴情報との類似度を算出し、
前記抽出部は、
前記算出部によって算出された前記キーワードの特徴情報と前記第2コンテンツの特徴情報との類似度が所定の閾値以上である特徴情報に対応するキーワードを抽出する、
ことを特徴とする請求項1に記載の抽出装置。
The calculation unit includes:
Of the plurality of combinations in which the keyword and the first content are linked, for each keyword, the feature information of all the first content linked to the keyword and the feature information of the second content The similarity of
The extraction unit includes:
Extracting a keyword corresponding to feature information whose similarity between the feature information of the keyword calculated by the calculation unit and the feature information of the second content is equal to or greater than a predetermined threshold;
The extraction device according to claim 1.
前記算出部は、
前記特徴情報として、前記キーワードに紐づけられた第1コンテンツに対応する単語ベクトルと、前記第2コンテンツに対応する単語ベクトルとを用いて前記類似度を算出し、
前記抽出部は、
前記類似度が所定の閾値以上である前記単語ベクトルに対応するキーワードを抽出する、
ことを特徴とする請求項1又は2に記載の抽出装置。
The calculation unit includes:
The similarity is calculated using the word vector corresponding to the first content associated with the keyword and the word vector corresponding to the second content as the feature information,
The extraction unit includes:
Extracting a keyword corresponding to the word vector whose similarity is equal to or greater than a predetermined threshold;
The extraction apparatus according to claim 1 or 2, wherein
前記算出部は、
前記キーワードに紐づけられた第1コンテンツに対応する単語ベクトルと、前記第2コンテンツに対応する単語ベクトルとのコサイン類似度を算出し、
前記抽出部は、
前記コサイン類似度が所定の閾値以上である前記単語ベクトルに対応するキーワードを抽出する、
ことを特徴とする請求項3に記載の抽出装置。
The calculation unit includes:
Calculating a cosine similarity between a word vector corresponding to the first content linked to the keyword and a word vector corresponding to the second content;
The extraction unit includes:
Extracting a keyword corresponding to the word vector whose cosine similarity is greater than or equal to a predetermined threshold;
The extraction device according to claim 3.
前記算出部は、
前記キーワードに紐づけられた第1コンテンツが複数ある場合には、前記キーワードに紐づけられた複数の第1コンテンツに対応する各単語ベクトルの重心ベクトルと、前記第2コンテンツに対応する単語ベクトルとの類似度を算出し、
前記抽出部は、
前記類似度が所定の閾値以上である前記重心ベクトルに対応するキーワードを抽出する、
ことを特徴とする請求項3又は4に記載の抽出装置。
The calculation unit includes:
When there are a plurality of first contents associated with the keyword, a centroid vector of each word vector corresponding to the plurality of first contents associated with the keyword, and a word vector corresponding to the second content, The similarity of
The extraction unit includes:
Extracting a keyword corresponding to the centroid vector whose similarity is equal to or greater than a predetermined threshold;
The extraction device according to claim 3 or 4, characterized in that.
前記キーワードに紐づけられた第1コンテンツに対応する単語ベクトル、前記キーワードに紐づけられた複数の第1コンテンツに対応する各単語ベクトルの重心ベクトル及び前記第2コンテンツに対応する単語ベクトルの少なくとも一つを生成する生成部、
をさらに備え、
前記算出部は、
前記生成部によって生成された前記単語ベクトルの少なくとも一つを用いて、前記類似度を算出する、
ことを特徴とする請求項3〜5のいずれか一つに記載の抽出装置。
At least one of a word vector corresponding to the first content linked to the keyword, a centroid vector of each word vector corresponding to the plurality of first contents linked to the keyword, and a word vector corresponding to the second content Generating unit for generating
Further comprising
The calculation unit includes:
Calculating the similarity using at least one of the word vectors generated by the generation unit;
The extraction device according to any one of claims 3 to 5, wherein
前記生成部は、
前記第1コンテンツ又は前記第2コンテンツに対応する単語ベクトルについて、該第1コンテンツ又は該第2コンテンツ内の全ての単語の出現回数の総和、所定の単語が出現する回数及び該所定の単語が前記キーワードと紐づく頻度に基づいて、該所定の単語毎に重み付けがされた前記単語ベクトルを生成する、
ことを特徴とする請求項6に記載の抽出装置。
The generator is
For a word vector corresponding to the first content or the second content, the sum of the number of appearances of all words in the first content or the second content, the number of times a predetermined word appears, and the predetermined word are Generating the word vector weighted for each predetermined word based on the frequency associated with the keyword;
The extraction apparatus according to claim 6.
前記算出部は、
前記第1コンテンツとして、広告主が入稿する広告コンテンツ若しくは前記広告コンテンツのリンク先となるウェブページを用い、前記キーワードとして、広告主が入札する検索クエリである入札キーワードを用い、前記第2コンテンツとして、前記第1コンテンツに対応するコンテンツとは異なるコンテンツを用いて、前記類似度を算出する、
ことを特徴とする請求項1〜7のいずれか一つに記載の抽出装置。
The calculation unit includes:
As the first content, an advertising content submitted by an advertiser or a web page linked to the advertising content is used, and as the keyword, a bid keyword which is a search query bid by the advertiser is used, and the second content is used. And calculating the similarity using content different from the content corresponding to the first content,
The extraction device according to any one of claims 1 to 7, wherein
前記算出部は、
前記第1コンテンツに紐づくキーワードがユーザから入力された回数、前記第1コンテンツがユーザから選択された回数又は前記第1コンテンツが表示されることで前記第1コンテンツの提供主が得た利益に関する情報の少なくとも一つに基づいて、前記類似度を算出する、
ことを特徴とする請求項1〜8のいずれか一つに記載の抽出装置。
The calculation unit includes:
The number of times a keyword associated with the first content is input by the user, the number of times the first content is selected by the user, or the profit obtained by the provider of the first content by displaying the first content Calculating the similarity based on at least one of the information;
The extraction device according to any one of claims 1 to 8, wherein
前記第2コンテンツに紐づかせるキーワードとして、前記抽出部によって抽出されたキーワードを該第2コンテンツの提供主に提示する提示部、
をさらに備えたことを特徴とする請求項1〜9のいずれか一つに記載の抽出装置。
A presenting unit that presents the keyword extracted by the extracting unit to a provider of the second content as a keyword associated with the second content;
The extraction device according to claim 1, further comprising:
コンピュータが実行する抽出方法であって、
キーワードに紐づけられた第1コンテンツの特徴情報と、任意の単語を含む第2コンテンツの特徴情報との類似度を算出する算出工程と、
前記算出工程によって算出された類似度が所定の閾値以上の前記特徴情報に対応するキーワードを抽出する抽出工程と、
を含んだことを特徴とする抽出方法。
An extraction method performed by a computer,
A calculation step of calculating the similarity between the feature information of the first content linked to the keyword and the feature information of the second content including an arbitrary word;
An extraction step of extracting a keyword corresponding to the feature information whose similarity calculated by the calculation step is equal to or greater than a predetermined threshold;
The extraction method characterized by including.
キーワードに紐づけられた第1コンテンツの特徴情報と、任意の単語を含む第2コンテンツの特徴情報との類似度を算出する算出手順と、
前記算出手順によって算出された類似度が所定の閾値以上の前記特徴情報に対応するキーワードを抽出する抽出手順と、
をコンピュータに実行させることを特徴とする抽出プログラム。
A calculation procedure for calculating the similarity between the feature information of the first content linked to the keyword and the feature information of the second content including an arbitrary word;
An extraction procedure for extracting a keyword corresponding to the feature information whose similarity calculated by the calculation procedure is equal to or greater than a predetermined threshold;
An extraction program characterized by causing a computer to execute.
JP2014173955A 2014-08-28 2014-08-28 Extraction apparatus, extraction method and extraction program Active JP6100741B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014173955A JP6100741B2 (en) 2014-08-28 2014-08-28 Extraction apparatus, extraction method and extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014173955A JP6100741B2 (en) 2014-08-28 2014-08-28 Extraction apparatus, extraction method and extraction program

Publications (2)

Publication Number Publication Date
JP2016048526A true JP2016048526A (en) 2016-04-07
JP6100741B2 JP6100741B2 (en) 2017-03-22

Family

ID=55649368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014173955A Active JP6100741B2 (en) 2014-08-28 2014-08-28 Extraction apparatus, extraction method and extraction program

Country Status (1)

Country Link
JP (1) JP6100741B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168954A (en) * 2017-05-18 2017-09-15 北京奇艺世纪科技有限公司 Text key word generation method and device and electronic equipment and readable storage medium storing program for executing
CN112988971A (en) * 2021-03-15 2021-06-18 平安科技(深圳)有限公司 Word vector-based search method, terminal, server and storage medium

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272390A (en) * 2006-03-30 2007-10-18 Sony Corp Resource management device, tag candidate selection method and tag candidate selection program
JP2008310626A (en) * 2007-06-15 2008-12-25 Nippon Telegr & Teleph Corp <Ntt> Automatic tag impartment device, automatic tag impartment method, automatic tag impartment program and recording medium recording the program
JP2009032292A (en) * 2008-11-10 2009-02-12 Nec Corp Document retrieval device, retrieval method, and program
JP2010026792A (en) * 2008-07-18 2010-02-04 Yahoo Japan Corp Server, method and program for storing information about delivered advertising
WO2010045376A1 (en) * 2008-10-14 2010-04-22 Ebay Inc. A method and system for keyword bidding
WO2010120699A2 (en) * 2009-04-16 2010-10-21 Evri Inc. Enhanced advertisement targeting
JP2010267001A (en) * 2009-05-13 2010-11-25 Digital Advertising Consortium Inc Advertisement support system and advertisement support method
US20110191175A1 (en) * 1999-09-22 2011-08-04 Google Inc. Determining a Meaning of a Knowledge Item Using Document Based Information
US20110258054A1 (en) * 2010-04-19 2011-10-20 Sandeep Pandey Automatic Generation of Bid Phrases for Online Advertising
WO2014073231A1 (en) * 2012-11-12 2014-05-15 富士ゼロックス株式会社 Attribute information assignment program and attribute information assignment device

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110191175A1 (en) * 1999-09-22 2011-08-04 Google Inc. Determining a Meaning of a Knowledge Item Using Document Based Information
JP2007272390A (en) * 2006-03-30 2007-10-18 Sony Corp Resource management device, tag candidate selection method and tag candidate selection program
JP2008310626A (en) * 2007-06-15 2008-12-25 Nippon Telegr & Teleph Corp <Ntt> Automatic tag impartment device, automatic tag impartment method, automatic tag impartment program and recording medium recording the program
JP2010026792A (en) * 2008-07-18 2010-02-04 Yahoo Japan Corp Server, method and program for storing information about delivered advertising
WO2010045376A1 (en) * 2008-10-14 2010-04-22 Ebay Inc. A method and system for keyword bidding
JP2009032292A (en) * 2008-11-10 2009-02-12 Nec Corp Document retrieval device, retrieval method, and program
WO2010120699A2 (en) * 2009-04-16 2010-10-21 Evri Inc. Enhanced advertisement targeting
JP2010267001A (en) * 2009-05-13 2010-11-25 Digital Advertising Consortium Inc Advertisement support system and advertisement support method
US20110258054A1 (en) * 2010-04-19 2011-10-20 Sandeep Pandey Automatic Generation of Bid Phrases for Online Advertising
WO2014073231A1 (en) * 2012-11-12 2014-05-15 富士ゼロックス株式会社 Attribute information assignment program and attribute information assignment device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168954A (en) * 2017-05-18 2017-09-15 北京奇艺世纪科技有限公司 Text key word generation method and device and electronic equipment and readable storage medium storing program for executing
CN112988971A (en) * 2021-03-15 2021-06-18 平安科技(深圳)有限公司 Word vector-based search method, terminal, server and storage medium

Also Published As

Publication number Publication date
JP6100741B2 (en) 2017-03-22

Similar Documents

Publication Publication Date Title
JP6271345B2 (en) Extraction apparatus, extraction method, and extraction program
JP7311554B2 (en) Calculation device, calculation method and calculation program
JP5462972B2 (en) Information processing apparatus, information processing method, and information processing program
JP6023129B2 (en) Extraction apparatus, extraction method, and extraction program
JP6235443B2 (en) Extraction apparatus, extraction method and extraction program
JPWO2017158798A1 (en) Information processing apparatus, information distribution system, information processing method, and information processing program
JP6698730B2 (en) Extraction device, extraction method, and extraction program
JP2016062358A (en) Extractor, and method and program for extraction
JP6100741B2 (en) Extraction apparatus, extraction method and extraction program
JP6373140B2 (en) Extraction apparatus, extraction method, and extraction program
JP6311052B1 (en) Extraction apparatus, extraction method, and extraction program
JP2017091054A (en) Advertising system and advertisement distributing method
JP6282965B2 (en) Reception device, reception method, and reception program
JP6355151B2 (en) Offering system, offering method and program
JP6072739B2 (en) Extraction apparatus, extraction method and extraction program
JP5968381B2 (en) Extraction apparatus, extraction method and extraction program
JP6007300B1 (en) Calculation device, calculation method, and calculation program
JP6541521B2 (en) Generation device, generation method, generation program, determination device, determination method, and determination program
JP6240049B2 (en) Extraction apparatus, extraction method and extraction program
JP6921922B2 (en) Information processing equipment, information processing methods, and information processing programs
JP6961653B2 (en) Extractor, extraction method and extraction program
JP6664600B2 (en) Provision device, provision method and provision program
JP6310509B2 (en) Extraction apparatus, extraction method and extraction program
JP2018136720A (en) Distribution system, distribution method and distribution program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170223

R150 Certificate of patent or registration of utility model

Ref document number: 6100741

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250