JP6235443B2 - Extraction apparatus, extraction method and extraction program - Google Patents

Extraction apparatus, extraction method and extraction program Download PDF

Info

Publication number
JP6235443B2
JP6235443B2 JP2014189479A JP2014189479A JP6235443B2 JP 6235443 B2 JP6235443 B2 JP 6235443B2 JP 2014189479 A JP2014189479 A JP 2014189479A JP 2014189479 A JP2014189479 A JP 2014189479A JP 6235443 B2 JP6235443 B2 JP 6235443B2
Authority
JP
Japan
Prior art keywords
keyword
extraction
content
advertiser
search query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014189479A
Other languages
Japanese (ja)
Other versions
JP2016062275A (en
Inventor
塚本 浩司
浩司 塚本
堀田 徹
徹 堀田
幸 藤田
幸 藤田
田中 祐介
祐介 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014189479A priority Critical patent/JP6235443B2/en
Publication of JP2016062275A publication Critical patent/JP2016062275A/en
Application granted granted Critical
Publication of JP6235443B2 publication Critical patent/JP6235443B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、抽出装置、抽出方法および抽出プログラムに関する。   The present invention relates to an extraction apparatus, an extraction method, and an extraction program.

インターネット上には膨大な情報が開示されており、ユーザは、知りたい情報を探す際には検索サイトを利用する場合が多い。かかる検索サイトでは、検索マッチング広告や検索連動広告と呼ばれる広告配信が行われることがある。   Enormous amounts of information are disclosed on the Internet, and users often use search sites when searching for information they want to know. In such a search site, advertisement distribution called search matching advertisement or search-linked advertisement may be performed.

この種の広告配信において、広告主が広告の入稿時に一又は二以上の広告関連キーワードを指定する技術が知られている。この技術では、広告関連キーワードがユーザから検索キーワードとして入力された場合に、検索キーワードに応じた検索結果に隣接させて、広告関連キーワードに関連する広告を表示する。   In this type of advertisement distribution, a technique is known in which an advertiser designates one or more advertisement-related keywords when submitting an advertisement. In this technique, when an advertisement-related keyword is input as a search keyword from a user, an advertisement related to the advertisement-related keyword is displayed adjacent to a search result corresponding to the search keyword.

特開2010−211777号公報JP 2010-211777 A

しかしながら、上記の従来技術では、コンテンツの訴求効果を高めるキーワードを抽出することができるとは限らない。具体的には、上記の従来技術では、入稿されたコンテンツである広告に対して広告主が適切に広告関連キーワードを指定する手法については開示されていない。そして、検索連動型の広告配信においては、広告関連キーワードが適切に指定されなければ、適切な広告を配信することができない。これにより、配信される広告の訴求効果が十分に発揮されないおそれがある。   However, with the above-described conventional technology, it is not always possible to extract keywords that enhance the appeal effect of content. Specifically, the above-described conventional technology does not disclose a method in which an advertiser appropriately specifies an advertisement-related keyword for an advertisement that is a submitted content. In search-linked advertisement distribution, appropriate advertisements cannot be distributed unless advertisement-related keywords are appropriately specified. Thereby, there exists a possibility that the appeal effect of the advertisement distributed may not fully be exhibited.

なお、上記では、コンテンツとして広告を例に挙げ、訴求効果を高めることができるとは限らない点について説明した。しかし、広告目的以外のコンテンツにおいても同様に、訴求効果を高めることができるとは限らない。すなわち、上記のような検索連動型の広告配信の例に限られず、キーワードに関連するコンテンツを配信する技術分野においては、キーワードが適切に指定されなければ、適切なコンテンツを配信することができず、コンテンツの訴求効果を高めることができるとは限らない。   In the above, an advertisement is taken as an example of the content, and the point that the appeal effect cannot always be improved has been described. However, it is not always possible to increase the appeal effect for content other than advertising purposes. In other words, the present invention is not limited to the example of search-linked advertisement delivery as described above. In the technical field of delivering content related to a keyword, appropriate content cannot be delivered unless the keyword is appropriately specified. , It is not always possible to increase the appeal of the content.

本願は、上記に鑑みてなされたものであって、コンテンツの訴求効果を高めるキーワードを抽出することができる抽出装置、抽出方法及び抽出プログラムを提供することを目的とする。   The present application has been made in view of the above, and an object thereof is to provide an extraction device, an extraction method, and an extraction program capable of extracting a keyword that enhances the appeal effect of content.

本願に係る抽出装置は、コンテンツに紐づかせるキーワードとしての評価値を算定し、算定した前記評価値に基づいて前記キーワードを抽出する抽出モデルであって、互いに異なる手法を用いて前記評価値を算定する前記抽出モデル毎に、前記抽出モデルによって所定の条件に適合するキーワードが抽出された度合いに基づいて、前記抽出モデル毎の指標値を算出する算出部と、前記算出部によって算出された指標値により重み付けされた前記抽出モデルが算定する前記評価値に基づいて、前記コンテンツに紐づかせるキーワード、又は、前記コンテンツを抽出させるためのキーワードを抽出する抽出部と、を備えたことを特徴とする。   The extraction apparatus according to the present application is an extraction model that calculates an evaluation value as a keyword to be linked to content, and extracts the keyword based on the calculated evaluation value, and uses the different methods to calculate the evaluation value. For each of the extraction models to be calculated, a calculation unit that calculates an index value for each of the extraction models based on the degree to which a keyword that meets a predetermined condition is extracted by the extraction model, and an index calculated by the calculation unit An extraction unit for extracting a keyword associated with the content or a keyword for extracting the content based on the evaluation value calculated by the extraction model weighted by a value, To do.

実施形態の一態様によれば、コンテンツの訴求効果を高めるキーワードを抽出することができるという効果を奏する。   According to one aspect of the embodiment, it is possible to extract a keyword that enhances the appeal effect of the content.

図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。FIG. 1 is a diagram illustrating an example of a web page on which advertisement content according to the embodiment is displayed. 図2は、実施形態に係る抽出処理の一例を示す図である。FIG. 2 is a diagram illustrating an example of the extraction process according to the embodiment. 図3は、実施形態に係る広告装置の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of the advertising device according to the embodiment. 図4は、実施形態に係る第1テーブルの一例を示す図である。FIG. 4 is a diagram illustrating an example of the first table according to the embodiment. 図5は、実施形態に係る第2テーブルAの一例を示す図である。FIG. 5 is a diagram illustrating an example of the second table A according to the embodiment. 図6は、実施形態に係る第2テーブルBの一例を示す図である。FIG. 6 is a diagram illustrating an example of the second table B according to the embodiment. 図7は、実施形態に係る第3テーブルの一例を示す図である。FIG. 7 is a diagram illustrating an example of a third table according to the embodiment. 図8は、実施形態に係る広告情報記憶部の一例を示す図である。FIG. 8 is a diagram illustrating an example of the advertisement information storage unit according to the embodiment. 図9は、実施形態に係る第1抽出モデルによる抽出処理の一例を示す概念図である。FIG. 9 is a conceptual diagram illustrating an example of extraction processing by the first extraction model according to the embodiment. 図10は、実施形態に係る第2抽出モデルによる算定処理の一例を示す概念図である。FIG. 10 is a conceptual diagram illustrating an example of calculation processing using the second extraction model according to the embodiment. 図11は、実施形態に係る第2抽出モデルによる抽出処理の一例を示す概念図である。FIG. 11 is a conceptual diagram illustrating an example of extraction processing by the second extraction model according to the embodiment. 図12は、実施形態に係る第3抽出モデルによる抽出処理の一例を示す概念図である。FIG. 12 is a conceptual diagram illustrating an example of extraction processing by the third extraction model according to the embodiment. 図13は、実施形態に係る算出部による算出処理の一例を示す概念図である。FIG. 13 is a conceptual diagram illustrating an example of calculation processing by the calculation unit according to the embodiment. 図14は、実施形態に係る広告装置による算出処理手順を示すフローチャートである。FIG. 14 is a flowchart illustrating a calculation processing procedure performed by the advertising device according to the embodiment. 図15は、実施形態に係る広告装置による抽出処理手順を示すフローチャートである。FIG. 15 is a flowchart illustrating an extraction processing procedure performed by the advertising device according to the embodiment. 図16は、変形例に係る広告装置による算出処理の一例を示す図である。FIG. 16 is a diagram illustrating an example of calculation processing by the advertising device according to the modification. 図17は、広告装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 17 is a hardware configuration diagram illustrating an example of a computer that realizes the function of the advertising device.

以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。   Hereinafter, a mode for carrying out an extraction apparatus, an extraction method, and an extraction program according to the present application (hereinafter referred to as “embodiment”) will be described in detail with reference to the drawings. Note that the extraction apparatus, the extraction method, and the extraction program according to the present application are not limited to the embodiment. Moreover, in the following embodiment, the same code | symbol is attached | subjected to the same site | part and the overlapping description is abbreviate | omitted.

〔1.抽出処理〕
以下では、図1及び図2を用いて、実施形態に係る抽出処理の一例について説明する。図1及び図2では、本願に係る抽出装置に対応する広告装置100によって配信処理及び抽出処理が行われる例を示す。まず、図1を用いて、実施形態に係る広告配信の一例を説明する。図1は、実施形態に係る広告コンテンツが表示されるウェブページの一例を示す図である。
[1. (Extraction process)
Below, an example of the extraction process which concerns on embodiment is demonstrated using FIG.1 and FIG.2. 1 and 2 show an example in which distribution processing and extraction processing are performed by the advertising device 100 corresponding to the extraction device according to the present application. First, an example of advertisement distribution according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of a web page on which advertisement content according to the embodiment is displayed.

図1には、実施形態に係る広告コンテンツが表示されるウェブページとして、ユーザ端末10に表示される検索結果ページ50を示す。検索結果ページ50は、ユーザから入力される検索クエリに基づいて検索されたウェブページに関する情報が表示されるウェブページである。   FIG. 1 shows a search result page 50 displayed on the user terminal 10 as a web page on which advertisement content according to the embodiment is displayed. The search result page 50 is a web page on which information related to a web page searched based on a search query input from a user is displayed.

図1に示すように、検索結果ページ50には、検索クエリ入力部52が含まれる。検索結果ページ50を利用するユーザは、ユーザ端末10を介して、検索クエリ入力部52に検索クエリを入力する。図1では、ユーザが検索クエリ入力部52に入力した「英会話教室」という検索クエリに基づいて、検索結果ページ50に検索結果が表示される例を示す。すなわち、検索結果ページ50には、検索結果として、「英会話教室」に関連のあるウェブページのリンク等の情報が表示される。   As shown in FIG. 1, the search result page 50 includes a search query input unit 52. A user who uses the search result page 50 inputs a search query to the search query input unit 52 via the user terminal 10. FIG. 1 shows an example in which a search result is displayed on the search result page 50 based on a search query “English conversation classroom” input to the search query input unit 52 by the user. That is, the search result page 50 displays information such as a link of a web page related to “English conversation class” as a search result.

また、検索結果ページ50には、検索結果であるウェブページの情報とは別に、広告コンテンツが表示される。例えば、広告コンテンツは、検索結果ページ50に含まれる広告枠54又は広告枠56に表示される。広告コンテンツには、広告主の業務を宣伝するテキストなどが含まれる。そして、広告コンテンツには、広告主の提供するウェブページへのリンクが張られる。このような広告コンテンツのリンク先であるウェブページは、ランディングページ(Landing Page、以下「LP」と表記する場合がある)などと呼ばれる。例えば、広告主は、広告コンテンツを表示させることで、ユーザにLPへの移動を促し、自身が提供するウェブページを閲覧させたり、ウェブページ上で商品の購入をさせたりするといった営業に活用する。   Further, on the search result page 50, advertisement content is displayed separately from the information of the web page that is the search result. For example, the advertising content is displayed in the advertising space 54 or the advertising space 56 included in the search result page 50. The advertising content includes text that advertises the business of the advertiser. The advertisement content is linked to a web page provided by the advertiser. A web page that is a link destination of such advertising content is called a landing page (hereinafter sometimes referred to as “LP”). For example, the advertiser can display the advertising content to encourage the user to move to LP, browse the web page provided by the advertiser, or purchase the product on the web page. .

このような検索サービスと連動する広告配信サービスにおいて、広告主は、広告コンテンツを入稿する際や入稿した後に、所定のキーワードに対して入札を行う。そして、広告主は、ユーザが所定のキーワードを検索クエリとして入力した場合に、LPへのリンクが張られた広告コンテンツをユーザに配信させる権利を取得する。すなわち、広告主は、検索サービスにおいて、入札するキーワードを指定することで、キーワードと広告コンテンツとを紐づかせることができる。なお、広告コンテンツのリンク先はLPであるため、広告主は、入札するキーワードを指定することで、キーワードとLPとを紐づかせることもできる。このように、広告主は、ユーザが広告コンテンツと紐づけられたキーワードと同一又は類似のキーワードを検索クエリとして入力した場合に、検索サービスと連動して、検索結果ページ50に広告コンテンツを表示させることができる。言い換えれば、広告主は、広告コンテンツを抽出させるためのキーワードに対して入札する。これにより、広告主は、特定の情報への欲求がユーザに発生しているタイミングで広告コンテンツを配信させることができるので、より高い広告効果が見込める広告コンテンツの配信を行うことができる。   In such an advertisement distribution service linked with a search service, an advertiser bids for a predetermined keyword when or after the advertisement content is submitted. Then, when the user inputs a predetermined keyword as a search query, the advertiser acquires the right to distribute the advertising content linked to the LP to the user. In other words, the advertiser can associate the keyword with the advertisement content by designating the keyword to bid in the search service. Since the link destination of the advertising content is LP, the advertiser can also link the keyword and LP by specifying the keyword to bid. As described above, when the user inputs a keyword that is the same as or similar to the keyword associated with the advertisement content as a search query, the advertiser displays the advertisement content on the search result page 50 in conjunction with the search service. be able to. In other words, the advertiser bids for a keyword for extracting advertisement content. Thereby, since the advertiser can distribute the advertising content at the timing when the desire for specific information is generated in the user, it is possible to distribute the advertising content that can be expected to have a higher advertising effect.

ここで、検索サービスと連動する広告コンテンツの配信処理の流れについて説明する。検索サービスと連動する広告コンテンツの配信処理は、広告装置100と、検索サーバ30と、ユーザ端末10とにより、図示しないネットワークN(例えば、インターネット)を介して行われる。   Here, the flow of the advertisement content distribution process linked to the search service will be described. The distribution process of the advertising content linked to the search service is performed by the advertising device 100, the search server 30, and the user terminal 10 via a network N (not shown) (for example, the Internet).

ユーザ端末10は、ユーザによって利用される情報処理装置である。ユーザ端末10は、例えば、スマートフォンやタブレット端末やPDA(Personal Digital Assistant)等の移動端末や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。   The user terminal 10 is an information processing device used by a user. The user terminal 10 is, for example, a mobile terminal such as a smartphone, a tablet terminal, or a PDA (Personal Digital Assistant), a desktop PC (Personal Computer), a notebook PC, or the like.

検索サーバ30は、検索サービスを提供するサーバ装置である。例えば、検索サーバ30は、所定の検索サイトにおいて、ユーザから検索クエリの入力を受け付ける。そして、検索サーバ30は、検索クエリに基づいた検索結果をユーザに提供する。   The search server 30 is a server device that provides a search service. For example, the search server 30 receives an input of a search query from a user at a predetermined search site. Then, the search server 30 provides the user with a search result based on the search query.

広告装置100は、検索サーバ30と連動して広告配信を行うサーバ装置である。広告装置100は、広告主から広告コンテンツの入稿とともに、キーワードに対する入札を受け付ける。そして、広告装置100は、以下に説明する手順により、検索サービスにおいて広告主が入札を行ったキーワード(以下、「入札キーワード」と表記する場合がある)を入力したユーザに広告コンテンツを配信する。   The advertising device 100 is a server device that distributes advertisements in conjunction with the search server 30. The advertising device 100 accepts bids for keywords as well as submission of advertising content from advertisers. Then, the advertising device 100 distributes the advertising content to the user who has input a keyword (hereinafter, sometimes referred to as “bid keyword”) for which the advertiser has made a bid in the search service according to the procedure described below.

まず、ユーザは、ユーザ端末10を介して、検索サーバ30が提供する検索サイトにアクセスする。そして、ユーザは、検索サイトにおいて検索クエリを入力する。これにより、ユーザ端末10は、検索サーバ30に検索クエリを送信する(ステップS01)。検索サーバ30は、検索クエリに対応する検索結果を表示するウェブページである検索結果ページ50をユーザに提供する(ステップS02)。   First, the user accesses a search site provided by the search server 30 via the user terminal 10. Then, the user inputs a search query at the search site. Thereby, the user terminal 10 transmits a search query to the search server 30 (step S01). The search server 30 provides the user with a search result page 50, which is a web page that displays search results corresponding to the search query (step S02).

また、検索クエリを受信した検索サーバ30は、検索クエリに関する情報(以下、「クエリ情報」と表記する場合がある)を広告装置100に送信する(ステップS03)。これにより、広告装置100は、ユーザから入力された検索クエリに関する情報を取得する。そして、広告装置100は、検索クエリが入札キーワードである場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する(ステップS04)。   In addition, the search server 30 that has received the search query transmits information related to the search query (hereinafter sometimes referred to as “query information”) to the advertising device 100 (step S03). Thereby, advertising device 100 acquires information about a search query inputted by a user. Then, when the search query is a bid keyword, the advertising device 100 selects an advertisement content associated with the bid keyword as a distribution candidate (step S04).

上述のように、検索結果ページ50には、広告枠54及び広告枠56が含まれる。そこで、ユーザ端末10は、検索結果ページ50を表示する際に、広告枠54及び広告枠56で表示する広告コンテンツを取得するために、広告装置100に広告配信の要求を行う(ステップS05)。広告配信の要求を受け付けた広告装置100は、入札キーワードに紐づく広告コンテンツをユーザ端末10に配信する(ステップS06)。これにより、例えば、「英会話教室」というキーワードに入札していた広告主が提供する広告コンテンツが、広告枠54に表示される。また、同じキーワードに入札していた他の広告主が提供する広告コンテンツが、広告枠56に表示される。このように、広告装置100は、検索サービスと連動して、広告コンテンツをユーザに配信することができる。   As described above, the search result page 50 includes the advertising space 54 and the advertising space 56. Therefore, when displaying the search result page 50, the user terminal 10 requests the advertisement apparatus 100 to distribute advertisements in order to acquire the advertisement content displayed in the advertisement frame 54 and the advertisement frame 56 (step S05). Upon receiving the advertisement distribution request, the advertising device 100 distributes the advertisement content associated with the bid keyword to the user terminal 10 (step S06). As a result, for example, the advertising content provided by the advertiser who has bid on the keyword “English conversation classroom” is displayed in the advertising space 54. In addition, the advertising content provided by other advertisers who have bid on the same keyword is displayed in the advertising space 56. As described above, the advertising device 100 can distribute the advertising content to the user in conjunction with the search service.

なお、ステップS03において、検索サーバ30がクエリ情報を広告装置100に送信する例を示したが、クエリ情報は、ユーザ端末10から広告装置100に送信されてもよい。例えば、クエリ情報は、検索結果ページ50の広告配信要求のためのスクリプトに含まれてもよい。この場合、ユーザ端末10は、広告配信の要求とともに、クエリ情報を広告装置100に送信する。そして、広告装置100は、クエリに紐づく広告コンテンツを選択し、選択された広告コンテンツをユーザ端末10に配信する。   In addition, although the search server 30 showed the example which transmits query information to the advertising device 100 in step S03, query information may be transmitted to the advertising device 100 from the user terminal 10. FIG. For example, the query information may be included in a script for an advertisement distribution request on the search result page 50. In this case, the user terminal 10 transmits the query information to the advertising device 100 together with the advertisement distribution request. Then, the advertising device 100 selects the advertising content associated with the query, and distributes the selected advertising content to the user terminal 10.

ところで、図1の例のように、広告主は、検索結果ページ50に広告コンテンツを表示させるためには、所定のキーワードに入札を行うことになる。そして、広告主は、様々な興味を有するユーザに広告コンテンツを配信させるためには、適切な入札キーワードを複数指定するのが望ましい。しかしながら、広告主にとって、複数の適切なキーワードに入札することは容易でない。例えば、広告主は、自身が提供するLPから抽出される単語(すなわち、LP内に含まれる単語。以下では、「LP単語」と表記する場合がある)や、自身が提供する商品又はサービスの名称等について入札することが一般的には考えられる。この場合、広告主は、自身が想定するユーザの範囲にしか広告コンテンツを配信させることができないため、効率よく広告コンテンツの配信対象とするユーザの範囲を拡張させることが困難である。   By the way, as shown in the example of FIG. 1, in order to display the advertising content on the search result page 50, the advertiser bids on a predetermined keyword. And it is desirable for an advertiser to designate a plurality of appropriate bid keywords in order to distribute advertisement contents to users who have various interests. However, it is not easy for an advertiser to bid on a plurality of appropriate keywords. For example, an advertiser may use a word extracted from an LP provided by the advertiser (that is, a word included in the LP. Hereinafter, it may be referred to as “LP word”), or a product or service provided by the advertiser. It is generally considered to bid for names. In this case, since the advertiser can distribute the advertising content only to the range of the user assumed by the advertiser, it is difficult to efficiently expand the range of the user to be distributed as the advertising content.

上記の事情に鑑みると、検索連動型の広告配信サービスにおいて、広告主に適切な入札キーワードを提示することは有用である。また、広告配信サービスの管理者側にとっても、広告主に適切な入札キーワードを提示することにより、入札の促進につながり、サービスの活性化を図ることができる。   In view of the above circumstances, it is useful to present an appropriate bid keyword to an advertiser in a search-linked advertisement distribution service. Also, the manager of the advertisement distribution service can promote bidding by presenting an appropriate bid keyword to the advertiser, thereby activating the service.

そこで、実施形態に係る広告装置100は、図1で示したような検索連動型の広告配信サービスにおいて、広告主にとって適切な入札キーワードを抽出する。以下、図2を用いて、実施形態に係る抽出処理を説明する。図2は、実施形態に係る抽出処理の一例を示す図である。図2では、抽出システム1を例に挙げて、抽出処理の一例を説明する。   Therefore, the advertising device 100 according to the embodiment extracts bid keywords suitable for the advertiser in the search-linked advertisement distribution service as shown in FIG. Hereinafter, the extraction process according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram illustrating an example of the extraction process according to the embodiment. In FIG. 2, an example of the extraction process will be described by taking the extraction system 1 as an example.

図2に示すように、抽出システム1には、広告主端末20と、広告装置100とが含まれる。広告装置100は、図示しないネットワークN(例えば、インターネット)を介して、広告主端末20と通信可能に接続される。なお、図2では図示を省略したが、抽出システム1には、前述したユーザ端末10や、検索サーバ30が含まれてもよい。この場合、広告装置100は、ネットワークNを介して、ユーザ端末10、及び検索サーバ30と通信可能に接続される。   As shown in FIG. 2, the extraction system 1 includes an advertiser terminal 20 and an advertising device 100. The advertising device 100 is communicably connected to the advertiser terminal 20 via a network N (for example, the Internet) not shown. Although not shown in FIG. 2, the extraction system 1 may include the user terminal 10 and the search server 30 described above. In this case, the advertising device 100 is connected to the user terminal 10 and the search server 30 via the network N so as to be communicable.

広告主端末20は、広告主によって利用される情報処理装置である。広告主端末20は、例えば、スマートフォンやタブレット端末やPDA等の移動端末や、デスクトップ型PCや、ノート型PC等である。   The advertiser terminal 20 is an information processing device used by the advertiser. The advertiser terminal 20 is, for example, a mobile terminal such as a smartphone, a tablet terminal, or a PDA, a desktop PC, a notebook PC, or the like.

広告装置100は、以下に説明する抽出処理によって、広告主が入札する入札キーワードとして適切なキーワードを抽出するサーバ装置である。   The advertising device 100 is a server device that extracts an appropriate keyword as a bid keyword for an advertiser to bid by an extraction process described below.

広告装置100は、提供する広告配信サービスにおいて、複数の広告主から広告コンテンツの入稿を受け付ける。この場合、広告装置100は、広告コンテンツの入稿とともに、広告主が指定するキーワードに対して入札を受け付ける。そして、広告装置100は、受け付けた入札キーワードに関する情報を保持する。また、広告装置100は、例えば、ユーザから送信された検索クエリに関する情報を検索サーバ30から取得し、取得した情報を保持する。そして、広告装置100は、保持する情報に基づいて、広告配信サービスを利用する広告主に対する適切な入札キーワードを抽出する処理を実行する。   The advertising device 100 accepts submission of advertising content from a plurality of advertisers in the provided advertisement distribution service. In this case, the advertising device 100 accepts a bid for the keyword designated by the advertiser as well as the submission of the advertising content. Then, the advertising device 100 holds information regarding the accepted bid keyword. In addition, the advertising device 100 acquires, for example, information related to the search query transmitted from the user from the search server 30 and holds the acquired information. Then, the advertising device 100 executes a process of extracting an appropriate bid keyword for an advertiser who uses the advertisement distribution service based on the stored information.

広告装置100は、異なる複数の手法を用いてキーワードを抽出する。ここでは、広告装置100が実行するキーワードの抽出手法に用いられる一連の演算処理を「抽出モデル」と表記する。すなわち、広告装置100は、保持する情報について、各抽出モデルを用いて演算処理することにより、適切なキーワードを抽出する。詳しくは後述するが、実施形態に係る広告装置100は、3つの異なる抽出モデルを有する。第1抽出モデルは、広告主が提供するLPに関する情報や、LPから生成される特徴情報に基づいて、適切な入札キーワードを抽出する手法である。第2抽出モデルは、広告主から実際に入稿された入札キーワードの共起性に基づいて、適切な入札キーワードを抽出する手法である。第3抽出モデルは、ユーザ端末10から検索サーバ30に送信された検索クエリの傾向に基づいて、適切な入札キーワードを抽出する手法である。   The advertising device 100 extracts keywords using a plurality of different methods. Here, a series of arithmetic processing used for the keyword extraction method executed by the advertising device 100 is referred to as an “extraction model”. In other words, the advertising device 100 extracts appropriate keywords by performing arithmetic processing on the information held using each extraction model. As will be described in detail later, the advertising device 100 according to the embodiment has three different extraction models. The first extraction model is a technique for extracting an appropriate bid keyword based on information about the LP provided by the advertiser and feature information generated from the LP. The second extraction model is a technique for extracting an appropriate bid keyword based on the co-occurrence of bid keywords actually submitted by the advertiser. The third extraction model is a technique for extracting an appropriate bid keyword based on the tendency of the search query transmitted from the user terminal 10 to the search server 30.

各抽出モデルは、入力される情報をもとに、所定の評価値をキーワード毎に算定し、算定された評価値に基づいて入札キーワードとして適切と想定されるキーワードを抽出する。なお、広告装置100は、各抽出モデルが算定した評価値を既知の手法により正規化する。これにより、広告装置100は、異なる抽出モデルにより算定された評価値を同等に取扱い、比較することが可能となる。   Each extraction model calculates a predetermined evaluation value for each keyword based on input information, and extracts a keyword that is assumed to be appropriate as a bid keyword based on the calculated evaluation value. Note that the advertising device 100 normalizes the evaluation value calculated by each extraction model by a known method. Thereby, the advertising device 100 can handle and compare evaluation values calculated by different extraction models equally.

ここで、広告装置100は、複数の抽出モデルを利用してキーワードを抽出するため、予め学習のためのデータ(以下、「テストデータ」と表記する場合がある)で抽出モデルを学習させることにより、複数の抽出モデルに重み付けを行う(ステップS11)。例えば、広告装置100は、提供する広告配信サービスにおいて、複数の広告主から受け付けた広告に関する情報や、ユーザから送信される検索クエリ等の情報を各抽出モデルに学習させる。具体的には、広告装置100は、所定の広告主が現に指定している入札キーワードの一部の情報を隠したテストデータを抽出モデルに入力し、抽出処理を実行させる。そして、広告装置100は、隠された入札キーワードを抽出モデルが正確に抽出することができたか否か等によって、各抽出モデルの重み付けを行う。言い換えれば、広告装置100は、抽出モデルに対して、隠された入札キーワードを正例とする学習を行い、正例を抽出できた度合いによって各抽出モデルの重み付けを示す所定の指標値を算出する。   Here, since the advertising device 100 extracts a keyword using a plurality of extraction models, the advertising device 100 learns the extraction model in advance with data for learning (hereinafter may be referred to as “test data”). The plurality of extraction models are weighted (step S11). For example, the advertising device 100 causes each extraction model to learn information related to advertisements received from a plurality of advertisers and information such as a search query transmitted from a user in an advertisement distribution service to be provided. Specifically, the advertising device 100 inputs test data in which a part of information of a bid keyword currently designated by a predetermined advertiser is hidden into an extraction model, and executes an extraction process. Then, the advertising device 100 weights each extraction model depending on whether or not the extraction model can accurately extract the hidden bid keyword. In other words, the advertising device 100 performs learning using a hidden bid keyword as a positive example for the extraction model, and calculates a predetermined index value indicating the weight of each extraction model based on the degree of extraction of the positive example. .

このように、広告装置100は、予め複数の抽出モデルに重みを付与することで、複数の抽出モデルを適切に利用したキーワードの抽出処理を実行可能とする。   As described above, the advertising device 100 can execute keyword extraction processing appropriately using a plurality of extraction models by assigning weights to the plurality of extraction models in advance.

続いて、広告装置100は、新たに検索連動型の広告配信サービスを利用しようとする広告主CL10から、広告主端末20を介して、広告コンテンツの入稿を受け付ける(ステップS12)。この場合、広告装置100は、広告コンテンツの入稿とともに、広告コンテンツを検索結果ページ50で表示させるためのキーワードの入札を広告主CL10から受け付けてもよい。また、広告装置100は、入稿された広告コンテンツのリンク先であるLPの情報を取得する。また、広告装置100は、広告主CL10が提供するLPを検索するために用いられた検索クエリに関する情報等を検索サーバ30から取得する。   Subsequently, the advertising device 100 accepts submission of advertising content via the advertiser terminal 20 from the advertiser CL10 that is newly using the search-linked advertisement distribution service (step S12). In this case, the advertising device 100 may accept a bid for a keyword for displaying the advertising content on the search result page 50 from the advertiser CL10 together with the submission of the advertising content. In addition, the advertising device 100 acquires information about the LP that is the link destination of the submitted advertising content. In addition, the advertising device 100 acquires, from the search server 30, information related to the search query used for searching for LPs provided by the advertiser CL 10.

そして、広告装置100は、取得した広告主CL10に関する情報に基づいて、入稿された広告コンテンツに紐づかせるキーワードを抽出する(ステップS13)。具体的には、広告装置100は、各抽出モデルに広告主CL10に関する情報を入力し、抽出処理を実行させる。これにより、広告装置100は、広告主CL10にとって適切な入札キーワードを抽出する。   Then, the advertising device 100 extracts keywords to be associated with the submitted advertising content based on the acquired information regarding the advertiser CL10 (step S13). Specifically, the advertising device 100 inputs information related to the advertiser CL10 to each extraction model and causes the extraction process to be executed. Thereby, the advertising device 100 extracts a bid keyword appropriate for the advertiser CL10.

そして、広告装置100は、広告主CL10が指定する入札キーワードの候補として、抽出されたキーワードを提示する(ステップS14)。具体的には、広告装置100は、検索連動型の広告配信サービスにおいて、広告主CL10が入札することにより広告コンテンツが検索結果ページ50に表示される確率が高まることが想定されるキーワードを広告主CL10に提示する。   Then, the advertising device 100 presents the extracted keyword as a bid keyword candidate designated by the advertiser CL10 (step S14). Specifically, the advertising device 100 uses keywords that are expected to increase the probability that advertisement content will be displayed on the search result page 50 when the advertiser CL10 bids in the search-linked advertisement distribution service. Present to CL10.

このように、実施形態に係る広告装置100は、コンテンツに紐づかせるキーワードとしての評価値を算定し、算定した評価値に基づいてキーワードを抽出する抽出モデルであって、互いに異なる手法を用いて評価値を算定する抽出モデル毎に、抽出モデルによって所定の条件に適合するキーワード(例えば、テストデータにおいて正例であるキーワード)が抽出された度合いに基づいて、抽出モデル毎の指標値を算出する。そして、広告装置100は、算出された指標値により重み付けされた抽出モデルが算定する評価値に基づいて、コンテンツに紐づかせるキーワード、又は、コンテンツを抽出させるためのキーワードである入札キーワードを抽出する。   As described above, the advertising device 100 according to the embodiment is an extraction model that calculates an evaluation value as a keyword to be associated with content and extracts a keyword based on the calculated evaluation value, and uses different methods. For each extraction model for calculating the evaluation value, an index value for each extraction model is calculated based on the degree to which keywords (for example, keywords that are positive examples in the test data) that match a predetermined condition are extracted by the extraction model. . Then, the advertising device 100 extracts a keyword associated with the content or a bid keyword that is a keyword for extracting the content based on the evaluation value calculated by the extraction model weighted by the calculated index value. .

すなわち、実施形態に係る広告装置100は、検索連動型の広告配信サービスにおける入札キーワードに関して、複数の異なる抽出モデルを用いて、広告主にとって適切なキーワードを抽出する。このため、広告装置100によれば、現に検索連動型の広告配信サービスを利用している広告主に関する情報や、検索サーバ30が受信するユーザからの検索要求である検索クエリに関する情報など、種々の情報に基づいて、キーワードを抽出することができる。これにより、広告装置100によれば、広告主は、自身が指定する入札キーワードのみならず、種々の情報に基づいて抽出されるキーワードを入札キーワードとして指定することが可能となる。そして、適切な複数のキーワードに入札することにより、広告主は、提供する広告コンテンツに興味を持つと想定されるユーザに広告コンテンツをより多く配信させることができる。結果として、実施形態に係る広告装置100によれば、配信される広告コンテンツの広告効果を高めることができる。   That is, the advertising device 100 according to the embodiment extracts keywords suitable for the advertiser using a plurality of different extraction models with respect to bid keywords in the search-linked advertisement distribution service. For this reason, according to the advertising device 100, there are various information such as information on an advertiser who is currently using a search-linked advertisement distribution service and information on a search query that is a search request from a user received by the search server 30. Keywords can be extracted based on the information. Thereby, according to the advertising device 100, the advertiser can specify not only the bid keyword specified by the advertiser but also the keyword extracted based on various information as the bid keyword. Then, by bidding on a plurality of appropriate keywords, the advertiser can distribute more advertising content to users who are assumed to be interested in the advertising content to be provided. As a result, according to the advertising device 100 according to the embodiment, the advertising effect of the distributed advertising content can be enhanced.

〔2.広告装置100の構成〕
次に、図3を用いて、実施形態に係る広告装置100の構成について説明する。図3は、実施形態に係る広告装置100の構成例を示す図である。図3に示すように、広告装置100は、通信部110と、記憶部120と、制御部130とを有する。
[2. Configuration of Advertising Device 100]
Next, the configuration of the advertising device 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of the advertising device 100 according to the embodiment. As illustrated in FIG. 3, the advertising device 100 includes a communication unit 110, a storage unit 120, and a control unit 130.

(通信部110について)
通信部110は、ネットワークNと有線又は無線で接続され、ユーザ端末10、広告主端末20及び検索サーバ30との間で情報の送受信を行う。例えば、通信部110は、NIC(Network Interface Card)等によって実現される。
(About the communication unit 110)
The communication unit 110 is connected to the network N by wire or wireless, and transmits / receives information to / from the user terminal 10, the advertiser terminal 20, and the search server 30. For example, the communication unit 110 is realized by a NIC (Network Interface Card) or the like.

(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3の例では、記憶部120は、算出データ記憶部121と、広告情報記憶部126とを有する。
(About the storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. In the example of FIG. 3, the storage unit 120 includes a calculated data storage unit 121 and an advertisement information storage unit 126.

(算出データ記憶部121について)
算出データ記憶部121は、各抽出モデルがキーワードの評価値を算定するために用いる情報や、後述する算出部136が算出処理に用いる情報を記憶する。図3に示すように、算出データ記憶部121は、第1テーブル122、第2テーブルA123、第2テーブルB124、第3テーブル125といった、各データテーブルを有する。
(Regarding the calculated data storage unit 121)
The calculation data storage unit 121 stores information used by each extraction model to calculate an evaluation value of a keyword and information used by the calculation unit 136 described later for calculation processing. As illustrated in FIG. 3, the calculation data storage unit 121 includes data tables such as a first table 122, a second table A 123, a second table B 124, and a third table 125.

(第1テーブル122について)
ここで、図4に、実施形態に係る第1テーブル122の一例を示す。図4は、実施形態に係る第1テーブル122の一例を示す図である。第1抽出モデルによる処理を実行する第1抽出部133は、第1テーブル122に記憶された情報に基づいてキーワードの抽出を行う。上述のように、第1抽出モデルは、広告主が提供するLPに関する情報に基づいて、適切な入札キーワードを抽出する手法である。このため、第1テーブル122には、広告装置100が取得した情報のうち、主にLPに関する情報に関する情報が記憶される。図4に示した例では、第1テーブル122は、「入札キーワード」、「LP」、「LP単語ベクトル」、「キーワード単語ベクトル」といった項目を有する。
(About the first table 122)
Here, FIG. 4 shows an example of the first table 122 according to the embodiment. FIG. 4 is a diagram illustrating an example of the first table 122 according to the embodiment. The first extraction unit 133 that executes processing based on the first extraction model performs keyword extraction based on information stored in the first table 122. As described above, the first extraction model is a method of extracting an appropriate bid keyword based on information about LP provided by the advertiser. For this reason, the first table 122 stores mainly information related to information about the LP among the information acquired by the advertising device 100. In the example illustrated in FIG. 4, the first table 122 includes items such as “bid keyword”, “LP”, “LP word vector”, and “keyword word vector”.

「入札キーワード」は、各LP(言い換えれば、各広告コンテンツ)に紐づけられている入札キーワードを示す。図4に示すように、入札キーワードは、複数の広告主により指定される場合があるので、一つの入札キーワードに複数のLPが紐づけられる場合がある。なお、入札キーワードは、一つの単語に限られず、複数の単語の組み合わせであってもよい。   “Bid keyword” indicates a bid keyword associated with each LP (in other words, each advertisement content). As shown in FIG. 4, since a bid keyword may be designated by a plurality of advertisers, a plurality of LPs may be associated with one bid keyword. The bid keyword is not limited to one word, and may be a combination of a plurality of words.

「LP」は、広告主が提供するLPに関する情報を示す。図4に示す「LP01」という表記は、LPを識別するための識別情報を示すとともに、LPに関する情報を概念的に表現したものである。算出データ記憶部121内に記憶されるLPに関する情報は、LPを構成するHTML(HyperText Markup Language)ファイル等であってもよいし、LPのデータが置かれたURL(Uniform Resource Locator)を示す情報であってもよい。なお、以下では、図4に示したLPの項目に記憶されている情報を、LPの参照符号として用いる場合がある。例えば、LP「LP01」によって示される情報を有するLPを、「LP01」と表記する場合がある。   “LP” indicates information about LP provided by the advertiser. The notation “LP01” shown in FIG. 4 represents identification information for identifying the LP and conceptually represents information about the LP. The information on the LP stored in the calculated data storage unit 121 may be an HTML (HyperText Markup Language) file or the like constituting the LP, or information indicating a URL (Uniform Resource Locator) where the LP data is placed. It may be. In the following, the information stored in the LP item shown in FIG. 4 may be used as the LP reference code. For example, an LP having information indicated by LP “LP01” may be expressed as “LP01”.

「LP単語ベクトル」は、各LPに対応する単語ベクトルを示す。図4に示す「V01」という表記は、単語ベクトルを概念的に表現したものである。なお、各LPに対応する単語ベクトルは、後述する第1抽出部133によって生成される。第1抽出部133は、生成した単語ベクトルを生成元であるLPと対応付けて、第1テーブル122に記憶する。   “LP word vector” indicates a word vector corresponding to each LP. The notation “V01” shown in FIG. 4 is a conceptual representation of a word vector. Note that a word vector corresponding to each LP is generated by a first extraction unit 133 described later. The first extraction unit 133 stores the generated word vector in the first table 122 in association with the LP that is the generation source.

「キーワード単語ベクトル」は、入札キーワードに対応する単語ベクトルを示す。図4に示す「G01」という表記は、単語ベクトルを概念的に表現したものである。詳しくは後述するが、キーワード単語ベクトルは、入札キーワードに紐づくLP単語ベクトルに基づいて第1抽出部133により生成される。   “Keyword word vector” indicates a word vector corresponding to a bid keyword. The notation “G01” shown in FIG. 4 is a conceptual representation of a word vector. As will be described in detail later, the keyword word vector is generated by the first extraction unit 133 based on the LP word vector associated with the bid keyword.

例えば、図4では、入札キーワード「K101」は、LP「LP01」、「LP02」、「LP03」、・・・、に紐づいており、また、各LPに対応する単語ベクトルは、LP単語ベクトル「V01」、「V02」、「V03」、・・・、であり、入札キーワード「K101」に対応する単語ベクトルは、キーワード単語ベクトル「G01」である例を示している。   For example, in FIG. 4, the bid keyword “K101” is associated with LPs “LP01”, “LP02”, “LP03”,..., And the word vectors corresponding to each LP are LP word vectors. In this example, the word vector corresponding to the bid keyword “K101” is “V01”, “V02”, “V03”,.

(第2テーブルA123について)
次に、図5に、実施形態に係る第2テーブルA123の一例を示す。図5は、実施形態に係る第2テーブルA123の一例を示す図である。第2抽出モデルによる処理を実行する第2抽出部134は、第2テーブルA123及び第2テーブルB124に記憶された情報に基づいてキーワードの抽出を行う。上述のように、第2抽出モデルは、広告主から実際に入稿された入札キーワードの共起性に基づいて、適切な入札キーワードを抽出する手法である。このため、第2テーブルA123及び第2テーブルB124には、広告装置100が取得した情報のうち、主に広告主が入札しているキーワードに関する情報が記憶される。図5に示した例では、第2テーブルA123は、「広告主ID」、「広告コンテンツ」、「入札キーワード」といった項目を有する。
(About the second table A123)
Next, FIG. 5 shows an example of the second table A123 according to the embodiment. FIG. 5 is a diagram illustrating an example of the second table A123 according to the embodiment. The second extraction unit 134 that executes processing based on the second extraction model performs keyword extraction based on information stored in the second table A123 and the second table B124. As described above, the second extraction model is a method for extracting an appropriate bid keyword based on the co-occurrence of the bid keyword actually submitted by the advertiser. For this reason, in the second table A123 and the second table B124, information on keywords that are mainly bid by the advertiser among the information acquired by the advertising device 100 is stored. In the example illustrated in FIG. 5, the second table A123 includes items such as “advertiser ID”, “advertisement content”, and “bid keyword”.

「広告主ID」は、広告主又は広告主端末20を識別するための識別情報を示す。なお、以下では、図5に示した広告主IDに記憶されている識別情報を広告主の参照符号として用いる場合がある。例えば、広告主ID「CL21」によって識別される広告主を「広告主CL21」と表記する場合がある。   The “advertiser ID” indicates identification information for identifying the advertiser or the advertiser terminal 20. In the following, the identification information stored in the advertiser ID shown in FIG. 5 may be used as an advertiser reference code. For example, the advertiser identified by the advertiser ID “CL21” may be referred to as “advertiser CL21”.

「広告コンテンツ」は、広告主端末20から入稿された広告コンテンツを示す。図5では、「広告コンテンツ」に「AD01」や「AD02」といった概念的な情報が格納される例を示したが、実際には、広告コンテンツの宣伝内容であるテキストデータや、あるいは、これらの格納場所を示すファイルパス名などが格納される。   “Advertising content” indicates the advertising content submitted from the advertiser terminal 20. FIG. 5 shows an example in which conceptual information such as “AD01” and “AD02” is stored in “advertising content”, but in actuality, text data that is advertising content of advertising content, or these Stores the file path name indicating the storage location.

「入札キーワード」は、広告コンテンツに紐づけられている入札キーワードを示す。図5に示すように、広告主は、複数のキーワードに入札することができる。このため、広告コンテンツには、複数の入札キーワードが紐づけられる。   “Bid keyword” indicates a bid keyword associated with the advertising content. As shown in FIG. 5, the advertiser can bid on a plurality of keywords. For this reason, a plurality of bid keywords are associated with the advertising content.

例えば、図5では、広告主ID「CL21」によって識別される広告主CL21が、検索連動型の広告配信サービスにおいて、広告コンテンツ「AD01」を検索結果ページ50に表示させるために、入札キーワード「K001」、「K002」、「K003」、・・・、に入札している例を示している。   For example, in FIG. 5, in order for the advertiser CL21 identified by the advertiser ID “CL21” to display the advertisement content “AD01” on the search result page 50 in the search-linked advertisement distribution service, the bid keyword “K001” is displayed. ”,“ K002 ”,“ K003 ”,...

(第2テーブルB124について)
次に、図6に、実施形態に係る第2テーブルB124の一例を示す。図6は、実施形態に係る第2テーブルB124の一例を示す図である。上述のように、第2抽出部134は、第2テーブルB124に記憶された情報を用いてキーワードの抽出を実行する。詳しくは後述するが、第2抽出部134は、キーワードに入札している広告主毎にキーワードの組合せを作成し、かかる組合せの評価値である重み値を算定する。このため、第2テーブルB124には、主にキーワードの組合せに関する情報が記憶される。図6に示した例では、第2テーブルB124は、「入札キーワード(1)」、「入札キーワード(2)」、「重み値」といった項目を有する。
(About the second table B124)
Next, FIG. 6 shows an example of the second table B124 according to the embodiment. FIG. 6 is a diagram illustrating an example of the second table B124 according to the embodiment. As described above, the second extraction unit 134 performs keyword extraction using the information stored in the second table B124. As will be described in detail later, the second extraction unit 134 creates a combination of keywords for each advertiser who is bidding on the keyword, and calculates a weight value that is an evaluation value of the combination. For this reason, the second table B124 mainly stores information related to keyword combinations. In the example illustrated in FIG. 6, the second table B124 includes items such as “bid keyword (1)”, “bid keyword (2)”, and “weight value”.

「入札キーワード(1)」及び「入札キーワード(2)」は、図5に示した入札キーワードに対応する。なお、図6に示す例では、入札キーワード(1)に示される入札キーワードが、入札キーワード(2)に示される入札キーワードとともに組合せに含まれることを示している。   "Bid keyword (1)" and "Bid keyword (2)" correspond to the bid keyword shown in FIG. In the example illustrated in FIG. 6, the bid keyword indicated by the bid keyword (1) is included in the combination together with the bid keyword indicated by the bid keyword (2).

「重み値」は、キーワードの組合せの重み値を示す。重み値は、後述する第2抽出部134によって組合せ毎に算定される。なお、重み値は、広告主から受け付ける入札キーワードによって随時変化するため、所定のタイミングで(例えば、一日に一回など)更新されることがある。   “Weight value” indicates a weight value of a combination of keywords. The weight value is calculated for each combination by the second extraction unit 134 described later. Since the weight value changes as needed depending on the bid keyword received from the advertiser, the weight value may be updated at a predetermined timing (for example, once a day).

例えば、図6では、入札キーワード(1)「K001」と、入札キーワード(2)「K002」により形成される組合せ(K001,K002)の重み値は「0.6」であり、入札キーワード(1)「K001」と、入札キーワード(2)「K003」により形成される組合せ(K001,K003)の重み値は「0.3」である例を示している。   For example, in FIG. 6, the weight value of the combination (K001, K002) formed by the bid keyword (1) “K001” and the bid keyword (2) “K002” is “0.6”, and the bid keyword (1 ) The weight value of the combination (K001, K003) formed by “K001” and the bid keyword (2) “K003” is “0.3”.

(第3テーブル125について)
次に、図7に、実施形態に係る第3テーブル125の一例を示す。図7は、実施形態に係る第3テーブル125の一例を示す図である。第3抽出モデルによる処理を実行する第3抽出部135は、第3テーブル125に記憶された情報に基づいてキーワードの抽出を行う。上述のように、第3抽出モデルは、検索サーバ30にユーザ端末10から送信された検索クエリの傾向に基づいて、適切な入札キーワードを抽出する手法である。このため、第3テーブル125には、広告装置100が取得した情報のうち、主に検索サービスにおいてユーザから送信された検索要求に関する情報が記憶される。図7に示した例では、第3テーブル125は、「広告主ID」、「LP」、「検索クエリ」、「検索回数」、「再検索クエリ」、「検索回数」、「傾向値」といった項目を有する。
(About the third table 125)
Next, FIG. 7 shows an example of the third table 125 according to the embodiment. FIG. 7 is a diagram illustrating an example of the third table 125 according to the embodiment. The third extraction unit 135 that executes processing based on the third extraction model extracts keywords based on the information stored in the third table 125. As described above, the third extraction model is a method of extracting an appropriate bid keyword based on the tendency of the search query transmitted from the user terminal 10 to the search server 30. Therefore, in the third table 125, information related to the search request transmitted from the user mainly in the search service among the information acquired by the advertising device 100 is stored. In the example illustrated in FIG. 7, the third table 125 includes “advertiser ID”, “LP”, “search query”, “search count”, “re-search query”, “search count”, “trend value”, and the like. Have items.

「広告主ID」は、図5に示した広告主IDの項目に対応する。「LP」は、図4に示したLPの項目に対応する。   “Advertiser ID” corresponds to the item of advertiser ID shown in FIG. “LP” corresponds to the item of LP shown in FIG.

「検索クエリ」は、検索サービスにおいてユーザ端末10から送信される検索要求を示す。「再検索クエリ」は、検索クエリを送信したユーザ端末10から、さらに送信される検索要求を示す。また、「検索回数」は、検索クエリ又は再検索クエリが検索された回数を示す。言い換えれば、検索回数は、検索クエリ又は再検索クエリがユーザ端末10から送信された回数を示す。   “Search query” indicates a search request transmitted from the user terminal 10 in the search service. The “re-search query” indicates a search request further transmitted from the user terminal 10 that has transmitted the search query. The “number of searches” indicates the number of times a search query or re-search query has been searched. In other words, the search count indicates the number of times a search query or re-search query is transmitted from the user terminal 10.

「傾向値」は、検索クエリを送信したユーザ端末10がどのような内容の再検索クエリを送信したか、といった検索の傾向を示す値である。第3抽出部135は、傾向値を再検索クエリ(すなわち、キーワード)に対する評価値として扱う。第3抽出部135は、図7に示すように、LPに紐づく検索クエリと再検索クエリの組合せ毎に傾向値を算定する。なお、傾向値は、検索サーバ30から取得する検索クエリ及び再検索クエリに関する情報によって随時変化するため、所定のタイミングで(例えば、一時間に一回など)更新されることがある。   The “trend value” is a value indicating a search tendency such as what kind of content the re-search query is transmitted by the user terminal 10 that has transmitted the search query. The third extraction unit 135 treats the trend value as an evaluation value for the re-search query (ie, keyword). As illustrated in FIG. 7, the third extraction unit 135 calculates a trend value for each combination of a search query and a re-search query associated with LP. Note that the trend value changes from time to time depending on information related to the search query and re-search query acquired from the search server 30, and may be updated at a predetermined timing (for example, once per hour).

例えば、図7では、広告主ID「CL31」で識別される広告主から提供されるLP「LP31」で示されるウェブページは、ユーザ端末10から検索クエリ「ダイエット」が送信されることによって抽出されるウェブページであり、現時点において、検索クエリ「ダイエット」によって「20281」回だけ検索されていることを示す。また、LP31を表示したユーザ端末10は、さらに再検索クエリ「運動」や、「健康食品」や、「ヨーグルト」や、「エステ」などを送信したことを示す。例えば、再検索クエリ「運動」は、検索クエリ「ダイエット」を送信したユーザ端末10から、現時点において、「4125」回だけ送信されたことを示す。また、検索クエリ「ダイエット」を送信した結果としてLP31を表示したユーザ端末10は、さらに再検索クエリ「運動」を送信する傾向値が「0.2」であり、再検索クエリ「健康食品」を送信する傾向値が「0.2」であり、再検索クエリ「ヨーグルト」を送信する傾向値が「0.2」であり、再検索クエリ「エステ」を送信する傾向値が「0.1」である例を示している。   For example, in FIG. 7, the web page indicated by LP “LP31” provided by the advertiser identified by the advertiser ID “CL31” is extracted by transmitting the search query “Diet” from the user terminal 10. This indicates that the web page is currently searched “20281” times by the search query “diet”. Further, the user terminal 10 displaying the LP 31 indicates that a re-search query “exercise”, “health food”, “yogurt”, “esthetic”, and the like have been transmitted. For example, the re-search query “exercise” indicates that the user terminal 10 that has transmitted the search query “diet” has been transmitted “4125” times at the present time. In addition, the user terminal 10 that displayed LP31 as a result of transmitting the search query “diet” has a tendency value “0.2” for transmitting the re-search query “exercise” and the re-search query “health food”. The tendency value to be transmitted is “0.2”, the tendency value to transmit the re-search query “yogurt” is “0.2”, and the tendency value to transmit the re-search query “este” is “0.1”. An example is shown.

(広告情報記憶部126について)
広告情報記憶部126は、広告主から入稿された広告コンテンツに関する情報を記憶する。ここで、図8に、実施形態に係る広告情報記憶部126の一例を示す。図8は、実施形態に係る広告情報記憶部126の一例を示す図である。図8に示した例では、広告情報記憶部126は、「広告主ID」、「広告コンテンツ」、「LP」、「入札キーワード」といった項目を有する。
(About the advertisement information storage unit 126)
The advertisement information storage unit 126 stores information related to the advertisement content submitted by the advertiser. Here, FIG. 8 illustrates an example of the advertisement information storage unit 126 according to the embodiment. FIG. 8 is a diagram illustrating an example of the advertisement information storage unit 126 according to the embodiment. In the example illustrated in FIG. 8, the advertisement information storage unit 126 includes items such as “advertiser ID”, “advertisement content”, “LP”, and “bid keyword”.

「広告主ID」は、図5に示す広告主IDの項目に対応する。「広告コンテンツ」は、図5に示す広告コンテンツの項目に対応する。「LP」は、図4に示すLPの項目に対応する。「入札キーワード」は、図4に示す入札キーワードの項目に対応する。   “Advertiser ID” corresponds to the item of advertiser ID shown in FIG. "Advertising content" corresponds to the item of advertising content shown in FIG. “LP” corresponds to the item of LP shown in FIG. “Bid keyword” corresponds to the item of the bid keyword shown in FIG.

例えば、図8では、広告主ID「CL41」によって識別される広告主CL41が、検索連動型の広告配信サービスにおいて、広告コンテンツ「AD41」を検索結果ページ50に表示させるために、入札キーワード「K401」、「K402」、「K403」、・・・、に入札している例を示している。また、広告コンテンツ「AD41」のリンク先は、LP「LP41」である例を示している。   For example, in FIG. 8, in order for the advertiser CL41 identified by the advertiser ID “CL41” to display the advertisement content “AD41” on the search result page 50 in the search-linked advertisement distribution service, the bid keyword “K401” is displayed. ”,“ K402 ”,“ K403 ”,... In addition, an example is shown in which the link destination of the advertisement content “AD41” is LP “LP41”.

後述する配信部141は、例えば、ユーザ端末10から送信される広告取得の要求に従い、広告情報記憶部126に記憶されている広告コンテンツをユーザ端末10に配信する。   For example, the distribution unit 141 described later distributes the advertisement content stored in the advertisement information storage unit 126 to the user terminal 10 in accordance with an advertisement acquisition request transmitted from the user terminal 10.

(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告装置100内部の記憶装置に記憶されている各種プログラム(抽出プログラムの一例)がRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(About the control unit 130)
The control unit 130 includes, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like that stores various programs (an example of an extraction program) stored in a storage device inside the advertising device 100 as a RAM (Random Access Memory). Is implemented as a work area. The control unit 130 is realized by an integrated circuit such as an application specific integrated circuit (ASIC) or a field programmable gate array (FPGA).

図3に示すように、制御部130は、取得部131と、抽出制御部132と、入稿受付部138と、提示部139と、要求受付部140と、配信部141とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。   As shown in FIG. 3, the control unit 130 includes an acquisition unit 131, an extraction control unit 132, a submission receiving unit 138, a presentation unit 139, a request receiving unit 140, and a distribution unit 141. Implements or executes the information processing functions and operations described in (1). Note that the internal configuration of the control unit 130 is not limited to the configuration illustrated in FIG. 3, and may be another configuration as long as the information processing described below is performed. Further, the connection relationship between the processing units included in the control unit 130 is not limited to the connection relationship illustrated in FIG. 3, and may be another connection relationship.

(取得部131について)
取得部131は、キーワードの抽出処理に用いる各種情報を取得する。取得部131により取得される情報は、後述する算出処理や抽出処理に利用される。例えば、取得部131は、抽出モデル毎の重み付けを算出するためのテストデータとして、入稿受付部138が入稿を受け付けた広告コンテンツに関する情報や、広告主に関する情報を取得する。また、取得部131は、検索サーバ30から検索クエリに関する情報を取得する。
(About the acquisition unit 131)
The acquisition unit 131 acquires various types of information used for keyword extraction processing. Information acquired by the acquisition unit 131 is used for calculation processing and extraction processing described later. For example, the acquisition unit 131 acquires information related to the advertising content accepted by the submission receiving unit 138 and information related to the advertiser as test data for calculating the weight for each extraction model. In addition, the acquisition unit 131 acquires information related to the search query from the search server 30.

そして、取得部131は、抽出制御部132からの要求に従い、取得した情報を抽出制御部132に送る。なお、図3に示すように、取得部131は、取得した情報を算出データ記憶部121内に格納してもよい。この場合、抽出制御部132は、算出データ記憶部121内に格納された情報を抽出処理等に用いる。   Then, the acquisition unit 131 sends the acquired information to the extraction control unit 132 in accordance with a request from the extraction control unit 132. As illustrated in FIG. 3, the acquisition unit 131 may store the acquired information in the calculation data storage unit 121. In this case, the extraction control unit 132 uses information stored in the calculated data storage unit 121 for extraction processing and the like.

(抽出制御部132について)
抽出制御部132は、キーワードの抽出処理を制御する。図3に示すように、抽出制御部132は、第1抽出部133と、第2抽出部134と、第3抽出部135と、算出部136と、第4抽出部137とを有する。
(About the extraction control unit 132)
The extraction control unit 132 controls keyword extraction processing. As illustrated in FIG. 3, the extraction control unit 132 includes a first extraction unit 133, a second extraction unit 134, a third extraction unit 135, a calculation unit 136, and a fourth extraction unit 137.

(第1抽出部133について)
第1抽出部133は、第1抽出モデルによるキーワードの抽出処理を実行する。第1抽出モデルは、広告主が提供するLPに関する情報や、LPから生成される単語ベクトルに基づいて、適切な入札キーワードを抽出する手法である。以下に、第1抽出モデルがキーワードを抽出する処理について説明する。
(About the first extraction unit 133)
The first extraction unit 133 executes keyword extraction processing based on the first extraction model. The first extraction model is a technique for extracting appropriate bid keywords based on information about LPs provided by advertisers and word vectors generated from LPs. Below, the process in which a 1st extraction model extracts a keyword is demonstrated.

第1抽出部133は、取得部131によって取得されたLPや入札キーワードの特徴情報を生成する。例えば、第1抽出部133は、特徴情報として、現に広告コンテンツの入稿を受け付けている広告主が提供するLPや、抽出されたキーワードの提示対象である新規の広告主が提供するLPや、広告主が現に指定している入札キーワードに対応する各単語ベクトルを生成する。そして、第1抽出部133は、生成した単語ベクトルを第1テーブル122に格納する。   The first extraction unit 133 generates feature information of LPs and bid keywords acquired by the acquisition unit 131. For example, the first extraction unit 133 may include, as feature information, an LP provided by an advertiser who is currently accepting submission of advertising content, an LP provided by a new advertiser that is the target of the extracted keyword, Each word vector corresponding to the bid keyword currently designated by the advertiser is generated. Then, the first extraction unit 133 stores the generated word vector in the first table 122.

なお、LPに対応する単語ベクトルとは、例えば、LPに含まれる単語の種類と出現回数とに対して所定の重みを付した上で、LPをベクトルモデルで表現したものである。このように、第1抽出部133は、LPに出現する単語の傾向などを単語ベクトルで表すことにより、LPの特徴情報を生成する。   Note that the word vector corresponding to LP is, for example, a representation of LP by a vector model after giving a predetermined weight to the type and number of appearances of words included in LP. As described above, the first extraction unit 133 generates the feature information of the LP by expressing the tendency of the word appearing in the LP by the word vector.

具体的には、第1抽出部133は、LPに対応する単語ベクトルを生成する場合、LPのURLに基づいて、LPのデータを収集し、収集したLPのデータを取得する。そして、第1抽出部133は、例えば、LPに含まれるテキストを形態素解析する。すなわち、第1抽出部133は、LPに含まれるテキストを単語毎に分解する。そして、第1抽出部133は、LPに含まれる単語の種類と、LP内の単語の出現回数に基づいて、LPに対応する単語ベクトルを生成する。例えば、第1抽出部133は、LPに出現する単語について「1」の要素を与え、出現しない単語について「0」の要素を与えることで、LPに対応する単語ベクトルを生成する。   Specifically, when generating the word vector corresponding to the LP, the first extraction unit 133 collects the LP data based on the LP URL, and acquires the collected LP data. Then, the first extraction unit 133 performs morphological analysis on the text included in the LP, for example. That is, the 1st extraction part 133 decomposes | disassembles the text contained in LP for every word. Then, the first extraction unit 133 generates a word vector corresponding to the LP based on the type of word included in the LP and the number of appearances of the word in the LP. For example, the first extraction unit 133 generates a word vector corresponding to LP by providing an element “1” for a word that appears in LP and an element “0” for a word that does not appear.

また、第1抽出部133は、単語毎に重みを付与して、LPに対応する単語ベクトルを生成する。ここで、単語ベクトルの重みの付与に関しては、例えば、tf−idf(Term Frequency−Inverse Document Frequency)など既知の特徴抽出アルゴリズムにより特徴語を抽出する手法が考えられる。この場合、LPを特徴付ける特徴語として抽出された単語に関しては、第1抽出部133は、重みを重くして単語ベクトルを生成する。これにより、第1抽出部133は、LPの特徴を反映した単語ベクトルを生成することができる。   The first extraction unit 133 also assigns a weight to each word and generates a word vector corresponding to LP. Here, with respect to the weighting of the word vector, for example, a method of extracting a feature word by a known feature extraction algorithm such as tf-idf (Term Frequency-Inverse Document Frequency) can be considered. In this case, for the word extracted as a feature word that characterizes LP, the first extraction unit 133 generates a word vector with a higher weight. Thereby, the 1st extraction part 133 can generate | occur | produce the word vector reflecting the characteristic of LP.

なお、第1抽出部133は、上記のtf−idfではなく、tf−ilf(Term Frequency−Inverse Label Frequency)という手法を用いてもよい。上記のtf−idfにおいては、処理対象とする単語が全文書中においていくつの文書内で共通して使われているかを表す頻度としてdf(Document Frequency)を用いる(この場合、「文書」に対応するものはLPとなる)。これに対して、tf−ilfにおいては、LPに含まれる処理対象とする単語がどれくらいキーワード(すなわち、ラベル)に紐づけられているかを示す頻度(lf、Label Frequency)を用いる。   Note that the first extraction unit 133 may use a technique called tf-ilf (Term Frequency-Inverse Label Frequency) instead of the above-described tf-idf. In the above-described tf-idf, df (Document Frequency) is used as a frequency indicating how many documents are commonly used in all documents (in this case, it corresponds to “document”). What you do is LP). On the other hand, in tf-ilf, a frequency (lf, Label Frequency) indicating how much a word to be processed included in LP is linked to a keyword (that is, a label) is used.

この場合、第1抽出部133は、LPに対応する単語ベクトルについて、LP内の全ての単語の出現回数の総和、LP内に所定の単語が出現する回数及び所定の単語がキーワードと紐づく頻度に基づいて、所定の単語毎に重み付けがされた単語ベクトルを生成する。具体的には、第1抽出部133は、LP内の全ての単語の出現回数の総和とLP内に所定の単語が出現する回数との割合(すなわち、tf。所定の単語のLP内での出現頻度を示す)と、単語がキーワードと紐づく頻度(すなわち、lf)とに基づいて、LPに対応する単語ベクトルを生成する。これにより、第1抽出部133は、キーワードと極めて頻繁に紐づくような、ごくありふれた一般的な単語の重みが過度に重み付けられないよう、適切に重み付けのなされた単語ベクトルを生成する。このため、第1抽出部133は、より適切にLPの特徴を示す単語ベクトルを生成することができる。   In this case, for the word vector corresponding to LP, the first extraction unit 133 sums up the number of appearances of all words in the LP, the number of times a predetermined word appears in the LP, and the frequency with which the predetermined word is associated with the keyword. Based on the above, a word vector weighted for each predetermined word is generated. Specifically, the first extraction unit 133 determines the ratio between the total number of appearances of all words in the LP and the number of appearances of the predetermined word in the LP (that is, tf. The predetermined word in the LP). A word vector corresponding to LP is generated based on the frequency of appearance) and the frequency with which the word is associated with the keyword (ie, lf). Thus, the first extraction unit 133 generates a word vector that is appropriately weighted so that the weight of a common word that is very frequently associated with the keyword is not excessively weighted. For this reason, the 1st extraction part 133 can produce | generate the word vector which shows the characteristic of LP more appropriately.

また、第1抽出部133は、入札キーワードに対応する単語ベクトルを生成する。第1抽出部133は、入札キーワードに紐づくLPが複数ある場合には、入札キーワードに対応する単語ベクトルとして、入札キーワードに紐づけられた複数のLPに対応する各単語ベクトルの重心ベクトルを生成する。この点について、図9を用いて説明する。   In addition, the first extraction unit 133 generates a word vector corresponding to the bid keyword. When there are a plurality of LPs associated with the bid keyword, the first extraction unit 133 generates a centroid vector of each word vector corresponding to the plurality of LPs associated with the bid keyword as a word vector corresponding to the bid keyword. To do. This point will be described with reference to FIG.

図9は、実施形態に係る第1抽出モデルによる抽出処理の一例を示す概念図である。図9に示すように、入札キーワードK101には、LP01、LP02、LP03、・・・、が紐づけられている。第1抽出部133は、LP01、LP02、LP03、・・・、の各々に対応する単語ベクトルV01、V02、V03、・・・、を生成する。そして、第1抽出部133は、入札キーワードK001に対応する単語ベクトルとして、生成した各LPの単語ベクトルの重心ベクトルを生成する。すなわち、第1抽出部133は、各LPの単語ベクトルの重心ベクトルを、入札キーワードK001の単語ベクトルG01として生成する。このように、第1抽出部133は、紐づけられている複数のLPの各単語ベクトルの重心ベクトルを用いて入札キーワードに対応する単語ベクトルを生成するので、入札キーワードの特徴を適切に示す単語ベクトルを生成することができる。   FIG. 9 is a conceptual diagram illustrating an example of extraction processing by the first extraction model according to the embodiment. As shown in FIG. 9, LP01, LP02, LP03,... Are associated with the bid keyword K101. The first extraction unit 133 generates word vectors V01, V02, V03,... Corresponding to LP01, LP02, LP03,. And the 1st extraction part 133 produces | generates the gravity center vector of the word vector of each produced | generated LP as a word vector corresponding to the bid keyword K001. That is, the first extraction unit 133 generates the centroid vector of the word vector of each LP as the word vector G01 of the bid keyword K001. Thus, since the 1st extraction part 133 produces | generates the word vector corresponding to a bid keyword using the gravity vector of each word vector of several LP linked, the word which shows the characteristic of a bid keyword appropriately A vector can be generated.

続いて、第1抽出部133が、実際に処理対象となるLPに対してキーワードを抽出する例を説明する。まず、第1抽出部133は、キーワードに紐づけられた既存のLPの特徴情報と、任意の単語を含む処理対象のLPとの特徴情報との類似度を算定する。ここで、処理対象のLPとは、広告配信サービスにおいて、入札キーワードの抽出を所望する広告主が提供するLPのことをいう。   Next, an example in which the first extraction unit 133 extracts keywords from the LP that is actually the processing target will be described. First, the first extraction unit 133 calculates the similarity between the feature information of the existing LP linked to the keyword and the feature information of the processing target LP including an arbitrary word. Here, the processing target LP refers to an LP provided by an advertiser who desires to extract bid keywords in the advertisement distribution service.

なお、広告装置100は、広告配信サービスにおいて、複数のキーワードの入札や、複数の広告コンテンツの入稿を受け付けているため、入札キーワードと既存のLPとの組み合わせは複数存在する。このとき、第1抽出部133は、特徴情報の類似度の算定をキーワード毎に実行する。図4を例とすると、第1抽出部133は、入札キーワードK101を処理対象とする場合には、入札キーワードK101と紐づけられた既存のLPであるLP01、LP02、LP03の各々の特徴情報と、処理対象のLPの特徴情報との類似度を算定する。すなわち、第1抽出部133は、入札キーワードと既存のLPが紐づけられた複数の組み合わせについて、入札キーワード毎に、入札キーワードに紐づけられた全ての既存のLPの特徴情報と、処理対象のLPの特徴情報との類似度を算定する。   Since the advertising device 100 accepts bids for a plurality of keywords and submission of a plurality of advertisement contents in the advertisement distribution service, there are a plurality of combinations of bid keywords and existing LPs. At this time, the first extraction unit 133 calculates the similarity of the feature information for each keyword. Taking FIG. 4 as an example, when the bid keyword K101 is the processing target, the first extraction unit 133 includes the feature information of each of the existing LPs LP01, LP02, and LP03 associated with the bid keyword K101. The similarity with the feature information of the processing target LP is calculated. That is, the first extraction unit 133 includes, for each bid keyword, the feature information of all the existing LPs associated with the bid keyword and the processing target for a plurality of combinations associated with the bid keyword and the existing LP. The similarity with the feature information of LP is calculated.

上述のように、第1抽出部133は、特徴情報として単語ベクトルを用いる。例えば、第1抽出部133は、既存のLPの特徴情報に基づいて生成される、入札キーワードに対応する単語ベクトルと、処理対象のLPに対応する単語ベクトルとの類似度を算定する。具体的には、第1抽出部133は、既存のLPに紐づくキーワードに対応する単語ベクトルと、処理対象のLPに対応する単語ベクトルとの類似度として、単語ベクトル同士のコサイン類似度を算定する。すなわち、第1抽出部133は、算定処理の対象となる二つの単語ベクトルのコサイン類似度を算定する。上述のように、第1抽出部133がLPに出現する単語について「1」の要素を与え、出現しない単語について「0」の要素を与えて、LPに対応する単語ベクトルを生成した場合には、第1抽出部133は、二つの単語ベクトルのコサイン類似度として「0〜1」の範囲で示される所定の数値を算定する。   As described above, the first extraction unit 133 uses a word vector as feature information. For example, the first extraction unit 133 calculates the similarity between the word vector corresponding to the bid keyword and the word vector corresponding to the processing target LP, which is generated based on the existing LP feature information. Specifically, the first extraction unit 133 calculates the cosine similarity between the word vectors as the similarity between the word vector corresponding to the keyword associated with the existing LP and the word vector corresponding to the processing target LP. To do. That is, the 1st extraction part 133 calculates the cosine similarity of two word vectors used as the object of calculation processing. As described above, when the first extraction unit 133 gives an element “1” for a word that appears in LP and gives an element “0” for a word that does not appear, and generates a word vector corresponding to LP The first extraction unit 133 calculates a predetermined numerical value indicated in the range of “0 to 1” as the cosine similarity between the two word vectors.

なお、第1抽出部133は、類似度を算定する際に、類似度が比較的高くなると想定される単語ベクトル同士を抽出して、抽出された単語ベクトル同士の類似度を算定するようにしてもよい。例えば、第1抽出部133は、Top−k retrieval(Top−k検索)のようなアルゴリズムを用いて処理対象を抽出する。すなわち、第1抽出部133は、所定の手法(例えば、上述したtf−ilf)で付与されるスコアによって順序付けられた単語ベクトルの上位k個(kは任意の数)を抽出し、抽出された単語ベクトル同士の類似度を算定する。これにより、第1抽出部133は、スコアの低い処理対象については処理をスキップするので、高速に類似度の算定を行うことができる。   In addition, when calculating the degree of similarity, the first extraction unit 133 extracts word vectors that are assumed to have a relatively high degree of similarity, and calculates the degree of similarity between the extracted word vectors. Also good. For example, the first extraction unit 133 extracts a processing target using an algorithm such as Top-k retry (Top-k search). That is, the first extraction unit 133 extracts and extracts the top k word vectors (k is an arbitrary number) of word vectors ordered by a score given by a predetermined method (for example, tf-ilf described above). The similarity between word vectors is calculated. Thereby, since the 1st extraction part 133 skips a process about the process target with a low score, it can calculate a similarity at high speed.

また、第1抽出部133は、キーワードに紐づけられた既存のLPが複数ある場合には、キーワードに紐づけられた複数の既存のLPに対応する各単語ベクトルの重心ベクトルと、処理対象のLPに対応する単語ベクトルとの類似度を算定する。また、第1抽出部133は、算定された類似度が所定の閾値以上である複数の既存のLPに紐づくキーワードを抽出する。このように、第1抽出部133は、他の広告主が入札キーワードとしている複数の既存のLPの特徴を平均化して捉える。このため、第1抽出部133は、複数の既存のLPがキーワードに紐づく状況を加味して類似度を算定することができる。   In addition, when there are a plurality of existing LPs associated with the keyword, the first extraction unit 133 determines the centroid vector of each word vector corresponding to the plurality of existing LPs associated with the keyword, and the processing target The similarity with the word vector corresponding to LP is calculated. Further, the first extraction unit 133 extracts keywords associated with a plurality of existing LPs whose calculated similarity is equal to or greater than a predetermined threshold. Thus, the 1st extraction part 133 averages and grasps the feature of a plurality of existing LPs which other advertisers use as a bid keyword. For this reason, the 1st extraction part 133 can calculate a similarity degree in consideration of the situation where a plurality of existing LPs are associated with keywords.

上記のように、第1抽出部133は、既存のLPに紐づくキーワードが有する特徴情報と、処理対象のLPの特徴情報との類似度を算定するので、キーワードと処理対象のLPとの関連性を数値により示すことができる。   As described above, the first extraction unit 133 calculates the degree of similarity between the feature information of the keyword associated with the existing LP and the feature information of the processing target LP, and thus the relationship between the keyword and the processing target LP. Sex can be shown numerically.

そして、第1抽出部133は、算定された特徴情報の類似度が所定の閾値以上である特徴情報に対応するキーワードを抽出する。具体的には、第1抽出部133は、算定された単語ベクトルのコサイン類似度に基づき、コサイン類似度が所定の閾値以上である単語ベクトルに対応するキーワードを抽出する。   Then, the first extraction unit 133 extracts a keyword corresponding to the feature information whose calculated feature information similarity is equal to or greater than a predetermined threshold. Specifically, the first extraction unit 133 extracts a keyword corresponding to a word vector whose cosine similarity is equal to or greater than a predetermined threshold based on the calculated cosine similarity of the word vector.

例えば、第1抽出部133は、単語ベクトル同士のコサイン類似度が高いほど(すなわち、「1」の値に近いほど)、算定対象となった単語ベクトルに対応するキーワードとLPとの関連性が高いものと判定する。そのため、第1抽出部133は、類似度に所定の閾値を設定し、所定の閾値以上の類似度に係る単語ベクトルに対応するキーワードを抽出する。第1抽出部133は、所定の閾値を任意に設定することができる。例えば、第1抽出部133は、抽出するキーワードの数に応じて、所定の閾値を設定する。すなわち、第1抽出部133は、多数のキーワードを抽出する場合には、所定の閾値を低く設定してもよい。   For example, the higher the cosine similarity between the word vectors (that is, the closer to the value of “1”), the more the first extraction unit 133 has a relationship between the keyword corresponding to the calculated word vector and LP. Judge as high. Therefore, the first extraction unit 133 sets a predetermined threshold for the similarity, and extracts a keyword corresponding to the word vector related to the similarity equal to or higher than the predetermined threshold. The first extraction unit 133 can arbitrarily set a predetermined threshold value. For example, the first extraction unit 133 sets a predetermined threshold according to the number of keywords to be extracted. That is, the first extraction unit 133 may set the predetermined threshold value low when extracting a large number of keywords.

このように、実施形態に係る第1抽出部133は、処理対象となるLPと特徴が類似する既存のLPに紐づけられている入札キーワードを抽出する。このため、第1抽出部133によれば、現時点において、検索連動型の広告配信サービスを利用する他の広告主が入札しているキーワードと既存のLPとの情報に基づいて、処理対象となるLPに紐づかせるキーワードを抽出することができる。   As described above, the first extraction unit 133 according to the embodiment extracts a bid keyword associated with an existing LP having similar characteristics to the LP to be processed. For this reason, according to the 1st extraction part 133, it becomes processing object based on the information and keyword which the other advertiser using the search interlocking type | formula advertisement delivery service is bidding at present, and existing LP. It is possible to extract a keyword associated with the LP.

また、詳しくは後述するが、第1抽出部133は、算出部136が第1抽出モデルに対して重み付けを算出しようとする場合には、取得部131から取得したテストデータに基づいて抽出されたキーワードと、抽出されたキーワードに関する評価値である類似度とに関する情報を算出部136に送る。   In addition, as will be described in detail later, the first extraction unit 133 is extracted based on the test data acquired from the acquisition unit 131 when the calculation unit 136 intends to calculate a weight for the first extraction model. Information relating to the keyword and the similarity that is the evaluation value related to the extracted keyword is sent to the calculation unit 136.

(第2抽出部134について)
第2抽出部134は、第2抽出モデルによるキーワードの抽出処理を実行する。第2抽出モデルは、広告主から実際に入稿された入札キーワードの共起性に基づいて、適切な入札キーワードを抽出する手法である。以下に、第2抽出モデルがキーワードを抽出する処理について説明する。
(About the second extraction unit 134)
The second extraction unit 134 executes keyword extraction processing based on the second extraction model. The second extraction model is a technique for extracting an appropriate bid keyword based on the co-occurrence of bid keywords actually submitted by the advertiser. Below, the process in which a 2nd extraction model extracts a keyword is demonstrated.

第2抽出部134は、取得部131によって取得された入札キーワードに関する情報に基づいて、入札キーワードの組合せを生成する。なお、第2抽出部134は、入札キーワードを指定した広告主毎に入札キーワードの組合せを生成する。   The second extraction unit 134 generates a combination of bid keywords based on the information regarding the bid keyword acquired by the acquisition unit 131. Note that the second extraction unit 134 generates a combination of bid keywords for each advertiser who has designated a bid keyword.

具体的には、第2抽出部134は、図5及び図6に示すように、広告主CL21が入札したキーワードK001と、キーワードK002については、組合せ(K001,K002)を生成する。一方、第2抽出部134は、広告主CL21が入札したキーワードK001と、広告主CL22が入札したキーワードK011については、組合せ(K001,K011)を生成しない。ただし、第2抽出部134は、広告主CL23がキーワードK001とキーワードK011とについて入札していた場合には、組合せ(K001,K011)を生成する。そして、第2抽出部134は、生成した組合せに関する情報を第2テーブルB124に格納する。   Specifically, as illustrated in FIGS. 5 and 6, the second extraction unit 134 generates a combination (K001, K002) for the keyword K001 bid by the advertiser CL21 and the keyword K002. On the other hand, the second extraction unit 134 does not generate a combination (K001, K011) for the keyword K001 bid by the advertiser CL21 and the keyword K011 bid by the advertiser CL22. However, when the advertiser CL23 bids for the keyword K001 and the keyword K011, the second extraction unit 134 generates a combination (K001, K011). And the 2nd extraction part 134 stores the information regarding the produced | generated combination in 2nd table B124.

このように、第2抽出部134は、入札されている全てのキーワードの組合せを生成するのではなく、広告主毎に入札されているキーワードの組合せを生成する。すなわち、第2抽出部134は、一の広告主が同時に入札しているキーワードの組が多いほど、多くの組合せを生成する。例えば、キーワードK001とともにキーワードK002に入札している広告主が多いほど、第2抽出部134は、組合せ(K001,K002)を多く生成することになる。   As described above, the second extraction unit 134 does not generate a combination of all the bid keywords, but generates a combination of keywords that are bid for each advertiser. In other words, the second extraction unit 134 generates more combinations as the number of keyword sets that one advertiser is bidding simultaneously increases. For example, as the number of advertisers bidding on the keyword K002 together with the keyword K001 increases, the second extraction unit 134 generates more combinations (K001, K002).

続いて、第2抽出部134は、キーワードを指定した指定者毎に生成されるキーワードの各組合せの評価値を算定する。具体的には、第2抽出部134は、広告主毎に生成される組合せであって、広告主が提供するコンテンツに紐づくキーワードである入札キーワードの組合せの評価値として、組合せの重みを示す重み値を算定する。   Then, the 2nd extraction part 134 calculates the evaluation value of each combination of the keyword produced | generated for every designated person who designated the keyword. Specifically, the second extraction unit 134 indicates a combination weight as an evaluation value of a combination of bid keywords, which is a combination generated for each advertiser and is a keyword associated with content provided by the advertiser. Calculate the weight value.

例えば、第2抽出部134は、生成されるキーワードの組合せの数に応じて、組合せの重み値を算定する。すなわち、第2抽出部134は、生成される数が多い組合せほど、多くの広告主が同時に入札しているキーワード同士の組合せであるから、重要性が高いものとして重み値を高く算定する。   For example, the second extraction unit 134 calculates a combination weight value according to the number of keyword combinations to be generated. In other words, the second extraction unit 134 calculates a higher weight value because the combination with a larger number of generated keywords is a combination of keywords that many advertisers bid simultaneously.

また、この場合、第2抽出部134は、キーワードの組合せを正例とした線形モデルを学習することで、各組合せの重み値を算定してもよい。この点について、図10を用いて説明する。   In this case, the second extraction unit 134 may calculate a weight value of each combination by learning a linear model with keyword combinations as positive examples. This point will be described with reference to FIG.

図10は、実施形態に係る第2抽出モデルによる算定処理の一例を示す概念図である。図10に示すように、広告主CL21は、入札キーワードK001、入札キーワードK002、入札キーワードK003、・・・、を有する。同様に、広告主CL22は、入札キーワードK011、入札キーワードK002、入札キーワードK003、・・・、を有する。同様に、広告主CL23は、入札キーワードK001、入札キーワードK011、入札キーワードK111、・・・、を有する。   FIG. 10 is a conceptual diagram illustrating an example of calculation processing using the second extraction model according to the embodiment. As shown in FIG. 10, the advertiser CL21 has a bid keyword K001, a bid keyword K002, a bid keyword K003,. Similarly, the advertiser CL22 has a bid keyword K011, a bid keyword K002, a bid keyword K003,. Similarly, the advertiser CL23 has a bid keyword K001, a bid keyword K011, a bid keyword K111,.

この場合、第2抽出部134は、広告主CL21の入札キーワードに基づき、組合せ(K001,K002)、組合せ(K001,K003)、組合せ(K002,K003)を生成する。同様に、第2抽出部134は、広告主CL22の入札キーワードに基づき、組合せ(K011,K002)、組合せ(K011,K003)、組合せ(K002,K003)を生成する。同様に、第2抽出部134は、広告主CL23の入札キーワードに基づき、組合せ(K001,K011)、組合せ(K001,K111)、組合せ(K011,K111)を生成する。   In this case, the second extraction unit 134 generates a combination (K001, K002), a combination (K001, K003), and a combination (K002, K003) based on the bid keyword of the advertiser CL21. Similarly, the second extraction unit 134 generates a combination (K011, K002), a combination (K011, K003), and a combination (K002, K003) based on the bid keyword of the advertiser CL22. Similarly, the second extraction unit 134 generates a combination (K001, K011), a combination (K001, K111), and a combination (K011, K111) based on the bid keyword of the advertiser CL23.

このように、第2抽出部134は、広告装置100にキーワードを入札している全ての広告主について、広告主毎に、キーワードの組合せを生成する。そして、第2抽出部134は、全てのキーワードの組合せについて、キーワードの組合せを正例とした線形モデルを学習することで、各組合せの重み値を算定する。線形モデルの一例として、第2抽出部134は、下記式(1)に示すような回帰式を求める。   As described above, the second extraction unit 134 generates a combination of keywords for each advertiser for all advertisers who bid on the advertising device 100 for keywords. Then, the second extraction unit 134 calculates a weight value of each combination by learning a linear model using the keyword combination as a positive example for all keyword combinations. As an example of a linear model, the second extraction unit 134 obtains a regression equation as shown in the following equation (1).

y = a・x + a・x + ・・・ +a・x ・・・ (1) y = a 1 · x 1 + a 2 · x 2 + ... + a n · x n (1)

上記式(1)のうち、「y」は、各組合せを有する例が存在するか否かを示す。ここでは、各組合せを有する例は広告主であり、第2抽出部134は、キーワードの組合せを有する広告主を例として学習するため、原則として、「y」=「1」となる。   In the above formula (1), “y” indicates whether there is an example having each combination. Here, an example having each combination is an advertiser, and the second extraction unit 134 learns by taking an advertiser having a combination of keywords as an example, so that “y” = “1” in principle.

また、上記式(1)のうち、「x」(nは任意の数)は、キーワードの組合せを示す。例えば、「x」〜「x」には、キーワードの組合せ(kw,kw)が割り当てられる。図10の場合、例えば、「x」には組合せ(K001,K002)が割り当てられ、「x」には組合せ(K001,K003)が割り当てられ、「x」には組合せ(K002,K003)が割り当てられ、「x」には組合せ(K011,K002)が割り当てられ、「x」には組合せ(K011,K003)が割り当てられ、「x」には組合せ(K001,K011)が割り当てられ、「x」には組合せ(K001,K111)が割り当てられ、「x」には組合せ(K011,K111)が割り当てられる。ここでは、キーワードの組合せを正例とするため、各広告主について、キーワードの組合せ(kw,kw)が存在する場合には「xn」=「1」となり、存在しない場合には「0」となる。また、上記式(1)のうち、「a」は、「x」〜「x」の係数を示す。ここでは、「a」は、キーワードの組合せの各々を示す「x」〜「x」の重み値を示す。 In the above formula (1), “x n ” (n is an arbitrary number) indicates a combination of keywords. For example, keyword combinations (kw i , kw j ) are assigned to “x 1 ” to “x n ”. For Figure 10, for example, the combination in "x 1" (K001, K002) are assigned, is assigned a combination in the "x 2" (K001, K003), the combination in the "x 3" (K002, K003 ) is assigned, combining the "x 4" (K011, K002) are allocated, "x 5" combination (K011, K003) is assigned to the combination in the "x 6" (K001, K011) are assigned, combinations (K001, K111) are assigned to the "x 7", a combination (K011, K111) is assigned to "x 8". Here, since the keyword combination is a positive example, for each advertiser, when the keyword combination (kw i , kw j ) exists, “x n” = “1”, otherwise, “ 0 ". In the above formula (1), “a n ” represents a coefficient of “x 1 ” to “x n ”. Here, “a n ” indicates a weight value of “x 1 ” to “x n ” indicating each combination of keywords.

そして、第2抽出部134は、上記式(1)の重み値aをパラメータとし、例えば、SVM(Support Vector Machine)のようなパターン識別機を用いたサポートベクタ回帰などの回帰分析手法により調整を行う。すなわち、第2抽出部134は、上記式(1)で表される全ての広告主について、上記式(1)を満たすように、重み値aの値(サンプルとなる広告主の数によっては、求められる重み値aは近似値でもよい)を求める。 The second extraction unit 134, the weight value a n of the above formula (1) as a parameter, for example, adjusted by regression analysis method, such as support vector regression using pattern recognition machine, such as of SVM (Support Vector Machine) I do. That is, the second extraction unit 134, for all advertisers represented by the above formula (1), so as to satisfy the above formula (1), the number of advertisers to be a value (sample weight value a n is , the weight value a n obtained finds also be) in approximation.

例えば、第2抽出部134は、図10に示すように、組合せ(K001,K002)の重み値として「0.6」を、組合せ(K001,K003)の重み値として「0.3」を、組合せ(K002,K003)の重み値として「0.2」等を算定する。そして、第2抽出部134は、算定した重み値を各組合せに対応付けて、第2テーブルB124に格納する。   For example, as shown in FIG. 10, the second extraction unit 134 sets “0.6” as the weight value of the combination (K001, K002), “0.3” as the weight value of the combination (K001, K003), “0.2” or the like is calculated as the weight value of the combination (K002, K003). And the 2nd extraction part 134 matches the calculated weight value with each combination, and stores it in 2nd table B124.

続いて、第2抽出部134が、実際に処理対象となる広告主に対してキーワードを抽出する例を説明する。第2抽出部134は、組合せの評価値として算定した重み値に基づいて、広告配信サービスを利用する広告主から新たに指定される入札キーワードを含む組合せから、指定された入札キーワード以外のキーワードを抽出する。具体的には、処理対象となる広告主が入札キーワード「K001」を指定していたとする。このとき、第2抽出部134は、生成した組合せのうち、(K001,kw)である全ての組合せの重み値を比較する。そして、第2抽出部134は、最も重み値の高い組合せに含まれるキーワードであって、指定された入札キーワード「K001」以外のキーワードを抽出する。すなわち、抽出されたキーワードは、処理対象となる広告主が入札キーワード「K001」以外に追加する入札キーワードとして最も適切なキーワードであると第2抽出部134に判定されたキーワードである。 Next, an example in which the second extraction unit 134 extracts keywords for an advertiser that is actually a processing target will be described. Based on the weight value calculated as the evaluation value of the combination, the second extraction unit 134 selects keywords other than the specified bid keyword from the combination including the bid keyword newly specified by the advertiser who uses the advertisement distribution service. Extract. Specifically, it is assumed that the advertiser to be processed has designated the bid keyword “K001”. In this case, the second extraction unit 134, of the generated combination, to compare the weight values of all combinations are (K001, kw j). Then, the second extraction unit 134 extracts keywords other than the designated bid keyword “K001”, which are keywords included in the combination having the highest weight value. That is, the extracted keyword is a keyword determined by the second extraction unit 134 as the most appropriate keyword to be added by the advertiser to be processed in addition to the bid keyword “K001”.

なお、第2抽出部134は、広告主により新たに指定される入札キーワードが複数ある場合には、新たに指定される入札キーワードと他のキーワードとの組合せの重み値の和に基づいて、組合せに含まれる他のキーワードを抽出する。例えば、第2抽出部134は、広告主が既に入札しているキーワードから生成される組合せのうち、新たな入札キーワードを含む複数の組合せの重み値の和が最も高くなるような複数の組合せを抽出する。そして、第2抽出部134は、抽出した複数の組合せに含まれるキーワードであって、入札キーワードとは異なるキーワードを抽出する。   In addition, when there are a plurality of bid keywords newly designated by the advertiser, the second extraction unit 134 determines a combination based on the sum of weight values of combinations of the newly designated bid keyword and other keywords. Extract other keywords included in. For example, the second extraction unit 134 selects a plurality of combinations that have the highest sum of weight values of a plurality of combinations including a new bid keyword among combinations generated from keywords already bid by the advertiser. Extract. Then, the second extraction unit 134 extracts keywords that are included in the extracted combinations and that are different from the bid keywords.

上記の処理のうち、第2抽出部134は、各組合せに共通して含まれるキーワードと、入札キーワードとの組合せにおける指標値の和に基づいて、広告主に提示するキーワードを抽出してもよい。例えば、第2抽出部134は、広告主が既に入札しているキーワードから生成される組合せのうち、新たな入札キーワードを含む組合せであって、入札キーワードとともに組合せに含まれる他のキーワードが共通する組合せ同士の重み値の和を比較する。そして、第2抽出部134は、比較した複数の組合せの重み値の和に基づいて、各組合せに共通するキーワードを抽出する。これにより、第2抽出部134は、入札キーワードとの共起性がより高い共通したキーワードを抽出することができる。   Among the above processes, the second extraction unit 134 may extract a keyword to be presented to the advertiser based on a sum of index values in a combination of a keyword commonly included in each combination and a bid keyword. . For example, the second extraction unit 134 is a combination including a new bid keyword among the combinations generated from keywords already bid by the advertiser, and other keywords included in the combination are common with the bid keyword. The sum of the weight values between the combinations is compared. And the 2nd extraction part 134 extracts the keyword common to each combination based on the sum of the weight value of the compared several combination. Thereby, the 2nd extraction part 134 can extract a common keyword with higher co-occurrence with a bid keyword.

上記の抽出処理について、一例を挙げて説明する。例えば、第2抽出部134は、重み値の和に基づき抽出処理を行うため、広告主毎に、組合せの存否及び組合せの重み値を変数として生成される関数を求める。そして、第2抽出部134は、新たに指定される入札キーワードを含むいずれかの組合せに対応する変数を加えた場合に、関数が示す値を最適化する変数に対応する組合せの中から、入札キーワードとは異なる他のキーワードを抽出する。   The extraction process will be described with an example. For example, since the second extraction unit 134 performs the extraction process based on the sum of the weight values, the second extraction unit 134 obtains a function that is generated for each advertiser using the presence / absence of the combination and the weight value of the combination as variables. Then, when the second extraction unit 134 adds a variable corresponding to any combination including the newly specified bid keyword, the second extraction unit 134 selects a bid from the combinations corresponding to the variable that optimizes the value indicated by the function. Another keyword different from the keyword is extracted.

例えば、第2抽出部134は、組合せの存否及び組合せの重み値を変数として生成される関数の一例として、下記式(2)で表される関数を求める。   For example, the second extraction unit 134 obtains a function represented by the following formula (2) as an example of a function generated using the presence / absence of the combination and the weight value of the combination as variables.

広告主のスコア = Σ(w_kwij) × (kw,kw) ・・・ (2) Advertiser score = Σ (w_kw ij ) × (kw i , kw j ) (2)

上記式(2)のうち、「(w_kwij)」は、組合せ(kw,kw)に対応する重み値を示す。また、「(kw,kw)」は、組合せ(kw,kw)が存在するか否かを示す。例えば、処理対象である広告主が組合せ(kw,kw)を有する場合には、「(kw,kw)」=「1」となる。一方、広告主が組合せ(kw,kw)を有しない場合には、「(kw,kw)」=「0」となる。 In the above equation (2), “(w_kw ij )” indicates a weight value corresponding to the combination (kw i , kw j ). Further, “(kw i , kw j )” indicates whether or not a combination (kw i , kw j ) exists. For example, when the advertiser to be processed has a combination (kw i , kw j ), “(kw i , kw j )” = “1”. On the other hand, when the advertiser does not have the combination (kw i , kw j ), “(kw i , kw j )” = “0”.

上記式(2)において、第2抽出部134は、入札キーワード「(kw)」を含む任意の組合せ(kw,kw)に対応する変数を加えるとする。すなわち、第2抽出部134は、任意の組合せ(kw,kw)が存在することを示す「1」の値と、任意の組合せ(kw,kw)に対応する重み値を乗算した変数を上記式(2)に加える。上記の例では、加えられる変数の値が大きいほど、他の広告主との共起性を伴う適切なキーワードが含まれる組合せを広告主が有することを示す。すなわち、広告主のスコアが大きくなるほど、広告主のスコアが改善されたといえる。そして、広告主のスコアが最大となる場合に、上記関数が示す値が最適化されたといえる。ゆえに、第2抽出部134は、入札キーワード「(kw)」と、任意のキーワード「kw」とを含む組合せに対応する変数のいずれかを上記式(2)に加え、最もスコアを上昇させる変数に対応する組合せ(kw,kw)を抽出する。そして、第2抽出部134は、組合せ(kw,kw)に含まれる任意のキーワード「kw」を抽出する。 In the above formula (2), it is assumed that the second extraction unit 134 adds a variable corresponding to an arbitrary combination (kw e , kw j ) including the bid keyword “(kw e )”. That is, the second extraction unit 134 multiplies the value “1” indicating that an arbitrary combination (kw e , kw j ) exists and the weight value corresponding to the arbitrary combination (kw e , kw j ). Variables are added to equation (2) above. In the above example, the larger the value of the added variable, the more the advertiser has a combination including appropriate keywords with co-occurrence with other advertisers. In other words, it can be said that the advertiser's score improved as the advertiser's score increased. And when an advertiser's score becomes the maximum, it can be said that the value which the said function shows was optimized. Therefore, the second extraction unit 134 adds one of the variables corresponding to the combination including the bid keyword “(kw e )” and the arbitrary keyword “kw j ” to the above formula (2), and increases the score most. A combination (kw e , kw j ) corresponding to the variable to be extracted is extracted. Then, the second extraction unit 134 extracts an arbitrary keyword “kw j ” included in the combination (kw e , kw j ).

上述した第2抽出部134の抽出処理について、図11を用いて、具体的に説明する。図11は、実施形態に係る第2抽出モデルによる抽出処理の一例を示す概念図である。図11に示す例では、広告主CL10は、新たにキーワード「K001」及び「K011」を指定して、入札を行うものとする。なお、各組合せの重み値は、図10で示された重み値を用いる。   The extraction process of the second extraction unit 134 described above will be specifically described with reference to FIG. FIG. 11 is a conceptual diagram illustrating an example of extraction processing by the second extraction model according to the embodiment. In the example illustrated in FIG. 11, it is assumed that the advertiser CL10 bids by newly specifying the keywords “K001” and “K011”. In addition, the weight value shown in FIG. 10 is used as the weight value of each combination.

第2抽出部134は、広告主CL10から新たに指定された入札キーワード「K001」について、第2抽出部134によって算定された任意のキーワードとの組合せの重み値を参照する。図11に示すように、組合せ(K001,K002)の重み値は「0.6」であり、組合せ(K001,K003)の重み値は「0.3」であり、組合せ(K001,K111)の重み値は「0.15」である。また、広告主CL10から新たに指定された入札キーワード「K011」と任意のキーワードとの組合せの重み値の例としては、図11に示すように、組合せ(K011,K002)の重み値は「0.35」であり、組合せ(K011,K003)の重み値は「0.1」であり、組合せ(K011,K111)の重み値は「0.05」である。   The second extraction unit 134 refers to the weight value of the combination with the arbitrary keyword calculated by the second extraction unit 134 for the bid keyword “K001” newly designated by the advertiser CL10. As shown in FIG. 11, the weight value of the combination (K001, K002) is “0.6”, the weight value of the combination (K001, K003) is “0.3”, and the combination (K001, K111) The weight value is “0.15”. Further, as an example of the weight value of the combination of the bid keyword “K011” newly designated by the advertiser CL10 and an arbitrary keyword, as shown in FIG. 11, the weight value of the combination (K011, K002) is “0”. .35 ”, the weight value of the combination (K011, K003) is“ 0.1 ”, and the weight value of the combination (K011, K111) is“ 0.05 ”.

ここで、第2抽出部134は、上記式(2)を用いて、広告主CL10のスコアを求める。この例では、第2抽出部134は、入札キーワードと異なるキーワードとして、共通する一つのキーワードを抽出するものとする。   Here, the 2nd extraction part 134 calculates | requires the score of advertiser CL10 using the said Formula (2). In this example, the second extraction unit 134 extracts one common keyword as a keyword different from the bid keyword.

具体的には、第2抽出部134は、新たにキーワード「K001」及び「K011」を含む組合せであって、共通するキーワード「K002」を含む組合せである、組合せ(K001,K002)及び組合せ(K011,K002)に対応する変数を上記式(2)に加える。この場合、第2抽出部134は、上記式(2)より、組合せ(K001,K002)に対応する重み値「0.6」と、組合せ(K011,K002)に対応する重み値「0.35」に基づき、広告主CL10のスコアが「0.95」だけ上昇することを求める。同様に、第2抽出部134は、共通するキーワード「K003」の場合には、組合せ(K001,K003)に対応する重み値「0.3」と、組合せ(K011,K003)に対応する重み値「0.1」に基づき、広告主CL10のスコアが「0.4」だけ上昇することを求める。同様に、第2抽出部134は、共通するキーワード「K111」の場合には、組合せ(K001,K111)に対応する重み値「0.15」と、組合せ(K011,K111)に対応する重み値「0.05」に基づき、広告主CL10のスコアが「0.2」だけ上昇することを求める。   Specifically, the second extraction unit 134 is a combination that newly includes the keywords “K001” and “K011”, and includes a common keyword “K002”. The combination (K001, K002) and the combination ( The variable corresponding to K011, K002) is added to the above equation (2). In this case, the second extraction unit 134 calculates the weight value “0.6” corresponding to the combination (K001, K002) and the weight value “0.35” corresponding to the combination (K011, K002) from the above equation (2). ", The score of the advertiser CL10 is requested to increase by" 0.95 ". Similarly, in the case of the common keyword “K003”, the second extraction unit 134 uses the weight value “0.3” corresponding to the combination (K001, K003) and the weight value corresponding to the combination (K011, K003). Based on “0.1”, the score of advertiser CL10 is requested to increase by “0.4”. Similarly, in the case of the common keyword “K111”, the second extraction unit 134 uses the weight value “0.15” corresponding to the combination (K001, K111) and the weight value corresponding to the combination (K011, K111). Based on “0.05”, the score of advertiser CL10 is requested to increase by “0.2”.

なお、第2抽出部134は、図11に示す組合せ(K001,K211)と、組合せ(K011,K311)とについては、上記抽出処理に用いない。この場合、組合せ(kw,kw)において、任意のキーワード「kw」が共通していないため、第2抽出部134は、組合せ同士の重み値を比較することができないからである。 Note that the second extraction unit 134 does not use the combination (K001, K211) and the combination (K011, K311) illustrated in FIG. 11 for the extraction process. In this case, since the arbitrary keyword “kw j ” is not common in the combination (kw e , kw j ), the second extraction unit 134 cannot compare the weight values of the combinations.

そして、第2抽出部134は、上記結果に基づいて、広告主のスコアを最適化する組合せに共通して含まれるキーワード「K002」を抽出する。すなわち、第2抽出部134は、広告主CL10が新たに指定した入札キーワード「K001」及び「K011」に追加する適切な入札キーワードとして、キーワード「K002」を抽出する。   Then, based on the above result, the second extraction unit 134 extracts the keyword “K002” that is commonly included in the combination that optimizes the advertiser's score. That is, the second extraction unit 134 extracts the keyword “K002” as an appropriate bid keyword to be added to the bid keywords “K001” and “K011” newly specified by the advertiser CL10.

このように、実施形態に係る第2抽出部134は、広告配信サービスにおいて、実際にキーワードを入札している広告主毎に生成されるキーワードの組合せを抽出処理に用いる。このため、第2抽出部134によれば、広告主が指定するキーワード同士の関連性についても指標に含めた上で、新たなキーワードを抽出することができる。例えば、検索連動型の広告配信サービスにおいて、単に検索クエリとして入力されやすいキーワードを広告主に提示したとしても、広告コンテンツと関連性の低いキーワードでは、ユーザの意図と広告コンテンツの内容に齟齬が生じるため、十分に広告コンテンツの効果が発揮されないおそれがある。一方、第2抽出部134は、現時点で他の広告主が入札しているキーワードの組合せを利用してキーワードを抽出する。すなわち、抽出されるキーワードは、他の広告主が入札しているキーワードと共起性を有する。これにより、処理対象となる広告主は、広告装置100によって抽出されるキーワードであって、自身と関連性の高い他の広告主が入札しているキーワードを、適切に入札キーワードに追加することができる。   As described above, the second extraction unit 134 according to the embodiment uses a combination of keywords generated for each advertiser who actually bids for a keyword in the advertisement distribution service for the extraction process. For this reason, according to the 2nd extraction part 134, a new keyword can be extracted, after also including in the parameter | index the relevance of the keywords which an advertiser designates. For example, in a search-linked advertisement distribution service, even if a keyword that is easy to be input as a search query is presented to an advertiser, there is a discrepancy between the user's intention and the contents of the advertisement content if the keyword is not relevant to the advertisement content Therefore, there is a possibility that the effect of the advertising content is not sufficiently exhibited. On the other hand, the second extraction unit 134 extracts keywords by using a combination of keywords currently being bid by other advertisers. That is, the extracted keyword has co-occurrence with the keyword bid by other advertisers. As a result, the advertiser to be processed is a keyword extracted by the advertising device 100, and a keyword bid by another advertiser highly relevant to itself can be appropriately added to the bid keyword. it can.

また、第1抽出部133と同様に、第2抽出部134は、算出部136が第2抽出モデルに対して重み付けを算出しようとする場合には、取得部131から取得したテストデータに基づいて抽出されたキーワードと、抽出されたキーワードに関する評価値である重み値、又は、上述した広告主のスコアに関する情報を算出部136に送る。   Similarly to the first extraction unit 133, the second extraction unit 134, based on the test data acquired from the acquisition unit 131, when the calculation unit 136 intends to calculate weights for the second extraction model. The extracted keyword and the weight value, which is the evaluation value related to the extracted keyword, or the information related to the advertiser's score described above are sent to the calculation unit 136.

(第3抽出部135について)
第3抽出部135は、第3抽出モデルによるキーワードの抽出処理を実行する。第3抽出モデルは、検索サーバ30にユーザ端末10から送信された検索クエリの傾向に基づいて、適切な入札キーワードを抽出する手法である。以下に、第3抽出モデルがキーワードを抽出する処理について説明する。
(About the third extraction unit 135)
The third extraction unit 135 executes keyword extraction processing based on the third extraction model. The third extraction model is a technique for extracting an appropriate bid keyword based on the tendency of the search query transmitted from the user terminal 10 to the search server 30. Below, the process in which a 3rd extraction model extracts a keyword is demonstrated.

第3抽出部135は、取得部131が取得した検索クエリ及び再検索クエリに関する情報を処理に用いる。例えば、第3抽出部135は、検索クエリ及び再検索クエリがユーザ端末10から検索サーバ30に送信された回数や、検索クエリ及び再検索クエリに対応するLPや広告コンテンツや、検索クエリ及び再検索クエリを送信したユーザ端末10を識別する情報などを処理に用いる。   The third extraction unit 135 uses information related to the search query and re-search query acquired by the acquisition unit 131 for processing. For example, the third extraction unit 135 determines the number of times that the search query and the re-search query are transmitted from the user terminal 10 to the search server 30, LPs and advertisement content corresponding to the search query and the re-search query, the search query and the re-search Information for identifying the user terminal 10 that transmitted the query is used for the processing.

そして、第3抽出部135は、検索クエリと再検索クエリとの関連性を示す評価値を算定する。具体的には、第3抽出部135は、検索サービスにおいて、検索クエリを送信したユーザ端末10がどのような内容の再検索クエリを送信したか、といった検索の傾向を示す値である傾向値を算定する。   Then, the third extraction unit 135 calculates an evaluation value indicating the relevance between the search query and the re-search query. Specifically, in the search service, the third extraction unit 135 obtains a tendency value that is a value indicating a search tendency such as what kind of content the re-search query is transmitted by the user terminal 10 that has transmitted the search query. Calculate.

例えば、第3抽出部135は、検索クエリの送信後に再検索クエリが送信された回数に基づいて、検索クエリと再検索クエリとの関連性を示す評価値である傾向値を算定する。すなわち、第3抽出部135は、取得部131により取得される数がより多い再検索クエリほど、検索クエリを送信した後にさらに送信されやすい傾向にあるとして、かかる検索クエリに対する再検索クエリの傾向値が高くなるよう算定する。   For example, the third extraction unit 135 calculates a tendency value, which is an evaluation value indicating the relevance between the search query and the re-search query, based on the number of times the re-search query is transmitted after the search query is transmitted. That is, the third extraction unit 135 assumes that the re-search query acquired by the acquisition unit 131 is more likely to be transmitted after the search query is transmitted, and the re-search query tendency value for the search query is more likely to be transmitted. To be higher.

なお、第3抽出部135は、検索クエリと、検索クエリに基づいて抽出されたコンテンツ(例えば、LPや広告コンテンツ)を取得したユーザ端末10からさらに送信される再検索クエリとの関連性を示す評価値である傾向値を算定する。言い換えれば、第3抽出部135は、あらゆるユーザ端末10から送信される検索クエリと再検索クエリとの傾向値を算定するのではなく、検索クエリによって検索されたコンテンツを取得したユーザ端末10から送信される再検索クエリとの傾向値を算定する。これにより、第3抽出部135は、検索サービスにより検索されたコンテンツに対応する検索クエリと再検索クエリとの傾向値を算定するので、かかるコンテンツにおける検索傾向を明確に算定することができる。   Note that the third extraction unit 135 indicates the relationship between the search query and the re-search query further transmitted from the user terminal 10 that acquired the content (for example, LP or advertisement content) extracted based on the search query. The trend value that is the evaluation value is calculated. In other words, the third extraction unit 135 does not calculate the tendency value between the search query and the re-search query transmitted from any user terminal 10, but transmits from the user terminal 10 that acquired the content searched by the search query. Calculate the trend value with the re-search query. Thereby, since the 3rd extraction part 135 calculates the tendency value of the search query and re-search query corresponding to the content searched by the search service, it can calculate the search tendency in this content clearly.

また、第3抽出部135は、検索クエリに基づいて抽出されたコンテンツ毎に、検索クエリと再検索クエリとの傾向値を算定する。例えば、ユーザ端末10が検索サービスに対して検索クエリを送信した場合、複数のコンテンツが検索結果として抽出されうる。この場合、ユーザ端末10は、複数のコンテンツの中から選択したコンテンツ(例えば、検索結果ページ50において、リンク先をクリックしたコンテンツ)を取得する。そして、第3抽出部135は、ユーザによって選択されたコンテンツ毎に、検索クエリと再検索クエリとの傾向値を算定する。これにより、第3抽出部135は、検索サービスによって複数のコンテンツが抽出された場合であっても、特定のコンテンツにおける検索傾向を明確に算定することができる。   Further, the third extraction unit 135 calculates a tendency value between the search query and the re-search query for each content extracted based on the search query. For example, when the user terminal 10 transmits a search query to the search service, a plurality of contents can be extracted as search results. In this case, the user terminal 10 acquires content selected from a plurality of contents (for example, content clicked on a link destination in the search result page 50). And the 3rd extraction part 135 calculates the tendency value of a search query and a re-search query for every content selected by the user. Accordingly, the third extraction unit 135 can clearly calculate a search tendency in specific content even when a plurality of contents are extracted by the search service.

このように、第3抽出部135は、検索サーバ30に検索クエリが送信された結果として抽出された所定のLP毎に再検索クエリが送信された数に基づいて、傾向値を算定する。一例として、第3抽出部135は、所定のLPを表示するために送信された検索クエリの総数を分母とし、各々の再検索クエリが送信された数を分子とした数値を傾向値として算定する。この場合、算定される傾向値は、「0」乃至「1」の数値で表現される。あるいは、第3抽出部135は、検索クエリに対して再検索クエリがどのくらい関連しているかを、例えば、検索クエリ及び再検索クエリが送信された数や頻度に基づいて、既知の手法によりコサイン(cosine)で表現される類似度によって算定してもよい。この場合であっても、算定される傾向値は、「0」乃至「1」の数値で表現される。あるいは、第3抽出部135は、再検索クエリが送信された数をそのまま傾向値として扱ってもよい。   As described above, the third extraction unit 135 calculates the tendency value based on the number of re-search queries transmitted for each predetermined LP extracted as a result of the transmission of the search query to the search server 30. As an example, the third extraction unit 135 calculates, as a trend value, a numerical value with the total number of search queries transmitted to display a predetermined LP as a denominator and the number of each re-search query transmitted as a numerator. . In this case, the calculated tendency value is expressed by a numerical value of “0” to “1”. Alternatively, the third extraction unit 135 may determine how much the re-search query is related to the search query based on, for example, the cosine ( You may calculate by the similarity expressed by cosine. Even in this case, the calculated tendency value is expressed by a numerical value of “0” to “1”. Or the 3rd extraction part 135 may treat the number by which the re-search query was transmitted as a tendency value as it is.

そして、第3抽出部135は、算定した傾向値をコンテンツと対応付けて、第3テーブル125内に格納する。なお、第3抽出部135は、取得部131によって検索サーバ30から取得される検索クエリ及び再検索クエリに関する情報が随時変化する場合には、例えば、第3テーブル125内に格納した傾向値を所定のタイミングで更新するようにしてもよい。   Then, the third extracting unit 135 stores the calculated tendency value in the third table 125 in association with the content. In addition, when the information regarding the search query and the re-search query acquired from the search server 30 by the acquisition unit 131 changes at any time, the third extraction unit 135 determines the tendency value stored in the third table 125 as a predetermined value, for example. You may make it update at the timing of.

そして、第3抽出部135は、算定された評価値に基づいて、再検索クエリの中から、検索クエリに基づいて抽出される所定のコンテンツに紐づかせるキーワードを抽出する。具体的には、第3抽出部135は、算定された傾向値がより高い数値に対応する再検索クエリを、広告配信サービスにおいて広告コンテンツ又はLPに紐づかせるキーワードである入札キーワードの一例として抽出する。言い換えれば、第3抽出部135は、広告主に提示する入札キーワードの候補を抽出する。   And the 3rd extraction part 135 extracts the keyword linked | related with the predetermined content extracted based on a search query from a re-search query based on the calculated evaluation value. Specifically, the third extraction unit 135 extracts a re-search query corresponding to a numerical value having a higher calculated tendency value as an example of a bid keyword that is a keyword associated with the advertisement content or LP in the advertisement distribution service. To do. In other words, the third extraction unit 135 extracts bid keyword candidates to be presented to the advertiser.

なお、第3抽出部135は、検索クエリに基づいて抽出されたコンテンツを取得したユーザ端末10からさらに送信される再検索クエリとの傾向値を算定した場合には、ユーザ端末10によって取得されたコンテンツに紐づかせるキーワードを抽出する。すなわち、第3抽出部135は、算定された傾向値と、傾向値の算定に用いられたコンテンツとを対応付けてキーワードを抽出する。   In addition, the 3rd extraction part 135 was acquired by the user terminal 10, when calculating the tendency value with the re-search query further transmitted from the user terminal 10 which acquired the content extracted based on the search query Extract keywords associated with content. That is, the third extraction unit 135 extracts a keyword by associating the calculated tendency value with the content used for calculating the tendency value.

第3抽出部135の抽出処理について、図12を用いて、具体的に説明する。図12は、実施形態に係る第3抽出モデルによる抽出処理の一例を示す概念図である。なお、図12で例に挙げるLPや、検索クエリや、再検索クエリは、図7で示した第3テーブル125内に記憶されているLPや、検索クエリや、再検索クエリに対応する。図12では、検索クエリ「ダイエット」によって抽出されたLP31を取得したユーザ端末10が、再検索クエリを送信した例を示している。   The extraction process of the third extraction unit 135 will be specifically described with reference to FIG. FIG. 12 is a conceptual diagram illustrating an example of extraction processing by the third extraction model according to the embodiment. Note that the LP, search query, and re-search query exemplified in FIG. 12 correspond to the LP, search query, and re-search query stored in the third table 125 shown in FIG. FIG. 12 illustrates an example in which the user terminal 10 that has acquired the LP 31 extracted by the search query “Diet” transmits a re-search query.

まず、ユーザ端末10は、検索サービスにおいて検索クエリ「ダイエット」を送信する。これにより、検索結果ページ50に、LP31をリンク先とする広告コンテンツ、又はウェブページの検索結果として、LP31へのリンクが表示される。ユーザ端末10は、広告コンテンツ又はリンクをクリックすることで、LP31を取得し、ユーザ端末10の表示画面に表示する。   First, the user terminal 10 transmits a search query “diet” in the search service. As a result, a link to the LP 31 is displayed on the search result page 50 as a search result of advertisement content or a web page with the LP 31 as a link destination. The user terminal 10 acquires the LP 31 by clicking on the advertisement content or the link and displays it on the display screen of the user terminal 10.

その後、ユーザ端末10は、再び検索サービスを利用する。この場合、ユーザ端末10は、検索サービスにおいて再検索クエリを送信する。図12では、検索クエリ「ダイエット」を検索したユーザ端末10が送信した再検索クエリを、「ダイエット」と表記された円の周囲に配置された円により示している。図12に示す円において、円内に表記される単語は再検索クエリを示す。円内に表記される数値は、傾向値を示す。すなわち、図12では、「ダイエット」を検索した後のユーザ端末10が、再検索クエリとしてどのような単語を送信する傾向にあるのかを示している。図12に示す例では、検索クエリ「ダイエット」の再検索クエリとしては、「運動」、「健康食品」及び「ヨーグルト」が傾向値「0.2」であり、他の再検索クエリよりも高い数値を示している。   Thereafter, the user terminal 10 uses the search service again. In this case, the user terminal 10 transmits a re-search query in the search service. In FIG. 12, the re-search query transmitted by the user terminal 10 that has searched for the search query “Diet” is indicated by a circle arranged around the circle labeled “Diet”. In the circle shown in FIG. 12, a word written in the circle indicates a re-search query. The numerical value described in a circle shows a tendency value. That is, FIG. 12 shows what words the user terminal 10 after searching for “diet” tends to transmit as a re-search query. In the example illustrated in FIG. 12, as the re-search query of the search query “diet”, “exercise”, “health food”, and “yogurt” have a tendency value “0.2”, which is higher than other re-search queries. Numerical values are shown.

この場合、第3抽出部135は、「運動」、「健康食品」及び「ヨーグルト」の全てを、LP31に紐づかせるキーワードとして抽出してもよいし、この中から、さらに詳細に算定された傾向値に基づいて、一つだけキーワードを抽出してもよい。   In this case, the third extraction unit 135 may extract all of “exercise”, “health food”, and “yogurt” as keywords to be linked to the LP 31, and calculated from these in more detail. Only one keyword may be extracted based on the trend value.

なお、再検索クエリ「ヨーグルト」を送信したユーザ端末10が、再検索クエリ「ヨーグルト」によって抽出されるLP32を取得する場合がある。そして、LP32を取得したユーザ端末10がさらに再検索クエリを送信する場合がある。この場合には、LP32に対して、「ヨーグルト」は、検索クエリとして扱われる。すなわち、第3抽出部135は、検索クエリ「ヨーグルト」によって抽出されるLP32を取得したユーザ端末10から送信される再検索クエリに対応する傾向値に基づいて、LP32に紐づかせるキーワードを抽出する。   Note that the user terminal 10 that has transmitted the re-search query “yogurt” may acquire the LP 32 extracted by the re-search query “yogurt”. And the user terminal 10 which acquired LP32 may transmit a re-search query further. In this case, “yogurt” is handled as a search query for LP32. That is, the third extraction unit 135 extracts a keyword associated with the LP 32 based on the tendency value corresponding to the re-search query transmitted from the user terminal 10 that acquired the LP 32 extracted by the search query “yogurt”. .

図12に示す例では、検索クエリ「ヨーグルト」の再検索クエリとしては、「美腸」が傾向値「0.4」であり、他の再検索クエリよりも高い数値を示している。この場合、第3抽出部135は、再検索クエリ「美腸」をLP32に紐づかせるキーワードとして抽出する。   In the example illustrated in FIG. 12, as a re-search query for the search query “yogurt”, “beautiful bowel” has a tendency value “0.4”, which is higher than other re-search queries. In this case, the third extraction unit 135 extracts the re-search query “beautiful intestine” as a keyword associated with the LP 32.

なお、第3抽出部135は、LP31に紐づかせるキーワードとしては、再検索クエリ「美腸」を抽出しなくてもよい。すなわち、第3抽出部135は、検索クエリを送信したユーザ端末10がその後に送信した再検索クエリであっても、抽出処理に用いなくてもよい。言い換えれば、第3抽出部135は、検索クエリを送信したユーザ端末10が直後に送信した検索クエリのみを再検索クエリとして扱ってもよい。これにより、第3抽出部135は、検索クエリの連鎖によって関連性が低いと想定される再検索クエリがキーワードとして抽出されるのを防止することができる。   Note that the third extraction unit 135 may not extract the re-search query “beautiful bowel” as a keyword associated with the LP 31. In other words, the third extraction unit 135 may not be used for the extraction process even if it is a re-search query transmitted later by the user terminal 10 that transmitted the search query. In other words, the third extraction unit 135 may treat only the search query transmitted immediately after the user terminal 10 that transmitted the search query as the re-search query. Accordingly, the third extraction unit 135 can prevent a re-search query that is assumed to be less relevant due to a chain of search queries from being extracted as a keyword.

このように、実施形態に係る第3抽出部135は、広告配信サービスにおいて、実際にユーザが入力するクエリに基づいてキーワードを抽出する。一般に、検索サービスを利用するユーザは、1回目の検索において欲する情報が入手できなかったり、さらに情報を収集することを望んだりしたために、1回目の検索と同じ意図を有しながら、異なるクエリにより2回目の検索を行う。このことから、検索クエリと再検索クエリとは、ユーザの同じ意図を反映した単語である確率が高いといえる。そこで、第3抽出部135は、上記の関係性に基づき、検索クエリ後の再検索クエリに対する検索傾向を求めることで、再検索クエリに含まれるキーワードであって、広告主が認知しにくいキーワードを抽出することを可能とする。言い換えれば、第3抽出部135は、広告主自身が入札キーワードとして想定するようなキーワードだけではなく、実際のユーザの行動履歴が反映されたキーワードを抽出することができる。   Thus, the 3rd extraction part 135 which concerns on embodiment extracts a keyword based on the query which a user actually inputs in an advertisement delivery service. In general, users who use the search service cannot obtain the information they want in the first search, or want to collect more information, so they have the same intention as the first search but use different queries. Perform a second search. From this, it can be said that the search query and the re-search query have a high probability of being words reflecting the same intention of the user. Therefore, the third extraction unit 135 obtains a keyword that is included in the re-search query and is difficult for the advertiser to recognize by obtaining a search tendency for the re-search query after the search query based on the above relationship. It is possible to extract. In other words, the third extraction unit 135 can extract not only a keyword that the advertiser himself assumes as a bid keyword but also a keyword reflecting an actual user's action history.

また、第1抽出部133と同様に、第3抽出部135は、算出部136が第3抽出モデルに対して重み付けを算出しようとする場合には、取得部131から取得したテストデータに基づいて抽出されたキーワードと、抽出されたキーワードに関する評価値である傾向値とに関する情報を算出部136に送る。   Similarly to the first extraction unit 133, the third extraction unit 135 is based on the test data acquired from the acquisition unit 131 when the calculation unit 136 is to calculate the weight for the third extraction model. Information about the extracted keyword and a tendency value, which is an evaluation value related to the extracted keyword, is sent to the calculation unit 136.

(算出部136について)
算出部136は、互いに異なる手法を用いてコンテンツに紐づかせるキーワードを抽出する抽出モデル毎に、抽出モデルによって所定の条件に適合するキーワードが抽出された度合いに基づいて、抽出モデルの指標値を算出する。例えば、算出部136は、所定の条件として、抽出モデルによって抽出されたキーワードが実際に広告コンテンツやLPに紐づいていること、又は、予め条件に適合すると取り決められているキーワード(例えば、人為的に、事前に所定のキーワードが正例であると取り決められていること)を用いて指標値を算出する。
(About the calculation unit 136)
For each extraction model that extracts keywords to be associated with content using different methods, the calculation unit 136 calculates an index value of the extraction model based on the degree of extraction of keywords that meet a predetermined condition by the extraction model. calculate. For example, as the predetermined condition, the calculation unit 136 may determine that the keyword extracted by the extraction model is actually associated with the advertisement content or LP, or a keyword (for example, artificial In addition, the index value is calculated using the fact that the predetermined keyword is determined to be a positive example in advance.

以下に、算出部136が抽出モデル毎の重みを算出する手法について説明する。例えば、広告装置100が提供する広告配信サービスにおいて、現に10万件分(以下、広告主を計数する場合には、広告主の計数の単位を「アカウント」と表記する)の広告主から広告コンテンツの入稿を受け付けているとする。すなわち、取得部131は、10万アカウント分の広告主に関する情報を取得しているものとする。   Hereinafter, a method in which the calculation unit 136 calculates the weight for each extraction model will be described. For example, in the advertisement distribution service provided by the advertising device 100, the advertisement content from 100,000 advertisers (hereinafter, when the advertiser is counted, the unit of counting the advertiser is referred to as “account”). Is accepted. That is, it is assumed that the acquisition unit 131 has acquired information on advertisers for 100,000 accounts.

まず、算出部136は、取得されている10万アカウントのうち、例えば、8万アカウントの情報を用いて、各抽出モデルを学習させる。すなわち、算出部136は、8万アカウント分の広告主に関する情報を第1抽出部133、第2抽出部134及び第3抽出部135に入力する。そして、第1抽出部133、第2抽出部134及び第3抽出部135は、入力された情報に基づき、各抽出モデルの抽出手法により、各アカウントに対してキーワードの抽出を試みる。そして、第1抽出部133、第2抽出部134及び第3抽出部135は、実際に広告主が指定している入札キーワードを正例とし、実際に広告主が指定している入札キーワードを抽出できた場合にはキーワードの評価値が高くなるように調整し、抽出されたキーワードが実際に広告主が指定している入札キーワードでなかった場合には、抽出されたキーワードの評価値が低くなるように調整を繰り返し、抽出モデルを学習させる。このように、各抽出モデルは、同一の学習データである、共通したテストデータに基づいて学習され、生成される。   First, the calculation unit 136 learns each extraction model using, for example, information of 80,000 accounts among the acquired 100,000 accounts. That is, the calculation unit 136 inputs information related to advertisers for 80,000 accounts to the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135. Then, the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135 try to extract a keyword for each account by the extraction method of each extraction model based on the input information. Then, the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135 use the bid keyword actually designated by the advertiser as a positive example, and extract the bid keyword actually designated by the advertiser. If possible, adjust the keyword rating value to be higher, and if the extracted keyword is not actually a bid keyword specified by the advertiser, the extracted keyword rating value will be lower The adjustment is repeated so that the extraction model is learned. Thus, each extraction model is learned and generated based on the common test data that is the same learning data.

そして、算出部136は、取得されている10万アカウントのうち、2万アカウントの情報を用いて、各抽出モデルに付与する重み付けの指標値を算出する。例えば、算出部136は、2万アカウントの広告主に関する情報において、広告主が入札しているキーワードの8割の情報を第1抽出部133、第2抽出部134及び第3抽出部135に入力する。そして、算出部136は、入力した各アカウントについて、隠された2割の入札キーワードを各抽出モデルが正確に抽出できる度合いを算出する。言い換えれば、第1抽出部133、第2抽出部134及び第3抽出部135は、広告主が実際に入札しているキーワードの8割にあたる情報に基づいて、さらに各アカウントに追加する入札キーワードを抽出する。そして、算出部136は、第1抽出部133、第2抽出部134及び第3抽出部135が抽出したキーワードが、各アカウントに実際に指定されている入札キーワードであるか否かの度合いを算出する。例えば、算出部136は、各アカウントに実際に指定されている入札キーワードに対して高い評価値を算出する抽出モデルほど、重みが重くなるような指標値を算出する。   Then, the calculation unit 136 calculates a weighting index value to be assigned to each extraction model using information of 20,000 accounts among the 100,000 accounts that have been acquired. For example, the calculation unit 136 inputs, to the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135, information about 80% of the keywords bid by the advertiser in the information about the advertiser of 20,000 accounts. To do. Then, the calculation unit 136 calculates the degree to which each extraction model can accurately extract the hidden 20% bid keywords for each input account. In other words, the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135 further add a bid keyword to be added to each account based on information corresponding to 80% of the keywords that the advertiser is actually bidding on. Extract. Then, the calculation unit 136 calculates the degree of whether or not the keywords extracted by the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135 are bid keywords that are actually specified for each account. To do. For example, the calculation unit 136 calculates an index value that gives a higher weight to an extraction model that calculates a higher evaluation value for a bid keyword actually specified for each account.

なお、算出部136は、各抽出モデルがキーワードの抽出にあたって算定したキーワードの評価値を正規化した数値に基づいて、各抽出モデルの重み付けの指標値を算出する。算出部136の算出処理の流れについて、図13を用いて、具体的に説明する。図13は、実施形態に係る算出部136による算出処理の一例を示す概念図である。   The calculation unit 136 calculates a weighting index value of each extraction model based on a numerical value obtained by normalizing the evaluation value of the keyword calculated by each extraction model when extracting the keyword. The calculation processing flow of the calculation unit 136 will be specifically described with reference to FIG. FIG. 13 is a conceptual diagram illustrating an example of calculation processing performed by the calculation unit 136 according to the embodiment.

まず、算出部136は、テストデータとして入札キーワードの2割を隠した2万アカウントのデータを第1抽出モデルに入力する(ステップS21)。第1抽出部133は、各アカウントのLPに関する情報等に基づき、上述した類似度を算出し、キーワードを抽出する。同様に、算出部136は、テストデータを第2抽出モデルに入力する(ステップS22)。第2抽出部134は、各アカウントの入札キーワードの組合せに関する情報等に基づき、上述した重み値を算定し、キーワードを抽出する。同様に、算出部136は、テストデータを第3抽出モデルに入力する(ステップS23)。第3抽出部135は、各アカウントのLPに対する検索クエリと再検索クエリとの情報等に基づき、上述した傾向値を算定し、キーワードを抽出する。   First, the calculation unit 136 inputs 20,000 account data in which 20% of bid keywords are hidden as test data to the first extraction model (step S21). The first extraction unit 133 calculates the above-described similarity based on information about the LP of each account, and extracts keywords. Similarly, the calculation unit 136 inputs test data to the second extraction model (step S22). The second extraction unit 134 calculates the above-described weight value based on information related to the combination of bid keywords for each account, and extracts keywords. Similarly, the calculation unit 136 inputs test data to the third extraction model (step S23). The third extraction unit 135 calculates the above-described tendency value based on information on the search query and the re-search query for the LP of each account, and extracts keywords.

そして、算出部136は、各抽出モデルにより算定された評価値である類似度や、重み値や、傾向値を既知の手法により正規化する(ステップS24)。なお、算出部136は、各抽出モデルが類似度や、重み値や、傾向値そのものを評価値とせず、類似度や、重み値や、傾向値に基づいて定められるキーワードのスコアを算定している場合には、かかるスコアを正規化してもよい。これにより、算出部136は、各抽出モデルが算定する評価値を比較することができる。   Then, the calculation unit 136 normalizes the similarity, the weight value, and the trend value, which are evaluation values calculated by each extraction model, using a known method (step S24). The calculation unit 136 does not use the similarity, weight value, or trend value itself as an evaluation value for each extraction model, but calculates a score for a keyword determined based on the similarity, weight value, or trend value. If so, the score may be normalized. Thereby, the calculation part 136 can compare the evaluation value which each extraction model calculates.

そして、算出部136は、上述したようなテストデータに対して正例を抽出することができた度合いに基づいて、重み付けを示す指標値を算出することにより各抽出モデルに重み付けをする(ステップS25)。例えば、算出部136は、下記式(3)で示されるような重み付けを算出する。   Then, the calculation unit 136 weights each extraction model by calculating an index value indicating weighting based on the degree to which positive examples can be extracted from the test data as described above (step S25). ). For example, the calculation unit 136 calculates weights represented by the following formula (3).

キーワードのスコア = α・X + β・Y +γ・Z ・・・ (3)     Keyword score = α · X + β · Y + γ · Z (3)

上記式(3)のうち、「キーワードのスコア」は、抽出されるキーワードのスコアを示す。例えば、スコアは、各抽出モデルによって算定される評価値に対応する。また、上記式(3)のうち、「α」は第1抽出モデルの重みを示し、「X」は第1抽出モデルによるキーワードのスコアの演算手法を示している。同様に、「β」は第2抽出モデルの重みを示し、「Y」は第2抽出モデルによるキーワードのスコアの演算手法を示している。同様に、「γ」は第3抽出モデルの重みを示し、「Z」は第3抽出モデルによるキーワードのスコアの演算手法を示している。「α」、「β」及び「γ」は、上記の重み付けの算出処理に応じて動的に変化することができる。なお、「α」、「β」及び「γ」の和は「1」となる。例えば、キーワードのスコアを複数の抽出モデルによらず、単独の抽出モデルで算定することは、「α」、「β」、「γ」のいずれか一つが「1」であり、残りの重みは「0」であることと同様である。   In the above formula (3), “keyword score” indicates the score of the extracted keyword. For example, the score corresponds to an evaluation value calculated by each extraction model. In the above formula (3), “α” represents the weight of the first extraction model, and “X” represents the keyword score calculation method based on the first extraction model. Similarly, “β” indicates the weight of the second extraction model, and “Y” indicates a keyword score calculation method based on the second extraction model. Similarly, “γ” represents the weight of the third extraction model, and “Z” represents a keyword score calculation method based on the third extraction model. “Α”, “β”, and “γ” can dynamically change in accordance with the above-described weighting calculation process. The sum of “α”, “β”, and “γ” is “1”. For example, calculating a keyword score with a single extraction model without using a plurality of extraction models means that any one of “α”, “β”, and “γ” is “1”, and the remaining weight is It is the same as being “0”.

なお、上記では、算出部136は、実際に広告主から指定されている入札キーワードを正例として重み付けの指標値を算出する例を示した。しかし、算出部136は、実際に広告主から指定されている入札キーワードを正例とするのではなく、所定の取り決めにより定められたキーワードを正例としてもよい。例えば、算出部136は、人為的な判断により各アカウントに対して適切と想定されるキーワードを正例とするような設定を予め受け付ける。そして、算出部136は、かかる取り決めにより正例と定められたキーワードを抽出することができた抽出モデルに対して、値が高くなるよう重み付けの指標値を算出してもよい。   In the above description, the calculation unit 136 has shown an example in which the index value for weighting is calculated using the bid keyword actually designated by the advertiser as a positive example. However, the calculation unit 136 may not use a bid keyword actually designated by the advertiser as a positive example but may use a keyword determined by a predetermined agreement as a positive example. For example, the calculation unit 136 accepts in advance a setting such that a keyword assumed to be appropriate for each account is determined as a positive example by human judgment. Then, the calculation unit 136 may calculate an index value for weighting so that the value becomes higher with respect to the extraction model that can extract the keyword that is determined as a positive example by the agreement.

算出部136は、このように、各抽出モデルに適切な重みを付与することにより、複数の抽出モデルを用いてキーワードを抽出するための演算式を生成する。後述する第4抽出部137は、上記式(3)で示されるような演算式で算定されるキーワードのスコアに基づいて、適切な入札キーワードを抽出することができる。   In this way, the calculation unit 136 generates an arithmetic expression for extracting a keyword using a plurality of extraction models by assigning an appropriate weight to each extraction model. The fourth extraction unit 137, which will be described later, can extract an appropriate bid keyword based on the keyword score calculated by the arithmetic expression as shown in the above formula (3).

(第4抽出部137について)
第4抽出部137は、算出部136によって算出された指標値により重み付けされた抽出モデルが算定する評価値に基づいて、コンテンツに紐づかせるキーワード、又は、コンテンツを抽出させるためのキーワードを抽出する。具体的には、第4抽出部137は、新たに広告配信サービスを利用する広告主から広告コンテンツの入稿を受け付けた場合に、かかる広告コンテンツや広告主に関する情報に基づいて、複数の抽出モデルを利用した抽出処理手法により、新たな広告主にとって適した入札キーワードを抽出する。言い換えれば、第4抽出部137は、新たな広告主が入札する候補としてのキーワードを抽出する。
(About the fourth extraction unit 137)
The fourth extraction unit 137 extracts a keyword associated with the content or a keyword for extracting the content based on the evaluation value calculated by the extraction model weighted by the index value calculated by the calculation unit 136. . Specifically, the fourth extraction unit 137 receives a plurality of extraction models based on information related to the advertisement content and the advertiser when receiving the submission of the advertisement content from an advertiser who newly uses the advertisement distribution service. The bid keyword suitable for the new advertiser is extracted by the extraction processing method using. In other words, the fourth extraction unit 137 extracts a keyword as a candidate for a new advertiser to bid.

第4抽出部137は、例えば、処理対象であるアカウントに関する情報に基づいて、上記式(3)のような演算式により算定されたスコアにより、キーワードを抽出する。すなわち、第4抽出部137は、上記式(3)で示すように、複数の抽出モデルが算定するキーワード毎の評価値であって、算出部136によって算出された指標値に対応する重みが付加された評価値の和に基づいて、広告コンテンツに紐づかせるキーワード、又は、広告コンテンツやLPを抽出させるためのキーワードを抽出する。   For example, the fourth extraction unit 137 extracts a keyword based on the score calculated by the arithmetic expression such as the above expression (3) based on the information related to the account to be processed. That is, the fourth extraction unit 137 adds the weight corresponding to the index value calculated by the calculation unit 136, which is an evaluation value for each keyword calculated by the plurality of extraction models, as shown in the above formula (3). Based on the sum of the evaluated values, a keyword associated with the advertising content or a keyword for extracting the advertising content and LP is extracted.

(入稿受付部138について)
入稿受付部138は、広告コンテンツの入稿を受け付ける。また、入稿受付部138は、広告コンテンツの入稿とともに、広告主が指定する入札キーワードを受け付ける。そして、入稿受付部138は、受け付けた広告コンテンツや、入札キーワードを算出データ記憶部121に格納する。
(About the submission reception part 138)
The submission receiving unit 138 receives submission of advertisement content. In addition, the submission receiving unit 138 receives bid keywords specified by the advertiser as well as the submission of the advertising content. Then, the submission receiving unit 138 stores the received advertisement content and bid keyword in the calculated data storage unit 121.

(提示部139について)
提示部139は、第4抽出部137によって抽出されたキーワードを提示する。具体的には、提示部139は、広告配信サービスにおいて広告コンテンツに紐づかせる入札キーワードとして、第4抽出部137によって抽出されたキーワードを広告主に提示する。
(About the presentation unit 139)
The presentation unit 139 presents the keywords extracted by the fourth extraction unit 137. Specifically, the presenting unit 139 presents the keyword extracted by the fourth extracting unit 137 to the advertiser as a bid keyword associated with the advertising content in the advertisement distribution service.

なお、提示部139は、第4抽出部137によって抽出されたキーワードであっても、入札キーワードとして広告主に提示しない場合があってもよい。例えば、提示部139は、広告コンテンツに設定されうる除外キーワードについては提示しなくてもよい。広告コンテンツに設定されうる除外キーワードとは、例えば、広告コンテンツの提供主である広告主と競合する企業名や、競合する企業が扱う製品名などが該当する。   Note that the presentation unit 139 may not present the keyword as a bid keyword to the advertiser, even if the keyword is extracted by the fourth extraction unit 137. For example, the presentation unit 139 does not have to present the excluded keyword that can be set in the advertising content. Examples of the exclusion keyword that can be set in the advertisement content include a company name that competes with an advertiser who is a provider of the advertisement content, and a product name handled by the competing company.

(要求受付部140について)
要求受付部140は、広告コンテンツの配信に関する要求を受け付ける。例えば、要求受付部140は、広告コンテンツの取得要求として、ユーザ端末10が表示するウェブページに含まれるHTTP(Hypertext Transfer Protocol)リクエストを受け付ける。
(About the request reception unit 140)
The request reception unit 140 receives a request regarding distribution of advertisement content. For example, the request reception unit 140 receives an HTTP (Hypertext Transfer Protocol) request included in a web page displayed by the user terminal 10 as an advertisement content acquisition request.

(配信部141について)
配信部141は、広告コンテンツを配信する。例えば、配信部141は、要求受付部140が受け付けたHTTPリクエストに従い、ユーザ端末10に広告コンテンツを配信する。また、配信部141は、要求受付部140によって広告コンテンツの取得要求が受け付けられた場合には、配信候補の広告コンテンツを広告情報記憶部126から選択する。
(About distribution unit 141)
The distribution unit 141 distributes advertising content. For example, the distribution unit 141 distributes the advertising content to the user terminal 10 in accordance with the HTTP request received by the request reception unit 140. In addition, when the request reception unit 140 receives an advertisement content acquisition request, the distribution unit 141 selects the distribution candidate advertisement content from the advertisement information storage unit 126.

ここで、配信部141は、要求受付部140が受け付けた検索クエリと入札キーワードが同一又は類似である場合には、入札キーワードに紐づく広告コンテンツを配信候補として選択する。そして、配信部141は、検索クエリを検索サーバ30に送信したユーザ端末10に、選択した広告コンテンツを配信する。   Here, when the search query received by the request receiving unit 140 and the bid keyword are the same or similar, the distribution unit 141 selects the advertisement content associated with the bid keyword as a distribution candidate. Then, the distribution unit 141 distributes the selected advertisement content to the user terminal 10 that has transmitted the search query to the search server 30.

〔3.処理手順〕
次に、図14を用いて、実施形態に係る広告装置100が実行する算出処理の手順について説明する。図14は、実施形態に係る広告装置100による算出処理手順を示すフローチャートである。
[3. Processing procedure)
Next, the procedure of the calculation process executed by the advertising device 100 according to the embodiment will be described with reference to FIG. FIG. 14 is a flowchart illustrating a calculation processing procedure by the advertising device 100 according to the embodiment.

図14に示すように、広告装置100は、例えば、既に広告配信サービスを利用している広告主に関する情報等が含まれる、抽出モデルの学習のためのテストデータを取得する(ステップS101)。そして、広告装置100は、取得したテストデータに含まれるアカウントについて、各抽出モデルによって評価値を算定する(ステップS102)。   As illustrated in FIG. 14, the advertising device 100 acquires test data for learning an extraction model including information on an advertiser who already uses an advertisement distribution service, for example (step S101). Then, the advertising device 100 calculates an evaluation value for each account included in the acquired test data using each extraction model (step S102).

そして、広告装置100は、各抽出モデルによって算定された評価値を正規化する(ステップS103)。広告装置100は、正規化された評価値と、抽出したキーワードが正例であった度合いとに基づいて、各抽出モデルの重み付けを算出する(ステップS104)。   Then, the advertising device 100 normalizes the evaluation value calculated by each extraction model (step S103). The advertising device 100 calculates the weight of each extraction model based on the normalized evaluation value and the degree to which the extracted keyword is a positive example (step S104).

次に、図15を用いて、実施形態に係る広告装置100が実行する抽出処理の手順について説明する。図15は、実施形態に係る広告装置100による抽出処理手順を示すフローチャートである。   Next, the procedure of the extraction process executed by the advertising device 100 according to the embodiment will be described with reference to FIG. FIG. 15 is a flowchart illustrating an extraction processing procedure by the advertising device 100 according to the embodiment.

図15に示すように、広告装置100は、新たに広告配信サービスを利用する広告主から、広告コンテンツの入稿を受け付けたか否かを判定する(ステップS201)。広告装置100は、広告コンテンツの入稿を受け付けていない場合には(ステップS201;No)、受け付けるまで待機する。   As shown in FIG. 15, the advertising device 100 determines whether or not a submission of advertising content has been received from an advertiser who newly uses the advertising distribution service (step S201). When the advertising device 100 has not accepted the submission of the advertising content (step S201; No), the advertising device 100 waits until it is accepted.

一方、広告装置100は、広告コンテンツの入稿を受け付けた場合には(ステップS201;Yes)、受け付けた広告主に関する情報等に基づいて、複数の抽出モデルを利用して、キーワードを抽出する(ステップS202)。そして、広告装置100は、広告コンテンツを入稿した広告主に対して、抽出したキーワードを入札キーワードとして提示する(ステップS203)。   On the other hand, when the advertising device 100 accepts the submission of the advertising content (step S201; Yes), the advertising device 100 extracts a keyword by using a plurality of extraction models based on the received information on the advertiser or the like ( Step S202). Then, the advertising device 100 presents the extracted keyword as a bid keyword to the advertiser who has submitted the advertising content (step S203).

なお、図15では、広告装置100が、ステップS203において、キーワードを広告主に提示した後に、さらに異なるキーワードを抽出してもよい。すなわち、広告装置100は、抽出されたキーワードに対する広告主の対応によっては、ステップS202とステップS203を繰り返し実行してもよい。例えば、広告主が提示されたキーワード以外のキーワードを所望する場合には、広告装置100は、入札キーワードとして先に抽出したキーワード以外のキーワードをさらに抽出する。そして、広告装置100は、新たに抽出されたキーワードを広告主に提示する。   In FIG. 15, the advertising device 100 may extract a different keyword after presenting the keyword to the advertiser in step S203. That is, the advertising device 100 may repeatedly execute Step S202 and Step S203 depending on the advertiser's correspondence to the extracted keyword. For example, when the advertiser desires a keyword other than the keyword presented, the advertising device 100 further extracts a keyword other than the keyword previously extracted as the bid keyword. Then, the advertising device 100 presents the newly extracted keyword to the advertiser.

〔4.変形例〕
上述した実施形態は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、他の実施形態について説明する。
[4. (Modification)
The embodiment described above may be implemented in various different forms other than the above embodiment. Accordingly, other embodiments will be described below.

〔4−1.動的な重み付け〕
上記実施形態において、広告装置100は、正規化された評価値と、テストデータにおける正例となるキーワードを抽出できた度合いに基づいて、各抽出モデルの重み付けを付与する例を示した。ここで、広告装置100は、各抽出モデルの重みについて、抽出処理と連動させて動的に重みを変化させていってもよい。この点について、図16を用いて説明する。
[4-1. (Dynamic weighting)
In the embodiment described above, the advertising device 100 has shown an example in which the weight of each extraction model is given based on the normalized evaluation value and the degree of extraction of a positive example keyword in the test data. Here, the advertising device 100 may dynamically change the weight of each extraction model in conjunction with the extraction process. This point will be described with reference to FIG.

図16は、変形例に係る広告装置100による算出処理の一例を示す図である。図16では、上記式(3)における「α」及び「β」を、2次元上のグラフにより示す。ここで、上述のように、「α」、「β」及び「γ」の和は「1」であるため、図16に示すように、座標(α,β)=(1,0)、(0,0)、(0,1)の3点で囲まれる三角形の内側に、一点(α,β)が定められた場合、(α,β,γ)がとりうる値は、一意に定められる。例えば、図16に示す点P1(α,β)=(0.4,0.3)を定めた場合、「γ」=0.3に定まる。なお、上記の重み(α,β,γ)は、算出部136による算出処理により定められたものとする。   FIG. 16 is a diagram illustrating an example of calculation processing by the advertising device 100 according to the modification. In FIG. 16, “α” and “β” in the above equation (3) are shown by a two-dimensional graph. Here, since the sum of “α”, “β”, and “γ” is “1” as described above, coordinates (α, β) = (1, 0), ( When one point (α, β) is defined inside a triangle surrounded by three points (0, 0) and (0, 1), the values that (α, β, γ) can take are uniquely determined. . For example, when the point P1 (α, β) = (0.4, 0.3) shown in FIG. 16 is determined, “γ” = 0.3. It is assumed that the above weights (α, β, γ) are determined by calculation processing by the calculation unit 136.

ここで、広告装置100は、上記で定められた重み付けを用いて、新たに広告配信サービスを利用する広告主に対してキーワードの抽出処理を行うものとする。そして、広告装置100は、抽出したキーワードを広告主に提示する。広告主は、提示されたキーワードを入札キーワードとして指定したものとする。その後、広告装置100は、抽出したキーワードについて、入札キーワードとしての効果を示す指標値を取得する。例えば、広告装置100は、広告コンテンツを検索するための検索クエリとして広告コンテンツに紐づくキーワードがユーザから入力された回数や、広告コンテンツがユーザから選択された回数、又は、広告コンテンツが表示されることで広告主が得た利益に関する情報などを取得する。   Here, it is assumed that the advertising device 100 performs keyword extraction processing on an advertiser who newly uses the advertisement distribution service, using the weighting determined above. Then, the advertising device 100 presents the extracted keyword to the advertiser. It is assumed that the advertiser designates the presented keyword as a bid keyword. Thereafter, the advertising device 100 acquires an index value indicating the effect as a bid keyword for the extracted keyword. For example, the advertising device 100 displays the number of times a keyword associated with the advertising content is input from the user as a search query for searching for advertising content, the number of times the advertising content is selected by the user, or the advertising content. Information on the profits obtained by the advertiser.

すなわち、広告装置100は、実際に抽出されたキーワードが入札キーワードとして指定されることにより、広告コンテンツについての何らかの広告効果の向上を示す指標値を取得する。そして、広告装置100は、例えば、最も広告効果を向上させる契機となったキーワードを抽出した抽出モデルについて、重みを重くするように調整する。例えば、広告装置100は、第1抽出モデルによって抽出されたキーワードによって広告コンテンツの広告効果が向上したことを示す所定の指標値を取得した場合、第1抽出モデルの重みを示す「α」の数値を高くする。例えば、広告装置100が重みを「0.1」刻みで設定する場合には、「α」は「0.4」から「0.5」へ調整される。この場合、図16に示すように、点P1は、点P5へと移動することになる。すなわち、重み(α,β,γ)は、(0.5,0.3,0.2)へと調整される。   In other words, the advertising device 100 acquires an index value indicating an improvement in some advertising effect on the advertising content by designating an actually extracted keyword as a bid keyword. Then, for example, the advertising device 100 adjusts the extraction model that extracts the keyword that has the most improvement in the advertising effect so as to increase the weight. For example, when the advertising device 100 acquires a predetermined index value indicating that the advertising effect of the advertising content is improved by the keyword extracted by the first extraction model, the numerical value “α” indicating the weight of the first extraction model To increase. For example, when the advertising device 100 sets the weight in increments of “0.1”, “α” is adjusted from “0.4” to “0.5”. In this case, as shown in FIG. 16, the point P1 moves to the point P5. That is, the weight (α, β, γ) is adjusted to (0.5, 0.3, 0.2).

そして、広告装置100は、新たに算出された重み(α,β,γ)=(0.5,0.3,0.2)を用いて、新たに広告配信サービスを利用する広告主に対してキーワードの抽出処理を行う。かかる処理を繰り返すことにより、広告装置100は、広告効果が高くなると想定される重みを、動的に各抽出モデルに対して算出することができる。例えば、広告装置100は、抽出されたキーワードが入札キーワードとして指定された結果によって重みを調整するので、図16の例でいえば、重みを示す点P1が、点P2や、点P3や、点P4に動かされるように重みを調整する。   Then, the advertising device 100 uses the newly calculated weight (α, β, γ) = (0.5, 0.3, 0.2) to the advertiser who newly uses the advertisement distribution service. To extract keywords. By repeating this process, the advertising device 100 can dynamically calculate the weight assumed to increase the advertising effect for each extraction model. For example, since the advertising device 100 adjusts the weight according to the result of specifying the extracted keyword as a bid keyword, in the example of FIG. 16, the point P1 indicating the weight is the point P2, the point P3, Adjust the weight to be moved to P4.

このように、広告装置100は、各抽出モデルに付与される重みを、広告効果などの結果に基づいて、動的に調整することができる。これにより、広告装置100は、実態に即した、適切な重みが付与された各抽出モデルを用いて抽出処理を実行することができる。   As described above, the advertising device 100 can dynamically adjust the weight given to each extraction model based on the result such as the advertising effect. Thereby, the advertising device 100 can execute the extraction process using each extraction model to which an appropriate weight is given in accordance with the actual situation.

〔4−2.抽出に用いる情報〕
上記実施形態において、第1抽出部133、第2抽出部134及び第3抽出部135は、既に広告コンテンツを入稿している広告主に係る入札キーワードや、検索クエリに関する情報に基づいて、キーワードを抽出する例を示した。ここで、第1抽出部133、第2抽出部134及び第3抽出部135は、既存の入札キーワード等に限らず、他の情報を用いて、キーワードを抽出してもよい。
[4-2. Information used for extraction)
In the above-described embodiment, the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135 are based on the bid keyword related to the advertiser who has already submitted the advertising content, or information on the search query. An example of extracting is shown. Here, the 1st extraction part 133, the 2nd extraction part 134, and the 3rd extraction part 135 may extract a keyword not only using an existing bid keyword etc. but using other information.

例えば、第1抽出部133は、上記の通り、既存のLPに対応する単語ベクトルを生成したが、第1抽出部133は、広告コンテンツに対応する単語ベクトルを生成してもよい。   For example, as described above, the first extraction unit 133 generates a word vector corresponding to the existing LP, but the first extraction unit 133 may generate a word vector corresponding to the advertising content.

すなわち、第1抽出部133は、既存のLPではなく、広告コンテンツに含まれるテキストデータについて形態素解析をする。そして、第1抽出部133は、広告コンテンツに対応する単語ベクトルを生成する。また、第1抽出部133は、広告コンテンツに対応する単語ベクトルに基づいて、広告コンテンツに紐づく入札キーワード(すなわち、LPに紐づくキーワード)に対応する単語ベクトルを生成することにより、キーワードを抽出してもよい。   That is, the first extraction unit 133 performs morphological analysis on text data included in the advertisement content, not the existing LP. Then, the first extraction unit 133 generates a word vector corresponding to the advertising content. In addition, the first extraction unit 133 extracts a keyword by generating a word vector corresponding to a bid keyword associated with the advertising content (that is, a keyword associated with LP) based on the word vector corresponding to the advertising content. May be.

また、第2抽出部134は、上記の通り、既存の入札キーワードに基づいてキーワードの組合せを生成したが、第2抽出部134は、広告コンテンツや、LPに関する情報に基づいて、キーワードの組合せを生成してもよい。例えば、第2抽出部134は、広告コンテンツやLPに含まれるテキストデータについて形態素解析をすることにより、広告コンテンツやLPに含まれるテキストデータから、組合せを生成する要素となりえるキーワードを抽出する。そして、第2抽出部134は、抽出したキーワードの組合せを生成する。そして、第2抽出部134は、生成した組合せに基づいて、所定のコンテンツに紐づかせるキーワードを抽出する。   Further, as described above, the second extraction unit 134 generates a combination of keywords based on the existing bid keywords. However, the second extraction unit 134 determines the combination of keywords based on the advertisement content and information about the LP. It may be generated. For example, the second extraction unit 134 performs morphological analysis on the text data included in the advertising content or LP, thereby extracting a keyword that can be an element for generating a combination from the text data included in the advertising content or LP. Then, the second extraction unit 134 generates a combination of extracted keywords. And the 2nd extraction part 134 extracts the keyword linked | related with a predetermined content based on the produced | generated combination.

なお、広告コンテンツやLPに含まれるキーワードは、広告コンテンツやLPを特徴付けるキーワードであることが望ましい。この場合、第2抽出部134は、例えば、広告コンテンツやLPのテキストデータ内に多く含まれる単語や、他の広告コンテンツやLPには出現しにくい単語などを広告コンテンツやLPを特徴付けるキーワードとして判定し、かかるキーワードを抽出する。   Note that the keyword included in the advertising content or LP is preferably a keyword that characterizes the advertising content or LP. In this case, the second extraction unit 134 determines, for example, words that are included in the advertising content or the text data of the LP, or words that are unlikely to appear in other advertising content or LP, as keywords that characterize the advertising content or LP. Then, such keywords are extracted.

このように、第1抽出部133や、第2抽出部134によれば、既存の入札キーワードに限られず、広告コンテンツやLPを用いることにより、広告主が入札する適切なキーワードを抽出することができる。   Thus, according to the 1st extraction part 133 and the 2nd extraction part 134, it is not restricted to the existing bid keyword, By using advertising content and LP, the suitable keyword which an advertiser bids can be extracted. it can.

また、第1抽出部133や、第2抽出部134は、広告コンテンツの広告効果を示す指標を用いて、上記の抽出処理を行ってもよい。例えば、第2抽出部134は、組合せの重み値の算定処理において、CTR(Click Through Rate)の高い広告コンテンツを提供する広告主について重みを重くして、組合せの重み値を算定してもよい。例えば、第2抽出部134は、上記式(1)において、「y」の値を広告主毎に調整してもよい。この場合、第2抽出部134は、CTRの高い広告コンテンツを提供する広告主に関して、「y」の値を高くすることにより、結果として、かかる広告主が有する各組合せの重み値を高くすることができる。これにより、第2抽出部134は、CTRの高い広告コンテンツを提供する広告主が指定するキーワードを抽出しやすくなる。あるいは、第2抽出部134は、CTRの高い広告コンテンツを提供する広告主が有する組合せに対して算定した重み値に所定の値を加算してもよい。   Moreover, the 1st extraction part 133 and the 2nd extraction part 134 may perform said extraction process using the parameter | index which shows the advertising effect of advertisement content. For example, in the combination weight value calculation process, the second extraction unit 134 may calculate the combination weight value by increasing the weight for an advertiser providing advertisement content having a high CTR (Click Through Rate). . For example, the second extraction unit 134 may adjust the value of “y” for each advertiser in the above equation (1). In this case, the second extraction unit 134 increases the value of “y” for the advertiser that provides the advertising content with a high CTR, and consequently increases the weight value of each combination that the advertiser has. Can do. Thereby, the 2nd extraction part 134 becomes easy to extract the keyword which the advertiser who provides advertising content with high CTR specifies. Or the 2nd extraction part 134 may add a predetermined value to the weight value calculated with respect to the combination which the advertiser who provides advertising content with high CTR has.

なお、第1抽出部133や、第2抽出部134は、CTR以外の広告効果を示す指標に基づいてキーワードの評価値を算定してもよい。例えば、第1抽出部133や、第2抽出部134は、広告コンテンツが表示された回数に対して何割がコンバージョンに至るかの割合を示すCVR(Conversion Rate)や、ユーザ端末10における広告コンテンツの実際の表示回数(インプレッション数)や、広告コンテンツに対するクリックで発生する課金額であるCPC(Cost Per Click)や、広告コンテンツの1000回表示あたりの課金額であるeCPM(effective Cost Per Mill)などの広告コンテンツに関する情報を用いて評価値を算定してもよい。   In addition, the 1st extraction part 133 and the 2nd extraction part 134 may calculate the evaluation value of a keyword based on the parameter | index which shows advertising effects other than CTR. For example, the first extraction unit 133 and the second extraction unit 134 may use a CVR (Conversion Rate) indicating a percentage of conversion to the number of times the advertising content is displayed, or advertising content in the user terminal 10. The actual number of impressions (number of impressions), CPC (Cost Per Click), which is the amount charged for clicks on advertising content, and eCPM (effective cost per mill), which is the amount charged per 1000 times of advertising content The evaluation value may be calculated using information related to the advertisement content.

また、第3抽出部135は、LPを取得したユーザ端末10に限らず、広告コンテンツを取得したユーザ端末10から再検索クエリが送信された回数に基づいて、傾向値を算定してもよい。また、第3抽出部135は、ユーザが広告コンテンツを選択した場合には、かかるユーザは他のユーザよりも広告主に興味関心があるものとして、かかるユーザに対応するユーザ端末10から送信される再検索クエリに所定の重み値を付与してもよい。なお、上記実施形態において、検索クエリがLP単語や入札キーワードである例を示したが、検索クエリは、広告コンテンツに含まれる単語であってもよい。   Moreover, the 3rd extraction part 135 may calculate a tendency value not only based on the user terminal 10 which acquired LP but based on the frequency | count that the re-search query was transmitted from the user terminal 10 which acquired advertising content. In addition, when the user selects the advertisement content, the third extraction unit 135 is transmitted from the user terminal 10 corresponding to the user, assuming that the user is more interested in the advertiser than the other users. A predetermined weight value may be given to the re-search query. In the above embodiment, an example in which the search query is an LP word or a bid keyword has been shown. However, the search query may be a word included in the advertisement content.

上記のように、第1抽出部133、第2抽出部134及び第3抽出部135は、上記実施形態において示した例に限られず、種々の情報を用いてキーワードを抽出することができる。   As described above, the first extraction unit 133, the second extraction unit 134, and the third extraction unit 135 are not limited to the examples shown in the above embodiment, and can extract keywords using various information.

〔4−3.広告主〕
上記実施形態において、広告主は、広告主端末20を用いて、広告装置100に広告コンテンツを入稿する例を示した。しかし、広告主は、自ら広告装置100に広告コンテンツを入稿せずに、かかる処理を代理店に依頼する場合もある。この場合、広告装置100にかかる処理をするのは代理店となる。すなわち、「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主端末」といった表記は、広告主端末20だけでなく代理店によって利用される代理店端末を含む概念であるものとする。
[4-3. Advertiser)
In the above embodiment, the advertiser has shown an example in which the advertising content is submitted to the advertising device 100 using the advertiser terminal 20. However, the advertiser may request such processing from the agency without submitting the advertising content to the advertising device 100 itself. In this case, it is an agency that performs the processing related to the advertising device 100. That is, the notation “advertiser” is a concept including not only the advertiser but also the agency, and the notation “advertiser terminal” includes not only the advertiser terminal 20 but also the agency terminal used by the agency. It is assumed to be a concept.

〔4−4.広告配信〕
また、配信部141は、広告コンテンツの配信において、同じ入札キーワードに紐づく広告コンテンツが複数ある場合には、入札キーワードの入札価格が高い広告主や、CTRの高い広告コンテンツや、入札価格及びCTRの双方が高い広告コンテンツを優先して選択するようにしてもよい。そして、配信部141は、選択した広告コンテンツをユーザ端末10に配信する。
[4-4. (Advertisement delivery)
In addition, when there are a plurality of advertisement contents associated with the same bid keyword in the distribution of the advertisement content, the distribution unit 141 may be an advertiser with a high bid price of the bid keyword, an advertisement content with a high CTR, a bid price and a CTR. It is also possible to preferentially select advertising content that is both high. Then, the distribution unit 141 distributes the selected advertisement content to the user terminal 10.

〔4−5.再検索クエリの例〕
上記実施形態において、第3抽出部135が利用する再検索クエリの一例として、検索サーバ30は、検索クエリを送信したユーザ端末10であって、LPを取得したユーザ端末10から再び送信される検索クエリを再検索クエリとして扱う例を示した。しかし、検索サーバ30は、他の状況において送信される検索クエリを再検索クエリとして扱ってもよい。
[4-5. Example of re-search query)
In the above embodiment, as an example of a re-search query used by the third extraction unit 135, the search server 30 is a user terminal 10 that has transmitted a search query, and is transmitted again from the user terminal 10 that has acquired the LP. An example of handling a query as a re-search query was shown. However, the search server 30 may treat a search query transmitted in another situation as a re-search query.

例えば、検索サーバ30は、ユーザ端末10から検索クエリが送信された後、所定時間内(例えば、10分以内など)に送信される検索クエリを再検索クエリとして扱ってもよい。また、検索サーバ30は、検索結果ページ50を取得したユーザ端末10において、検索結果ページ50を表示させた直後に、検索クエリ入力部52に新たに入力されることにより、検索サーバ30に送信される検索クエリを再検索クエリとして扱ってもよい。この場合、検索サーバ30は、ユーザが検索クエリによって抽出されたLPを閲覧していたか否かを判定しなくともよい。なお、検索サーバ30は、LPを取得したユーザ端末10から再び送信される検索クエリであっても、ユーザ端末10から検索クエリが送信された後、所定時間外(例えば、先の検索クエリの送信から24時間経過後)に送信される検索クエリについては、再検索クエリとして扱わないようにしてもよい。   For example, after the search query is transmitted from the user terminal 10, the search server 30 may treat a search query transmitted within a predetermined time (for example, within 10 minutes) as a re-search query. Further, the search server 30 is transmitted to the search server 30 by being newly input to the search query input unit 52 immediately after displaying the search result page 50 in the user terminal 10 that has acquired the search result page 50. May be treated as a re-search query. In this case, the search server 30 may not determine whether or not the user has browsed the LP extracted by the search query. Note that even if the search query is transmitted again from the user terminal 10 that acquired the LP, the search server 30 is outside the predetermined time after the search query is transmitted from the user terminal 10 (for example, transmission of the previous search query). The search query transmitted after 24 hours) may not be treated as a re-search query.

また、検索サーバ30は、検索クエリを送信したユーザ端末10が、検索結果ページ50において広告コンテンツをクリックせず、他のウェブページのリンクをクリックした場合であっても、その後、再び検索結果ページ50を表示させたユーザ端末10から送信される検索クエリを再検索クエリとして扱ってもよい。上記のように、検索サーバ30は、ユーザが同じ検索意図をもって検索していると想定される前後の検索クエリを、検索クエリと再検索クエリとして扱うことができる。   Further, even when the user terminal 10 that has transmitted the search query does not click the advertisement content on the search result page 50 and clicks a link of another web page, the search server 30 then returns to the search result page. You may treat the search query transmitted from the user terminal 10 which displayed 50 as a re-search query. As described above, the search server 30 can handle search queries before and after it is assumed that a user is searching with the same search intention as a search query and a re-search query.

また、広告装置100がユーザ端末10からクエリ情報を受信する場合もありうる。例えば、広告装置100は、ユーザ端末10が検索結果ページ50を表示する際に送信される広告取得要求に含まれるリクエストに基づいて、検索クエリに関する情報を取得する。この場合、広告装置100に係る第3抽出部135は、ユーザ端末10から検索クエリが送信された後に、ユーザ端末10から所定時間内に送信される新たな検索クエリを再検索クエリとして、新たな検索クエリと、再検索クエリとの傾向値を算定してもよい。なお、ユーザ端末10の同一性は、例えば、ユーザ端末10から送信されるクッキー(Cookie)等に含まれる端末の識別情報に基づいて識別される。   In addition, the advertising device 100 may receive query information from the user terminal 10. For example, the advertising device 100 acquires information related to the search query based on a request included in the advertisement acquisition request transmitted when the user terminal 10 displays the search result page 50. In this case, after the search query is transmitted from the user terminal 10, the third extraction unit 135 according to the advertising device 100 uses a new search query transmitted from the user terminal 10 within a predetermined time as a new search query. You may calculate the tendency value of a search query and a re-search query. The identity of the user terminal 10 is identified based on, for example, terminal identification information included in a cookie transmitted from the user terminal 10 or the like.

〔4−6.他の用途〕
上記実施形態において、広告装置100は、検索連動型の広告配信サービスにおける入札キーワードを抽出する例を示した。しかし、広告装置100は、上記のような検索連動型以外の広告配信サービスに利用されてもよい。例えば、広告装置100は、キーワードに対する入札を受け付け、かかるキーワードと親和性の高い内容のウェブページに広告コンテンツを配信するような、いわゆる広告コンテンツマッチ型の広告サービスに利用されてもよい。
[4-6. Other uses)
In the above embodiment, the advertising device 100 has shown an example in which bid keywords are extracted in a search-linked advertisement distribution service. However, the advertising device 100 may be used for an advertisement distribution service other than the search-linked type as described above. For example, the advertising device 100 may be used for a so-called advertising content matching type advertising service that accepts bids for keywords and distributes the advertising content to web pages having high affinity with the keywords.

また、上記実施形態において、コンテンツの一例として、広告コンテンツやLPを挙げ、キーワードの一例として、入札キーワードを例に挙げて説明した。しかし、広告装置100は、広告コンテンツやLPに紐づく入札キーワードを抽出するのみならず、他の用途として利用されてもよい。   Moreover, in the said embodiment, the advertisement content and LP were mentioned as an example of content, and the bid keyword was mentioned as an example as an example of a keyword. However, the advertising device 100 may be used not only for extracting bid keywords associated with advertising content and LPs but also for other purposes.

例えば、本願に係る抽出装置が検索サーバ30に対応する場合、検索サーバ30は、検索結果ページ50に検索クエリのアシストとなるキーワードを表示してもよい。例えば、検索サーバ30は、検索対象である所定のLPに対応するキーワードを抽出する。そして、検索サーバ30は、ユーザが検索サービスを利用する際に、ユーザから入力された検索クエリと抽出されたキーワードが関連する場合(例えば、意味的に類似する場合など)には、検索クエリとともに抽出されたキーワードをユーザに提示してもよい。例えば、検索サーバ30は、抽出したキーワードを、先にユーザが入力した検索クエリの代わりに、所定のウェブページを検索するためのクエリとして抽出する。そして、検索サーバ30は、検索結果ページ50に、検索結果とともに抽出されたキーワードを提示してもよい。ユーザは、提示されたキーワードに基づいて検索を実行することにより、効率よく目的のウェブページを検索できる場合がある。この場合、検索サーバ30は、検索サービスを実行する制御部に加え、上記実施形態に係る取得部131、抽出制御部132、及び提示部139に対応する各処理部を有する。このように、抽出装置に係る第4抽出部137は、算出部136によって算出された指標値により重み付けされた抽出モデルを用いて、コンテンツに紐づかせるキーワードのみならず、コンテンツを抽出させるためのキーワードを抽出することができる。   For example, when the extraction device according to the present application corresponds to the search server 30, the search server 30 may display a keyword that assists the search query on the search result page 50. For example, the search server 30 extracts a keyword corresponding to a predetermined LP that is a search target. Then, when the user uses the search service, the search server 30, together with the search query, when the search query input by the user and the extracted keyword are related (for example, when they are similar in meaning). The extracted keyword may be presented to the user. For example, the search server 30 extracts the extracted keyword as a query for searching for a predetermined web page instead of the search query previously input by the user. Then, the search server 30 may present the keyword extracted together with the search result on the search result page 50. The user may be able to efficiently search for a target web page by executing a search based on the presented keyword. In this case, the search server 30 includes processing units corresponding to the acquisition unit 131, the extraction control unit 132, and the presentation unit 139 according to the above embodiment, in addition to the control unit that executes the search service. As described above, the fourth extraction unit 137 according to the extraction device uses the extraction model weighted by the index value calculated by the calculation unit 136 to extract not only the keyword associated with the content but also the content. Keywords can be extracted.

〔4−7.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-7. Others]
In addition, among the processes described in the above embodiment, all or part of the processes described as being automatically performed can be performed manually, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the document and drawings can be arbitrarily changed unless otherwise specified. For example, the various types of information illustrated in each drawing is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Further, each component of each illustrated apparatus is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured.

例えば、図3に示した算出データ記憶部121や広告情報記憶部126は、広告装置100が保持せずに、図示しないストレージサーバ等が保持してもよい。この場合、広告装置100は、ストレージサーバから広告に関する情報等を取得する。   For example, the calculation data storage unit 121 and the advertisement information storage unit 126 illustrated in FIG. 3 may be held by a storage server or the like (not shown) without being held by the advertising device 100. In this case, the advertising device 100 acquires information related to the advertisement from the storage server.

また、例えば、上記実施形態では、広告装置100が検索クエリなどに関する情報を取得し、取得した情報に基づいてキーワードを抽出する例を示したが、広告装置100が実行する処理は、広告装置100の機能を実現する個別の装置により実行されてもよい。例えば、上述した広告装置100は、取得部131と入稿受付部138とを有する情報取得装置と、抽出制御部132を有する抽出装置と、提示部139を有する提示装置と、要求受付部140と配信部141とを有する配信装置とに分散されてもよい。   Further, for example, in the above-described embodiment, an example in which the advertising device 100 acquires information related to a search query and the like and extracts a keyword based on the acquired information has been described, but the processing executed by the advertising device 100 is performed by the advertising device 100. It may be executed by an individual device that realizes the above functions. For example, the advertising device 100 described above includes an information acquisition device having an acquisition unit 131 and a submission reception unit 138, an extraction device having an extraction control unit 132, a presentation device having a presentation unit 139, and a request reception unit 140. It may be distributed to a distribution device having the distribution unit 141.

〔5.ハードウェア構成〕
また、上述してきた実施形態に係る広告装置100は、例えば図17に示すような構成のコンピュータ1000によって実現される。以下、広告装置100を例に挙げて説明する。図17は、広告装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[5. Hardware configuration)
Further, the advertising device 100 according to the embodiment described above is realized by a computer 1000 having a configuration as shown in FIG. 17, for example. Hereinafter, the advertisement apparatus 100 will be described as an example. FIG. 17 is a hardware configuration diagram illustrating an example of a computer 1000 that implements the functions of the advertising device 100. The computer 1000 includes a CPU 1100, RAM 1200, ROM 1300, HDD 1400, communication interface (I / F) 1500, input / output interface (I / F) 1600, and media interface (I / F) 1700.

CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。   The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400 and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(ネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。   The HDD 1400 stores a program executed by the CPU 1100, data used by the program, and the like. The communication interface 1500 receives data from other devices via the communication network 500 (corresponding to the network N) and sends the data to the CPU 1100, and transmits data generated by the CPU 1100 to other devices via the communication network 500. .

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。   The CPU 1100 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the data generated via the input / output interface 1600 to the output device.

メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 1700 reads a program or data stored in the recording medium 1800 and provides it to the CPU 1100 via the RAM 1200. The CPU 1100 loads such a program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.

例えば、コンピュータ1000が実施形態に係る広告装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。   For example, when the computer 1000 functions as the advertising device 100 according to the embodiment, the CPU 1100 of the computer 1000 implements the function of the control unit 130 by executing a program loaded on the RAM 1200. The HDD 1400 stores data in the storage unit 120. The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them, but as another example, these programs may be acquired from other devices via the communication network 500.

〔6.効果〕
上述してきたように、実施形態に係る広告装置100は、算出部136と、第4抽出部137とを有する。算出部136は、広告コンテンツ(コンテンツの一例)に紐づかせるキーワードとしての評価値を算定し、算定した評価値に基づいてキーワードを抽出する抽出モデルであって、互いに異なる手法を用いて評価値を算定する抽出モデル毎に、抽出モデルによって所定の条件に適合するキーワードが抽出された度合いに基づいて、抽出モデル毎の指標値を算出する。第4抽出部137は、算出部136によって算出された指標値により重み付けされた抽出モデルが算定する評価値に基づいて、広告コンテンツに紐づかせるキーワード、又は、広告コンテンツを抽出させるためのキーワードを抽出する。
[6. effect〕
As described above, the advertising device 100 according to the embodiment includes the calculation unit 136 and the fourth extraction unit 137. The calculation unit 136 is an extraction model that calculates an evaluation value as a keyword to be associated with an advertising content (an example of content) and extracts a keyword based on the calculated evaluation value, and uses different methods to evaluate the evaluation value The index value for each extraction model is calculated based on the degree to which keywords that match the predetermined condition are extracted by the extraction model for each extraction model for calculating. The fourth extraction unit 137 selects a keyword associated with the advertising content or a keyword for extracting the advertising content based on the evaluation value calculated by the extraction model weighted by the index value calculated by the calculation unit 136. Extract.

このように、実施形態に係る広告装置100は、検索連動型の広告配信サービスにおける入札キーワードに関して、複数の異なる抽出モデルを用いて、広告主にとって適切なキーワードを抽出する。このため、広告装置100によれば、広告主は、種々の情報を利用する複数の抽出モデルにより抽出されたキーワードを入札キーワードとして指定することが可能となる。結果として、広告主は、提供する広告コンテンツに興味を持つと想定されるユーザに広告コンテンツをより多く配信させることができる。すなわち、実施形態に係る広告装置100は、広告コンテンツの訴求効果を高めるキーワードを抽出することができる。   As described above, the advertising device 100 according to the embodiment extracts a keyword appropriate for the advertiser using a plurality of different extraction models with respect to the bid keyword in the search-linked advertisement distribution service. For this reason, according to the advertising device 100, the advertiser can specify keywords extracted by a plurality of extraction models using various information as bid keywords. As a result, the advertiser can distribute more advertising content to users who are expected to be interested in the advertising content to be provided. That is, the advertising device 100 according to the embodiment can extract a keyword that enhances the appeal effect of the advertising content.

また、第4抽出部137は、複数の抽出モデルが算定するキーワード毎の評価値であって、算出部136によって算出された指標値に対応する重みが付加された評価値の和に基づいて、広告コンテンツに紐づかせるキーワード、又は、広告コンテンツを抽出させるためのキーワードを抽出する。   The fourth extraction unit 137 is an evaluation value for each keyword calculated by a plurality of extraction models, and is based on the sum of evaluation values to which weights corresponding to the index values calculated by the calculation unit 136 are added. A keyword associated with the advertising content or a keyword for extracting the advertising content is extracted.

このように、実施形態に係る広告装置100は、複数の異なる手法により算出されたキーワードの評価値に基づいて、広告配信サービスにおける入札キーワードを抽出することができる。このため、広告装置100によれば、各抽出モデルによって異なる傾向により抽出されるキーワードの中から、適切な入札キーワードを自動的に選択し抽出することができる。   Thus, the advertising device 100 according to the embodiment can extract bid keywords in the advertisement distribution service based on the keyword evaluation values calculated by a plurality of different methods. Therefore, according to the advertising device 100, it is possible to automatically select and extract an appropriate bid keyword from keywords extracted with different tendencies depending on each extraction model.

また、算出部136は、所定の条件に適合するキーワードとして、実際に広告コンテンツに紐づいているキーワード、又は、予め条件に適合すると取り決められているキーワードを用いて抽出モデル毎に指標値を算出する。   In addition, the calculation unit 136 calculates an index value for each extraction model using a keyword that is actually associated with the advertising content or a keyword that is determined in advance to meet the condition as a keyword that satisfies the predetermined condition. To do.

このように、実施形態に係る広告装置100は、実際に他の広告主が入札キーワードとして設定しているキーワードや、入札キーワードとして適切であると特定されたキーワードなどを正例として重み付けを算出する。これにより、広告装置100は、多くの広告主が入札しているような、効果が高いと想定されるキーワードを抽出しやすくすることができる。このため、広告装置100は、広告主に適切な入札キーワードを抽出することができる。   As described above, the advertising device 100 according to the embodiment calculates weights using, as positive examples, keywords that are actually set as bid keywords by other advertisers, keywords that are identified as appropriate as bid keywords, and the like. . Thereby, the advertising device 100 can make it easy to extract keywords that are assumed to be highly effective, such as many advertisers bidding. Therefore, the advertising device 100 can extract a bid keyword appropriate for the advertiser.

また、算出部136は、同一の学習データにより生成される抽出モデル毎に指標値を算出する。   Further, the calculation unit 136 calculates an index value for each extraction model generated from the same learning data.

このように、実施形態に係る広告装置100は、各抽出モデルを共通したテストデータで学習させるので、特定の情報に偏ることなく学習され、生成された抽出モデルによって抽出処理を実行することができる。   As described above, the advertising device 100 according to the embodiment learns each extraction model from the common test data, and thus can learn without biasing to specific information and execute the extraction process using the generated extraction model. .

また、算出部136は、抽出モデルとして、キーワードに紐づけられたLPの特徴情報(例えば、単語ベクトル)と、キーワードに対応する特徴情報との類似度に基づいてキーワードを抽出する第1の抽出モデル、LPもしくは広告コンテンツにキーワードを指定した広告主毎に生成されるキーワードの各組合せの所定の指標値に基づいてキーワードを抽出する第2の抽出モデル、又は、ユーザ端末10から送信された検索クエリと、検索クエリを送信した後にユーザ端末10からさらに送信される検索クエリである再検索クエリとの関連性を示す所定の指標値に基づいてキーワードを抽出する第3の抽出モデル、のうち少なくとも一つの抽出モデルの指標値を算出する。   Further, the calculation unit 136 extracts, as an extraction model, a keyword based on similarity between LP feature information (for example, a word vector) associated with the keyword and feature information corresponding to the keyword. Model, LP or second extraction model that extracts keywords based on a predetermined index value of each combination of keywords generated for each advertiser who has specified a keyword for LP or advertisement content, or a search transmitted from user terminal 10 A third extraction model that extracts a keyword based on a predetermined index value indicating a relationship between the query and a re-search query that is a search query further transmitted from the user terminal 10 after transmitting the search query; The index value of one extraction model is calculated.

このように、実施形態に係る広告装置100は、異なる手法を用いてキーワードを抽出する抽出モデルについての重み付けを算出する。これにより、広告装置100は、様々な情報に基づき、また、特定の情報に偏ることなく、入札キーワードを抽出することができる。   As described above, the advertising device 100 according to the embodiment calculates a weight for an extraction model that extracts keywords using different methods. Thereby, the advertising device 100 can extract bid keywords based on various information and without biasing to specific information.

また、算出部136は、第4抽出部137によって抽出されたキーワードが広告コンテンツ又はLPを抽出させるための検索クエリとしてユーザから入力された回数、広告コンテンツがユーザから選択された回数、又は広告コンテンツが表示されることで広告主が得た利益に関する情報の少なくとも一つに基づいて、抽出モデル毎の指標値を算出する。   In addition, the calculation unit 136 may determine whether the keyword extracted by the fourth extraction unit 137 is input by the user as a search query for extracting advertisement content or LP, the number of times the advertisement content is selected by the user, or the advertisement content. The index value for each extraction model is calculated based on at least one of the information on the profits obtained by the advertiser by displaying.

このように、実施形態に係る広告装置100は、現状の広告効果を踏まえたうえで抽出モデル毎の重み付けを算出することができる。このため、広告装置100は、現状に則した、適切なキーワードを抽出することができる。   As described above, the advertising device 100 according to the embodiment can calculate the weight for each extraction model in consideration of the current advertising effect. For this reason, the advertising device 100 can extract an appropriate keyword in accordance with the current situation.

また、算出部136は、広告配信において広告主が入札するキーワードとしての評価値を算出する抽出モデル毎の指標値を算出する。   In addition, the calculation unit 136 calculates an index value for each extraction model that calculates an evaluation value as a keyword for which an advertiser bids for advertisement distribution.

これにより、実施形態に係る広告装置100は、広告配信サービスにおける適切な入札キーワードを抽出することができる。   Thereby, the advertising device 100 according to the embodiment can extract an appropriate bid keyword in the advertisement distribution service.

また、算出部136は、コンテンツとして、広告主が入稿する広告コンテンツ、又は広告コンテンツのリンク先となるウェブページを用いて、抽出モデル毎の重み付けを示す指標値を算出する。   Further, the calculation unit 136 calculates an index value indicating a weight for each extraction model, using the advertisement content submitted by the advertiser or the web page that is the link destination of the advertisement content as the content.

これにより、実施形態に係る広告装置100は、例えば検索連動型など、キーワードマッチ型の広告配信サービスにおいて、適切な入札キーワードを抽出することができる。   Thereby, the advertising device 100 according to the embodiment can extract an appropriate bid keyword in a keyword match type advertisement distribution service such as a search-linked type.

また、実施形態に係る広告装置100は、所定のコンテンツに紐づかせるキーワードとして、第4抽出部137によって抽出されたキーワードをコンテンツの提供主(例えば、広告主など)に提示する提示部139をさらに備える。   In addition, the advertising device 100 according to the embodiment includes a presentation unit 139 that presents a keyword extracted by the fourth extraction unit 137 to a content provider (for example, an advertiser) as a keyword associated with predetermined content. Further prepare.

このように、実施形態に係る広告装置100は、キーワードに入札する広告主に、適切なキーワードを提示する。このため、広告装置100によれば、広告主は、新たに追加する入札キーワードとして適切なキーワードを知ることができる。また、広告配信サービスの管理者側は、広告主から入札されるキーワードが増えることにより、入札の促進につながり、サービスの活性化を図ることができる。   As described above, the advertising device 100 according to the embodiment presents an appropriate keyword to an advertiser who bids for a keyword. Therefore, according to the advertising device 100, the advertiser can know an appropriate keyword as a newly added bid keyword. Further, the manager of the advertisement distribution service can promote bidding by increasing the number of keywords bid by the advertiser, and can activate the service.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail based on the drawings. It is possible to implement the present invention in other forms with improvements.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、算出部は、算出手段や算出回路に読み替えることができる。   In addition, the “section (module, unit)” described above can be read as “means” or “circuit”. For example, the calculation unit can be read as calculation means or a calculation circuit.

1 抽出システム
10 ユーザ端末
20 広告主端末
30 検索サーバ
100 広告装置
110 通信部
120 記憶部
121 算出データ記憶部
122 第1テーブル
123 第2テーブルA
124 第2テーブルB
125 第3テーブル
126 広告情報記憶部
130 制御部
131 取得部
132 抽出制御部
133 第1抽出部
134 第2抽出部
135 第3抽出部
136 算出部
137 第4抽出部
138 入稿受付部
139 提示部
140 要求受付部
141 配信部
DESCRIPTION OF SYMBOLS 1 Extraction system 10 User terminal 20 Advertiser terminal 30 Search server 100 Advertising apparatus 110 Communication part 120 Storage part 121 Calculation data storage part 122 1st table 123 2nd table A
124 Second table B
125 third table 126 advertisement information storage unit 130 control unit 131 acquisition unit 132 extraction control unit 133 first extraction unit 134 second extraction unit 135 third extraction unit 136 calculation unit 137 fourth extraction unit 138 submission reception unit 139 presentation unit 140 Request reception unit 141 Distribution unit

Claims (10)

コンテンツに紐づかせるキーワードとしての評価値を算定し、算定した前記評価値に基づいて前記キーワードを抽出する抽出モデルであって、互いに異なる手法を用いて前記評価値を算定する前記抽出モデル毎に、前記抽出モデルによって実際に前記コンテンツに紐づけられているキーワード、又は、予め所定の条件に適合すると取り決められているキーワードが抽出された度合いに基づいて、前記抽出モデル毎の指標値を算出する算出部と、
前記算出部によって算出された指標値により重み付けされた前記抽出モデルが算定する前記評価値に基づいて、前記コンテンツに紐づかせるキーワード、又は、前記コンテンツを抽出させるためのキーワードを抽出する抽出部と、
を備えることを特徴とする抽出装置。
An extraction model that calculates an evaluation value as a keyword to be linked to content and extracts the keyword based on the calculated evaluation value, and for each of the extraction models that calculates the evaluation value using different methods The index value for each extraction model is calculated based on the degree to which keywords that are actually linked to the content by the extraction model or keywords that are determined in advance to meet predetermined conditions are extracted. A calculation unit;
An extraction unit for extracting a keyword associated with the content or a keyword for extracting the content based on the evaluation value calculated by the extraction model weighted by the index value calculated by the calculation unit; ,
An extraction device comprising:
前記抽出部は、
複数の前記抽出モデルが算定するキーワード毎の前記評価値であって、前記算出部によって算出された指標値に対応する重みが付加された前記評価値の和に基づいて、前記コンテンツに紐づかせるキーワード、又は、前記コンテンツを抽出させるためのキーワードを抽出する、
ことを特徴とする請求項1に記載の抽出装置。
The extraction unit includes:
The evaluation value for each keyword calculated by a plurality of extraction models, and associated with the content based on a sum of the evaluation values to which a weight corresponding to the index value calculated by the calculation unit is added A keyword or a keyword for extracting the content is extracted;
The extraction device according to claim 1.
前記算出部は、
同一の学習データにより生成される前記抽出モデル毎に前記指標値を算出する、
ことを特徴とする請求項1又は2に記載の抽出装置。
The calculation unit includes:
Calculating the index value for each of the extraction models generated by the same learning data;
The extraction apparatus according to claim 1 or 2 , wherein
前記算出部は、
前記抽出モデルとして、キーワードに紐づけられた前記コンテンツの特徴情報と前記キーワードに対応する特徴情報との類似度に基づいて前記キーワードを抽出する第1の抽出モデル、前記コンテンツにキーワードを指定した前記コンテンツの提供主毎に生成される前記キーワードの各組合せの所定の評価値に基づいて前記キーワードを抽出する第2の抽出モデル、又は、ユーザ端末から送信された検索クエリと、前記検索クエリを送信した後に前記ユーザ端末からさらに送信される検索クエリである再検索クエリとの関連性を示す所定の評価値に基づいて前記キーワードを抽出する第3の抽出モデル、のうち少なくともいずれか二つの前記抽出モデルの前記指標値を算出する、
ことを特徴とする請求項1〜のいずれか一つに記載の抽出装置。
The calculation unit includes:
As the extraction model, a first extraction model for extracting the keyword based on the similarity between the feature information of the content associated with the keyword and the feature information corresponding to the keyword, and the keyword specified for the content A second extraction model for extracting the keyword based on a predetermined evaluation value of each combination of the keywords generated for each content provider, or a search query transmitted from a user terminal and the search query are transmitted And at least any two of the third extraction models that extract the keyword based on a predetermined evaluation value indicating a relevance with a re-search query that is a search query further transmitted from the user terminal Calculating the index value of the model;
The extraction device according to any one of claims 1 to 3 , wherein
前記算出部は、
前記抽出部によって抽出されたキーワードが前記コンテンツを抽出させるための検索クエリとしてユーザから入力された回数、前記コンテンツがユーザから選択された回数、又は前記コンテンツが表示されることで前記コンテンツの提供主が得た利益に関する情報の少なくとも一つに基づいて、前記抽出モデル毎の前記指標値を算出する、
ことを特徴とする請求項1〜4のいずれか一つに記載の抽出装置。
The calculation unit includes:
The number of times the keyword extracted by the extraction unit is input by the user as a search query for extracting the content, the number of times the content is selected by the user, or the content is displayed by displaying the content Calculating the index value for each of the extraction models based on at least one of the information on the profit obtained by
The extraction device according to any one of claims 1 to 4 , wherein
前記算出部は、
広告配信において広告主が入札するキーワードとしての評価値を算定する前記抽出モデル毎の前記指標値を算出する、
ことを特徴とする請求項1〜5のいずれか一つに記載の抽出装置。
The calculation unit includes:
Calculating the index value for each of the extraction models for calculating an evaluation value as a keyword bid by the advertiser in the advertisement distribution;
The extraction apparatus according to any one of claims 1 to 5 , wherein
前記算出部は、
前記コンテンツとして、広告主が入稿する広告コンテンツ、又は前記広告コンテンツのリンク先となるウェブページを用いて、前記抽出モデル毎の前記指標値を算出する、
ことを特徴とする請求項1〜6のいずれか一つに記載の抽出装置。
The calculation unit includes:
The index value for each extraction model is calculated using the advertising content submitted by the advertiser as the content, or the web page that is the link destination of the advertising content.
The extraction apparatus according to any one of claims 1 to 6 , wherein
前記コンテンツに紐づかせるキーワードとして前記抽出部によって抽出されたキーワードを、前記コンテンツを提供する提供主に提示する提示部、
をさらに備えたことを特徴とする請求項1〜7のいずれか一つに記載の抽出装置。
A presentation unit that presents a keyword extracted by the extraction unit as a keyword to be associated with the content to a provider who provides the content;
Extraction device according to any one of claims 1 to 7, further comprising a.
コンピュータが実行する抽出方法であって、
コンテンツに紐づかせるキーワードとしての評価値を算定し、算定した前記評価値に基づいて前記キーワードを抽出する抽出モデルであって、互いに異なる手法を用いて前記評価値を算定する前記抽出モデル毎に、前記抽出モデルによって実際に前記コンテンツに紐づけられているキーワード、又は、予め所定の条件に適合すると取り決められているキーワードが抽出された度合いに基づいて、前記抽出モデル毎の指標値を算出する算出工程と、
前記算出工程によって算出された指標値により重み付けされた前記抽出モデルが算定する前記評価値に基づいて、前記コンテンツに紐づかせるキーワード、又は、前記コンテンツを抽出させるためのキーワードを抽出する抽出工程と、
を含んだことを特徴とする抽出方法。
An extraction method performed by a computer,
An extraction model that calculates an evaluation value as a keyword to be linked to content and extracts the keyword based on the calculated evaluation value, and for each of the extraction models that calculates the evaluation value using different methods The index value for each extraction model is calculated based on the degree to which keywords that are actually linked to the content by the extraction model or keywords that are determined in advance to meet predetermined conditions are extracted. A calculation process;
An extraction step of extracting a keyword associated with the content or a keyword for extracting the content based on the evaluation value calculated by the extraction model weighted by the index value calculated by the calculation step; ,
The extraction method characterized by including.
コンテンツに紐づかせるキーワードとしての評価値を算定し、算定した前記評価値に基づいて前記キーワードを抽出する抽出モデルであって、互いに異なる手法を用いて前記評価値を算定する前記抽出モデル毎に、前記抽出モデルによって実際に前記コンテンツに紐づけられているキーワード、又は、予め所定の条件に適合すると取り決められているキーワードが抽出された度合いに基づいて、前記抽出モデル毎の指標値を算出する算出手順と、
前記算出手順によって算出された指標値により重み付けされた前記抽出モデルが算定する前記評価値に基づいて、前記コンテンツに紐づかせるキーワード、又は、前記コンテンツを抽出させるためのキーワードを抽出する抽出手順と、
をコンピュータに実行させることを特徴とする抽出プログラム。
An extraction model that calculates an evaluation value as a keyword to be linked to content and extracts the keyword based on the calculated evaluation value, and for each of the extraction models that calculates the evaluation value using different methods The index value for each extraction model is calculated based on the degree to which keywords that are actually linked to the content by the extraction model or keywords that are determined in advance to meet predetermined conditions are extracted. Calculation procedure,
An extraction procedure for extracting a keyword associated with the content or a keyword for extracting the content based on the evaluation value calculated by the extraction model weighted by the index value calculated by the calculation procedure; ,
An extraction program characterized by causing a computer to execute.
JP2014189479A 2014-09-17 2014-09-17 Extraction apparatus, extraction method and extraction program Active JP6235443B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014189479A JP6235443B2 (en) 2014-09-17 2014-09-17 Extraction apparatus, extraction method and extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014189479A JP6235443B2 (en) 2014-09-17 2014-09-17 Extraction apparatus, extraction method and extraction program

Publications (2)

Publication Number Publication Date
JP2016062275A JP2016062275A (en) 2016-04-25
JP6235443B2 true JP6235443B2 (en) 2017-11-22

Family

ID=55797817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014189479A Active JP6235443B2 (en) 2014-09-17 2014-09-17 Extraction apparatus, extraction method and extraction program

Country Status (1)

Country Link
JP (1) JP6235443B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109154942B (en) 2016-07-03 2022-04-01 株式会社咕嘟妈咪 Information providing method, information providing program, and information providing device
JP6373320B2 (en) * 2016-09-08 2018-08-15 ヤフー株式会社 Generating device, generating method, and generating program
CN108241667B (en) 2016-12-26 2019-10-15 百度在线网络技术(北京)有限公司 Method and apparatus for pushed information
JP6698040B2 (en) * 2017-02-07 2020-05-27 ヤフー株式会社 Generation device, generation method, and generation program
JP6993913B2 (en) * 2018-03-19 2022-01-14 ヤフー株式会社 Information processing equipment, information processing methods, and programs
CN109508370B (en) * 2018-09-28 2022-07-08 北京百度网讯科技有限公司 Comment extraction method, comment extraction device and storage medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765018A (en) * 1993-08-31 1995-03-10 Matsushita Electric Ind Co Ltd Automatic key word extracting device
JP4008551B2 (en) * 1997-11-07 2007-11-14 富士通株式会社 Keyword weight generation apparatus, keyword weight generation method, and computer-readable recording medium
JP5577385B2 (en) * 2012-06-26 2014-08-20 ヤフー株式会社 Content distribution device

Also Published As

Publication number Publication date
JP2016062275A (en) 2016-04-25

Similar Documents

Publication Publication Date Title
US11170392B2 (en) System and method for classifying relevant competitors
JP6271345B2 (en) Extraction apparatus, extraction method, and extraction program
JP6235443B2 (en) Extraction apparatus, extraction method and extraction program
JP5928920B2 (en) Determination of recommended data
JP6023129B2 (en) Extraction apparatus, extraction method, and extraction program
US20140278939A1 (en) Advertisement extraction device and advertisement extraction method
JP7117826B2 (en) SEARCH DEVICE, SEARCH METHOD AND SEARCH PROGRAM
US9734503B1 (en) Hosted product recommendations
JP2018045553A (en) Selection device, selection method, and selection program
JP6698730B2 (en) Extraction device, extraction method, and extraction program
JP6933443B2 (en) Information processing equipment, information processing methods and information processing programs
JP6667061B2 (en) Extraction device, extraction method and extraction program
JP6865045B2 (en) Search device, search method and search program
JP6320258B2 (en) Extraction apparatus, extraction method, and extraction program
JP6866069B2 (en) Information processing equipment, information processing methods and information processing programs
JP2018088282A (en) Extracting apparatus, extracting method, and extracting program
JP6100741B2 (en) Extraction apparatus, extraction method and extraction program
JP6311052B1 (en) Extraction apparatus, extraction method, and extraction program
JP5968381B2 (en) Extraction apparatus, extraction method and extraction program
JP6282965B2 (en) Reception device, reception method, and reception program
JP6355151B2 (en) Offering system, offering method and program
JP6549675B2 (en) Learning apparatus, learning method and learning program
JP6310509B2 (en) Extraction apparatus, extraction method and extraction program
JP6072739B2 (en) Extraction apparatus, extraction method and extraction program
JP6921922B2 (en) Information processing equipment, information processing methods, and information processing programs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171026

R150 Certificate of patent or registration of utility model

Ref document number: 6235443

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350