JP4859893B2 - Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program - Google Patents

Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program Download PDF

Info

Publication number
JP4859893B2
JP4859893B2 JP2008208092A JP2008208092A JP4859893B2 JP 4859893 B2 JP4859893 B2 JP 4859893B2 JP 2008208092 A JP2008208092 A JP 2008208092A JP 2008208092 A JP2008208092 A JP 2008208092A JP 4859893 B2 JP4859893 B2 JP 4859893B2
Authority
JP
Japan
Prior art keywords
news
content
advertisement
word
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008208092A
Other languages
Japanese (ja)
Other versions
JP2010044585A (en
Inventor
敏之 前澤
学 颯々野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008208092A priority Critical patent/JP4859893B2/en
Publication of JP2010044585A publication Critical patent/JP2010044585A/en
Application granted granted Critical
Publication of JP4859893B2 publication Critical patent/JP4859893B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ウェブコンテンツと共に表示されるウェブ広告を配信する広告配信装置、広告配信方法、及び広告配信制御プログラムの分野に関する。   The present invention relates to the fields of an advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program for distributing a web advertisement displayed together with web contents.

表示されるウェブコンテンツの内容に合わせて広告掲載を行うコンテンツマッチ広告やコンテンツ連動型広告が知られている(例えば、特許文献1参照)。広告主は、掲載したい広告と、その広告に関連するキーワードを指定すると、広告はそのキーワードに関連するコンテンツ(広告媒体)に対して掲載される。ウェブコンテンツの文章内容、キーワードなどを解析して、その内容と関連性の高い広告が配信される仕組みである。広告主にとっては、自らの商品やサービスと関連性の高いウェブサイトやウェブコンテンツに広告を掲載することができるので、高い広告効果を期待できる。即ち、このような広告方法によれば、閲覧者の嗜好にマッチした広告掲載を行うので、ウェブ広告による集客効果、又、費用対効果を向上させることができる。   Content match advertisements and content-linked advertisements that place advertisements in accordance with the contents of displayed web contents are known (for example, see Patent Document 1). When an advertiser designates an advertisement to be placed and a keyword related to the advertisement, the advertisement is placed on content (advertisement medium) related to the keyword. It is a mechanism that analyzes text content, keywords, etc. of web content and distributes advertisements highly relevant to the content. Advertisers can place advertisements on websites and web contents that are highly relevant to their products and services, so that a high advertising effect can be expected. In other words, according to such an advertising method, an advertisement that matches the viewer's preference is placed, so that it is possible to improve the effect of attracting customers by the web advertisement and the cost effectiveness.

ところで、このようなコンテンツマッチ広告において、掲載する広告は、時事変動に合わせ変化したほうが、世の中のトレンドに合わせた広告掲載ができて好ましい。例えば、携帯電話について記載されたブログに対して、その携帯電話についての広告を引き当てるのは勿論のこと、新発売の携帯電話の広告や最近キャンペーンなどで使われているキャラクターに関連する広告も表示したいといった具合である。   By the way, in such content match advertisements, it is preferable that the advertisements to be posted change according to current fluctuations because advertisements can be placed according to the trend of the world. For example, in addition to attracting advertisements for mobile phones to blogs about mobile phones, advertisements for newly released mobile phones and advertisements related to characters used in recent campaigns are also displayed. I want to do it.

関連する技術として、広告に関連するニュース記事等を当該広告の補足として掲載し広告に時事を関連させようとするものがある(例えば、特許文献2参照)。ターゲットコンテンツ(広告)を使用して補足的なコンテンツ(例えば、ニュース記事)を作成又は特定し、そのターゲットコンテンツと補足的なコンテンツとを結合して広告を得る。
特開2008−97351号公報 特開2006−519425号公報
As a related technique, there is a technique for posting a news article or the like related to an advertisement as a supplement to the advertisement so as to relate the current affair to the advertisement (for example, see Patent Document 2). Target content (advertisement) is used to create or identify supplemental content (eg, news articles), and the target content and supplemental content are combined to obtain an advertisement.
JP 2008-97351 A JP 2006-519425 A

しかしながら、従来のコンテンツマッチ広告では、必ずしも世の中のトレンドや時事変動に合わせた広告掲載が反映されるとは限らなかった。例えば、携帯電話について記載されたブログに対してコンテンツマッチ広告が掲載されるとき、記事投稿日から日付が経過してブログのコンテンツが陳腐化すると、そのブログには、現在旧機種となってしまった携帯電話に関する広告が依然掲載される場合がある。また、DVDや映画について記載されたブログに対してコンテンツマッチ広告が掲載されるとき、記事投稿日から日付が経過してブログのコンテンツが陳腐化すると、そのブログには、現在旧作となってしまったDVDに関する広告が掲載される場合がある。   However, conventional content match advertisements do not always reflect advertisements that are in line with world trends and current fluctuations. For example, when a content match advertisement is posted on a blog that describes a mobile phone, if the date of the article has passed and the blog content has become obsolete, the blog is now an old model. There may still be advertisements about mobile phones. Also, when a content match advertisement is posted on a blog that describes DVDs or movies, if the date of the article has passed and the blog content has become obsolete, the blog is now an old work. There may be advertisements related to DVDs.

このように、従来のコンテンツマッチ広告配信の処理に際して、直接的に最新のトレンドや時事が反映されているとはいえず、多くのユーザは新製品や新サービスへの関心が高い中、ユーザの興味を引き付ける広告の配信は、広告効果の観点からも強く望まれる。   In this way, the conventional content match advertisement distribution process does not directly reflect the latest trends and current events, and many users are highly interested in new products and services. Distribution of advertisements that attract interest is strongly desired from the viewpoint of advertising effectiveness.

特許文献1に記載される発明は、掲載する広告に対してニュース記事等の関連するコンテンツを結合して表示することができるが、広告そのものに関連する文書を引き当てたにすぎず、必ずしもコンテンツに関連する時事に連動した広告を引き当てることはできない。つまり、広告主が時事やトレンドに合わせたキーワードを指定していたとしても、そのキーワードでの広告引き当てが行われない。   The invention described in Patent Document 1 can display related content such as a news article in combination with an advertisement to be posted, but only assigns a document related to the advertisement itself. It is not possible to allocate advertisements linked to related current events. In other words, even if the advertiser designates a keyword that matches the current affairs or trend, advertisement allocation using that keyword is not performed.

本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、コンテンツマッチ広告の配信に関して、コンテンツにマッチした広告配信を行なうとともに、時事に連動した広告の配信を行う広告配信装置、広告配信方法、及び広告配信制御プログラムを提供することにある。   The present invention has been proposed in view of the above-described conventional problems. The purpose of the present invention is to distribute advertisements that match content and distribute advertisements that are linked to current affairs. An advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program are provided.

上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツに応じて広告の配信を行なう広告配信装置であって、前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、前記第一の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するカテゴリ決定手段と、前記ニュースコンテンツ配信装置から、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツを検索するニュース検索手段と、前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索手段とを有することを特徴とする広告配信装置を要旨としている。   In order to solve the above-described problems, according to the present invention, as described in claim 1, a news content distribution device that distributes news content is connected via a network and corresponds to web content that is an advertising medium. An advertisement distribution apparatus that distributes advertisements, wherein a first feature word extraction unit that extracts a feature word from text information included in the web content and a feature extracted by the first feature word extraction unit Category determination means for determining a news category to which the web content belongs based on a word; news search means for searching for news content belonging to the news category determined by the category determination means from the news content distribution device; , Included in the news content retrieved by the news retrieval means From the text information, a second feature word extracting unit that extracts a feature word, and a content match advertisement to be distributed to the web content are searched based on the feature word extracted by the second feature word extracting unit. The gist of the present invention is an advertisement distribution device characterized by having an advertisement search means.

また、請求項2に記載されるように、請求項1に記載の広告配信装置において、前記ウェブコンテンツの属するニュースのカテゴリを表す単語と、当該ニュースのカテゴリを表す単語に関連する関連単語とが対応付けて登録されたカテゴリ分類データベースを備え、
前記カテゴリ決定手段は、前記第一の特徴語抽出手段により抽出された特徴語と、前記カテゴリ分類データベースとに基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するようにすることができる。
Further, as described in claim 2, in the advertisement delivery device according to claim 1, a word representing a news category to which the web content belongs and a related word related to a word representing the news category are provided. It has a category classification database registered in association with it,
The category determining unit may determine a news category to which the web content belongs based on the feature word extracted by the first feature word extracting unit and the category classification database.

また、請求項3に記載されるように、請求項1又は2に記載の広告配信装置において、前記第一の特徴語抽出手段により抽出された特徴語の、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツとの関連度合いを示す重み値を算出する第一の重み値算出手段を有し、前記ニュース検索手段は、前記第一の重み値算出手段により算出された重み値に基づいて、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツの中から、ニュースコンテンツを検索するようにすることができる。   In addition, as described in claim 3, in the advertisement distribution device according to claim 1 or 2, the news determined by the category determining means of the feature words extracted by the first feature word extracting means. First weight value calculating means for calculating a weight value indicating the degree of association with news content belonging to the category, wherein the news search means is based on the weight value calculated by the first weight value calculating means. Thus, the news content can be searched for from the news content belonging to the news category determined by the category determining means.

また、上記の課題を解決するため、本発明にあっては、請求項4に記載されるように、ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツに応じて広告の配信を行なう広告配信装置であって、前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、前記ニュースコンテンツ配信装置から、前記第一の特徴語抽出手段により抽出された特徴語に基づいて、ニュースコンテンツを検索するニュース検索手段と、前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索する広告検索手段とを有することを特徴とする広告配信装置を要旨としている。   In order to solve the above problems, according to the present invention, as described in claim 4, web content that is connected to a news content distribution device that distributes news content via a network and is an advertising medium An advertisement distribution device that distributes advertisements in response to the first feature word extraction means for extracting feature words from the text information included in the web content, and the news content distribution device from the first Based on the feature words extracted by the feature word extraction means, a news search means for searching for news content, and a second feature for extracting feature words from text information included in the news content searched by the news search means Based on the feature words extracted by the word extraction means and the second feature word extraction means, the web controller Are summarized as advertisement distribution device characterized by having an advertisement search means for searching content matching ads to be delivered to Ntsu.

また、請求項5に記載されるように、請求項1ないし4いずれか一項に記載の広告配信装置において、ユーザの検索操作に用いられたクエリワードを記憶するクエリログ記憶装置とネットワークを介して接続され、前記第二の特徴語抽出手段は、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、当該クエリワードを特徴語として当該ニュースコンテンツから抽出するようにすることができる。   Further, as described in claim 5, in the advertisement distribution device according to any one of claims 1 to 4, the query log storage device that stores the query word used for the user's search operation and the network are used. The second feature word extraction unit is connected, acquires a query word included in the news content searched by the news search unit from the query log storage device, and extracts the query word from the news content as a feature word To be able to.

また、請求項6に記載されるように、請求項1ないし5いずれか一項に記載の広告配信装置において、前記第二の特徴語抽出手段により抽出された特徴語の、前記ニュース検索手段により検索されたニュースコンテンツとの関連度合いを示す重み値を算出する第二の重み値算出手段を有し、前記広告検索手段は、前記第二の特徴語抽出手段により抽出された特徴語と、前記第二の重み値算出手段により算出された当該特徴語の重み値とに基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索することを特徴とするようにすることができる。   Further, as described in claim 6, in the advertisement distribution device according to any one of claims 1 to 5, the feature search extracted by the second feature word extraction unit is performed by the news search unit. A second weight value calculating unit that calculates a weight value indicating a degree of association with the searched news content, wherein the advertisement search unit includes the feature word extracted by the second feature word extracting unit; The content match advertisement to be distributed to the web content can be searched based on the weight value of the feature word calculated by the second weight value calculation means.

また、請求項7に記載されるように、請求項6に記載の広告配信装置において、前記第二の重み値算出手段は、ニュースコンテンツのニュースタイトル位置における特徴語に、ニュース本文位置における特徴語よりも、大きい重み値を算出するようにすることができる。   Further, as described in claim 7, in the advertisement distribution device according to claim 6, the second weight value calculation means includes a feature word at the news body position in the feature word at the news title position of the news content. It is possible to calculate a larger weight value than that.

また、請求項8に記載されるように、請求項6又は7に記載の広告配信装置において、ユーザの検索操作に用いられたクエリワードを記憶するクエリログ記憶装置とネットワークを介して接続され、前記第二の重み値算出手段は、前記ニュース検索手段により検索されたニュースコンテンツにおける特徴語の重み値を算出するとき、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、取得されたクエリワードに、クエリワード以外のワードよりも、大きい重み値を算出するようにすることができる。   Further, as described in claim 8, in the advertisement distribution device according to claim 6 or 7, the advertisement distribution device is connected to a query log storage device that stores a query word used for a user search operation via a network, and When calculating the weight value of the feature word in the news content searched by the news search unit, the second weight value calculation unit stores a query word included in the news content searched by the news search unit in the query log storage It is possible to calculate a weight value larger than a word other than the query word obtained from the device and obtained from the query word.

なお、本発明の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、などに適用したものも本発明の態様として有効である。   In addition, what applied the arbitrary combination of the component of this invention, expression, or a component to a method, an apparatus, a system, a computer program, a recording medium, etc. is also effective as an aspect of this invention.

本発明によれば、コンテンツマッチ広告の配信に関して、コンテンツにマッチした広告配信を行なうとともに、時事に連動した広告の配信を行う広告配信装置、広告配信方法、及び広告配信制御プログラムを提供することができる。   According to the present invention, it is possible to provide an advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program that distribute advertisements that match contents and distribute advertisements that are linked to current affairs regarding distribution of content match advertisements. it can.

以下、本発明を実施するための最良の形態を各実施形態において図面を用いて説明する。   The best mode for carrying out the present invention will be described below with reference to the drawings in each embodiment.

<システム構成>
はじめに、具体的な発明の内容を説明する前に、本発明を実施するにあたってのシステム構成について説明する。
<System configuration>
First, before describing specific contents of the present invention, a system configuration for carrying out the present invention will be described.

(ネットワーク)
図1は、本発明による広告配信装置1、Webサーバ2、ニュースサーバ3、及び端末4が、ネットワーク5を介して接続されているネットワーク構成図である。
(network)
FIG. 1 is a network configuration diagram in which an advertisement distribution apparatus 1, a Web server 2, a news server 3, and a terminal 4 according to the present invention are connected via a network 5.

広告配信装置1は、本発明に係る広告配信装置(広告配信サーバ)であり、Webサーバ2が提供するコンテンツに関連する広告の配信を行なう。Webサーバ2は、コンテンツサーバであり、端末4からのコンテンツ取得要求に応じてコンテンツを提供する。ニュースサーバ3は、特にニュースに係るコンテンツサーバでニュースコンテンツ(時事情報)を有している。端末4は、広告を含むウェブコンテンツを閲覧するためのクライアント端末である。例えば、PC(Personal Computer)、PDA(Personal Digital Assistants)、携帯電話等の情報処理機器から構成され、ウェブブラウザ(ウェブコンテンツ閲覧ソフトウェア)を備える。ネットワーク5は、有線、無線を含むネットワークで、例えば、インターネット網である。   The advertisement distribution apparatus 1 is an advertisement distribution apparatus (advertisement distribution server) according to the present invention, and distributes advertisements related to content provided by the Web server 2. The Web server 2 is a content server and provides content in response to a content acquisition request from the terminal 4. The news server 3 is a content server related to news in particular and has news content (current information). The terminal 4 is a client terminal for browsing web content including advertisements. For example, it is composed of an information processing device such as a PC (Personal Computer), a PDA (Personal Digital Assistants), and a mobile phone, and includes a web browser (web content browsing software). The network 5 is a network including wired and wireless, for example, an Internet network.

なお、図1は本発明の一実施形態を説明するにあたっての一構成例を示したものであり、広告配信装置1は、Webサーバ2やニュースサーバ3などと共通のサーバ上に構築してもよいし、さらに後述する内部の機能部やDB(Data Base)を異なるサーバ上に構築してネットワーク5上に配置(接続)してもよい。   FIG. 1 shows a configuration example for explaining an embodiment of the present invention, and the advertisement distribution apparatus 1 can be constructed on a server shared with the Web server 2 and the news server 3. Alternatively, an internal function unit and DB (Data Base), which will be described later, may be constructed on different servers and arranged (connected) on the network 5.

(ハードウェア)
ここで、広告配信装置1のハードウェア構成について簡単に説明しておく。広告配信装置1は、主要な構成として、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、補助記憶装置、記憶媒体読取装置、入力装置、表示装置、及び通信装置などを備える。
(hardware)
Here, the hardware configuration of the advertisement distribution apparatus 1 will be briefly described. The advertisement distribution apparatus 1 includes, as main components, a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), an auxiliary storage device, a storage medium reader, an input device, a display device, and a communication device. Etc.

CPUは、マイクロプロセッサ及びその周辺回路から構成され、広告配信装置1全体を制御する回路である。また、ROMは、CPUで実行される所定の制御プログラム(ソフトウェア部品)を格納するメモリであり、RAMは、CPUがROMに格納された所定の制御プログラム(ソフトウェア部品)を実行して各種の制御を行うときの作業エリア(ワーク領域)として使用するメモリである。   The CPU is composed of a microprocessor and its peripheral circuits, and is a circuit that controls the entire advertisement distribution apparatus 1. The ROM is a memory that stores a predetermined control program (software component) executed by the CPU. The RAM executes various control operations by executing a predetermined control program (software component) stored in the ROM. This is a memory used as a work area (work area) when performing.

補助記憶装置は、汎用のOS(Operating System)、広告に係る各種DB、本発明に係るプログラムなどを格納する装置であり、不揮発性の記憶装置であるHDD(Hard Disk Drive)などが用いられる。なお、上記各種情報は、補助記憶装置以外にも、CD−ROM(Compact Disk - ROM)やDVD(Digital Versatile Disk)などの記憶媒体やその他のメディアを記憶されてもよく、これらの記憶媒体に格納された各種情報は、記憶媒体読取装置などのドライブ装置を介して読み取ることが可能である。よって、必要に応じて記録媒体を記憶媒体読取装置にセットすることで、各種情報が得られる。   The auxiliary storage device is a device that stores a general-purpose OS (Operating System), various DBs related to advertisements, a program according to the present invention, and the like, and an HDD (Hard Disk Drive) that is a nonvolatile storage device is used. In addition to the auxiliary storage device, the various types of information may be stored in a storage medium such as a CD-ROM (Compact Disk-ROM) or a DVD (Digital Versatile Disk) or other media. Various stored information can be read through a drive device such as a storage medium reader. Therefore, various information can be obtained by setting the recording medium in the storage medium reading device as necessary.

入力装置は、ユーザ(管理者)が各種入力操作を行うための装置である。入力装置は、マウス、キーボードなどを含む。表示装置は、表示画面を表示する装置である。例えば、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)などから構成される。次に、通信装置は、ネットワークを介して他装置との通信を行う装置である。有線ネットワークや無線ネットワークなど含む各種ネットワーク形態に応じた通信をサポートする。   The input device is a device for a user (administrator) to perform various input operations. The input device includes a mouse, a keyboard, and the like. The display device is a device that displays a display screen. For example, it is composed of LCD (Liquid Crystal Display), CRT (Cathode Ray Tube) and the like. Next, the communication device is a device that communicates with other devices via a network. Supports communication according to various network forms including wired and wireless networks.

(機能)
図2は、本発明の実施形態に係る広告配信装置1、及びWebサーバ2の一実施形態の主要機能を示す機能ブロック図である。広告配信装置1は、主要な機能として、コンテンツ受信部101、コンテンツ特徴語抽出部102、カテゴリ分類部103、ニュース検索部104、ニュース特徴語抽出部105、コンテンツマッチ広告検索部106、及び広告送信部107を含む構成である。また、DBとして、カテゴリ分類DB111、コンテンツマッチ広告DB/入札ワードDB112を備える。
(function)
FIG. 2 is a functional block diagram showing main functions of an embodiment of the advertisement distribution apparatus 1 and the Web server 2 according to the embodiment of the present invention. The advertisement distribution apparatus 1 includes, as main functions, a content reception unit 101, a content feature word extraction unit 102, a category classification unit 103, a news search unit 104, a news feature word extraction unit 105, a content match advertisement search unit 106, and an advertisement transmission. The unit 107 is included. In addition, a DB includes a category classification DB 111 and a content match advertisement DB / bid word DB 112.

コンテンツ受信部101は、Webサーバ2からウェブコンテンツを受信する機能を有している。Webサーバ2からは、ウェブコンテンツから抽出済みのテキスト情報形式で受信してもよい。   The content receiving unit 101 has a function of receiving web content from the web server 2. You may receive from the web server 2 in the text information format already extracted from the web content.

コンテンツ特徴語抽出部102は、ウェブコンテンツから特徴語を重み値とともに抽出する機能を有している。特徴語は、ウェブコンテンツに含まれる単語から特徴語抽出処理を行って抽出される。例えば、ウェブコンテンツ内の単語について、その出現頻度、出現箇所、文字属性などに応じた重みを値として算出(重み値算出部)し、上位の重み値を有する単語をそのウェブコンテンツを特徴付ける特徴語として抽出する。   The content feature word extraction unit 102 has a function of extracting feature words together with weight values from web content. The feature words are extracted by performing a feature word extraction process from words included in the web content. For example, for words in web content, feature words that calculate weights corresponding to their appearance frequency, appearance location, character attributes, etc. as values (weight value calculation unit) and characterize the web content with words having higher weight values Extract as

カテゴリ分類部103は、カテゴリ分類DB111を参照して、特徴語(及び重み値)に基づいてウェブコンテンツが属するカテゴリに分類する機能を有している。カテゴリ分類DB111は、詳しくは後述するが、コンテンツをカテゴリ分類するために、ニュースサーバ3上のニュースカテゴリに対応させたカテゴリと、そのカテゴリ(名称)に関連する関連単語を対応させて記憶しているDBである。関連単語の取得方法は色々であるが、一例として、カテゴリ名称を検索エンジンに投げて検索結果のスニペットから関連単語を取得しておく。なお、スニペットとは、検索エンジンで検索結果のタイトルの下に表示されるテキストのことである。   The category classification unit 103 has a function of referring to the category classification DB 111 and classifying into categories to which web contents belong based on feature words (and weight values). As will be described in detail later, the category classification DB 111 stores a category associated with a news category on the news server 3 and a related word associated with the category (name) in association with each other in order to categorize content. DB. There are various methods for acquiring related words, but as an example, a category name is thrown to a search engine, and related words are acquired from a snippet of a search result. A snippet is a text displayed under the title of a search result by a search engine.

ニュース検索部104は、ニュースサーバ3からニュースコンテンツを検索する機能を有している。ニュースの検索は、カテゴリ分類部103で分類されたウェブコンテンツのカテゴリに基づいて行なわれる。具体的には、コンテンツのカテゴリと同一カテゴリのニュースを検索する。また、ニュースの検索は、コンテンツ特徴語抽出部102により抽出された特徴語(及び重み値)に基づいて行なわれる。このようにニュース検索部104は、カテゴリ又は特徴語のいずれかに基づいてニュースを検索する。詳細はまた後述する。   The news search unit 104 has a function of searching for news content from the news server 3. Search for news is performed based on the category of the web content classified by the category classification unit 103. Specifically, the news of the same category as the content category is searched. The news search is performed based on the feature word (and weight value) extracted by the content feature word extraction unit 102. As described above, the news search unit 104 searches for news based on either a category or a feature word. Details will also be described later.

ニュース特徴語抽出部105は、ニュース検索部104により検索されたニュースから、特徴語(及び重み値)を抽出する機能を有している。特徴語は、上述した方法と同様でよく、ニュースコンテンツに含まれる単語から特徴語抽出処理を行って抽出される。例えば、ニュースコンテンツ内の単語について、その出現頻度、出現箇所(特に、ニュースタイトル部)、文字属性などに応じた重みを値として算出(重み値算出部)し、上位の重み値を有する単語をそのニュースコンテンツを特徴付ける特徴語として抽出する。   The news feature word extraction unit 105 has a function of extracting feature words (and weight values) from the news searched by the news search unit 104. The feature word may be the same as the method described above, and is extracted by performing a feature word extraction process from words included in the news content. For example, for a word in news content, a weight corresponding to its appearance frequency, appearance location (particularly, news title part), character attribute, etc. is calculated as a value (weight value calculating part), and a word having a higher weight value is calculated. It is extracted as a feature word that characterizes the news content.

また、ニュース特徴語抽出部105は、ニュース検索部104により検索されたニュースから、特徴語(及び重み値)を抽出するとき、クエリログDB301を参照する。クエリログDB301は、ニュースと、ニュースに対応するクエリワード(検索語)とを記録したログで、ニュースから特徴語(及び重み値)を抽出するとき、特徴語の重み値の決定に反映できる。詳細は後述する。   The news feature word extraction unit 105 refers to the query log DB 301 when extracting feature words (and weight values) from the news searched by the news search unit 104. The query log DB 301 is a log in which news and a query word (search word) corresponding to the news are recorded. When a feature word (and weight value) is extracted from the news, the query log DB 301 can be reflected in determination of the weight value of the feature word. Details will be described later.

コンテンツマッチ広告検索部106は、入札ワードを利用してコンテンツマッチ広告DB112から、ニュース特徴語抽出部105により抽出された特徴語にマッチしたコンテンツマッチ広告を検索して、配信すべき広告を決定する機能を有している。このコンテンツマッチ広告については、詳細後述する。   The content match advertisement search unit 106 searches for a content match advertisement that matches the feature word extracted by the news feature word extraction unit 105 from the content match advertisement DB 112 using a bid word, and determines an advertisement to be distributed. It has a function. This content match advertisement will be described later in detail.

広告送信部107は、コンテンツマッチ広告検索部106により検索された配信されるべきコンテンツマッチ広告をWebサーバ2に送信する機能を有している。   The advertisement transmission unit 107 has a function of transmitting, to the Web server 2, the content match advertisement to be distributed that has been searched by the content match advertisement search unit 106.

次に、Webサーバ2の機能についても簡単に説明する。Webサーバ2は、一般的なWebサーバ機能を有し、主要な機能として、ページ要求受信部201、コンテンツ送信部202、広告受信部203、ページ作成部204、及びページ送信部205を含む構成である。   Next, the function of the Web server 2 will be briefly described. The Web server 2 has a general Web server function, and includes a page request reception unit 201, a content transmission unit 202, an advertisement reception unit 203, a page creation unit 204, and a page transmission unit 205 as main functions. is there.

ページ要求受信部201は、端末4からウェブコンテンツページの要求を受信する。コンテンツ送信部202は、そのウェブコンテンツページに表示する(埋め込む)ための広告の配信を受けるため広告配信装置1に対して、コンテンツDB206から、ページ作成部204を介して、対象となるコンテンツを送信する。広告受信部203は、広告配信装置1から広告(コンテンツマッチ広告)を受信する。ページ作成部204は、ウェブコンテンツページに広告を埋め込んで最終的に端末4(ひいてはユーザ)に提供するウェブコンテンツページを作成する。ページ送信部205は、最終的なウェブコンテンツページを端末4に送信する。   The page request reception unit 201 receives a request for a web content page from the terminal 4. The content transmission unit 202 transmits the target content from the content DB 206 via the page creation unit 204 to the advertisement distribution apparatus 1 in order to receive distribution of an advertisement to be displayed (embedded) on the web content page. To do. The advertisement receiving unit 203 receives an advertisement (content match advertisement) from the advertisement distribution device 1. The page creation unit 204 creates a web content page that is finally provided to the terminal 4 (and thus the user) by embedding an advertisement in the web content page. The page transmission unit 205 transmits the final web content page to the terminal 4.

以上、本発明の実施形態に係る広告配信装置1の構成全般について説明を行った。この構成において以下、広告配信装置1の(処理)動作について説明を行う。   The overall configuration of the advertisement distribution device 1 according to the embodiment of the present invention has been described above. In this configuration, the (processing) operation of the advertisement distribution apparatus 1 will be described below.

<動作>
図3は、本発明による広告配信装置1の広告配信処理例を示すフローチャートである。適時図面を参照して以下説明を行う。
<Operation>
FIG. 3 is a flowchart showing an example of an advertisement distribution process of the advertisement distribution apparatus 1 according to the present invention. The following will be described with reference to the timely drawings.

ステップS301で、Webサーバ2から受信したウェブコンテンツからテキスト情報を読み込む。   In step S301, text information is read from the web content received from the web server 2.

ステップS302に進み、コンテンツ特徴語抽出部102は、読み込んだテキスト情報から特徴語抽出処理を行う。まず、テキスト情報に含まれる単語を抜き出して、その単語毎に重み値を算出する。重み値は、ウェブコンテンツとその単語との関連度合いを示す値である。重み値は、関連度合い算出の基となる要素、例えば上述したように、ウェブコンテンツ内の単語の出現頻度、出現箇所、文字属性(書体データ)などに基づいて算出される。そのウェブコンテンツ内で出現頻度の高い単語は、直接的にそのウェブコンテンツを特徴付ける意味を持つし、ウェブコンテンツ内のタイトルを示す箇所等に位置する単語は、要約的にそのウェブコンテンツを特徴付ける意味を持つ。また。文字属性(フォントサイズ、太文字、下線文字、色文字等)に着目すれば、ウェブコンテンツ作成者が何らかの意図を持ってその単語にフォントを付しているので、同様にそのウェブコンテンツを特徴付ける意味を持つと考えられるからである。   In step S302, the content feature word extraction unit 102 performs feature word extraction processing from the read text information. First, words included in the text information are extracted, and a weight value is calculated for each word. The weight value is a value indicating the degree of association between the web content and the word. The weight value is calculated based on an element that is a basis for calculating the degree of association, for example, as described above, the appearance frequency, appearance location, character attribute (typeface data) of the word in the web content. Words with a high frequency of appearance in the web content have the meaning of directly characterizing the web content, and words located in places indicating titles in the web content have the meaning of characterizing the web content in summary. Have. Also. Focusing on character attributes (font size, bold, underlined characters, color characters, etc.), the web content creator has attached the font to the word with some intention, so the meaning of characterizing the web content as well Because it is considered to have.

図4は、ウェブコンテンツから特徴語とその重み値が抽出された様子を示す図である。この例では、いわゆるブログと称されるコンテンツであるが、このコンテンツは、タイトルブロックと本文ブロックにブロック分けされている。タイトルブロックに位置する単語は、タイトルやそれに準ずる単語が記載されていることが多く、コンテンツの内容や話題をよく表している。よって、タイトルブロックに位置する単語は大きい重み値を付与する。また、文字フォントが他の文字に比べ大きい単語についても大きい重み値を付与する。よって、単語「主婦」、「子育て」などには大きな重み値が付与される。また、単語「運動」は出現頻度が高く、下線が引かれている箇所もあるため、同様に大きな重み値が付与される。   FIG. 4 is a diagram illustrating a state in which feature words and their weight values are extracted from web content. In this example, the content is a so-called blog, but this content is divided into a title block and a text block. The word located in the title block often includes a title or a word equivalent thereto, and well represents the content and topic. Therefore, a large weight value is given to the word located in the title block. Also, a large weight value is assigned to a word whose character font is larger than other characters. Therefore, a large weight value is given to the words “housewife”, “child care”, and the like. In addition, since the word “exercise” has a high appearance frequency and is underlined in some places, a large weight value is similarly given.

また、重み値として、世間一般でその単語がどの程度使用されているかを考慮することもできる。単純にその単語を検索エンジンで検索した結果のヒット数に応じて重み値を大きくしてもよいし、一般名詞(普通名詞)より固有名詞の方が商品名等に関連性が高かったり何かしら意味があるものとして同様に重み値を大きくしてもよい。   In addition, as a weight value, it can be considered how much the word is used in general. You can simply increase the weight value according to the number of hits as a result of searching for that word in the search engine, or the proper noun is more relevant to the product name or the like than the general noun (common noun). Similarly, the weight value may be increased.

このような重み付けに関し一例として、文章中の特徴的な単語を抽出するためのアルゴリズム(自然言語処理)であるTF-IDFなどが知られている。コンテンツから得られる単語の出現頻度を表すTF値と、コーパスを検索した結果得られる出現頻度であるDF値(又は逆出現頻度であるIDF値)とからTF-IDF値を求め、TF-IDF値がある閾値以上のもののみを特徴語とすることにより特徴語の抽出を行う。なお、コーパスとは、多数の単語が含まれているデータベースのようなもので、各単語とその出現頻度(DF値)が格納されているものとする。多くのドキュメントに出現する一般的な単語は重要度を下げて、特定のドキュメントにしか出現しない単語の重要度を上げる役割がある。特徴語の抽出条件は、例えば、「TF-IDF値がある閾値以上である単語すべて」、「TF-IDF値がある閾値以上である単語のうち上位N件の単語」などとする。   As an example of such weighting, TF-IDF, which is an algorithm (natural language processing) for extracting characteristic words in sentences, is known. The TF-IDF value is obtained from the TF value representing the appearance frequency of the word obtained from the content and the DF value (or IDF value that is the reverse appearance frequency) that is the appearance frequency obtained as a result of searching the corpus. Feature words are extracted by using only those having a certain threshold value or more as feature words. The corpus is like a database containing a large number of words, and each word and its appearance frequency (DF value) are stored. General words appearing in many documents have a role of decreasing the importance and increasing the importance of words appearing only in a specific document. The feature word extraction condition is, for example, “all words whose TF-IDF value is equal to or greater than a certain threshold value”, “the top N words among words whose TF-IDF value is equal to or greater than a certain threshold value”, and the like.

このようにどのような単語を特徴語として抽出するかは、弾力的に決定することが可能である。なお、算出された重み値は数値を扱いやすいよう正規化処理をしておく。   In this way, what words are extracted as feature words can be determined elastically. The calculated weight value is normalized so that numerical values can be easily handled.

図3に戻り、ステップS303に進み、コンテンツ特徴語抽出部102により抽出された特徴語に基づいて、ウェブコンテンツをカテゴリ分類してからカテゴリに基づいてニュースを検索(ニュース検索部104)するか、カテゴリ分類せずにその特徴語に基づいてニュースを検索(ニュース検索部104)するかで処理を分岐する。また、カテゴリ及び特徴語の両方に基づいてニュースを検索(ニュース検索部104)し、最終的に適切な結果を取捨選択してもよい。   Returning to FIG. 3, the process proceeds to step S303, where the web content is classified into categories based on the feature words extracted by the content feature word extraction unit 102, and then news is searched based on the categories (news search unit 104). The process branches depending on whether the news is searched (news search unit 104) based on the feature word without being classified into categories. Further, news may be searched based on both the category and the feature word (news search unit 104), and finally an appropriate result may be selected.

ステップS304に進むと、カテゴリ分類部103は、カテゴリ分類DB111を参照して、ステップS302で抽出された特徴語に基づいて、ウェブコンテンツをカテゴリに分類する。図5は、カテゴリ分類DB111のデータ構造を示す模式図である。カテゴリ分類DB111は、コンテンツから抽出された特徴語に基づいて、ウェブコンテンツをカテゴリ分類するために用いられるDBで、ニュースサーバ3上のニュースカテゴリ(ニュース分野)に対応させたカテゴリと、そのカテゴリ(名称)に関連する関連単語を対応させて記憶しているDBである。関連単語の取得方法は色々考えられるが、例えば、カテゴリ(名称)を検索エンジンに投げて検索結果のスニペットから関連単語(頻出語や特徴語としてもよい)を重み値とともに取得しておく。またここでTF-IDFを利用してもよい。図6は、コンテンツから抽出された特徴語を(仮)カテゴリ分類する様子を示す図である。特徴語によっては、カテゴリが重複するものもあるが重複してもカテゴリ毎に分類しておく。   In step S304, the category classification unit 103 refers to the category classification DB 111 and classifies the web content into categories based on the feature words extracted in step S302. FIG. 5 is a schematic diagram showing the data structure of the category classification DB 111. The category classification DB 111 is a DB used for classifying web content based on feature words extracted from the content. The category corresponding to the news category (news field) on the news server 3 and the category ( This is a DB that stores related words related to (name). There are various methods of acquiring related words. For example, a category (name) is thrown to a search engine, and related words (which may be frequent words or feature words) are acquired together with a weight value from a snippet of a search result. Also, TF-IDF may be used here. FIG. 6 is a diagram illustrating a state in which feature words extracted from content are classified into (temporary) categories. Some feature words have overlapping categories, but they are classified for each category even if they overlap.

次にカテゴリ分類部103は、特徴語の重み値と関連単語との重み値からスコアを算出する。スコアは、コンテンツに対するカテゴリ毎の関連度合いを表す1つの指標である。図7は、カテゴリ毎にスコアを算出する様子を示す図である。ここでは特徴語と関連単語との重み値を乗算することにより算出できる。なお、これまで精度を高めるために重み値を考慮してきたが、単純に特徴語の出現回数でスコアを算出する方法もある。例えば、カテゴリ「育児」には特徴語が3回、カテゴリ「地域」には特徴語が1回、又カテゴリ「健康」には特徴語が2回出現する場合には、スコアをそれぞれ3、1、2とできる。つまり、スコアは、コンテンツに対するカテゴリ毎の関連度合いを表す指標であればよい。   Next, the category classification unit 103 calculates a score from the weight value of the feature word and the weight value of the related word. The score is one index representing the degree of association for each category with respect to the content. FIG. 7 is a diagram illustrating how scores are calculated for each category. Here, it can be calculated by multiplying the weight value of the feature word and the related word. Although weight values have been considered so far in order to improve accuracy, there is also a method of simply calculating a score based on the number of appearances of feature words. For example, if the feature word appears three times in the category “childcare”, the feature word appears once in the category “region”, and the feature word appears twice in the category “health”, the score is 3, 1 respectively. 2 is possible. That is, the score may be an index representing the degree of association for each category with respect to the content.

図8は、スコア順にカテゴリを並び替え、上位カテゴリを抽出する様子を示す図である。カテゴリ分類部103によりスコアが算出されたが、スコアの値順(降順)に並び替えて所定上位のカテゴリのみ抽出する。ここでは上位1つのカテゴリを抽出するものとし、それ以下のカテゴリについては線引きを行いニュースの検索に考慮されない。このようにしてこの例では最終的に、ウェブコンテンツは、カテゴリ「育児」に分類された。   FIG. 8 is a diagram illustrating a state in which categories are rearranged in the order of scores and upper categories are extracted. Although the score is calculated by the category classification unit 103, only the predetermined upper category is extracted by rearranging in order of score value (descending order). Here, the top one category is extracted, and the lower categories are drawn and are not considered in the news search. Thus, in this example, the web content is finally classified into the category “childcare”.

図3に戻り、ステップS305に進み、ニュース検索部104は、ニュースサーバ3からニュースを検索する。上述したように、ニュース検索部104は、ウェブコンテンツのカテゴリ又は特徴語のいずれかに基づいてニュースを検索する。   Returning to FIG. 3, the process proceeds to step S <b> 305, and the news search unit 104 searches for news from the news server 3. As described above, the news search unit 104 searches for news based on either the category or the feature word of the web content.

まず、ウェブコンテンツのカテゴリに基づいてニュースを検索する。図9は、ニュースサーバ3から検索(取得)されたニュースカテゴリ「育児」に属するニュースコンテンツの一例を示す図である。カテゴリ分類部103によりウェブコンテンツは、カテゴリ「育児」に分類されているので、ニュースサーバ3からニュースカテゴリ「育児」に属するニュースコンテンツを、例えば、直近(最新)5件を検索する。上述したように、カテゴリ分類DB111のカテゴリと、ニュースサーバ3からニュースカテゴリは、対応した関係にあるので、ニュース検索部104は容易に対応するニュースコンテンツを検索することができる。また、さらにウェブコンテンツと文書的な距離が近いニュースを検索するよう、コンテンツ特徴語抽出部102により抽出された特徴語の、カテゴリ分類部103により分類されたニュースのカテゴリに属するニュースコンテンツとの関連度合いを示す重み値を算出し、ニュース検索部104は、算出された重み値に基づいて、分類されたニュースのカテゴリに属するニュースコンテンツの中から、ニュースコンテンツを検索することもできる。重み値を算出については、上述の如くTF-IDF等を利用できる。   First, news is searched based on the category of web content. FIG. 9 is a diagram illustrating an example of news content belonging to the news category “childcare” searched (acquired) from the news server 3. Since the web content is classified into the category “childcare” by the category classification unit 103, the news server 3 searches the news content belonging to the news category “childcare”, for example, the latest (latest) five. As described above, since the category of the category classification DB 111 and the news category from the news server 3 have a corresponding relationship, the news search unit 104 can easily search for the corresponding news content. Further, the relationship between the feature word extracted by the content feature word extraction unit 102 and the news content belonging to the category of the news classified by the category classification unit 103 so as to search for news whose document distance is close to the web content. Based on the calculated weight value, the news search unit 104 can also search for news content from the news content belonging to the classified news category based on the calculated weight value. For calculating the weight value, TF-IDF or the like can be used as described above.

次に、コンテンツ特徴語抽出部102により抽出された特徴語(及び重み値)に基づいてニュースを検索する処理について説明する。図4に戻り、ウェブコンテンツから特徴語(及び重み値)が抽出された様子が示されている。この特徴語(及び重み値)に基づいてニュースを検索する。例えば、直近(例えば、当日)に更新されたニュースコンテンツから、特徴語を含むニュースコンテンツを検索する。また、特徴語の重み値と、ニュースコンテンツの特徴語の重み値から、マッチスコアを算出してもよい。例えば、ベクトル空間モデルなどを利用して、特徴語にマッチするニュースコンテンツとの適合度(関連度)を表すマッチスコアを算出する。ベクトル空間モデルは情報検索を行なうためのアルゴリズムである。重み値をベクトルとみなしてベクトル空間上に表現し、相関量をコサイン、内積、距離等によって計算し関連度を求める。算出されたマッチスコア降順にニュースコンテンツを並び替え、所定上位のものを抽出する。このようにしてニュースコンテンツ毎のマッチスコアを算出し、マッチスコアが所定上位のニュースコンテンツを最終的に取得する。   Next, a process for searching for news based on the feature words (and weight values) extracted by the content feature word extraction unit 102 will be described. Returning to FIG. 4, a state in which feature words (and weight values) are extracted from the web content is shown. News is searched based on this feature word (and weight value). For example, news content including a characteristic word is searched from news content updated most recently (for example, the same day). The match score may be calculated from the feature word weight value and the news content feature word weight value. For example, using a vector space model or the like, a match score representing the degree of matching (relevance) with news content that matches a feature word is calculated. The vector space model is an algorithm for performing information retrieval. The weight value is regarded as a vector and expressed in a vector space, and the correlation amount is calculated by cosine, inner product, distance, etc., and the degree of association is obtained. The news content is rearranged in the descending order of the calculated match score, and a predetermined upper one is extracted. In this way, the match score for each news content is calculated, and finally the news content with a predetermined higher match score is obtained.

これまで説明したように、ステップ305では、ニュース検索部104は、ウェブコンテンツのカテゴリ又は特徴語のいずれかに基づいてニュースコンテンツを検索する。なお、ウェブコンテンツのカテゴリに基づいてニュースコンテンツを検索する場合、検索された複数のニュースコンテンツのニュースカテゴリはすべて同一である。一方、特徴語のいずれかに基づいてニュースコンテンツを検索する場合、特徴語(及び重み)次第なので、ニュースカテゴリ同一とは限らず多岐に渡る場合がある。   As described above, in step 305, the news search unit 104 searches for news content based on either the category or feature word of the web content. When searching for news content based on a category of web content, the news categories of a plurality of searched news content are all the same. On the other hand, when searching for news content based on one of the feature words, it depends on the feature word (and weight), and therefore, the news category is not necessarily the same, and there are various cases.

ここで、ウェブコンテンツが、比較的同一のカテゴリに属する話題が取り上げられている場合は、ウェブコンテンツのカテゴリ又は特徴語のいずれかに基づいてニュースコンテンツを検索しても、比較的同様なニュースコンテンツが検索される可能性が高い。一方、比較的異なる複数のカテゴリに属する話題が取り上げられている場合は、異なるニュースコンテンツが検索される可能性が高い。ニュースコンテンツの検索がウェブコンテンツのカテゴリに基づく場合、特定のカテゴリに係る広告に絞って広告を決定するので、高い広告効果を得られる場合がある。一方、犠牲(足きり)となる話題も伴う。また、ニュースコンテンツの検索が特徴語に基づく場合、ウェブコンテンツに出現する特徴語広くに渡って関連する広告を決定するので、バランスが取れた広告の配信となると考えられる。   Here, when topics that belong to relatively the same category are taken up as web content, even if the news content is searched based on either the category or feature word of the web content, relatively similar news content is obtained. Is likely to be searched. On the other hand, when topics belonging to a plurality of relatively different categories are taken up, there is a high possibility that different news contents are searched. When the search of news content is based on the category of web content, since the advertisement is determined by focusing on the advertisement related to a specific category, a high advertising effect may be obtained. On the other hand, it comes with a sacrificial topic. In addition, when the search of news content is based on feature words, related advertisements are determined over a wide range of feature words appearing in web content, so it is considered that balanced advertisement delivery is achieved.

図3、ステップS306に進む。クエリログDB301を参照して、ステップS305で検索されたニュースコンテンツから特徴語(及び重み)を抽出するときは、ステップS307で、そのニュースコンテンツに対応するクエリログを取得する。クエリログDB301を参照(考慮)しない場合には、クエリログを取得なしにステップS308に進む。   The process proceeds to FIG. 3, step S306. When feature words (and weights) are extracted from the news content searched in step S305 with reference to the query log DB 301, a query log corresponding to the news content is acquired in step S307. If the query log DB 301 is not referred to (considered), the process proceeds to step S308 without acquiring the query log.

ここで、ここでいうクエリワードとは、ニュースコンテンツに対応付いたワード(単語)であって、検索エンジンの検索窓に入力された検索ワードをいう。具体的に説明すると、ユーザがあるニュースコンテンツを閲覧し、その直後に検索窓に入力した検索語である。一般に、ユーザはニュース記事中のある特定のワードに興味を持つと、そのワードを検索エンジンで検索するという行動がしばしば見られる。よって、ニュースを閲覧したユーザの行動履歴をトラッキングし、ニュース閲覧直後に検索窓に入力されたワードは、そのニュースにおいてユーザが興味を示したワード、即ち特徴語そのものであるといえる。クエリログDB301は、ニュースサーバ3のニュースコンテンツを識別(特定)するニュースコンテンツ識別子と、そのニュースコンテンツに対応するクエリワード(検索語)とを記録したログで、ニュースコンテンツから、特徴語(及び重み値)を抽出するとき、特徴語の抽出及び重み値の決定に反映することができる。図10は、クエリログの一例を示す図である。   Here, the query word here is a word (word) associated with the news content and is a search word input to the search window of the search engine. More specifically, it is a search term that is input to the search window immediately after a user browses a certain news content. In general, when a user is interested in a specific word in a news article, a search engine is often used to search for that word. Therefore, it can be said that the word entered in the search window immediately after browsing the news after tracking the behavior history of the user who browsed the news is the word that the user showed interest in the news, that is, the feature word itself. The query log DB 301 is a log in which a news content identifier for identifying (specifying) news content of the news server 3 and a query word (search word) corresponding to the news content are recorded. ) Can be reflected in feature word extraction and weight value determination. FIG. 10 is a diagram illustrating an example of a query log.

図3、ステップS308に進み、ニュース特徴語抽出部105は、ステップS305で検索されたニュースコンテンツから、特徴語及び重み値を抽出する。抽出方法は、上述したように、ニュースコンテンツ内の単語について、その出現頻度、出現箇所、文字属性などに応じた重みを値として算出(重み値算出部)し、上位の重み値を有する単語をそのニュースコンテンツを特徴付ける特徴語として抽出すればよい。またここでTF-IDFを利用してもよい。   In step S308 in FIG. 3, the news feature word extraction unit 105 extracts feature words and weight values from the news content searched in step S305. As described above, the extraction method calculates a weight corresponding to the appearance frequency, appearance location, character attribute, and the like of a word in news content as a value (weight value calculation unit), and selects a word having a higher weight value. What is necessary is just to extract as a characteristic word which characterizes the news content. Also, TF-IDF may be used here.

また、ニュースコンテンツ特有の点に着目した単語の重み付けを行うことができる。一般にニュースコンテンツには、タイトル(見出し)が付される。タイトルは、そのニュースコンテンツを要約的に示すので、タイトルに含まれる単語には、より大きな重み値を付与することにより、引き当てられる広告とのコンテンツマッチ(マッチスコア)の精度を高めることができる。   Further, it is possible to weight words focusing on points unique to news content. In general, a title (heading) is attached to news content. Since the title indicates the news content in summary, the accuracy of the content match (match score) with the assigned advertisement can be improved by giving a larger weight value to the word included in the title.

また、クエリログを取得している場合は、クエリログを反映して、特徴語及び重み値の抽出を行なう。具体的には、あるニュースコンテンツで、そのクエリログに記録される単語には大きな重み値を付与する。その単語は、ユーザがそのニュースコンテンツを閲覧したとき、相当な程度をもって興味を示したワードであるといえるからである。   If a query log is acquired, feature words and weight values are extracted reflecting the query log. Specifically, a large weight value is assigned to a word recorded in the query log of a certain news content. This is because the word can be said to be a word that shows interest to a considerable degree when the user browses the news content.

図11は、ニュースコンテンツから、特徴語及び重み値が抽出された様子を示す図である。上述したように、どのような単語を特徴語として抽出するかは、弾力的に決定することが可能であるが、本発明のニュース特徴語抽出部105は、特にニュースコンテンツ特有の点に着目した単語の重み付けや、クエリログを反映しての重み付けを行なっている。   FIG. 11 is a diagram illustrating a state in which feature words and weight values are extracted from news content. As described above, what word is extracted as a feature word can be determined elastically, but the news feature word extraction unit 105 of the present invention pays particular attention to points unique to news content. Word weighting and weighting reflecting the query log are performed.

図3、ステップS309に進み、コンテンツマッチ広告検索部106は、ニュースコンテンツから抽出された特徴語及び重み値に基づいて、コンテンツマッチ広告の検索を行なう。コンテンツマッチ広告検索部106は、入札ワードを利用してコンテンツマッチ広告DB112から、特徴語(及び重み値)にマッチしたコンテンツマッチ広告を検索して決定する。   In step S309 in FIG. 3, the content match advertisement search unit 106 searches for a content match advertisement based on the feature word and the weight value extracted from the news content. The content match advertisement search unit 106 searches and determines a content match advertisement that matches the feature word (and weight value) from the content match advertisement DB 112 using the bid word.

図12は、コンテンツマッチ広告DB112のデータ構造を示す模式図である。コンテンツマッチ広告DB112は、広告主が購入した広告(広告コンテンツ)と入札ワードとが対応付けられて登録されるDBである。広告主は、広告とその広告に関連する入札ワード(キーワード)を指定して広告を購入する。入札ワードは、配信する広告と広告媒体のコンテンツとマッチさせるためのキーワードである。   FIG. 12 is a schematic diagram showing the data structure of the content match advertisement DB 112. The content match advertisement DB 112 is a DB in which an advertisement (advertisement content) purchased by an advertiser and a bid word are registered in association with each other. An advertiser designates an advertisement and a bid word (keyword) related to the advertisement and purchases the advertisement. The bid word is a keyword for matching the advertisement to be distributed with the content of the advertisement medium.

図13は、コンテンツマッチ広告検索部106が、入札ワードDB112を利用して、広告媒体であるコンテンツと入札ワードとの適合度を表すマッチスコアを算出する様子を示す図である。入札ワードDB112には、予め入札ワードとその関連単語(及び重み値)とが対応付けられて登録されている。ニュース特徴語抽出部105によりニュースコンテンツから抽出された特徴語の重み値と関連単語の重み値とから、例えば、ベクトル空間モデルなどを利用して広告媒体であるコンテンツと入札ワードとの適合度(関連度)を表すマッチスコアを算出する。ベクトル空間モデルは情報検索を行なうためのアルゴリズムである。重み値をベクトルとみなしてベクトル空間上に表現し、相関量をコサイン、内積、距離等によって計算し関連度を求める。算出されたマッチスコア降順に入札ワードを並び替え、所定上位の入札ワードを抽出する。そして、コンテンツマッチ広告DB112において、この入札ワードに対応する広告が決定(検索)される。   FIG. 13 is a diagram showing how the content match advertisement search unit 106 uses the bid word DB 112 to calculate a match score representing the degree of matching between the content that is the advertisement medium and the bid word. In the bid word DB 112, a bid word and its related word (and weight value) are registered in advance in association with each other. Based on the weight value of the feature word extracted from the news content by the news feature word extraction unit 105 and the weight value of the related word, for example, using a vector space model or the like, the fitness of the content that is the advertising medium and the bid word ( A match score representing the degree of association is calculated. The vector space model is an algorithm for performing information retrieval. The weight value is regarded as a vector and expressed in a vector space, and the correlation amount is calculated by cosine, inner product, distance, etc., and the degree of association is obtained. The bid words are rearranged in the descending order of the calculated match score, and a predetermined higher bid word is extracted. Then, an advertisement corresponding to the bid word is determined (searched) in the content match advertisement DB 112.

図3、ステップS309に進み、コンテンツマッチ広告検索部106により配信すべき広告が決定されたので、広告送信部107は、Webサーバ2にその広告を送信する。Webサーバ2は広告を受信すると、コンテンツ(広告媒体)に広告(広告情報)を埋め込んで、最終的にウェブコンテンツページとしてユーザの端末4に送信する。そして、端末4においてウェブブラウザ等で広告を含むウェブコンテンツページが表示される。図14は、表示されるウェブコンテンツページの一例である。広告媒体であるウェブコンテンツ(ブログ)に関連する広告であって、直近のニュース(トレンド)なども反映した広告が配信されている。なお、広告にはテキスト広告、画像広告(バナー)形式を含んでいる。また、テキスト広告、画像広告には、URL(Uniform Resource Locator)などのリンク情報が埋め込まれている。   In FIG. 3, the process proceeds to step S <b> 309, and since the advertisement to be distributed is determined by the content match advertisement search unit 106, the advertisement transmission unit 107 transmits the advertisement to the Web server 2. When the web server 2 receives the advertisement, the web server 2 embeds the advertisement (advertisement information) in the content (advertisement medium), and finally transmits it as a web content page to the user terminal 4. Then, a web content page including an advertisement is displayed on the terminal 4 by a web browser or the like. FIG. 14 is an example of the displayed web content page. Advertisements related to web contents (blogs), which are advertising media, are also distributed that reflect the latest news (trends). The advertisement includes a text advertisement and an image advertisement (banner) format. In addition, link information such as URL (Uniform Resource Locator) is embedded in the text advertisement and the image advertisement.

<総括>
これまで説明したように、本発明による広告配信装置1は、ウェブコンテンツにマッチしたニュースコンテンツを検索し、そのニュースコンテンツに基づいて、広告の引き当てを行なう。ニュースコンテンツは、トレンドや時事変動に係る情報を有しているので、広告とのマッチ処理に際して直接的に最新のトレンドや時事を反映することができ、よりユーザの興味を引き付ける広告を配信してひいては広告効果の向上が期待できる。
<Summary>
As described above, the advertisement distribution apparatus 1 according to the present invention searches for news content that matches web content, and allocates advertisements based on the news content. News content has information on trends and current affairs, so it can directly reflect the latest trends and current affairs when matching with ads, and deliver ads that attract more users' interests. As a result, improvement in advertising effectiveness can be expected.

また、広告主サイドからすれば、ウェブコンテンツ(広告掲載媒体)において時事やトレンドに合ったコンテンツを含まない場合でも、広告主が時事やトレンドに合わせたキーワード(入札ワード)を指定していればそのキーワードでの広告の引き当てを行うことができる。   From the advertiser's side, even if the web content (advertising media) does not include content that matches current affairs or trends, if the advertiser specifies keywords (bid words) that match current affairs or trends. You can allocate ads for that keyword.

また、ウェブコンテンツに対する広告の引き当てを行う際に、ニュースを介在させることで、ウェブコンテンツからは抽出できないような商品名や企業名等の広告引き当てが容易な特徴語を抽出することができる。   In addition, when an advertisement is assigned to a web content, a feature word that can be easily assigned an advertisement such as a product name or a company name that cannot be extracted from the web content can be extracted by interposing news.

また、ウェブコンテンツとニュースコンテンツとの関連度に基づいてニュースコンテンツを検索することで、ウェブコンテンツの内容に近いニュースに基づいて特徴語を抽出することができるため、ウェブコンテンツの内容に近く且つ時事に連動した広告を引き当てることができる。   Also, by searching for news content based on the degree of association between web content and news content, it is possible to extract feature words based on news that is close to the content of the web content. Can be used for ads linked to.

以上、本発明によれば、コンテンツマッチ広告の配信に関して、コンテンツにマッチした広告配信を行なうとともに、時事に連動した広告の配信を行う広告配信装置、広告配信方法、及び広告配信制御プログラムを提供することが可能となる。   As described above, according to the present invention, an advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program that distribute advertisements that match contents and distribute advertisements that are linked to current affairs are provided for distribution of content match advertisements. It becomes possible.

なお、本発明の好適な実施の形態、特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。   Although the present invention has been described with reference to preferred embodiments and specific specific examples of the present invention, these specific examples have been described without departing from the broad spirit and scope of the present invention as defined in the claims. Obviously, various modifications and changes can be made to the. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.

本発明に係るネットワーク構成図である。1 is a network configuration diagram according to the present invention. FIG. 本発明の実施形態に係る広告配信装置及びWebサーバの一実施形態の主要機能を示す機能ブロック図である。It is a functional block diagram which shows the main functions of one Embodiment of the advertisement delivery apparatus and web server which concern on embodiment of this invention. 本発明による広告配信装置の広告配信処理例を示すフローチャートである。It is a flowchart which shows the example of an advertisement delivery process of the advertisement delivery apparatus by this invention. ウェブコンテンツから特徴語とその重み値が抽出された様子を示す図である。It is a figure which shows a mode that the feature word and its weight value were extracted from the web content. カテゴリ分類DBのデータ構造を示す模式図である。It is a schematic diagram which shows the data structure of category classification DB. 特徴語をカテゴリ分類する様子を示す図である。It is a figure which shows a mode that a feature word is classified into categories. カテゴリ毎にスコアを算出する様子を示す図である。It is a figure which shows a mode that a score is calculated for every category. 上位カテゴリを抽出する様子を示す図である。It is a figure which shows a mode that a high-order category is extracted. ニュースコンテンツの一例である。It is an example of news content. クエリログを抽出する様子を示す図である。It is a figure which shows a mode that a query log is extracted. ニュースコンテンツから特徴語とその重み値が抽出された様子を示す図である。It is a figure which shows a mode that the feature word and its weight value were extracted from news content. コンテンツマッチ広告DBのデータ構造を示す模式図である。It is a schematic diagram which shows the data structure of content match advertisement DB. マッチスコアを算出する様子を示す図である。It is a figure which shows a mode that a match score is calculated. 表示されるウェブコンテンツページの一例である。It is an example of the web content page displayed.

符号の説明Explanation of symbols

1 広告配信装置
2 Webサーバ
3 ニュースサーバ
4 端末
5 ネットワーク
101 コンテンツ受信部
102 コンテンツ特徴語抽出部
103 カテゴリ分類部
104 ニュース検索部
105 ニュース特徴語抽出部
106 コンテンツマッチ広告検索部
107 広告送信部
111 カテゴリ分類DB
112 コンテンツマッチ広告DB/入札ワードDB
201 ページ要求受信部
202 コンテンツ送信部
203 広告受信部
204 ページ作成部
205 ページ送信部
206 コンテンツDB
301 クエリログDB
DESCRIPTION OF SYMBOLS 1 Advertisement delivery apparatus 2 Web server 3 News server 4 Terminal 5 Network 101 Content receiving part 102 Content feature word extraction part 103 Category classification | category part 104 News search part 105 News feature word extraction part 106 Content match advertisement search part 107 Advertisement transmission part 111 Category Classification DB
112 Content Match Ad DB / Bid Word DB
201 page request reception unit 202 content transmission unit 203 advertisement reception unit 204 page creation unit 205 page transmission unit 206 content DB
301 Query log DB

Claims (11)

ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツに応じて広告の配信を行なう広告配信装置であって、
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、
前記第一の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するカテゴリ決定手段と、
前記ニュースコンテンツ配信装置から、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツを検索するニュース検索手段と、
前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、
前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索手段と、
を有することを特徴とする広告配信装置。
An advertisement distribution apparatus that is connected to a news content distribution apparatus that distributes news content via a network and distributes advertisements according to web content that is an advertisement medium,
First feature word extraction means for extracting feature words from text information included in the web content;
Category determining means for determining a news category to which the web content belongs based on the feature words extracted by the first feature word extracting means;
News search means for searching for news content belonging to the news category determined by the category determination means from the news content distribution device;
Second feature word extraction means for extracting feature words from text information included in the news content searched by the news search means;
Advertisement search means for searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction means;
An advertisement distribution apparatus comprising:
前記ウェブコンテンツの属するニュースのカテゴリを表す単語と、当該ニュースのカテゴリを表す単語に関連する関連単語とが対応付けて登録されたカテゴリ分類データベースを備え、
前記カテゴリ決定手段は、前記第一の特徴語抽出手段により抽出された特徴語と、前記カテゴリ分類データベースとに基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定すること、
を特徴とする請求項1に記載の広告配信装置。
A category classification database in which a word representing a news category to which the web content belongs and a related word related to a word representing the news category are registered in association with each other;
The category determining unit determines a news category to which the web content belongs based on the feature word extracted by the first feature word extracting unit and the category classification database;
The advertisement distribution apparatus according to claim 1.
前記第一の特徴語抽出手段により抽出された特徴語の、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツとの関連度合いを示す重み値を算出する第一の重み値算出手段を有し、
前記ニュース検索手段は、前記第一の重み値算出手段により算出された重み値に基づいて、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツの中から、ニュースコンテンツを検索すること、
を特徴とする請求項1又は2に一項に記載の広告配信装置。
First weight value calculating means for calculating a weight value indicating a degree of association between the feature word extracted by the first feature word extracting means and the news content belonging to the news category determined by the category determining means; Have
The news search means, based on the weight value calculated by the first weight value calculation means, to search for news content from the news content belonging to the news category determined by the category determination means;
The advertisement distribution device according to claim 1 or 2, wherein
ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツに応じて広告の配信を行なう広告配信装置であって、
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、
前記ニュースコンテンツ配信装置から、前記第一の特徴語抽出手段により抽出された特徴語に基づいて、ニュースコンテンツを検索するニュース検索手段と、
前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、
前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索する広告検索手段と、
を有することを特徴とする広告配信装置。
An advertisement distribution apparatus that is connected to a news content distribution apparatus that distributes news content via a network and distributes advertisements according to web content that is an advertisement medium,
First feature word extraction means for extracting feature words from text information included in the web content;
News search means for searching for news content based on the feature words extracted by the first feature word extraction means from the news content distribution device;
Second feature word extraction means for extracting feature words from text information included in the news content searched by the news search means;
Advertisement search means for searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction means;
An advertisement distribution apparatus comprising:
ユーザの検索操作に用いられたクエリワードを記憶するクエリログ記憶装置とネットワークを介して接続され、
前記第二の特徴語抽出手段は、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、当該クエリワードを特徴語として当該ニュースコンテンツから抽出すること、
を特徴とする請求項1ないし4いずれか一項に記載の広告配信装置。
Connected to a query log storage device for storing a query word used for a user's search operation via a network;
The second feature word extraction unit obtains a query word included in the news content searched by the news search unit from the query log storage device, and extracts the query word from the news content as a feature word;
The advertisement distribution device according to any one of claims 1 to 4, wherein
前記第二の特徴語抽出手段により抽出された特徴語の、前記ニュース検索手段により検索されたニュースコンテンツとの関連度合いを示す重み値を算出する第二の重み値算出手段を有し、
前記広告検索手段は、前記第二の特徴語抽出手段により抽出された特徴語と、前記第二の重み値算出手段により算出された当該特徴語の重み値とに基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索すること、
を特徴とする請求項1ないし5いずれか一項に記載の広告配信装置。
Second weight value calculating means for calculating a weight value indicating a degree of association between the feature word extracted by the second feature word extracting means and the news content searched by the news searching means;
The advertisement search means is distributed to the web content based on the feature word extracted by the second feature word extraction means and the weight value of the feature word calculated by the second weight value calculation means. Search for content match ads to do,
The advertisement distribution device according to any one of claims 1 to 5, wherein:
前記第二の重み値算出手段は、ニュースコンテンツのニュースタイトル位置における特徴語に、ニュース本文位置における特徴語よりも、大きい重み値を算出すること、
を特徴とする請求項6に記載の広告配信装置。
The second weight value calculating means calculates a weight value larger than the feature word at the news body position for the feature word at the news title position of the news content;
The advertisement distribution apparatus according to claim 6.
ユーザの検索操作に用いられたクエリワードを記憶するクエリログ記憶装置とネットワークを介して接続され、
前記第二の重み値算出手段は、前記ニュース検索手段により検索されたニュースコンテンツにおける特徴語の重み値を算出するとき、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、取得されたクエリワードに、クエリワード以外のワードよりも、大きい重み値を算出すること、
を特徴とする請求項6又は7に記載の広告配信装置。
Connected to a query log storage device for storing a query word used for a user's search operation via a network;
The second weight value calculating means calculates a query word weight value included in the news content searched by the news search means when calculating a weight value of a feature word in the news content searched by the news search means. Obtaining from the storage device, and calculating a greater weight value for the obtained query word than words other than the query word;
The advertisement distribution device according to claim 6 or 7.
ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツの属するニュースのカテゴリを表す単語と、当該ニュースのカテゴリを表す単語に関連する関連単語とが対応付けて登録されたカテゴリ分類データベースを備え、前記ウェブコンテンツに応じて広告の配信を行なう広告配信装置における広告配信方法であって、
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出工程と、
前記第一の特徴語抽出工程により抽出された特徴語に基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するカテゴリ決定工程と、
前記ニュースコンテンツ配信装置から、前記カテゴリ決定工程により決定されたニュースのカテゴリに属するニュースコンテンツを検索するニュース検索工程と、
前記ニュース検索工程により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出工程と、
前記第二の特徴語抽出工程により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索工程と、
を有することを特徴とする広告配信方法。
A word representing a news category to which a web content serving as an advertising medium belongs is associated with a news content distribution apparatus that distributes news content, and a related word related to the word representing the news category is associated with each other. An advertisement distribution method in an advertisement distribution apparatus that includes a registered category classification database and distributes advertisements according to the web content,
A first feature word extraction step of extracting feature words from text information included in the web content;
A category determination step for determining a news category to which the web content belongs based on the feature words extracted by the first feature word extraction step;
A news search step of searching for news content belonging to the news category determined by the category determination step from the news content distribution device;
A second feature word extraction step of extracting a feature word from text information included in the news content searched by the news search step;
An advertisement search step of searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction step;
An advertisement distribution method characterized by comprising:
ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツに応じて広告の配信を行なう広告配信装置における広告配信方法であって、
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出工程と、
前記ニュースコンテンツ配信装置から、前記第一の特徴語抽出工程により抽出された特徴語に基づいて、ニュースコンテンツを検索するニュース検索工程と、
前記ニュース検索工程により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出工程と、
前記第二の特徴語抽出工程により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索工程と、
を有することを特徴とする広告配信方法。
An advertisement distribution method in an advertisement distribution apparatus that is connected to a news content distribution apparatus that distributes news content via a network and distributes advertisements according to web content that is an advertisement medium,
A first feature word extraction step of extracting feature words from text information included in the web content;
A news search step of searching for news content based on the feature word extracted by the first feature word extraction step from the news content distribution device;
A second feature word extraction step of extracting a feature word from text information included in the news content searched by the news search step;
An advertisement search step of searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction step;
An advertisement distribution method characterized by comprising:
請求項9又は10に記載の広告配信方法をコンピュータに実行させるための広告配信制御プログラム。   An advertisement distribution control program for causing a computer to execute the advertisement distribution method according to claim 9.
JP2008208092A 2008-08-12 2008-08-12 Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program Active JP4859893B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008208092A JP4859893B2 (en) 2008-08-12 2008-08-12 Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008208092A JP4859893B2 (en) 2008-08-12 2008-08-12 Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program

Publications (2)

Publication Number Publication Date
JP2010044585A JP2010044585A (en) 2010-02-25
JP4859893B2 true JP4859893B2 (en) 2012-01-25

Family

ID=42015920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008208092A Active JP4859893B2 (en) 2008-08-12 2008-08-12 Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program

Country Status (1)

Country Link
JP (1) JP4859893B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5315266B2 (en) 2010-03-01 2013-10-16 住友重機械工業株式会社 Connection structure between hollow output shaft and driven shaft, and reduction gear
JP5556461B2 (en) * 2010-07-12 2014-07-23 大日本印刷株式会社 Information browsing terminal device, information browsing system, information browsing program, and information browsing method
KR101614551B1 (en) * 2010-11-23 2016-04-22 네이버 주식회사 System and method for extracting keyword using category matching
JP5636082B1 (en) * 2013-10-08 2014-12-03 株式会社ワイズ Advertising information sharing system
US20180060913A1 (en) * 2016-08-29 2018-03-01 Nec Personal Computers, Ltd. Information processing apparatus, information processing method, and program
CN108241667B (en) * 2016-12-26 2019-10-15 百度在线网络技术(北京)有限公司 Method and apparatus for pushed information
CN110019776B (en) * 2017-09-05 2023-04-28 腾讯科技(北京)有限公司 Article classification method and device and storage medium
CN109635082B (en) * 2018-11-26 2024-08-02 平安科技(深圳)有限公司 Policy influence analysis method, device, computer equipment and storage medium

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050216823A1 (en) * 2003-12-30 2005-09-29 Microsoft Corporation Assigning textual ads based on article history
US7698626B2 (en) * 2004-06-30 2010-04-13 Google Inc. Enhanced document browsing with automatically generated links to relevant information

Also Published As

Publication number Publication date
JP2010044585A (en) 2010-02-25

Similar Documents

Publication Publication Date Title
US20220198129A1 (en) Selectively replacing displayed content items based on user interaction
JP4809403B2 (en) Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program
JP4859892B2 (en) Product advertisement distribution device, product advertisement distribution method, and product advertisement distribution control program
KR100650404B1 (en) On-line Advertising System And Method
JP5572596B2 (en) Personalize the ordering of place content in search results
US8041601B2 (en) System and method for automatically targeting web-based advertisements
US8209333B2 (en) System for using keyword phrases on a page to provide contextually relevant content to users
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
US10719836B2 (en) Methods and systems for enhancing web content based on a web search query
JP4859893B2 (en) Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program
JP6027039B2 (en) Extraction apparatus, extraction method and extraction program
JP5296045B2 (en) Advertisement information providing device
WO2017041359A1 (en) Information pushing method, apparatus and device, and non-volatile computer storage medium
JP2016520913A (en) Entity bid
US8543578B2 (en) Method and system for automatically identifying related content to an electronic text
KR20080105129A (en) Targeting of buzz advertising information
US11386180B2 (en) Resource locator remarketing
US20110071898A1 (en) System and method for updating search advertisements during search results navigation
US20050182677A1 (en) Method and/or system for providing web-based content
US20150278687A1 (en) User device side predicted performance measure adjustments
KR20050050016A (en) On-line advertising system and method
RU2683482C2 (en) Method of displaying relevant contextual information
US9135345B1 (en) Generating and updating online content using standardized tagged data
WO2016046650A1 (en) Method of and server for processing a message to determine intent
KR20050058172A (en) An online advertising system using exclusive keywords and a method thereof

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111004

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111101

R150 Certificate of patent or registration of utility model

Ref document number: 4859893

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250