JP4859893B2 - Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program - Google Patents
Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program Download PDFInfo
- Publication number
- JP4859893B2 JP4859893B2 JP2008208092A JP2008208092A JP4859893B2 JP 4859893 B2 JP4859893 B2 JP 4859893B2 JP 2008208092 A JP2008208092 A JP 2008208092A JP 2008208092 A JP2008208092 A JP 2008208092A JP 4859893 B2 JP4859893 B2 JP 4859893B2
- Authority
- JP
- Japan
- Prior art keywords
- news
- content
- advertisement
- word
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000000605 extraction Methods 0.000 claims description 47
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 239000000047 product Substances 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 230000000153 supplemental effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、ウェブコンテンツと共に表示されるウェブ広告を配信する広告配信装置、広告配信方法、及び広告配信制御プログラムの分野に関する。 The present invention relates to the fields of an advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program for distributing a web advertisement displayed together with web contents.
表示されるウェブコンテンツの内容に合わせて広告掲載を行うコンテンツマッチ広告やコンテンツ連動型広告が知られている(例えば、特許文献1参照)。広告主は、掲載したい広告と、その広告に関連するキーワードを指定すると、広告はそのキーワードに関連するコンテンツ(広告媒体)に対して掲載される。ウェブコンテンツの文章内容、キーワードなどを解析して、その内容と関連性の高い広告が配信される仕組みである。広告主にとっては、自らの商品やサービスと関連性の高いウェブサイトやウェブコンテンツに広告を掲載することができるので、高い広告効果を期待できる。即ち、このような広告方法によれば、閲覧者の嗜好にマッチした広告掲載を行うので、ウェブ広告による集客効果、又、費用対効果を向上させることができる。 Content match advertisements and content-linked advertisements that place advertisements in accordance with the contents of displayed web contents are known (for example, see Patent Document 1). When an advertiser designates an advertisement to be placed and a keyword related to the advertisement, the advertisement is placed on content (advertisement medium) related to the keyword. It is a mechanism that analyzes text content, keywords, etc. of web content and distributes advertisements highly relevant to the content. Advertisers can place advertisements on websites and web contents that are highly relevant to their products and services, so that a high advertising effect can be expected. In other words, according to such an advertising method, an advertisement that matches the viewer's preference is placed, so that it is possible to improve the effect of attracting customers by the web advertisement and the cost effectiveness.
ところで、このようなコンテンツマッチ広告において、掲載する広告は、時事変動に合わせ変化したほうが、世の中のトレンドに合わせた広告掲載ができて好ましい。例えば、携帯電話について記載されたブログに対して、その携帯電話についての広告を引き当てるのは勿論のこと、新発売の携帯電話の広告や最近キャンペーンなどで使われているキャラクターに関連する広告も表示したいといった具合である。 By the way, in such content match advertisements, it is preferable that the advertisements to be posted change according to current fluctuations because advertisements can be placed according to the trend of the world. For example, in addition to attracting advertisements for mobile phones to blogs about mobile phones, advertisements for newly released mobile phones and advertisements related to characters used in recent campaigns are also displayed. I want to do it.
関連する技術として、広告に関連するニュース記事等を当該広告の補足として掲載し広告に時事を関連させようとするものがある(例えば、特許文献2参照)。ターゲットコンテンツ(広告)を使用して補足的なコンテンツ(例えば、ニュース記事)を作成又は特定し、そのターゲットコンテンツと補足的なコンテンツとを結合して広告を得る。
しかしながら、従来のコンテンツマッチ広告では、必ずしも世の中のトレンドや時事変動に合わせた広告掲載が反映されるとは限らなかった。例えば、携帯電話について記載されたブログに対してコンテンツマッチ広告が掲載されるとき、記事投稿日から日付が経過してブログのコンテンツが陳腐化すると、そのブログには、現在旧機種となってしまった携帯電話に関する広告が依然掲載される場合がある。また、DVDや映画について記載されたブログに対してコンテンツマッチ広告が掲載されるとき、記事投稿日から日付が経過してブログのコンテンツが陳腐化すると、そのブログには、現在旧作となってしまったDVDに関する広告が掲載される場合がある。 However, conventional content match advertisements do not always reflect advertisements that are in line with world trends and current fluctuations. For example, when a content match advertisement is posted on a blog that describes a mobile phone, if the date of the article has passed and the blog content has become obsolete, the blog is now an old model. There may still be advertisements about mobile phones. Also, when a content match advertisement is posted on a blog that describes DVDs or movies, if the date of the article has passed and the blog content has become obsolete, the blog is now an old work. There may be advertisements related to DVDs.
このように、従来のコンテンツマッチ広告配信の処理に際して、直接的に最新のトレンドや時事が反映されているとはいえず、多くのユーザは新製品や新サービスへの関心が高い中、ユーザの興味を引き付ける広告の配信は、広告効果の観点からも強く望まれる。 In this way, the conventional content match advertisement distribution process does not directly reflect the latest trends and current events, and many users are highly interested in new products and services. Distribution of advertisements that attract interest is strongly desired from the viewpoint of advertising effectiveness.
特許文献1に記載される発明は、掲載する広告に対してニュース記事等の関連するコンテンツを結合して表示することができるが、広告そのものに関連する文書を引き当てたにすぎず、必ずしもコンテンツに関連する時事に連動した広告を引き当てることはできない。つまり、広告主が時事やトレンドに合わせたキーワードを指定していたとしても、そのキーワードでの広告引き当てが行われない。 The invention described in Patent Document 1 can display related content such as a news article in combination with an advertisement to be posted, but only assigns a document related to the advertisement itself. It is not possible to allocate advertisements linked to related current events. In other words, even if the advertiser designates a keyword that matches the current affairs or trend, advertisement allocation using that keyword is not performed.
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、コンテンツマッチ広告の配信に関して、コンテンツにマッチした広告配信を行なうとともに、時事に連動した広告の配信を行う広告配信装置、広告配信方法、及び広告配信制御プログラムを提供することにある。 The present invention has been proposed in view of the above-described conventional problems. The purpose of the present invention is to distribute advertisements that match content and distribute advertisements that are linked to current affairs. An advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program are provided.
上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツに応じて広告の配信を行なう広告配信装置であって、前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、前記第一の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するカテゴリ決定手段と、前記ニュースコンテンツ配信装置から、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツを検索するニュース検索手段と、前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索手段とを有することを特徴とする広告配信装置を要旨としている。 In order to solve the above-described problems, according to the present invention, as described in claim 1, a news content distribution device that distributes news content is connected via a network and corresponds to web content that is an advertising medium. An advertisement distribution apparatus that distributes advertisements, wherein a first feature word extraction unit that extracts a feature word from text information included in the web content and a feature extracted by the first feature word extraction unit Category determination means for determining a news category to which the web content belongs based on a word; news search means for searching for news content belonging to the news category determined by the category determination means from the news content distribution device; , Included in the news content retrieved by the news retrieval means From the text information, a second feature word extracting unit that extracts a feature word, and a content match advertisement to be distributed to the web content are searched based on the feature word extracted by the second feature word extracting unit. The gist of the present invention is an advertisement distribution device characterized by having an advertisement search means.
また、請求項2に記載されるように、請求項1に記載の広告配信装置において、前記ウェブコンテンツの属するニュースのカテゴリを表す単語と、当該ニュースのカテゴリを表す単語に関連する関連単語とが対応付けて登録されたカテゴリ分類データベースを備え、
前記カテゴリ決定手段は、前記第一の特徴語抽出手段により抽出された特徴語と、前記カテゴリ分類データベースとに基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するようにすることができる。
Further, as described in
The category determining unit may determine a news category to which the web content belongs based on the feature word extracted by the first feature word extracting unit and the category classification database.
また、請求項3に記載されるように、請求項1又は2に記載の広告配信装置において、前記第一の特徴語抽出手段により抽出された特徴語の、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツとの関連度合いを示す重み値を算出する第一の重み値算出手段を有し、前記ニュース検索手段は、前記第一の重み値算出手段により算出された重み値に基づいて、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツの中から、ニュースコンテンツを検索するようにすることができる。
In addition, as described in
また、上記の課題を解決するため、本発明にあっては、請求項4に記載されるように、ニュースコンテンツを配信するニュースコンテンツ配信装置とネットワークを介して接続され、広告媒体であるウェブコンテンツに応じて広告の配信を行なう広告配信装置であって、前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、前記ニュースコンテンツ配信装置から、前記第一の特徴語抽出手段により抽出された特徴語に基づいて、ニュースコンテンツを検索するニュース検索手段と、前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索する広告検索手段とを有することを特徴とする広告配信装置を要旨としている。 In order to solve the above problems, according to the present invention, as described in claim 4, web content that is connected to a news content distribution device that distributes news content via a network and is an advertising medium An advertisement distribution device that distributes advertisements in response to the first feature word extraction means for extracting feature words from the text information included in the web content, and the news content distribution device from the first Based on the feature words extracted by the feature word extraction means, a news search means for searching for news content, and a second feature for extracting feature words from text information included in the news content searched by the news search means Based on the feature words extracted by the word extraction means and the second feature word extraction means, the web controller Are summarized as advertisement distribution device characterized by having an advertisement search means for searching content matching ads to be delivered to Ntsu.
また、請求項5に記載されるように、請求項1ないし4いずれか一項に記載の広告配信装置において、ユーザの検索操作に用いられたクエリワードを記憶するクエリログ記憶装置とネットワークを介して接続され、前記第二の特徴語抽出手段は、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、当該クエリワードを特徴語として当該ニュースコンテンツから抽出するようにすることができる。
Further, as described in
また、請求項6に記載されるように、請求項1ないし5いずれか一項に記載の広告配信装置において、前記第二の特徴語抽出手段により抽出された特徴語の、前記ニュース検索手段により検索されたニュースコンテンツとの関連度合いを示す重み値を算出する第二の重み値算出手段を有し、前記広告検索手段は、前記第二の特徴語抽出手段により抽出された特徴語と、前記第二の重み値算出手段により算出された当該特徴語の重み値とに基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索することを特徴とするようにすることができる。 Further, as described in claim 6, in the advertisement distribution device according to any one of claims 1 to 5, the feature search extracted by the second feature word extraction unit is performed by the news search unit. A second weight value calculating unit that calculates a weight value indicating a degree of association with the searched news content, wherein the advertisement search unit includes the feature word extracted by the second feature word extracting unit; The content match advertisement to be distributed to the web content can be searched based on the weight value of the feature word calculated by the second weight value calculation means.
また、請求項7に記載されるように、請求項6に記載の広告配信装置において、前記第二の重み値算出手段は、ニュースコンテンツのニュースタイトル位置における特徴語に、ニュース本文位置における特徴語よりも、大きい重み値を算出するようにすることができる。 Further, as described in claim 7, in the advertisement distribution device according to claim 6, the second weight value calculation means includes a feature word at the news body position in the feature word at the news title position of the news content. It is possible to calculate a larger weight value than that.
また、請求項8に記載されるように、請求項6又は7に記載の広告配信装置において、ユーザの検索操作に用いられたクエリワードを記憶するクエリログ記憶装置とネットワークを介して接続され、前記第二の重み値算出手段は、前記ニュース検索手段により検索されたニュースコンテンツにおける特徴語の重み値を算出するとき、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、取得されたクエリワードに、クエリワード以外のワードよりも、大きい重み値を算出するようにすることができる。 Further, as described in claim 8, in the advertisement distribution device according to claim 6 or 7, the advertisement distribution device is connected to a query log storage device that stores a query word used for a user search operation via a network, and When calculating the weight value of the feature word in the news content searched by the news search unit, the second weight value calculation unit stores a query word included in the news content searched by the news search unit in the query log storage It is possible to calculate a weight value larger than a word other than the query word obtained from the device and obtained from the query word.
なお、本発明の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、などに適用したものも本発明の態様として有効である。 In addition, what applied the arbitrary combination of the component of this invention, expression, or a component to a method, an apparatus, a system, a computer program, a recording medium, etc. is also effective as an aspect of this invention.
本発明によれば、コンテンツマッチ広告の配信に関して、コンテンツにマッチした広告配信を行なうとともに、時事に連動した広告の配信を行う広告配信装置、広告配信方法、及び広告配信制御プログラムを提供することができる。 According to the present invention, it is possible to provide an advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program that distribute advertisements that match contents and distribute advertisements that are linked to current affairs regarding distribution of content match advertisements. it can.
以下、本発明を実施するための最良の形態を各実施形態において図面を用いて説明する。 The best mode for carrying out the present invention will be described below with reference to the drawings in each embodiment.
<システム構成>
はじめに、具体的な発明の内容を説明する前に、本発明を実施するにあたってのシステム構成について説明する。
<System configuration>
First, before describing specific contents of the present invention, a system configuration for carrying out the present invention will be described.
(ネットワーク)
図1は、本発明による広告配信装置1、Webサーバ2、ニュースサーバ3、及び端末4が、ネットワーク5を介して接続されているネットワーク構成図である。
(network)
FIG. 1 is a network configuration diagram in which an advertisement distribution apparatus 1, a
広告配信装置1は、本発明に係る広告配信装置(広告配信サーバ)であり、Webサーバ2が提供するコンテンツに関連する広告の配信を行なう。Webサーバ2は、コンテンツサーバであり、端末4からのコンテンツ取得要求に応じてコンテンツを提供する。ニュースサーバ3は、特にニュースに係るコンテンツサーバでニュースコンテンツ(時事情報)を有している。端末4は、広告を含むウェブコンテンツを閲覧するためのクライアント端末である。例えば、PC(Personal Computer)、PDA(Personal Digital Assistants)、携帯電話等の情報処理機器から構成され、ウェブブラウザ(ウェブコンテンツ閲覧ソフトウェア)を備える。ネットワーク5は、有線、無線を含むネットワークで、例えば、インターネット網である。
The advertisement distribution apparatus 1 is an advertisement distribution apparatus (advertisement distribution server) according to the present invention, and distributes advertisements related to content provided by the
なお、図1は本発明の一実施形態を説明するにあたっての一構成例を示したものであり、広告配信装置1は、Webサーバ2やニュースサーバ3などと共通のサーバ上に構築してもよいし、さらに後述する内部の機能部やDB(Data Base)を異なるサーバ上に構築してネットワーク5上に配置(接続)してもよい。
FIG. 1 shows a configuration example for explaining an embodiment of the present invention, and the advertisement distribution apparatus 1 can be constructed on a server shared with the
(ハードウェア)
ここで、広告配信装置1のハードウェア構成について簡単に説明しておく。広告配信装置1は、主要な構成として、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、補助記憶装置、記憶媒体読取装置、入力装置、表示装置、及び通信装置などを備える。
(hardware)
Here, the hardware configuration of the advertisement distribution apparatus 1 will be briefly described. The advertisement distribution apparatus 1 includes, as main components, a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), an auxiliary storage device, a storage medium reader, an input device, a display device, and a communication device. Etc.
CPUは、マイクロプロセッサ及びその周辺回路から構成され、広告配信装置1全体を制御する回路である。また、ROMは、CPUで実行される所定の制御プログラム(ソフトウェア部品)を格納するメモリであり、RAMは、CPUがROMに格納された所定の制御プログラム(ソフトウェア部品)を実行して各種の制御を行うときの作業エリア(ワーク領域)として使用するメモリである。 The CPU is composed of a microprocessor and its peripheral circuits, and is a circuit that controls the entire advertisement distribution apparatus 1. The ROM is a memory that stores a predetermined control program (software component) executed by the CPU. The RAM executes various control operations by executing a predetermined control program (software component) stored in the ROM. This is a memory used as a work area (work area) when performing.
補助記憶装置は、汎用のOS(Operating System)、広告に係る各種DB、本発明に係るプログラムなどを格納する装置であり、不揮発性の記憶装置であるHDD(Hard Disk Drive)などが用いられる。なお、上記各種情報は、補助記憶装置以外にも、CD−ROM(Compact Disk - ROM)やDVD(Digital Versatile Disk)などの記憶媒体やその他のメディアを記憶されてもよく、これらの記憶媒体に格納された各種情報は、記憶媒体読取装置などのドライブ装置を介して読み取ることが可能である。よって、必要に応じて記録媒体を記憶媒体読取装置にセットすることで、各種情報が得られる。 The auxiliary storage device is a device that stores a general-purpose OS (Operating System), various DBs related to advertisements, a program according to the present invention, and the like, and an HDD (Hard Disk Drive) that is a nonvolatile storage device is used. In addition to the auxiliary storage device, the various types of information may be stored in a storage medium such as a CD-ROM (Compact Disk-ROM) or a DVD (Digital Versatile Disk) or other media. Various stored information can be read through a drive device such as a storage medium reader. Therefore, various information can be obtained by setting the recording medium in the storage medium reading device as necessary.
入力装置は、ユーザ(管理者)が各種入力操作を行うための装置である。入力装置は、マウス、キーボードなどを含む。表示装置は、表示画面を表示する装置である。例えば、LCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)などから構成される。次に、通信装置は、ネットワークを介して他装置との通信を行う装置である。有線ネットワークや無線ネットワークなど含む各種ネットワーク形態に応じた通信をサポートする。 The input device is a device for a user (administrator) to perform various input operations. The input device includes a mouse, a keyboard, and the like. The display device is a device that displays a display screen. For example, it is composed of LCD (Liquid Crystal Display), CRT (Cathode Ray Tube) and the like. Next, the communication device is a device that communicates with other devices via a network. Supports communication according to various network forms including wired and wireless networks.
(機能)
図2は、本発明の実施形態に係る広告配信装置1、及びWebサーバ2の一実施形態の主要機能を示す機能ブロック図である。広告配信装置1は、主要な機能として、コンテンツ受信部101、コンテンツ特徴語抽出部102、カテゴリ分類部103、ニュース検索部104、ニュース特徴語抽出部105、コンテンツマッチ広告検索部106、及び広告送信部107を含む構成である。また、DBとして、カテゴリ分類DB111、コンテンツマッチ広告DB/入札ワードDB112を備える。
(function)
FIG. 2 is a functional block diagram showing main functions of an embodiment of the advertisement distribution apparatus 1 and the
コンテンツ受信部101は、Webサーバ2からウェブコンテンツを受信する機能を有している。Webサーバ2からは、ウェブコンテンツから抽出済みのテキスト情報形式で受信してもよい。
The
コンテンツ特徴語抽出部102は、ウェブコンテンツから特徴語を重み値とともに抽出する機能を有している。特徴語は、ウェブコンテンツに含まれる単語から特徴語抽出処理を行って抽出される。例えば、ウェブコンテンツ内の単語について、その出現頻度、出現箇所、文字属性などに応じた重みを値として算出(重み値算出部)し、上位の重み値を有する単語をそのウェブコンテンツを特徴付ける特徴語として抽出する。
The content feature
カテゴリ分類部103は、カテゴリ分類DB111を参照して、特徴語(及び重み値)に基づいてウェブコンテンツが属するカテゴリに分類する機能を有している。カテゴリ分類DB111は、詳しくは後述するが、コンテンツをカテゴリ分類するために、ニュースサーバ3上のニュースカテゴリに対応させたカテゴリと、そのカテゴリ(名称)に関連する関連単語を対応させて記憶しているDBである。関連単語の取得方法は色々であるが、一例として、カテゴリ名称を検索エンジンに投げて検索結果のスニペットから関連単語を取得しておく。なお、スニペットとは、検索エンジンで検索結果のタイトルの下に表示されるテキストのことである。
The
ニュース検索部104は、ニュースサーバ3からニュースコンテンツを検索する機能を有している。ニュースの検索は、カテゴリ分類部103で分類されたウェブコンテンツのカテゴリに基づいて行なわれる。具体的には、コンテンツのカテゴリと同一カテゴリのニュースを検索する。また、ニュースの検索は、コンテンツ特徴語抽出部102により抽出された特徴語(及び重み値)に基づいて行なわれる。このようにニュース検索部104は、カテゴリ又は特徴語のいずれかに基づいてニュースを検索する。詳細はまた後述する。
The
ニュース特徴語抽出部105は、ニュース検索部104により検索されたニュースから、特徴語(及び重み値)を抽出する機能を有している。特徴語は、上述した方法と同様でよく、ニュースコンテンツに含まれる単語から特徴語抽出処理を行って抽出される。例えば、ニュースコンテンツ内の単語について、その出現頻度、出現箇所(特に、ニュースタイトル部)、文字属性などに応じた重みを値として算出(重み値算出部)し、上位の重み値を有する単語をそのニュースコンテンツを特徴付ける特徴語として抽出する。
The news feature
また、ニュース特徴語抽出部105は、ニュース検索部104により検索されたニュースから、特徴語(及び重み値)を抽出するとき、クエリログDB301を参照する。クエリログDB301は、ニュースと、ニュースに対応するクエリワード(検索語)とを記録したログで、ニュースから特徴語(及び重み値)を抽出するとき、特徴語の重み値の決定に反映できる。詳細は後述する。
The news feature
コンテンツマッチ広告検索部106は、入札ワードを利用してコンテンツマッチ広告DB112から、ニュース特徴語抽出部105により抽出された特徴語にマッチしたコンテンツマッチ広告を検索して、配信すべき広告を決定する機能を有している。このコンテンツマッチ広告については、詳細後述する。
The content match
広告送信部107は、コンテンツマッチ広告検索部106により検索された配信されるべきコンテンツマッチ広告をWebサーバ2に送信する機能を有している。
The
次に、Webサーバ2の機能についても簡単に説明する。Webサーバ2は、一般的なWebサーバ機能を有し、主要な機能として、ページ要求受信部201、コンテンツ送信部202、広告受信部203、ページ作成部204、及びページ送信部205を含む構成である。
Next, the function of the
ページ要求受信部201は、端末4からウェブコンテンツページの要求を受信する。コンテンツ送信部202は、そのウェブコンテンツページに表示する(埋め込む)ための広告の配信を受けるため広告配信装置1に対して、コンテンツDB206から、ページ作成部204を介して、対象となるコンテンツを送信する。広告受信部203は、広告配信装置1から広告(コンテンツマッチ広告)を受信する。ページ作成部204は、ウェブコンテンツページに広告を埋め込んで最終的に端末4(ひいてはユーザ)に提供するウェブコンテンツページを作成する。ページ送信部205は、最終的なウェブコンテンツページを端末4に送信する。
The page
以上、本発明の実施形態に係る広告配信装置1の構成全般について説明を行った。この構成において以下、広告配信装置1の(処理)動作について説明を行う。 The overall configuration of the advertisement distribution device 1 according to the embodiment of the present invention has been described above. In this configuration, the (processing) operation of the advertisement distribution apparatus 1 will be described below.
<動作>
図3は、本発明による広告配信装置1の広告配信処理例を示すフローチャートである。適時図面を参照して以下説明を行う。
<Operation>
FIG. 3 is a flowchart showing an example of an advertisement distribution process of the advertisement distribution apparatus 1 according to the present invention. The following will be described with reference to the timely drawings.
ステップS301で、Webサーバ2から受信したウェブコンテンツからテキスト情報を読み込む。
In step S301, text information is read from the web content received from the
ステップS302に進み、コンテンツ特徴語抽出部102は、読み込んだテキスト情報から特徴語抽出処理を行う。まず、テキスト情報に含まれる単語を抜き出して、その単語毎に重み値を算出する。重み値は、ウェブコンテンツとその単語との関連度合いを示す値である。重み値は、関連度合い算出の基となる要素、例えば上述したように、ウェブコンテンツ内の単語の出現頻度、出現箇所、文字属性(書体データ)などに基づいて算出される。そのウェブコンテンツ内で出現頻度の高い単語は、直接的にそのウェブコンテンツを特徴付ける意味を持つし、ウェブコンテンツ内のタイトルを示す箇所等に位置する単語は、要約的にそのウェブコンテンツを特徴付ける意味を持つ。また。文字属性(フォントサイズ、太文字、下線文字、色文字等)に着目すれば、ウェブコンテンツ作成者が何らかの意図を持ってその単語にフォントを付しているので、同様にそのウェブコンテンツを特徴付ける意味を持つと考えられるからである。
In step S302, the content feature
図4は、ウェブコンテンツから特徴語とその重み値が抽出された様子を示す図である。この例では、いわゆるブログと称されるコンテンツであるが、このコンテンツは、タイトルブロックと本文ブロックにブロック分けされている。タイトルブロックに位置する単語は、タイトルやそれに準ずる単語が記載されていることが多く、コンテンツの内容や話題をよく表している。よって、タイトルブロックに位置する単語は大きい重み値を付与する。また、文字フォントが他の文字に比べ大きい単語についても大きい重み値を付与する。よって、単語「主婦」、「子育て」などには大きな重み値が付与される。また、単語「運動」は出現頻度が高く、下線が引かれている箇所もあるため、同様に大きな重み値が付与される。 FIG. 4 is a diagram illustrating a state in which feature words and their weight values are extracted from web content. In this example, the content is a so-called blog, but this content is divided into a title block and a text block. The word located in the title block often includes a title or a word equivalent thereto, and well represents the content and topic. Therefore, a large weight value is given to the word located in the title block. Also, a large weight value is assigned to a word whose character font is larger than other characters. Therefore, a large weight value is given to the words “housewife”, “child care”, and the like. In addition, since the word “exercise” has a high appearance frequency and is underlined in some places, a large weight value is similarly given.
また、重み値として、世間一般でその単語がどの程度使用されているかを考慮することもできる。単純にその単語を検索エンジンで検索した結果のヒット数に応じて重み値を大きくしてもよいし、一般名詞(普通名詞)より固有名詞の方が商品名等に関連性が高かったり何かしら意味があるものとして同様に重み値を大きくしてもよい。 In addition, as a weight value, it can be considered how much the word is used in general. You can simply increase the weight value according to the number of hits as a result of searching for that word in the search engine, or the proper noun is more relevant to the product name or the like than the general noun (common noun). Similarly, the weight value may be increased.
このような重み付けに関し一例として、文章中の特徴的な単語を抽出するためのアルゴリズム(自然言語処理)であるTF-IDFなどが知られている。コンテンツから得られる単語の出現頻度を表すTF値と、コーパスを検索した結果得られる出現頻度であるDF値(又は逆出現頻度であるIDF値)とからTF-IDF値を求め、TF-IDF値がある閾値以上のもののみを特徴語とすることにより特徴語の抽出を行う。なお、コーパスとは、多数の単語が含まれているデータベースのようなもので、各単語とその出現頻度(DF値)が格納されているものとする。多くのドキュメントに出現する一般的な単語は重要度を下げて、特定のドキュメントにしか出現しない単語の重要度を上げる役割がある。特徴語の抽出条件は、例えば、「TF-IDF値がある閾値以上である単語すべて」、「TF-IDF値がある閾値以上である単語のうち上位N件の単語」などとする。 As an example of such weighting, TF-IDF, which is an algorithm (natural language processing) for extracting characteristic words in sentences, is known. The TF-IDF value is obtained from the TF value representing the appearance frequency of the word obtained from the content and the DF value (or IDF value that is the reverse appearance frequency) that is the appearance frequency obtained as a result of searching the corpus. Feature words are extracted by using only those having a certain threshold value or more as feature words. The corpus is like a database containing a large number of words, and each word and its appearance frequency (DF value) are stored. General words appearing in many documents have a role of decreasing the importance and increasing the importance of words appearing only in a specific document. The feature word extraction condition is, for example, “all words whose TF-IDF value is equal to or greater than a certain threshold value”, “the top N words among words whose TF-IDF value is equal to or greater than a certain threshold value”, and the like.
このようにどのような単語を特徴語として抽出するかは、弾力的に決定することが可能である。なお、算出された重み値は数値を扱いやすいよう正規化処理をしておく。 In this way, what words are extracted as feature words can be determined elastically. The calculated weight value is normalized so that numerical values can be easily handled.
図3に戻り、ステップS303に進み、コンテンツ特徴語抽出部102により抽出された特徴語に基づいて、ウェブコンテンツをカテゴリ分類してからカテゴリに基づいてニュースを検索(ニュース検索部104)するか、カテゴリ分類せずにその特徴語に基づいてニュースを検索(ニュース検索部104)するかで処理を分岐する。また、カテゴリ及び特徴語の両方に基づいてニュースを検索(ニュース検索部104)し、最終的に適切な結果を取捨選択してもよい。
Returning to FIG. 3, the process proceeds to step S303, where the web content is classified into categories based on the feature words extracted by the content feature
ステップS304に進むと、カテゴリ分類部103は、カテゴリ分類DB111を参照して、ステップS302で抽出された特徴語に基づいて、ウェブコンテンツをカテゴリに分類する。図5は、カテゴリ分類DB111のデータ構造を示す模式図である。カテゴリ分類DB111は、コンテンツから抽出された特徴語に基づいて、ウェブコンテンツをカテゴリ分類するために用いられるDBで、ニュースサーバ3上のニュースカテゴリ(ニュース分野)に対応させたカテゴリと、そのカテゴリ(名称)に関連する関連単語を対応させて記憶しているDBである。関連単語の取得方法は色々考えられるが、例えば、カテゴリ(名称)を検索エンジンに投げて検索結果のスニペットから関連単語(頻出語や特徴語としてもよい)を重み値とともに取得しておく。またここでTF-IDFを利用してもよい。図6は、コンテンツから抽出された特徴語を(仮)カテゴリ分類する様子を示す図である。特徴語によっては、カテゴリが重複するものもあるが重複してもカテゴリ毎に分類しておく。
In step S304, the
次にカテゴリ分類部103は、特徴語の重み値と関連単語との重み値からスコアを算出する。スコアは、コンテンツに対するカテゴリ毎の関連度合いを表す1つの指標である。図7は、カテゴリ毎にスコアを算出する様子を示す図である。ここでは特徴語と関連単語との重み値を乗算することにより算出できる。なお、これまで精度を高めるために重み値を考慮してきたが、単純に特徴語の出現回数でスコアを算出する方法もある。例えば、カテゴリ「育児」には特徴語が3回、カテゴリ「地域」には特徴語が1回、又カテゴリ「健康」には特徴語が2回出現する場合には、スコアをそれぞれ3、1、2とできる。つまり、スコアは、コンテンツに対するカテゴリ毎の関連度合いを表す指標であればよい。
Next, the
図8は、スコア順にカテゴリを並び替え、上位カテゴリを抽出する様子を示す図である。カテゴリ分類部103によりスコアが算出されたが、スコアの値順(降順)に並び替えて所定上位のカテゴリのみ抽出する。ここでは上位1つのカテゴリを抽出するものとし、それ以下のカテゴリについては線引きを行いニュースの検索に考慮されない。このようにしてこの例では最終的に、ウェブコンテンツは、カテゴリ「育児」に分類された。
FIG. 8 is a diagram illustrating a state in which categories are rearranged in the order of scores and upper categories are extracted. Although the score is calculated by the
図3に戻り、ステップS305に進み、ニュース検索部104は、ニュースサーバ3からニュースを検索する。上述したように、ニュース検索部104は、ウェブコンテンツのカテゴリ又は特徴語のいずれかに基づいてニュースを検索する。
Returning to FIG. 3, the process proceeds to step S <b> 305, and the
まず、ウェブコンテンツのカテゴリに基づいてニュースを検索する。図9は、ニュースサーバ3から検索(取得)されたニュースカテゴリ「育児」に属するニュースコンテンツの一例を示す図である。カテゴリ分類部103によりウェブコンテンツは、カテゴリ「育児」に分類されているので、ニュースサーバ3からニュースカテゴリ「育児」に属するニュースコンテンツを、例えば、直近(最新)5件を検索する。上述したように、カテゴリ分類DB111のカテゴリと、ニュースサーバ3からニュースカテゴリは、対応した関係にあるので、ニュース検索部104は容易に対応するニュースコンテンツを検索することができる。また、さらにウェブコンテンツと文書的な距離が近いニュースを検索するよう、コンテンツ特徴語抽出部102により抽出された特徴語の、カテゴリ分類部103により分類されたニュースのカテゴリに属するニュースコンテンツとの関連度合いを示す重み値を算出し、ニュース検索部104は、算出された重み値に基づいて、分類されたニュースのカテゴリに属するニュースコンテンツの中から、ニュースコンテンツを検索することもできる。重み値を算出については、上述の如くTF-IDF等を利用できる。
First, news is searched based on the category of web content. FIG. 9 is a diagram illustrating an example of news content belonging to the news category “childcare” searched (acquired) from the
次に、コンテンツ特徴語抽出部102により抽出された特徴語(及び重み値)に基づいてニュースを検索する処理について説明する。図4に戻り、ウェブコンテンツから特徴語(及び重み値)が抽出された様子が示されている。この特徴語(及び重み値)に基づいてニュースを検索する。例えば、直近(例えば、当日)に更新されたニュースコンテンツから、特徴語を含むニュースコンテンツを検索する。また、特徴語の重み値と、ニュースコンテンツの特徴語の重み値から、マッチスコアを算出してもよい。例えば、ベクトル空間モデルなどを利用して、特徴語にマッチするニュースコンテンツとの適合度(関連度)を表すマッチスコアを算出する。ベクトル空間モデルは情報検索を行なうためのアルゴリズムである。重み値をベクトルとみなしてベクトル空間上に表現し、相関量をコサイン、内積、距離等によって計算し関連度を求める。算出されたマッチスコア降順にニュースコンテンツを並び替え、所定上位のものを抽出する。このようにしてニュースコンテンツ毎のマッチスコアを算出し、マッチスコアが所定上位のニュースコンテンツを最終的に取得する。
Next, a process for searching for news based on the feature words (and weight values) extracted by the content feature
これまで説明したように、ステップ305では、ニュース検索部104は、ウェブコンテンツのカテゴリ又は特徴語のいずれかに基づいてニュースコンテンツを検索する。なお、ウェブコンテンツのカテゴリに基づいてニュースコンテンツを検索する場合、検索された複数のニュースコンテンツのニュースカテゴリはすべて同一である。一方、特徴語のいずれかに基づいてニュースコンテンツを検索する場合、特徴語(及び重み)次第なので、ニュースカテゴリ同一とは限らず多岐に渡る場合がある。
As described above, in step 305, the
ここで、ウェブコンテンツが、比較的同一のカテゴリに属する話題が取り上げられている場合は、ウェブコンテンツのカテゴリ又は特徴語のいずれかに基づいてニュースコンテンツを検索しても、比較的同様なニュースコンテンツが検索される可能性が高い。一方、比較的異なる複数のカテゴリに属する話題が取り上げられている場合は、異なるニュースコンテンツが検索される可能性が高い。ニュースコンテンツの検索がウェブコンテンツのカテゴリに基づく場合、特定のカテゴリに係る広告に絞って広告を決定するので、高い広告効果を得られる場合がある。一方、犠牲(足きり)となる話題も伴う。また、ニュースコンテンツの検索が特徴語に基づく場合、ウェブコンテンツに出現する特徴語広くに渡って関連する広告を決定するので、バランスが取れた広告の配信となると考えられる。 Here, when topics that belong to relatively the same category are taken up as web content, even if the news content is searched based on either the category or feature word of the web content, relatively similar news content is obtained. Is likely to be searched. On the other hand, when topics belonging to a plurality of relatively different categories are taken up, there is a high possibility that different news contents are searched. When the search of news content is based on the category of web content, since the advertisement is determined by focusing on the advertisement related to a specific category, a high advertising effect may be obtained. On the other hand, it comes with a sacrificial topic. In addition, when the search of news content is based on feature words, related advertisements are determined over a wide range of feature words appearing in web content, so it is considered that balanced advertisement delivery is achieved.
図3、ステップS306に進む。クエリログDB301を参照して、ステップS305で検索されたニュースコンテンツから特徴語(及び重み)を抽出するときは、ステップS307で、そのニュースコンテンツに対応するクエリログを取得する。クエリログDB301を参照(考慮)しない場合には、クエリログを取得なしにステップS308に進む。
The process proceeds to FIG. 3, step S306. When feature words (and weights) are extracted from the news content searched in step S305 with reference to the
ここで、ここでいうクエリワードとは、ニュースコンテンツに対応付いたワード(単語)であって、検索エンジンの検索窓に入力された検索ワードをいう。具体的に説明すると、ユーザがあるニュースコンテンツを閲覧し、その直後に検索窓に入力した検索語である。一般に、ユーザはニュース記事中のある特定のワードに興味を持つと、そのワードを検索エンジンで検索するという行動がしばしば見られる。よって、ニュースを閲覧したユーザの行動履歴をトラッキングし、ニュース閲覧直後に検索窓に入力されたワードは、そのニュースにおいてユーザが興味を示したワード、即ち特徴語そのものであるといえる。クエリログDB301は、ニュースサーバ3のニュースコンテンツを識別(特定)するニュースコンテンツ識別子と、そのニュースコンテンツに対応するクエリワード(検索語)とを記録したログで、ニュースコンテンツから、特徴語(及び重み値)を抽出するとき、特徴語の抽出及び重み値の決定に反映することができる。図10は、クエリログの一例を示す図である。
Here, the query word here is a word (word) associated with the news content and is a search word input to the search window of the search engine. More specifically, it is a search term that is input to the search window immediately after a user browses a certain news content. In general, when a user is interested in a specific word in a news article, a search engine is often used to search for that word. Therefore, it can be said that the word entered in the search window immediately after browsing the news after tracking the behavior history of the user who browsed the news is the word that the user showed interest in the news, that is, the feature word itself. The
図3、ステップS308に進み、ニュース特徴語抽出部105は、ステップS305で検索されたニュースコンテンツから、特徴語及び重み値を抽出する。抽出方法は、上述したように、ニュースコンテンツ内の単語について、その出現頻度、出現箇所、文字属性などに応じた重みを値として算出(重み値算出部)し、上位の重み値を有する単語をそのニュースコンテンツを特徴付ける特徴語として抽出すればよい。またここでTF-IDFを利用してもよい。
In step S308 in FIG. 3, the news feature
また、ニュースコンテンツ特有の点に着目した単語の重み付けを行うことができる。一般にニュースコンテンツには、タイトル(見出し)が付される。タイトルは、そのニュースコンテンツを要約的に示すので、タイトルに含まれる単語には、より大きな重み値を付与することにより、引き当てられる広告とのコンテンツマッチ(マッチスコア)の精度を高めることができる。 Further, it is possible to weight words focusing on points unique to news content. In general, a title (heading) is attached to news content. Since the title indicates the news content in summary, the accuracy of the content match (match score) with the assigned advertisement can be improved by giving a larger weight value to the word included in the title.
また、クエリログを取得している場合は、クエリログを反映して、特徴語及び重み値の抽出を行なう。具体的には、あるニュースコンテンツで、そのクエリログに記録される単語には大きな重み値を付与する。その単語は、ユーザがそのニュースコンテンツを閲覧したとき、相当な程度をもって興味を示したワードであるといえるからである。 If a query log is acquired, feature words and weight values are extracted reflecting the query log. Specifically, a large weight value is assigned to a word recorded in the query log of a certain news content. This is because the word can be said to be a word that shows interest to a considerable degree when the user browses the news content.
図11は、ニュースコンテンツから、特徴語及び重み値が抽出された様子を示す図である。上述したように、どのような単語を特徴語として抽出するかは、弾力的に決定することが可能であるが、本発明のニュース特徴語抽出部105は、特にニュースコンテンツ特有の点に着目した単語の重み付けや、クエリログを反映しての重み付けを行なっている。
FIG. 11 is a diagram illustrating a state in which feature words and weight values are extracted from news content. As described above, what word is extracted as a feature word can be determined elastically, but the news feature
図3、ステップS309に進み、コンテンツマッチ広告検索部106は、ニュースコンテンツから抽出された特徴語及び重み値に基づいて、コンテンツマッチ広告の検索を行なう。コンテンツマッチ広告検索部106は、入札ワードを利用してコンテンツマッチ広告DB112から、特徴語(及び重み値)にマッチしたコンテンツマッチ広告を検索して決定する。
In step S309 in FIG. 3, the content match
図12は、コンテンツマッチ広告DB112のデータ構造を示す模式図である。コンテンツマッチ広告DB112は、広告主が購入した広告(広告コンテンツ)と入札ワードとが対応付けられて登録されるDBである。広告主は、広告とその広告に関連する入札ワード(キーワード)を指定して広告を購入する。入札ワードは、配信する広告と広告媒体のコンテンツとマッチさせるためのキーワードである。 FIG. 12 is a schematic diagram showing the data structure of the content match advertisement DB 112. The content match advertisement DB 112 is a DB in which an advertisement (advertisement content) purchased by an advertiser and a bid word are registered in association with each other. An advertiser designates an advertisement and a bid word (keyword) related to the advertisement and purchases the advertisement. The bid word is a keyword for matching the advertisement to be distributed with the content of the advertisement medium.
図13は、コンテンツマッチ広告検索部106が、入札ワードDB112を利用して、広告媒体であるコンテンツと入札ワードとの適合度を表すマッチスコアを算出する様子を示す図である。入札ワードDB112には、予め入札ワードとその関連単語(及び重み値)とが対応付けられて登録されている。ニュース特徴語抽出部105によりニュースコンテンツから抽出された特徴語の重み値と関連単語の重み値とから、例えば、ベクトル空間モデルなどを利用して広告媒体であるコンテンツと入札ワードとの適合度(関連度)を表すマッチスコアを算出する。ベクトル空間モデルは情報検索を行なうためのアルゴリズムである。重み値をベクトルとみなしてベクトル空間上に表現し、相関量をコサイン、内積、距離等によって計算し関連度を求める。算出されたマッチスコア降順に入札ワードを並び替え、所定上位の入札ワードを抽出する。そして、コンテンツマッチ広告DB112において、この入札ワードに対応する広告が決定(検索)される。
FIG. 13 is a diagram showing how the content match
図3、ステップS309に進み、コンテンツマッチ広告検索部106により配信すべき広告が決定されたので、広告送信部107は、Webサーバ2にその広告を送信する。Webサーバ2は広告を受信すると、コンテンツ(広告媒体)に広告(広告情報)を埋め込んで、最終的にウェブコンテンツページとしてユーザの端末4に送信する。そして、端末4においてウェブブラウザ等で広告を含むウェブコンテンツページが表示される。図14は、表示されるウェブコンテンツページの一例である。広告媒体であるウェブコンテンツ(ブログ)に関連する広告であって、直近のニュース(トレンド)なども反映した広告が配信されている。なお、広告にはテキスト広告、画像広告(バナー)形式を含んでいる。また、テキスト広告、画像広告には、URL(Uniform Resource Locator)などのリンク情報が埋め込まれている。
In FIG. 3, the process proceeds to step S <b> 309, and since the advertisement to be distributed is determined by the content match
<総括>
これまで説明したように、本発明による広告配信装置1は、ウェブコンテンツにマッチしたニュースコンテンツを検索し、そのニュースコンテンツに基づいて、広告の引き当てを行なう。ニュースコンテンツは、トレンドや時事変動に係る情報を有しているので、広告とのマッチ処理に際して直接的に最新のトレンドや時事を反映することができ、よりユーザの興味を引き付ける広告を配信してひいては広告効果の向上が期待できる。
<Summary>
As described above, the advertisement distribution apparatus 1 according to the present invention searches for news content that matches web content, and allocates advertisements based on the news content. News content has information on trends and current affairs, so it can directly reflect the latest trends and current affairs when matching with ads, and deliver ads that attract more users' interests. As a result, improvement in advertising effectiveness can be expected.
また、広告主サイドからすれば、ウェブコンテンツ(広告掲載媒体)において時事やトレンドに合ったコンテンツを含まない場合でも、広告主が時事やトレンドに合わせたキーワード(入札ワード)を指定していればそのキーワードでの広告の引き当てを行うことができる。 From the advertiser's side, even if the web content (advertising media) does not include content that matches current affairs or trends, if the advertiser specifies keywords (bid words) that match current affairs or trends. You can allocate ads for that keyword.
また、ウェブコンテンツに対する広告の引き当てを行う際に、ニュースを介在させることで、ウェブコンテンツからは抽出できないような商品名や企業名等の広告引き当てが容易な特徴語を抽出することができる。 In addition, when an advertisement is assigned to a web content, a feature word that can be easily assigned an advertisement such as a product name or a company name that cannot be extracted from the web content can be extracted by interposing news.
また、ウェブコンテンツとニュースコンテンツとの関連度に基づいてニュースコンテンツを検索することで、ウェブコンテンツの内容に近いニュースに基づいて特徴語を抽出することができるため、ウェブコンテンツの内容に近く且つ時事に連動した広告を引き当てることができる。 Also, by searching for news content based on the degree of association between web content and news content, it is possible to extract feature words based on news that is close to the content of the web content. Can be used for ads linked to.
以上、本発明によれば、コンテンツマッチ広告の配信に関して、コンテンツにマッチした広告配信を行なうとともに、時事に連動した広告の配信を行う広告配信装置、広告配信方法、及び広告配信制御プログラムを提供することが可能となる。 As described above, according to the present invention, an advertisement distribution apparatus, an advertisement distribution method, and an advertisement distribution control program that distribute advertisements that match contents and distribute advertisements that are linked to current affairs are provided for distribution of content match advertisements. It becomes possible.
なお、本発明の好適な実施の形態、特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。 Although the present invention has been described with reference to preferred embodiments and specific specific examples of the present invention, these specific examples have been described without departing from the broad spirit and scope of the present invention as defined in the claims. Obviously, various modifications and changes can be made to the. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.
1 広告配信装置
2 Webサーバ
3 ニュースサーバ
4 端末
5 ネットワーク
101 コンテンツ受信部
102 コンテンツ特徴語抽出部
103 カテゴリ分類部
104 ニュース検索部
105 ニュース特徴語抽出部
106 コンテンツマッチ広告検索部
107 広告送信部
111 カテゴリ分類DB
112 コンテンツマッチ広告DB/入札ワードDB
201 ページ要求受信部
202 コンテンツ送信部
203 広告受信部
204 ページ作成部
205 ページ送信部
206 コンテンツDB
301 クエリログDB
DESCRIPTION OF SYMBOLS 1
112 Content Match Ad DB / Bid Word DB
201 page
301 Query log DB
Claims (11)
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、
前記第一の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するカテゴリ決定手段と、
前記ニュースコンテンツ配信装置から、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツを検索するニュース検索手段と、
前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、
前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索手段と、
を有することを特徴とする広告配信装置。 An advertisement distribution apparatus that is connected to a news content distribution apparatus that distributes news content via a network and distributes advertisements according to web content that is an advertisement medium,
First feature word extraction means for extracting feature words from text information included in the web content;
Category determining means for determining a news category to which the web content belongs based on the feature words extracted by the first feature word extracting means;
News search means for searching for news content belonging to the news category determined by the category determination means from the news content distribution device;
Second feature word extraction means for extracting feature words from text information included in the news content searched by the news search means;
Advertisement search means for searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction means;
An advertisement distribution apparatus comprising:
前記カテゴリ決定手段は、前記第一の特徴語抽出手段により抽出された特徴語と、前記カテゴリ分類データベースとに基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定すること、
を特徴とする請求項1に記載の広告配信装置。 A category classification database in which a word representing a news category to which the web content belongs and a related word related to a word representing the news category are registered in association with each other;
The category determining unit determines a news category to which the web content belongs based on the feature word extracted by the first feature word extracting unit and the category classification database;
The advertisement distribution apparatus according to claim 1.
前記ニュース検索手段は、前記第一の重み値算出手段により算出された重み値に基づいて、前記カテゴリ決定手段により決定されたニュースのカテゴリに属するニュースコンテンツの中から、ニュースコンテンツを検索すること、
を特徴とする請求項1又は2に一項に記載の広告配信装置。 First weight value calculating means for calculating a weight value indicating a degree of association between the feature word extracted by the first feature word extracting means and the news content belonging to the news category determined by the category determining means; Have
The news search means, based on the weight value calculated by the first weight value calculation means, to search for news content from the news content belonging to the news category determined by the category determination means;
The advertisement distribution device according to claim 1 or 2, wherein
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出手段と、
前記ニュースコンテンツ配信装置から、前記第一の特徴語抽出手段により抽出された特徴語に基づいて、ニュースコンテンツを検索するニュース検索手段と、
前記ニュース検索手段により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出手段と、
前記第二の特徴語抽出手段により抽出された特徴語に基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索する広告検索手段と、
を有することを特徴とする広告配信装置。 An advertisement distribution apparatus that is connected to a news content distribution apparatus that distributes news content via a network and distributes advertisements according to web content that is an advertisement medium,
First feature word extraction means for extracting feature words from text information included in the web content;
News search means for searching for news content based on the feature words extracted by the first feature word extraction means from the news content distribution device;
Second feature word extraction means for extracting feature words from text information included in the news content searched by the news search means;
Advertisement search means for searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction means;
An advertisement distribution apparatus comprising:
前記第二の特徴語抽出手段は、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、当該クエリワードを特徴語として当該ニュースコンテンツから抽出すること、
を特徴とする請求項1ないし4いずれか一項に記載の広告配信装置。 Connected to a query log storage device for storing a query word used for a user's search operation via a network;
The second feature word extraction unit obtains a query word included in the news content searched by the news search unit from the query log storage device, and extracts the query word from the news content as a feature word;
The advertisement distribution device according to any one of claims 1 to 4, wherein
前記広告検索手段は、前記第二の特徴語抽出手段により抽出された特徴語と、前記第二の重み値算出手段により算出された当該特徴語の重み値とに基づいて、前記ウェブコンテンツに配信すべきコンテンツマッチ広告を検索すること、
を特徴とする請求項1ないし5いずれか一項に記載の広告配信装置。 Second weight value calculating means for calculating a weight value indicating a degree of association between the feature word extracted by the second feature word extracting means and the news content searched by the news searching means;
The advertisement search means is distributed to the web content based on the feature word extracted by the second feature word extraction means and the weight value of the feature word calculated by the second weight value calculation means. Search for content match ads to do,
The advertisement distribution device according to any one of claims 1 to 5, wherein:
を特徴とする請求項6に記載の広告配信装置。 The second weight value calculating means calculates a weight value larger than the feature word at the news body position for the feature word at the news title position of the news content;
The advertisement distribution apparatus according to claim 6.
前記第二の重み値算出手段は、前記ニュース検索手段により検索されたニュースコンテンツにおける特徴語の重み値を算出するとき、前記ニュース検索手段により検索されたニュースコンテンツ中に含まれるクエリワードを前記クエリログ記憶装置から取得し、取得されたクエリワードに、クエリワード以外のワードよりも、大きい重み値を算出すること、
を特徴とする請求項6又は7に記載の広告配信装置。 Connected to a query log storage device for storing a query word used for a user's search operation via a network;
The second weight value calculating means calculates a query word weight value included in the news content searched by the news search means when calculating a weight value of a feature word in the news content searched by the news search means. Obtaining from the storage device, and calculating a greater weight value for the obtained query word than words other than the query word;
The advertisement distribution device according to claim 6 or 7.
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出工程と、
前記第一の特徴語抽出工程により抽出された特徴語に基づいて、前記ウェブコンテンツの属するニュースのカテゴリを決定するカテゴリ決定工程と、
前記ニュースコンテンツ配信装置から、前記カテゴリ決定工程により決定されたニュースのカテゴリに属するニュースコンテンツを検索するニュース検索工程と、
前記ニュース検索工程により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出工程と、
前記第二の特徴語抽出工程により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索工程と、
を有することを特徴とする広告配信方法。 A word representing a news category to which a web content serving as an advertising medium belongs is associated with a news content distribution apparatus that distributes news content, and a related word related to the word representing the news category is associated with each other. An advertisement distribution method in an advertisement distribution apparatus that includes a registered category classification database and distributes advertisements according to the web content,
A first feature word extraction step of extracting feature words from text information included in the web content;
A category determination step for determining a news category to which the web content belongs based on the feature words extracted by the first feature word extraction step;
A news search step of searching for news content belonging to the news category determined by the category determination step from the news content distribution device;
A second feature word extraction step of extracting a feature word from text information included in the news content searched by the news search step;
An advertisement search step of searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction step;
An advertisement distribution method characterized by comprising:
前記ウェブコンテンツに含まれるテキスト情報から、特徴語を抽出する第一の特徴語抽出工程と、
前記ニュースコンテンツ配信装置から、前記第一の特徴語抽出工程により抽出された特徴語に基づいて、ニュースコンテンツを検索するニュース検索工程と、
前記ニュース検索工程により検索されたニュースコンテンツに含まれるテキスト情報から、特徴語を抽出する第二の特徴語抽出工程と、
前記第二の特徴語抽出工程により抽出された特徴語に基づいて、前記ウェブコンテンツに対して配信すべきコンテンツマッチ広告を検索する広告検索工程と、
を有することを特徴とする広告配信方法。 An advertisement distribution method in an advertisement distribution apparatus that is connected to a news content distribution apparatus that distributes news content via a network and distributes advertisements according to web content that is an advertisement medium,
A first feature word extraction step of extracting feature words from text information included in the web content;
A news search step of searching for news content based on the feature word extracted by the first feature word extraction step from the news content distribution device;
A second feature word extraction step of extracting a feature word from text information included in the news content searched by the news search step;
An advertisement search step of searching for a content match advertisement to be distributed to the web content based on the feature words extracted by the second feature word extraction step;
An advertisement distribution method characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008208092A JP4859893B2 (en) | 2008-08-12 | 2008-08-12 | Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008208092A JP4859893B2 (en) | 2008-08-12 | 2008-08-12 | Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010044585A JP2010044585A (en) | 2010-02-25 |
JP4859893B2 true JP4859893B2 (en) | 2012-01-25 |
Family
ID=42015920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008208092A Active JP4859893B2 (en) | 2008-08-12 | 2008-08-12 | Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4859893B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5315266B2 (en) | 2010-03-01 | 2013-10-16 | 住友重機械工業株式会社 | Connection structure between hollow output shaft and driven shaft, and reduction gear |
JP5556461B2 (en) * | 2010-07-12 | 2014-07-23 | 大日本印刷株式会社 | Information browsing terminal device, information browsing system, information browsing program, and information browsing method |
KR101614551B1 (en) * | 2010-11-23 | 2016-04-22 | 네이버 주식회사 | System and method for extracting keyword using category matching |
JP5636082B1 (en) * | 2013-10-08 | 2014-12-03 | 株式会社ワイズ | Advertising information sharing system |
US20180060913A1 (en) * | 2016-08-29 | 2018-03-01 | Nec Personal Computers, Ltd. | Information processing apparatus, information processing method, and program |
CN108241667B (en) * | 2016-12-26 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | Method and apparatus for pushed information |
CN110019776B (en) * | 2017-09-05 | 2023-04-28 | 腾讯科技(北京)有限公司 | Article classification method and device and storage medium |
CN109635082B (en) * | 2018-11-26 | 2024-08-02 | 平安科技(深圳)有限公司 | Policy influence analysis method, device, computer equipment and storage medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050216823A1 (en) * | 2003-12-30 | 2005-09-29 | Microsoft Corporation | Assigning textual ads based on article history |
US7698626B2 (en) * | 2004-06-30 | 2010-04-13 | Google Inc. | Enhanced document browsing with automatically generated links to relevant information |
-
2008
- 2008-08-12 JP JP2008208092A patent/JP4859893B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010044585A (en) | 2010-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220198129A1 (en) | Selectively replacing displayed content items based on user interaction | |
JP4809403B2 (en) | Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program | |
JP4859892B2 (en) | Product advertisement distribution device, product advertisement distribution method, and product advertisement distribution control program | |
KR100650404B1 (en) | On-line Advertising System And Method | |
JP5572596B2 (en) | Personalize the ordering of place content in search results | |
US8041601B2 (en) | System and method for automatically targeting web-based advertisements | |
US8209333B2 (en) | System for using keyword phrases on a page to provide contextually relevant content to users | |
US8321278B2 (en) | Targeted advertisements based on user profiles and page profile | |
US10719836B2 (en) | Methods and systems for enhancing web content based on a web search query | |
JP4859893B2 (en) | Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program | |
JP6027039B2 (en) | Extraction apparatus, extraction method and extraction program | |
JP5296045B2 (en) | Advertisement information providing device | |
WO2017041359A1 (en) | Information pushing method, apparatus and device, and non-volatile computer storage medium | |
JP2016520913A (en) | Entity bid | |
US8543578B2 (en) | Method and system for automatically identifying related content to an electronic text | |
KR20080105129A (en) | Targeting of buzz advertising information | |
US11386180B2 (en) | Resource locator remarketing | |
US20110071898A1 (en) | System and method for updating search advertisements during search results navigation | |
US20050182677A1 (en) | Method and/or system for providing web-based content | |
US20150278687A1 (en) | User device side predicted performance measure adjustments | |
KR20050050016A (en) | On-line advertising system and method | |
RU2683482C2 (en) | Method of displaying relevant contextual information | |
US9135345B1 (en) | Generating and updating online content using standardized tagged data | |
WO2016046650A1 (en) | Method of and server for processing a message to determine intent | |
KR20050058172A (en) | An online advertising system using exclusive keywords and a method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4859893 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |