JP2008097351A - 広告配信装置およびプログラム - Google Patents

広告配信装置およびプログラム Download PDF

Info

Publication number
JP2008097351A
JP2008097351A JP2006278851A JP2006278851A JP2008097351A JP 2008097351 A JP2008097351 A JP 2008097351A JP 2006278851 A JP2006278851 A JP 2006278851A JP 2006278851 A JP2006278851 A JP 2006278851A JP 2008097351 A JP2008097351 A JP 2008097351A
Authority
JP
Japan
Prior art keywords
web page
category
advertisement
unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006278851A
Other languages
English (en)
Other versions
JP4940399B2 (ja
Inventor
Noriya Furubayashi
紀哉 古林
Takeshi Kono
武 河野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SIX APART Ltd
Nomura Research Institute Ltd
Original Assignee
SIX APART Ltd
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SIX APART Ltd, Nomura Research Institute Ltd filed Critical SIX APART Ltd
Priority to JP2006278851A priority Critical patent/JP4940399B2/ja
Publication of JP2008097351A publication Critical patent/JP2008097351A/ja
Application granted granted Critical
Publication of JP4940399B2 publication Critical patent/JP4940399B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ウェブページの内容に関連した広告を配信する。
【解決手段】文章分類部100は、ネットワーク208上で提供される媒体ウェブページ214のテキスト情報に基づいて、前もって設定されている複数のカテゴリの中から媒体ウェブページ214が分類されるべきカテゴリを決定する。広告配信装置210は、配信先となるウェブページのカテゴリを指定した広告情報の中から媒体ウェブページ214のカテゴリと一致する広告情報を選択する。そして、広告配信装置210は、媒体ウェブページ214とともに広告情報を表示させるために、媒体ウェブページを閲覧する端末206に対して広告情報を送信する。
【選択図】図1

Description

本発明は、ネットワーク上で提供されるウェブページに対して、ウェブページの内容に関連する広告を配信する技術に関する。
近年、インターネットを介して閲覧されるウェブページに広告を表示することが広く行われている。従来、インターネット上で広告を配信する手法として、コンテンツマッチング技術が知られている。この技術では、広告主が自身の広告のキーワードを指定しておき、そのキーワードに合致するウェブサイトに広告が配信される(例えば、特許文献1を参照)。
特開2003−187145号公報
しかし、コンテンツマッチングによる広告配信では、ウェブページのキーワードのみを参照するため、ある商品について否定的なコメントを述べているようなウェブページにその商品の広告が配信されたり、または、キーワードとしての言葉は同一であっても、広告の対象となる物品やサービスが全く別のものについて述べているウェブページに広告が配信されるようなことが起こりえる。
本発明はこうした状況に鑑みてなされたものであり、その目的は、ウェブページの内容や文脈に即した適切な広告の配信を可能にする技術を提供することにある。
本発明のある態様は、ネットワーク上で提供される媒体ウェブページのテキスト情報に基づいて、前もって設定されている複数のカテゴリの中から媒体ウェブページが分類されるべきカテゴリを決定し、配信先となるウェブページのカテゴリを指定した広告情報の中から媒体ウェブページのカテゴリと一致する広告情報を選択し、媒体ウェブページとともに広告情報を表示させるために媒体ウェブページを閲覧する端末に対して広告情報を送信する広告配信装置である。
ここで、「媒体ウェブページ」とは、広告情報の配信先となるウェブページのことをいう。「カテゴリ」とは、ウェブページを特定の基準にしたがって分類するためのグループ分けのことをいう。「広告情報」には、単に特定の商品やサービスの広告のテキストのみの情報、特定の商品やサービスを提供するサイトへのリンク情報、特定の商品やサービスの画像、動画、または音声、およびこれらの複数を組み合わせたもののいずれも含まれる。
この態様によると、媒体ウェブページのカテゴリと合致するカテゴリが広告主によって指定されている広告情報が選択されて、媒体ウェブページとともに表示されるので、媒体ウェブページの内容や文脈に即した内容の広告を配信することができる。
本発明の別の態様もまた、広告配信装置である。この装置は、ネットワーク上で提供される媒体ウェブページに広告を表示させる装置であって、広告の配信先となる媒体ウェブページのカテゴリ条件を指定するカテゴリ指定情報と関連付けて広告情報を保持する広告情報保持部と、ネットワークを介して媒体ウェブページを取得し、該媒体ウェブページのテキスト情報に基づいて、前もって設定されている複数のカテゴリの中から該媒体ウェブページが分類されるべきカテゴリを決定するページ解析部と、ページ解析部により決定された媒体ウェブページのカテゴリがカテゴリ条件を満たしている広告情報を広告情報保持部から選択するマッチング部と、ネットワークに接続された端末で媒体ウェブページが閲覧されるとき、その端末に対してマッチング部で選択された広告情報を媒体ウェブページとともに表示させる形態で送信する広告送信部と、を備える。
この態様によると、媒体ウェブページのテキスト情報に基づいて分類されるべきカテゴリが決定され、このカテゴリが、予め広告情報に関連付けて設定されているカテゴリ条件を満足する広告情報が選択されて配信されるので、前もって媒体ウェブページのカテゴリの申告や分類をさせることなく、媒体ウェブページの内容や文脈に即した内容の広告を配信することができる。
広告情報保持部は、前もって設定されている複数のカテゴリ毎に、そのカテゴリに分類される媒体ウェブページに広告を表示するか否かを指定するカテゴリ指定情報と関連付けて広告情報を保持してもよい。これによると、媒体ウェブページのカテゴリ毎に、広告主が自身の広告情報を表示させるか否かを個別に設定することができる。
ページ解析部は、前もって設定されている複数のカテゴリに媒体ウェブページが帰属する確率を表す帰属確率をカテゴリ毎に計算する文章分類部をさらに備えてもよい。広告情報保持部は、広告の配信先となる媒体ウェブページの帰属確率の下限値をカテゴリ毎に指定するカテゴリ指定情報と関連付けて広告情報を保持し、マッチング部は、媒体ウェブページの帰属確率と広告情報に関連する帰属確率の下限値とを比較して、媒体ウェブページの帰属確率が下限値以上であるとき、対応する広告情報を広告情報保持部から選択してもよい。
「帰属確率」とは、ウェブページがあるカテゴリに分類されるべき確率のことであり、カテゴリ毎に算出することができる。これによると、カテゴリ毎に帰属確率の下限値を指定することで、複数のカテゴリにまたがるような内容の媒体ウェブページを広告の配信先として選別することが可能になる。
広告情報保持部は、広告の送信を回避すべき非表示カテゴリを指定するカテゴリ指定情報と関連付けて広告情報を保持し、広告送信部は、非表示カテゴリに分類される媒体ウェブページへの広告情報の送信を拒否してもよい。これによると、広告主は、文章分類部によって算出される帰属確率にかかわらず、広告を表示させたくない媒体ウェブページのカテゴリを個別に指定することができる。
広告送信部から送信された広告情報を媒体ウェブページに表示させるためのスクリプトプログラムを媒体ウェブページに記述させるために、該スクリプトプログラムを媒体ウェブページの管理者の端末に送信するページ管理部をさらに備えてもよい。スクリプトプログラムは、ネットワークに接続された端末で媒体ウェブページが閲覧されたとき、該媒体ウェブページの情報をページ解析部に送信する機能を有してもよい。ページ解析部は、スクリプトプログラムから送信された情報にしたがって媒体ウェブページを取得してもよい。これによると、媒体ウェブページが閲覧されたときに初めて、そのウェブページが広告配信装置によって取得され、その後ページ解析部によって媒体ウェブページのカテゴリ分類が実行される。したがって、広告配信装置は前もって媒体ウェブページをクロールしておく必要がなく、広告配信装置の処理負荷を抑えることができる。
広告情報保持部は、広告の配信先となる媒体ウェブページのキーワードを指定する配信先キーワードに関連付けて広告情報を保持し、ページ解析部は、媒体ウェブページからキーワード集合を抽出するキーワード抽出部をさらに備えてもよい。マッチング部は、媒体ウェブページのキーワード集合に含まれる配信先キーワードが指定された広告情報を広告情報保持部から選択し、その後、選択された広告情報の中からウェブページのカテゴリがカテゴリ条件を満足している広告情報を選択してもよい。これによると、広告情報の表示先についてキーワードとカテゴリの両方を指定させ、両方の条件を満足する媒体ウェブページに対してのみ広告情報が表示されるので、広告主は、広告配信先の媒体ウェブページの内容をさらに細かく指定することができる。
本発明のさらに別の態様もまた、広告配信装置である。この装置は、ネットワーク上で提供される媒体ウェブページに広告を表示させる装置であって、広告の配信先となる媒体ウェブページのカテゴリ条件を指定するカテゴリ指定情報と関連付けて広告情報を保持する広告情報保持部と、広告情報の配信先となる媒体ウェブページが分類されるカテゴリを受け取り、該カテゴリがカテゴリ条件を満たしている広告情報を広告情報保持部から選択するマッチング部と、ネットワークに接続された端末で媒体ウェブページが閲覧されるとき、その端末に対してマッチング部で選択された広告情報を媒体ウェブページとともに表示させる形態で送信する広告送信部と、を備える。
なお、以上の構成要素の任意の組合せ、本発明を方法、装置、システム、記録媒体、コンピュータプログラムにより表現したものもまた、本発明の態様として有効である。
本発明によれば、媒体ウェブページのカテゴリを決定し、カテゴリについての条件が合致する広告情報が選択されて媒体ウェブページとともに表示されるので、媒体ウェブページの内容や文脈に即した内容の広告を配信することができる。
本発明の一実施形態は、ネットワーク上で提供されているブログを初めとするウェブページに広告を配信する広告配信装置である。
図1は、本実施の形態に係る広告配信装置210の使用形態の一例を示す。広告配信装置210は、ネットワーク208を介して一般ユーザ端末206、広告主端末202、およびページ管理者端末204と接続される。広告主端末202は、ウェブページに対して広告の配信を希望する広告主が操作する端末であり、ページ管理者端末204は、自身が管理するウェブページに対する広告情報の配信を許可するウェブページ管理者が操作する端末である。本明細書では、広告情報の配信対象となるウェブページを、特に「媒体ウェブページ」と呼ぶことにする。一般ユーザ端末206は、広告主端末202およびページ管理者端末204以外の、媒体ウェブページを閲覧するユーザが使用する端末である。
本実施形態における「広告情報」は、広告主サイトのURL(Uniform Resource Locator)と関連付けされた状態で媒体ウェブページに表示され、その広告を一般ユーザが選択することで、広告主のサイトに一般ユーザを誘う役割を有するものをいう。好ましくは、広告情報はクリック可能なかたちで表示されるテキスト、画像、または動画である。しかしながら、一般ユーザを広告主のサイトへと誘う方法はこれらに限定されず、単に広告情報とともに広告主のURLを表示したり、広告主のメールアドレスを宛先にしたメーラが起動されたりしてもよい。また、広告情報をクリックしたとき、プロキシサーバを経由して広告主のサイトに接続されてもよい。
ページ管理者は、自身の端末204を操作して、作成したウェブページ214をプロバイダサーバ212のデータベースに保存する。プロバイダサーバ212は、媒体ウェブページにアクセスする一般ユーザ端末206からURLを指定してウェブページ214の要求がくると、そのURLに対応するウェブページ214を選択して一般ユーザ端末206に対して送信する。一般ユーザ端末206のブラウザは、ウェブページ214を解釈してディスプレイに表示する。
広告配信装置210は、予め登録されている広告情報をいずれの媒体ウェブページに配信するかを決定する。また、広告配信装置210は、各広告情報が媒体ページに表示された回数や、広告がクリックされて広告主のサイトが表示された回数などを集計してもよい。
広告配信装置210は、文章分類部100を備える。文章分類部100は、URLで指定される媒体ウェブページを取得して、その媒体ウェブページを予め設定してある複数のカテゴリのいずれかに分類する。
広告主は、広告情報の配信先としたい媒体ウェブページのキーワードを指定する配信先キーワードと、配信先としたい媒体ウェブページのカテゴリを指定するカテゴリ条件とを指定しておく。広告主が指定する配信先キーワードは、一語でもよいし複数語でもよい。広告配信装置210は、予め広告の配信を希望する旨の登録がなされた媒体ウェブページについて、媒体ウェブページに含まれるキーワードの集合と媒体ウェブページのカテゴリとを決定する。広告配信装置210は、文章分類部100が決定した媒体ウェブページのキーワード集合およびカテゴリと、広告情報について指定されている配信先キーワードおよびカテゴリ条件を比較する。そして、広告配信装置210は、媒体ウェブページに含まれるキーワード集合が広告主の指定した配信先キーワードを含み、かつ媒体ウェブページのカテゴリが広告主の指定したカテゴリ条件を満足する場合に、対応する広告情報を一般ユーザ端末206に対して送信する。
以下では、まず媒体ウェブページが分類されるべきカテゴリを決定する文章分類部100の機能および構成について詳細に説明する。その後、本実施形態にかかる広告配信装置210について説明する。
1.文章分類部
図2は、文章分類部100の機能ブロック図である。文章分類部100は、文例格納部12、文章分解部18、ソート部20、分類辞書作成部22、分類辞書保持部24、カテゴリ帰属確率計算部26、判定部28、要素絞り込み基準提供部30、判定結果格納部32および文章受付部36を備える。これらの構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
文章分類部100に含まれる機能ブロックは、辞書データを作成する学習段階に使用される機能ブロックと、辞書データの作成後に当該辞書データを使用して未分類の文章データを分類する分類段階に使用される機能ブロックとに分けることができる。まず、学習段階に使用される機能ブロックについて説明する。
文例格納部12は、予め定められた複数のカテゴリそれぞれについて、そのカテゴリに分類されるべき文章データを含むカテゴリ文例14と、そのカテゴリに分類されない文章データを含む非カテゴリ文例16とを格納する。ここで「カテゴリ」とは、文章データを特定の基準にしたがって分類するためのグループ分けのことをいう。このカテゴリは、文章の分類結果の使用目的に応じて、多様に設定することができる。例えば、文章分類部100による分類結果をニュース記事配信サイトで使用する場合は、「政治」「経済」「社会」「スポーツ」のようなカテゴリの種類が考えられる。文章分類部100による分類結果をディレクトリ型の検索サイトで提供する場合は、「ショッピング」「旅行」「映画」「音楽」のようなカテゴリの種類が考えられる。文章分類部100により、クライアント端末から送信されてくるアンケートなどを分類する場合は、「女性」「若年層」のようなカテゴリの種類が考えられる。
また、「文章データ」とは、テキストデータ、HTML、XML、XHTMLファイルなどのテキスト情報を含んだデータを指すが、そのデータ形式は限定されない。
M個のカテゴリ(カテゴリ1、・・・、カテゴリM)が規定されるとすると、各カテゴリ毎にカテゴリ文例14と非カテゴリ文例16が文例格納部12内に準備される。カテゴリ文例は、あるカテゴリに分類されるべきひとつまたは複数の文章データを蓄積したファイルである。非カテゴリ文例データは、あるカテゴリに分類されないひとつまたは複数の文章データを蓄積したファイルである。文章データがいずれのカテゴリ文例または非カテゴリ文例に含まれるかの判断は、人手を介して行われる。また、カテゴリ文例と非カテゴリ文例は、各カテゴリについて一対ずつ準備される。
あるカテゴリについての非カテゴリ文例に含まれる文章データは、他のカテゴリについての非カテゴリ文例に含まれる文章データと異なっていてもよいし、同一であってもよい。つまり、「非カテゴリ1文例」内の文章データと「非カテゴリ2文例」内の文章データとが重複していてもよい。カテゴリ文例についても同様であり、例えば、「カテゴリ1文例」と「カテゴリ2文例」の両方に分類される文章データが存在してもよい。ただし、同一カテゴリ内で、カテゴリ文例と非カテゴリ文例の両方に分類される文章データは存在しないことが望ましい。
文章分解部18は、上述したカテゴリ文例14および非カテゴリ文例16に含まれる文章データを所定の規則にしたがって解析し、文章の構成要素を抽出する。文章分解部18は、既知の文章分解アルゴリズムのうち任意のものを使用することができる。文章分解部18は、文章分解アルゴリズムに応じて、単語、単語と品詞の組合せ、文節、単文などを構成要素として文章データから抽出する。文章分解部18で使用される文章分解アルゴリズムの例については、後述する。
ソート部20は、文章分解部18によりカテゴリ文例14、非カテゴリ文例16の文章データから抽出された構成要素を、所定の規則にしたがって並べ替える。一例として、構成要素の読みを50音順に並べ替えてもよい。または、構成要素の最初の一文字のASCIIコード順に並べ替えてもよい。文章分解部18が単語と品詞の組合せを構成要素として抽出した場合は、構成要素の品詞順に配列してもよい。ソート部20によって構成要素を並べ替えることによって、後述する構成要素をキーとした辞書データの検索が容易になるため、分類辞書の作成に要する時間を短縮できる。
分類辞書作成部22は、文章分解部18により抽出された各構成要素が、各カテゴリについてのカテゴリ文例14および非カテゴリ文例16内の文章データに出現する頻度を算出し、構成要素と各カテゴリについての出現頻度とを関連付けた辞書データを作成する。ここでいう「頻度」は、単なる出現の回数でもよいし、全単語数に対する出現の比率で表してもよい。あるいは、カテゴリ文例または非カテゴリ文例に含まれる文章データ数に対する出現比率でもよい。以下では、これらを合わせて「出現頻度」と呼ぶ。いずれにしても、ある構成要素がひとつのカテゴリについてのカテゴリ文例と非カテゴリ文例に出現する度合いを表現する数値であれば、任意のものを採用できる。
分類辞書作成部22により作成された辞書データは、分類辞書保持部24に格納される。分類辞書作成部22のさらに詳細な構成および機能については、図4を参照して後述する。
要素絞り込み基準提供部30には、文章分解部18により抽出された構成要素から一部の構成要素を除外するための選択基準が格納されている。この選択基準は、例えば特定の品詞(例えば、名詞+動詞、名詞のみ、助詞のみなど)を指定したり、文字数の上限を指定したり、平仮名のみ、または漢字のみからなる構成要素を指定する条件のことをいう。複数の条件を組み合わせて選択基準としてもよい。
分類辞書作成部22は、要素絞り込み基準提供部30から提供される選択基準を利用して、辞書データの作成対象となる構成要素数を絞り込むことによって、分類辞書保持部24に格納される辞書データのデータ量を抑制しつつ、分類に有効な辞書データを作成することができる。
本実施の形態の文章分類部100は、分類すべき文章データの言語を限定しないが、この要素絞り込み基準提供部30は、日本語の文章データの処理時には特に有用となる。
続いて、分類段階に使用される機能ブロックについて説明する。
文章受付部36は、分類対象となる文章データ34(以下、「未分類文章データ34」と呼ぶ)を図示しない外部装置から受信する。未分類文章データ34は、上述と同様にデータ形式に制限はない。外部装置は、例えばネットワークに接続されたクライアント端末やサーバであるが、これらに限定されない。
文章分解部18は、文章受付部36から未分類文章データ34を受け取り、上述したのと同様にして、文章の構成要素を抽出する。抽出された構成要素は、ソート部20によって所定の規則にしたがって並べ替えられる。この規則は、カテゴリ文例および非カテゴリ文例から抽出された構成要素を並べ替えたのと同様の規則であることが好ましい。この並べ替えによって、構成要素をキーとした分類辞書保持部24内の辞書データの検索が容易になるため、後述するカテゴリ帰属確率計算部26における処理が高速化される。
カテゴリ帰属確率計算部26は、分類辞書保持部24に格納された辞書データを参照して、いくつかの構成要素を含む未分類文章データがそれぞれのカテゴリに分類されるべき確率を、各カテゴリについて計算する。以下では、この確率のことを「帰属確率」と呼ぶ。
分類辞書作成部22と同様に、カテゴリ帰属確率計算部26は、要素絞り込み基準提供部30から提供される選択基準にしたがって、帰属確率を算出する基礎となる構成要素数を限定してもよい。
カテゴリ帰属確率計算部26のさらに詳細な構成および機能については、図7を参照して後述する。
判定部28は、カテゴリ帰属確率計算部26により各カテゴリについて計算された帰属確率を取得し、帰属確率の値に基づいて未分類文章データをいずれかのカテゴリに分類するかを決定する。より具体的には、判定部28は、帰属確率が最大となったカテゴリに未分類文章データを分類する。あるいは、予め設定されているしきい値以上の帰属確率が得られたすべてのカテゴリに未分類文章データを分類してもよい。こうすることによって、一連の演算でひとつの未分類文章データを二つ以上のカテゴリに分類することができる。帰属確率がしきい値以上となったカテゴリが存在しない場合、判定部28は、未分類文章データをいずれのカテゴリにも分類されない文章と判定してもよいし、帰属確率が最大となったカテゴリに分類してもよい。判定部28による未分類文章データの判定結果は、判定結果格納部32に格納されるか、または図示しない外部装置に出力される。
次に、文章分解部18で使用される文章分解アルゴリズムの概要を説明する。
(1)形態素解析
図3は、文章データを形態素解析によって構成要素に分解した例を示す。使用した文章データは、「気象庁は23日、関東地方で春一番が吹いたと発表した。」という文章である。図3に示すように、この文章は「気象庁/は/2/3/日/、/関東/地方/で/春一番/が/吹い/た/と/発表/し/た/。」のように、18の要素に分解される。形態素解析では、対象となる文章から、活用形50と、原形52と、品詞54を決定することができる。これら活用形、原形、品詞のうち、(原形+品詞)を構成要素としてもよいし、または、原形のみを要素としてもよい。原形の代わりに活用形を要素としてもよい。
形態素解析を使用して抽出された構成要素は文章の分解能が高いため、この構成要素を使用した辞書データに基づくカテゴリへの分類が高精度になると期待される。形態素解析は周知の技術であるため、これ以上の説明を省略する。
(2)構文解析
次に、構文解析について説明する。構文解析は、文章を文節に分解する。図3の例と同一の文章データを構文解析によって分解すると、「気象庁は/23日、/関東地方で/春一番が/吹いたと/発表した。」のように、6つの構成要素に分解される。
構文解析を使用すると、形態素解析と比べて構成要素数が大幅に減少するので、高速分類に適しているが、分類の精度は低下する。構文解析は周知の技術であるため、これ以上の説明を省略する。
(3)最小構成文
次に、形態素解析と構文解析を使用して文章から最小構成文を抽出する例を説明する。ここで「最小構成文」とは、最小限の意味をなす文のことであり、詳細は「模倣レポート判定に用いる文書間類似度の考案、太田貴久、増山繁、言語処理学会第10回年次大会発表論文集、pp.729-732、2004」に記載されている。
図3の例と同一の文章データから最小構成文を抽出すると、「気象庁は発表した。」「23日、発表した。」「関東地方で春一番が吹いたと発表した。」の3つの最小構成文が得られる。これら最小構成文を構成要素として辞書データを作成すると、文脈の中での単語の意味を捉えることができるため、複数の意味に捉えられる単語を含んだ文章を適切なカテゴリに分類するといった高度の分類が可能となるが、計算コストは高くなる。
なお、形態素解析の結果得られる品詞情報を利用して、名詞、形容詞、動詞の原形のみからなる最小構成文を抽出してもよい。上記と同一の例を使用すると、「気象庁・発表する」「23日・発表する」「関東地方・春一番・吹く・発表する」という3つの最小構成文が得られる。
このように、文章分解部18において異なる文章分解アルゴリズムを使用して構成要素を抽出することで、分類辞書作成部22において異なる傾向を有する辞書データを作成することができる。したがって、カテゴリの種類などに合わせて適切な文章分解アルゴリズムを選択することで、分類の精度や処理速度を向上させることも可能である。
図4は、分類辞書作成部22の詳細な機能ブロック図である。分類辞書作成部22は、構成要素受付部102、絞り込み情報受付部104、カテゴリ情報提供部106、構成要素選択部108、辞書データ検索部110および辞書データ更新部112を含む。
構成要素受付部102は、ソート部20から所定の規則にしたがって並べ替えられた構成要素を受け取り、構成要素選択部108に渡す。カテゴリ情報提供部106は、構成要素受付部102で受け取られた構成要素が抽出されたカテゴリ文例および非カテゴリ文例の属するカテゴリについての情報を、要素絞り込み基準提供部30に伝える。絞り込み情報受付部104は、要素絞り込み基準提供部30から選択基準を受け取り、構成要素選択部108に渡す。構成要素選択部108は、選択基準と構成要素とを比較して、選択基準を満たす構成要素を選択して辞書データ検索部110に渡す。辞書データ検索部110は、分類辞書保持部24に保持されている辞書データの中から、選択基準を満たした構成要素と同一の構成要素についての辞書データがあるか検索し、対応する辞書データがある場合は、辞書データ更新部112に渡す。辞書データ更新部112は、選択基準を満たした各構成要素の数をカウントし、その数を辞書データに追加し、分類辞書保持部24に格納する。構成要素が新規であるときは、新たな辞書データを作成して分類辞書保持部24に格納する。
図5は、分類辞書保持部24に格納されている辞書データのデータ構造図である。辞書データ40においては、構成要素42と、その構成要素がカテゴリ1〜Mのカテゴリ文例および非カテゴリ文例に含まれる文章中に出現する出現頻度44とが関連付けされている。構成要素をW(n=1〜N)、Wがカテゴリm(m=1〜M)のカテゴリ文例または非カテゴリ文例に含まれる文章中の出現頻度をそれぞれXnm、Ynmと表記すると、ある構成要素Wについての辞書データ46は、(W,Xn1,Yn1,Xn2,Yn2,・・・,Xnm,Ynm)と表すことができる。
この実施の形態では、各構成要素Wについて、(カテゴリmのカテゴリ文例に含まれる文章中の出現頻度)と(カテゴリmの非カテゴリ文例に含まれる文章中の出現頻度)の二つの値をペアで保持している。これは、カテゴリ文例または非カテゴリ文例に新たな文章データを追加して分類辞書保持部24内の辞書データを拡充しようとした場合に、頻度情報の書き換えを容易にするためである。
別の実施の形態では、構成要素Wの出現頻度を単一の値で保持してもよい。構成要素Wのカテゴリmについての出現頻度をFnmと表記すると、Fnm=Xnm/Ynmとしてもよいし、Fnm=Xnm/(Xnm+Ynm)としてもよい。この場合、ある構成要素Wについての辞書データ46は、(W,Fn1,Fn2,・・・,FnM)と表すことができる。
図6は、要素絞り込み基準提供部30に格納されている選択基準のデータ構造図である。選択基準は、カテゴリ種類に対応して準備される。図6では、カテゴリ種類として、「テーマ分け」「文体」「年代」が含まれる。要素絞り込み基準提供部30は、構成要素を抽出したカテゴリ文例の情報をカテゴリ情報提供部106から受け取り、図中の左欄56に示す特定のカテゴリの場合には、右欄58の選択基準を返す。カテゴリ情報提供部106から受け取ったカテゴリが左欄56に存在しない場合は、標準的な「名詞」という選択基準を返す。
例えば、カテゴリ種類がテーマや話題の分類に関するもの、例えば「旅行」「音楽」「映画」などのカテゴリの場合は、「名詞」という基準を提供する。このようなテーマや話題の分類については、特定の名詞の存在がカテゴリ分類を決定付けることが多いからである。カテゴリの種類が文体に関するもの、例えば「フォーマル」「丁寧」「乱文」などのカテゴリの場合は、「形容詞または助詞」という基準を提供する。文体は、「てにをは」などの助詞や感情表現によって決定できる場合が多いからである。さらに、文章を作成した人の年代や性別に関するもの、例えば「女性」「若年層」などの場合は、「平仮名の名詞」という基準を提供する。このように、要素絞り込み基準提供部30は、辞書データの作成対象となる構成要素が、いずれのカテゴリ文例または非カテゴリ文例に含まれる文章データから抽出されたかに応じて、カテゴリ毎に異なる選択基準を提供することができる。分類辞書作成部22は、選択基準を参照して、辞書として準備される構成要素を絞り込んだ辞書データを作成することができる。
要素絞り込み基準提供部30は、構成要素の品詞を選択基準として提供する代わりに、文字数を選択基準として提供してもよい。これによって、分類辞書作成部22は、一定字数以下の構成要素について辞書を作成することができる。あるいは、要素絞り込み基準提供部30は、選択基準として特定の構成要素(例えば、「自動車」という名詞)を提供してもよい。分類辞書作成部22は、それと一致する構成要素は辞書データの作成対象から除外するようにしてもよい。例えば、極めて多数の文章中で使用されるありふれた名詞(例えば、「私」「物」)などはカテゴリ分類に与える影響が少ないので、除外することが好ましい。
図7は、カテゴリ帰属確率計算部26の詳細な機能ブロック図である。カテゴリ帰属確率計算部26は、構成要素受付部122、絞り込み情報受付部124、構成要素選択部126、辞書データ検索部128、出現確率算出部130および帰属確率算出部132を含む。
構成要素受付部122は、ソート部20から所定の規則にしたがって並べ替えられた構成要素を受け取る。絞り込み情報受付部124は、要素絞り込み基準提供部30から選択基準を受け取り、構成要素選択部126に渡す。構成要素選択部126は、選択基準と構成要素とを比較して、選択基準を満たす構成要素を選択して辞書データ検索部128に渡す。辞書データ検索部128は、分類辞書保持部24に保持されている辞書データの中から、選択基準を満たした構成要素と同一の構成要素についての辞書データがあるか検索し、対応する辞書データがある場合は、出現確率算出部130に渡す。
出現確率算出部130は、各カテゴリmについて、未分類データから抽出された各構成要素Wの出現確率anmを計算する。ここで、出現確率anmは、上述したカテゴリ文例または非カテゴリ文例に含まれる文章中への出現頻度Xnm、Ynmを使用して、次式により算出される。
Figure 2008097351
図8は、数1により算出された、カテゴリ1に対する各構成要素W〜Wの出現確率a11〜aN1を示す。
なお、出現確率の算出は、数1に限られない。例えば、上述したFnmをそのまま使用してもよい。
帰属確率算出部132は、算出された出現確率をすべての構成要素について総計して、未分類文章データについてカテゴリ毎の帰属確率を算出する。好ましくは、帰属確率算出部132は、ベイジアンフィルタ法を使用して、次式によりカテゴリnへの帰属確率Eを算出する。
Figure 2008097351
なお、ベイジアンフィルタ法以外の手法を使用して帰属確率を算出してもよい。例えば、すべての構成要素の出現確率を単に掛け合わせて帰属確率を算出してもよいし、出現確率の平均値を帰属確率としてもよい。
図9は、分類辞書を作成する処理過程を示すフローチャートである。
まず、文章分解部18は、文例格納部12から一対のカテゴリ文例または非カテゴリ文例を取得する(S10)。次に、文章分解部18は、所定の文章分解アルゴリズムに基づいて、カテゴリ文例および非カテゴリ文例中の文章データを構成要素に分解し、ソート部20は分解された構成要素を所定の規則にしたがって並べ替える(S12)。なお、この並べ替えの実行は本実施の形態に必須ではなく、分類辞書保持部からのデータ検索時間が長くなるため演算速度は低下しうるが、カテゴリ分類の精度に影響を及ぼすことはない。
次に、分類辞書作成部22は、抽出されたひとつの構成要素について、要素絞り込み基準提供部30から受け取った選択基準と比較して、辞書データの作成対象の構成要素であるか否かを判定する(S14)。辞書データの作成対象でなければ(S14のN)、S24に進む。辞書データの作成対象であれば(S14のY)、分類辞書作成部22は分類辞書保持部24からその構成要素についての辞書データを検索する(S16)。対応する辞書データが存在した場合は(S18のY)、今回の文例データ中に存在した構成要素の数を、辞書データ中のそのカテゴリの頻度に追加する(S20)。対応する辞書データが存在しない場合は(S18のN)、新たな辞書データを作成する(S22)。そして、文章分解部18で分解されたすべての構成要素について処理したか否かを判定し(S24)、処理が終了していなければ(S24のN)、別の構成要素についてS14からの処理を繰り返す。すべての構成要素についての辞書データの作成が終了すると(S24のY)、このフローを終了する。
図10は、未分類文章データをカテゴリに分類する処理過程を示すフローチャートである。
文章受付部36は、未分類文章データを受け取る(S30)。文章分解部18は、好ましくは図9のS12と同じ文章分解アルゴリズムに基づいて、未分類文章データ中の文章を構成要素に分解し、ソート部20は分解された構成要素を所定の規則にしたがって並べ替える(S32)。次に、カテゴリ帰属確率計算部6は、抽出されたひとつの構成要素について、要素絞り込み基準提供部30から受け取った選択基準と比較して、未分類文章データの帰属確率を計算するために、その構成要素の出現確率を計算するか否かを判定する(S34)。出現確率の計算対象であれば(S34のY)、カテゴリ帰属確率計算部26は、分類辞書保持部24からその構成要素についての辞書データを検索し、対応する辞書データがある場合は(S36のY)、辞書データに基づいて、その構成要素の出現確率を各カテゴリについて算出する(S38)。S34で構成要素が出現確率の計算対象でなかった場合(S34のN)、またはS36で対応する辞書データが存在しなかった場合(S36のN)は、S38をスキップする。
続いて、文章分解部18によって抽出されたすべての構成要素について処理したか否かを判定し(S40)、処理が終了していなければ(S40のN)、別の構成要素についてS34からの処理を繰り返す。
すべての構成要素についての処理が終了すると(S40のY)、カテゴリ帰属確率計算部26は、上述した手順にしたがって、カテゴリ毎に未分類文章データの帰属確率を算出し(S42)、判定部28は、帰属確率に基づいて未分類文章データが属するカテゴリを判定する(S44)。
(実施例)
以下、具体的な実施例に基づいて、本実施の形態に係る文章分類部100の動作を説明する。この実施例では、説明を簡単にするために、カテゴリとして「ギャンブル」「教育」の二つのカテゴリが準備されているものとする。また、辞書データは作成済みのものを用いることとする。
図11は、この実施例で使用される辞書データを示し、上述の全体説明における図5に対応する。この辞書データは、カテゴリ「ギャンブル」について、カテゴリ文例に含まれる30の文章と非カテゴリ文例に含まれる15の文章から抽出された構成要素、および、カテゴリ「教育」について、カテゴリ文例に含まれる20の文章と非カテゴリ文例に含まれる18の文章から抽出された構成要素についてのものである。使用された文章数は、欄154に「文章数」として示されている。
図示するように、この辞書には、「パチンコ」「万馬券」「青少年」「健全」「育成」などの単語が構成要素として含まれている。そして、それぞれの構成要素に対して、カテゴリ毎の出現頻度情報を有している。構成要素「パチンコ」を例としてみると、カテゴリ「ギャンブル」に対して、カテゴリ文例の文章中の出現頻度は10回、非カテゴリ文例の文章中の出現頻度は2回である。また、カテゴリ「教育」に対しては、カテゴリ文例の文章中の出現頻度は1回、非カテゴリ文例の文章中の出現頻度は20回である。他の構成要素についても同様である。
「総計」欄152は、カテゴリ文例の文章数および非カテゴリ文例の文章数を、すべての構成要素について足し合わせた数である。
このような辞書データが分類辞書保持部24に保持されていることを前提に、未分類文章データとして「パチンコ業界を健全に育成しましょう。」という文章が、二つのカテゴリのいずれに分類されるかを説明する。この文章から、文章分解部18により構成要素が抽出される。この実施例では、文章分解部18は形態素解析によって文章を分解し、その結果、「パチンコ/業界/を/健全/に/育成/し/ましょ/う/。」のように、10の構成要素が抽出される。続いて、カテゴリ帰属確率計算部26内の構成要素選択部126は、要素絞り込み基準提供部30から「名詞」という選択基準を受け取り、抽出された構成要素から名詞のみを選択する。したがって、「パチンコ」「業界」「健全」「育成」の4つの構成要素が選択されることになる。
辞書データ検索部128は、対応する辞書データを分類辞書保持部24から検索する。この場合、「パチンコ」「健全」「育成」の3つの辞書データが得られる。出現確率算出部130は、この辞書データにおける3つの構成要素の出現頻度から、上記数1を使用して各カテゴリについての出現確率を算出する。その結果を図12に示す。構成要素「パチンコ」を例としてみると、カテゴリ「ギャンブル」についての出現確率は0.714、カテゴリ「教育」についての出現確率は0.043である。他の構成要素についても同様である。
帰属確率算出部132は、上記数2にしたがって、出現確率を使用して未分類文章データの帰属確率をカテゴリ毎に算出する。
具体的な数値を用いて説明する。図13は、上記全体説明の図8に対応させて、カテゴリ「ギャンブル」「教育」についての出現確率aと(1−a)をまとめた表である。カテゴリ「ギャンブル」に対しては、要素「パチンコ」の出現確率a11が0.714、要素「健全」の出現確率a21が0.200、要素「育成」の出現確率a31が0.273であるから、数2にしたがって計算すると、未分類文章データのカテゴリ「ギャンブル」への帰属確率Eは、以下のようにして算出される。
(数3)
=(0.714×0.200×0.273)/
{(0.714×0.200×0.273)+(1−0.714)×(1−0.200)×(1−0.273)}≒0.190
カテゴリ「教育」に対しては、要素「パチンコ」の出現確率a12が0.043、要素「健全」の出現確率a22が0.783、要素「育成」の出現確率a32が0.844であるから、数2にしたがって計算すると、未分類文章データのカテゴリ「教育」への帰属確率Eは、以下のようにして算出される。
(数4)
=(0.043×0.783×0.844)/
{(0.043×0.783×0.844)+(1−0.043)×(1−0.783)×(1−0.844)}≒0.467
この結果、判定部28は、「パチンコ業界を健全に育成しましょう。」という文章は、帰属確率の大きい方のカテゴリ「教育」に分類されると判定する。以上で、未分類文章データを分類する一連の処理が終了する。
以上説明したように、文章分類部100によれば、未分類文章データを予め定められたカテゴリに沿って自動的に分類することができる。未分類文章データがいずれのカテゴリに属するかは、カテゴリ毎に算出される未分類文章データの帰属確率により判定される。したがって、文章分類部100は、ひとつの文章データをひとつのカテゴリに分類することもできるし、二つ以上のカテゴリに分類することもできる。また、ひとつの視点に基づくカテゴリについて分類するのみならず、複数の視点に基づくカテゴリを混合させておき、それらについてまとめて未分類文章データの帰属確率を算出することができる。
上述した文章分類技術を使用したブログ記事の分類については、以下の文献に詳細に説明されている。
平野耕一、古林紀哉、高橋淳一、「日本語圏ブログの自動分類」、情報処理学会研究会報告(自然言語処理)、2005年11月、2005−NL−170、p.21−26
古林紀哉、平野耕一、高橋淳一、「ブログ記事の自動分類により消費者意識の側面を捉える試み」、NRI技術創発、2006年1月、2006 Vol.7、p.38−52
2.広告配信装置
続いて、本実施形態に係る広告配信装置210について説明する。
図14は、広告配信装置210の機能ブロック図である。この図においても、各機能ブロックは、ハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによって実現できる。
媒体ページ管理部218は、広告の配信先となる媒体ウェブページの登録を管理する。媒体ページ管理部218は、媒体登録受付部220とスクリプト生成部222とを含む。
媒体登録受付部220は、媒体ウェブページの管理者からの登録を受け付ける。媒体登録受付部220は、ページ管理者端末204から、媒体ウェブページとして登録するページのURLや、管理者の氏名、メールアドレスなどを受け取り、これらの情報を媒体情報保持部230に記憶させる。
スクリプト生成部222は、広告配信装置210から送信される広告情報を媒体ウェブページに表示させるためのスクリプトプログラムを作成する。スクリプト生成部222は、作成したスクリプトプログラムを電子メールで送信するか、またはプログラムを記載したウェブページを提示するなどして、ページ管理者端末204に送る。ウェブページの管理者は、受け取ったスクリプトプログラムを、自身のウェブページを記述するHTML文書またはXML文書などのマークアップ言語ファイルにコピーする。そして、管理者はこのファイルをプロバイダサーバ212に対してアップロードする。こうすることで、媒体ウェブページにアクセスした一般ユーザ端末206に、プロバイダサーバ212からスクリプトプログラムが送られるようになる。
媒体ページ解析部232は、媒体ウェブページのキーワード集合とカテゴリを決定する。媒体ページ解析部232は、ページ取得部224、確認部226、文章分類部234、キーワード抽出部228、および媒体情報保持部230を含む。
ページ取得部224は、ネットワーク208を介して媒体ウェブページ214をプロバイダサーバ212から取得する。ページ取得部224は、後述するように、一般ユーザ端末206で媒体ウェブページが閲覧されたときにその媒体ウェブページを取得してもよいし、あるいは、ページ取得部224は、ウェブクローラを稼働させてネットワーク上で提供されている媒体ウェブページの情報を収集しておいてもよい。また、ページ取得部224は、媒体ウェブページを閲覧している一般ユーザ端末206のURLも取得して、広告送信部246に渡す。
確認部226は、ページ取得部224によって取得された媒体ウェブページについて、媒体情報保持部230を参照して、キーワード集合およびカテゴリを既に決定済みか否かを判定する。または、確認部226は、配信結果保持部242を参照して、以前に広告情報を送信したか否かを判定する。キーワード集合およびカテゴリが未決定である場合、確認部226は、媒体ウェブページを文章分類部234およびキーワード抽出部228に与える。広告情報を以前に送信済みである場合、確認部226は、広告送信部246に対し、配信結果保持部242に記憶されている広告情報を、媒体ウェブページを閲覧している一般ユーザ端末206に対して送信するように指示する。
配信結果保持部242に記憶されている広告情報が、前回の配信から相当の時間が経過しており古いものである場合や、毎回異なる広告情報を媒体ウェブページに対して送信したい場合は、確認部226は、マッチング部244に対して、媒体情報保持部230に保持されている当該媒体ウェブページについて決定されたキーワード集合およびカテゴリの情報を使用して、新たな広告情報を選択して送信するように指示してもよい。
文章分類部234は、上述した文章分類部100と同様の機能を有する。文章分類部234は、媒体ウェブページのファイルを未分類文章として受け取り、前もって設定されている複数のカテゴリに対する帰属確率を算出する。文章分類部234は、帰属確率と所定のしきい値との比較にしたがって、媒体ウェブページが帰属するカテゴリをいくつかに決定してもよいし、または、帰属確率を算出したままで、その後の広告情報のカテゴリとの比較については後述するマッチング部244に任せるようにしてもよい。これは、広告管理部240において、広告主から広告の配信先となるカテゴリの指定を受け付ける態様によって決まる。より具体的な説明は、図17ないし図19を参照して後述する。
キーワード抽出部228は、媒体ウェブページのキーワード集合を決定する。具体的には、キーワード抽出部228は、媒体ウェブページのテキスト情報を形態素解析によって形態素に分解し、各形態素の出現頻度や形態素間の関連性などに基づいて、キーワード集合を決定する。なお、キーワード抽出部228は、キーワード集合として複数のキーワードを抽出することが望ましいが、ひとつのキーワードのみを選択してもよい。このようなキーワードの抽出手法は公知であるので、これ以上詳細な説明は省略する。
媒体情報保持部230は、媒体ウェブページ毎に、文章分類部234で計算されたカテゴリ毎の帰属確率または決定されたカテゴリと、キーワード抽出部228で抽出されたキーワード集合とを保持する。
広告管理部240は、媒体ウェブページに表示させる広告情報の登録および配信を管理する。広告管理部240は、配信結果保持部242、マッチング部244、広告送信部246、広告受付部250、および広告情報保持部252を含む。
広告受付部250は、広告主からの広告情報の登録を受け付ける。広告受付部250は、広告主端末202から広告として表示すべきテキスト、広告情報の配信先となる媒体ウェブページのカテゴリ条件を指定するカテゴリ指定情報、広告情報の配信先となる媒体ウェブページの配信先キーワードを指定するキーワード指定情報、リンク先の広告主サイトのURLなどの広告情報を受け取る。これらの情報は、広告情報保持部252に保持される。
広告情報保持部252は、カテゴリ指定情報およびキーワード指定情報と関連付けて広告情報を保持する。カテゴリ条件の指定の仕方は複数ある。ひとつは、前もって設定されている複数のカテゴリ毎に、そのカテゴリに分類される媒体ウェブページに広告を表示するか否かを指定する方法である。二つ目は、広告の配信先となる媒体ウェブページの帰属確率の下限値をカテゴリ毎に指定する方法である。二番目の方法を採用する場合は、広告の送信を回避すべき非表示カテゴリをさらに指定するようにしてもよい。
マッチング部244は、今回の配信対象である媒体ウェブページのキーワード集合とカテゴリとを媒体情報保持部230から取得する。続いて、マッチング部244は、媒体ウェブページのキーワード集合に含まれる配信先キーワードが指定された広告情報を広告情報保持部252から選択する。その後、マッチング部244は、選択された広告情報の中から、今回の配信対象である媒体ウェブページのカテゴリが、広告情報に関連するカテゴリ条件を満足している広告情報を、広告情報保持部252から選択する。
このとき、カテゴリ条件が単に媒体ウェブページに広告を表示するか否かを指定するものである場合、マッチング部244は、媒体ウェブページのカテゴリについて表示の対象としている広告情報を選択すればよい。帰属確率の下限値をカテゴリ毎に指定している場合は、以下のようにする。まず、マッチング部244は、媒体情報保持部230から、広告の配信対象である媒体ウェブページのカテゴリ毎の帰属確率を取得する。続いて、マッチング部244は、各カテゴリについて、媒体ウェブページの帰属確率と広告情報に関連する帰属確率の下限値とを比較する。そして、媒体ウェブページの帰属確率が下限値以上であるカテゴリが存在したとき、マッチング部244は、対応する広告情報を広告情報保持部252から選択する。
マッチング部244は、選択した広告情報を広告送信部246に送る。
広告送信部246は、マッチング部244で選択された広告情報を媒体ウェブページとともに表示させるように、一般ユーザ端末206に送信する。この送信は、ページ取得部224で取得された一般ユーザ端末206のURLに対してなされる。広告送信部246における送信の結果は、配信結果保持部242に記憶される。
配信結果保持部242は、媒体ウェブページと、当該媒体ウェブページで表示するために送信した広告情報との組合せを保持する。配信結果保持部242は、その他にも、広告情報を送信した一般ユーザ端末206のURL、広告を表示した日付、広告の表示回数などの情報を記憶してもよい。
図15は、広告配信装置210によって、ウェブページに関連する広告を配信する処理の概略を示すフローチャートである。
まず、広告主端末202から広告管理部240に対して広告情報の登録がなされる(S60)。また、ページ管理者端末204から媒体ページ管理部218に対して、媒体ウェブページの登録がなされる(S62)。その後、登録された媒体ウェブページが一般ユーザ端末206で閲覧されると、媒体ウェブページのキーワード集合およびカテゴリが媒体ページ解析部232によって決定される。さらに広告管理部240によって、登録されている広告情報の中からキーワードおよびカテゴリの両方が合致する広告情報が選択され、一般ユーザ端末206に対して送信される(S64)。送信された広告情報は、一般ユーザ端末206において媒体ウェブページとともに表示される。
図16は、広告受付部250によって広告主端末202のディスプレイに表示される広告受付画面260の一例を示す。
広告主が広告主端末202を使用して広告情報を登録するための専用のサイトにアクセスすると、広告受付部250は広告主端末202に対して広告受付画面260を表示するマークアップ言語ファイルを送信する。広告主は、広告受付画面260において、社名欄262およびメールアドレス欄264には、広告主となる企業の社名と担当者のメールアドレスを入力する。広告テキスト欄266、268には、媒体ウェブページに配信する広告文のテキストを入力する。広告主は、広告テキスト欄266には一行程度で表示できる見出し文を入力し、広告テキスト欄268には、より詳細な内容を入力する。
キーワード欄270には、広告主が広告情報の配信を希望する媒体ウェブページを指定するための配信先キーワードを入力する。入力する配信先キーワードは、一語でも複数語でもよい。表示カテゴリボタン272は、広告主が広告情報の配信を希望するカテゴリを詳細に設定するためにクリックするボタンである。ジャンプ先URL欄274には、媒体ウェブページに表示された広告テキストをユーザがクリックしたときに、リンク先となる広告主サイトのURLを入力する。
上記欄への記入をした後、広告主が登録ボタン276をクリックすると、入力された内容が広告受付部250に送信される。広告受付部250は、受け取った情報を広告情報保持部252に渡す。
図17ないし図19は、広告受付画面260で表示カテゴリボタン272をクリックしたときに表示される、カテゴリを設定するための画面例を示す。
図17は、カテゴリ毎に、広告を表示すべきカテゴリまたは非表示にすべきカテゴリを設定する設定画面280を示す。設定画面280では、カテゴリ282毎に、広告情報の配信先のカテゴリとして指定するときにチェックするチェックボックス284と、広告情報の配信先のカテゴリとして指定したくないときにチェックするチェックボックス286と、が表示される。マッチング部244は、媒体ウェブページのカテゴリに対して、そのカテゴリと同一のカテゴリのチェックボックス284にチェックが入れられた広告情報を選択する。
図18は、カテゴリ292毎に、広告情報の配信先の媒体ウェブページについて算出される帰属確率の下限値を設定する下限値欄294と、広告情報を配信しない媒体ウェブページのカテゴリ(以下、「非表示カテゴリ」という)を設定する非表示カテゴリ欄296とを有するカテゴリ設定画面290を示す。
下限値欄294には、文章分類部234においてカテゴリ毎に算出される帰属確率をパーセント表示したときの下限値を20%刻みで設定することができる。下限値を設定するチェックボックスにチェックを入れると、帰属確率がチェックボックスの右肩に表示されている数字以上になったカテゴリについて広告情報を配信することを意味する。例えば、カテゴリ「エンターテインメント」297を見ると、下限値欄294において、「20〜40」のチェックボックスにチェックが入れられている。これは、カテゴリ「エンターテインメント」について、帰属確率が20%以上である媒体ウェブページに広告情報を配信すべきことを意味する。言い換えると、エンターテインメントの要素がわずかでもあるような媒体ウェブページのすべてに広告情報が配信される。また、カテゴリ「コンピュータ」298を見ると、下限値欄294において、「80〜100」のチェックボックスにチェックが入れられている。これは、カテゴリ「コンピュータ」について、帰属確率が80%以上である媒体ウェブページに広告を配信すべきことを意味する。言い換えると、コンピュータの要素が非常に高い媒体ウェブページにのみ広告情報が配信される。さらに、カテゴリ「金融」299を見ると、非表示カテゴリ欄296にチェックが入れられている。これは、カテゴリ「金融」に対する帰属確率がわずかでもある場合は、その媒体ウェブページに広告情報を配信しないことを意味する。
図示するように、このカテゴリ設定画面290では、カテゴリ毎に、広告配信先とする媒体ウェブページのカテゴリの帰属確率の下限を定めることができる。したがって、広告主は、カテゴリを明確には分類できないような媒体ウェブページを広告情報の配信先として指定することが可能になる。例えば、複数のカテゴリにまたがって分類されるような媒体ウェブページをマッチング部244により絞り込むことが可能になるため、広告主は広告の対象者を絞って配信することができ、広告効果の向上につながりうる。
図19は、カテゴリ302毎に、広告情報の配信先の媒体ウェブページについて算出される帰属確率の下限値を設定する下限値欄304を有するカテゴリ設定画面300を示す。下限値欄304には、文章分類部234においてカテゴリ毎に算出される帰属確率をパーセント表示したときの下限値を数値で設定することができる。帰属確率が下限値欄304に表示されている数字以上になったカテゴリについて広告情報が配信される。例えば、カテゴリ「エンターテインメント」306を見ると、下限値欄304に「20」の数値が入力されている。これは、カテゴリ「エンターテインメント」について、帰属確率が20%以上となった媒体ウェブページに広告情報を配信すべきことを意味する。なお、このカテゴリ設定画面300にも、非表示カテゴリを設定する非表示カテゴリ欄を設けてもよい。
図20は、図16の広告受付画面260、および図17ないし図19のいずれかのカテゴリ設定画面を介して広告受付部250に入力され、広告情報保持部252に保持される広告情報のテーブル310を示す。
番号欄312は、広告受付部250で受け取られた広告情報毎に固有に与えられる番号を示す。広告テキスト欄314、316、キーワード欄318、およびURL欄324は、広告受付画面260で入力された広告テキスト1、広告テキスト2、配信先キーワード、ジャンプ先URLを示す。カテゴリ条件欄319への入力項目は、カテゴリ設定をいずれの方式で実施したかによって異なる。図17に示したように、広告を表示すべきカテゴリと非表示とすべきカテゴリを設定した場合には、カテゴリ名320毎に「表示」「非表示」のいずれかが記録される。これに対し、図18および図19に示したように、広告を表示すべきカテゴリの下限値を指定した場合には、カテゴリ名320毎に下限値が記録される。
図20の例では、番号「1」で指定される広告は、衣類のマフラーを販売する企業の広告であり、広告を表示するカテゴリとして「ファッション」が指定されている。番号「2」で指定される広告は、自動車のマフラーを販売する企業の広告であり、カテゴリ「ファッション」の帰属確率の下限値が80%、カテゴリ「モータースポーツ」の帰属確率の下限値が20%と指定されている。この例では、配信先キーワードとしてともに同音の「マフラー」が指定されていることに注意する。
図21は、媒体登録受付部220によってページ管理者端末204に表示される媒体登録受付画面330の一例を示す。
ページ管理者が、ページ管理者端末204を使用して媒体ウェブページを登録するための専用のサイトにアクセスすると、媒体登録受付部220はページ管理者端末204に対して媒体登録受付画面330を表示するマークアップ言語ファイルを送信する。ページ管理者は、媒体登録受付画面330において、名前欄332、住所欄334およびメールアドレス欄338には、広告の配信先としての媒体ウェブページを提供する管理者の氏名、住所およびメールアドレスを入力する。また、ページ管理者は、URL欄336に媒体ウェブページのURLを入力する。
上記欄への記入をした後、ページ管理者が登録ボタン340をクリックすると、入力された内容がページ管理者端末204から媒体登録受付部220に送信される。媒体登録受付部220は、受け取った情報を媒体情報保持部230に渡す。
図22は、媒体ウェブページとして登録されたページのテキスト情報の例を示す。ページ取得部224は、一般ユーザ端末206から閲覧している媒体ウェブページのURLを受け取ると、そのURLにアクセスして媒体ウェブページのファイルを取得し、そこからテキスト情報を抽出して文章分類部234およびキーワード抽出部228に渡す。図22(a)は、URL342で指定される媒体ウェブページに記載されているテキスト344を表し、図22(b)は、URL346で指定される媒体ウェブページに記載されているテキスト348を表す。図示するように、テキスト344はファッションに関する日記風の記事でありマフラーが話題になっている。また、テキスト348は、バイクに関する日記風の記事であり、交換した部品としてマフラーの記載がある。
図23は、媒体情報保持部230に保持される媒体情報のテーブル350を示す。コード欄352は、ページ管理者毎に媒体登録受付部220により付与されるコードを示す。URL欄354は、媒体ウェブページのURLを示す。キーワード欄356は、キーワード抽出部228によって、媒体ウェブページ中のテキストから抽出されたキーワード集合を示す。分類結果欄358には、前もって定められている複数のカテゴリについて文章分類部234によって算出された帰属確率が表示される。
図23の例では、コード「0001」で指定される媒体ウェブページは、図22(a)に示したページに対応する。したがって、URL欄354には図22(a)に示すURL342が示されている。キーワード欄356には、テキスト344からキーワード抽出部228によって抽出されたキーワード集合が示されている。また、分類結果欄358は、テキスト344を文章分類部234に入力して得られた分類結果として、カテゴリ「ファッション」について帰属確率0.76が算出され、カテゴリ「ショッピング」について帰属確率0.68が算出されたことを示している。
また、コード「0002」で指定される媒体ウェブページは、図22(b)に示したページに対応する。したがって、URL欄354には図22(b)に示すURL346が示されている。キーワード欄356には、テキスト348からキーワード抽出部228によって抽出されたキーワード集合が示されている。また、分類結果欄358は、テキスト348を文章分類部234に入力して得られた分類結果として、カテゴリ「モータースポーツ」について帰属確率0.88が算出されたことを示す。
図24は、ページ管理者による媒体ウェブページの登録過程を説明するフローチャートである。
媒体登録受付部220は、ページ管理者端末204から入力される媒体ウェブページの登録情報を受け取る(S70)。媒体登録受付部220は、ページ管理者に対して固有のコードを付与し、媒体ウェブページについて登録された情報を媒体情報保持部230に記録する(S72)。続いて、スクリプト生成部222は、一般ユーザ端末206により媒体ウェブページが閲覧されたときに、媒体ウェブページのURLを広告配信装置210に送信し、また広告配信装置210から送信された情報を媒体ウェブページとともに表示する機能を有する広告配信スクリプトプログラムを作成し、この広告配信スクリプトプログラムをページ管理者端末204に送信する(S74)。ページ管理者は、受け取ったスクリプトプログラムを自身の媒体ウェブページに挿入し、このファイルをプロバイダサーバ212にアップロードする(S76)。これによって、一般ユーザ端末206で媒体ウェブページが読み込まれたときに、広告配信スクリプトプログラムも一緒に読み込まれるようになる。
なお、媒体ウェブページの管理者が同一人物である限り、複数の媒体ウェブページに同一の広告配信スクリプトプログラムを使用することができる。媒体ウェブページ毎のキーワード集合やカテゴリは、広告配信装置210側でURL毎に個別に抽出または分類され保持されるため、同一の広告配信スクリプトプログラムを使用していても、ページ毎に異なる広告情報が表示されることになる。
図25は、ウェブページに広告が配信されるプロセスを詳細に説明するフローチャートである。
一般ユーザが一般ユーザ端末206を使用して媒体ウェブページにアクセスすると(S80)、プロバイダサーバ212から一般ユーザ端末206にウェブページ214が送信され、一般ユーザ端末206のディスプレイに媒体ウェブページが表示される(S82)。媒体ウェブページに挿入されたスクリプトプログラムが一般ユーザ端末206で動作し、閲覧しているページのURLとページ管理者コードとを広告配信装置210に送信する(S84)。
ページ取得部224は、送信されたページURLとページ管理者コードとを受け取り、確認部226は、ページURLで指定される媒体ウェブページのカテゴリが既に分類済みであるか否かを判定する(S86)。媒体ウェブページのカテゴリが未分類である場合(S86のN)、広告送信部246は、カテゴリに無関係に表示するために用意されている広告情報を一般ユーザ端末206に対して送信する(S88)。一般ユーザ端末206の広告配信スクリプトプログラムは、送信された広告情報をディスプレイに表示させる。
ページ取得部224は、ページURLを使用して対応する媒体ウェブページをプロバイダサーバ212から取得する。取得された媒体ウェブページのテキスト情報にしたがって、文章分類部234がその媒体ウェブページのキーワード集合を抽出し、また文章分類部234がカテゴリ毎の帰属確率を算出する(S90)。マッチング部244は、媒体ウェブページから抽出されたキーワード集合が、広告情報保持部252に保持されている広告毎の配信先キーワードを含み、かつ媒体ウェブページのカテゴリ毎の帰属確率が、広告情報保持部252に保持されている広告毎のカテゴリ条件を満足する広告情報を決定する(S92)。この結果は、配信結果保持部242に保持される。
S86で、媒体ウェブページのカテゴリが分類済みである場合(S86のY)、確認部226からの指示に応じて、広告送信部246は、配信結果保持部242に記録されている、媒体ウェブページとマッチングされた広告情報を一般ユーザ端末206に対して送信する(S94)。一般ユーザ端末206bの広告配信スクリプトプログラムは、送信された広告情報を受け取って媒体ウェブページと共に表示する。
このように、本実施形態においては、媒体ウェブページとして登録されたウェブページの内容を実際に取得するのは、媒体ウェブページが初めて一般ユーザ端末によって閲覧されたときである。したがって、この時点では広告配信装置側に媒体ウェブページに関する情報が蓄積されていないため、顧客のターゲッティングをしていない広告をとりあえず配信しておき、その後媒体ウェブページを取得してキーワード集合とカテゴリを決定する。このようにするのは、一般ユーザ端末によって媒体ウェブページが閲覧されたときに、その媒体ウェブページのキーワード抽出およびカテゴリ分類を実行した後に広告を送信すると、計算処理および送信に時間がかかり、速やかな広告の表示ができないからである。
また、媒体ウェブページが閲覧されてからウェブページを取得するのは、登録されたすべての媒体ウェブページを閲覧前にクロールしてウェブページを取得し、キーワード集合とカテゴリを決定すると、広告配信装置の計算処理負荷が大きくなるからである。また、一般ユーザによる閲覧時に媒体ウェブページを取得することで、媒体ウェブページの更新前のキーワード集合とカテゴリ分類にしたがってマッチングされた広告を配信するようなことがなくなる。
また、カテゴリ分類後に媒体ウェブページの内容が更新された場合に対処するために、広告配信装置は、所定の周期で古いキーワード集合およびカテゴリの情報を破棄し、新たに媒体ウェブページを取得してキーワード抽出とカテゴリ分類をやり直す構成とすることが好ましい。
なお、一般ユーザ端末による閲覧の前に媒体ウェブページを取得してキーワード抽出とカテゴリ分類を行っておいたり、媒体ウェブページが閲覧されるたびにキーワード抽出とカテゴリ分類を実行したり、あるいは一度決定したキーワード集合とカテゴリを使い続けたりといった実施例を排除する趣旨ではない。配信する広告の内容や媒体ウェブページの内容などに応じて、適宜好適な手法を採用できる。
図26は、マッチング部244において、媒体ウェブページと広告情報とのマッチングをする過程のフローチャートである。
マッチング部244は、媒体情報保持部230からキーワード集合とカテゴリ毎の帰属確率とを受け取る(S100)。マッチング部244は、広告情報保持部252に保持されている広告情報の中から、今回の媒体ウェブページから抽出されたキーワード集合が、広告情報に関連して保持されている配信先キーワードを含んでいる広告情報を選択する(S102)。続いて、マッチング部244は、S102で選択された広告情報の中から、今回の媒体ウェブページについてカテゴリ毎に算出された帰属確率が、広告情報に関連して保持されているカテゴリ条件を満足している広告情報を選択する(S104)。マッチング部244は、選択された広告情報を広告送信部246に渡すか、または配信結果保持部242に記憶させる(S106)。
図27は、ウェブページのカテゴリを前もって決定しておく場合のフローチャートである。
ページ取得部224は、媒体情報保持部230を参照して、登録された媒体ウェブページのURLにしたがって、媒体ウェブページを取得する(S110)。キーワード抽出部228が媒体ウェブページのテキスト情報からキーワード集合を抽出し、文章分類部234がカテゴリ毎の帰属確率を計算する(S112)。マッチング部244は、媒体ウェブページに含まれるキーワード集合が広告主の指定した配信先キーワードを含み、かつ媒体ウェブページのカテゴリ毎の帰属確率が広告主の指定したカテゴリ条件を満足する広告情報を選択し、その結果を配信結果保持部242に記憶させる(S114)。このように、予め媒体ウェブページのカテゴリを決定しておけば、一般ユーザ端末による初回の媒体ウェブページの表示の際にも、適切な広告を配信することができる。
図28は、以上の手順にしたがって、図22(a)に示したテキスト344を含む媒体ウェブページに広告テキスト384が表示された一般ユーザ端末の画面380を示す。
一般ユーザ端末206で媒体ウェブページが閲覧されると、図23のテーブル350に示すキーワード集合356とカテゴリ分類結果358がマッチング部244に渡される。マッチング部244は、まず媒体ウェブページのキーワード集合に含まれる配信先キーワード「マフラー」を持つ広告情報として、図20のテーブル310に示す二つを選択する。続いて、マッチング部244は、この媒体ウェブページのカテゴリ「ファッション」の帰属確率0.76を取得し、選択された二つの広告情報に関連するカテゴリ条件を比較する。この場合、番号「1」の広告では、カテゴリ条件欄319において、カテゴリ「ファッション」について「表示」となっているので、マッチング部244は番号「1」の広告情報を選択する。番号「2」の広告では、カテゴリ条件欄319において、カテゴリ「ファッション」の帰属確率が0.80となっている。これに対し、媒体ウェブページの「ファッション」に対する帰属確率は0.76であるから、マッチング部244は番号「2」の広告情報を選択しない。したがって、マッチング部244は、番号「1」の広告情報のみを出力する。
広告送信部246がこの広告情報を一般ユーザ端末206に送信すると、一般ユーザ端末206のスクリプトプログラムがこれを受け取り、媒体ウェブページの所定の位置382に広告を表示する。図示するように、広告テキスト1「カシミアマフラー20%オフ」と広告テキスト2「人気ブランドで素敵な貴女をフロデュース!」とが、クリック可能な形態で表示される。一般ユーザがこの広告テキスト384をクリックすると、図20のURL欄324に示すURLへとジャンプする。
以上説明したように、本実施の形態の広告配信装置によれば、ウェブページを前もって設定されたカテゴリに分類し、そのカテゴリに応じた広告を配信することができる。広告主としては、広告の配信先となるウェブページのカテゴリを指定することで、商品やサービスのターゲットとして想定する顧客が閲覧するウェブページに対して広告を表示させることが可能になる。したがって、広告効果が高まることが期待される。
また、広告情報のカテゴリ条件として、カテゴリ単位で表示と非表示とを選択できるため、広告主は、広告の配信先のウェブページの内容を事前に細かく指定することができる。また、複数のカテゴリにまたがるような内容のウェブページに対しても、最も効果的な広告を配信することができる。
初めにカテゴリの設定と文例の収集をしておけば、以降のウェブページのカテゴリ分類や、広告情報とのマッチング等に人手を介することがない。従来のカテゴリ分類では、カテゴリの分類を人手で行うことで、分類の結果に個人差がでてしまい、必ずしも適切な分類ができなかったが、本実施形態ではそのようなことがない。
従来のネットワーク上での広告配信では、広告主が広告を表示させたいウェブページのキーワードを指定しておき、キーワードが一致するウェブページに広告を表示させるマッチング手法が使用されていることが多い。この手法は、キーワードに関連する商品の広告が表示されるため、広告のクリックや購買につながる確率が高いという効果もあるが、以下のようなマイナス面もあった。例えば、ウェブページのキーワードのみを参考にしているため、ある商品について否定的なコメントを述べているようなウェブページに広告が配信されたり、または、キーワードとしての言葉は同一であっても、広告の対象となる物品やサービスが全く別のものについて述べているウェブページに広告が配信されるようなことがあった。前者の場合、広告主である企業や広告対象である商品またはサービスのイメージを低下させてしまうし、後者の場合は、広告を表示させても効果が上がらず、広告の配信が無駄になってしまう。
これに対し、本実施形態の広告配信装置では、ウェブページからキーワードを抽出することに加えてウェブページのカテゴリをも判定し、キーワードとカテゴリの両方の条件が合致する広告情報のみがウェブページに対して配信されるので、広告主の希望に近いウェブページを選んで広告情報を配信することが可能である。したがって、広告のクリックや購買につながる確率がさらに上昇し、広告効果の増大につながりうる。
以上、本発明をいくつかの実施の形態をもとに説明した。これらの実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
請求項に記載の各構成要件が果たすべき機能は、本実施例において示された各機能ブロックの単体もしくはそれらの連係によって実現されることも当業者には理解されるところである。
実施の形態では、広告主が広告情報について配信先キーワードとカテゴリ条件の両方を設定することを述べたが、カテゴリ条件のみ設定してもよい。
文章分類部におけるカテゴリと文例の集め方次第で、実施の形態に示した以外にも様々なカテゴリに媒体ウェブページを分類することができる。
例えば、肯定的な意見を述べている文例と否定的な意見を述べている文例を文例格納部に準備しておくことで、「肯定的文章」というカテゴリを設定することができる。配信先キーワードや他のカテゴリと「肯定的文章」のカテゴリを組み合わせることで、広告主は、自身の商品やサービスに好意的な記事が記載されていると考えられる媒体ウェブページに広告情報を表示させることができる。
また、年齢や性別毎にカテゴリ文例と非カテゴリ文例を収集しておくことで、「30代女性が作者」といったカテゴリを設定することができる。さらに、方言毎にカテゴリ文例と非カテゴリ文例を収集すれば、「大阪弁のウェブページ」のようなカテゴリの設定も可能である。
上述のカテゴリは、すべてウェブページの作者についての分類であるが、例えば、「20代男性が読む文例」と「20代男性が読まない文例」を文例格納部に用意し、カテゴリの分類をすれば、「20代男性が読みそうなウェブページ」といったように、ウェブページを読者別のカテゴリで分類することができる。この場合、書き手でなく読み手に合わせて広告の配信先を設定できるため、ウェブページで表示される広告の効果がさらに向上することが期待される。
実施の形態では、広告主が自分の広告を表示または非表示とすべきサイトのカテゴリを選択することを述べたが、サイトの提供者側が、自分のサイトに表示または非表示とすべき広告のカテゴリを選択するようにしてもよい。
この場合、図示しない逆指名部が、広告テキストについてのカテゴリを分類する。このとき、逆指名部は、広告主が申告したカテゴリとは無関係にカテゴリ分類を実行してよい。マッチング部は、ページ管理者側で許可しているカテゴリと、広告主側で許可しているカテゴリとが一致する組合せを見つけて、広告情報を配信する。こうすることで、ページ管理者の媒体ウェブページに、管理者が好まない種類の広告が知らないうちに表示されるようなことが回避される。
実施の形態では、媒体ページ管理部218、媒体ページ解析部232、広告管理部240が組み合わされた広告配信装置について説明したが、これらのブロックは、それぞれ別のサーバ上で動作してもよい。また、これらのブロックのうちの一部や、または広告配信装置の全体がプロバイダ業者のサーバ上で動作してもよい。この場合、プロバイダ業者は、自身が管理するウェブページには、すべて広告配信装置によって自動的に広告が配信される旨をユーザに通知しておいてもよい。
本実施の形態に係る広告配信装置の使用形態の一例を示す図である。 図1の文章分類部の機能ブロック図である。 文章データを形態素解析によって構成要素に分解した例を示す図である。 分類辞書作成部の詳細な機能ブロック図である。 分類辞書保持部に格納されている辞書データのデータ構造図である。 要素絞り込み基準提供部に格納されている選択基準データの構造図である。 カテゴリ帰属確率計算部の詳細な機能ブロック図である。 ひとつのカテゴリについての構成要素の出現確率を示す図である。 分類辞書を作成する処理過程を示すフローチャートである。 未分類文章データをカテゴリに分類する処理過程を示すフローチャートである。 一実施例で使用する辞書データを示す図である。 図11の辞書データを使用して、構成要素毎に出現確率を計算した結果を示す図である。 図12の出現確率を使用して各カテゴリについての帰属確率を計算した結果を示す図である。 本実施の形態に係る広告配信装置の機能ブロック図である。 広告配信装置によってウェブページに関連する広告を配信する処理の概略を示すフローチャートである。 広告受付部によって広告主端末のディスプレイに表示される広告受付画面の一例を示す図である。 カテゴリ毎に広告を表示すべきカテゴリまたは非表示にすべきカテゴリを設定する設定画面を示す図である。 カテゴリ毎に、広告の配信先の媒体ウェブページについて算出される帰属確率の下限値を設定する下限値欄と、広告を配信しない媒体ウェブページのカテゴリを設定する非表示カテゴリ欄を有するカテゴリ設定画面を示す図である。 広告受付画面で表示カテゴリボタンをクリックしたときに表示される、カテゴリを設定するための画面例を示す図である。 図16の広告受付画面、および図17ないし図19のいずれかのカテゴリ設定画面を介して広告受付部に入力され、広告情報保持部に保持される広告情報のテーブルを示す図である。 媒体登録受付部によってページ管理者端末に表示される媒体登録受付画面の一例を示す図である。 媒体ウェブページとして登録されたページのテキスト情報の例を示す図である。 媒体情報保持部に保持される媒体情報のテーブルを示す図である。 ページ管理者による媒体ウェブページの登録過程を説明するフローチャートである。 ウェブページに広告が配信されるプロセスを詳細に説明するフローチャートである。 マッチング部において、媒体ウェブページと広告情報とのマッチングをする過程のフローチャートである。 ウェブページのカテゴリを前もって決定しておく場合のフローチャートである。 図22(a)に示した記事を含む媒体ウェブページに広告が表示された、一般ユーザ端末の画面を示す図である。
符号の説明
100 文章分類部、 202 広告主端末、 204 ページ管理者端末、 206 一般ユーザ端末、 208 ネットワーク、 210 広告配信装置、 212 プロバイダサーバ、 214 ウェブページ、 218 媒体ページ管理部、 220 媒体登録受付部、 222 スクリプト生成部、 224 ページ取得部、 226 確認部、 228 キーワード抽出部、 230 媒体情報保持部、 232 媒体ページ解析部、 240 広告管理部、 242 配信結果保持部、 244 マッチング部、 246 広告送信部、 250 広告受付部、 252 広告情報保持部。

Claims (10)

  1. ネットワーク上で提供される媒体ウェブページのテキスト情報に基づいて、前もって設定されている複数のカテゴリの中から媒体ウェブページが分類されるべきカテゴリを決定し、
    配信先となるウェブページのカテゴリを指定した広告情報の中から前記媒体ウェブページのカテゴリと一致する広告情報を選択し、
    前記媒体ウェブページとともに前記広告情報を表示させるために前記媒体ウェブページを閲覧する端末に対して前記広告情報を送信することを特徴とする広告配信装置。
  2. ネットワーク上で提供される媒体ウェブページに広告を表示させる装置であって、
    広告の配信先となる媒体ウェブページのカテゴリ条件を指定するカテゴリ指定情報と関連付けて広告情報を保持する広告情報保持部と、
    ネットワークを介して媒体ウェブページを取得し、該媒体ウェブページのテキスト情報に基づいて、前もって設定されている複数のカテゴリの中から該媒体ウェブページが分類されるべきカテゴリを決定するページ解析部と、
    前記ページ解析部により決定された媒体ウェブページのカテゴリが前記カテゴリ条件を満たしている広告情報を前記広告情報保持部から選択するマッチング部と、
    ネットワークに接続された端末で前記媒体ウェブページが閲覧されるとき、その端末に対して前記マッチング部で選択された広告情報を前記媒体ウェブページとともに表示させる形態で送信する広告送信部と、
    を備えることを特徴とする広告配信装置。
  3. 前記広告情報保持部は、前もって設定されている複数のカテゴリ毎に、そのカテゴリに分類される媒体ウェブページに広告を表示するか否かを指定するカテゴリ指定情報と関連付けて前記広告情報を保持することを特徴とする請求項2に記載の広告配信装置。
  4. 前記ページ解析部は、前もって設定されている複数のカテゴリに前記媒体ウェブページが帰属する確率を表す帰属確率をカテゴリ毎に計算する文章分類部をさらに備え、
    前記広告情報保持部は、広告の配信先となる媒体ウェブページの帰属確率の下限値をカテゴリ毎に指定するカテゴリ指定情報と関連付けて前記広告情報を保持し、
    前記マッチング部は、前記媒体ウェブページの帰属確率と前記広告情報に関連する帰属確率の下限値とを比較して、前記媒体ウェブページの帰属確率が前記下限値以上であるとき、対応する広告情報を前記広告情報保持部から選択することを特徴とする請求項2に記載の広告配信装置。
  5. 前記広告情報保持部は、広告の送信を回避すべき非表示カテゴリを指定するカテゴリ指定情報と関連付けて前記広告情報を保持し、
    前記広告送信部は、前記非表示カテゴリに分類される媒体ウェブページへの広告情報の送信を拒否することを特徴とする請求項4に記載の広告配信装置。
  6. 前記広告送信部から送信された広告情報を媒体ウェブページに表示させるためのスクリプトプログラムを媒体ウェブページに記述させるために、該スクリプトプログラムを媒体ウェブページの管理者の端末に送信するページ管理部をさらに備え、
    前記スクリプトプログラムは、ネットワークに接続された端末で前記媒体ウェブページが閲覧されたとき、該媒体ウェブページの情報を前記ページ解析部に送信する機能を有し、
    前記ページ解析部は、前記スクリプトプログラムから送信された情報にしたがって前記媒体ウェブページを取得することを特徴とする請求項2に記載の広告配信装置。
  7. 前記ページ管理部は、前記管理者を特定するためのコードを生成し前記スクリプトプログラムに埋め込んで送信し、
    前記スクリプトプログラムは、ネットワークに接続された端末で前記媒体ウェブページが閲覧されたとき、該媒体ウェブページの情報とともに前記コードを前記ページ解析部に送信する機能を有することを特徴とする請求項6に記載の広告配信装置。
  8. 前記広告情報保持部は、広告の配信先となる媒体ウェブページのキーワードを指定する配信先キーワードに関連付けて前記広告情報を保持し、
    前記ページ解析部は、媒体ウェブページからキーワード集合を抽出するキーワード抽出部をさらに備え、
    前記マッチング部は、媒体ウェブページのキーワード集合に含まれる配信先キーワードが指定された広告情報を前記広告情報保持部から選択し、その後、選択された広告情報の中から前記ウェブページのカテゴリが前記カテゴリ条件を満足している広告情報を選択することを特徴とする請求項2ないし7のいずれかに記載の広告配信装置。
  9. ネットワーク上で提供される媒体ウェブページに広告を表示させる装置であって、
    広告の配信先となる媒体ウェブページのカテゴリ条件を指定するカテゴリ指定情報と関連付けて広告情報を保持する広告情報保持部と、
    広告情報の配信先となる媒体ウェブページが分類されるカテゴリを受け取り、該カテゴリが前記カテゴリ条件を満たしている広告情報を前記広告情報保持部から選択するマッチング部と、
    ネットワークに接続された端末で前記媒体ウェブページが閲覧されるとき、その端末に対して前記マッチング部で選択された広告情報を前記媒体ウェブページとともに表示させる形態で送信する広告送信部と、
    を備えることを特徴とする広告配信装置。
  10. ネットワーク上で提供される媒体ウェブページに広告を表示させるプログラムであって、
    広告の配信先となる媒体ウェブページのカテゴリ条件を指定するカテゴリ指定情報と関連付けて広告情報を所定の記憶領域に記憶させる広告情報保持機能と、
    ネットワークを介して媒体ウェブページを取得する取得機能と、
    取得した媒体ウェブページのテキスト情報に基づいて、前もって設定されている複数のカテゴリの中から該媒体ウェブページが分類されるべきカテゴリを決定するページ解析機能と、
    前記ページ解析機能により決定された媒体ウェブページのカテゴリが前記カテゴリ条件を満たしている広告情報を前記記憶領域から選択するマッチング機能と、
    ネットワークに接続された端末で前記媒体ウェブページが閲覧されるとき、その端末に対して前記マッチング機能で選択された広告情報を前記媒体ウェブページとともに表示させる形態で送信する広告送信機能と、
    をコンピュータに実行させることを特徴とする広告配信プログラム。
JP2006278851A 2006-10-12 2006-10-12 広告配信装置およびプログラム Expired - Fee Related JP4940399B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006278851A JP4940399B2 (ja) 2006-10-12 2006-10-12 広告配信装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006278851A JP4940399B2 (ja) 2006-10-12 2006-10-12 広告配信装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2008097351A true JP2008097351A (ja) 2008-04-24
JP4940399B2 JP4940399B2 (ja) 2012-05-30

Family

ID=39380124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006278851A Expired - Fee Related JP4940399B2 (ja) 2006-10-12 2006-10-12 広告配信装置およびプログラム

Country Status (1)

Country Link
JP (1) JP4940399B2 (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009307A (ja) * 2008-06-26 2010-01-14 Kyoto Univ 特徴語自動学習システム、コンテンツ連動型広告配信コンピュータシステム、検索連動型広告配信コンピュータシステム、およびテキスト分類コンピュータシステム、並びにこれらのコンピュータプログラムおよび方法
JP2010020461A (ja) * 2008-07-09 2010-01-28 Jetrun Technology Corp 広告配信システム
JP2010039600A (ja) * 2008-08-01 2010-02-18 Yahoo Japan Corp 広告配信装置、広告配信方法、及び広告配信制御プログラム
JP2010117761A (ja) * 2008-11-11 2010-05-27 Yahoo Japan Corp 広告提供装置
WO2010074847A2 (en) * 2008-12-23 2010-07-01 Yahoo! Inc. Context transfer in search advertising
JP2010191710A (ja) * 2009-02-18 2010-09-02 Yahoo Japan Corp ジャンル判定辞書作成装置、ジャンル判定装置及び方法
JP2010218209A (ja) * 2009-03-17 2010-09-30 Yahoo Japan Corp 関連情報提供装置、そのシステム、そのプログラム、および、その方法
JP2010237779A (ja) * 2009-03-30 2010-10-21 Mitsubishi Space Software Kk 広告選択サーバ及び広告選択方法及びプログラム
JP2011028599A (ja) * 2009-07-28 2011-02-10 Yahoo Japan Corp Snsサイト紹介サーバ及び、snsサイト紹介方法
JP2011528479A (ja) * 2008-07-15 2011-11-17 グーグル・インコーポレーテッド 埋込みアプリケーションにおける地理的コンテキスト、およびキーワードコンテキスト
WO2011161900A1 (ja) * 2010-06-25 2011-12-29 日本電気通信システム株式会社 情報分類システム
JP2012138046A (ja) * 2010-12-28 2012-07-19 Yahoo Japan Corp 広告配信装置、広告配信方法及びプログラム
JP2013196382A (ja) * 2012-03-19 2013-09-30 Nippon Telegr & Teleph Corp <Ntt> 文書分類方法、装置、及びプログラム
KR20140052254A (ko) * 2012-10-23 2014-05-07 에스케이플래닛 주식회사 광고 서비스 시스템 및 그 방법, 그리고 이에 적용되는 장치
JP2014146347A (ja) * 2008-09-25 2014-08-14 Yahoo Inc 関心マネージャ
JP2017097512A (ja) * 2015-11-20 2017-06-01 株式会社オープンエイト 動画広告配信サーバおよびプログラム
WO2018225192A1 (ja) * 2017-06-07 2018-12-13 三菱電機ビルテクノサービス株式会社 データ名称分類支援装置及びデータ名称分類支援プログラム
US10358144B2 (en) 2015-09-03 2019-07-23 Yahoo Japan Corporation Notification-needed information presenting apparatus, notification-needed information presenting method, and non-transitory computer readable storage medium

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344169A (ja) * 2000-06-01 2001-12-14 Internatl Business Mach Corp <Ibm> ネットワークシステム、サーバ、ウェブサーバ、ウェブページ、データ処理方法、記憶媒体及びプログラム伝送装置
JP2003030234A (ja) * 2001-07-18 2003-01-31 Toshiba Tec Corp 個人興味自動認識システム
JP2006505077A (ja) * 2002-09-24 2006-02-09 グーグル、インコーポレイテッド クライアント側デバイスサポートでコンテンツ関連広告を供給すること
JP2006195974A (ja) * 2005-01-14 2006-07-27 Adsclick Sa コンピュータ・ネットワークにおける広告の目標とされた表示を管理するプラットフォーム
JP2007272814A (ja) * 2006-03-31 2007-10-18 Cyber Wing Corp 広告配信システム、広告配信方法及び広告配信プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001344169A (ja) * 2000-06-01 2001-12-14 Internatl Business Mach Corp <Ibm> ネットワークシステム、サーバ、ウェブサーバ、ウェブページ、データ処理方法、記憶媒体及びプログラム伝送装置
JP2003030234A (ja) * 2001-07-18 2003-01-31 Toshiba Tec Corp 個人興味自動認識システム
JP2006505077A (ja) * 2002-09-24 2006-02-09 グーグル、インコーポレイテッド クライアント側デバイスサポートでコンテンツ関連広告を供給すること
JP2006195974A (ja) * 2005-01-14 2006-07-27 Adsclick Sa コンピュータ・ネットワークにおける広告の目標とされた表示を管理するプラットフォーム
JP2007272814A (ja) * 2006-03-31 2007-10-18 Cyber Wing Corp 広告配信システム、広告配信方法及び広告配信プログラム

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009307A (ja) * 2008-06-26 2010-01-14 Kyoto Univ 特徴語自動学習システム、コンテンツ連動型広告配信コンピュータシステム、検索連動型広告配信コンピュータシステム、およびテキスト分類コンピュータシステム、並びにこれらのコンピュータプログラムおよび方法
JP2010020461A (ja) * 2008-07-09 2010-01-28 Jetrun Technology Corp 広告配信システム
US8655761B2 (en) 2008-07-15 2014-02-18 Google Inc. Geographic and keyword context in embedded applications
US11120473B2 (en) 2008-07-15 2021-09-14 Google Llc Geographic and keyword context in embedded applications
JP2011528479A (ja) * 2008-07-15 2011-11-17 グーグル・インコーポレーテッド 埋込みアプリケーションにおける地理的コンテキスト、およびキーワードコンテキスト
JP2010039600A (ja) * 2008-08-01 2010-02-18 Yahoo Japan Corp 広告配信装置、広告配信方法、及び広告配信制御プログラム
JP2014146347A (ja) * 2008-09-25 2014-08-14 Yahoo Inc 関心マネージャ
JP2010117761A (ja) * 2008-11-11 2010-05-27 Yahoo Japan Corp 広告提供装置
WO2010074847A2 (en) * 2008-12-23 2010-07-01 Yahoo! Inc. Context transfer in search advertising
WO2010074847A3 (en) * 2008-12-23 2010-08-19 Yahoo! Inc. Context transfer in search advertising
US8886636B2 (en) 2008-12-23 2014-11-11 Yahoo! Inc. Context transfer in search advertising
JP2010191710A (ja) * 2009-02-18 2010-09-02 Yahoo Japan Corp ジャンル判定辞書作成装置、ジャンル判定装置及び方法
JP2010218209A (ja) * 2009-03-17 2010-09-30 Yahoo Japan Corp 関連情報提供装置、そのシステム、そのプログラム、および、その方法
JP2010237779A (ja) * 2009-03-30 2010-10-21 Mitsubishi Space Software Kk 広告選択サーバ及び広告選択方法及びプログラム
JP2011028599A (ja) * 2009-07-28 2011-02-10 Yahoo Japan Corp Snsサイト紹介サーバ及び、snsサイト紹介方法
US9009160B2 (en) 2010-06-25 2015-04-14 Nec Communication Systems, Ltd. Information classification system
JP5483506B2 (ja) * 2010-06-25 2014-05-07 日本電気通信システム株式会社 情報分類システム
WO2011161900A1 (ja) * 2010-06-25 2011-12-29 日本電気通信システム株式会社 情報分類システム
JP2012138046A (ja) * 2010-12-28 2012-07-19 Yahoo Japan Corp 広告配信装置、広告配信方法及びプログラム
JP2013196382A (ja) * 2012-03-19 2013-09-30 Nippon Telegr & Teleph Corp <Ntt> 文書分類方法、装置、及びプログラム
KR20140052254A (ko) * 2012-10-23 2014-05-07 에스케이플래닛 주식회사 광고 서비스 시스템 및 그 방법, 그리고 이에 적용되는 장치
KR101979721B1 (ko) * 2012-10-23 2019-05-17 에스케이플래닛 주식회사 광고 서비스 시스템 및 그 방법, 그리고 이에 적용되는 장치
US10358144B2 (en) 2015-09-03 2019-07-23 Yahoo Japan Corporation Notification-needed information presenting apparatus, notification-needed information presenting method, and non-transitory computer readable storage medium
JP2017097512A (ja) * 2015-11-20 2017-06-01 株式会社オープンエイト 動画広告配信サーバおよびプログラム
WO2018225192A1 (ja) * 2017-06-07 2018-12-13 三菱電機ビルテクノサービス株式会社 データ名称分類支援装置及びデータ名称分類支援プログラム
JPWO2018225192A1 (ja) * 2017-06-07 2019-11-07 三菱電機ビルテクノサービス株式会社 データ名称分類支援装置及びデータ名称分類支援プログラム
CN110753939A (zh) * 2017-06-07 2020-02-04 三菱电机大楼技术服务株式会社 数据名称分类辅助装置和数据名称分类辅助程序
CN110753939B (zh) * 2017-06-07 2024-03-01 三菱电机楼宇解决方案株式会社 数据名称分类辅助装置

Also Published As

Publication number Publication date
JP4940399B2 (ja) 2012-05-30

Similar Documents

Publication Publication Date Title
JP4940399B2 (ja) 広告配信装置およびプログラム
US11907237B2 (en) Gathering and contributing content across diverse sources
US9201880B2 (en) Processing a content item with regard to an event and a location
CN101288067B (zh) 从电子文档组装、提取和配置内容的方法和装置
CN104484431B (zh) 一种基于领域本体的多源个性化新闻网页推荐方法
JP5092252B2 (ja) トレンド解析サーバおよびトレンド解析方法
US8209214B2 (en) System and method for providing targeted content
US20080177708A1 (en) System and method for providing persistent, dynamic, navigable and collaborative multi-media information packages
TW200917070A (en) System and method to facilitate matching of content to advertising information in a network
US9672269B2 (en) Method and system for automatically identifying related content to an electronic text
JP2007272814A (ja) 広告配信システム、広告配信方法及び広告配信プログラム
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
JP2006293767A (ja) 文章分類装置、文章分類方法および分類辞書作成装置
CN104199938B (zh) 基于rss的农用土地信息发送方法和系统
JP2007018285A (ja) 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム
US20140025496A1 (en) Social content distribution network
US20130110594A1 (en) Ad copy determination
CN103455538A (zh) 信息处理装置、信息处理方法和程序
JP2011107826A (ja) 行動情報抽出システム及び抽出方法
JP4743766B2 (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
CN112328857A (zh) 一种产品知识聚合方法、装置、计算机设备及存储介质
KR101518488B1 (ko) 온라인 콘텐츠 가치 향상 방법 및 시스템
JP5462591B2 (ja) 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及び関連コンテンツ挿入装置
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
JP2019175212A (ja) 情報表示装置、記事ページ生成装置、情報処理装置、情報表示システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20120112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120215

R150 Certificate of patent or registration of utility model

Ref document number: 4940399

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees