JP4962986B2 - コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム - Google Patents

コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム Download PDF

Info

Publication number
JP4962986B2
JP4962986B2 JP2009020530A JP2009020530A JP4962986B2 JP 4962986 B2 JP4962986 B2 JP 4962986B2 JP 2009020530 A JP2009020530 A JP 2009020530A JP 2009020530 A JP2009020530 A JP 2009020530A JP 4962986 B2 JP4962986 B2 JP 4962986B2
Authority
JP
Japan
Prior art keywords
keyword
web page
category
bid
relevance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009020530A
Other languages
English (en)
Other versions
JP2009266204A (ja
Inventor
敦 大竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009020530A priority Critical patent/JP4962986B2/ja
Publication of JP2009266204A publication Critical patent/JP2009266204A/ja
Application granted granted Critical
Publication of JP4962986B2 publication Critical patent/JP4962986B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラムに関する。
従来、Webページや電子メール等のコンテンツデータに対して、そのコンテンツデータに関連する広告等の付加データを配信する、いわゆるコンテントマッチ広告サービスが行われている。例えば、特許文献1には、閲覧したWebサイトに含まれるWebコンテンツの内容に連動した広告を提供することが示されている。
このようなサービスでは、広告データを配信する広告主により入札キーワードが指定され、この入札キーワードとコンテンツデータとのマッチングにより、配信する広告データが選択されることが多い。これにより、コンテンツデータに関連した広告データが配信され、無作為に提示される場合に比べて広告効果が上がることが期待できる。
特開2007−286833号公報
しかしながら、前述のように、コンテンツデータと入札キーワードとのマッチングにより付加データを配信する方法の場合、例えば、コンテンツデータに入札キーワードが含まれたとしても、異なる分野(カテゴリ)の内容である場合もあるため、広告主の意図するコンテンツデータと関連付けられない可能性があった。
したがって、広告主の意図するカテゴリと、コンテンツデータのカテゴリとが食い違わないように調整する手順が必要となる。そして、この調整する手順に人手が介することにより、付加データを配信するシステムの省力化と精度の向上を難しくしていた。
更に、コンテンツデータが入札キーワードに関連する内容であったとしても、広告主が配信を避けたいカテゴリ(NGカテゴリ、例えば、刑事事件や訃報等のネガティブなニュース等)のコンテンツデータに配信されてしまうことも考えられる。
そこで本発明は、コンテンツデータに対して付加データを配信する処理を省力化し、かつ配信先のコンテンツデータとのマッチング精度を向上させる方法を提供することを目的とする。
本発明では、以下のような解決手段を提供する。
(1) コンテンツデータに付加データ(例えば、広告データ)を付加する方法であって、
前記付加データを、予め設けられた複数種類の付加データカテゴリに対して関連付けて記憶する記憶ステップと、
前記コンテンツデータの出力要求(例えば、Webページ表示要求)を受け付けたことに応じて、予め記憶した参照キーワードと前記コンテンツデータを分類するコンテンツカテゴリとの関連度を参照し、前記コンテンツデータに含まれる特徴語と類似する前記参照キーワードに基づいて、前記コンテンツデータと前記コンテンツカテゴリとの関連度を算出する関連度算出ステップと、
前記関連度算出ステップにおいて算出された前記関連度に基づいて、前記コンテンツデータを前記コンテンツカテゴリに分類し、前記コンテンツデータが分類された前記コンテンツカテゴリと前記付加データカテゴリとをマッチングすることにより、前記記憶ステップにおいて記憶された付加データを選択して、当該コンテンツデータに付加する付加ステップと、を含む方法。
このような構成によれば、当該方法を実行するサーバは、付加データを、予め設けられた複数種類の付加データカテゴリに対して関連付けて記憶し、コンテンツデータの出力要求を受け付けたことに応じて、予め記憶した参照キーワードとコンテンツデータを分類するコンテンツカテゴリとの関連度を参照し、コンテンツデータに含まれる特徴語と類似する参照キーワードに基づいて、コンテンツデータとコンテンツカテゴリとの関連度を算出し、算出された関連度に基づいて、コンテンツデータをコンテンツカテゴリに分類し、コンテンツデータが分類されたコンテンツカテゴリと付加データカテゴリとをマッチングすることにより、記憶された付加データを選択して、コンテンツデータに付加する。
このことにより、当該サーバは、出力要求を受け付けたコンテンツデータ(例えば、Webページ)を、予め記憶したコンテンツカテゴリのいずれかに自動的に分類し、分類されたコンテンツカテゴリと付加データカテゴリとのマッチングにより付加データを選択して配信することができる。
その結果、当該サーバは、カテゴリに基づいて付加データを選択したので、付加データと配信先のコンテンツデータとのマッチング精度を向上させることができる。更に、コンテンツカテゴリへの分類を自動化したことにより、コンテンツデータに対して付加データを配信する処理を省力化することができる。
(2) 前記コンテンツカテゴリに対して、当該コンテンツカテゴリのそれぞれを特徴付ける設定キーワードの入力を受け付ける受付ステップと、
前記受付ステップにより受け付けられた設定キーワードに関連するWebページを検索する検索ステップと、
前記検索ステップにより検索されたWebページに含まれる前記参照キーワードを抽出する抽出ステップと、
前記抽出ステップにより抽出された前記参照キーワードそれぞれの、前記Webページにおける重要度を示す評価値を算出する評価値算出ステップと、
前記評価値算出ステップにより算出された評価値に基づいて、前記参照キーワードに対する前記コンテンツカテゴリの関連度を示す転置インデックスを生成して記憶するインデックス生成ステップと、を更に含み、
前記関連度算出ステップは、前記インデックス生成ステップにより生成された転置インデックスを参照し、前記コンテンツデータと前記コンテンツカテゴリとの関連度を算出する(1)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、コンテンツカテゴリに対して、当該コンテンツカテゴリのそれぞれを特徴付ける設定キーワードの入力を受け付け、受け付けられた設定キーワードに関連するWebページを検索し、検索されたWebページに含まれる参照キーワードを抽出し、抽出された参照キーワードそれぞれの、Webページにおける重要度を示す評価値を算出し、算出された評価値に基づいて、参照キーワードに対するコンテンツカテゴリの関連度を示す転置インデックスを生成して記憶し、生成された転置インデックスを参照し、コンテンツデータと、コンテンツカテゴリとの関連度を算出する。
このことにより、当該サーバは、指定された設定キーワードに基づいて検索されたWebページに含まれる参照キーワードについて、その重要度を示す評価値を算出する。ここで、検索されたWebページは、指定された設定キーワードに関連しており、すなわち、対象のコンテンツカテゴリに関する内容であると推定できる。したがって、このWebページから抽出された参照キーワードは、このコンテンツカテゴリと関連する可能性が高いため、重要度を示す評価値を算出することによれば、この評価値が大きいほど、コンテンツカテゴリとの関連度が高いこととなる。
そこで、当該サーバは、この評価値に基づいて、参照キーワードに対するコンテンツカテゴリの関連度を示す転置インデックスを生成するので、この転置インデックスが示す関連度に基づいて、コンテンツデータとコンテンツカテゴリとの関連度を算出できる。その結果、当該サーバは、コンテンツデータを、例えば、関連度が最上位のコンテンツカテゴリ等へ自動的に分類することができる。
なお、キーワードに関連するWebページは、複数検索してよい。複数のWebページを検索することにより、多くの関連語が抽出されることとなるため、抽出される参照キーワードの偏りを低減できる可能性がある。
(3) 前記評価値算出ステップは、前記Webページに含まれる参照キーワードの出現頻度に関する指標であるTFとIDFとの積に基づいて、前記評価値を算出することを特徴とする(2)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、参照キーワードの出現頻度に関する指標であるTF・IDF値に基づいて評価値を算出する。このことにより、当該サーバは、検索されたWebページに頻出する(TFが大きい)参照キーワード、検索エンジンによる検索範囲のWebページでの出現頻度が低い(IDFが大きい)参照キーワードほど、評価値を大きく算出する。したがって、検索されたWebページを特徴付ける参照キーワードの評価値を大きく算出することができる。
(4) 前記関連度算出ステップは、語の出現頻度に関する指標であるTFとIDFとの積に基づいて、前記コンテンツデータに含まれる特徴語を抽出し、当該抽出された特徴語と類似する前記参照キーワードに基づいて、前記コンテンツカテゴリそれぞれとの関連度を算出することを特徴とする(1)から(3)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、出現頻度に関する指標であるTF・IDF値に基づいて、受け付けたコンテンツデータを特徴付ける特徴語を抽出し、抽出した特徴語に基づいてコンテンツカテゴリとの関連度を算出する。よって、当該サーバは、コンテンツデータの内容とは関係の薄い語を排除した上で、精度良くコンテンツカテゴリに分類できる可能性がある。
(5) 前記記憶ステップは、前記付加データと共に入札キーワードを関連付けて記憶し、
前記付加ステップは、前記コンテンツデータを分類したコンテンツカテゴリとマッチングする付加データカテゴリの付加データのうち、当該付加データの入札キーワードが当該コンテンツデータに含まれる付加データを選択することを特徴とする(1)から(4)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、付加データと共に入札キーワードを関連付けて記憶し、コンテンツデータを分類したコンテンツカテゴリとマッチングする付加データカテゴリの付加データのうち、当該付加データの入札キーワードが当該コンテンツデータに含まれる付加データを選択する。
このことにより、当該サーバは、付加データとコンテンツデータとの関連付けに関して、コンテンツカテゴリと付加データカテゴリとが一致することに加えて、コンテンツデータが、指定された入札キーワードを含む場合に、付加データを配信する。したがって、当該サーバは、配信する付加データを、コンテンツカテゴリにより絞り込んだ上で、入札キーワードにより、精度良く選択できる可能性がある。
(6) 前記記憶ステップは、前記付加データと共に入札キーワードを関連付けて記憶し、
前記コンテンツデータが分類された複数の前記コンテンツカテゴリに関連付けられた参照キーワードを選び出し1つにマージする参照キーワード選出ステップと、
前記コンテンツカテゴリとマッチングした前記付加データカテゴリに関連付けられた付加データの入札キーワードを選び出し1つにマージする入札キーワード選出ステップと、
マージされた参照キーワード群とマージされた入札キーワード群に含まれる入札キーワードそれぞれとの類似度に対して、所定の条件に従った重み付けをし、当該入札キーワードの優先度を算出する優先度算出ステップと、を更に含み、
前記付加ステップは、前記優先度算出ステップにより算出された優先度に基づいて、当該優先度が上位の入札キーワードに対応する付加データを選択することを特徴とする(1)から(4)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、付加データと共に入札キーワードを関連付けて記憶し、コンテンツデータが分類された複数のコンテンツカテゴリに関連付けられた参照キーワードを選び出し1つにマージし、コンテンツカテゴリとマッチングした付加データカテゴリに関連付けられた付加データの入札キーワードを選び出し1つにマージし、マージされた参照キーワード群とマージされた入札キーワード群に含まれる入札キーワードそれぞれとの類似度に対して、所定の条件に従った重み付けをし、当該入札キーワードの優先度を算出し、算出された優先度に基づいて、当該優先度が上位の入札キーワードに対応する付加データを選択する。
このことにより、当該サーバは、コンテンツデータと付加データとのカテゴリが異なることなく、更に所定の条件に従った重み付けにより、優先度の高い入札キーワードと対応する付加データを選択することができる。したがって、当該サーバは、カテゴリのマッチングのみでは対象外となっていた優先度の高い付加データが選択される可能性を高めることができる。
(7) 前記優先度算出ステップは、前記所定の条件として、前記入札キーワードの入札価格が高いほど、大きな重み付けを行うことを特徴とする(6)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、入札価格が高い、すなわちサービスへの投資額が上位の付加データを優先して配信することができる。
(8) 前記付加データを、入札キーワードと共に受け付ける入札ステップを更に含み、
前記記憶ステップは、前記入札ステップにより受け付けた付加データの入札キーワードと類似する前記参照キーワードに基づいて、当該入札キーワードと前記付加データカテゴリとの関連度を算出し、当該付加データを当該関連度に基づいて前記付加データカテゴリに関連付けることを特徴とする(1)から(7)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、付加データを、入札キーワードと共に受け付け、受け付けた付加データの入札キーワードと類似する参照キーワードに基づいて、入札キーワードと付加データカテゴリとの関連度を算出し、当該付加データを当該関連度に基づいて付加データカテゴリに関連付ける。
このことにより、当該サーバは、前述の参照キーワードに対するコンテンツカテゴリの関連度(転置インデックス)に基づいて、付加データと共に受け付けた入札キーワードを、いずれかの付加データカテゴリに関連付ける。よって、当該サーバは、コンテンツデータに対して、付加データカテゴリを介して付加データを自動的に配信することができる。
(9) 前記付加データを、入札キーワードと共に受け付ける入札ステップと、
前記入札ステップにより受け付けた付加データの入札キーワードに関連するWebページを検索する第2検索ステップと、を更に含み、
前記記憶ステップは、前記第2検索ステップにより検索されたWebページに含まれる語と類似する前記参照キーワードに基づいて、前記付加データカテゴリとの関連度を算出し、当該付加データを当該関連度に基づいて前記付加データカテゴリに関連付けることを特徴とする(1)から(7)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、付加データを、入札キーワードと共に受け付け、受け付けた付加データの入札キーワードに関連するWebページを検索し、検索されたWebページに含まれる語と類似する前記参照キーワードに基づいて、付加データカテゴリとの関連度を算出し、当該付加データを当該関連度に基づいて付加データカテゴリに関連付ける。
このことにより、当該サーバは、入札キーワードに関連するWebページを検索し、このWebページに含まれる語を抽出することで、入札キーワードに関連する語を取得することができる。この取得した語に類似する参照キーワードを用いることにより、入札キーワードのみから付加データカテゴリを決定することに比べて、算出された付加データカテゴリとの関連度に対する信頼性が高くなると期待できる。
(10) 前記付加データとの関連付けを避ける付加データカテゴリの指定を更に受け付ける指定ステップを更に含み、
前記記憶ステップは、前記入札ステップにより受け付けた付加データを、前記指定ステップにより指定されなかった付加データカテゴリに関連付けることを特徴とする(8)または(9)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、付加データとの関連付けを避ける付加データカテゴリの指定を更に受け付け、付加データを、指定されなかった付加データカテゴリに関連付ける。
このことにより、当該サーバは、付加データとの関連付けを避ける付加データカテゴリ(NGカテゴリ)の指定を受け付けることにより、付加データの配信対象として相応しくないコンテンツカテゴリのコンテンツデータに対して付加データが配信されるのを抑制することができる。
(11) コンテンツデータに付加データを付加するサーバであって、
前記付加データを、予め設けられた複数種類の付加データカテゴリに対して関連付けて記憶する記憶手段と、
前記コンテンツデータの出力要求を受け付けたことに応じて、予め記憶した参照キーワードと前記コンテンツデータを分類するコンテンツカテゴリとの関連度を参照し、前記コンテンツデータに含まれる特徴語と類似する前記参照キーワードに基づいて、前記コンテンツデータと前記コンテンツカテゴリとの関連度を算出する関連度算出手段と、
前記関連度算出手段において算出された前記関連度に基づいて、前記コンテンツデータを前記コンテンツカテゴリに分類し、前記コンテンツデータが分類された前記コンテンツカテゴリと前記付加データカテゴリとをマッチングすることにより、前記記憶手段において記憶された付加データを選択して、当該コンテンツデータに付加する付加手段と、を備えるサーバ。
このような構成によれば、当該サーバを運用することにより、(1)と同様の効果が期待できる。
(12) サーバにより、コンテンツデータに付加データを付加させるプログラムであって、
前記付加データを、予め設けられた複数種類の付加データカテゴリに対して関連付けて記憶する記憶ステップと、
前記コンテンツデータの出力要求(例えば、Webページ表示要求)を受け付けたことに応じて、予め記憶した参照キーワードと前記コンテンツデータを分類するコンテンツカテゴリとの関連度を参照し、前記コンテンツデータに含まれる特徴語と類似する前記参照キーワードに基づいて、前記コンテンツデータと前記コンテンツカテゴリとの関連度を算出する関連度算出ステップと、
前記関連度算出ステップにおいて算出された前記関連度に基づいて、前記コンテンツデータを前記コンテンツカテゴリに分類し、前記コンテンツデータが分類された前記コンテンツカテゴリと前記付加データカテゴリとをマッチングすることにより、前記記憶ステップにおいて記憶された付加データを選択して、当該コンテンツデータに付加する付加ステップと、を実行させるプログラム。
このような構成によれば、当該プログラムをサーバに実行させることにより、(1)と同様の効果が期待できる。
本発明によれば、コンテンツデータに対して付加データを配信する処理を省力化し、かつ配信先のコンテンツデータとのマッチング精度を向上させることができる。
本発明の第1実施形態に係る広告配信システムの構成を示す図である。 本発明の第1実施形態に係る広告配信サーバ10のハードウェア構成の一例を示す図である。 本発明の第1実施形態に係る広告配信サーバ10の機能を示すブロック図である。 本発明の第1実施形態に係るカテゴリ分類定義テーブルを示す図である。 本発明の第1実施形態に係るカテゴリ関連度テーブルを示す図である。 本発明の第1実施形態に係る広告データテーブルを示す図である。 本発明の第1実施形態に係る広告データを配信する処理を示すフローチャートである。 本発明の第1実施形態に係るカテゴリ情報を管理する処理を示すフローチャートである。 本発明の第1実施形態に係る広告情報を管理する処理を示すフローチャートである。 本発明の第2実施形態に係る広告配信サーバ10aの機能を示すブロック図である。 本発明の第2実施形態に係る優先度に基づく広告データの抽出例を示す図である。 本発明の第2実施形態に係る広告データを配信する処理を示すフローチャートである。
<第1実施形態>
以下、本発明の第1実施形態について図を参照しながら説明する。なお、本実施形態においては、コンテンツデータをWebページのテキストデータとして、付加データを広告データとして説明するが、コンテンツに対して関連する情報を付加する形態であれば、これには限られない。
[システム構成]
図1は、本発明の第1実施形態に係る広告配信システムの構成を示す図である。広告配信サーバ10と、コンテンツサーバ20と、ユーザが操作する端末装置30とは、ネットワーク40を介して接続されている。
ユーザは、端末装置30により、コンテンツサーバ20により管理されているWebページの閲覧を要求(1)する。すると、コンテンツサーバ20からの要求(2)に応じて、広告配信サーバ10は、対象のWebページの内容に応じた広告データを配信(3)し、このWebページの一部として、端末装置30に表示(4)させる。
ここで、広告配信サーバ10は、本発明の機能を実現するサーバであって、閲覧要求のあったWebページを、複数設けられたコンテンツカテゴリのいずれかに自動的に分類する。そして、広告データの広告カテゴリ(付加データカテゴリ)とのマッチングを行うことにより、Webページと広告データとの関連付けの精度を向上させる。
[ハードウェア構成]
図2は、本発明の第1実施形態に係る広告配信サーバ10のハードウェア構成の一例を示す図である。広告配信サーバ10は、制御部101を構成するCPU(Central Processing Unit)1(1010)(マルチプロセッサ構成ではCPU2(1012)等複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、USBポート1090、I/Oコントローラ1070、ならびにキーボードおよびマウス1100等の入力手段や表示装置1022を備える。
I/Oコントローラ1070には、テープドライブ1072、ハードディスク1074、光ディスクドライブ1076、半導体メモリ1078、等の記憶手段を接続することができる。
BIOS1060は、各サーバの起動時にCPU1(1010)が実行するブートプログラムや、各サーバのハードウェアに依存するプログラム等を格納する。
記憶部107を構成するハードディスク1074は、広告配信サーバ10がサーバとして機能するための各種プログラムおよび本発明の機能を実行するプログラムを記憶しており、更に必要に応じて各種データベース(後述のカテゴリDB71、広告DB72等)を構成可能である。
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラムまたはデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050またはハードディスク1074に提供することもできる。
広告配信サーバ10に提供されるプログラムは、ハードディスク1074、光ディスク1077、またはメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、または通信I/F1040を介してダウンロードされることによって、広告配信サーバ10にインストールされ実行されてもよい。
前述のプログラムは、内部または外部の記憶媒体に格納されてもよい。ここで、記憶部107を構成する記憶媒体としては、ハードディスク1074、光ディスク1077、またはメモリーカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバシステムに設けたハードディスク1074または光ディスクライブラリ等の記憶装置を記録媒体として使用し、通信回線を介してプログラムを広告配信サーバ10に提供してもよい。
ここで、表示装置1022は、ユーザにデータの入力を受け付ける画面を表示したり、広告配信サーバ10による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
ここで、入力手段は、ユーザによる入力の受け付けを行うものであり、キーボードおよびマウス1100等により構成してよい。
また、通信I/F1040は、各サーバを専用ネットワークまたは公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデムおよびイーサネット(登録商標)・アダプタを含んでよい。
以上の例は、広告配信サーバ10について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータをサーバ装置として動作させることにより各機能を実現することもできる。したがって、本実施形態の広告配信サーバ10により実現される機能は、前述の方法を当該コンピュータにより実行することにより、あるいは、前述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
端末装置30も、前述の広告配信サーバ10と同様な構成を持つ。また、本実施形態ではいわゆるPC(Personal Computer)で実現した例について説明するが、更に、本発明の原理が適用可能である限り、携帯電話、PDA(Personal Data Assistant)、ゲーム機等の様々な端末で実現してよい。
[機能構成]
図3は、本発明の第1実施形態に係る広告配信サーバ10の機能を示すブロック図である。制御部101と記憶部107とが協働することにより、本実施形態の機能を実現する。
制御部101は、設定キーワード受付部11と、Web検索部12と、参照キーワード抽出部13と、インデックス生成部14と、関連度算出部15と、広告データ受付部16と、広告データ記憶部17と、広告データ配信部18と、を備える。また、記憶部107は、カテゴリDB71と、広告DB72と、を備える。
設定キーワード受付部11は、予め設けられた複数種類のコンテンツカテゴリに対して、このコンテンツカテゴリそれぞれを特徴付ける設定キーワードの入力を受け付ける。具体的には、設定キーワードは、広告配信サーバ10の管理者により入力されることとしてよく、図4に示すカテゴリ分類定義テーブルに記憶される。
図4は、本発明の第1実施形態に係るカテゴリ分類定義テーブルを示す図である。カテゴリ分類定義テーブルは、カテゴリDB71に記憶されることとしてよい。ここで、各コンテンツカテゴリは、階層構造により定義され、コンテンツカテゴリそれぞれに対して、少なくとも1の設定キーワードが関連付けて記憶される。
Web検索部12は、設定キーワード受付部11により受け付けた設定キーワードに基づいて、関連する少なくとも1のWebページを検索する。このとき、検索方法は所定の検索エンジンによるが、閲覧頻度や被リンク数等に基づく順位付けがされることが望ましい。Web検索部12は、このように順位付けされた検索結果の、上位から所定数を抽出することにより、設定キーワードに関連する有用なWebページを取得できる。
参照キーワード抽出部13は、Web検索部12により検索されたWebページに含まれる参照キーワードを抽出する。具体的には、Webページに含まれるテキストデータを形態素解析することにより、Webページを構成する語を抽出し、参照キーワードとする。
インデックス生成部14は、参照キーワード抽出部13により抽出された参照キーワードそれぞれの、Webページにおける重要度を示す評価値を算出する。ここで、重要度を示す評価値とは、例えば、語の出現頻度に関する指標であるTF(Term Frequency)とIDF(Inverse Document Frequency)との積であるTF・IDF値に基づいてよい。
このことによれば、Webページに頻出する(TFが大きい)参照キーワード、検索エンジンによる検索範囲のWebページでの出現頻度が低い(IDFが大きい)参照キーワードほど、評価値が大きくなる。したがって、検索されたWebページを特徴付ける参照キーワードの評価値が大きく算出されることとなる。
インデックス生成部14は、このようにして算出した評価値に基づいて、転置インデックスを計算することにより、参照キーワードに対するコンテンツカテゴリの関連度を示すインデックスとして、図5のカテゴリ関連度テーブルを生成する。
図5は、本発明の第1実施形態に係るカテゴリ関連度テーブルを示す図である。カテゴリ関連度テーブルは、カテゴリDB71に記憶されることとしてよい。ここで、参照キーワード抽出部13により抽出された参照キーワードについて、コンテンツカテゴリとの関連度を記憶する。なお、1の参照キーワードに対して複数のコンテンツカテゴリの関連度を記憶してよい。
関連度算出部15は、コンテンツサーバ20から受け付けたWebページ、すなわち端末装置30から閲覧要求のあったWebページについての、コンテンツカテゴリとの関連度を算出する。
具体的には、関連度算出部15は、まず、インデックス生成部14により生成されたカテゴリ関連度テーブル(図5)に記憶された参照キーワードとコンテンツカテゴリとの関連度に基づいて、Webページに含まれる少なくとも1の語と一致または類似する参照キーワードの組み合わせと、コンテンツカテゴリそれぞれとの関連度を算出する。なお、あるコンテンツカテゴリへの関連度は、このコンテンツカテゴリに対する1または複数の語それぞれの関連度を合計したものであってよい。
ここで、Webページに含まれる語とは、このWebページを特徴付ける語であることが好ましい。例えば、前述のTF・IDF値等、出現頻度に基づく評価に基づいて選択することとしてよい。あるいは、強調されたフォントを用いた語や、タイトルとして用いられている語等、Webページのスタイル情報に基づいて抽出してもよい。
広告データ受付部16は、広告主から、広告データと、この広告データを表示させるWebページを選択するための入札キーワードと、更に必要に応じて、この広告データが表示されることを避けるWebページのコンテンツカテゴリを指定するNGカテゴリの入力を受け付ける。
広告データ記憶部17は、広告データ受付部16により受け付けた広告データを記憶する。このとき、広告データは、いずれかの広告カテゴリに関連付けて記憶することとする。なお、関連付ける広告カテゴリは、広告データ受付部16が広告データを受け付ける際に、広告主からの入力を求める。
また、広告データを関連付ける広告カテゴリは、自動的に決定してもよい。具体的には、広告データ受付部16により広告データと共に受け付けた入札キーワードに関連するWebページを検索し、検索されたWebページに含まれる語と一致または類似する参照キーワードと、広告カテゴリ(コンテンツカテゴリで代用)それぞれとの関連度を算出する。そして、この関連度に基づいて、広告データを関連付ける広告カテゴリを決定する。例えば、関連度が最上位から所定数の広告カテゴリや、所定以上の関連度の広告カテゴリに決定することとしてよい。また、関連度の順位付けに基づいて、管理者や広告主から広告カテゴリを指定する入力を受け付けてもよい。
なお、この関連度の算出方法は、前述の関連度算出部15によるものと同様であってよく、Webページを特徴付ける1または複数の語に関して、それぞれの広告カテゴリに対する関連度を集計することにより算出される。
また、検索されたWebページに含まれる、関連度を算出するための語は、Webページを特徴付けるものであることが好ましい。具体的には、強調されたフォントを用いた語や、タイトルとして用いられている語等を抽出することとしてよい。また、TF・IDF値が上位の語等、出現頻度に基づいて抽出してもよい。
ここで、広告データ記憶部17は、広告データを関連付ける広告カテゴリを、入札キーワードにより検索されたWebページに基づいて決定したが、これには限られない。例えば、広告データ受付部16により受け付けた入札キーワードと、広告カテゴリとの関連度を算出し、算出した関連度に基づいて決定してもよい。
図6は、本発明の第1実施形態に係る広告データテーブルを示す図である。広告データテーブルは、広告DB72に記憶されることとしてよい。ここでは、1の広告データに対して、入札キーワードと、少なくとも1の広告カテゴリとが関連付けられる。
なお、関連付けられる広告カテゴリは、前述のように広告データ記憶部17により決定されるが、広告データ受付部16によりNGカテゴリの指定を受け付けた場合には、広告データを、指定されたNGカテゴリ以外の広告カテゴリに関連付けることとする。これにより、広告主が望まないコンテンツカテゴリのWebページに対して広告データが配信されるのを抑制することができる。
広告データ配信部18は、関連度算出部15により算出した関連度が最上位のコンテンツカテゴリに対して、受け付けたWebページを分類する。なお、分類するコンテンツカテゴリは複数であってもよく、算出した関連度の上位から所定数、あるいは所定以上の関連度を持つコンテンツカテゴリに対して分類することとしてもよい。また、関連度算出部15により関連度の順位付けを行い、管理者により選択するようにしてもよい。これらの方法により、最上位ではないコンテンツカテゴリにも分類することができるため、広告データを配信するWebページの範囲を柔軟に広げることが可能となる。
次に、広告データ配信部18は、広告データ記憶部17により記憶された広告データのうち、Webページが分類されたコンテンツカテゴリと一致する広告カテゴリに関連付けられた広告データを選択する。そして、広告データ配信部18は、選択した広告データをコンテンツサーバ20に送信することにより、広告データが付加されたWebページを端末装置30にて表示させる。
ここで、広告データ配信部18が選択する広告データは、受け付けたWebページのコンテンツカテゴリと一致する広告カテゴリに関連付けられた広告データのうち、入札キーワードがこのWebページに含まれる広告データを選択することとしてよい。このことにより、広告データ配信部18は、広告カテゴリにより分野を絞り込んだ上で、広告データを配信するWebページを入札キーワードに基づいて決定することができる。
以上、広告配信サーバ10の機能構成を説明したが、各機能は、適宜複数のサーバに分散させてもよい。
[広告データ配信フロー]
図7は、本発明の第1実施形態に係る広告データをWebページに関連付けて配信する処理を示すフローチャートである。
ステップS31では、関連度算出部15は、広告データの配信対象となるWebページの出力要求を受け付ける。
ステップS32では、関連度算出部15は、ステップS31にて受け付けたWebページのテキストデータを形態素解析し、フォントやレイアウト等のスタイル情報や、TF・IDF値等の出現頻度に基づいて、Webページに含まれる特徴語を抽出する。
ステップS33では、関連度算出部15は、カテゴリ関連度テーブル(図5)に基づいて、ステップS32にて抽出した特徴語と一致または類似する参照キーワードを選択し、コンテンツカテゴリとの関連度を算出する。これにより、Webページと関連度の高いコンテンツカテゴリが決定される。
ステップS34では、広告データ配信部18は、ステップS33にて算出された関連度に基づいて、Webページをいずれかのコンテンツカテゴリに分類する。続いて、広告データ配信部18は、分類されたコンテンツカテゴリと広告カテゴリとのマッチングを行い、コンテンツカテゴリと一致する広告カテゴリに関連付けられた広告データを、広告データテーブル(図6)を参照して抽出する。
ステップS35では、ステップS34にて抽出された広告データについて、入札キーワードによるWebページとのマッチングを行う。これにより、コンテンツカテゴリと広告カテゴリとが一致し、更にWebページに含まれる語と入札キーワードとが一致または類似する広告データを選択する。なお、Webページとのマッチングは、このWebページを特徴付ける特徴語に対して行ってもよい。
ステップS36では、広告データ配信部18は、ステップS35にて選択された広告データをコンテンツサーバ20に送信する。これにより、ステップS31にて受け付けたWebページに対して、関連する広告データが配信される。
[カテゴリ情報管理フロー]
図8は、本発明の第1実施形態に係るカテゴリ情報を管理する処理を示すフローチャートである。なお、カテゴリ情報とは、カテゴリ分類定義テーブル(図4)およびカテゴリ関連度テーブル(図5)にて記憶されるコンテンツカテゴリに関するデータを示す。
ステップS11では、設定キーワード受付部11は、コンテンツカテゴリに対する設定キーワードの入力を受け付け、カテゴリ分類定義テーブル(図4)に記憶する。
ステップS12では、Web検索部12は、ステップS11にて受け付けた設定キーワードに基づいて、関連するWebページを検索する。
ステップS13では、参照キーワード抽出部13は、ステップS12にて検索されたWebページのテキストデータを形態素解析し、Webページに含まれる参照キーワードを抽出する。
ステップS14では、インデックス生成部14は、ステップS13にて抽出した参照キーワードに関して、Webページにおける重要度の尺度として、TF・IDF値を算出する。
ステップS15では、インデックス生成部14は、ステップS14にて算出したTF・IDF値に基づいて、転置インデックスを計算することにより、参照キーワードに対するコンテンツカテゴリの関連度を算出してカテゴリ関連度テーブル(図5)に記憶する。
以上の処理により、カテゴリ分類定義テーブル(図4)およびカテゴリ関連度テーブル(図5)は、設定キーワードが入力、編集されたタイミングで更新され、コンテンツカテゴリへの分類のための参照データとして最新の状態が維持される。
[広告情報管理フロー]
図9は、本発明の第1実施形態に係る広告情報を管理する処理を示すフローチャートである。なお、広告情報とは、広告データテーブル(図6)にて記憶される広告に関するデータを示す。
ステップS21では、広告データ受付部16は、広告主による広告データの入力を受け付ける。このとき、広告データ受付部16は、広告データをWebページに配信するための入札キーワードと、配信したくないコンテンツカテゴリであるNGカテゴリの指定を受け付ける。
ステップS22では、広告データ記憶部17は、ステップS21にて受け付けた入札キーワードに基づいて、関連するWebページを検索する。
ステップS23では、広告データ記憶部17は、ステップS22にて検索されたWebページのテキストデータを形態素解析し、フォントやレイアウト等のスタイル情報や、TF・IDF値等の出現頻度に基づいて、Webページに含まれる特徴語を抽出する。
ステップS24では、広告データ記憶部17は、カテゴリ関連度テーブル(図5)に基づいて、ステップS23にて抽出した特徴語と広告カテゴリとのマッチングを行う。具体的には、特徴語と一致または類似する参照キーワードとコンテンツカテゴリとの関連度に基づいて算出する、Webページとコンテンツカテゴリとの関連度が上位のものから所定数を広告カテゴリとして選択する。あるいは、所定以上の関連度を持つコンテンツカテゴリを広告カテゴリとして選択することとしてもよい。
ステップS25では、広告データ記憶部17は、ステップS24にて選択した広告カテゴリがNGカテゴリであるか否かを判定する。この判定がYESの場合は、NGカテゴリの選択を取り止め、ステップS24に戻り、他の広告カテゴリを選択する。一方、この判定がNOの場合はステップS26に移る。なお、NGカテゴリを除外しても選択された広告カテゴリが1以上残っている場合には、他の広告カテゴリを選択しなくてもよい。
ステップS26では、広告データ記憶部17は、ステップS21にて受け付けた広告データを、入札キーワードと、ステップS24〜S25にて選択した広告カテゴリと共に、広告データテーブル(図6)に記憶する。
このように、本実施形態によれば、Webページをコンテンツカテゴリに分類する処理を自動化することで、広告配信のプロセスを省力化でき、また、Webページと広告データとのマッチングの精度が向上する。更に、NGカテゴリの指定を可能とすることで、広告主の意向に近い広告配信が実現できる可能性がある。その結果、広告配信システムの利用価値が高まり、当該システムの利用が促進されることが期待できる。
<第2実施形態>
以下、本発明の第2実施形態について図を参照しながら説明する。本実施形態においては、前述の第1実施形態に加えて、後述のように新たな構成が追加される。なお、第1実施形態と同様の機能については同一の符号を付し、説明を省略する。
図10は、本発明の第2実施形態に係る広告配信サーバ10aの機能を示すブロック図である。参照キーワード選出部51と、入札キーワード選出部52と、優先度算出部53と、が新たに動作することにより、本実施形態の機能を実現する。
参照キーワード選出部51は、関連度算出部15により算出された関連度に基づいて、Webページを分類する1以上のコンテンツカテゴリが決定されると、このコンテンツカテゴリに関連付けられた参照キーワードを選び出してマージする。
入札キーワード選出部52は、Webページが分類された複数のコンテンツカテゴリと一致する広告カテゴリを選択し、この広告カテゴリに関連付けられている広告データについて、それぞれの入札キーワードを選び出してマージする。
優先度算出部53は、参照キーワード選出部51により選び出され、マージされた参照キーワード群と、入札キーワード選出部52により選び出され、マージされた入札キーワード群に含まれる入札キーワードそれぞれとを比較し、広告データの配信優先度を示す各入札キーワードの優先度を算出する。この優先度は、参照キーワード群との類似度に対して、所定の条件に従った重み付けをして算出する。具体的には、広告データ受付部16により広告データおよび入札キーワードを受け付けた際の入札価格に基づいて、この入札価格が高いほど、大きな重み付けを行う。
広告データ配信部18は、優先度算出部53により算出された優先度が高い入札キーワードを所定数、あるいは所定以上の優先度をもつ入札キーワードを抽出し、対応する広告データを送信する。
図11は、本発明の第2実施形態に係る優先度に基づく広告データの抽出例を示す図である。ここで、広告配信対象のWebページは、コンテンツカテゴリA、B、およびCと特定されている。
参照キーワード選出部51は、これらのコンテンツカテゴリA、B、およびCにそれぞれ関連付けられている参照キーワードを選び出して参照キーワード群としてマージする。この例では、各コンテンツカテゴリから参照キーワードを1つずつ選び出しているが、これには限られず、複数の参照キーワードを選び出すこととしてよい。
コンテンツカテゴリA、B、およびCに対応する広告カテゴリA、B、およびCには、それぞれ、入札価格が異なる複数の広告データおよび入札キーワードが関連付けて記憶されている。入札キーワード選出部52は、これらの入札キーワードを、上記の参照キーワード群との比較対象として選び出す。
そして、優先度算出部53により、参照キーワード群と入札キーワードそれぞれとの類似度に対して、入札価格が重み付けされて、入札キーワードの優先度が算出される。具体的には、選び出された入札キーワードのうち、入札価格が高いもの(例えば、100、90、80等)が優先され、この入札キーワードに対応する広告データが配信される可能性が高まる。
図12は、本発明の第2実施形態に係る広告データを配信する処理を示すフローチャートである。
ステップS31からステップS34までは、第1実施形態(図7)と同様であり、出力要求を受け付けたWebページがコンテンツカテゴリに分類され、対応する広告カテゴリおよび関連付けられた広告データが抽出される。
ステップS41では、参照キーワード選出部51は、ステップS34にてWebページが分類された、1以上のコンテンツカテゴリに関連付けられた参照キーワードを選び出す。
ステップS42では、入札キーワード選出部52は、ステップS34にて抽出された広告データと対応付けて記憶されている入札キーワードを、入札価格を示すデータと共に選び出す。
ステップS43では、優先度算出部53は、参照キーワード群と入札キーワードとの類似度に対して、入札価格による重み付けをした広告配信に係る優先度を算出する。そして、優先度の高い所定数の入札キーワードに対応する広告データを選択する。
ステップS36では、広告データ配信部18は、ステップS35にて選択された広告データをコンテンツサーバ20へ送信する。これにより、ステップS31にて受け付けたWebページに関連し、かつ入札価格の高い広告データを配信することができる。
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
10 広告配信サーバ
11 設定キーワード受付部
12 Web検索部
13 参照キーワード抽出部
14 インデックス生成部
15 関連度算出部
16 広告データ受付部
17 広告データ記憶部
18 広告データ配信部
20 コンテンツサーバ
30 端末装置
40 ネットワーク
51 参照キーワード選出部
52 入札キーワード選出部
53 優先度算出部
71 カテゴリDB
72 広告DB
101 制御部
107 記憶部

Claims (10)

  1. コンピュータが、Webページ広告データを付加する方法であって、
    Webページを構成する参照キーワードと、Webページを分類するためのコンテンツカテゴリと、当該参照キーワードと当該コンテンツカテゴリとの関連度と、を関連付けて予め関連度記憶手段に記憶する第1記憶ステップと、
    前記広告データと、入札キーワードと、予め設けられた複数種類の広告カテゴリとを関連付けて広告データ記憶手段に記憶する第2記憶ステップと、
    Webページの出力要求を受け付けたことに応じて、前記関連度記憶手段を参照し、当該Webページに含まれる特徴語と一致又は類似する前記参照キーワードに基づいて、当該Webページと前記コンテンツカテゴリとの関連度を算出する関連度算出ステップと、
    前記関連度算出ステップにおいて算出された前記関連度に基づいて、出力要求が行われた前記Webページ複数のコンテンツカテゴリに分類する分類ステップと、
    前記関連度記憶手段を参照し、前記分類ステップにおいてWebページが分類された複数の前記コンテンツカテゴリに関連付けられた参照キーワードを選び出し1つにマージする参照キーワード選出ステップと、
    前記広告データ記憶手段を参照し、前記分類ステップにおいてWebページが分類された複数の前記コンテンツカテゴリとマッチングした前記広告カテゴリに関連付けられた前記入札キーワードを選び出し1つにマージする入札キーワード選出ステップと、
    マージされた参照キーワード群とマージされた入札キーワード群に含まれる入札キーワードそれぞれとの類似度に対して、所定の条件に従った重み付けをし、当該入札キーワードの優先度を算出する優先度算出ステップと、
    前記優先度算出ステップにおいて算出された優先度が相対的に高い入札キーワードに関連付けられている広告データを選択して、前記出力要求が行われた前記Webページに付加する付加ステップと、を含む方法。
  2. 前記優先度算出ステップにおいて、前記所定の条件として、前記入札キーワードの入札価格が高いほど、大きな重み付けを行うことを特徴とする請求項に記載の方法。
  3. 前記広告データ、入札キーワードと受け付ける入札ステップを更に含み、
    前記第2記憶ステップにおいて、前記入札ステップにおいて受け付けた広告データの入札キーワードと類似する前記参照キーワードに基づいて、当該入札キーワードと前記広告カテゴリとの関連度を算出し、算出された関連度に基づいて当該広告データと前記広告カテゴリとを関連付けることを特徴とする請求項1又は2に記載の方法。
  4. 前記広告データ、入札キーワードと受け付ける入札ステップと、
    前記入札ステップにおいて受け付けた入札キーワードに関連するWebページを検索する検索ステップと、を更に含み、
    前記第2記憶ステップにおいて検索されたWebページに含まれる語と一致又は類似する前記参照キーワードに基づいて、前記広告カテゴリとの関連度を算出し、算出された関連度に基づいて当該広告データと前記広告カテゴリとを関連付けることを特徴とする請求項1又は2に記載の方法。
  5. 前記広告データとの関連付けを避ける広告カテゴリの指定を更に受け付ける指定ステップを更に含み、
    前記第2記憶ステップにおいて、前記入札ステップにおいて受け付けた広告データを、前記指定ステップにより指定されなかった広告カテゴリに関連付けることを特徴とする請求項3又は4に記載の方法。
  6. 前記コンテンツカテゴリに対して、当該コンテンツカテゴリのそれぞれを特徴付ける設定キーワードの入力を受け付ける受付ステップと、
    前記受付ステップにおいて受け付けられた設定キーワードに関連するWebページを検索する第2検索ステップと、
    前記第2検索ステップにおいて検索されたWebページに含まれる前記参照キーワードを抽出する抽出ステップと、
    前記抽出ステップにおいて抽出された前記参照キーワードそれぞれの、前記Webページにおける重要度を示す評価値を算出する評価値算出ステップと、
    前記評価値算出ステップにおいて算出された評価値に基づいて、前記参照キーワードに対する前記コンテンツカテゴリの関連度を示す転置インデックスを生成して記憶するインデックス生成ステップと、を更に含み、
    前記関連度算出ステップは、前記インデックス生成ステップにより生成された転置インデックスを参照し、前記Webページと前記コンテンツカテゴリとの関連度を算出する請求項1から5のいずれかに記載の方法。
  7. 前記評価値算出ステップにおいて、前記Webページに含まれる参照キーワードの出現頻度に関する指標であるTFとIDFとの積に基づいて、前記評価値を算出することを特徴とする請求項に記載の方法。
  8. 前記関連度算出ステップにおいて、語の出現頻度に関する指標であるTFとIDFとの積に基づいて、前記Webページに含まれる特徴語を抽出し、当該抽出された特徴語と類似する前記参照キーワードに基づいて、前記コンテンツカテゴリそれぞれとの関連度を算出することを特徴とする請求項1からのいずれかに記載の方法。
  9. Webページに広告データを付加するサーバであって、
    Webページを構成する参照キーワードと、Webページを分類するためのコンテンツカテゴリと、当該参照キーワードと当該コンテンツカテゴリとの関連度と、を関連付けて予め記憶する関連度記憶手段と、
    前記広告データと、入札キーワードと、予め設けられた複数種類の広告カテゴリとを関連付けて記憶する広告データ記憶手段と、
    Webページの出力要求を受け付けたことに応じて、前記関連度記憶手段を参照し、当該Webページに含まれる特徴語と一致又は類似する前記参照キーワードに基づいて、当該Webページと前記コンテンツカテゴリとの関連度を算出する関連度算出手段と、
    前記関連度算出手段により算出された前記関連度に基づいて、出力要求が行われた前記Webページ複数のコンテンツカテゴリに分類する分類手段と、
    前記関連度記憶手段を参照し、前記分類手段によりWebページが分類された複数の前記コンテンツカテゴリに関連付けられた参照キーワードを選び出し1つにマージする参照キーワード選出手段と、
    前記広告データ記憶手段を参照し、前記分類手段によりWebページが分類された複数の前記コンテンツカテゴリとマッチングした前記広告カテゴリに関連付けられた前記入札キーワードを選び出し1つにマージする入札キーワード選出手段と、
    マージされた参照キーワード群とマージされた入札キーワード群に含まれる入札キーワードそれぞれとの類似度に対して、所定の条件に従った重み付けをし、当該入札キーワードの優先度を算出する優先度算出手段と、
    前記優先度算出手段において算出された優先度が相対的に高い入札キーワードに関連付けられている広告データを選択して、前記出力要求が行われた前記Webページに付加する付加手段と、を備えるサーバ。
  10. Webページ広告データを付加するプログラムであって、
    Webページを構成する参照キーワードと、Webページを分類するためのコンテンツカテゴリと、当該参照キーワードと当該コンテンツカテゴリとの関連度と、を関連付けて予め関連度記憶手段に記憶する第1記憶ステップと、
    前記広告データと、入札キーワードと、予め設けられた複数種類の広告カテゴリとを関連付けて広告データ記憶手段に記憶する第2記憶ステップと、
    Webページの出力要求を受け付けたことに応じて、前記関連度記憶手段を参照し、当該Webページに含まれる特徴語と一致又は類似する前記参照キーワードに基づいて、当該Webページと前記コンテンツカテゴリとの関連度を算出する関連度算出ステップと、
    前記関連度算出ステップにおいて算出された前記関連度に基づいて、出力要求が行われた前記Webページ複数のコンテンツカテゴリに分類する分類ステップと、
    前記関連度記憶手段を参照し、前記分類ステップにおいてWebページが分類された複数の前記コンテンツカテゴリに関連付けられた参照キーワードを選び出し1つにマージする参照キーワード選出ステップと、
    前記広告データ記憶手段を参照し、前記分類ステップにおいてWebページが分類された複数の前記コンテンツカテゴリとマッチングした前記広告カテゴリに関連付けられた前記入札キーワードを選び出し1つにマージする入札キーワード選出ステップと、
    マージされた参照キーワード群とマージされた入札キーワード群に含まれる入札キーワードそれぞれとの類似度に対して、所定の条件に従った重み付けをし、当該入札キーワードの優先度を算出する優先度算出ステップと、
    前記優先度算出ステップにおいて算出された優先度が相対的に高い入札キーワードに関連付けられている広告データを選択して、前記出力要求が行われた前記Webページに付加する付加ステップと、をコンピュータに実行させるプログラム。
JP2009020530A 2008-04-01 2009-01-30 コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム Active JP4962986B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009020530A JP4962986B2 (ja) 2008-04-01 2009-01-30 コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008094809 2008-04-01
JP2008094809 2008-04-01
JP2009020530A JP4962986B2 (ja) 2008-04-01 2009-01-30 コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム

Publications (2)

Publication Number Publication Date
JP2009266204A JP2009266204A (ja) 2009-11-12
JP4962986B2 true JP4962986B2 (ja) 2012-06-27

Family

ID=41391913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009020530A Active JP4962986B2 (ja) 2008-04-01 2009-01-30 コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム

Country Status (1)

Country Link
JP (1) JP4962986B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5165021B2 (ja) * 2010-05-11 2013-03-21 ヤフー株式会社 カテゴリ処理装置及び方法
JP5130340B2 (ja) * 2010-10-26 2013-01-30 ヤフー株式会社 情報選択装置、方法及びプログラム
JP5281105B2 (ja) * 2011-02-28 2013-09-04 楽天株式会社 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体
JP5281104B2 (ja) * 2011-02-28 2013-09-04 楽天株式会社 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体
KR101344911B1 (ko) 2011-07-05 2013-12-26 네이버 주식회사 클라우드 기반의 클립보드에 저장된 문서를 페이스트 가능한 서비스를 표시하는 문서 연결 시스템 및 방법
CN102880969A (zh) * 2011-07-13 2013-01-16 阿里巴巴集团控股有限公司 广告投放方法、广告投放服务器及广告投放系统
JP5814772B2 (ja) * 2011-12-15 2015-11-17 ヤフー株式会社 広告決定システム、広告決定方法およびプログラム
CN103324633A (zh) * 2012-03-22 2013-09-25 阿里巴巴集团控股有限公司 一种信息发布方法及装置
JP2013210448A (ja) * 2012-03-30 2013-10-10 Denso It Laboratory Inc 情報提供システム
JP5530476B2 (ja) * 2012-03-30 2014-06-25 株式会社Ubic 文書分別システム及び文書分別方法並びに文書分別プログラム
JP6560705B2 (ja) * 2017-03-23 2019-08-14 Necパーソナルコンピュータ株式会社 広告付与装置、広告付与方法、及び広告付与プログラム
JP6629268B2 (ja) * 2017-07-20 2020-01-15 Necパーソナルコンピュータ株式会社 広告付与装置、広告付与方法、及び広告付与プログラム
CN107609916A (zh) * 2017-09-28 2018-01-19 武汉斗鱼网络科技有限公司 一种推送广告信息的方法、装置及计算机设备
JPWO2022208706A1 (ja) * 2021-03-31 2022-10-06
CN113192605A (zh) * 2021-04-13 2021-07-30 复旦大学附属中山医院 医学影像的分类方法、医学影像的检索方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245061A (ja) * 2001-02-14 2002-08-30 Seiko Epson Corp キーワード抽出
JP4755834B2 (ja) * 2005-01-21 2011-08-24 ヤフー株式会社 属性評価装置、属性評価方法および属性評価プログラム
JP2009521736A (ja) * 2005-11-07 2009-06-04 スキャンスカウト,インコーポレイテッド リッチメディアと共に広告をレンダリングするための技術
JP2007272814A (ja) * 2006-03-31 2007-10-18 Cyber Wing Corp 広告配信システム、広告配信方法及び広告配信プログラム
JP2008040613A (ja) * 2006-08-02 2008-02-21 Komu Square:Kk 広告方法、広告プログラム及び広告システム

Also Published As

Publication number Publication date
JP2009266204A (ja) 2009-11-12

Similar Documents

Publication Publication Date Title
JP4962986B2 (ja) コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム
US8386469B2 (en) Method and system for determining relevant sources, querying and merging results from multiple content sources
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
US20170116200A1 (en) Trust propagation through both explicit and implicit social networks
US8099423B2 (en) Hierarchical metadata generator for retrieval systems
JP4934169B2 (ja) カテゴリを対応付けする装置、方法、およびプログラム
US7769771B2 (en) Searching a document using relevance feedback
CN105765573B (zh) 网站通信量优化方面的改进
US20160042274A1 (en) Knowledge automation system adaptive feedback
US20090287676A1 (en) Search results with word or phrase index
US20050222989A1 (en) Results based personalization of advertisements in a search engine
US20120303444A1 (en) Semantic advertising selection from lateral concepts and topics
US20090043749A1 (en) Extracting query intent from query logs
US20130024448A1 (en) Ranking search results using feature score distributions
US20120150861A1 (en) Highlighting known answers in search results
US20060173822A1 (en) System and method for optimization of results based on monetization intent
JP2008507041A (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US20110302149A1 (en) Identifying dominant concepts across multiple sources
JP2014132493A (ja) 格納されたクエリ情報を使用したコンテンツの提供
US11995090B2 (en) Techniques for determining relevant electronic content in response to queries
US20200278989A1 (en) Information processing apparatus and non-transitory computer readable medium
JP4375626B2 (ja) カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法
JP5226241B2 (ja) タグを付与する方法
JP2010061420A (ja) 商品情報検索装置、方法及びシステム
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120319

R150 Certificate of patent or registration of utility model

Ref document number: 4962986

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250