JP6228425B2 - 広告生成装置および広告生成方法 - Google Patents
広告生成装置および広告生成方法 Download PDFInfo
- Publication number
- JP6228425B2 JP6228425B2 JP2013222606A JP2013222606A JP6228425B2 JP 6228425 B2 JP6228425 B2 JP 6228425B2 JP 2013222606 A JP2013222606 A JP 2013222606A JP 2013222606 A JP2013222606 A JP 2013222606A JP 6228425 B2 JP6228425 B2 JP 6228425B2
- Authority
- JP
- Japan
- Prior art keywords
- advertisement
- information
- word
- feature
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
記事データ:広告の付与対象となるテキスト情報であり、処理を行う際に意味を持った一つの単位を示す。
ジャンル:記事データのうち、似た話題を扱うものの分類であり、いわゆる記事ジャンルを示す。
カテゴリ:広告として表示する広告コンテンツ(広告情報)の分類であり、いわゆる広告カテゴリを示す。
図1は、第1実施形態における広告生成装置である広告生成サーバ1に備わる機能要素のうち、本実施形態に特に関連するものの機能ブロック図を示す。図1における広告生成サーバ1は、特徴語抽出部101(特徴語抽出手段)、検索順序決定部102(特徴度算出手段、検索順序決定手段)、検索部103(検索手段)、情報選択部104(情報選択手段)、情報抽出部105、配信部106、辞書データ格納部107、および配信情報格納部108を少なくとも有する。辞書データ格納部107は、NGワード辞書107a(NG単語テーブル)、ストップワード辞書107b(ストップワード記憶手段)、カテゴリ辞書107c(カテゴリテーブル)、およびジャンル対応テーブル107dを含んでいる。また、配信情報格納部108は、記事管理テーブル108aおよび広告管理テーブル108b(広告情報管理テーブル)を含んでいる。以下、図1に示す機能ブロック図に基づいて、各機能ブロックを説明する。
ここで、idfiは単語iのIDF値、|D|はドキュメントの総数、d∋tiは単語iを含むドキュメントの総数を指し、珍しい単語ほど大きな値になる。
ここで、jは素性、xjはスコアに使用する素性の値、wjは各素性jの重み係数を表す。本実施形態においては、素性jは、一の特徴語における全ユーザによる検索回数の度合い(対数で表す)、記事データ内における出現位置(タイトル部分か本文部分か、または本文部分の前半か、後半かなど)、単語が人名かどうか(0もしくは1)、特徴度(単語の偏り度合い)およびIDF値である。重み係数はあらかじめ素性に応じて設定されているものとする。
複数のジャンルがある場合は全てジャンルについて式(4)の値を求める。単語xが全てのジャンルに均等に出現するほど式(4)の値は0に近くなる。本実施形態においては、ある単語xの各ジャンルに対する相互情報量の最大値をその単語xの特徴度とする。
検索部103は、この決定された順序の特徴語を用いて、広告コンテンツのインデックス情報を持つ検索エンジンに問い合わせを行う。検索部103は、検索結果として複数の広告コンテンツを取得し、情報選択部104は、取得された複数の広告コンテンツから、広告配信の対象とする広告情報を選択する。これにより、記事データにあった広告コンテンツを選択することができるという効果を奏する。特に、特徴語における検索サービス上での検索回数や、文書情報における出現位置に応じた順番で、検索することで、出現頻度は低いにもかかわらず重要な特徴語を優先的に検索に用いることができ、より納得感の高い広告情報を選択することができる、という効果を得ることができる。
つぎに、第2実施形態に係る広告生成サーバ1aについて説明する。この第2実施形態における広告生成サーバ1aは、それぞれジャンルに分類された記事データ、およびカテゴリに分類された広告のそれぞれに出現する単語の分布から、ストップワード辞書107b、カテゴリ辞書107c、およびジャンル対応テーブル107dのそれぞれのレコードを生成して登録する。
複数のジャンルがある場合は全てジャンルについて式(4)の値を求める。単語xが全てのジャンルに均等に出現するほど式(4)の値は0に近くなる。本実施形態においては、ある単語xの全ジャンルに対する相互情報量の最大値をその単語のジャンル特徴度とする。
類似度が所定の閾値を超えるジャンルおよびカテゴリの組み合わせのみをジャンル対応テーブル107dに追加することで、概念的に近いカテゴリのみを広告として提示することが可能となる。これら語彙ベクトルをすべてのジャンル・カテゴリに対して生成して、類似度を算出することで、概念的に近いジャンルとカテゴリとの組み合わせを求めることができる。
つぎに、第3実施形態に係る広告生成サーバ1bについて説明する。この第3実施形態に係る広告生成サーバ1bにおいて、履歴情報解析部113は、配信された広告コンテンツ、およびクリックされた広告コンテンツを解析し、効果の低い広告コンテンツを表示させなくすることができる。これによって、広告の精度を向上させる。
つぎに、第4実施形態に係る広告生成サーバ1cについて説明する。図15は、第4実施形態の広告生成サーバ1cの機能を示すブロック図である。この広告生成サーバ1cは、第1実施形態の広告生成サーバ1の機能とほぼ同様の構成をとるものであり、特徴語抽出部101a(特徴語抽出手段)のみが相違する。
ここで、|X∪Y|は集合Xと集合Yとの少なくともいずれか一方に含まれる文書の数、|X∩Y|は集合Xと集合Yとの両方に含まれる文書の数を表す。
により与えられる。
上述第1実施形態から第4実施形態における広告生成サーバ1〜広告生成サーバ1cのハードウェア構成について説明する。図18は、上述広告生成サーバ1〜広告生成サーバ1cのハードウェア構成図である。広告生成サーバ1〜広告生成サーバ1cのそれぞれは、物理的には、図18に示すように、一または複数のCPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスクまたは半導体メモリ等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図1等の各機能ブロック図における各機能は、図18に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。
Claims (9)
- 入力した文書情報を単語分割して得られた複数の単語のそれぞれの、文書情報のジャンルを示す各文書ジャンルのいずれかにおける特徴語の出現の偏り度合いを示す特徴度を特徴語ごとに算出する特徴度算出手段と、
入力した文書情報を単語分割して得られた複数の単語から、当該文書情報を特徴付ける単語を特徴語として抽出する特徴語抽出手段と、
前記特徴語抽出手段により抽出された特徴語を、前記特徴度算出手段により算出された特徴度に基づいて定められた順序に並び替える検索順序決定手段と、
前記検索順序決定手段により決定された順序の特徴語で、広告情報のインデックス情報を持つ検索エンジンに問い合わせを行い、検索結果として複数の広告情報を取得する検索手段と、
前記検索手段により取得された複数の広告情報から、広告配信の対象とする広告情報を選択する情報選択手段と、
文書情報のジャンルを示す文書ジャンルと、広告情報のカテゴリを示す広告カテゴリとを対応付けたジャンル対応テーブルと、を備え、
前記検索手段により検索された検索結果に含まれる広告情報は、その広告カテゴリを含んでおり、
前記情報選択手段は、前記ジャンル対応テーブルに従って、前記入力された文書情報の文書ジャンルに対応する広告カテゴリに属する広告情報を、前記取得された検索結果から選択する、
広告生成装置。 - 広告情報のカテゴリを示す広告カテゴリを単語と対応付けたカテゴリテーブルをさらに備え、
前記検索手段は、前記特徴語抽出手段により抽出された特徴語に一致する単語が、前記カテゴリテーブルに記述されている場合、当該単語に対応付けられた広告カテゴリに絞り込んだ検索処理を実行する、請求項1に記載の広告生成装置。 - 広告情報を検索取得対象から除外するためのNG単語を記憶するNG単語テーブルをさらに備え、
前記情報選択手段は、前記取得された検索結果から、前記NG単語テーブルに記憶されているNG単語を含んでいる広告情報を除去する、請求項1または2に記載の広告生成装置。 - 前記特徴語抽出手段は、
入力した文書情報を単語分割して得られた複数の単語を、事前定義されたルールに従って連結して、特徴語を生成する、請求項1から3のいずれか一項に記載の広告生成装置。 - 前記特徴度算出手段により算出された単語のそれぞれの出現度合いに基づいて、特徴的ではない単語を記憶するストップワード記憶手段と、
を備え、
前記特徴語抽出手段は、前記ストップワード記憶手段に記憶されている単語に一致する特徴語を、抽出した特徴語から除去する、請求項1から4のいずれか一項に記載の広告生成装置。 - 広告情報の付与対象となる文書情報の文書ジャンルと、広告情報の広告カテゴリとの全ての組み合わせに対して、文書ジャンルに属する全文書情報に基づいた語彙ベクトルと広告カテゴリに属する全広告情報に基づいた語彙ベクトルとに基づいて文書ジャンルと広告カテゴリとの類似度を算出し、所定の類似度を有する文書ジャンルと広告カテゴリとの組み合わせを、前記ジャンル対応テーブルに追加するジャンル対応解析手段をさらに備える、
請求項1から5のいずれか一項に記載の広告生成装置。 - 前記情報選択手段により選択された広告情報と、当該広告情報に対する検索時に用いられた特徴語とを記憶する広告情報管理テーブルと、
配信された広告情報を特定するための特定情報と、当該配信された広告情報のうちクリックされた広告情報を特定するための特定情報とを記憶する履歴テーブルと、
前記履歴テーブルに基づいて、各広告情報のクリック履歴を解析する履歴情報解析手段と、
をさらに備え、
前記特徴語抽出手段は、前記履歴テーブルおよび前記広告情報管理テーブルに従って、クリック率の低い広告情報に対応する特徴語を、抽出した特徴語から除外する、請求項1から6のいずれか一項に記載の広告生成装置。 - 前記特徴語抽出手段は、
端末の画面に表示される表示情報と、当該表示情報における所定のリンク情報を操作することにより表示される非表示情報とからなる文書情報に対して、
前記表示情報に含まれる特徴語と、前記非表示情報に含まれる特徴語との共起度を算出し、
あらかじめ定めた順位以上の共起度を有する特徴語を非表示情報から抽出する、請求項1から7のいずれか一項に記載の広告生成装置。 - 広告情報のインデックス情報を持つ検索エンジンに問い合わせを行い、検索結果として複数の広告情報を取得する広告生成装置における広告生成方法において、
入力した文書情報を単語分割して得られた複数の単語のそれぞれの、文書情報のジャンルを示す各文書ジャンルのいずれかにおける特徴語の出現の偏り度合いを示す特徴度を算出する特徴度算出ステップと、
入力した文書情報を単語分割して得られた複数の単語から、当該文書情報を特徴付ける単語を特徴語として抽出する特徴語抽出ステップと、
前記特徴語抽出ステップにより抽出された特徴語を、前記特徴度算出ステップにより算出された特徴度に基づいて定められた順序に並び替える検索順序決定ステップと、
前記検索順序決定ステップにより決定された順序の特徴語で、広告情報のインデックス情報を持つ検索エンジンに問い合わせを行い、検索結果として複数の広告情報を取得する検索ステップと、
前記検索ステップにより取得された複数の広告情報から、広告配信の対象とする広告情報を選択する情報選択ステップと、を備え、
前記検索ステップにより検索された検索結果に含まれる広告情報には、その広告カテゴリが含まれており、
前記情報選択ステップでは、文書情報のジャンルを示す文書ジャンルと広告情報のカテゴリを示す広告カテゴリとを対応付けたジャンル対応テーブルに従って、前記入力された文書情報の文書ジャンルに対応する広告カテゴリに属する広告情報が、前記取得された検索結果から選択される、
広告生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013222606A JP6228425B2 (ja) | 2013-10-25 | 2013-10-25 | 広告生成装置および広告生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013222606A JP6228425B2 (ja) | 2013-10-25 | 2013-10-25 | 広告生成装置および広告生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015084178A JP2015084178A (ja) | 2015-04-30 |
JP6228425B2 true JP6228425B2 (ja) | 2017-11-08 |
Family
ID=53047746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013222606A Active JP6228425B2 (ja) | 2013-10-25 | 2013-10-25 | 広告生成装置および広告生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6228425B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5993068B1 (ja) * | 2015-07-16 | 2016-09-14 | ヤフー株式会社 | 選択装置、選択方法、選択プログラム、端末装置、及び表示プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100792698B1 (ko) * | 2006-03-14 | 2008-01-08 | 엔에이치엔(주) | 시드를 이용한 광고 매칭 방법 및 광고 매칭 시스템 |
JP5311378B2 (ja) * | 2008-06-26 | 2013-10-09 | 国立大学法人京都大学 | 特徴語自動学習システム、コンテンツ連動型広告配信コンピュータシステム、検索連動型広告配信コンピュータシステム、およびテキスト分類コンピュータシステム、並びにこれらのコンピュータプログラムおよび方法 |
JP2011529600A (ja) * | 2008-07-29 | 2011-12-08 | テキストワイズ・リミテッド・ライアビリティ・カンパニー | 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置 |
JP4809403B2 (ja) * | 2008-08-01 | 2011-11-09 | ヤフー株式会社 | 広告配信装置、広告配信方法、及び広告配信制御プログラム |
US20110264507A1 (en) * | 2010-04-27 | 2011-10-27 | Microsoft Corporation | Facilitating keyword extraction for advertisement selection |
JP5225425B2 (ja) * | 2011-04-26 | 2013-07-03 | ヤフー株式会社 | 広告処理装置及び方法 |
-
2013
- 2013-10-25 JP JP2013222606A patent/JP6228425B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015084178A (ja) | 2015-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101171405B1 (ko) | 검색 결과에서 배치 내용 정렬의 맞춤화 | |
US8321278B2 (en) | Targeted advertisements based on user profiles and page profile | |
US8768922B2 (en) | Ad retrieval for user search on social network sites | |
US8782037B1 (en) | System and method for mark-up language document rank analysis | |
US20140278939A1 (en) | Advertisement extraction device and advertisement extraction method | |
US8122049B2 (en) | Advertising service based on content and user log mining | |
US20120303444A1 (en) | Semantic advertising selection from lateral concepts and topics | |
US20090287676A1 (en) | Search results with word or phrase index | |
US20120158693A1 (en) | Method and system for generating web pages for topics unassociated with a dominant url | |
US20090249229A1 (en) | System and method for display of relevant web page images | |
KR101355945B1 (ko) | 온라인 문맥기반 광고 장치 및 방법 | |
WO2008094289A2 (en) | A method of choosing advertisements to be shown to a search engine user | |
TWI417751B (zh) | Information providing device, information providing method, information application program, and information recording medium | |
TWI399657B (zh) | A provider, a method of providing information, a program, and an information recording medium | |
JP6228425B2 (ja) | 広告生成装置および広告生成方法 | |
US8510289B1 (en) | Systems and methods for detecting commercial queries | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
JP5903370B2 (ja) | 情報検索装置、情報検索方法、及びプログラム | |
JP5068304B2 (ja) | 抽出装置、方法及びプログラム | |
TW201908993A (zh) | 網站閱讀者之興趣喜好程度之分析方法 | |
US20210295371A1 (en) | Advanced search engine for business | |
AU2011204929B2 (en) | Ranking blog documents | |
Kidambi et al. | Performance of Annotation-Based Image Retrieval | |
CN110737851A (zh) | 超链的语义化方法、装置、设备及计算机可读存储介质 | |
EP2245553A1 (en) | Method to search for a user generated content web page |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170919 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6228425 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |