JP5372990B2 - 広告処理装置及び方法 - Google Patents
広告処理装置及び方法 Download PDFInfo
- Publication number
- JP5372990B2 JP5372990B2 JP2011097705A JP2011097705A JP5372990B2 JP 5372990 B2 JP5372990 B2 JP 5372990B2 JP 2011097705 A JP2011097705 A JP 2011097705A JP 2011097705 A JP2011097705 A JP 2011097705A JP 5372990 B2 JP5372990 B2 JP 5372990B2
- Authority
- JP
- Japan
- Prior art keywords
- parts
- analysis target
- block
- advertisement
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000004458 analytical method Methods 0.000 claims abstract description 49
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 239000000284 extract Substances 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 11
- 230000000007 visual effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 235000012813 breadcrumbs Nutrition 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本実施形態は、図1(構成図)に示すように、端末Tへ広告を配信する広告処理装置1(「本装置」又は「本装置1」とも呼ぶ)に関するものである。本装置1は、ウェブサーバWが提供するウェブページの内容に応じた広告を端末Tに配信するものであるが、配信の機能は別のサーバなどに持たせ、本装置は、広告を選択する機能だけを持つように構成してもよい。
上記のように構成した本装置1について動作の概要を図3のフローチャートに示す。すなわち、分割手段20が、解析対象コンテンツすなわち対象ページを複数の部分に分割し(ステップS2)、キーワード抽出手段30が、分割された部分ごとのキーワードを抽出する(ステップS3)。キーワードの抽出は、形態素解析やtf−idfによる特徴語の抽出など公知の任意の言語処理技術を用いて行う。
上記のように対象ページを部分に分割する基準や手法は自由であるが、いくつかの例を挙げる。
〔3−1.概念階層による分割〕
まず、上位概念的な語の多い部分と、下位概念的な語の多い部分への分割が考えられる。この場合、分割手段20は、語の概念階層関係を予めデータで表したシソーラス辞書に基づいて、対象ページ内の語を相対的な上位概念と相対的な下位概念に位置付け、相対的な上位概念の割合又は相対的な下位概念の割合の少なくとも一方が所定以上又は所定以下となる範囲をそれぞれ前記部分とすることにより対象ページを分割する。シソーラス辞書については従来公知のものでよいので省略する。
また、ウェブ画面上での表示位置のまとまりでの分割が考えられる。この場合、分割手段20は、対象ページとしてマークアップ記述された構成要素ごとに画面上での表示位置をウェブブラウザから取得し、その表示位置に基づいて画面を縦又は横の少なくとも一方に分割するように構成要素をクラスタリング処理などでグループ化することにより対象ページを部分に分割する。
Var t = document.getElementById("HTMLタグ上に記述されたID");
このtを用い、タグの表示領域の高さを取得(tに対して):
t.scrollHeight
タグの表示領域の幅を取得(tに対して):
t.scrollWidth
また、タグの画面上のブラウザ左上からの見た目のx座標を取得:
t.clientX
タグの画面上のブラウザ左上からの見た目のy座標を取得:
t.clientY
t.childNodes[X]
あるタグの直下のタグの個数を取得:
t.childNodes.length
あるタグのYスタイル情報を取得:
t.style[Y]
あるプラグインプログラムを取得:
Var f = window.[HTMLタグ上に記述されたID];
プラグインプログラム上の関数Zを呼び出し:
f.z(引数1,引数2,...);
プラグインプログラム側から呼び出し関数Zを設定:
ExternalInterface.addCallback("関数名",呼び出し関数);
さらに、予め判明しているタグに基づく分割も考えられる。この場合、分割手段20は、対象ページのマークアップ記述から所定のタグを検出し、そのタグを基に対象ページを部分に分割する。例えば、HTMLタグであるページを、ブレッドクラム(図4上部に示すいわゆる「パンくずリスト」)の部分P1と、それ以外のコンテンツ本体の部分に、両者間の境界に配置されていることが予め判明しているハイパーリンクや表示文字列(例えば図4内の「掲載案件」)などのタグで、分割するなどが考えられる。なお、ここでいう所定のタグは、ブロック要素を定義するタグ(「ブロックタグ」と呼ぶこととする)に限らず、文字列の表示やそのスタイルの定義など自由である。
加えて、構成要素の種類に基づく分割も考えられる。この場合、分割手段20は、対象ページのマークアップ記述からブロック要素を抽出し、そのブロック要素ごとの画面上での表示位置を取得し、それら表示位置の共通性に基づいてブロック要素をグループ化することにより対象ページを部分に分割する。部分を構成するブロック要素は一つでも複数でもよい。
また、部分への分割を段階的に行うことも可能で、その処理手順を図6のフローチャートに例示する。この場合、最初は対象ページの全体を対象範囲とし(ステップS1)、対象範囲を縦半分や横半分などに(ここでは上下二分割とする)分割手段20が分割し(ステップS2X)、キーワード抽出(ステップS3)、広告配信(ステップS4)、指標値の取得(ステップS5)を行う。そのうえで、分割された部分のうち指標取得手段50による指標値が優れた部分を採用すなわち選択して(ステップS61)、その優れた部分の指標値を前回値として記憶したうえ(ステップS64)、対応する部分をさらに分割の対象とする(ステップS2X)。
先述した表示位置による分割及びブロック要素による分割を併せ、より具体的な例を示す。この例は、対象ページを、部分であるブロックに分割するもので、この例において分割手段20は、図1に示すように、対象ページを表すHTMLなどのマークアップデータ内から、ブロック要素として定義されている所定のブロックタグで記述されているブロックタグ要素を検出するタグ要素検出手段21と、検出された前記各ブロックタグ要素について、ウェブページの表示領域におけるX軸方向の各絶対座標を算出する座標算出手段22と、算出された前記各絶対座標のうち所定以上の頻出度をもつ各座標を各基準軸座標として取得する基準軸取得手段23と、取得された前記各基準軸座標と、算出された前記各絶対座標が一致する各ブロックタグ要素群を、それぞれブロックの全部又は一部として区分する座標区分手段24と、シミュレーション用のウェブブラウザBと、を有する。
そして、まず、分割手段20は、ウェブブラウザBに、アクセス先URLのウェブページデータをウェブサーバWから受信し、画面に表示する処理を行わせる。なお、この処理は、画面に表示する場合と同じ処理をメモリ上等で内部的に行えば足り、現実の画面表示は不要である。ここで、ウェブページデータは、マークアップデータとスタイルシートデータを識別IDで関連付けたもので、必要な画像などのファイルを含む。
すなわち、本装置1では、分割手段20(図1)が、与えられたウェブページデータのHTMLを、ブラウザ表示において矩形の要素群を構成する単位であるブロックすなわちブロック要素に区分する。
なお、ブロック要素として定義されている上記のようなタグが、ページ上の視覚的ブロック要素と必ず対応するかは、ウェブページの作り方によるので、タグ検出状態に応じて自動的に又は所定の要求操作に応じ、視覚的ブロック要素を認識させることも可能である。
「
Var height = 対象要素オブジェクト.offsetHeight;
Var width = 対象要素オブジェクト.offsetWidth;
」
のように用いて取得可能である。
なお、上記実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、本出願における構成図、データの図、フローチャートなどは例示に過ぎず、各要素の有無、その配置や処理実行などの順序、具体的内容などは適宜変更可能である。一例として、上記実施形態では、本装置1は広告を配信する手段として選択配信手段40を含むものとしたが、広告の引当てのみを行う構成としてもよい。また、広告については、文字広告に限らずバナー広告など画像や動画の広告でもよい。さらに、広告は、ウェブサーバWを経由せずユーザの端末T1で解釈表示されるHTML記述などに基づいて本装置1から端末Tへ直接配信するようにしてもよい。
6 演算制御部
7 記憶装置
8 通信手段
15 コンテンツ記憶手段
20 分割手段
21 タグ要素検出手段
22 座標算出手段
23 基準軸取得手段
24 座標区分手段
25 分割部分記憶手段
30 キーワード抽出手段
35 広告記憶手段
40 選択配信手段
50 指標取得手段
55 指標記憶手段
60 部分決定手段
a1〜a9,b1〜b5,c1〜c8 要素
B ウェブブラウザ
L,LX 部分
N 通信ネットワーク
P1,P2 部分
R 部分
T 端末
V0,V1,H1,H2 位置
W ウェブサーバ
Xa,Xb,Xc 基準軸座標
Yc11,Yc22,Yc31,Yc62 軸
Claims (8)
- 解析対象コンテンツを複数の部分に分割する分割手段と、
分割された前記部分ごとのキーワードを抽出するキーワード抽出手段と、
前記部分ごとに、抽出された前記キーワードに基づく広告の選択及び配信を複数回行う選択配信手段と、
前記部分ごとに、複数回行われた広告の前記配信の成果を表す所定の指標値を取得する指標取得手段と、
分割された前記部分のうち、取得された前記指標値に基づいて解析対象部分を決定する部分決定手段と、
を有することを特徴とする広告処理装置。 - 前記解析対象コンテンツを前記分割手段が分割し、
分割された部分のうち前記指標取得手段による前記指標値が優れた部分を採用してさらに前記の分割の対象とし、
前記部分決定手段は、二度目またはそれ以降に分割された部分のうち優れた部分の指標値が分割前の部分の指標値を下回った時点でその分割前の部分を最適な解析対象部分として決定する
ことを特徴とする請求項1記載の広告処理装置。 - 前記分割手段は、語の概念階層関係をデータで表したシソーラス辞書に基づいて、前記解析対象コンテンツ内の語を相対的な上位概念と相対的な下位概念に位置付け、相対的な上位概念の割合又は相対的な下位概念の割合の少なくとも一方が所定以上又は所定以下となる範囲をそれぞれ前記部分とすることにより前記解析対象コンテンツを分割することを特徴とする請求項1又は2記載の広告処理装置。
- 前記分割手段は、前記解析対象コンテンツとしてマークアップ記述された構成要素ごとに画面上での表示位置を取得し、その表示位置に基づいて画面を縦又は横の少なくとも一方に分割するように構成要素をグループ化することにより前記解析対象コンテンツを部分に分割することを特徴とする請求項1から3のいずれか一項に記載の広告処理装置。
- 前記分割手段は、前記解析対象コンテンツのマークアップ記述から所定のタグを検出し、そのタグを基に解析対象コンテンツを前記部分に分割することを特徴とする請求項1から4のいずれか一項に記載の広告処理装置。
- 前記分割手段は、前記解析対象コンテンツのマークアップ記述からブロック要素を抽出し、そのブロック要素ごとの画面上での表示位置を取得し、それら表示位置の共通性に基づいてブロック要素をグループ化することにより前記解析対象コンテンツを部分に分割することを特徴とする請求項1から5のいずれか一項に記載の広告処理装置。
- 前記分割手段は、
前記解析対象コンテンツの前記マークアップ記述から、ブロック要素として定義されている所定のタグで記述されているブロックタグ要素を検出するタグ要素検出手段と、
検出された前記各ブロックタグ要素について、ウェブページの表示領域におけるX軸方向の各絶対座標を算出する座標算出手段と、
算出された前記各絶対座標のうち所定以上の頻出度をもつ各座標を各基準軸座標として取得する基準軸取得手段と、
取得された前記各基準軸座標と、算出された前記各絶対座標が一致する各ブロックタグ要素群を、それぞれブロックの全部又は一部として区分する座標区分手段と、
を有することを特徴とする請求項1から6のいずれか一項に記載の広告処理装置。 - 解析対象コンテンツを複数の部分に分割する分割処理と、
分割された前記部分ごとのキーワードを抽出するキーワード抽出処理と、
前記部分ごとに、抽出された前記キーワードに基づく広告の選択及び配信を複数回行う選択配信処理と、
前記部分ごとに、複数回行われた広告の前記配信の成果を表す所定の指標値を取得する指標取得処理と、
分割された前記部分のうち、取得された前記指標値に基づいて解析対象部分を決定する部分決定処理と、
をコンピュータが実行することを特徴とする広告処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011097705A JP5372990B2 (ja) | 2011-04-26 | 2011-04-26 | 広告処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011097705A JP5372990B2 (ja) | 2011-04-26 | 2011-04-26 | 広告処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012230509A JP2012230509A (ja) | 2012-11-22 |
JP5372990B2 true JP5372990B2 (ja) | 2013-12-18 |
Family
ID=47432012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011097705A Active JP5372990B2 (ja) | 2011-04-26 | 2011-04-26 | 広告処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5372990B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11205195B2 (en) * | 2013-03-29 | 2021-12-21 | Rakuten Group, Inc. | Information processing device, information processing method, and information processing program |
CN106202098A (zh) * | 2015-05-05 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 记录及还原网页中点击位置的方法和装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11306237A (ja) * | 1998-04-24 | 1999-11-05 | Takashi Sasaki | ゲーム用サーバ装置および仮想生活空間を利用したマーケティングデータ取得方法ならびに情報記録媒体 |
JP2000331020A (ja) * | 1999-05-21 | 2000-11-30 | Nippon Telegr & Teleph Corp <Ntt> | 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体 |
JP2002074175A (ja) * | 2000-09-05 | 2002-03-15 | Dentsu Inc | 情報コンテンツ及び広告を含む蓄積情報を表示する方法、媒体、及びこれを利用した情報表示装置 |
JP2007286833A (ja) * | 2006-04-14 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | 広告配信システムおよび広告配信プログラム |
JP2008241943A (ja) * | 2007-03-26 | 2008-10-09 | Cross Feed Co Ltd | 広告配信装置およびその方法 |
JP4834042B2 (ja) * | 2008-08-06 | 2011-12-07 | ヤフー株式会社 | ユーザ作成コンテンツ管理装置、ユーザ作成コンテンツ管理システムおよび閲覧者の嗜好調査方法 |
US20110231254A1 (en) * | 2008-09-05 | 2011-09-22 | Nhn Business Platform Corporation | Method and system for providing advertisements, and computer-readable recording medium |
-
2011
- 2011-04-26 JP JP2011097705A patent/JP5372990B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012230509A (ja) | 2012-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102779167B (zh) | 在移动终端中显示网页的方法及系统 | |
US20210042466A1 (en) | Detecting compatible layouts for content-based native ads | |
CN106874467A (zh) | 用于提供搜索结果的方法和装置 | |
US9934206B2 (en) | Method and apparatus for extracting web page content | |
US20150058711A1 (en) | Presenting fixed format documents in reflowed format | |
CN112818111B (zh) | 文档推荐方法、装置、电子设备和介质 | |
CN105893564A (zh) | 一种基于搜索引擎客户端的搜索方法和装置 | |
CN104866582A (zh) | 显示页面信息的方法和装置 | |
CN105426508A (zh) | 网页生成方法和装置 | |
CN107526718A (zh) | 用于生成文本的方法和装置 | |
US20130151511A1 (en) | Information providing device, information providing method, information providing program, information display device, information display method, information display program, information search system, and recording medium | |
CN110020312A (zh) | 提取网页正文的方法和装置 | |
JP5556461B2 (ja) | 情報閲覧端末装置、情報閲覧システム、情報閲覧プログラム及び情報閲覧方法 | |
CN107168635A (zh) | 信息呈现方法和装置 | |
CN107329981B (zh) | 页面检测的方法和装置 | |
JP5372990B2 (ja) | 広告処理装置及び方法 | |
Kucher et al. | Analysis of VINCI 2009-2017 proceedings | |
CN111428159B (zh) | 线上化分类方法和装置 | |
KR101614470B1 (ko) | 검색어 리스트 제공 장치 및 이를 이용한 방법 | |
JP2021068328A (ja) | 情報提供装置、情報提供方法および情報提供プログラム | |
CN107622125B (zh) | 一种信息爬取方法和装置、电子设备 | |
CN103218358A (zh) | 一种Diff打分方法以及系统 | |
CN106776634A (zh) | 一种用于网络访问的方法、装置及终端设备 | |
JP2011164869A (ja) | 文字入力支援装置及び方法 | |
JP2019175212A (ja) | 情報表示装置、記事ページ生成装置、情報処理装置、情報表示システム及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130507 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5372990 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |