JP2011215687A - ドキュメント変換方法、ドキュメント変換装置およびそのプログラム - Google Patents

ドキュメント変換方法、ドキュメント変換装置およびそのプログラム Download PDF

Info

Publication number
JP2011215687A
JP2011215687A JP2010080351A JP2010080351A JP2011215687A JP 2011215687 A JP2011215687 A JP 2011215687A JP 2010080351 A JP2010080351 A JP 2010080351A JP 2010080351 A JP2010080351 A JP 2010080351A JP 2011215687 A JP2011215687 A JP 2011215687A
Authority
JP
Japan
Prior art keywords
document
conversion method
divided block
block elements
block element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010080351A
Other languages
English (en)
Other versions
JP2011215687A5 (ja
Inventor
Kenji Bau
ケンジ バウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2010080351A priority Critical patent/JP2011215687A/ja
Publication of JP2011215687A publication Critical patent/JP2011215687A/ja
Publication of JP2011215687A5 publication Critical patent/JP2011215687A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】前提と異なる表示エリアでドキュメントを表示するときの利便性を向上させるためにドキュメントを変換する際に、ドキュメント提供者に不利が発生することを抑える。
【解決手段】コンピューターシステムにおいて、表示装置に表示するドキュメントを変換するドキュメント変換方法であって、表示を要求されたドキュメントを取得する第1のステップS1と、取得したドキュメントをブロック要素に分割する第2のステップS5と、分割したブロック要素について、ドキュメントを要求した側の関心度を判定する第3のステップS6と、分割したブロック要素について、ドキュメントを提供する側の重要度を判定する第4のステップS7と、判定した関心度および重要度に基づき、分割したブロック要素を配置したドキュメントを生成する第5のステップS9とを含む。
【選択図】図5

Description

本発明は、ドキュメント変換方法、ドキュメント変換装置およびそのプログラに関する。
従来、PC(Personal Computer)を前提にしたウェブページにおいて、携帯端末での閲覧の利便性を向上させるため、HTML(HyperText Markup Language)ドキュメントのレイヤウトを画面の幅に合わせて、各要素を一つのコラム内に収まるように縮小、調整の処理を行う方法がある(例えば特許文献1)。
米国特許第7362311号明細書
しかしながら、従来の方法においては、ユーザーが見たいコンテンツが携帯端末に表示されるものの、タイトル、著作権情報が表示されないことがある、あるいは、元々「アボブ・ザ・フォルド」にあった広告が「アンダー・ザ・フォルド」または未表示になることがあるなど、ドキュメントの提供者に不利が生じてしまうことがあるという問題がある。
本発明は、このような事情に鑑みてなされたもので、その目的は、前提と異なる表示エリアでドキュメントを表示するときの利便性を向上させるためにドキュメントを変換する際に、ドキュメント提供者に不利が発生することを抑えるドキュメント変換方法、ドキュメント変換装置およびそのプログラムを提供することにある。
(1)この発明は上述した課題を解決するためになされたもので、本発明のドキュメント変換方法は、コンピューターシステムにおいて、表示装置に表示するドキュメントを変換するドキュメント変換方法であって、表示を要求されたドキュメントを取得する第1のステップと、前記取得したドキュメントをブロック要素に分割する第2のステップと、前記分割したブロック要素について、ドキュメントを要求した側の関心度を判定する第3のステップと、前記分割したブロック要素について、ドキュメントを提供する側の重要度を判定する第4のステップと、前記判定した関心度および重要度に基づき、前記分割したブロック要素を配置したドキュメントを生成する第5のステップとを含むことを特徴とする。
(2)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記表示装置がドキュメントを表示する領域の解像度が、前記表示を要求されたドキュメントが前提としている解像度より低いことを特徴とする。
(3)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記表示装置は、携帯端末であることを特徴とする。
(4)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第5のステップにおいて、予め用意されたレイヤウトの情報を用いることを特徴とする。
(5)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、 前記レイアウトの情報は、配置可能なブロック要素の種類または数に関する制限を含むことを特徴とする。
(6)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、広告を提示するためのブロック要素、知名度の向上を目的としたブロック要素、著作権の記述を目的としたブロック要素、会員登録に関するブロック要素、有料コンテンツまたは有料サービスへの誘導を目的としたブロック要素、アフィリエイトリンクを含むブロック要素の内、少なくとも一つを識別することを特徴とする。
(7)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記要求されたドキュメントは、マークアップ言語で記述されていることを特徴とする。
(8)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記マークアップ言語は、HTML言語であることを特徴とする。
(9)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記HTML言語は、HTML5言語であることを特徴とする。
(10)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第2のステップにおいて、HTML5の<section>、<header>、<footer>、<nav>、<article>、<aside>の要素の内、少なくとも一つを用いることを特徴とする。
(11)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第3のステップにおいて、<article>、<section>の要素のいずれかを用いることを特徴とする。
(12)また、本発明のドキュメント変換方法は、上述のいずれかのドキュメント変換方法であって、前記第3のステップにおいて、前記分割したブロック要素に含まれる<p>要素の数を用いることを特徴とする。
(13)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第3のステップにおいて、前記分割したブロック要素に含まれる長い文章の数を用いることを特徴とする。
(14)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第3のステップにおいて、リファラURLを用いることを特徴とする。
(15)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第3のステップにおいて、検索エンジンを用いることを特徴とする。
(16)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第4のステップにおいて、ドキュメントのURIを用いることを特徴とする。
(17)また、本発明のドキュメント変換方法は、上述のいずれかのドキュメント変換方法であって、前記第4のステップにおいて、<title>要素を用いることを特徴とする。
(18)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、<header>要素を用いることを特徴とする。
(19)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、同一ドメインにある他のドキュメントに共通するブロック要素が存在するか否かを用いることを特徴とする。
(20)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、表示エリアまたは表示位置に関する情報を用いることを特徴とする。
(21)また、本発明のドキュメント変換方法は、上述のいずれかのドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、ID属性、NAME属性のいずれかを用いることを特徴とする。
(22)また、本発明のドキュメント変換方法は、上述のいずれかのドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、前記要求されたドキュメント内のコメントを用いることを特徴とする。
(23)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記分割したブロック要素について、種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、前記要求されたドキュメントのURIにおけるトップレベルドメインに応じた判定情報を、種類を識別する際に用いることを特徴とする。
(24)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記分割したブロック要素について、広告を含む種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、広告を識別するために、前記分割したブロック要素の表示エリアのサイズを用いることを特徴とする。
(25)また、本発明のドキュメント変換方法は、上述のいずれかのドキュメント変換方法であって、前記分割したブロック要素について、広告を含む種類を識別する第6のステップを有し、前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、前記第6のステップにおいて、広告を識別するために、スクリプトのSRC属性を用いることを特徴とする。
(26)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第5のステップにおいて、広告の表示エリアのサイズを調整することを特徴とする。
(27)また、本発明のドキュメント変換方法は、上述のドキュメント変換方法であって、前記第3のステップにおいて、以前に判定された該ユーザーの関心度に関する情報を用いることを特徴とする。
(28)また、本発明のドキュメント変換装置は、表示装置に表示するドキュメントを変換するドキュメント変換装置であって、表示を要求されたドキュメントを取得するドキュメント取得部と、前記取得したドキュメントをブロック要素に分割するドキュメント分割部と、前記分割したブロック要素について、ドキュメントを要求した側の関心度を判定するユーザー関心度判定部と、前記分割したブロック要素について、ドキュメントを提供する側の重要度を判定する提供者側重要度判定部と、前記判定した関心度および重要度に基づき、前記分割したブロック要素を配置したドキュメントを生成するドキュメント生成部とを備えることを特徴とする。
(29)また、本発明のプログラムは、表示装置に表示するドキュメントを変換するドキュメント変換装置におけるコンピューターシステムに、表示を要求されたドキュメントを取得する第1のステップと、前記取得したドキュメントをブロック要素に分割する第2のステップと、前記分割したブロック要素について、ドキュメントを要求した側の関心度を判定する第3のステップと、前記分割したブロック要素について、ドキュメントを提供する側の重要度を判定する第4のステップと、前記判定した関心度および重要度に基づき、前記分割したブロック要素を配置したドキュメントを生成する第5のステップとを実行させる。
この発明によれば、前提と異なる表示エリアでドキュメントを表示するときの利便性を向上させるためにドキュメントを変換する際に、ドキュメント提供者に不利が発生することを抑えることができる。
サンプルドキュメントを、PC(Personal Computer)用のブラウザー200がレンダリングした結果とその表示例を示す図である。 この発明の第1の実施形態における携帯端末900の外観図である。 同実施形態における携帯端末900の構成を示す概略ブロック図である。 同実施形態におけるドキュメント最適化装置100の構成を示す概略ブロック図である。 同実施形態におけるドキュメント最適化装置100の動作を説明するフローチャートである。 同実施形態におけるドキュメントツリーの例を示す図である。 同実施形態におけるステップS6の関心度判定の処理を説明するフローチャートである。 同実施形態におけるステップS7の重要度判定の処理を説明するフローチャートである。 同実施形態における基本レイヤウトの例を示す図である。 同実施形態における基本レイヤウトAのレンダリング結果の例を示す図である。 ドキュメントをPC上のブラウザーでレンダリングした場合のアウトプットの例を示す図である。 同実施形態におけるドキュメント最適化装置100が生成したドキュメントをレンダリングした場合のアウトプットの例を示す図である。 この発明の第2の実施形態におけるドキュメント最適化装置500の構成を示す概略ブロック図である。 この発明の第3の実施形態におけるドキュメント提供システムの構成を示す図である。 同実施形態におけるドキュメント最適化サーバー1100の構成を示す概略ブロック図である。 同実施形態におけるドキュメント最適化装置600の構成を示す概略ブロック図である。 同端末仕様判定部602による処理を説明するフローチャ−トである。
本発明の実施の形態について説明する前に、まず、用語を定義する。図1を参照しながら、「アボブ・ザ・フォルド」のコンセプトを説明する。なお、図1、図11、図12で使われているテキストは「lorem ipsum」と呼ばれる典型的なダミーテキストである。図1は、サンプルドキュメントを、PC(Personal Computer)用のブラウザー200がレンダリングした結果とその表示例を示す。図1に示すサンプルドキュメントは、広告201a、広告201b、コンテンツ202、ヘッダー部203、ナビゲーションメニュー204、フッター部205、の要素で構成されている。
このサンプルドキュメントがブラウザーによりレンダリングされて表示された結果は、「アボブ・ザ・フォルド」206、「フォルド」207、「アンダー・ザ・フォルド」208のエリアに別れている。「アボブ・ザ・フォルド」とは、可視領域のことで、ページを開いた時にブラウザー画面をスクロールせずに、表示されている部分のことである。一方、「アンダー・ザ・フォルド」は、スクロールをしないと見えない部分のことである。そして、「フォルド」は「アボブ・ザ・フォルド」と「アンダー・ザ・フォルド」の間の境界線である。一般的に、「アボブ・ザ・フォルド」にある広告がクリックされる確率が、「アンダー・ザ・フォルド」にある広告よりも高いとされている。
次いで、リファラURL(Universal Resource Locator)を説明する。あるWebページのリンクをクリックすると、表示は、リンク先のページに移動する。その際、HTTPプロトコルで通信され、リンク先のWebサーバーに送信される情報には、リンク元の(表示されていた)Webページを表す情報が含まれる。それを、このリンクリファラURLと呼ぶ。
[第1の実施形態]
次に本発明の第1の実施形態について説明する。まず、図2に、本実施形態におけるドキュメント表示装置である携帯端末900の外観図を示す。なお、携帯端末900は携帯電話であるが、それに限定される必要がなく、PDAや、モバイル端末、モバイルゲーム機、家電製品等に、ドキュメントの閲覧ソフトウェア、つまりブラウザー、が搭載された別形態のドキュメント表示装置であっても本発明は適用可能である。また、本実施形態では、ドキュメントとしてHTMLドキュメントを用いるが、別のフォーマットでも容易に適用できる。図3は、本実施形態における携帯端末900の構成を示す概略ブロック図である。携帯端末900は、入力部901、表示部902、ブラウザー部903、通信部904、ドキュメント最適化装置100を含む。
入力部901は、数字キー、4方向キー、選択キーなど、端末装置900を操作するための入力デバイスである。表示部902は、画像を表示する液晶パネル、有機ELパネルなどを備えた表示デバイスである。ブラウザー部903は、入力部901へのユーザー操作に基づき、通信部904を介して、外部の機器にドキュメントを要求し、取得したドキュメントをレンダリングして、表示部902に表示させるWebブラウザーなどのブラウザーである。通信部904は、携帯電話網に接続し、外部の機器に対するドキュメントの要求を送信し、その要求に対する応答であるドキュメントを受信する。ドキュメント最適化装置100は、通信部904が受信したドキュメントを、表示部902への表示に適したデータに変換してブラウザー部903に出力する。
図4は、ドキュメント最適化装置100の構成を示す概略ブロック図である。なお、本装置は、本実施形態では、携帯端末900が有するCPUがプログラムをメモリから読み出して実行することで、実現されるとして説明するが、図15で示されるように、従来の携帯端末1000と、ドキュメント最適化サーバー1100と、ドキュメント提供サーバー1201等で構成されているシステムでは、ドキュメント最適化装置100は、ドキュメント最適化サーバー1100に含まれるとしてもよい。なお、このようなサーバーによる実装のメリットは、既存の端末でも適用が可能にすることである。詳しくは第3の実施の形態で後述する。
図4は、ドキュメント最適化装置100の構成を示す概略ブロック図である。図4に示すように、ドキュメント最適化装置100は、ドキュメント取得部101、端末情報記録部102、ドキュメント分割部103、ユーザー関心度判定部104、提供者側重要度判定部105、ドキュメント生成部106、基本レイヤウト記録部107を含む。
図5は、ドキュメント最適化装置100の動作を説明するフローチャートである。図4の概略ブロック図と、図5のフローチャートを参照しながら、ドキュメント最適化装置100の動作を説明する。ユーザーの操作によりドキュメントリソースのURIの入力または指定を受けると、入力部901は、そのURIを含み、ドキュメントリソースの取得を要求するリクエストメッセージを、ドキュメント最適化装置100のドキュメント取得部101に渡す。このリクエストメッセージを受けたドキュメント取得部101は、リクエストメッセージに応じて、図5のステップS1にて、ドキュメントリソースを取得する。
例えば、URIが、HTTP(Hypertext transfer protocol)プロトコルを指定している場合、ドキュメント取得部101は、HTTPプロトコルに準拠し、URIにて指定されたドキュメントリソースを要求するメッセージを、通信部904を介して、ネットワーク上のサーバーに送信する。このメッセージを受信したサーバーが、要求されたドキュメントリソースを端末装置900に返信すると、このドキュメントリソースを、通信部904を介して、ドキュメント取得部101が受信する。図5のステップS2にて、ドキュメント取得部101は、取得が成功したかどうかの確認を行う。成功した場合、ステップS5に移動するが、失敗の場合はステップS10に移動する。ステップS10では、ドキュメント取得部101は、エラードキュメントを生成して、ブラウザー部903に返信し、ドキュメント最適化装置100を終了させる。
ステップS5では、ドキュメント分割部103は、ドキュメント取得部101が受信したドキュメントリソースを解釈し、図6で示されているようなドキュメントツリーを作成する。ドキュメントツリーは、ドキュメントのブロック要素のツリーである。なお、ドキュメントツリーは元々のドキュメントにあったコンテンツを含まない。具体的には、HTMLの場合、ブロック要素として、<div>要素を用いる。なお、HTML5以降の場合では、新たに導入された<header>、<nav>、<article>、<section>、<aside>、<footer>要素をさらに用いることで、ドキュメントの構成をより正確に判断できる。それぞれの要素の意味と、本実施形態での用途を下記に説明する。
<header>:ドキュメントのヘッダー部を示すブロック要素である。用途:ヘッダーをより正確に判断できるため、ブランディングに関するブロック要素の判断材料として用いる。
<nav>:目次(他のドキュメントへのリンク集)に相当するブロック要素である。用途:たとえば、ブロックが<nav>に含まれている場合、コンテンツブロックの可能性を全面的に否定する、あるいは、マイナス材料としてルールに加えるなどして、従来のHTMLに比べて、コンテンツブロック要素の誤った判断を減らすことができる。
<article>:ドキュメントの独立した部分に相当するブロック要素(例:フォーラムの投稿、新聞等の記事、ブログのエントリまたはコメント)である。用途:コンテンツブロック要素の判断材料として用いる。
<section>:ドキュメント内のセクションを示すブロック要素である。用途:<div>に比べて、粒度が大きいため(複数の<div>をグループ化するブロック要素として)、ドキュメントの基本構成の判断材料として用いる。
<aside>:前後のコンテンツに関連する内容だが、本筋と少し離れているため、コンテンツから分離されたものと見なしても良いコンテンツブロック要素である。用途:コンテンツに関するブロック要素であるが、重要度がやや低いと判断する。
<footer>:フッター部を示すブロック要素である。用途:フッター部の判断材料として用いる。
次いで、ステップS6では、ユーザー関心度判定部104が、リクエストメッセージ、ドキュメント取得部101で取得されたドキュメント、およびドキュメント分割部103で生成されたドキュメントツリーを元に、各ブロック要素に対して、ユーザーにとっての関心度を判定する。図7は、ステップS6の関心度判定の処理を説明するフローチャートである。ユーザー関心度判定部104は、まず、ステップS61にて、ブロック要素の種類を識別し、次にステップS62にて、そのブロック要素の、ユーザーにとっての関心度を判定する。そして、ステップS63にて、関心度を判定していないブロック要素があるか否かを判定し、あるときは(S63−Yes)、ステップS61に戻って、残りのブロック要素について処理をする。ないときは(S63−No)、処理を終了する。なお、ユーザー関心度判定部104は、各要素の関心度情報とセットで要素の種類も出力する。
ステップS61におけるブロック要素の種類の識別方法としては、具体的には、一般的にユーザーの関心が対象となるのがほとんどコンテンツであるため、下記ルールを用いて、コンテンツに関するブロック要素を識別する。以下に示すルールを自由に組み合わせても良いが、最も効果的な方法としては、各ルールの判断結果のスコアーに、予め決められた重み付けを付し、それらを加算したスコアーが、予め決められた閾値を超えているときは、コンテンツに関するブロック要素と判定する。
HTML 5から導入された、コンテンツのブロック要素を示す<article>または<section>要素を用い、これらの要素であるときは、コンテンツの可能性が高いので、予め決められたスコアーを与える。
段落の<p>タグや長い文章が頻出する場合、コンテンツの可能性が高いので、<p>タグあるいは長い文章(所定より単語数が多い)の数が多いほど、大きいスコアーを与える。
ドキュメント要求の際、HTTPプロトコルにおけるリファラURLが検索エンジンの結果が表示されているページであった場合、検索式または検索エンジンの結果ページにある抜粋を、ユーザーが読みたい内容ととらえる。その内容が該当ブロック要素に含まれている場合、コンテンツの可能性が高いので、予め決められたスコアーを与える。
ドキュメント要求の際、HTTPプロトコルにおけるリファラURLがない場合(ユーザーがドキュメントを直接にアクセスした場合など)、一般的なユーザーが当ドキュメントをアクセスする理由を推測するため、検索エンジンで当ドキュメントがリンクされているページを検索し、リンクのテキストに使われている文書や検索エンジンの抜粋を用いる。具体的には、検索エンジンから得られたページの中で<a href=”http://example.org/faq.html”>This FAQ about the origin of the example.org domain</a> is interestingなどのような記述が多数ある場合、http://example.org/faq.htmlのドキュメントにアクセスする理由は「FAQ about the origin of the example.org domain」にあると推測する。そして、該当ブロック要素にその文章または共通文字列が含まれていれば、コンテンツの可能性が高いので、予め決められたスコアーを与える。
ステップS62におけるユーザーの関心度の判定方法としては、下記のようなルールを用いる。
ドキュメント要求の際、HTTPプロトコルにおけるリファラURLが検索エンジンの結果が表示されているページであった場合、検索式または検索エンジンの結果ページにある抜粋を、ユーザーが読みたい内容ととらえる。その内容が該当ブロック要素に含まれている場合、該当ブロック要素に関する関心が高いと判断し、所定の関心度を与える。
ドキュメント要求の際、HTTPプロトコルにおけるリファラURLがない場合(ユーザーがドキュメントを直接にアクセスした場合など)、一般的なユーザーが当ドキュメントをアクセスする理由を推測するため、検索エンジンで当ドキュメントがリンクされているページを検索し、リンクのテキストに使われている文書や検索エンジンの抜粋を用いる。具体的には、検索エンジンから得られたページの中で<a href=”http://example.org/faq.html”>This FAQ about the origin of the example.org domain</a> is interestingなどのような記述が多数ある場合、http://example.org/faq.htmlのドキュメントにアクセスする理由は「FAQ about the origin of the example.org domain」にあると推測する。そして、該当ブロック要素にその文章または共通文字列が含まれていれば、該当ブロック要素に対する関心度が高いと判断し、所定の関心度を与える。
図5に戻って、次に、ステップS7では、提供者側重要度判定部105が、ドキュメント分割部103で生成されたドキュメントツリー、およびドキュメント取得部101で取得されたドキュメントを元に、各ブロック要素に対して、ドキュメントの提供者にとっての重要度を判定する。図8は、ステップS7の重要度判定の処理を説明するフローチャートである。提供者側重要度判定部105は、まず、ステップS71にて、ブロック要素の種類を識別し、次にステップS72にて、そのブロック要素の、ドキュメントの提供者にとっての重要度を判定する。そして、ステップS73にて、重要度を判定していないブロック要素があるか否かを判定し、あるときは(S73−Yes)、ステップS71に戻って、残りのブロック要素について処理をする。ないときは(S73−No)、処理を終了する。なお、各要素の重要度情報とセットで要素の種類も出力される。
ドキュメントを提供する際、提供者にとって、何が重要かについて説明する。提供者は、ドキュメントを提供することで、情報の伝達(「content」)、知名度の向上(「branding」)、利益の向上(「monetization」)といった目的を抱いていると考えられる。これら、各々の目的を果たすために、ひとつまたは複数のブロック要素が用いられている。例えば、知名度の向上に用いられるブロック要素としては、ヘッダーのブロック要素、著作権に関する情報が記述されているコピーライト(Copyright)ブロック要素などがある。なお、目的の中で、情報の伝達はユーザーが最も関心のある部分であるため、情報の伝達に用いられるブロック要素は、ユーザー関心度判定部104に用いてもよい。
それ以外の目的(知名度の向上、利益の向上)に関しては、比較的、ユーザーの関心度が低いと考えられる。そのため、これらの目的に用いられているブロック要素と判定した要素についは、提供者側重要度判定部105は、重要度を判定する。
次に、ステップS71における知名度の向上に関するブロック要素の識別方法を説明する。知名度の向上に関するブロック要素は下記のルールを用いて、識別を行う。以下に示すルールを自由に組み合わせても良いが、最も効果的な方法としては、各ルールの判断結果のスコアーに、予め決められた重み付けを付し、それらを加算したスコアーが、予め決められた閾値を超えているときは、知名度に関するブロックと判定する。
URIのドメイン名に近い内容がブロック要素に含まれている。例えば、URIがhttp://www.abcdef.co.jp/example.html であった場合、ドメイン名が「abcdef」となり、ブロック要素に「abcdef」が使われていると知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。
HTMLのヘッダー部(<head>…</head>)にあるタイトルタグ(<title>…</title>)に記述されている内容またはその一部がブロック要素に含まれているときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。なお、タイトルタグに記述されている内容のうち、一般的に頻出度の高い言葉などは判定に用いない方が望ましい。一般的に頻出度の高い言葉としては、例えば、英語のページであれば「The」、「A」、「to」、「with」などが考えられる。これらの言葉を用いないようにする方法としては、具体的には、用いない言葉(文字列)のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
同一ドメイン名にある他のページ(ドキュメント)に共通するブロック要素が存在するときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。例えば、指定されたページ内にリンクされている同一ドメイン名のページをいくつか取得し、共通するブロック要素を探すことで判定する。なお、ブロック要素が共通しているか否かの判断方法としては、例えば、ブロックのID属性が一致しているか否かによって判断する方法、あるいは、ブロック要素の内容が所定の割合以上一致しているか否かによって判断する方法がある。
同一ドメイン名にある複数のページのタイトル内で共通している部分がブロック要素に含まれているときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。具体的には、例えば、指定されたページ内にリンクされている同一ドメイン名のページをいくつか取得し、これらのタイトル内で共通している部分を抽出し、抽出した部分がブロック要素内にあるか否かを調べる。例えば、取得されたページのタイトルが「New products − abcdef」(新製品 − abcdef)、「Customer Support − abcdef」(カストマーサポート − abcdef)、「Worldwide presence − abcdef」(グロバール体制 − abcedf)の場合、共通の部分として「abcdef」(abcedf)を抽出し、「abcedf」がブロック要素に含まれているか否かで判定する。
ドキュメントの上部にあって、表示エリアに対して比較的に大きいブロック要素であるときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。その理由は、多くのウェブページでは、ブランド名がドキュメントの先頭に大きく表示されているからである。具体的に、PCでレンダリングされた場合、該当グロック要素が表示エリアの半分上にあって、なおかつ幅が表示エリアの一定の割合を超えると知名度に関するブロック要素と判定する。
ブロック要素のID属性が特定の文字列と一致しているときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。ブランド名を表示するブロック要素のID属性には、例えば、<div id=”header”>…</div>のように「header」(ヘッダー)や「title」(タイトル)または「logo」(ロゴ)などの特定の文字列が用いられていることが多い。特定の文字列と一致しているか否かの判定方法としては、具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いて判定しも良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にあるコメント文に、特定の文字列が含まれているときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。ブランド名を表示するブロック要素のコメント文には、例えば、<!-- Here goes the header -->(ここにヘッダーが入ります)のように「header」(ヘッダー)や「title」(タイトル)または「logo」(ロゴ)などの特定の文字列が用いられていることが多い。特定の文字列が含まれているか否かの判定方法としては、具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いて判定しも良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素内のコンテンツやコメント文、またはID属性に、著作権に関する記載を示す特定の文字列が含まれているときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。ブランド名の著作権を表示するブロック要素には、例えば、<!-- Copyright notice -->(コピーライトの情報)のように「copyright」(コピーライト)やコピーライトマーク(Cを丸又は括弧で囲ったもの)または「Provided to you by」(提供者)などの特定の文字列が用いられていることが多い。なお、一つ前のルールで得られた情報も含まれていれば、知名度に関するブロックの可能性がさらに高いので、与えるスコアーを高くしてもよい。特定の文字列が含まれているか否かの判定方法としては、具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いて判定しも良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にHTML5以降で導入された<header>タグが含まれているときは、知名度に関するブロックの可能性が高いので、予め決められたスコアーを与える。新たに導入された<header>タグは、ドキュメントのヘッダーを示しており、知名度の向上に関するブロックである可能性が高いと判断できる。
以上のルールでは、文字列として英語の文字列を用いて説明を行ったが、判定ルールとしては文字列の言語に関わらず、他の言語の文字列を用いても本発明を適用できる。
次に、ステップS72における知名度の向上に関する要素の重要度を判定する方法を説明する。知名度の向上に関するブロック要素の重要度を判定する方法としては、以下のような方法を用いる。以下に示すルールを自由に組み合わせても良いが、最も効果的な方法としては、各ルールの判断結果のスコアーに、予め決められた重み付けを付し、それらを加算したスコアーを、重要度とする。
ブロック要素の重要度は、表示エリアに比例した関係があるので、例えば、該当ブロック要素が全体表示エリアの50%を占めれば、重要度が非常に高いと判断し、予め決められたスコアーを与える。
ブロック要素の重要度を判定するのに、表示位置との関係を利用する。具体的には、表示エリアの先頭や左上のエリアが最も注目されることが様々な視線追跡実験で証明されている。これを利用すれば、表示位置による重要度を判定できる。例えば、ブロック要素が表示エリアの左上端から所定の範囲内に位置する場合、重要度が非常に高いと判定し、予め決められたスコアーを与える。または、ブロック要素が表示エリアの先頭の中央に位置する場合、重要度が高いと判定し、予め決められたスコアーを与える。
ブロック要素が同一ドメインの多くのページに共通しているブロック要素であれば、重要度が高いと判定し、予め決められたスコアーを与える。具体的には、指定されたページ内にあるリンクから同一ドメインのドキュメントをいくつか取得し、共通するブロックが予め決めた割合より多くのドキュメントに存在するか否かにより判定する。なお、ブロック要素が共通していると判断する方法は、例えば、ブロックのID属性を照合するか、ブロック要素の内容がどれぐらい一致しているかによって同一のブロック要素と判定する。
次に、ステップS71における利益の向上に関するブロック要素の識別方法を説明する。利益の向上に関するブロック要素は、さらに複数の種類に分けることができる。それらの種類毎に、後述するルールを用いて、識別を行う。最も多い種類は、広告のブロック要素であるが、その他には、有料版への誘導、アフィリェイトリンク、会員登録への誘導、スポンサーによるコンテンツ(つまり、インフォマーシャル)等がある。以下、種類ごとに判定ルールを説明する。
まず、1つ目の種類である広告のブロック要素の識別には、以下のようなルールを用いる。
ブロック要素のID属性が特定の文字列と一致しているときは、広告のブロック要素と判定する。広告のブロック要素には、例えば、<div id=”advertisement”>…</div>のように「advertisement」(広告)や「ad」(広告)または「banner」(バナー)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素の表示エリアが特定のサイズとなっているときは、広告のブロック要素と判定する。具体的には、多くのバナー広告などは特定のサイズを持つことを利用する。バナー広告に用いられる特定のサイズとしては、例えば、728x90ピクセルの「Leaderboard」フォーマット、468x60ピクセルの「Banner」フォーマット、120x600ピクセルの「Skyscraper」フォーマット等がある。
広告の内容がドキュメントであり、動的に決定される場合には、スクリプトが用いられるが、スクリプトのソースを指定するSRC属性が特定のURIと一致しているときは、広告に関するブロック要素と判定する。特定のURIとしては、例えば、<script src=”http://example.org/show_ads.js”>…</script>のように「http://example.org/show_ads.js」などがある。具体的には、URIのリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
広告の課金管理のために、広告を発行するサービスがリダイレクトを行うことが一般的に行われていることを利用する。ブロック要素内のリンクがこのようなリダイレクトを行うための特定のURIであれば、広告に関するブロック要素と判定する。特定のURIとしては、例えば、<a href=”http://rd.example.org/ads.php?destination=http://www.example.net/sales/”>…</a>のように「http://rd.example.org/ads.php?destination=」などがある。具体的には、URIのリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素の先頭または後部に特定の文字列が含まれているときは、広告のブロック要素と判定する。例えば、「advertisement」(広告)、「sponsored by」(提供者)、「ads」(広告)などの特定の文字列がある場合、広告のブロック要素であると判定できる。具体的には、文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にあるコメント文に、特定の文字列が含まれているときは、広告のブロック要素と判定する。広告のブロック要素には、例えば、<!-- Here goes an advertisement -->(ここに広告が入ります)のように「advertisement」(広告)や「ads」(広告)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
以上のルールでは、文字列として英語の文字列を用いて説明を行ったが、判定ルールとしては文字列の言語に関わらず、他の言語の文字列を用いても本発明を適用できる。
次に、2つ目の種類である有料版への誘導に関するブロック要素の識別には、以下のようなルールを用いる。
ブロック要素のID属性が特定の文字列と一致しているときは、有料版への誘導に関するブロック要素と判定する。有料版への誘導に関するブロック要素には、例えば、<div id=”members only”>…</div>のように「members only」(会員限定)や「premium」(プレミアム)または「full access」(フルアクセス)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素の先頭または後部に特定の文字列が含まれているときは、有料版への誘導に関するブロック要素と判定する。有料版への誘導に関するブロック要素には、例えば、「members only」(会員限定)、「membership benefits」(会員の特典)、「subscribe for more」(続きを見るには加入を)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にあるコメント文に、特定の文字列が含まれているときは、有料版への誘導に関するブロック要素と判定する。有料版への誘導に関するブロック要素には、例えば、<!-- subscription teaser -->(加入への誘導)のように「subscription」(加入)や「members only」(会員限定)または「premium」(プレミアム)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にあるリンクのテキストまたはURIに、特定の文字列が含まれているときは、有料版への誘導に関するブロック要素と判定する。有料版への誘導に関するブロック要素には、例えば、<a href=”http://www.example.org/membership-benefits.html”>Membership benefits </a>(会員の特典)のようにURIや、リンクのテキストに「membership」(会員)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
以上のルールでは、文字列として英語の文字列を用いて説明を行ったが、判定ルールとしては文字列の言語に関わらず、他の言語の文字列を用いても本発明を適用できる。
次に、3つ目の種類であるアフィリェイトリンクに関するブロック要素の識別には、以下のようなルールを用いる。
ブロック要素のID属性が特定の文字列と一致しているときは、アフィリェイトリンクに関するブロック要素と判定する。アフィリェイトリンクに関するブロック要素には、例えば、<div id=”affiliate”>…</div>のように「affiliate」(アフィリェイト)または「partners」(提携企業)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素の内容がドキュメントであり、その内容が動的に決まる場合に、スクリプトが用いられるが、スクリプトのソースを指定する「SRC」属性が特定のURIと一致しているときは、アフィリエイトリンクに関するブロック要素と判定する。アフィリェイトリンクに関するブロック要素には、例えば、<script src=”http://example.org/affiliate-program.js”>…</script>のように「http://example.org/affiliate-program.js」などの特定なURIが用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素の先頭または後部に特定の文字列が含まれているときは、アフィリェイトリンクに関するブロック要素と判定する。アフィリェイトリンクに関するブロック要素には、例えば、「Our partners」(提携企業)、「brought to you by」(提供者)、「related products」(関連商品)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にあるコメント文に、特定の文字列が含まれているときは、アフィリェイトリンクに関するブロック要素と判定する。アフィリェイトリンクに関するブロック要素には、例えば、<!-- Here goes an affiliate block -->(ここにアフィリェイトブロックが入ります)のように「affiliate」(アフィリェイト)や「partners」(提携企業)などの文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
以上のルールでは、文字列として英語の文字列を用いて説明を行ったが、判定ルールとしては文字列の言語に関わらず、他の言語の文字列を用いても本発明を適用できる。
次に、4つ目の種類である会員登録への誘導に関するブロック要素の識別には、以下のようなルールを用いる。
ブロック要素のID属性が特定の文字列と一致しているときは、会員登録への誘導に関するブロック要素と判定する。会員登録への誘導に関するブロック要素には、例えば、<div id=”registration”>…</div>のように「registration」(登録)または「register」(登録する)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にあるリンクのテキストまたはURIに特定の文字列が含まれているときは、会員登録への誘導に関するブロック要素と判定する。会員登録への誘導に関するブロック要素としては、例えば、<a href=”http://www.example.org/register.html”>Register (100% free)</a>(ご登録(無料))のようにURIや、リンクのテキストに「register」(登録)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
以上のルールでは、文字列として英語の文字列を用いて説明を行ったが、判定ルールとしては文字列の言語に関わらず、他の言語の文字列を用いても本発明を適用できる。
次に、5つ目の種類であるスポンサーや提携先によるコンテンツに関するブロック要素(以降、スポンサーのブロック要素と呼ぶ)の識別には、以下のようなルールを用いる。
ブロック要素のID属性が特定の文字列と一致しているときは、スポンサーのブロック要素と判定する。スポンサーのブロック要素には、例えば、<div id=”infomercial”>…</div>のように「infomercial」(インフォマーシャル)または「syndicated content」(同一ネットワークのコンテンツ)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素の先頭または後部に特定の文字列が含まれているときは、スポンサーのブロック要素と判定する。スポンサーのブロック要素の先頭または後部には、例えば、「Infomercial」(インフォマーシャル)、「Syndicated content」(同一ネットワークのコンテンツ)、「Sister site」(同一ネットワークにおける関連サイト)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
ブロック要素にあるコメント文に、特定の文字列が含まれているときは、スポンサーのブロック要素と判定する。スポンサーのブロック要素には、例えば、<!-- Here goes some syndicated content from our sister site-->(ここに同一ネットワークのコンテンツが入ります)のように「syndicated content」(同一ネットワークのコンテンツ)や「sister site」(同一ネットワークの関連サイト)などの特定の文字列が用いられていることが多い。具体的には、特定の文字列のリストを予め記憶しておき、そのリストを用いても良いが、冗長性を省くために、正規表現のリストを用いることが望ましい。
以上のルールでは、文字列として英語の文字列を用いて説明を行ったが、判定ルールとしては文字列の言語に関わらず、他の言語の文字列を用いても本発明を適用できる。
次に、ステップS72における利益の向上に関するブロック要素の重要度を判定する方法を説明する。利益の向上に関するブロック要素の重要度を判定する方法としては、以下のような方法を用いる。以下に示すルールを自由に組み合わせても良いが、最も効果的な方法としては、各ルールの判断結果のスコアーに、予め決められた重み付けを付し、それらを加算したスコアーを、重要度とする。
ブロック要素の重要度は表示エリアの大きさに比例しているという関係がある。そこで、例えば、該当ブロック要素が全体表示エリアの20%以上を占めれば、重要度が高いと判断し、予め決められたスコアーを与える。
ブロック要素が別の要素ブロック(親ブロック要素)に含まれている場合には、その親ブロック要素の表示エリア内の、比較的に大きい表示エリアを占めているときは、重要度が高いと考えられる。そこで、例えば、該当ブロック要素が親ブロックの表示エリアの20%以上を占めれば、重要度が高いと判断し、予め決められたスコアーを与える。
ブロック要素の重要度を、そのブロック要素の表示エリアのサイズと親ブロック要素の表示エリアまたは全体表示エリアの縦方向または横方向のサイズとの比較で判定する。例えば、該当ブロック要素の縦方向や横方向のサイズが親ブロックの縦方向または横方向のサイズに比べて、30%以上であれば、重要度が高いと判断し、予め決められたスコアーを与える。
ブロック要素の重要度を判定するのに、表示位置と重要度との関係を利用する。具体的には、表示エリアの先頭や左上のエリアが最も注目されることが様々な視線追跡実験で証明されている。これを利用して、表示位置に基づき、重要度を判定する。例えば、ブロック要素が表示エリアの左上端から所定の範囲内に位置する場合、重要度が非常に高いと判定し、予め決められたスコアーを与える。また、ブロック要素が「アボブ・ザ・フォルド」に位置する場合、重要度が高いと判定し、予め決められたスコアーを与える。
ブロック要素が同一ドメインの多くのページに共通しているブロック要素であれば、重要度が高いと判定し、予め決められたスコアーを与える。具体的には、指定されたページ内にあるリンクから同一ドメインのドキュメントをいくつか取得し、共通するブロックが予め決めた割合より多くのドキュメントに存在するか否かにより判定する。なお、ブロック要素が共通していると判断する方法は、例えば、ブロックのID属性を照合するか、ブロック要素の内容がどれぐらい一致しているかによって同一のブロック要素と判定する。
以上、各ブロック要素に対して、提供者にとっての重要度を判定するためのルールを説明したが、適用できるルールはそれに限定されず、また上記に含まれていない種類のブロック要素を識別するルールを追加してもよい。
なお、上述の種類を識別するルールを自由に組み合わせても良いが、最も効果的である方法としては、各種類におけるルール各々にて、予め決められた重み付けでスコアーを算出し、それらを種類毎に加算し、加算結果が予め設定された閾値を越えた場合に、識別を確定する。また、同じブロック要素が二つ以上の種類として識別された場合は、識別結果を廃棄するか、一つの種類に絞ることが望ましい。例えば、ルールによって算出されたスコアーが一番大きい種類を選ぶことで、一つの種類に絞る。なお、スコアーが同じ場合は、識別があいまいため、ブロック要素の識別を廃棄するようにしてもよい。
また、ドキュメントのURIのTLD(Top Level Domain:トップレベルドメイン)に応じた、ルールまたはルールに使われる判定情報、つまり、定数、文字列のリストまたは正規表現のリストを用いるようにしても良い。例えば、URIが「http://www.example.co.jp」の場合、TLDが「co.jp」となっているため、日本または日本語に特化した判定情報を標準セットに置き換えるまたは追加しても良い。
同様に、HTMLタグのLang属性によって、ルールまたはルールに使われる判定情報、つまり、定数、文字列のリストまたは正規表現のリストを選択または追加しても良い。例えば、<html lang="ja"></html>の場合、Lang属性が日本語をあらわしている「ja」となっているため、日本語に特化した判定情報を標準セットに置き換えるまたは追加しても良い。
また、上述のルールには、タグのID属性を用いているものがあるが、同様にタグのNAME属性を用いるようにしてもよい。
図5に戻って、ドキュメント生成部106が、リクエストメッセージ、ドキュメント取得部101で取得されたドキュメント、端末情報記録部102、ドキュメント分割部103で生成されたドキュメントツリー、ユーザー関心度104で判定された関心度の情報、および提供者側重要度判定部105で判定された重要度情報を元に、最適化なレイヤウトを決定し(S8)、ドキュメントを生成する(S9)。
ステップS8では、具体的には、まず、ドキュメント生成部106が、端末情報記録部102から、ディスプレーの解像度(例:幅640ピクセル、高さ480ピクセル)、ドキュメントを表示するためのエリアの解像度(例:幅600ピクセル、高さ470ピクセル)、ディスプレーのサイズ(例:3インチ、または縦横のサイズ)を取得する。なお、端末情報記録部102に記録されている情報は、予めメーカによって記録された情報であってもよいし、ブラウザー部903が動的に記録した情報であってもよい。後者の場合は、例えば、ユーザーがブラウザー部903による表示エリアを調整できる場合に適する。
次いで、ドキュメント生成部106が、基本レイヤウト記録部107から、基本レイヤウトを選択し、取得する。図9は、基本レイヤウトの例(以降、基本レイヤウトAという)を示す図である。図9に示すように、基本レイヤウトは、一つまたは複数のプレースホルダーで構成されている。また、各プレースホルダーに対して、付属情報が記述されている。この付属情報は、プレースホルダーに関する制限を示し、そのプレースホルダー内に配置可能なブロック要素の種類や数などの指定に用いる。付属情報としては、例えば、ブロック要素の最大数(max-parts)、ブロック要素の最小数(min-parts)、配置が可能なブロック要素の種類(<allowed-parts>…</allowed-parts>)、配置が不可能なブロックの種類(<disallowed-parts>…</allowed-parts>)、該当するブロック要素がない場合、代わりとなるブロック要素 (<alternative-part>… </alternative-part>)がある。
基本レイヤウトAの各タグについて、説明する。<stack>要素は、ブロック要素のスタックを示す要素である。<slice>要素は、スタック内のスライスを示す要素である。一つのスライスの中には、一つまたは複数のプレースホルダー(<placeholder>…</placeholder>)が存在する。前述したように、<placeholder>要素の属性でプレースホルダーに関する制限を記述できる。例えば、min-parts属性でブロック要素の最小数を指定する。また、max-parts属性で最大数のブロック要素を指定する。そして、relevance属性で重要度または関心度の高いブロック要素に限定する旨を記述できる。なお、それらの属性が記述されていない場合、制限が特にないと見なす。
<allowed-parts>要素は、プレースホルダーの中に配置してもよいブロック要素の種類を示す。例えば、「footer-placeholder」のプレースホルダーには、「branding」(知名度の向上に用いられるブロック要素)のうち、「copyright」(コピーライトブロック要素)が許可されている。また、<disallowed-parts>要素は、プレースホルダーの中に使用できないブロック要素の種類を示す。例えば、「main-placeholder」のプレースホルダーには、「branding」(知名度の向上に用いられるブロック要素)が許可されていない。なお、<allowed-parts>および<disallowed-parts>が記述されていない場合は、全ての種類のブロック要素が許可されていると見なす。<alternative-parts>要素では、該当ブロック要素が無い場合に、代わりとなるブロック要素の内容またはURIを指定する。例えば、<![CDATA[<div>Copyright {{@year}}]]>の場合、ドキュメントが生成された年が2009年であれば、<div>Copyright 2009</div>を出力する。
図10は、基本レイヤウトAのレンダリング結果の例を示す図である。図10に示すレンダリング結果1300には、「header-placeholder」ヘッダー用のプレースホルダー1301、「main-placeholder」メイン部のプレースホルダー1302、「footer-placeholder」のプレースホルダー1303と、「remainder-placeholder」未使用ブロック要素用のプレースホルダーがある。
なお、基本レイヤウト記録部107に記録されている基本レイヤウトは、予めメーカによって記録されたレイヤウトであってもよいし、ブラウザー部903が動的に記録したレイヤウトであってもよい。後者の場合は、例えば、提供者側からドキュメントと一緒に送信された基本レイアウトを用いることが可能になるといった効果がある。
基本レイヤウトの選択方法としては、例えば、重要度または関心度が一定以上のブロック要素を出来るだけ多く使うように基本レイヤウトを選択する方法がある。
図5に戻って、次に、ステップS9では、ドキュメント生成部106が基本レイヤウト記録部107から選択された基本レイヤウトの各プレースホルダーに対して、該当するブロック要素を取得し、プレースホルダーの付属情報に従い、重要度の順にブロック要素をプレースホルダーに流し込む。なお、その際、ドキュメント生成部106は、ブロック要素の調整を行う。
図9、図10、図11、図12を参照しながら、具体的に説明する。図11において、PCアウトプット200は、元々のドキュメントをPC上のブラウザーでレンダリングした場合のアウトプットである。また、図12において、アウトプット400は、本発明でレンダリングした場合のアウトプットである。アウトプット200には、ヘッダー部203、コンテンツ部202、広告201a、広告201b、ナビゲーションメニュー204、フッター部205がある。アウトプット400には、ヘッダー部403、コンテンツ部402、広告401a、広告401b、ナビゲーションメニュー404、フッター部404がある。
まず、ドキュメント生成部106は、基本レイヤウトA(図9)の各スライスの中にあるプレースホルダーの記述にしたがって、該当するブロック要素を選択し、ドキュメントに追加する。なお、ドキュメントに追加されたブロック要素が重複して使われないように、ドキュメント生成部106は、使用済みのブロック要素を無視するように動作する。具体的には、例えば、ブロック要素の候補リストから使用済みのブロック要素を削除する。
以下、スライスごとの動作を説明する。まず、レイヤウトAでは、ID属性が「header-placeholder」のプレースホルダーでは、「relevance=”true”」となっているため、このプレースホルダーに配置可能なブロック要素は、重要度または関心度が、所定の値よりも高いブロック要素に限定される。また、「allowed-parts」により、ブロック要素の種類が「Branding」における「Name」に限定されている。このため、配置可能なブロック要素の種類は、知名度の向上に関するブロック要素において、ブランド名に関するブロック要素である。また、「min-parts」と「max-parts」とも1となっているため、挿入できるブロック要素は一つだけである。
そこで、ドキュメント生成部106は、重要度が最も高いブランド名に関するブロック要素を選択し、ドキュメントに追加する。その際、端末情報記録部102から得られた情報に基づいて、調整を行う。例えば、ブロック要素が画像を含む場合、ドキュメントを表示するためのエリアの解像度にあわせて、画像の拡大や縮小を行う。
次に、ID属性が「main-placeholder」のプレースホルダーも、「relevance=”true”」となっているため、このプレースホルダーも、配置可能なブロック要素は、重要度または関心度が、所定の値よりも高いブロック要素に限定される。「allowed-parts」では、ブロック要素の種類が「content」および「monetization」に限定されているため、コンテンツに関するブロック要素と利益の向上に関するブロック要素が対象となる。また、それぞれの種類にはmax-parts属性で制限がかけられていて、コンテンツに関するブロック要素が最大2つまでと、利益の向上に関するブロック要素が最大3つまでとに制限されている。
そこで、ドキュメント生成部106は、ユーザー視点を重視するので、コンテンツに関するブロック要素から関心度が最も高い2つのブロック要素を選択し、ドキュメントに追加する。その際、端末情報記録部102から得られた情報に基づいて、「header-placeholder」のプレースホルダーと同様に、ブロック要素の調整を行う。例えば、ブロック要素が画像を含む場合、拡大や縮小を行う。次に、ドキュメント生成部106は、利益向上に関するブロック要素を重要度の順で、最大3つまで選択し、前のステップで追加された要素の中、またはブロック要素の間に、挿入する。このように、ドキュメント生成部106は、プレースホルダー内に、同じ種類のブロック要素を複数配置できるときには、同じ種類のブロック要素が連続して配置されることを出来るだけ避けて、ブロック要素を配置する。
具体的には、例えば、ブロック要素の間、ブロック要素内の<p>…</p>で示されている段落ブロックの間、または段落の中に追加する。例えば、<p>[段落1]</p><div style=”float:right;”>[広告]<div><p>[段落2]</p>のようにして、[段落1]の後に、利益向上に関するブロック要素である[広告]を右に寄せて、続く[段落2]を回り込ませるようにする。その際、端末情報記録部102から得られた情報に基づいて、「header-placeholder」のプレースホルダーと同様に、ブロック要素の調整を行う。例えば、ブロック要素が画像を含む場合、拡大や縮小を行う。なお、ブロック要素が表示の際に決まる広告のブロックである場合、スクリプト内にある広告のサイズに関するパラメターを調整するようにしてもよい。具体的には、広告のフォーマットがLeaderboardの場合、728x90ピクセルを要するが、端末の解像度で納まらない場合、468x60ピクセルの「Banner」フォーマットになるようにパラメターを調整する。
次に、ID属性が「footer-placeholder」のプレースホルダーでも、「relevance=”true”」となっているため、このプレースホルダーに配置可能なブロック要素は、重要度または関心度が、所定の値よりも高いブロック要素に限定される。また、「allowed-parts」により、ブロック要素の種類が「Branding」における「Copyright」に限定されている。このため、配置可能なブロック要素の種類は、知名度の向上に関するブロック要素において、著作権記述に関するブロック要素(コピーライトブロック要素)となる。また、「min-parts」と「max-parts」とも1となっているため、挿入できるブロック要素は一つだけである。
そこで、ドキュメント生成部106は、重要度が最も高い著作権記述に関するブロック要素を選択し、ドキュメントに追加する。その際、端末情報記録部102から得られた情報に基づいて、「header-placeholder」のプレースホルダーと同様に、調整を行う。例えば、ブロック要素が画像を含む場合、拡大や縮小を行う。
なお、例えば、該当するブロック要素が見つからない場合、<alternative-parts>要素の内容を解析した上でドキュメントに追加する。この場合、<div>Copyright 2009</div>を追加する。
最後に、ID属性が「remainders-placeholder」のプレースホルダーには、「relevance」属性が記述されていないため、ドキュメント生成部106は、重要度または関心度の制限が特にないと判断する。また、ドキュメント生成部106は、ブロック要素の種類に関しても特に限定がないと判断する。そこで、ドキュメント生成部106は、未使用のブロック要素を下記のように追加していく。まず、ユーザーの関心度が高い順に、ブロック要素をドキュメントに追加する。次に、利益向上に関するブロック要素を重要度の順に、前のステップで追加された要素の中にまたはブロック要素の間に挿入する。
具体的には、例えば、ブロック要素の間、ブロック要素内の<p>…</p>で示されている段落ブロックの間、または段落の中に追加する(例:<div style=”float:right;”>[広告]<div><p>[段落]</p>のように利益向上に関するブロック要素を右に寄せて続く要素を回り込ませるようにする)。その際、端末情報記録部102から得られた情報に基づいて、調整を行う。例えば、ブロック要素が画像を含む場合、拡大や縮小を行う。または、ブロック要素が表示の際に決まる広告のブロックである場合、スクリプト内にある広告のサイズに関するパラメターを調整してもよい。具体的には、広告のフォーマットがLeaderboardの場合、728x90ピクセルを要するが、端末の解像度で納まらない場合、468x60ピクセルの「Banner」フォーマットになるようにパラメターを調整する。
次に、未使用のブロック要素がまだ残っている場合、元のドキュメントの順でドキュメントに追加する。
最後に、ドキュメント生成部106は、生成したドキュメントをブラウザー部903に出力する。
このように、ブロック要素について、ドキュメントを要求した側(ユーザー)の関心度と、ドキュメントを提供する側の重要度とを判定し、これらの情報に基づき、ドキュメント要素を配置したドキュメントを生成する。このため、PC(Personal Computer)を前提にしたウェブページを、携帯端末で表示するなど、前提と異なる表示エリアでドキュメントを表示するときの利便性を向上させるためにドキュメントを変換する際に、ドキュメント提供者に不利が発生することを抑えることができる。
<変形例>
本発明の他の実施の形態について、以下の通り記載する。尚、説明の便宜上、前記の実施の形態において示した部材と同一の機能を有する部材には、その説明を省略する。
[第2の実施形態]
図13は、本発明の第2の実施形態におけるドキュメント最適化装置500の構成を示す概略ブロック図である。本実施形態におけるドキュメント最適化装置500は、ドキュメント最適化装置100に、ユーザー情報記録部508が追加されている。ユーザー情報記録部508は、ユーザーの関心に関する情報を記録する。具体的には、関心度を判定する際、関心度の高いブロック要素の中にある文字列を記録する。このとき、頻出度の高い言葉や意味合いが低い言葉を除いて、記録する。例えば、名詞だけを記録してもよい。なお、ユーザーの関心の傾向が変わる可能性があるため、古いデータを廃棄することが望ましい。
そして、本実施形態におけるユーザー関心度判定部104は、同一ユーザーが別のドキュメントにアクセスする際に、ユーザー情報記録部508に記録された情報を関心度の判定に、以下のように活用する。ブロック要素の内容と、ユーザー情報記録部508に記録されている情報とを照合し、共通する言葉が多ければ、多いほどユーザーの関心度が高いと判定し、高いスコアーを与える。
[第3の実施形態]
図14は、本発明の第3の実施形態におけるドキュメント提供システムの構成を示す図である。本実施形態におけるドキュメント提供システムは、従来の携帯端末1000、本発明のドキュメント最適化装置が実装されているドキュメント最適化サーバー1100、1201から始まり、ドキュメントを提供するドキュメント提供サーバーを備える。従来の携帯端末1000で、本発明による効果を得るためには、例えば、携帯端末1000のプロキシー(Proxy)を本発明が実装されているサーバー1100のIPアドレスに設定する。プロキシーを設定することで、ドキュメント提供サーバー1201…に存在するドキュメントにアクセスすると、ドキュメントの要求メッセージが、ドキュメント最適化サーバー1100に送信される。そこで、ドキュメント最適化サーバー1100が、ドキュメントの最適化を行い、結果を携帯端末1000に返信する。
図15は、本実施形態におけるドキュメント最適化サーバー1100の構成を示す概略ブロック図である。ドキュメント最適化サーバー1100は、移動体網通信部1101、ドキュメント最適化装置600、インターネット通信部1102を備える。移動体網通信部1101は、移動体網を介して、携帯端末1000と通信する。インターネット通信部1102は、インターネットを介して、ドキュメント提供サーバー1201…と通信する。ドキュメント最適化装置600は、携帯端末1000が要求したドキュメントであって、ドキュメント提供サーバー1201…から取得したドキュメントを、携帯端末1000での表示に適するように変換し、移動体網通信部1101を介して、携帯端末1000に送信する。
図16は、本実施形態におけるドキュメント最適化装置600の構成を示す概略ブロック図である。ドキュメント最適化装置600は、ドキュメント最適化装置500の端末情報記録部102に替えて、携帯端末1000の情報を判定する端末仕様判定部602を備える。
図17は、端末仕様判定部602による処理を説明するフローチャ−トである。なお、図17に示す処理は、図5のステップS8より前に実行されればよいが、ステップS5の前に実行させた方が望ましい。その理由は、処理結果が、他のプロセスに必要となる場合が考えられるためである。
まず、ステップS31において、端末仕様判定部602は、ドキュメントのリクエスト時に送信されたデータを取得する。そして、ステップS32では、そのデータの中に、携帯端末1000を判定できる情報があれば(S32−Yes)、ステップS33に移動する。具体的には、例えば、HTTPプロトコルの「user agent」に端末名が含まれている場合などである。ステップS33では、端末仕様判定部602が有する端末データベースに、その端末に関する情報があるかどうかを調べる。情報がある場合(S33−Yes)、ステップS34に移動する。ステップS34では、端末仕様判定部602は、端末データベースから、表示エリア、解像度、及びスクリーンサイズの情報を取得し、出力する。
一方、ステップS32で、端末を判定できる情報が無かった場合(S32−No)、ステップS35に移動し、端末の情報を取得するドキュメントを携帯端末1000に送信する。具体的には、例えば、Javascript(登録商標)で解像度、端末名などの情報の取得を行う。次に、ステップS36では、取得が成功したか否かを判定し、成功した場合、ステップS37に移動する。ステップS37では、取得した情報を端末データベースに記録し、ステップS34に移動する。
また、ステップS37で、取得が失敗した場合、ステップS38に移動する。ステップS38では、デフォルトの情報を選択し、出力する。
なお、本実施形態においてドキュメント最適化装置600は、ユーザー情報記録部508を備えるが、備えていなくてもよい。
また、上述の第1から第3の実施形態においては、携帯端末900や携帯端末1000が、PCより解像度が低い場合を説明したが、それに限定されない。例えば、移動中に通信速度が低下したり、接続が不安定になったりすることがあるため、端末に替えてPCでドキュメントを表示する場合に本発明を用いることで、状況に影響されずに快適なドキュメント閲覧環境を提供することができる。
また、図4におけるドキュメント取得部101、端末情報記録部102、ドキュメント分割部103、ユーザー関心度判定部104、提供者側重要度判定部105、ドキュメント生成部106、基本レイヤウト記録部107、および図13におけるドキュメント取得部101、端末情報記録部102、ドキュメント分割部103、ユーザー関心度判定部104、提供者側重要度判定部105、ドキュメント生成部106、基本レイヤウト記録部107、ユーザー情報記録部508、および図16におけるドキュメント取得部101、端末仕様判定部602、ドキュメント分割部103、ユーザー関心度判定部104、提供者側重要度判定部105、ドキュメント生成部106、基本レイヤウト記録部107、ユーザー情報記録部508の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
100、500、600…ドキュメント最適化装置
101…ドキュメント取得部
102…端末情報記録部
103…ドキュメント分割部
104…ユーザー関心度判定部
105…提供者側重要度判定部
106…ドキュメント生成部
107…基本レイヤウト記録部
508…ユーザー情報記録部
602…端末仕様判定部
900…端末装置
901…入力部
902…表示部
903…ブラウザー部
904…通信部
1000…携帯端末
1100…ドキュメント最適化サーバー
1201…ドキュメント提供サーバー

Claims (29)

  1. コンピューターシステムにおいて、表示装置に表示するドキュメントを変換するドキュメント変換方法であって、
    表示を要求されたドキュメントを取得する第1のステップと、
    前記取得したドキュメントをブロック要素に分割する第2のステップと、
    前記分割したブロック要素について、ドキュメントを要求した側の関心度を判定する第3のステップと、
    前記分割したブロック要素について、ドキュメントを提供する側の重要度を判定する第4のステップと、
    前記判定した関心度および重要度に基づき、前記分割したブロック要素を配置したドキュメントを生成する第5のステップと
    を含むことを特徴とするドキュメント変換方法。
  2. 前記表示装置がドキュメントを表示する領域の解像度が、前記表示を要求されたドキュメントが前提としている解像度より低いことを特徴とする請求項1に記載のドキュメント変換方法。
  3. 前記表示装置は、携帯端末であることを特徴とする請求項1に記載のドキュメント変換方法。
  4. 前記第5のステップにおいて、予め用意されたレイヤウトの情報を用いることを特徴とする請求項1に記載のドキュメント変換方法。
  5. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記レイアウトの情報は、配置可能なブロック要素の種類または数に関する制限を含むこと
    を特徴とする請求項4に記載のドキュメント変換方法。
  6. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、広告を提示するためのブロック要素、知名度の向上を目的としたブロック要素、著作権の記述を目的としたブロック要素、会員登録に関するブロック要素、有料コンテンツまたは有料サービスへの誘導を目的としたブロック要素、アフィリエイトリンクを含むブロック要素の内、少なくとも一つを識別すること
    を特徴とする請求項1に記載のドキュメント変換方法。
  7. 前記要求されたドキュメントは、マークアップ言語で記述されていることを特徴とする請求項1に記載のドキュメント変換方法。
  8. 前記マークアップ言語は、HTML言語であることを特徴とする請求項7に記載のドキュメント変換方法。
  9. 前記HTML言語は、HTML5言語であることを特徴とする請求項8に記載のドキュメント変換方法。
  10. 前記第2のステップにおいて、HTML5の<section>、<header>、<footer>、<nav>、<article>、<aside>の要素の内、少なくとも一つを用いることを特徴とする請求項9に記載のドキュメント変換方法。
  11. 前記第3のステップにおいて、<article>、<section>の要素のいずれかを用いることを特徴とする請求項10に記載のドキュメント変換方法。
  12. 前記第3のステップにおいて、前記分割したブロック要素に含まれる<p>要素の数を用いることを特徴とする請求項8または請求項9に記載のドキュメント変換方法。
  13. 前記第3のステップにおいて、前記分割したブロック要素に含まれる長い文章の数を用いることを特徴とする請求項1に記載のドキュメント変換方法。
  14. 前記第3のステップにおいて、リファラURLを用いることを特徴とする請求項1に記載のドキュメント変換方法。
  15. 前記第3のステップにおいて、検索エンジンを用いることを特徴とする請求項1に記載のドキュメント変換方法。
  16. 前記第4のステップにおいて、ドキュメントのURIを用いることを特徴とする請求項1に記載のドキュメント変換方法。
  17. 前記第4のステップにおいて、<title>要素を用いることを特徴とする請求項8または請求項9に記載のドキュメント変換方法。
  18. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、<header>要素を用いること
    を特徴とする請求項9に記載のドキュメント変換方法。
  19. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、同一ドメインにある他のドキュメントに共通するブロック要素が存在するか否かを用いること
    を特徴とする請求項1に記載のドキュメント変換方法。
  20. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、表示エリアまたは表示位置に関する情報を用いること
    を特徴とする請求項1に記載のドキュメント変換方法。
  21. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、ID属性、NAME属性のいずれかを用いること
    を特徴とする請求項8または請求項9に記載のドキュメント変換方法。
  22. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、前記要求されたドキュメント内のコメントを用いること
    を特徴とする請求項8または請求項9に記載のドキュメント変換方法。
  23. 前記分割したブロック要素について、種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、前記要求されたドキュメントのURIにおけるトップレベルドメインに応じた判定情報を、種類を識別する際に用いること
    を特徴とする請求項1に記載のドキュメント変換方法。
  24. 前記分割したブロック要素について、広告を含む種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、広告を識別するために、前記分割したブロック要素の表示エリアのサイズを用いること
    を特徴とする請求項1に記載のドキュメント変換方法。
  25. 前記分割したブロック要素について、広告を含む種類を識別する第6のステップを有し、
    前記第5のステップにおいて、前記判定した関心度および重要度に加えて、前記識別した種類に基づき、前記分割したブロック要素を配置したドキュメントを生成し、
    前記第6のステップにおいて、広告を識別するために、スクリプトのSRC属性を用いること
    を特徴とする請求項8または請求項9に記載のドキュメント変換方法。
  26. 前記第5のステップにおいて、広告の表示エリアのサイズを調整することを特徴とする請求項1に記載のドキュメント変換方法。
  27. 前記第3のステップにおいて、以前に判定された該ユーザーの関心度に関する情報を用いることを特徴とする請求項1に記載のドキュメント変換方法。
  28. 表示装置に表示するドキュメントを変換するドキュメント変換装置であって、
    表示を要求されたドキュメントを取得するドキュメント取得部と、
    前記取得したドキュメントをブロック要素に分割するドキュメント分割部と、
    前記分割したブロック要素について、ドキュメントを要求した側の関心度を判定するユーザー関心度判定部と、
    前記分割したブロック要素について、ドキュメントを提供する側の重要度を判定する提供者側重要度判定部と、
    前記判定した関心度および重要度に基づき、前記分割したブロック要素を配置したドキュメントを生成するドキュメント生成部と
    を備えることを特徴とするドキュメント変換装置。
  29. 表示装置に表示するドキュメントを変換するドキュメント変換装置におけるコンピューターシステムに、
    表示を要求されたドキュメントを取得する第1のステップと、
    前記取得したドキュメントをブロック要素に分割する第2のステップと、
    前記分割したブロック要素について、ドキュメントを要求した側の関心度を判定する第3のステップと、
    前記分割したブロック要素について、ドキュメントを提供する側の重要度を判定する第4のステップと、
    前記判定した関心度および重要度に基づき、前記分割したブロック要素を配置したドキュメントを生成する第5のステップと
    を実行させるためのプログラム。
JP2010080351A 2010-03-31 2010-03-31 ドキュメント変換方法、ドキュメント変換装置およびそのプログラム Pending JP2011215687A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010080351A JP2011215687A (ja) 2010-03-31 2010-03-31 ドキュメント変換方法、ドキュメント変換装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010080351A JP2011215687A (ja) 2010-03-31 2010-03-31 ドキュメント変換方法、ドキュメント変換装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2011215687A true JP2011215687A (ja) 2011-10-27
JP2011215687A5 JP2011215687A5 (ja) 2012-08-16

Family

ID=44945375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010080351A Pending JP2011215687A (ja) 2010-03-31 2010-03-31 ドキュメント変換方法、ドキュメント変換装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP2011215687A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016108677A1 (ko) * 2015-01-02 2016-07-07 에스케이플래닛 주식회사 웹 컨텐츠 출력 장치 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016108677A1 (ko) * 2015-01-02 2016-07-07 에스케이플래닛 주식회사 웹 컨텐츠 출력 장치 및 방법
KR20160083741A (ko) * 2015-01-02 2016-07-12 에스케이플래닛 주식회사 웹 컨텐츠 출력 장치 및 방법
US10296566B2 (en) 2015-01-02 2019-05-21 Sk Planet Co., Ltd. Apparatus and method for outputting web content that is rendered based on device information
KR102311326B1 (ko) * 2015-01-02 2021-10-13 에스케이플래닛 주식회사 웹 컨텐츠 출력 장치 및 방법

Similar Documents

Publication Publication Date Title
US10997358B1 (en) Click tracking using link styles
US10176495B2 (en) Selection of keyword phrases for providing contextually relevant content to users
JP5601730B2 (ja) 広告表示プログラム、広告表示装置、広告表示方法、記録媒体、および、広告表示システム
JP5595509B2 (ja) 表示プログラム、表示装置、情報処理方法、および、情報処理装置
KR101667344B1 (ko) 검색 결과들을 제공하는 방법 및 시스템
US9223895B2 (en) System and method for contextual commands in a search results page
US20070055748A1 (en) Systems and methods for integrating xml syndication feeds into online advertisement
US20090313127A1 (en) System and method for using contextual sections of web page content for serving advertisements in online advertising
CA2781945C (en) Information processing device, terminal device and program, content of interest determination method and program, recording medium on which program is recorded, and information provision system
RU2605039C2 (ru) Способ и система ранжирования элементов сетевого ресурса для пользователя
JP2015520894A (ja) ブラウザにおいて、カスタマイズされたアドレスバー又は検索結果を表示する方法
US11386180B2 (en) Resource locator remarketing
JP2012073863A (ja) 広告表示プログラム、広告表示装置、広告表示方法、記録媒体、および、広告表示システム
IL224401A (en) Visualization of an area in a processed code
US20160342574A1 (en) Allotment of placement locations for supplemental content in dynamic documents
US8140508B2 (en) System and method for contextual commands in a search results page
JP4859893B2 (ja) 広告配信装置、広告配信方法、及び広告配信制御プログラム
US10810635B2 (en) Server apparatus, terminal apparatus, non-transitory computer-readable storage medium having information processing program stored therein, information processing system, information processing method, and data structure
CN101311927A (zh) 页面附加信息共享管理方法和设备
JP2011096078A (ja) 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及び関連コンテンツ挿入装置
JP2011215687A (ja) ドキュメント変換方法、ドキュメント変換装置およびそのプログラム
JP2008046879A (ja) ページ表示装置、ページ表示方法、およびコンピュータプログラム
JP4921570B2 (ja) ブログサービス提供システム、方法及びプログラム
JP6698721B2 (ja) 情報表示プログラム、情報表示方法、情報表示装置、及び配信装置
KR101372580B1 (ko) 브라우저 ui를 제공하기 위한 방법, 단말 장치, 서버 및 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120702