JP3982454B2 - 携帯型電子機器、ウェブページ処理方法およびプログラム - Google Patents

携帯型電子機器、ウェブページ処理方法およびプログラム Download PDF

Info

Publication number
JP3982454B2
JP3982454B2 JP2003149958A JP2003149958A JP3982454B2 JP 3982454 B2 JP3982454 B2 JP 3982454B2 JP 2003149958 A JP2003149958 A JP 2003149958A JP 2003149958 A JP2003149958 A JP 2003149958A JP 3982454 B2 JP3982454 B2 JP 3982454B2
Authority
JP
Japan
Prior art keywords
web page
cluster
heading
determined
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003149958A
Other languages
English (en)
Other versions
JP2004355157A (ja
Inventor
雅之 中村
哲夫 由谷
和敏 永留
信太郎 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2003149958A priority Critical patent/JP3982454B2/ja
Priority to KR1020057001439A priority patent/KR20060021810A/ko
Priority to EP04734400A priority patent/EP1569137A4/en
Priority to PCT/JP2004/007307 priority patent/WO2004107212A1/ja
Priority to CNB2004800005705A priority patent/CN100401291C/zh
Publication of JP2004355157A publication Critical patent/JP2004355157A/ja
Priority to US10/523,234 priority patent/US7272787B2/en
Application granted granted Critical
Publication of JP3982454B2 publication Critical patent/JP3982454B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Description

【0001】
【発明の属する技術分野】
本発明は、ネットワークへの接続機能をもつPDA、携帯電話、テレビジョンセットなどの電子機器に適用され、ウェブ上のコンテンツを処理して、自身の表示環境に合わせて最適に表示を行う携帯型電子機器、ウェブページ処理方法、およびプログラムに関する。
【0002】
【従来の技術】
一般に、PDA(Personal Digital(Data) Assistants)、携帯電話、テレビジョンセットといったプログラム組み込み型の携帯型電子機器が持つマン・マシンインタフェースは、パーソナルコンピュータのそれに比べると貧弱であると言わざるを得ない。これに対し、Web上のコンテンツは、マウスや高解像度の表示装置を用いたパーソナルコンピュータによる閲覧表示を想定してデザインされる場合が多く、このため上記のような携帯型電子機器でWeb上のコンテンツを閲覧表示しようとすると、ユーザは様々な不具合に遭遇することを避けて通れなかった。
【0003】
たとえば、携帯型電子機器の表示デバイスは、パーソナルコンピュータのそれよりも解像度が低いものが採用される場合がほとんどである。前述したように、ウェブページの多くはパーソナルコンピュータに用いられる高解像度の表示デバイスでの閲覧表示を想定してデザインされているため、たとえば、図16に示すように、PDAのような携帯型電子機器161に備えられた低解像度の表示デバイス162では、全体のウェブページ163の一部164しか一度に表示できない場合が多く、ページ全体を見るには縦横のスクロール操作を繰り返さなければならないなど、ユーザにとって操作の負担が大きかった。
【0004】
小さい画面に表示できる情報量を高める方法には、ウェブブラウザによって、画像の省略、文字詰め、文字の折り返しなどを行う方法や、表示画面の面積に応じて、表示される文字のフォントの最適なサイズを選択する技術などがある(たとえば、特許文献1参照。)。
【0005】
【特許文献1】
特開2002−156957号公報(段落[0065]、図15)。
【0006】
【発明が解決しようとする課題】
しかし、ウェブブラウザによって、画像の省略、文字詰め、文字の折り返しなどを行っても、PDAなどが持つ小さい画面では、やはりページ全体の一部しか一度に表示できない。また、表示画面の面積に応じて、表示される文字のフォントの最適なサイズを選択する技術によっても、1画面に表示できる文字数にはやはり限界があり、また、文字が小さくなると読み辛くなるという弊害が発生する。
【0007】
本発明は、このような課題を解決するためになされるもので、ネットワークを通じて取得したウェブページを、低解像度の表示環境での閲覧に適したウェブページに再構築して表示させることができるとともに、少ないコストで、様々な種類の言語で記述されたウェブページの再構築を行うことのできる携帯型電子機器、ウェブページ処理方法およびプログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
上記目的を達成するために、本発明の携帯型電子機器は、少なくとも見出しとこの見出しに関連する本文と、前記見出しおよび本文に関連しない非関連情報とを含む第1のウェブページを取得するウェブページ取得手段と、前記ウェブページ取得手段により取得された前記第1のウェブページから前記本文を抽出して、この本文を含む第2のウェブページを作成するとともに、前記第1のウェブページから前記見出しを抽出し、この見出しを含み、かつ前記第2のウェブページへのリンクが設けられた第3のウェブページを作成するウェブページ再構築手段と、前記作成された第3のウェブページ及び第2のウェブページをそれぞれ表示するよう制御するとともに、前記非関連情報を表示しないよう制御する表示制御手段とを具備するものである。
【0009】
すなわち、この携帯型電子機器では、ネットワークを通じて取得した、見出しとこの見出しに関連する本文を含む第1のウェブページを、本文へのリンクが設けられた見出しのウェブページ(第3のウェブページ)と、本文のウェブページ(第2のウェブページ)とに分けて別画面で閲覧することを可能とした。これにより、PDAなどの携帯端末における貧弱な(低解像度の)表示環境において、パーソナルコンピュータ向けにデザインされた高解像度のウェブページ全体の内容を、スクロール操作無し、あるいは少ないスクロール量で効率良く閲覧することが可能になった。
【0010】
また、第1のウェブページの見出しがヘッドラインと小見出しとで構成され、本文が、ヘッドラインの本文と小見出しに属する記事へのリンクの一覧で構成される場合には、第3のウェブページとして、ヘッドラインの本文のページと小見出しに属する記事へのリンクの一覧ページとを作成し、第2のウェブページとして、本文へのリンクが設けられたヘッドラインと、リンク一覧ページへのリンクが設けられた小見出しとを含むページを作成するようにする。これにより、第3のウェブページでヘッドラインが指定されたなら当該ヘッドラインの本文ページを表示し、小見出しが指定されたなら当該小見出しに属する記事へのリンクの一覧ページを表示できるようになる。このように各ウェブページが全体として一定の規則性をもった形で提供されるので、ユーザにとっては、目的のウェブページに辿り着くための操作上の試行錯誤を排除することができ、ウェブページの内容そのものに集中したウェブ閲覧が可能になる。
【0011】
また、本発明の携帯型電子機器において、ウェブページ再構築手段は、第1のウェブページを内部的に描画し、この描画データに基づき第1のウェブページにおける個々の表示要素の位置を判定する表示要素位置判定手段と、判定された表示要素の位置に基づいて、個々の表示要素をレイアウト的に繋がりの強いものどうしを結び付け、いくつかのクラスタに分別するクラスタ分別手段と、個々のクラスタのレイアウト上の特徴を検出し、この特徴検出結果に基づいて第1のウェブページにおける見出しおよび本文の各クラスタを他のクラスタに対して判別する特定クラスタ判別手段と、判別された見出しおよび本文の各クラスタについて、表示要素である文字の属性が同一であるクラスタどうしを集めてグループ化し、それぞれのグループに含まれるクラスタ内の文字数の平均を算出し、平均値の高いグループを本文として決定し、平均値の低いグループを見出しとして決定する手段とを具備するものである。
【0012】
ウェブページの記述言語には、HTML、XHTML、XML+CSSなど様々な種類があるが、この発明によれば、解釈して描画できるページ記述言語であればウェブページの再構築を行うことができ、タグの意味的な繋がり解析によってウェブページを再構築する方法に比べ、ページ再構築に要するコストを抑えることができる。
【0013】
さらに、本発明の携帯型電子機器において、特定クラスタ判別手段は、最も多くの表示要素と交わるページ上の縦線を重心線として決定し、この決定された重心線を基準に、個々のクラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間およびその他のいずれかから判定し、特徴が中間として判定されたクラスタを見出しおよび本文の各クラスタとして判別し、特徴が前記左寄り、右寄りおよびその他のいずれかとして判別されたクラスタを前記非関連情報のクラスタとして判別する。
【0014】
ほとんどのウェブページにおいて、主要なコンテンツはページの横軸上の中間に配置されている。最も多くの表示要素と交わるページ上の縦線は、前記の主要なコンテンツが配置されたページ上の横軸上の位置と考えることができ、この縦線を重心線として、この重心線を基準に個々のクラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間のいずれかから判定すれば、特徴が中間として判定されたクラスタを見出しおよび本文の各クラスタとして他のクラスタに対して、高い精度で判別することが可能である。
【0015】
また、本発明の別の観点に基づくウェブページ処理方法は、処理演算部と、ウェブページを表示する表示部とを有する携帯型電子機器のウェブページ処理方法であって、少なくとも見出しとこの見出しに関連する本文と、前記見出しおよび本文に関連しない非関連情報とを含む第1のウェブページをネットワークを通じて取得するステップと、前記処理演算部による処理演算によって、前記取得した前記第1のウェブページから前記本文を抽出し、この本文を含む第2のウェブページを作成するステップと、前記処理演算部による処理演算によって、前記第1のウェブページから前記見出しを抽出し、この見出しを含み、かつ前記第2のウェブページへのリンクが設けられた第3のウェブページを作成するステップと前記作成された第3のウェブページ及び第2のウェブページをそれぞれ前記表示部に表示するよう制御するとともに、前記非関連情報を前記表示部に表示しないよう制御するステップとを具備するものである。
【0016】
すなわち、この発明のウェブページ処理方法では、ネットワークを通じて取得した、見出しとこの見出しに関連する本文を含む第1のウェブページを、本文へのリンクが設けられた見出しのウェブページ(第3のウェブページ)と、本文のウェブページ(第2のウェブページ)とに分けて別画面で閲覧することを可能とした。これにより、PDAなどの携帯端末における貧弱な(低解像度の)表示環境において、パーソナルコンピュータ向けにデザインされた高解像度のウェブページ全体の内容を、スクロール操作無し、あるいは少ないスクロール量で効率良く閲覧することが可能になった。
【0017】
また、この発明のウェブページ処理方法において、処理演算部は、第1のウェブページを内部的に描画し、この描画データに基づき第1のウェブページにおける個々の表示要素の位置を判定し、この判定した表示要素の位置に基づいて、個々の表示要素をレイアウト的に繋がりの強いものどうしを結び付け、いくつかのクラスタに分別し、個々のクラスタのレイアウト上の特徴を検出し、この特徴検出結果に基づいて第1のウェブページにおける見出しおよび本文の各クラスタを他のクラスタに対して判別し、この判別した見出しおよび本文の各クラスタについて、表示要素である文字の属性が同一であるクラスタどうしを集めてグループ化し、それぞれのグループに含まれるクラスタ内の文字数の平均を算出し、平均値の高いグループを前記本文として決定し、前記平均値の低いグループを前記見出しとして決定するようにした。
【0018】
したがって、この発明によれば、解釈して描画できるページ記述言語であればウェブページの再構築を行うことができ、タグの意味的な繋がり解析によってウェブページを再構築する方法に比べ、ページ再構築に要するコストを抑えることができる。
【0019】
さらに、この発明のウェブページ処理方法において、処理演算部は、最も多くの表示要素と交わるページ上の縦線を重心線として決定し、この決定された重心線を基準に、個々のクラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間およびその他のいずれかから判定し、特徴が中間として判定されたクラスタを見出しおよび本文の各クラスタとして判別し、特徴が前記左寄り、右寄りおよびその他のいずれかとして判別されたクラスタを前記非関連情報のクラスタとして判別するようにした。
【0020】
最も多くの表示要素と交わるページ上の縦線は、前記の主要なコンテンツが配置されたページ上の横軸上の位置と考えることができ、この縦線を重心線として、この重心線を基準に個々のクラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間のいずれかから判定すれば、特徴が中間として判定されたクラスタを見出しおよび本文の各クラスタとして他のクラスタに対して、高い精度で判別することが可能となる。
【0021】
さらに、本発明の別の観点に基づくプログラムは、少なくとも見出しとこの見出しに関連する本文と、前記見出しおよび本文に関連しない非関連情報とを含む第1のウェブページを取得するウェブページ取得手段と、前記ウェブページ取得手段により取得された前記第1のウェブページから前記本文を抽出して、この本文を含む第2のウェブページを作成するとともに、前記第1のウェブページから前記見出しを抽出し、この見出しを含み、かつ前記第2のウェブページへのリンクが設けられた第3のウェブページを作成するウェブページ再構築手段と、前記作成された第3のウェブページ及び第2のウェブページをそれぞれ表示するよう制御するとともに、前記非関連情報を表示しないよう制御する表示制御手段としてコンピュータを機能させるものである。
【0022】
この発明のプログラムによれば、ネットワークを通じて取得した、見出しとこの見出しに関連する本文を含む第1のウェブページを、本文へのリンクが設けられた見出しのウェブページ(第3のウェブページ)と、本文のウェブページ(第2のウェブページ)とに分けて別画面で閲覧することを可能とした。これにより、PDAなどの携帯端末における貧弱な(低解像度の)表示環境において、パーソナルコンピュータ向けにデザインされた高解像度のウェブページ全体の内容を、スクロール操作無し、あるいは少ないスクロール量で効率良く閲覧することが可能になった。
【0023】
また、この発明のプログラムにおいて、ウェブページ再構築手段は、第1のウェブページを内部的に描画し、この描画データに基づき前記第1のウェブページにおける個々の表示要素の位置を判定する表示要素位置判定手段と、判定された表示要素の位置に基づいて、個々の表示要素をレイアウト的に繋がりの強いものどうしを結び付け、いくつかのクラスタに分別するクラスタ分別手段と、個々のクラスタのレイアウト上の特徴を検出し、この特徴検出結果に基づいて第1のウェブページにおける見出しおよび本文の各クラスタを他のクラスタに対して判別する特定クラスタ判別手段と、判別された見出しおよび本文の各クラスタについて、表示要素である文字の属性が同一であるクラスタどうしを集めてグループ化し、それぞれのグループに含まれるクラスタ内の文字数の平均を算出し、平均値の高いグループを前記本文として決定し、平均値の低いグループを見出しとして決定する手段としてコンピュータを機能させるものである。
【0024】
この発明によれば、解釈して描画できるページ記述言語であればウェブページの再構築を行うことができ、タグの意味的な繋がり解析によってウェブページを再構築する方法に比べ、ページ再構築に要するコストを抑えることができる。
【0025】
さらに、この発明のプログラムにおいて、特定クラスタ判別手段は、最も多くの前記表示要素と交わるページ上の縦線を重心線として決定し、この決定された重心線を基準に、前記個々のクラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間およびその他のいずれかから判定し、特徴が中間として判定されたクラスタを前記見出しおよび前記本文の各クラスタとして判別し、特徴が前記左寄り、右寄りおよびその他のいずれかとして判別されたクラスタを前記非関連情報のクラスタとして判別する手段としてコンピュータを機能させることを特徴とする。
【0026】
この発明によれば、特徴が中間として判定されたクラスタを見出しおよび本文の各クラスタとして高い精度で判別することが可能となる。
【0027】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づき説明する。
【0028】
図1は本発明の一実施形態にかかる携帯型電子機器の電気的な構成を示すブロック図である。
【0029】
同図に示すように、この携帯型電子機器100は、処理演算部としてのCPU(Central Processing Unit)1、メインメモリ2、プログラム/データ記憶部3、インターネットなどのネットワーク4との接続を処理するネットワークインタフェース部5、ユーザに情報を視覚的に提供する表示デバイス6、表示デバイス6の画面への描画処理をVRAM(video RAM)7を用いて行うグラフィックコントローラ8、ジョグダイヤルなどのユーザの操作入力部9からの入力を処理するユーザインタフェースコントローラ10、そして以上の各部の間で信号を伝達するためのバス11を備える。
【0030】
CPU1は、たとえばプログラム/データ記憶部3に記憶されたプログラムやデータ、ユーザによる操作入力部9からの入力などに基づき、メインメモリ2をワークエリアとして用いて各種の演算処理や制御を実行する。メインメモリ2は、たとえば、RAM(Random Access Memory)などの、ランダムに読み取りと書き込みが可能な高速なメモリからなる。プログラム/データ記憶部3は、読み取り専用あるいは読み書き可能な不揮発性の記憶装置であり、たとえばROM(Read Only Memory)、フラッシュROM、ディスクドライブなどである。
【0031】
表示デバイス6は、具体的には、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、OEL(Organic Electroluminescence)などである。ユーザの操作入力部9は、具体的には、簡易キーボード、IR(Infrared)リモートコントローラ、ジョグダイヤル、プッシュボタンなどである。
【0032】
ネットワークインタフェース部5は、たとえばアナログモデム、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、ADSL(Asymmetric Digital Subscriber Line)、FTTH(Fiber-To-The-Home)、Bluetooth、FOMA(W−CDMA)などである。
【0033】
この携帯型電子機器100では、取得したウェブページを自身の表示装置の解像度などの表示環境に適した形態に再構築して、表示閲覧する機能を備えている。
【0034】
プログラム/データ記憶部3には、この携帯型電子機器100を動作させるためのOS(Operating System)などの基本プログラムのほか、この基本プログラムの下でウェブページの再構築を実行するページ再構築プログラム、ウェブブラウザなどが格納されており、これらのプログラムは、メインメモリ2にロードされてCPU1によって解釈、実行される。
【0035】
図2は、当該ページ再構築プログラムのモジュール構成を示す図である。同図に示すように、ページ再構築プログラム21は、アダプテーションプロキシ31、アダプテーションエンジン32、およびクラスタリングエンジン33で構成されている。
【0036】
次に、このページ再構築プログラム21の処理手順を説明する。図3は、このページ再構築プログラム21の処理手順を示すフローチャートである。なお、ここでは携帯型電子機器100の一例として、PDAなどの携帯端末100を考える。
【0037】
まず、この携帯端末100において、URLがユーザより入力される。この際、図4に示すように、URL(例:http://www.somewhere.com)51の後ろにページ再構築のための識別子(例:"/??ID=index")52を付加し、ページ閲覧要求を入力することで、この要求はページ再構築プログラムにページ再構築の要求として与えられる(ST301)。
【0038】
ページ再構築プログラム21は、ページ再構築の要求を受けると、アダプテーションプロキシ31を起動させ、これにURLを渡す。アダプテーションプロキシ31は、URLに基づいてインターネットからオリジナルのウェブページ34をダウンロードし、アダプテーションエンジン32に渡す(ST302)。
【0039】
アダプテーションエンジン32は、取得したウェブページ34のソースをDOM(Document Object Model)ツリー35の形でメインメモリ2に保存し、ウェブページを内部的に描画する(表示はしない)。続いて、当該ウェブページにおける文字列や画像などの表示要素の画面上の描画位置を求め、その位置情報をタグと組み合わせてメインメモリにタグ/位置情報36として保存する(ST303)。なお、表示要素の描画位置は文字フォントのサイズ、文字数、画像サイズによって変わってくるので、文字の場合には文字フォントのサイズと文字数などを加味して描画位置が求められ、画像の場合には画像サイズなどを加味して描画位置が求められる。
【0040】
DOMツリーとは、ページ全体のタグ、文字、画像などの要素をツリー階層化して、アプリケーションによるページの検索、編集などを可能としたものである。また、DOMは、XML(eXtensible Markup Language)文書をツリー構造のノード・オブジェクトの集合としてアクセスするためのAPI(Application Programming Interface)である。XMLのAPIとしては、DOMのほかにSAX(Simple API for XML)がある。
【0041】
この後、アダプテーションエンジン32は、タグ/位置情報36をクラスタリングエンジン33に渡し、クラスタ化を行うようにクラスタリングエンジン33に指示する。クラスタリングエンジン33は、タグ/位置情報36に基づき、視覚的に繋がりの強い(距離の近い)タグ(表示要素)どうしを結び付けて、ウェブページ中の各タグ(表示要素)をいくつかの塊(クラスタ)に分別し(ST304)、その分別したクラスタの情報をメインメモリ2にクラスタリスト37として保存する。
【0042】
図5の符合70は、オリジナルのウェブページ60に対して、各表示要素61a〜61lのクラスタ化を行った結果を示している。71a〜711は個々のクラスタを示している。71bはウェブページ上のヘッドライン(見出し)61bのクラスタ、71cはヘッドラインの本文61cのクラスタ、71f、71h、71jはそれぞれ小見出し61f、61h、61jのクラスタ、71g、71i、71kはそれぞれ小見出しに属する記事リスト61g、61i、61kの部分のクラスタである。ヘッドライン61bおよび小見出し61f、61h、61jは他の表示要素と視覚的な繋がりを持たないため、それぞれが個々のクラスタ71b、71f、71h、71jとして生成されている。また、記事リスト61g、61i、61kは一つの小見出しに属する集合ごとに一つのクラスタ71g、71i、71kとして生成されている。これ以外にも、いくつかの表示情報がクラスタ71a、71d、71lとして得られている。
【0043】
クラスタ化の手法には、たとえば、2Dデータマイニング分野で広く知られているグリッドペースの手法を利用できる(参考:http://www.cs.ualberta.ca/~zaiane/courses/cmput695-00/papers/wave.pdf)。
【0044】
続いて、クラスタリングエンジン33は、生成した個々のクラスタ71a〜71lについてレイアウト上の特徴を抽出して、レイアウト上の意味付けを行う。すなわち、図6に示すように、個々のクラスタ71a〜71lを「左寄り」(L)、「右寄り」(R)、「ヘッドライン(小見出しも含む)」(H)、「本体(記事リンクを含む)」(B)、「未使用」(U)の5種類の意味に分類し(ST305)、その結果をアダプテーションエンジン32に渡す。このクラスタの分類については後で詳細を説明する。
【0045】
図2に戻って、アダプテーションエンジン32は、各クラスタの分類結果を基にウェブページの再構築を行い(ST306)、再構築したページの情報38をメインメモリ2に格納する。この後、ウェブブラウザは、メインメモリ2に格納された再構築ページの情報38を読み込んで表示デバイス6の画面に表示する(ST307)。
【0046】
次に、クラスタの分類方法の詳細を説明する。
【0047】
図7はクラスタ分類の処理手順を示すフローチャート、図8は図7のクラスタ分類の処理手順において重心線を決定するための処理手順、図9は重心線決定の具体例、図10は図7のクラスタ分類の処理手順においてクラスタのレイアウト上の意味を「左寄り」「右寄り」「未使用」の中から決定する処理手順、図11は図10のクラスタのレイアウト上の意味を決定する処理の具体例、図12は図7のクラスタ分類の処理手順においてクラスタのレイアウト上の意味を「ヘッドライン(小見出しも含む)」「本体(記事リンクを含む)」のうちから決定する処理手順である。
【0048】
まず、図7のST701で、クラスタリングエンジン33は、各クラスタのレイアウト上の特徴を検出するための基準の一つとなる、ページ画面の重心線を決定する。重心線とは、ページ画面上で最も多くの表示要素が配置された、Y軸に沿った線である。
【0049】
この重心線を決定する具体的な方法としては、たとえば、図8の処理手順および図9の具体例に示すように、まず、クラスタ化されたページ画面全体81をたとえば4×4の16の領域に等分割するグリッド線82を設定する(ST801)。ページ中心部分のたとえば2×2の4つの領域について、左右(X軸方向の)いずれか一方の端から一定間隔(Δd)を置いたY軸方向のラインごとに、存在する表示要素の数(P)をカウントし(ST802)、最大のカウント値Pmaxが得られたY軸方向のラインを重心線83として決定する(ST803−806)。
【0050】
このようにして重心線83が決定した後、図7のST702で、個々のクラスタのレイアウト上の意味を「左寄り」「右寄り」「未使用」の中から決定する処理が行われる。この処理の具体的な方法としては、たとえば、図10の処理手順と図11の具体例に示すように、まず、たとえばグリッド線82によって分割された4×4の16の領域の上部4×3の12個の領域において、重心線83と交わるクラスタ71a、71b、71c、71f、71g、71h、71i、71j、71kのうち、最も左寄りに突出している(最小のX座標である)クラスタ(この例では71c)の左端のX座標値をとるY軸方向のライン121を左境界線として判定するとともに、最も右寄りに突出している(最大のX座標である)クラスタ(この例では71i)の右端のX座標値をとるY軸方向のライン122を右境界線として判定する(ST1001)。これにより、ページ画面全体81は左右境界線121、122を境にして3つの領域に区切られることになる。
【0051】
この後、クラスタリングエンジン33は、クラスタリスト37から、一つのクラスタの情報を取り出す(ST1002)。このクラスタの情報は、このクラスタを構成する表示要素に関する情報(タグ、位置情報)を含んでいる。クラスタリングエンジン33は、このクラスタの情報に基づいて、クラスタのレイアウト上の意味を「左寄り」「右寄り」「未使用」の中から次のようにして決定する。 まず、左境界線121と右境界線122との双方にまたがるクラスタの場合は(ST1003のYES)、そのクラスタを「未使用」のクラスタとして分類し(ST1007)、クラスタリスト37から除外する(ST1008)。
【0052】
クラスタが、左境界線121より左側の領域に完全に包含される場合は(ST1004のYES)、そのクラスタを「左寄り」のクラスタとして分類し(ST1009)、右境界線122より右側の領域に完全に包含される場合は(ST1004のYES)、そのクラスタを「右寄り」のクラスタとして分類し(ST1009)、クラスタリスト37から除外する(ST1010)。
【0053】
また、クラスタが、左境界線121より左側の領域に完全には包含されないが(ST1004のNO)、左境界線121または右境界線122の一方の境界線にまたがっている場合には(ST1005のYES)、クラスタの重心線を計算し(ST1011)、重心線が左境界線121と右境界線122のどちらに近いかよって、すなわち左境界線121に近い場合には「左寄り」のクラスタとして、右境界線122に近い場合には「右寄り」のクラスタとして分類し(ST1012)、クラスタリストから除外する(ST1013)。
【0054】
以上の処理を、クラスタリストに登録されている、一つ一つのクラスタについて繰り返す(ST1006)。
【0055】
以上の処理で「左寄り」「右寄り」「未使用」のどれにも分類されなかったクラスタは「ヘッドライン(小見出しも含む)」または「本文(記事へのリンクも含む)」のいずれかである。このクラスタ分類は、たとえば図12に示す手順で行われる。
【0056】
まず、クラスタリングエンジン33は、クラスタリストからクラスタの情報を取り出してメインメモリ2上で内部的に描画展開し(ST1201)、図11に示した左境界線121と右境界線122との間の領域をスキャンする(ST1202)。続いて、フォントのサイズ、色、書体、背景色など、共通の表示属性を有するクラスタ(以下「同属クラスタ」という。)を一つのグループとして決定する(ST1203)。
【0057】
次に、クラスタリングエンジン33は、決定したグループのなかで、クラスタ数の多い2つのグループを選択し(ST1204)、それぞれのグループについて、同属クラスタ内での文字数などの情報量の平均を算出する(ST1205)。これにより、情報量の平均値の高い(文字数の多い)グループを「本文(記事リンクを含む)」として決定し、情報量の平均値の低い(文字数の少ない)グループを「ヘッドライン(小見出し含む)」として決定する(ST1206)。
【0058】
次に、ウェブページの再構築の詳細を説明する。
【0059】
アダプテーションエンジン32は、たとえば図13に示すように、ヘッドライン131と小見出し132とで構成されるトップページ133、小見出し132に属する記事へのリンク134を集めた記事リンク集ページ135、ヘッドライン131の本文や小見出し132に属する記事で構成される本文・記事ページ136、137などの再構築を行う。
【0060】
トップページ133において、ヘッドライン131がジョグダイヤルなどの操作でユーザによって選択された場合、そのヘッドライン131に設定されたハイパーリンクによって本文・記事ページ137の表示へと切り替わる。また、トップページ133において、任意の小見出し132がユーザによって選択された場合には、その選択された小見出し132に設定されたハイパーリンクによって、その小見出し132に属する記事リンク集ページ135が表示され、さらに、この記事リンク集ページ135において任意の記事へのリンク134がユーザによって選択されることで、そのリンク先の本文・記事ページ136が表示される。再度、他の本文・記事ページを表示したい場合は、ウェブブラウザの戻りボタンなどを用いて、トップページ133や記事リンク集ページ135に戻って、同様な操作を繰り返せばよい。
【0061】
これらのページのレイアウトは、あらかじめ、携帯端末の表示画面のサイズ、解像度などの表示環境に合わせて最適に設定されている。
【0062】
図14はウェブページの再構築(トップページ133の作成時)の処理手順を示すフローチャートである。
【0063】
まず、アダプテーションエンジン32は、クラスタの分類データをロードする(ST1401)。続いて、オリジナルのDOMツリー(図2の35)から降順にタグを読み込み(ST1402)、クラスタの分類データに基づいて、オリジナルのDOMツリーから、ヘッドラインまたは小見出しのタグを検索し(ST1404)、再構築ページのDOMツリーに該当タグを追加する(ST1405)。オリジナルのDOMツリーに次の該当するタグがあれば(ST1406のYES)、ST502に戻ってそのタグを読み込み、当該次のタグがヘッドラインのタグではなければ(小見出しであれば)(ST1403のNO)、この小見出しのタグをオリジナルのDOMツリーから検索し(ST1404)、再構築ページのDOMツリーに該当タグを追加する(ST1405)。このようにして、オリジナルのDOMツリーから、トップページ133を構成するヘッドラインと小見出しのタグをそれぞれ検索して、再構築ページのDOMツリーに追加し、再構築ページを完成させる。
【0064】
記事リンク集ページ135および本文・記事ページ136について同様に、ST1404で、クラスタの分類データに基づいて、オリジナルのDOMツリーから、記事リンクおよび本文・記事を検索し、ST1405で、再構築ページのDOMツリーに該当タグを追加することによって作成することができる。そして、以上のように作成した各再構築ページに必要なリンクを設定することによって、図13に示したようなページの移動を実現することができる。
【0065】
このように本実施形態によれば、パーソナルコンピュータの表示環境向けにデザインされたウェブページを、PDAなどの携帯端末の表示環境に適したデザインに変換して表示させることができる。具体的には、携帯端末の表示画面に一度に表示可能なサイズ(解像度)のウェブページを再構築することで、スクロール操作無しでウェブページ全体の閲覧が可能になる。また、ヘッドラインと小見出しとでメインページを構成し、このトップページでヘッドラインが指定されたなら当該ヘッドラインの本文ページを表示し、小見出しが指定されたなら当該小見出しに属する記事へのリンクの一覧ページを表示させたりすることができる。このように各ウェブページが全体として一定の規則性をもった形で提供されるので、ユーザにとって効率的なウェブ閲覧が可能になる。さらに言うならば、目的のウェブページに辿り着くための操作上の試行錯誤を排除することができ、内容そのものに集中したウェブ閲覧が可能になる。
【0066】
また、本実施形態によれば、解釈して描画できるページ記述言語であれば、ウェブページの再構築を行うことができる。すなわち、HTML(HyperText Markup Language)、XHTML(eXtensible HyperText Markup Language)、XML+CSS(cading Style Sheets)など、ウェブページの記述言語には様々な種類があるが、本実施形態は、これら様々な記述言語で作成されたウェブページの再構築を同一のロジックで実現し得るものである。これに対して、タグの意味的な繋がり(セマンティクス)解析によってウェブページを再構築する方法があるが、この方法ではページ記述言語の種類ごとに対応する解析プログラムが必要となり、また、多大な解析時間を要する。本実施形態は、このようなタグの意味的な繋がり解析によってウェブページを再構築する方法に比べ、ページ再構築に要するコストを大幅に低減することができる。
【0067】
また、本実施形態は、オリジナルのウェブページのタグを用いて再構築ページを作成するので、再構築したウェブページを既存のウェブブラウザをそのまま用いて閲覧できるという利点がある。また、言語の種類(日本語、英語など)やロケールに依存することなく、ウェブページの再構築を行うことができる。
【0068】
なお、ページ再構築プログラムは、Web対応電子機器装置100に組み込んで用いられることに止まらず、パーソナルコンピュータやサーバ用途のコンピュータなどに、記憶媒体や通信媒体を通じて組み込み可能なプログラムとして提供してもよい。
【0069】
たとえば、図15に示すように、ページ再構築プログラムを構成するモジュールであるアダプテーションプロキシ31、アダプテーションエンジン32、クラスタリングエンジン33を、LAN(Local Area Network)やインターネットなどのネットワーク151上に存在するサーバ152に組み込んでおき、サーバ152が、PDAなどの携帯型電子機器であるクライアント153からのリクエストを受けて、クライアント153が指定するウェブページをウェブサイト154から取得し、ウェブページの再構築のための一連の処理を行って、再構築ページをクライアント153にネットワーク151を介して配信するように構成してもよい。
【0070】
また、アダプテーションプロキシ、アダプテーションエンジン、クラスタリングエンジンの各機構を複数のサーバに分散して配置し、複数のサーバが協働してウェブページの再構築に係る一連の処理を分散して行うように構成してもよい。
【0071】
なお、本発明は上述したいずれの実施形態にも限定されず、本発明の技術思想の範囲内で適宜変更して実施できる。
【0072】
【発明の効果】
以上説明したように本発明によれば、低解像度の表示環境において、パーソナルコンピュータ向けにデザインされた高解像度のウェブページ全体の内容を、スクロール操作無し、あるいは少ないスクロール量で効率良く閲覧することができるとともに、少ないコストで、様々な種類の言語で記述されたウェブページの再構築を行うことが可能になる。
【図面の簡単な説明】
【図1】 本発明の一実施形態にかかる携帯型電子機器の電気的な構成を示すブロック図である。
【図2】 ページ再構築プログラムのモジュール構成を示す図である。
【図3】 ページ再構築プログラムの処理手順を示すフローチャートである。
【図4】 携帯端末においてページ再構築のための識別子を付加したURLの入力の様子を示す図である。
【図5】 オリジナルのウェブページの例と、このウェブページに対して各表示要素のクラスタ化を実施した結果を示す図である。
【図6】 クラスタのレイアウト上での意味分類の結果の例を示す図である。
【図7】 クラスタ分類の処理手順を示すフローチャートである。
【図8】 図7のクラスタ分類処理において重心線を決定するための処理手順を示すフローチャートである。
【図9】 重心線の決定の具体例を示す図である。
【図10】 図7のクラスタ分類処理においてクラスタのレイアウト上の意味を「左寄り」「右寄り」「未使用」の中から決定する処理手順を示すフローチャートである。
【図11】 図10のクラスタのレイアウト上の意味を決定する処理の具体例を示す図である。
【図12】 図7のクラスタ分類処理においてクラスタのレイアウト上の意味を「ヘッドライン(小見出しも含む)」「本体(記事リンクを含む)」のうちから決定する処理手順を示すフローチャートである。
【図13】 再構築されたウェブページの例を示す図である。
【図14】 ウェブページの再構築(トップページの作成時)の処理手順を示すフローチャートである。
【図15】 ネットワーク上のサーバでウェブページの再構築を行う場合の構成を示すブロック図である。
【図16】 一般的なウェブページを低解像度の表示デバイスに表示させた様子を示す図である。
【符号の説明】
1 CPU
2 メインメモリ
3 プログラム/データ記憶部
4 ネットワーク
6 表示デバイス
21 ページ再構築プログラム
31 アダプテーションプロキシ
32 アダプテーションエンジン
33 クラスタリングエンジン
60 オリジナルのウェブページ
61a〜61l オリジナルのウェブページの表示要素
61b オリジナルのウェブページのヘッドライン
61c オリジナルのウェブページの本文
61f、61h、61j オリジナルのウェブページの小見出し
61g、61i、61k オリジナルのウェブページの記事リスト
71a〜71l クラスタ
100 携帯型電子機器
131 再構築ウェブページのヘッドライン
132 再構築ウェブページの小見出し
133 トップページ
135 記事リンク集ページ
136 記事ページ
137 本文ページ

Claims (6)

  1. 少なくとも見出しと、この見出しに関連する本文と、前記見出しおよび本文に関連しない非関連情報とを含む第1のウェブページを取得するウェブページ取得手段と、
    前記ウェブページ取得手段により取得された前記第1のウェブページから前記本文を抽出して、この本文を含む第2のウェブページを作成するとともに、前記第1のウェブページから前記見出しを抽出し、この見出しを含み、かつ前記第2のウェブページへのリンクが設けられた第3のウェブページを作成するウェブページ再構築手段と、
    前記作成された第3のウェブページ及び第2のウェブページをそれぞれ表示するよう制御するとともに、前記非関連情報を表示しないよう制御する表示制御手段と
    を具備し、
    前記ウェブページ再構築手段は、
    前記第1のウェブページを内部的に描画し、この描画データに基づき前記第1のウェブページにおける個々の表示要素の位置を判定する表示要素位置判定手段と、
    前記判定された表示要素の位置に基づいて、前記個々の表示要素をレイアウト的に繋がりの強いものどうしを結び付け、いくつかのクラスタに分別するクラスタ分別手段と、
    最も多くの前記表示要素と交わるページ上の縦線を重心線として決定し、この決定された重心線を基準に、前記各クラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間およびその他のいずれかから判定し、前記特徴が中間として判定されたクラスタを前記見出しおよび前記本文の各クラスタとして判別し、前記特徴が前記左寄り、右寄りおよびその他のいずれかとして判別されたクラスタを前記非関連情報のクラスタとして判別する特定クラスタ判別手段と、
    前記判別された前記見出しおよび前記本文の各クラスタについて、表示要素である文字の属性が同一であるクラスタどうしを集めてグループ化し、それぞれのグループに含まれるクラスタ内の文字数の平均を算出し、平均値の高いグループを前記本文として決定し、前記平均値の低いグループを前記見出しとして決定する手段とを有する
    ことを特徴とする携帯型電子機器。
  2. 請求項1に記載の携帯型電子機器であって、
    前記本文は、前記見出しに属する記事へのリンクの一覧を含むことを特徴とする携帯型電子機器。
  3. 処理演算部と、ウェブページを表示する表示部とを有する携帯型電子機器のウェブページ処理方法であって、
    少なくとも見出しと、この見出しに関連する本文と、前記見出しおよび本文に関連しない非関連情報とを含む第1のウェブページをネットワークを通じて取得するステップと、
    前記処理演算部による処理演算によって、前記取得した前記第1のウェブページから前記本文を抽出し、この本文を含む第2のウェブページを作成するとともに、前記第1のウェブページから前記見出しを抽出し、この見出しを含み、かつ前記第2のウェブページへのリンクが設けられた第3のウェブページを作成するステップと
    前記作成された第3のウェブページ及び第2のウェブページをそれぞれ前記表示部に表示するよう制御するとともに、前記非関連情報を前記表示部に表示しないよう制御するステップと
    を具備し、
    前記第2及び第3のウェブページを作成するステップは、
    前記第1のウェブページを内部的に描画し、この描画データに基づき前記第1のウェブページにおける個々の表示要素の位置を判定するステップと、
    前記判定した表示要素の位置に基づいて、前記個々の表示要素をレイアウト的に繋がりの強いものどうしを結び付け、いくつかのクラスタに分別するステップと、
    最も多くの前記表示要素と交わるページ上の縦線を重心線として決定し、この決定され た重心線を基準に、前記各クラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間およびその他のいずれかから判定し、前記特徴が中間として判定されたクラスタを前記見出しおよび前記本文の各クラスタとして判別し、前記特徴が前記左寄り、右寄りおよびその他のいずれかとして判別されたクラスタを前記非関連情報のクラスタとして判別するステップと、
    前記判別した見出しおよび本文の各クラスタについて、表示要素である文字の属性が同一であるクラスタどうしを集めてグループ化し、それぞれのグループに含まれるクラスタ内の文字数の平均を算出し、平均値の高いグループを前記本文として決定し、前記平均値の低いグループを前記見出しとして決定するステップとを有する
    ことを特徴とするウェブページ処理方法。
  4. 請求項に記載のウェブページ処理方法であって、
    前記本文は、前記見出しに属する記事へのリンクの一覧を含むことを特徴とするウェブページ処理方法。
  5. 少なくとも見出しと、この見出しに関連する本文と、前記見出しおよび本文に関連しない非関連情報とを含む第1のウェブページを取得するウェブページ取得手段と、
    前記ウェブページ取得手段により取得された前記第1のウェブページから前記本文を抽出して、この本文を含む第2のウェブページを作成するとともに、前記第1のウェブページから前記見出しを抽出し、この見出しを含み、かつ前記第2のウェブページへのリンクが設けられた第3のウェブページを作成するウェブページ再構築手段と、
    前記作成された第3のウェブページ及び第2のウェブページをそれぞれ表示するよう制御するとともに、前記非関連情報を表示しないよう制御する表示制御手段
    としてコンピュータを機能させ
    前記ウェブページ再構築手段を、
    前記第1のウェブページを内部的に描画し、この描画データに基づき前記第1のウェブページにおける個々の表示要素の位置を判定する表示要素位置判定手段と、
    前記判定された表示要素の位置に基づいて、前記個々の表示要素をレイアウト的に繋がりの強いものどうしを結び付け、いくつかのクラスタに分別するクラスタ分別手段と、
    最も多くの前記表示要素と交わるページ上の縦線を重心線として決定し、この決定された重心線を基準に、前記各クラスタのレイアウト上の特徴を、少なくとも、左寄り、右寄り、その中間およびその他のいずれかから判定し、前記特徴が中間として判定されたクラスタを前記見出しおよび前記本文の各クラスタとして判別し、前記特徴が前記左寄り、右寄りおよびその他のいずれかとして判別されたクラスタを前記非関連情報のクラスタとして判別する特定クラスタ判別手段と、
    前記判別された前記見出しおよび前記本文の各クラスタについて、表示要素である文字の属性が同一であるクラスタどうしを集めてグループ化し、それぞれのグループに含まれるクラスタ内の文字数の平均を算出し、平均値の高いグループを前記本文として決定し、前記平均値の低いグループを前記見出しとして決定する手段
    として機能させることを特徴とするプログラム。
  6. 請求項に記載のプログラムであって、
    前記本文は、前記見出しに属する記事へのリンクの一覧を含むことを特徴とするプログラム。
JP2003149958A 2003-05-27 2003-05-27 携帯型電子機器、ウェブページ処理方法およびプログラム Expired - Lifetime JP3982454B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2003149958A JP3982454B2 (ja) 2003-05-27 2003-05-27 携帯型電子機器、ウェブページ処理方法およびプログラム
KR1020057001439A KR20060021810A (ko) 2003-05-27 2004-05-21 웹 대응 전자 기기 장치, 웹페이지 처리 방법 및 프로그램
EP04734400A EP1569137A4 (en) 2003-05-27 2004-05-21 INTERNET COMPATIBLE ELECTRONIC DEVICE, WEB PAGE PROCESSING METHOD, AND PROGRAM
PCT/JP2004/007307 WO2004107212A1 (ja) 2003-05-27 2004-05-21 ウェブ対応電子機器装置、ウェブページ処理方法およびプログラム
CNB2004800005705A CN100401291C (zh) 2003-05-27 2004-05-21 网络兼容电子装置和网页处理方法
US10/523,234 US7272787B2 (en) 2003-05-27 2005-01-26 Web-compatible electronic device, web page processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003149958A JP3982454B2 (ja) 2003-05-27 2003-05-27 携帯型電子機器、ウェブページ処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2004355157A JP2004355157A (ja) 2004-12-16
JP3982454B2 true JP3982454B2 (ja) 2007-09-26

Family

ID=33487163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003149958A Expired - Lifetime JP3982454B2 (ja) 2003-05-27 2003-05-27 携帯型電子機器、ウェブページ処理方法およびプログラム

Country Status (6)

Country Link
US (1) US7272787B2 (ja)
EP (1) EP1569137A4 (ja)
JP (1) JP3982454B2 (ja)
KR (1) KR20060021810A (ja)
CN (1) CN100401291C (ja)
WO (1) WO2004107212A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060117269A1 (en) * 2004-11-29 2006-06-01 Inventec Appliances Corporation Method for displaying multiple frames on small screen of communication device
US7509575B2 (en) * 2005-03-30 2009-03-24 Nokia Corporation Optimization of content
US7788577B2 (en) 2005-09-23 2010-08-31 Google Inc. Displaying information on a mobile device
US7464078B2 (en) * 2005-10-25 2008-12-09 International Business Machines Corporation Method for automatically extracting by-line information
CN100452039C (zh) * 2005-11-18 2009-01-14 财团法人资讯工业策进会 网页数据显示的转换方法以及系统
JP2007279795A (ja) * 2006-04-03 2007-10-25 Ibm Japan Ltd プログラムによって表示される画面が仕様を満たすか判断するシステム
KR100784633B1 (ko) 2006-06-05 2007-12-12 박희섭 웹브라우저에서 위지위그 방식으로 편집되는 이층 구조의구성요소들을 조립하여 만드는 홈페이지 제작방법
JP4720695B2 (ja) * 2006-09-15 2011-07-13 株式会社日立製作所 コンテンツ提供方法
US9128596B2 (en) * 2006-09-22 2015-09-08 Opera Software Asa Method and device for selecting and displaying a region of interest in an electronic document
TWI338846B (en) * 2006-12-22 2011-03-11 Univ Nat Pingtung Sci & Tech A method for grid-based data clustering
US20080244381A1 (en) * 2007-03-30 2008-10-02 Alex Nicolaou Document processing for mobile devices
US8762556B2 (en) 2007-06-13 2014-06-24 Apple Inc. Displaying content on a mobile device
US9418171B2 (en) * 2008-03-04 2016-08-16 Apple Inc. Acceleration of rendering of web-based content
US8477143B2 (en) * 2008-03-04 2013-07-02 Apple Inc. Buffers for display acceleration
US8289333B2 (en) * 2008-03-04 2012-10-16 Apple Inc. Multi-context graphics processing
CA2722833A1 (en) * 2008-07-29 2010-02-04 Research In Motion Limited Method and system for rendering a representation of a webpage on a display
JP4788841B2 (ja) * 2008-09-29 2011-10-05 日本電気株式会社 Gui評価システム、gui評価方法およびgui評価用プログラム
US8645815B2 (en) 2008-09-29 2014-02-04 Nec Corporation GUI evaluation system, GUI evaluation method, and GUI evaluation program
WO2010035391A1 (ja) * 2008-09-29 2010-04-01 日本電気株式会社 Gui評価システム、gui評価方法およびgui評価プログラム
US9594730B2 (en) * 2010-07-01 2017-03-14 Yahoo! Inc. Annotating HTML segments with functional labels
US8713473B2 (en) 2011-04-26 2014-04-29 Google Inc. Mobile browser context switching
US20120311427A1 (en) * 2011-05-31 2012-12-06 Gerhard Dietrich Klassen Inserting a benign tag in an unclosed fragment
US20130298068A1 (en) * 2012-01-31 2013-11-07 Samsung Electronics Co., Ltd. Contents display method and mobile terminal implementing the same
US20130339840A1 (en) * 2012-05-08 2013-12-19 Anand Jain System and method for logical chunking and restructuring websites
CN103544155B (zh) 2012-07-09 2018-01-09 百度在线网络技术(北京)有限公司 用于移动终端的网页显示方法及装置
US20140189586A1 (en) 2012-12-28 2014-07-03 Spritz Technology Llc Methods and systems for displaying text using rsvp
US8903174B2 (en) 2012-07-12 2014-12-02 Spritz Technology, Inc. Serial text display for optimal recognition apparatus and method
US9483109B2 (en) 2012-07-12 2016-11-01 Spritz Technology, Inc. Methods and systems for displaying text using RSVP
US9552596B2 (en) 2012-07-12 2017-01-24 Spritz Technology, Inc. Tracking content through serial presentation
US8843941B2 (en) 2012-08-20 2014-09-23 Comcast Cable Communications, Llc Adaptable application programming interfaces and specification of same
CN104239332A (zh) * 2013-06-18 2014-12-24 腾讯科技(深圳)有限公司 网页内容处理方法、装置及浏览器客户端
KR102306149B1 (ko) * 2013-09-12 2021-09-28 윅스.컴 리미티드 모바일 및 다른 디스플레이 환경을 지원하기 위하여 대화형 사이트 및 애플리케이션을 자동 변환하는 시스템 및 방법
US9665617B1 (en) * 2014-04-16 2017-05-30 Google Inc. Methods and systems for generating a stable identifier for nodes likely including primary content within an information resource
WO2016153081A1 (en) * 2015-03-20 2016-09-29 Lg Electronics Inc. Electronic device and method for controlling the same
MX2018001256A (es) * 2015-07-30 2018-09-28 Wix Com Ltd Sistema que integra un sistema de creacion, edicion y distribución de aplicaciones de dispositivo móvil con un sistema de diseño de sitio web.
US11048933B2 (en) 2019-07-31 2021-06-29 Intuit Inc. Generating structured representations of forms using machine learning

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701500A (en) * 1992-06-02 1997-12-23 Fuji Xerox Co., Ltd. Document processor
EP0898240B1 (en) * 1993-01-11 2003-03-05 Canon Kabushiki Kaisha Image processing method and apparatus
US6282548B1 (en) * 1997-06-21 2001-08-28 Alexa Internet Automatically generate and displaying metadata as supplemental information concurrently with the web page, there being no link between web page and metadata
US6300947B1 (en) * 1998-07-06 2001-10-09 International Business Machines Corporation Display screen and window size related web page adaptation system
US6751777B2 (en) * 1998-10-19 2004-06-15 International Business Machines Corporation Multi-target links for navigating between hypertext documents and the like
JP2000148788A (ja) * 1998-11-05 2000-05-30 Ricoh Co Ltd 文書画像からのタイトル領域抽出装置およびタイトル領域抽出方法,並びに文書検索方法
US6865720B1 (en) * 1999-03-23 2005-03-08 Canon Kabushiki Kaisha Apparatus and method for dividing document including table
JP2001209655A (ja) 2000-01-28 2001-08-03 Nec Corp 情報提供装置、情報更新方法、情報提供プログラムを記録した記録媒体、及び情報提供システム
US6910182B2 (en) * 2000-01-31 2005-06-21 Xmlcities, Inc. Method and apparatus for generating structured documents for various presentations and the uses thereof
US20040049737A1 (en) * 2000-04-26 2004-03-11 Novarra, Inc. System and method for displaying information content with selective horizontal scrolling
GB2366633A (en) * 2000-09-06 2002-03-13 Argo Interactive Group Plc Analysing hypertext documents
GB0023938D0 (en) * 2000-09-29 2000-11-15 British Telecomm Information access
US7051084B1 (en) * 2000-11-02 2006-05-23 Citrix Systems, Inc. Methods and apparatus for regenerating and transmitting a partial page
AU2002220172A1 (en) * 2000-11-15 2002-05-27 David M. Holbrook Apparatus and method for organizing and/or presenting data
JP2002156957A (ja) 2000-11-22 2002-05-31 Mitsubishi Electric Corp 携帯端末、携帯端末における表示方法、およびその方法を実現するプログラムを記録した機械読取可能な記録媒体
US6947932B2 (en) * 2001-01-23 2005-09-20 Xpriori, Llc Method of performing a search of a numerical document object model
JP3714879B2 (ja) 2001-02-27 2005-11-09 ヤフー株式会社 Web検索サービスシステムおよび方法
US6832353B2 (en) * 2001-06-08 2004-12-14 Nokia Mobile Phones, Ltd. Viewing web pages on small screen devices using a keypad for navigation
US7458017B2 (en) * 2001-06-26 2008-11-25 Microsoft Corporation Function-based object model for use in website adaptation
US20030004998A1 (en) * 2001-06-29 2003-01-02 Chutney Technologies, Inc. Proxy-based acceleration of dynamically generated content
US20050022114A1 (en) * 2001-08-13 2005-01-27 Xerox Corporation Meta-document management system with personality identifiers
US6925613B2 (en) * 2001-08-30 2005-08-02 Jim Gibson Strobe reading technology and device
JP2003122770A (ja) * 2001-10-09 2003-04-25 Mitsubishi Electric Corp Webブラウズ装置
JP2003125082A (ja) * 2001-10-17 2003-04-25 Canon Inc 情報提示装置およびその制御方法
US7093001B2 (en) * 2001-11-26 2006-08-15 Microsoft Corporation Methods and systems for adaptive delivery of multimedia contents
US6912555B2 (en) * 2002-01-18 2005-06-28 Hewlett-Packard Development Company, L.P. Method for content mining of semi-structured documents
US7246306B2 (en) * 2002-06-21 2007-07-17 Microsoft Corporation Web information presentation structure for web page authoring
US7065707B2 (en) * 2002-06-24 2006-06-20 Microsoft Corporation Segmenting and indexing web pages using function-based object models
US20040010752A1 (en) * 2002-07-09 2004-01-15 Lucent Technologies Inc. System and method for filtering XML documents with XPath expressions
US7203901B2 (en) * 2002-11-27 2007-04-10 Microsoft Corporation Small form factor web browsing
US20040163041A1 (en) * 2003-02-13 2004-08-19 Paterra, Inc. Relational database structures for structured documents

Also Published As

Publication number Publication date
EP1569137A4 (en) 2009-04-22
US7272787B2 (en) 2007-09-18
CN1698052A (zh) 2005-11-16
JP2004355157A (ja) 2004-12-16
EP1569137A1 (en) 2005-08-31
CN100401291C (zh) 2008-07-09
US20050289121A1 (en) 2005-12-29
WO2004107212A1 (ja) 2004-12-09
KR20060021810A (ko) 2006-03-08

Similar Documents

Publication Publication Date Title
JP3982454B2 (ja) 携帯型電子機器、ウェブページ処理方法およびプログラム
CN102057369B (zh) 用于当显示电子文档的选定区域时动态地文本换行的方法和设备
US6292188B1 (en) System and method for navigating in a digital information environment
US20130227398A1 (en) Page based navigation and presentation of web content
US20080077880A1 (en) Method and device for selecting and displaying a region of interest in an electronic document
US20130145252A1 (en) Page based navigation and presentation of web content
CN101523336B (zh) 终端装置、内容显示方法
US20130339840A1 (en) System and method for logical chunking and restructuring websites
US20090292671A1 (en) Motion-based data review and zoom
Roudaki et al. A classification of web browsing on mobile devices
US20080163065A1 (en) Using a light source to indicate navigation spots on a web page
CN107480148A (zh) 控制网页跳转的方法及装置及用户终端
US20130080871A1 (en) Method for retrieving a representation of an annotated web document, associated computer program and electronic device
JP4389707B2 (ja) 電子機器装置、サーバ装置、Webページ処理方法及びそのプログラム
JP5482842B2 (ja) 情報処理装置およびその制御プログラム
CN106649299B (zh) 一种网页区块懒加载的方法和装置
US10725645B2 (en) Information processing device for controlling display of web pages using main display area and sub display area
US20140173413A1 (en) Method and system to build a representative model for web pages to interact with users
CN106202160A (zh) 一种网页显示方法及装置
JP5423149B2 (ja) 閲覧情報収集システム、閲覧情報収集方法、サーバ、及び、プログラム
JP5389880B2 (ja) 電子ブック処理装置、電子ブック処理方法、およびプログラム
JP6091231B2 (ja) 情報処理装置、コンピュータプログラム
JP2012181693A (ja) ウェブページ表示制御装置およびスクロール制御方法
CN104462101A (zh) 一种信息处理的方法及电子设备
JP5884814B2 (ja) 表示処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070612

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070625

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3