JP2013214250A - 情報処理装置、方法、コンピュータ・プログラム及びシステム - Google Patents

情報処理装置、方法、コンピュータ・プログラム及びシステム Download PDF

Info

Publication number
JP2013214250A
JP2013214250A JP2012085005A JP2012085005A JP2013214250A JP 2013214250 A JP2013214250 A JP 2013214250A JP 2012085005 A JP2012085005 A JP 2012085005A JP 2012085005 A JP2012085005 A JP 2012085005A JP 2013214250 A JP2013214250 A JP 2013214250A
Authority
JP
Japan
Prior art keywords
web
data
tag
page
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012085005A
Other languages
English (en)
Other versions
JP5674704B2 (ja
Inventor
Shunji Konuma
俊治 小沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012085005A priority Critical patent/JP5674704B2/ja
Publication of JP2013214250A publication Critical patent/JP2013214250A/ja
Application granted granted Critical
Publication of JP5674704B2 publication Critical patent/JP5674704B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

【課題】ウェブブラウザという一般的環境において任意のWebページを直感的操作で容易に閲覧できる表示形式に変換する。
【解決手段】指定されたWebページのデータからタグ構造を取得してWebページ毎に構造記憶手段に記憶し、そのタグ構造に基づいて表示すべき内容を抽出し、タブレット端末などタッチパネルを有する端末でのページめくり操作に適した書籍形式のWebページに変換して出力する。お年寄りやインターネットに詳しくないユーザを含め誰でも、ウェブブラウザという一般的環境において任意のWebページを、書籍でページをめくるのに準じた直観的操作で容易に閲覧できる表示形式に変換することができる。Webデータから表示すべき内容を抽出する処理は実際に書籍の形式に変換する都度行うので、逐次更新されるWebページが持つ最新の情報に基づく新鮮なコンテンツ内容を書籍形式で提供できる。
【選択図】図1

Description

本発明は、情報処理装置、方法、コンピュータ・プログラム及びシステムに関し、特にWebページの表示形式を変換する技術に関する。
従来、Webページ(以下「ページ」とも呼ぶ)を閲覧するにはウェブブラウザを備えた端末装置を用い、コンテンツプロバイダ(情報提供事業者)等が提供するページ毎に予め用意された形式で表示し、ページ中のテキスト(文字列)などに設定したハイパーリンクに対しクリックなどの操作を行うことでリンク先である下位のページなどに表示を遷移させ、そのような操作を必要に応じて繰り返す必要があった。
特開2009−239566号
しかしながら、近年、通信インフラの整備が進み、また、利便性の向上した情報通信端末の普及に伴い、お年寄りなどのインターネット利用に慣れていないユーザ層もインターネットを介してWebページを閲覧する機会が増加しており、そのようなユーザ層にとって所望のページを閲覧する操作は、必ずしも容易でなかった。例えば、ページ上の任意の領域に多様な形態で配置されているハイパーリンクを辿ることにより任意のページを選択し、結果的に所望のページを表示させる操作(以下、「ブラウジング操作」とも呼ぶ)に不慣れなユーザは、目的に合致する情報(ページ)を自らの意思に基づいて容易に取得することが困難であった。
一方で、本をめくる様に表示情報を遷移させる書籍形式による情報の表示技術が知られているが、そのような表示技術は、電子書籍リーダー機能を持つソフトウェアや、電子書籍閲覧用途の専用端末などが必須という制限があった。また、予め定められた情報を書籍の形式で表示する例はあったが(特表2004-507808)、ユーザが指定する任意のウェブページを対象としたものではなかった。
上記の課題に対し、本発明の目的は、ウェブブラウザという一般的環境において任意のWebページを直感的操作で容易に閲覧できる表示形式に変換することである。
上記の目的をふまえ、本発明の一態様(1)である情報処理装置は、Webページの指定を受け付ける指定受付手段と、指定された前記Webページを表すWebデータを取得するデータ取得手段と、取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得する構造取得手段と、取得された前記タグ構造を記憶する構造記憶手段と、前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出する抽出手段と、抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換する変換手段と、変換された前記第2のWebデータを出力する出力手段と、を備えたことを特徴とする。
本発明の他の態様(5)である情報処理システムは、上記態様をシステムのカテゴリで捉えたもので、サーバ装置と、端末と、を備えた情報処理システムであって、Webページの指定を受け付ける指定受付手段と、指定された前記Webページを表すWebデータを取得するデータ取得手段と、取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得する構造取得手段と、取得された前記タグ構造を記憶する構造記憶手段と、前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出する抽出手段と、抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換する変換手段と、変換された前記第2のWebデータを出力する出力手段と、を備えたことを特徴とする。
本発明の他の態様(6)である情報処理方法は、上記態様を方法のカテゴリで捉えたもので、Webページの指定を受け付ける指定受付処理と、指定された前記Webページを表すWebデータを取得するデータ取得処理と、取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得して予め定められた構造記憶手段に記憶させる構造取得処理と、前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出する抽出処理と、抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換する変換処理と、変換された前記第2のWebデータを出力する出力処理と、をコンピュータが実行することを特徴とする。
本発明の他の態様(7)であるコンピュータ・プログラムは、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、コンピュータを制御することにより、Webページの指定を受け付けさせ、指定された前記Webページを表すWebデータを取得させ、取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得して予め定められた構造記憶手段に記憶させ、前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出させ、抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換させ、変換された前記第2のWebデータを出力させることを特徴とする。
本発明の他の態様(2)は、上記いずれかの態様において、前記構造取得手段(「手段」は方法及びプログラムにあっては「処理」又は「ステップ」と読み替える。以下同じ)は、取得された前記Webデータから、タグの階層構造を含む前記タグ構造を取得し、前記変換手段は、前記Webデータから前記抽出手段により抽出された前記内容データを、前記構造取得手段により取得された前記タグの階層構造に応じた構成の書籍の形式で表示するための前記第2のWebデータに変換することを特徴とする。
本発明の他の態様(3)は、上記いずれかの態様において、前記抽出手段は、ページ遷移のリンクで関連付けられた複数のWebページが前記対象として前記指定受付手段において指定された場合、前記複数のWebページの前記Webデータから前記コンテンツの内容と共に広告表示枠のデータを抽出し、前記変換手段は、抽出された前記広告表示枠のデータを抽出された前記コンテンツの内容とともに、前記第2のWebデータが表す書籍の一部のページ又はページの一部分に組み込むことを特徴とする。
本発明の他の態様(4)は、上記いずれかの態様において、前記データ取得手段は、指定された前記Webページに予め対応付けられているRSSデータが対象としているWebページを表すWebデータを取得することを特徴とする。
本発明によれば、ウェブブラウザという一般的環境において任意のWebページを直感的操作で容易に閲覧できる表示形式に変換することが可能となる。
本発明の実施形態について構成を示す機能ブロック図。 本発明の実施形態における処理手順を示すフローチャート。 本発明の実施形態における正規表現記述の例を示す図。 本発明の実施形態における正規表現記述の例を示す図。 本発明の実施形態におけるWebデータの例を示す図。 本発明の実施形態におけるタグ構造の例を示す図。 本発明の実施形態におけるWebページの例を示す図。 本発明の実施形態における画面表示例を示す図。 本発明の実施形態における画面表示例を示す図。
次に、本発明を実施するための形態(「実施形態」と呼ぶ)について図に沿って例示する。なお、背景技術や課題などで既に述べた内容と共通の前提事項は適宜省略する。
〔1.構成〕
本実施形態は、図1の構成図に示す情報処理装置1(「本装置1」とも呼ぶ)に関するもので、本装置1は、指定されたWebページをWebサーバS(S1及びS2。以下単に「サーバS」のようにも呼ぶ)から取得し書籍の形式に変換して端末Tへ提供するサーバ装置である。本装置1と、端末Tと、サーバSは通信ネットワークNを介して通信し、本装置1と端末Tを情報処理システムとして把握することができる。
本装置1は、コンピュータの構成として少なくとも、CPUなどの演算制御部6と、主メモリや補助記憶装置等の記憶部7と、通信ネットワークN(例えば、インターネット、携帯電話、PHS、公衆無線LANなどの移動通信網など)との通信部8(例えば、無線や有線の各種通信アダプタ、その他の通信回路、通信機器など)と、を有する。
本装置1では、記憶部7に記憶したコンピュータ・プログラム(情報処理プログラム)を演算制御部6が実行することで、図1に示す各手段などの要素(10、17ほか)を実現する。実現される要素のうち情報の記憶手段の態様は自由で、記憶部7上のファイルなど任意のデータ形式で実現できるほか、ネットワーク・コンピューティング(クラウド)によるリモート記憶などでもよい。
記憶手段は、データの格納領域だけでなく、データの入出力や管理などの機能を含んでもよい。また、本出願に示す記憶手段の単位は説明上の便宜によるもので、適宜、構成を分けたり一体化できるほか、明示する記憶手段以外にも、各手段の処理データや処理結果などを記憶する記憶手段を適宜用いるものとする。
なお、図中(例えば図1)の矢印は、データや制御などの流れについて主要な方向を補助的に示すもので、他の流れを否定するものでも、方向の限定を意味するものでもない。例えばある方向のデータ取得の前後に、データ要求や確認応答(ACK)が逆方向に発生し得る。
また、記憶手段以外の各手段は、以下に説明するような情報処理の機能・作用(例えば図1)を実現・実行する処理手段であるが、これらは説明のために整理した機能単位であり、実際のハードウェア要素やソフトウェアモジュールとの一致は問わない。
〔2.作用の概要〕
上記のように構成された本装置1における処理手順のうち本実施形態に特に関わる部分の概要を図2のフローチャートに示す。すなわち、サーバSが提供するWebページを書籍形式に変換して表示したいユーザは、本装置1の提供する所定のWebページ又はAPIなどを用いて、変換したい任意のWebページの指定をURLなどの形で本装置1に対し指定する。
本装置1では指定受付手段10が、変換の対象とするWebページの指定を受け付けるが(ステップS1)、指定の対象とするWebページは、単一のページでもよいし、複数ページからなるウェブサイトを例えばそのトップページのURLなどで指定するのでもよい。そして、データ取得手段24が、指定されたWebページを表すWebデータ(例えばHTMLファイルなど)を取得する(ステップS2)。図5は、単一のWebページのHTMLファイルの一例を示す。
続いて、構造取得手段32は、取得したウェブページのタグ構造を構造記憶手段35から検索する(ステップS3)。ここで、タグ構造は、Webページを書籍の形式で表示する際に有効とする予め定められたタグ(以下「有効タグ」とも呼ぶこととする)の位置を表す情報である。図6は、タグ構造の一例を示す。
タグ構造は、より具体的には、単一のWebページ内において、ある開始タグと対応する終了タグがどこに(例えば何バイト目に)存在するかを表す場合と、複数のWebページが、どのページのどこに存在するタグからのハイパーリンクによる遷移先が、他のどのWebページ(遷移先は同じページの別の場所である場合もある)であるかを表す場合があり、タグ構造はこれらの少なくともいずれか一方を表す情報である。
検索の結果、Webページに対応するタグ構造が存在すれば(ステップS3:「YES」)それを構造記憶手段35から読み出す(ステップS4)。
一方、取得したWebページが初めて変換するWebページ又は前回変換したときからみて更新されていたりタグ構造の有効期間切れなどで、そのWebページのタグ構造が構造記憶手段35に記憶されていない場合(ステップS3:「NO」)、構造取得手段32が、取得されたWebデータからタグ構造を取得し、そのタグ構造を構造記憶手段35に記憶させる(ステップS5)。
また、抽出手段43は、Webデータのうちタグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより、表示すべき内容(記事本文のテキスト、画像など)を表す内容データを抽出する(ステップS6)。
そのうえで、変換手段52は、抽出された内容データを、取得されたタグ構造に基づき、書籍の形式で表示しかつページめくり操作を受け付けるための所定のタグ(「書籍タグ」とも呼ぶこととする)及びそのタグ構造を持つ第2のWebデータに変換し(ステップS7)、出力手段18は、変換された前記第2のWebデータを出力する(ステップS8)。
書籍タグとそのタグ構造の具体的な表現形式は自由であるが、書籍タグに応じて端末Tで実際に表示される書籍形式やページめくりアニメーションなどの動作は、HTML5、JavaScript(登録商標)やSilverlight(登録商標)などで記述したデータを、本装置1から端末Tのウェブブラウザに送信して表示内容を生成(レンダリング)させることで実現する。
〔3.RSSからの変換の例〕
以下、具体例として、対象とするWebページのコンテンツをまとめて提供するRSSページを介して、表示する内容を取得し変換する例を示す。この場合、閲覧を希望するWebページへのアクセスをユーザが指示入力すると、データ取得手段24は、指定されたWebページに予め対応付けられているRSSデータが対象としているWebページを表すWebデータを取得する。
例えば、Yahoo!(登録商標)トピックスに代表されるニュースサイトへのアクセスをユーザが指示入力しそれを指定受付手段10が受け付けると(ステップS1)、当該サイトと図示しない対照データで予め対応付けられ、Webページのコンテンツをまとめて提供するRSSページ(例えばニュースサイトのRSS集)のURLを、その対照データから取得する。そして、RSSページのRSSデータより記事ページのURL一覧を取得する。
RSSデータは「http://rss.dailynews.yahoo.co.jp/fc/domestic/rss.xml」のようなURLで指定でき、そのRSSデータが対象とするWebページからのデータ取得手段24によるWebデータの取得として(ステップS2)、RSSデータに含まれる各記事ページのURL(例えば、「http://dailynews.yahoo.co.jp/fc/domestic/fighter_x/」)より記事ページのWebデータとして、HTMLファイルを取得する。
そして、例えば、RSSページのURLと対応付けてそのRSSページが対象とするWebページのタグ構造が記憶されていれば(ステップS3:「YES」)、アクセスするURLに対応するRSSページのタグ構造を読み出せばよいが、記憶されていなければ(ステップS3:「NO」)、取得したWebデータから構造取得手段32がタグ構造を取得する(ステップS5)。
この際、有効タグの例としては、/html/body/div#wrapper/div#content/div#main/div#mainMargin/div#detailHeadline/の各配下のタグなどが挙げられる。また、不必要な情報の具体的としては、例えば正規表現で「"/<h2>ヘッドライン<\/h2>//」のように不要な文字列を除去する条件を指定することが考えられる。各Webデータについて、複数の条件を処理することで不要な文字列を除去してもよい。
抽出手段43による内容データの抽出(ステップS6)において、正規表現を用いて不要な文字列を除去する記述の例として、図3にPHP言語、図4にPerl言語によるものを示す。
なお、図2の例及び以上の説明では、タグ構造の取得(ステップS5)と不要な文字列の除去による内容データの抽出(ステップS6)とは別個独立のステップとして示したが、有効タグを残して不要な文字列を除去する一例の処理によって、結果的にタグ構造(例えば図6)を残すようにしてもよい。
以上のように、RSSページにアクセスして記事ページのURL一覧を取得した後に、構造記憶手段35から又はWebデータから取得したタグ構造を参照して、各記事ページから記事、広告等の内容データの抽出を繰り返せば、第2のWebデータへの変換の素材となるタグ情報及び内容データが揃うので、これを第2のWebデータに変換する(ステップS7)。
例えば、Webサイトであって、図7(1)に例示するトップページから、個々の記事のタイトルに設定されたハイパーリンクを順次クリックして、図7(2)に一例を示すような記事ごとのWebページに画面遷移するニュースサイトの構造を変換の基とする場合を考える。
この場合、トップページ及び個々の記事のページから取得したタグ情報及び抽出した内容データを、変換手段52が第2のWebデータに変換する。その第2のWebデータを出力手段18が通信ネットワークN経由で出力したものを端末Tが受信して画面表示した一例を図8に示す。
図8の例では、抽出した記事を書籍のページ形式にレイアウトし、綴じ部の右側をページ表示領域R、左側を広告表示領域Lとした書籍ページ画像を表示する。綴じ部の右側には、ページ全体を表示し、左側には、左ページの綴じ部側の一部分を表示し広告を配置している。これにより、Webページを書籍レイアウトに変換した書籍形式ページが生成される。
書籍形式ページを読み進める場合、書籍レイアウトの右側ページを指Fで左(矢印A1方向)にフリック(指ではじく操作)すれば、指が触れている接触点の移動に合わせ、またはフリック後は完全にページがめくられた状態まで自動で、ページがめくられていくアニメーションを表示する(図9)。反対に、ページを戻す場合には、右側のページを右に(矢印A2方向)フリックする。少しのフリックでページが完全にめくれるようにアニメーション表示の動きを実現することでページめくりが容易になる。
〔4.タグの階層構造に合わせた書籍の構成〕
また、ここでは、タグの階層構造に応じた構成の書籍の形式に変換するものとする。具体的には、構造取得手段32が、取得されたWebデータから、タグの階層構造を含むタグ構造を取得する(ステップS5)。例えば、図7(1)の例では、HTMLのタグにより、「トピックス」のタブt1にいくつかのニュース記事へのリンクが含まれ、隣接する「ニュース」のタブt2にも図示しないいくつかのニュース記事へのリンクが含まれる。
そして、変換手段52は、Webデータから抽出手段43により抽出された内容データを(ステップS6)、構造取得手段32により取得されたタグの階層構造に応じた構成の書籍の形式で表示するための第2のWebデータに変換する(ステップS7)。図7(1)のWebデータから取得されるタグの階層構造は、「トピックス」のカテゴリにいくつか、「ニュース」のカテゴリにいくつかのニュース記事が含まれる構造である。
このようなタグの階層構造に応じた構成の書籍の形式としては、図8に示すように、「トピック」タブT1と「ニュース」タグT2が示す章の範囲の各ページに、それぞれに対応するカテゴリに含まれるニュース記事が連続して表示される形式となる。例えば、図8の状態から1頁めくり進めると、同じカテゴリ内の次のニュース記事が表示される。
〔5.広告の変換〕
また、ここでは、Webページの遷移で本来は表示された広告を書籍形式の表示にも組み込む。具体的には、抽出手段43が、ページ遷移のリンクで関連付けられた複数のWebページが対象として指定受付手段において指定された場合、複数のWebページのWebデータから表示すべき内容と共に広告表示枠のデータを抽出する。
例えば、図7(1)のWebページと、そこからページ遷移する図7(2)のWebページが指定された場合を考えると、広告Aと広告Bの広告表示枠のデータを抽出する。
そして、変換手段52は、抽出された広告表示枠のデータを抽出された表示すべき内容とともに、第2のWebデータが表す書籍の一部のページ又はページの一部分に組み込む。図8の例では、広告Aと広告Bが左側のページにまとめて表示されている。
組み込むのは広告表示枠なので、実際の表示のタイミングで広告配信サーバからそれら広告表示枠に別の広告が配信されてはめ込み表示されてもよい。また、一部のページに広告を組み込むパターンとしては、例えば数ページ毎に、複数の広告をまとめたページを設けるほか、そのような数ページ毎のページに、一つの広告を全面表示するなどでもよい。
〔6.効果〕
(1) 以上のように本実施形態では、指定されたWebページのデータからタグ構造を取得してWebページ毎に構造記憶手段に記憶し(例えば、図2のステップS5)、そのタグ構造に基づいて表示すべき内容を抽出し(ステップS6)、タブレット端末などタッチパネルを有する端末でのページめくり操作に適した書籍形式のWebページに変換して(ステップS7)出力する(ステップS8)。
これにより、お年寄りやインターネットに詳しくないユーザを含め誰でも、ウェブブラウザという一般的環境において任意のWebページを、書籍でページをめくるのに準じた直観的操作で容易に閲覧できる表示形式(例えば、図8や図9)に変換することができる。
また、Webデータから表示すべき内容を抽出する処理(ステップS6)を、実際に書籍の形式に変換する都度行うことにより、逐次更新されるWebページが持つ最新の情報に基づく新鮮なコンテンツ内容を書籍形式で提供できる。
さらに、構造記憶手段にタグ構造を記憶しておくことにより(例えば図6)、Webページを2度目に変換表示しようとするときに、そのウェブページが更新されていなければ、タグ構造の再取得が省略できる。
(2) また、本実施形態では、タグの階層構造に応じた構成の書籍形式にコンテンツを変換することにより(例えば図7に応じた図8)、内容の理解が容易になる。例えば、カテゴリ毎のブロックにまとめられたニュース記事群(図7)をそれぞれ、カテゴリに応じた章ごとにまとまった書籍の形式(図8)にすることで、読みたいカテゴリに対応した章から容易に閲覧できる。
(3) さらに、本実施形態では、もとのWebページのページ遷移経路では本来表示される広告表示枠(例えば、図7(1)の広告Aと図7(2)の広告B)について、変換後の書籍の形式において一部のページやページの一部分に組み込む(例えば図8及び図9)。これにより、コンテンツ内容に適合した有用な広告情報を閲覧者に確実に提供し、また、広告ビジネスモデルの有効性を維持して有用なコンテンツの提供継続を容易にすることができる。
(4) 加えて、本実施形態では、ポータルサイトの各カテゴリページなどに設けられているRSSデータなど、指定されたWebページに予め対応付けられているRSSデータにURLなどとして含まれているWebページのWebデータを取得して書籍形式に変換する。これにより、タグの階層構造からリンク先ページの意味的分類を推定するまでもなく、予め情報提供者が情報のまとまりごとに提供しているRSSを活用し情報が整理された書籍形式の表示が実現できる。
また、本実施形態によれば、閲覧するデバイス環境についても限定が無く、スマートフォンやタブレットPCなど幅広い各種の端末でウェブ・ブラウザを用い、追加ソフトウェアも不要で、Webページを書籍の形式で閲覧できる。特に、本実施形態をHTML5で実装すれ、HTMLなどで構成された既存のWebページとも親和性の優れた実施が可能となる。
さらに、本実施形態によれば、専門家が作成した書籍形式の表示スタイルをコンテンツ利用者などの第三者に試させる場合、プラグインなど特段のファイルの配信無しで、APIなどで対象のWebページとその変換を要求するための所定のURLを相手に知らせ、そこへアクセスしてもらうのみで足りる。
〔7.他の実施形態〕
なお、上記実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、ページめくり操作の入力はタッチパネルに限らず、マウスなどのポインティングデバイスその他の入力機構でもよい。また、装置などとして示した各態様は、明記しない他のカテゴリ(方法、プログラム、端末を含むシステムなど)としても把握することができる。
方法やプログラムのカテゴリについては、装置のカテゴリで示した「手段」を、「処理」や「ステップ」のように適宜読み替えるものとする。また、処理やステップの順序は、本出願に直接明記のものに限定されず、順序を変更したり、一部の処理をまとめてもしくは随時一部分ずつ実行するなど、変更可能である。
また、個々の手段、処理やステップを実現、実行する端末などのコンピュータは共通でもよいし、手段、処理やステップごとにもしくはタイミングごとに異なってもよい。また、上記「手段」の全部又は任意の一部を「部」(ユニット、セクション、モジュール等)と読み替えることができる。
また、本出願における構成図、データの図、フローチャートなども例示に過ぎず、各要素の有無、その配置や処理実行などの順序、具体的内容などは適宜変更可能である。例えば、本装置1とサーバSとを一体に構成することもできる。
また、本装置1を構成する個々の手段を実現する態様は自由で、外部のサーバが提供している機能をAPI(アプリケーション・プログラム・インタフェース)やネットワーク・コンピューティング(いわゆるクラウドなど)で呼び出して実現するなど、本発明の構成は柔軟に変更できる。さらに、本発明に関する手段などの各要素は、コンピュータの演算制御部に限らず物理的な電子回路など他の情報処理機構で実現してもよい。
1 情報処理装置
6 演算制御部
7 記憶部
8 通信部
10 指定受付手段
24 データ取得手段
32 構造取得手段
35 構造記憶手段
43 抽出手段
52 変換手段
60 出力手段
N 通信ネットワーク
S サーバ
T 端末

Claims (7)

  1. Webページの指定を受け付ける指定受付手段と、
    指定された前記Webページを表すWebデータを取得するデータ取得手段と、
    取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得する構造取得手段と、
    取得された前記タグ構造を記憶する構造記憶手段と、
    前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出する抽出手段と、
    抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換する変換手段と、
    変換された前記第2のWebデータを出力する出力手段と、
    を備えたことを特徴とする情報処理装置。
  2. 前記構造取得手段は、取得された前記Webデータから、タグの階層構造を含む前記タグ構造を取得し、
    前記変換手段は、前記Webデータから前記抽出手段により抽出された前記内容データを、前記構造取得手段により取得された前記タグの階層構造に応じた構成の書籍の形式で表示するための前記第2のWebデータに変換することを特徴とする請求項1記載の情報処理装置。
  3. 前記抽出手段は、ページ遷移のリンクで関連付けられた複数のWebページが前記対象として前記指定受付手段において指定された場合、前記複数のWebページの前記Webデータから前記コンテンツの内容と共に広告表示枠のデータを抽出し、
    前記変換手段は、抽出された前記広告表示枠のデータを抽出された前記コンテンツの内容とともに、前記第2のWebデータが表す書籍の一部のページ又はページの一部分に組み込むことを特徴とする請求項1又は2記載の情報処理装置。
  4. 前記データ取得手段は、指定された前記Webページに予め対応付けられているRSSデータが対象としているWebページを表すWebデータを取得することを特徴とする請求項1から3のいずれか一項に記載の情報処理装置。
  5. サーバ装置と、端末と、を備えた情報処理システムであって、
    Webページの指定を受け付ける指定受付手段と、
    指定された前記Webページを表すWebデータを取得するデータ取得手段と、
    取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得する構造取得手段と、
    取得された前記タグ構造を記憶する構造記憶手段と、
    前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出する抽出手段と、
    抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換する変換手段と、
    変換された前記第2のWebデータを出力する出力手段と、
    を備えたことを特徴とする情報処理システム。
  6. Webページの指定を受け付ける指定受付処理と、
    指定された前記Webページを表すWebデータを取得するデータ取得処理と、
    取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得して予め定められた構造記憶手段に記憶させる構造取得処理と、
    前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出する抽出処理と、
    抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換する変換処理と、
    変換された前記第2のWebデータを出力する出力処理と、
    をコンピュータが実行することを特徴とする情報処理方法。
  7. コンピュータを制御することにより、
    Webページの指定を受け付けさせ、
    指定された前記Webページを表すWebデータを取得させ、
    取得された前記Webデータから、そのWebページを書籍の形式で表示する際に有効とする予め定められたタグの位置を表す情報であるタグ構造を取得して予め定められた構造記憶手段に記憶させ、
    前記Webデータのうち前記タグ構造に対応する部分から、予め定められたパターンに該当する不必要な情報を除去することにより表示すべき内容を表す内容データを抽出させ、
    抽出された前記内容データを、取得された前記タグ構造に基づき、前記書籍の形式で表示しかつページめくり操作を受け付けるための予め定められたタグ及びそのタグ構造を持つ第2のWebデータに変換させ、
    変換された前記第2のWebデータを出力させる
    ことを特徴とするコンピュータ・プログラム。
JP2012085005A 2012-04-03 2012-04-03 情報処理装置、方法、コンピュータ・プログラム及びシステム Expired - Fee Related JP5674704B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012085005A JP5674704B2 (ja) 2012-04-03 2012-04-03 情報処理装置、方法、コンピュータ・プログラム及びシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012085005A JP5674704B2 (ja) 2012-04-03 2012-04-03 情報処理装置、方法、コンピュータ・プログラム及びシステム

Publications (2)

Publication Number Publication Date
JP2013214250A true JP2013214250A (ja) 2013-10-17
JP5674704B2 JP5674704B2 (ja) 2015-02-25

Family

ID=49587521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012085005A Expired - Fee Related JP5674704B2 (ja) 2012-04-03 2012-04-03 情報処理装置、方法、コンピュータ・プログラム及びシステム

Country Status (1)

Country Link
JP (1) JP5674704B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055667A (zh) * 2016-06-06 2016-10-26 北京林业大学 一种基于文本‑标签密度的网页核心内容提取方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09138745A (ja) * 1995-09-08 1997-05-27 Xerox Corp コンピュータ制御表示システム
JPH09282218A (ja) * 1996-04-10 1997-10-31 Nippon Telegr & Teleph Corp <Ntt> Html文書本型整形方法及びその装置
JPH1040301A (ja) * 1996-07-24 1998-02-13 Nippon Telegr & Teleph Corp <Ntt> マルチメディア情報任意部分アクセス方法および装置
JP2004288208A (ja) * 2004-05-11 2004-10-14 Nec Corp ページ情報表示装置
JP2008134633A (ja) * 2000-10-12 2008-06-12 E-Book Systems Pte Ltd ブック状のインターフェースによりインターネットブラウザを使用する広告方法およびシステム
JP2009199512A (ja) * 2008-02-25 2009-09-03 Advanced Telecommunication Research Institute International 情報処理装置、およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09138745A (ja) * 1995-09-08 1997-05-27 Xerox Corp コンピュータ制御表示システム
JPH09282218A (ja) * 1996-04-10 1997-10-31 Nippon Telegr & Teleph Corp <Ntt> Html文書本型整形方法及びその装置
JPH1040301A (ja) * 1996-07-24 1998-02-13 Nippon Telegr & Teleph Corp <Ntt> マルチメディア情報任意部分アクセス方法および装置
JP2008134633A (ja) * 2000-10-12 2008-06-12 E-Book Systems Pte Ltd ブック状のインターフェースによりインターネットブラウザを使用する広告方法およびシステム
JP2004288208A (ja) * 2004-05-11 2004-10-14 Nec Corp ページ情報表示装置
JP2009199512A (ja) * 2008-02-25 2009-09-03 Advanced Telecommunication Research Institute International 情報処理装置、およびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG199901447006; 上野 香理 Kaori Ueno: 'ブックメタファによるHTML情報の閲覧と検索 Browsing and Searching on a Book Metaphor System' 情報処理学会研究報告 Vol.96 No.2 IPSJ SIG Notes 第96巻, 19960112, 第37〜44頁, 社団法人情報処理学会 Information Processing Socie *
JPN6013052182; 上野 香理 Kaori Ueno: 'ブックメタファによるHTML情報の閲覧と検索 Browsing and Searching on a Book Metaphor System' 情報処理学会研究報告 Vol.96 No.2 IPSJ SIG Notes 第96巻, 19960112, 第37〜44頁, 社団法人情報処理学会 Information Processing Socie *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055667A (zh) * 2016-06-06 2016-10-26 北京林业大学 一种基于文本‑标签密度的网页核心内容提取方法
CN106055667B (zh) * 2016-06-06 2019-06-04 北京林业大学 一种基于文本-标签密度的网页核心内容提取方法

Also Published As

Publication number Publication date
JP5674704B2 (ja) 2015-02-25

Similar Documents

Publication Publication Date Title
US20190272313A1 (en) Dynamic generation of mobile web experience
KR100490734B1 (ko) 주석기반 문서 자동 생성장치 및 방법
Bila et al. Pagetailor: reusable end-user customization for the mobile web
US20130283154A1 (en) Content display system
TW201443670A (zh) 提供不計內容格式及類型之內容可存取性的虛擬庫
US20100070849A1 (en) Adaptation of a website to mobile web browser
JP2014514629A (ja) 一種のウェブページ再組版の方法
WO2014154033A1 (en) Method and apparatus for extracting web page content
JP5309121B2 (ja) 情報処理方法、プログラム、情報処理システム
Roudaki et al. A classification of web browsing on mobile devices
CN103902736A (zh) 对移动信息设备屏幕上显示的词语进行手指单击取词搜索
JP2011186876A (ja) 閲覧装置、閲覧システム、閲覧方法および閲覧プログラム
US20140189478A1 (en) Web browsers for mobile and small screen devices
JP5674704B2 (ja) 情報処理装置、方法、コンピュータ・プログラム及びシステム
JP5134639B2 (ja) クライアント装置、表示方法、プログラム、情報処理装置、及び情報処理システム
JP2008071116A (ja) 情報配信システム、情報配信装置、情報配信方法および情報配信用プログラム
JP5415499B2 (ja) 情報表示装置、方法及びプログラム
JP5372704B2 (ja) Webページ表示プログラム、Webページ表示方法、Webページ表示装置、及びWebページ表示システム
CN102279860B (zh) 手机网络资讯导航系统及其实现方法
CN104615601A (zh) 基于网页的记录系统及其方法
JP5973480B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2014164736A (ja) ウェブページ閲覧装置及びプログラム
JP2011154539A (ja) ブログサービス提供システム、方法及びプログラム
JP5779412B2 (ja) クライアント・サーバシステム、クライアント機器、サーバ機器、クライアント・サーバシステムにおけるコメント画面作成方法、およびクライアント機器のプログラム、サーバ機器のプログラム
JP5230717B2 (ja) 情報処理システム、情報処理方法、プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141222

R150 Certificate of patent or registration of utility model

Ref document number: 5674704

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees