JP5729428B2 - ページ表示装置およびプログラム - Google Patents

ページ表示装置およびプログラム Download PDF

Info

Publication number
JP5729428B2
JP5729428B2 JP2013154062A JP2013154062A JP5729428B2 JP 5729428 B2 JP5729428 B2 JP 5729428B2 JP 2013154062 A JP2013154062 A JP 2013154062A JP 2013154062 A JP2013154062 A JP 2013154062A JP 5729428 B2 JP5729428 B2 JP 5729428B2
Authority
JP
Japan
Prior art keywords
page
information
link
link destination
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013154062A
Other languages
English (en)
Other versions
JP2013250989A (ja
Inventor
高弘 冨田
高弘 冨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2013154062A priority Critical patent/JP5729428B2/ja
Publication of JP2013250989A publication Critical patent/JP2013250989A/ja
Application granted granted Critical
Publication of JP5729428B2 publication Critical patent/JP5729428B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、ページ表示装置およびプログラムに関する。
従来から、LAN(Local Area Network)やWAN(Wide Area Network)、インターネットなど、通信ネットワークにおけるサーバ・クライアント・システムでは、クライアント装置が備えるWebブラウザにより、サーバ装置が生成保存している種々のWebページを取得表示して閲覧することが行われる。
一般に、Webページは、HTML(Hyper Text Markup Language)のソースコードにより記述されており、そのドキュメント構造をWebブラウザが解析して表示するものである。
このWebページには、ハイパーテキストとして、記述されたテキストを見出しとし、当該テキストの内容に対応する他のページへ遷移するためのハイパーリンクが設定されたテキスト部分(リンクテキスト)が複数箇所存在することが多い。
ユーザが、前記ハイパーテキストのリンクテキストにフォーカスして決定操作することにより、そのリンク先のURLへアクセスされて対応するWebページが取得され、画面展開され表示されるものである。
この際、前記Webページ上でユーザがフォーカスするリンクテキストは、あくまで見出しであり、その内容の詳細はリンク先のWebページが取得され画面展開されないと把握できないので、ユーザが所望のリンク先のWebページを開くまでに、幾つかの必要としないリンク先のWebページを開いてしまうことが多々ある。
この場合、リンク先のWebページが取得され画面展開される都度、その画面展開(レンダリング)の処理に時間が掛かり、しかも画面展開されたWebページの内容を見て、ユーザ所望のリンク先であったかを判断するので、元のWebページに戻ったり、別のリンクテキストにフォーカスして新たなWebページを開いたりする繰り返し操作が多くなる。このため、特に高速にレンダリング処理できない携帯端末のWebブラウザにおいては、所望のリンク先のWebページを見つけて開くまでに、無駄な待ち時間を要してしまう。
一方で、Webページのハイパーテキストを音声合成して読み上げたり、当該ハイパーテキストに設定されたリンクテキストのみを順次音声合成して読み上げたりするのに伴い、リンク先へのジャンプを指示するユーザ操作が行われると、その読み上げ位置に応じてフォーカスされているリンクテキストのリンク先Webページへジャンプする機能を備えたハイパーテキスト制御装置が考えられている(例えば、特許文献1参照。)。
特開平10−078952号公報
前記従来のハイパーテキスト制御装置では、ハイパーテキストを、ユーザが読まずしてその読み上げ音声を聞くことにより知ることができ、任意のテキスト読み上げ位置でのジャンプ指示により、関連のあるリンク先Webページへジャンプすることが可能である。しかしながら、リンク先のWebページがユーザ所望の内容であるか否かは、当該リンク先Webページが画面展開されてそれを確認するか、同リンク先Webページのハイパーテキスト先頭からの読み上げ音声を全て聞いていないと判断できない。このため、結局は各リンクテキストにフォーカスしてリンク先Webページを開く処理と元のWebページへ戻る処理とを所望のリンク先Webページが見つかるまで繰り返すことになり、ユーザの手間が多く時間的効率も悪い問題がある。
本発明は、表示されるページに含まれるリンクデータを選択してそのリンク先ページを開く前に、そのリンク先ページの内容を確認できるようにすることを目的とする。
請求項1は、ページ情報を表示画面上に画面展開して表示するページ表示装置であって、前記表示画面上に表示された第1のページ情報に含まれるリンクデータに対応して設定されるリンク先指示情報に基づいて、そのリンク先指示情報で指示されるリンク先ページとしての第2のページ情報を取得するページ取得手段と、前記ページ取得手段により取得された第2のページ情報の中から前記第1のページ情報のリンクデータと同一あるいは類似のデータを検索し、その検索したデータに該当するリンク先部分情報を前記第2のページ情報の中から抽出する抽出手段と、前記抽出手段で抽出されたリンク先部分情報を出力するよう制御する出力制御手段と、を備えたことを特徴とする。
請求項2は、ページ情報を表示画面上に画面展開して表示するページ表示装置であって、前記表示画面上に表示された第1のページ情報に含まれるリンクデータに対応して設定されるリンク先指示情報に基づいて、そのリンク先指示情報で指示されるリンク先ページの第2のページ情報を取得するページ取得手段と、前記ページ取得手段により取得された第2のページ情報の中から前記第1のページ情報内の前記リンクデータの表示内容に該当するデータ部分を検索し、その検索したデータ部分をリンク先部分情報として前記第2のページ情報の中から抽出する抽出手段と、前記抽出手段で抽出されたリンク先部分情報を出力するよう制御する出力制御手段と、を備えたことを特徴とする。
本発明によれば、表示されるページに含まれるリンクデータを選択してそのリンク先ページを開く前に、そのリンク先ページの内容を確認することが可能となる。

本発明のWebページ閲覧装置の実施形態に係るサーバ・クライアント・システムの構成を示すブロック図。 前記サーバ・クライアント・システムにおけるサーバ装置10の回路構成を示すブロック図。 前記サーバ・クライアント・システムにおけるクライアント装置20の回路構成を示すブロック図。 前記クライアント装置20においてサーバ装置(A)10[http://www.sight.a.co.jp]から取得されたWebページPの画面表示例を示す図。 前記図4におけるWebページPを記述したHTMLソースPhtmを示す図。 前記図5におけるリンクテキストLtxt3のリンク先URLに対応するWebページLPのHTMLソースLPhtmを示す図。 前記図6におけるHTMLソースLPhtmにより記述されたリンク先WebページLPの画面表示例を示す図。 リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の画面表示例を示す図。 前記クライアント装置20によるWebページの閲覧に伴いリンク先Webページの本文テキストを取得してその読み上げ音声を出力するための読み上げ対象テキスト取得処理を示すフローチャート。 前記クライアント装置20の読み上げ対象テキスト取得処理に伴うリンクテキストと同じ文字列を含む要素のリストアップ処理を示すフローチャート。 前記クライアント装置20の読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理を示すフローチャート。 前記クライアント装置20の読み上げ対象テキスト取得処理に伴う本文テキストの抽出処理を示すフローチャート。
以下図面により本発明の実施の形態について説明する。
図1は、本発明のWebページ閲覧装置の実施形態に係るサーバ・クライアント・システムの構成を示すブロック図である。
このサーバ・クライアント・システムは、インターネット、WAN、LANなどからなるネットワークN上に接続された複数のサーバ装置10,…および複数のクライアント装置20,…を備える。
サーバ装置10は、Webコンテンツ生成処理プログラム,登録ユーザ管理処理プログラム,Webページ配信処理プログラムなど、当該サーバ装置10の本体操作により機能する複数のアプリケーションプログラムを有し、例えば本サーバ装置10にユーザ登録されたクライアント装置20,…からの指定のWebサイトへのアクセス要求に応じて当該要求されたWebサイトにおけるWebコンテンツ15aのページを各クライアント装置20,…へ配信する。
クライアント装置20,…は、携帯電話,PDA(Personal Digital Assistant),PCなどからなり、インターネット接続処理プログラム、Webブラウザプログラム23a,Web印刷プログラムなど、当該端末装置20の本体操作により機能する複数のアプリケーションプログラムを有する。そして、例えば所望のWebサイト[http://www.sight_a.co.jp/]のサーバ装置(A)10にアクセスしてそのWebコンテンツA15aを取得し、当該WebコンテンツA15aのHTML(Hyper Text Markup Language)のタグ要素から成るツリー構造を解析してWebページとして画面展開し表示したり印刷したりする。
図2は、前記サーバ・クライアント・システムにおけるサーバ装置10の回路構成を示すブロック図である。
サーバ装置10は、コンピュータとしてのCPU11を備え、このCPU11には、バス12を介してROM13、RAM14、外付けハードディスクなどの外部記憶装置15が接続される。
また、CPU11には、バス12を介してキーボード,マウスなどの入力装置16、LCD(Liquid Crystal Display)などの表示装置17、クライアント装置20,…との通信I/F(インターフェイス)18が接続される。
CPU11は、ROM13に予め記憶されているシステムプログラムや種々のアプリケーションプログラムに従ってRAM14を作業用メモリとし回路各部の動作を制御するもので、入力装置16からのキー入力信号や通信I/F18を介して受信されるクライアント装置20からのユーザ操作に応じたWebコンテンツ取得要求信号などに応じて前記種々のプログラムが起動・実行される。
前記Webコンテンツ15aは、例えば外部記憶装置15に適宜更新生成されて記憶されている。
図3は、前記サーバ・クライアント・システムにおけるクライアント装置20の回路構成を示すブロック図である。
クライアント装置20は、コンピュータとしてのCPU21を備え、このCPU21には、バス22を介してROM23、RAM24、メモリカードや光ディスク読み書き部などの外部記憶装置25が接続される。
また、CPU21には、バス22を介してキーボード,マウスなどの入力装置26、LCDからなる表示装置27、前記サーバ装置10との通信I/F(インターフェイス)28、Webページなどに記述されているテキストデータを音声データに変換する音声合成処理部29a、音声データを出力する音声出力部29bおよびスピーカSPが接続される。
CPU21は、ROM23に予め記憶されているシステムプログラムおよび種々のアプリケーションプログラムに従ってRAM24を作業用メモリとし回路各部の動作を制御するもので、入力装置27からの入力信号に応じて前記種々のアプリケーションプログラムが起動され実行される。
前記サーバ装置10…をインターネット(N)上のWebサイト、前記クライアント装置20,…を前記Webサイトにアクセス可能なユーザ端末とした場合、ユーザ端末(20)からWebサイト(10)へのアクセス要求に応じて、当該Webサイト(10)においてHTMLにより記述生成されたWebコンテンツ15aがアクセス要求元のユーザ端末(20)へ配信され、そのWebブラウザプログラム23aによりWebページに展開されて表示装置27に表示される。
このクライアント装置(ユーザ端末)20のWebブラウザプログラム23aは、ユーザ指定のWebサイトのサーバ装置10へのアクセスに伴い、そのWebコンテンツ15aを取得し、当該Webコンテンツ15bのHTMLのタグから成るツリー構造を解析して、WebページとしてRAM24内のフレームバッファFBに画面展開し表示する機能を有する。そして、表示中のWebページのハイパーテキストにおけるリンクテキストがフォーカスにより指示されると、リンク先のWebページのハイパーテキストから前記リンクテキストに対応する内容の本文テキストを抽出し、その読み上げ音声を音声合成して出力する機能を有する。
そして、前記RAM24には、リンクテキスト類似要素メモリ24aおよび読み上げ対象テキストメモリ24bが備えられる。
前記リンクテキスト類似要素メモリ24aには、前記リンク先Webページのハイパーテキストから前記リンクテキストと同一あるいは類似の文字列を含むタグ要素がリストアップされて記憶される。
前記読み上げ対象テキストメモリ24bには、前記リンクテキストの類似文字列を含むタグ要素の中で最も強いスタイルの文字列を含むタグ要素が判断され、それ以降のタグ要素から、設定数以上の読点を有し且つ設定数以上の文字からなるテキストが、前記リンクテキストに対応する本文テキストとして抽出されて記憶される。
このようなリンク先本文テキストの抽出・音声出力機能は、例えば前記Webブラウザプログラム23aにプラグインあるいはアドオンするプログラムにより実現される。
図4は、前記クライアント装置20においてサーバ装置(A)10[http://www.sight.a.co.jp]から取得されたWebページPの画面表示例を示す図である。
図5は、前記図4におけるWebページPを記述したHTMLソースPhtmを示す図である。
図4に示すように、クライアント装置20の表示装置27に表示させたWebページPはハイパーテキストであり、タイトルT「今日の速報ニュース」で示される5項目の見出しが何れもリンクテキストLtxt1〜Ltxt5に設定されている。そして、当該各リンクテキストLtxt1〜Ltxt5は、図5に示すHTMLソースPhtmにおいて、何れも“A”で括られるタグ要素に記述され、リンク先WebページのURLが対応付けられている。
例えば表示装置27に表示されたWebページPにおいて、3番目のリンクテキスト「首相、内閣支持率に注文」Ltxt3にフォーカスすると、当該リンクテキストLtxt3を記述したHTMLソースPhtmから、破線aで囲んで示すように、リンク先WebページのURL[http://www.sight_b.co.jp/news002.html]が取得される。
図6は、前記図5におけるリンクテキストLtxt3のリンク先URLに対応するWebページLPのHTMLソースLPhtmを示す図である。
図7は、前記図6におけるHTMLソースLPhtmにより記述されたリンク先WebページLPの画面表示例を示す図である。
図6に示すように、リンク先WebページLPのHTMLソースLPhtmには、前記リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の見出しテキスト「首相、内閣支持率に注文」Mtxtを含んでいる“H1”で括られるタグ要素が存在する。
そして、前記見出しテキスト「首相、内閣支持率に注文」Mtxtに対応する本文テキストHtxtは、当該見出しテキスト「首相、内閣支持率に注文」Mtxtを含むタグ要素“H1”以降のタグ要素“P”において、幾つもの読点を有する比較的長い文字列として記述されている。
このため、リンク先WebページLPのHTMLソースLPhtmから、前記リンク元WbページPにてフォーカスしたリンクテキストLtxtnに対応する本文テキストHtxtを抽出するには、当該リンクテキストLtxtnと同一(あるいは類似)の見出しテキストMtxtを含んでいるタグ要素“H1”を検索し、これ以降のタグ要素“P”において、読点を設定個数以上含み且つ設定数以上の文字数からなるテキストを抽出すればよい。
図8は、リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の画面表示例を示す図である。
このような、リンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の場合には、当該リンクテキストLtxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2から、最も「強い」文字列(フォントサイズ・フォントスタイル)からなる見出しテキストMtxt2を判断する。そして、この最も「強い」文字列からなる見出しテキストMtxt2を含んでいるタグ要素“H1”以降のタグ要素“P”において、読点を設定個数以上含み且つ設定数以上の文字数からなるテキストを抽出すればよい。
次に、前記構成のクライアント装置20におけるWebページ閲覧機能について説明する。
図9は、前記クライアント装置20によるWebページの閲覧に伴いリンク先Webページの本文テキストを取得してその読み上げ音声を出力するための読み上げ対象テキスト取得処理を示すフローチャートである。
例えばサーバ装置(A)10のWebサイト[http://www.sight_a.co.jp/]から取得されたユーザ所望のWebコンテンツ(A)15aのページP(図4参照)が表示装置27に表示されると、図9における読み上げ対象テキスト取得処理が起動され、先ず、RAM24b内の読み上げ対象テキストメモリ24bの内容が初期化によりクリアされる(ステップS1)。
そして、この表示中のWebページPにおいて、所望のリンクテキスト(例えば「首相、内閣支持率に注文」Ltxt3)にフォーカスが移動されると、当該フォーカスの当たっているリンクテキストLtxt3がRAM24に記憶される(ステップS2)。
すると、前記表示中のWebページPのHTMLソースPhtm(図5参照)から、前記フォーカスされたリンクテキストLtxt3に対応するリンク先WebページのURL[http://www.sight_b.co.jp/news002.html]が取得され、当該リンク先のHTMLソースLPhtm(図6参照)が取得される(ステップS3)。
すると、前記取得されたリンク先WebページのHTMLソースLPhtmから、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3と同じ(あるいは類似の)文字列を含むタグ要素を検索してリストアップする処理が、次の図10のフローチャートに従い実行される。
図10は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴うリンクテキストと同じ文字列を含む要素のリストアップ処理を示すフローチャートである。
このリストアップ処理が起動されると、RAM24内のリンクテキスト類似要素メモリ24aが初期化によりクリアされ(ステップA1)、前記ステップS3にて取得されたリンク先WebページのHTMLソースLPhtm(図6参照)において、テキストの記述を含むタグ要素が存在するか否か、当該HTMLソースLPhtmの先頭から各タグ要素毎に判断される(ステップA2)。
ここで、テキストの記述を含むタグ要素が存在すると判断された場合には(ステップA2(yes))、当該タグ要素に含まれるテキストが、前記ステップS2にて記憶されたリンクテキスト「首相、内閣支持率に注文」Ltxt3と同じ(あるいは類似の)文字列を含むか否か判断される(ステップA3)。
そして、図6におけるリンク先WebページのHTMLソースLPhtmの“H1”で括られるタグ要素において、リンクテキスト「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の文字列(見出しテキスト「首相、内閣支持率に注文」Mtxt)を含んでいると判断されると(ステップA3(yes))、このタグ要素“H1”がRAM24内のリンクテキスト類似要素メモリ24aに登録される(ステップA4)。
前記ステップA2において、テキストの記述を含まないタグ要素と判断された場合(ステップA2(no))、又は前記ステップA3において、テキストの記述を含んでいても前記リンクテキストLtxt3と同一(あるいは類似)の文字列を含まないと判断された場合(ステップA3(no))、又は前記ステップA4においてリンクテキストLtxt3と同一(あるいは類似)の文字列を含むタグ要素が登録されると、当該各ステップにおいて処理対象となったタグ要素がリンク先WebページのHTMLソースLPhtmにおける最後のタグ要素であるか否か判断される(ステップA5)。
ここで、リンク先WebページのHTMLソースLPhtmにおける最後のタグ要素でないと判断された場合には(ステップA5(no))、次のタグ要素を処理対象として前記ステップA2以降の処理が繰り返される(ステップA6→A2)。
こうした図10におけるリストアップ処理に基づき(ステップSA)、1以上のタグ要素がリストアップされたと判断されると(ステップS4(yes))、当該リストアップされたタグ要素は1つのみか否か判断される(ステップS5)。
ここで、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を含むタグ要素が1つのみでなく複数リストアップされたと判断された場合には(ステップS5(no))、当該リストアップされた複数のタグ要素にそれぞれ含まれる文字列のうち、最も「強い」文字列(フォントサイズ・フォントスタイル)を、リンク先Webページの本文テキストHtxtの直前に位置する文字列として抽出するための、図11における文字列の「強さ」の比較処理に移行される(ステップSB)。
一方、前記図6で示したように、「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の文字列(見出しテキストMtxt)を含むタグ要素が、“H1”の1つのみであると判断された場合には(ステップS5(yes))、当該1つのタグ要素“H1”に基づきリンク先Webページの本文テキストHtxtを抽出するための、図12における本文テキストの抽出処理に移行される(ステップSC)。
図11は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理を示すフローチャートである。
前記リンクテキスト「首相、内閣支持率に注文」Ltxt3に対応するリンク先Webページが、例えば図8で示したように、当該リンクテキストLtxt3と同一(あるいは類似)の文字列(見出しテキストMtxt1,Mtxt2)を含むタグ要素が複数リストアップされたWebページLP′である場合(ステップS5(no))、図11における文字列の「強さ」比較処理に移行され(ステップSB)、先ず比較対象のタグ要素を管理するための変数x,yが、それぞれx=2,y=1として初期化される(ステップB1)。
また、変数zに、前記リストアップ処理(ステップSA)に従いRAM24内のリンクテキスト類似要素メモリ24aに登録されたタグ要素の数(図8で示すリンク先Webページの場合は“2”)が代入される(ステップB2)。
すると、前記テキスト類似要素メモリ24aに登録されたリスト上のx番目(x=2)のタグ要素に記述された文字列について、そのフォントサイズおよびフォントスタイルが取得される(ステップB3)。
そして、前記リスト上x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが比較され(ステップB4)、等しいか否か判断される(ステップB5)。
ここで、x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが等しくないと判断され(ステップB5(no))、y番目(y=1)よりx番目(x=2)が大きいと判断された場合には(ステップB6(yes))、当該変数xの値“2”が変数yに代入される(ステップB7)。
逆に、y番目(y=1)よりx番目(x=2)が小さいと判断された場合には(ステップB6(no))、当該変数yの値はそのまま維持される。
一方、前記ステップB5において、x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが等しいと判断された場合には(ステップB5(yes))、さらに当該x番目(x=2)のタグ要素の文字列のフォントスタイルSTxとy番目(y=1)のタグ要素の文字列のフォントスタイルSTyとが比較され(ステップB8)、x番目のフォントスタイルSTxのみボールドか(ステップB9)、またはy番目のフォントスタイルSTyのみボールドか(ステップB10)、または何れのフォントスタイルも同じであるか(ステップB10(no))が判断される。
ここで、x番目(x=2)のタグ要素の文字列のフォントスタイルSTxのみボールドであると判断された場合には(ステップB9(yes))、当該変数xの値“2”が変数yに代入される(ステップB7)。
逆に、y番目(y=1)のタグ要素の文字列のフォントスタイルSTyのみボールドであると判断された場合には(ステップB10(yes))、当該変数yの値はそのまま維持される。
そして、前記フォントサイズSZが大きい方、または当該フォンサイズSZが等しくてもそのフォンスタイルSTがボールドである方の文字列を含むタグ要素の出現番号が変数yに設定されると、変数xと変数zが等しい、つまり変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断されるまで(ステップB11
)、当該変数xがインクリメントされ(ステップB12)、前記ステップB3以降の処理が繰り返される(ステップB12→B3)。
一方、x番目のタグ要素の文字列のフォントサイズSZxとy番目のタグ要素の文字列のフォントサイズSZyとが等しく(ステップB5(yes))、しかも何れのフォントスタイルSTx,STyも同じであると判断された場合には(ステップB10(no))、変数xと変数zが等しい、つまり変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の数に達したと判断されるまでは(ステップB13)、変数xの値が変数yに代入された後(ステップB14)、当該変数xがインクリメントされ(ステップB12)、前記ステップB3以降の処理が繰り返される(ステップB12→B3)。
なお、前記ステップB13において、変数xと変数zが等しく、当該変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断された場合には(ステップB13(yes))、リンク先WebページのHTMLソースにおいて、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を含む複数のタグ要素のうち、最も「強い」文字列含むタグ要素への絞り込みは不可としてエラー処理される(ステップB15)。
そして、前記ステップB11において、変数xと変数zが等しく、当該変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断されると(ステップB11(yes))、当該登録されたリスト上のy番目のタグ要素が、最も「強い」文字列を含むタグ要素として設定される(ステップB16)。
すなわち、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3に対応するリンク先Webページが、例えば図8で示したWebページLP′であって、当該リンクテキストLtxt3と同一(あるいは類似)の文字列(見出しテキストMtxt1,Mtxt2)を含む2つのタグ要素がリストアップされた場合には、フォントサイズSZの大きい方の見出しテキストMtxt2を含むy番目(y=2)のタグ要素が、最も「強い」文字列を含むタグ要素として設定される。
こうした前記一連の文字列の「強さ」比較処理を経て、リンクテキストLtxtnと同一(あるいは類似)の最も「強い」文字列を含むタグ要素が抽出されたと判断されると(ステップS6(yes))、当該最も「強い」文字列を含むタグ要素に基づきリンク先Webページの本文テキストHtxtを抽出するための、図12における本文テキストの抽出処理に移行される(ステップSC)。
図12は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴う本文テキストの抽出処理を示すフローチャートである。
この本文テキスト抽出処理が起動されると、先ず、前記リンクテキストLtxtnに対応するリンク先URLに従い取得されたWebページのHTMLソースにおいて、前記ステップSAにてリストアップされたリンクテキストLtxtnと同一(あるいは類似)の文字列を含む1つのタグ要素の次のタグ要素か、または前記ステップSBにて抽出されたリンクテキストLtxtnと同一(あるいは類似)で且つ最も「強い」文字列を含むタグ要素の次のタグ要素に注目する(ステップC1)。
そして、前記注目したタグ要素について、テキスト情報を含むタグ要素であるか否か判断される(ステップC2)。
ここで、前記注目したタグ要素が、テキスト情報を含むタグ要素であると判断された場合には(ステップC2(yes))、当該テキスト情報は読点を設定個数Npunc以上含むか否か判断される(ステップC3)。
そして、前記注目したタグ要素のテキスト情報が、読点を設定個数Npunc以上含むテキスト情報であると判断された場合には(ステップC3(yes))、さらに当該テキスト情報は設定文字数Mlen以上の長さであるか判断される(ステップC4)。
そして、前記注目したタグ要素のテキスト情報が、設定文字数Mlen以上の長さであると判断された場合には(ステップC4(yes))、当該テキスト情報が前記リンクテキストLtxtnに対応するリンク先WebページLPの読み上げ対象の本文テキストHtxtであるとして設定される(ステップC5)。
すると、前記リンクテキストLtxtnに対応するリンク先WebページLPの本文テキストHtxtが抽出されたと判断され(ステップS7(yes))、当該リンクテキストLtxtnと抽出された本文テキストHtxtとがそれぞれRAM24内の読み上げ対象テキストメモリ24bに記憶される(ステップS8)。そして、この読み上げ対象テキストメモリ24bに記憶されたリンクテキストLtxtnと本文テキストHtxtとが、前記音声合成処理部29aにより音声信号に変換され、音声出力部29bを介してスピーカSPから音声出力される。
すなわち、前記図4で示したWebページPにおいて、リンクテキスト「首相、内閣支持率に注文」Ltxt3にフォーカスを移動させると、当該リンクテキストtxt3に対応するリンク先WebページLPのハイパーテキスト(図6参照)から本文テキスト「政権発足を受け、…と冷静に受け止めた。」Htxtが抽出され、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3と共にその読み上げ音声が出力される。これにより、リンクテキストLtxtからそのリンク先WebページLPを実際に開いて表示させ、その内容を確認する必要なく、当該リンクテキストLtxtに対応する本文テキストHtxtの内容を簡単に知ることができ、所望のリンク先を時間のロスなく効率的に見つけて表示させることができる。
一方、現在注目しているタグ要素がテキスト情報を含んでいないと判断された場合(ステップC2(no))、またはテキスト情報を含んでいると判断されても、当該テキスト情報は設定個数Npunc以上の読点を含まないと判断された場合(ステップC3(no))、または当該テキスト情報が設定個数Npunc以上の読点を含んでいても、設定文字数Mlen以上の長さがないと判断された場合には(ステップC4(no))、注目中のタグ要素がリンク先WebページのHTMLソースにおける最後のタグ要素か否か判断される(ステップC6)。
ここで、最後のタグ要素でないと判断された場合には(ステップC6(no))、次のタグ要素に注目し(ステップC7)、前記ステップC2以降の処理が繰り返される(ステップC7→C2)。
そして、前記ステップC6において、最後のタグ要素であると判断された場合には(ステップC6(yes))、前記リンクテキストtxtnに対応するリンク先WebページLPのハイパーテキストから本文テキストとしてのテキスト情報は抽出されなかったと判断され(ステップS7(no))、エラー処理される。
したがって、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、現在表示中のWebページのハイパーテキストにおける任意のリンクテキストLtxtnに、カーソル操作などによって選択的にフォーカスを当てると、当該リンクテキストLtxtnに対応するリンク先URLに従い、そのリンク先Webページのハイパーテキスト(HTMLソース)が取得されると共に、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素がリストアップされる。そして、前記リンク先Webページのハイパーテキスト(HTMLソース)における、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素に基づき、それ以降のタグ要素に含まれる本文テキストHtxtが抽出され、その読み上げ音声が音声合成されて出力される。このため、リンクテキストLtxtnからそのリンク先WebページLPを実際に開いて表示させ、その内容を確認する必要なく、当該リンクテキストLtxtに対応する本文テキストHtxtの内容を簡単に知ることができ、所望のリンク先を時間のロスなく効率的に見つけて表示させることができる。
また、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、リンク先Webページのハイパーテキスト(HTMLソース)から、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素が複数リストアップされた場合には、当該複数のタグ要素のうち、フォンサイズSZやフォントスタイルSTにおいて最も「強い」文字列を含むタグ要素が抽出され、この抽出されたタグ要素以降のタグ要素に含まれるテキスト情報から本文テキストHtxtが判断抽出され、その読み上げ音声が出力される。このため、リンク先Webページのハイパーテキスト(HTMLソース)に、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素が複数存在していても、当該リンクテキストLtxtnに対応する本文テキストHtxtを含んでいるタグ要素を従えたタグ要素を確実に抽出できる。
また、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素以降のタグ要素に含まれるテキスト情報を本文テキストHtxtとして判断抽出するには、当該テキスト情報が設定個数Npunc以上の読点を含み、且つ設定文字数Mlen以上の長さであるかを判断して抽出する。このため、リンクテキストLtxtnに対応する本文テキストHtxtを正しく抽出してその読み上げ音声を出力できる。
なお、前記実施形態では、通常のサーバ・クライアント・システムにおけるクライアント装置20のWebブラウザ23aに対し前記Webページ閲覧機能を搭載して、表示中のWebページPのリンクテキストLtxtnに対応するリンク先サイトの本文テキストHtxtを抽出しその読み上げ音声を出力する場合について説明した。これに対し、サーバベース・コンピューティング・システムにおけるシン・クライアント端末にて表示中のWebページPのリンクテキストLtxtnに対応するリンク先サイトの本文テキストHtxtを抽出しその読み上げ音声を出力する場合には、当該シン・クライアント端末からの入力イベントによって起動するサーバ装置のWebブラウザに対し、前記同様のWebページ閲覧機能を搭載すればよい。
なお、前記各実施形態において記載したWebページ閲覧装置による各処理の手法、すなわち、図9のフローチャートに示す読み上げ対象テキスト取得処理、図10のフローチャートに示す同読み上げ対象テキスト取得処理に伴うリンクテキストと同一文字列を含むタグ要素のリストアップ処理、図11のフローチャートに示す同読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理、図12のフローチャートに示す同読み上げ対象テキスト取得処理に伴う本文テキスト抽出処理などの各手法は、何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード等)、磁気ディスク(フロッピディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の外部記憶装置25(15)の媒体に格納して配布することができる。そして、Webページ閲覧装置のコンピュータ(CPU21(11))は、この外部記憶装置25(15)の媒体に記憶されたプログラムを記憶装置(フラッシュROM23(13)やRAM24(14))に読み込み、この読み込んだプログラムによって動作が制御されることにより、前記各実施形態において説明したWebページ閲覧機能を実現し、前述した手法による同様の処理を実行することができる。
また、前記各手法を実現するためのプログラムのデータは、プログラムコードの形態として通信ネットワーク(N)上を伝送させることができ、この通信ネットワーク(N)に接続されたコンピュータ装置(プログラムサーバ)から前記のプログラムデータを取り込んで記憶装置(フラッシュROM23(13)やRAM24(14))に記憶させ、前述したWebページ閲覧機能を実現することもできる。
なお、本願発明は、前記各実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、前記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、各実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が異なる形態にして組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。
10 …サーバ装置
20 …クライアント装置
11,21…CPU
12,22…バス
13,23…ROM
23a…Webブラウザプログラム
14,24…RAM
24a…リンクテキスト類似要素メモリ
24b…読み上げ対象テキストメモリ
15,25…外部記憶装置
15a…Webコンテンツ
16,26…入力装置
17,27…表示装置
18,28…通信I/F
29a…音声合成処理部
29b…音声出力部
SP …スピーカ
N …通信ネットワーク
FB …フレームバッファ
P …Webページ
Phtm…WebページのHTMLソース
LP …リンク先Webページ
LPhtm…リンク先WebページのHTMLソース
Ltxtn…リンクテキスト
Mtxt…見出しテキスト
Htxt…本文テキスト

Claims (9)

  1. ページ情報を表示画面上に画面展開して表示するページ表示装置であって、
    前記表示画面上に表示された第1のページ情報に含まれるリンクデータに対応して設定されるリンク先指示情報に基づいて、そのリンク先指示情報で指示されるリンク先ページとしての第2のページ情報を取得するページ取得手段と、
    前記ページ取得手段により取得された第2のページ情報の中から前記第1のページ情報のリンクデータと同一あるいは類似のデータを検索し、その検索したデータに該当するリンク先部分情報を前記第2のページ情報の中から抽出する抽出手段と、
    前記抽出手段で抽出されたリンク先部分情報を出力するよう制御する出力制御手段と、
    を備えたことを特徴とするページ表示装置。
  2. ページ情報を表示画面上に画面展開して表示するページ表示装置であって、
    前記表示画面上に表示された第1のページ情報に含まれるリンクデータに対応して設定されるリンク先指示情報に基づいて、そのリンク先指示情報で指示されるリンク先ページとしての第2のページ情報を取得するページ取得手段と、
    前記ページ取得手段により取得された第2のページ情報の中から前記第1のページ情報内の前記リンクデータの表示内容に該当するデータ部分を検索し、その検索したデータ部分をリンク先部分情報として前記第2のページ情報の中から抽出する抽出手段と、
    前記抽出手段で抽出されたリンク先部分情報を出力するよう制御する出力制御手段と、
    を備えたことを特徴とするページ表示装置。
  3. 前記ページ取得手段は、前記第1のページ情報に含まれるリンクデータの中で、リンクデータを選択することでそのリンクデータに対応する前記第2のページ情報を開いて表示するためのジャンプ指示操作を行う前に、任意のリンクデータにフォーカスが当たった段階で、そのフォーカスが当たっているリンクデータに対応する前記第2のページ情報を取得し、
    前記リンクデータにフォーカスが当たった段階で、前記抽出手段による抽出と、前記出力制御手段による出力制御と、を行う、
    ことを特徴とする請求項1又は2に記載のページ表示装置。
  4. 前記出力制御手段は、前記抽出手段で前記リンク先部分情報を抽出できない場合には、前記出力をしないように制御する、
    ことを特徴とする請求項1〜3の何れかに記載のページ表示装置。
  5. 前記抽出手段は、前記第2のページ情報の中で前記検索のデータを含む要素の中でその要素以降に含まれるテキスト部分の情報を前記リンク先部分情報として抽出する、
    ことを特徴とする請求項1〜の何れかに記載のページ表示装置。
  6. 前記抽出手段は、前記検索で前記第1のページ上のリンクデータと同一あるいは類似のデータを複数検索した際は、その検索したデータの中で最も強調された部分のデータに該当するリンク先部分情報を抽出する、
    ことを特徴とする請求項1〜5の何れかに記載のページ表示装置。
  7. 前記出力制御手段は、前記リンク先部分情報を音声に変換して音声出力する、
    ことを特徴とする請求項1〜6の何れかに記載のページ表示装置。
  8. ページ情報を表示画面上に画面展開して表示するページ表示装置のコンピュータを制御するためのプログラムであって、
    前記コンピュータを、
    前記表示画面上に表示された第1のページ情報に含まれるリンクデータに対応して設定されるリンク先指示情報に基づいて、そのリンク先指示情報で指示されるリンク先ページとしての第2のページ情報を取得するページ取得手段、
    前記ページ取得手段により取得された第2のページ情報の中から前記第1のページ情報のリンクデータと同一あるいは類似のデータを検索し、その検索したデータに該当するリンク先部分情報を前記第2のページ情報の中から抽出する抽出手段、
    前記抽出手段で抽出されたリンク先部分情報を出力するよう制御する出力制御手段、
    として機能させるようにしたコンピュータ読み取り可能なプログラム。
  9. ページ情報を表示画面上に画面展開して表示するページ表示装置のコンピュータを制御するためのプログラムであって、
    前記コンピュータを、
    前記表示画面上に表示された第1のページ情報に含まれるリンクデータに対応して設定されるリンク先指示情報に基づいて、そのリンク先指示情報で指示されるリンク先ページとしての第2のページ情報を取得するページ取得手段、
    前記ページ取得手段により取得された第2のページ情報の中から前記第1のページ情報内の前記リンクデータの表示内容に該当するデータ部分を検索し、その検索したデータ部分をリンク先部分情報として前記第2のページ情報の中から抽出する抽出手段と、
    前記抽出手段で抽出されたリンク先部分情報を出力するよう制御する出力制御手段、
    として機能させるようにしたコンピュータ読み取り可能なプログラム。
JP2013154062A 2013-07-25 2013-07-25 ページ表示装置およびプログラム Active JP5729428B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013154062A JP5729428B2 (ja) 2013-07-25 2013-07-25 ページ表示装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013154062A JP5729428B2 (ja) 2013-07-25 2013-07-25 ページ表示装置およびプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008324227A Division JP5338298B2 (ja) 2008-12-19 2008-12-19 ページ閲覧装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2013250989A JP2013250989A (ja) 2013-12-12
JP5729428B2 true JP5729428B2 (ja) 2015-06-03

Family

ID=49849529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013154062A Active JP5729428B2 (ja) 2013-07-25 2013-07-25 ページ表示装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5729428B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10254876A (ja) * 1997-03-07 1998-09-25 Omron Corp 文書要約方法及び文書要約装置
JP2000276471A (ja) * 1999-03-23 2000-10-06 Seiko Epson Corp リンク先情報の概要提示方法およびリンク先情報の概要提示装置ならびにリンク先情報の概要提示処理プログラムを記録した記録媒体
JP2002297667A (ja) * 2001-03-29 2002-10-11 Sanyo Electric Co Ltd 文書閲覧装置
JP2004178291A (ja) * 2002-11-27 2004-06-24 Hitachi Software Eng Co Ltd 検索プログラム、検索方法及び検索装置
JP2004178512A (ja) * 2002-11-29 2004-06-24 Nippon Telegr & Teleph Corp <Ntt> リンク先コンテンツ閲覧支援装置、リンク先コンテンツ閲覧支援方法及びプログラム並びに記録媒体
US9740794B2 (en) * 2005-12-23 2017-08-22 Yahoo Holdings, Inc. Methods and systems for enhancing internet experiences

Also Published As

Publication number Publication date
JP2013250989A (ja) 2013-12-12

Similar Documents

Publication Publication Date Title
US8204950B2 (en) Webpage search
JP4935658B2 (ja) ブラウザプログラムおよび情報処理装置
JP2007264792A (ja) 音声ブラウザプログラム
JP5676167B2 (ja) サーチ結果を生成するシステムと方法
JP4386011B2 (ja) Webページ再編集方法及びシステム
JP5211266B1 (ja) 閲覧システム、端末、画像サーバ、プログラム、プログラムを記録したコンピュータ読み取り可能な記録媒体、及び方法
JP5136087B2 (ja) クライアント装置およびクライアント制御プログラム
JP5338298B2 (ja) ページ閲覧装置およびプログラム
JP5109759B2 (ja) 情報処理装置およびその制御プログラム
JP5267342B2 (ja) マッシュアッププログラム、マッシュアップ装置及びマッシュアップ方法
JP2008262506A (ja) 情報抽出システム、情報抽出方法および情報抽出用プログラム
JP5858479B2 (ja) 端末装置及びプログラム
KR100491613B1 (ko) 웹문서의 클로즈업 기능을 구비한 정보통신기기와 이것을 이용한 웹문서의 디스플레이 방법 및 그 방법을 기록한 기록매체
JP4935396B2 (ja) Webコンテンツ提供装置、Webコンテンツ提供方法およびプログラム
JP5729428B2 (ja) ページ表示装置およびプログラム
JP5682113B2 (ja) 情報表示装置およびプログラム
JP2010134780A (ja) 情報処理装置およびその制御プログラム
JP4014361B2 (ja) 音声合成装置及び音声合成方法並びに音声合成プログラムを記録したコンピュータ読み取り可能な記録媒体
JP5476867B2 (ja) マッシュアッププログラム、マッシュアップ装置及びマッシュアップ方法
JP2010033339A (ja) サーバベース・コンピューティング・システムのサーバ装置、サーバ制御プログラム、および表示制御装置、表示制御プログラム
JP2009295122A (ja) 構造化文書処理システム、構造化文書処理方法および構造化文書処理プログラム
JP2008191879A (ja) 情報表示装置、情報表示装置の表示方法、情報表示プログラム、および情報表示プログラムを記録した記録媒体
JP5939711B2 (ja) 情報処理装置およびその制御プログラム
JP2000067071A (ja) 文書表示装置および文書表示方法並びに文書表示プログラムを記録した記録媒体
JP2009230210A (ja) テキスト検索処理を実行させるコンピュータソフトウエアプログラムおよびその処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150323

R150 Certificate of patent or registration of utility model

Ref document number: 5729428

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150