JP5338298B2 - Page browsing device and program - Google Patents
Page browsing device and program Download PDFInfo
- Publication number
- JP5338298B2 JP5338298B2 JP2008324227A JP2008324227A JP5338298B2 JP 5338298 B2 JP5338298 B2 JP 5338298B2 JP 2008324227 A JP2008324227 A JP 2008324227A JP 2008324227 A JP2008324227 A JP 2008324227A JP 5338298 B2 JP5338298 B2 JP 5338298B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- page
- link
- web page
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、ページ閲覧装置およびプログラムに関する。 The present invention relates to a page browsing apparatus and a program.
従来から、LAN(Local Area Network)やWAN(Wide Area Network)、インターネットなど、通信ネットワークにおけるサーバ・クライアント・システムでは、クライアント装置が備えるWebブラウザにより、サーバ装置が生成保存している種々のWebページを取得表示して閲覧することが行われる。 Conventionally, in a server client system in a communication network such as a LAN (Local Area Network), a WAN (Wide Area Network), and the Internet, various Web pages generated and stored by the server device by a Web browser provided in the client device. Is obtained, displayed, and browsed.
一般に、Webページは、HTML(Hyper Text Markup Language)のソースコードにより記述されており、そのドキュメント構造をWebブラウザが解析して表示するものである。 In general, a Web page is described by HTML (Hyper Text Markup Language) source code, and a Web browser analyzes and displays the document structure.
このWebページには、ハイパーテキストとして、記述されたテキストを見出しとし、当該テキストの内容に対応する他のページへ遷移するためのハイパーリンクが設定されたテキスト部分(リンクテキスト)が複数箇所存在することが多い。 In this Web page, there are a plurality of text portions (link text) in which the described text is used as a headline and a hyperlink is set for transition to another page corresponding to the content of the text. There are many cases.
ユーザが、前記ハイパーテキストのリンクテキストにフォーカスして決定操作することにより、そのリンク先のURLへアクセスされて対応するWebページが取得され、画面展開され表示されるものである。 When the user focuses on the hypertext link text and performs a determination operation, the URL of the link destination is accessed, the corresponding Web page is acquired, and the screen is expanded and displayed.
この際、前記Webページ上でユーザがフォーカスするリンクテキストは、あくまで見出しであり、その内容の詳細はリンク先のWebページが取得され画面展開されないと把握できないので、ユーザが所望のリンク先のWebページを開くまでに、幾つかの必要としないリンク先のWebページを開いてしまうことが多々ある。 At this time, the link text focused on by the user on the Web page is just a headline, and the details of the content cannot be grasped unless the linked Web page is acquired and expanded on the screen. Before opening a page, a number of unnecessary linked Web pages are often opened.
この場合、リンク先のWebページが取得され画面展開される都度、その画面展開(レンダリング)の処理に時間が掛かり、しかも画面展開されたWebページの内容を見て、ユーザ所望のリンク先であったかを判断するので、元のWebページに戻ったり、別のリンクテキストにフォーカスして新たなWebページを開いたりする繰り返し操作が多くなる。このため、特に高速にレンダリング処理できない携帯端末のWebブラウザにおいては、所望のリンク先のWebページを見つけて開くまでに、無駄な待ち時間を要してしまう。 In this case, each time a linked Web page is acquired and the screen is expanded, it takes time to perform the screen expansion (rendering), and the contents of the Web page expanded on the screen are viewed to determine whether the link destination is desired by the user. Therefore, there are many repeated operations of returning to the original Web page or opening a new Web page by focusing on another link text. For this reason, a web browser of a portable terminal that cannot perform rendering processing at high speed requires a wasteful waiting time until a desired linked web page is found and opened.
一方で、Webページのハイパーテキストを音声合成して読み上げたり、当該ハイパーテキストに設定されたリンクテキストのみを順次音声合成して読み上げたりするのに伴い、リンク先へのジャンプを指示するユーザ操作が行われると、その読み上げ位置に応じてフォーカスされているリンクテキストのリンク先Webページへジャンプする機能を備えたハイパーテキスト制御装置が考えられている(例えば、特許文献1参照。)。
前記従来のハイパーテキスト制御装置では、ハイパーテキストを、ユーザが読まずしてその読み上げ音声を聞くことにより知ることができ、任意のテキスト読み上げ位置でのジャンプ指示により、関連のあるリンク先Webページへジャンプすることが可能である。しかしながら、リンク先のWebページがユーザ所望の内容であるか否かは、当該リンク先Webページが画面展開されてそれを確認するか、同リンク先Webページのハイパーテキスト先頭からの読み上げ音声を全て聞いていないと判断できない。このため、結局は各リンクテキストにフォーカスしてリンク先Webページを開く処理と元のWebページへ戻る処理とを所望のリンク先Webページが見つかるまで繰り返すことになり、ユーザの手間が多く時間的効率も悪い問題がある。 In the conventional hypertext control device, the user can know the hypertext by listening to the read-out voice without reading the hypertext, and by jump instruction at an arbitrary text-reading position, the user can go to the related linked web page. It is possible to jump. However, whether or not the linked web page has the user-desired content is determined by expanding the screen of the linked web page and confirming it, or by reading out all of the reading voice from the hypertext head of the linked web page. I can't judge without listening. For this reason, after all, the process of opening the link destination web page by focusing on each link text and the process of returning to the original web page are repeated until a desired link destination web page is found. There is also a problem with poor efficiency.
本発明は、このような課題に鑑みなされたもので、ページを閲覧する際に、ハイパーリンクのリンク先へジャンプしてそのページを開く必要なく、ユーザ所望のページにリンクするリンクテキストを容易に見つけることが可能になるページ閲覧装置およびプログラムを提供することを目的とする。 The present invention has been made in view of such problems, when viewing a page, without having to open the page to jump to the hyperlink destination, easily link text that links to a user desired page It is an object to provide a page browsing device and a program that can be found.
請求項1は、ページ情報を受信するページ受信手段と、前記ページ受信手段により受信されたページ情報を表示画面上に画面展開して表示するページ表示手段と、前記ページ表示手段により表示されたページ情報に含まれるリンクテキストの中で、任意のリンクテキストにフォーカスが当たった段階で、そのフォーカスが当たっているリンクテキストに対応するリンク先ページ情報を取得するページ取得手段と、前記ページ取得手段により取得されたリンク先ページ情報の中から、前記リンクテキストと同一あるいは類似の文字列を含む要素を抽出する要素抽出手段と、前記要素抽出手段により抽出された要素以降に含まれる本文テキストを抽出するテキスト抽出手段と、前記テキスト抽出手段により抽出された本文テキストを出力する出力手段と、を備えたことを特徴としている。 The first aspect of the present invention provides a page receiving means for receiving page information, a page display means for displaying the page information received by the page receiving means on a display screen, and a page displayed by the page display means. A page acquisition unit that acquires link destination page information corresponding to a link text that is in focus at a stage where an arbitrary link text is focused in the link text included in the information, and the page acquisition unit From the acquired linked page information, an element extraction unit that extracts an element including a character string that is the same as or similar to the link text, and a body text that is included after the element extracted by the element extraction unit is extracted. Text extraction means and output for outputting the body text extracted by the text extraction means Is characterized by comprising: a stage, a.
本発明によれば、ページを閲覧する際に、ハイパーリンクのリンク先へジャンプしてそのページを開く必要なく、ユーザ所望のページにリンクするリンクテキストを容易に見つけることが可能になる。 According to the present invention, when viewing the page, without the need to open the page to jump to hyper-link to point, to be able to easily find the link text that you want to link to the user's desired page ing.
以下図面により本発明の実施の形態について説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1は、本発明のWebページ閲覧装置の実施形態に係るサーバ・クライアント・システムの構成を示すブロック図である。 FIG. 1 is a block diagram showing a configuration of a server / client system according to an embodiment of a Web page browsing apparatus of the present invention.
このサーバ・クライアント・システムは、インターネット、WAN、LANなどからなるネットワークN上に接続された複数のサーバ装置10,…および複数のクライアント装置20,…を備える。
This server / client system includes a plurality of
サーバ装置10は、Webコンテンツ生成処理プログラム,登録ユーザ管理処理プログラム,Webページ配信処理プログラムなど、当該サーバ装置10の本体操作により機能する複数のアプリケーションプログラムを有し、例えば本サーバ装置10にユーザ登録されたクライアント装置20,…からの指定のWebサイトへのアクセス要求に応じて当該要求されたWebサイトにおけるWebコンテンツ15aのページを各クライアント装置20,…へ配信する。
The
クライアント装置20,…は、携帯電話,PDA(Personal Digital Assistant),PCなどからなり、インターネット接続処理プログラム、Webブラウザプログラム23a,Web印刷プログラムなど、当該端末装置20の本体操作により機能する複数のアプリケーションプログラムを有する。そして、例えば所望のWebサイト[http://www.sight_a.co.jp/]のサーバ装置(A)10にアクセスしてそのWebコンテンツA15aを取得し、当該WebコンテンツA15aのHTML(Hyper Text Markup Language)のタグ要素から成るツリー構造を解析してWebページとして画面展開し表示したり印刷したりする。
The
図2は、前記サーバ・クライアント・システムにおけるサーバ装置10の回路構成を示すブロック図である。
FIG. 2 is a block diagram showing a circuit configuration of the
サーバ装置10は、コンピュータとしてのCPU11を備え、このCPU11には、バス12を介してROM13、RAM14、外付けハードディスクなどの外部記憶装置15が接続される。
The
また、CPU11には、バス12を介してキーボード,マウスなどの入力装置16、LCD(Liquid Crystal Display)などの表示装置17、クライアント装置20,…との通信I/F(インターフェイス)18が接続される。
Further, an
CPU11は、ROM13に予め記憶されているシステムプログラムや種々のアプリケーションプログラムに従ってRAM14を作業用メモリとし回路各部の動作を制御するもので、入力装置16からのキー入力信号や通信I/F18を介して受信されるクライアント装置20からのユーザ操作に応じたWebコンテンツ取得要求信号などに応じて前記種々のプログラムが起動・実行される。
The
前記Webコンテンツ15aは、例えば外部記憶装置15に適宜更新生成されて記憶されている。
The
図3は、前記サーバ・クライアント・システムにおけるクライアント装置20の回路構成を示すブロック図である。
FIG. 3 is a block diagram showing a circuit configuration of the
クライアント装置20は、コンピュータとしてのCPU21を備え、このCPU21には、バス22を介してROM23、RAM24、メモリカードや光ディスク読み書き部などの外部記憶装置25が接続される。
The
また、CPU21には、バス22を介してキーボード,マウスなどの入力装置26、LCDからなる表示装置27、前記サーバ装置10との通信I/F(インターフェイス)28、Webページなどに記述されているテキストデータを音声データに変換する音声合成処理部29a、音声データを出力する音声出力部29bおよびスピーカSPが接続される。
Further, the
CPU21は、ROM23に予め記憶されているシステムプログラムおよび種々のアプリケーションプログラムに従ってRAM24を作業用メモリとし回路各部の動作を制御するもので、入力装置27からの入力信号に応じて前記種々のアプリケーションプログラムが起動され実行される。
The
前記サーバ装置10…をインターネット(N)上のWebサイト、前記クライアント装置20,…を前記Webサイトにアクセス可能なユーザ端末とした場合、ユーザ端末(20)からWebサイト(10)へのアクセス要求に応じて、当該Webサイト(10)においてHTMLにより記述生成されたWebコンテンツ15aがアクセス要求元のユーザ端末(20)へ配信され、そのWebブラウザプログラム23aによりWebページに展開されて表示装置27に表示される。
When the
このクライアント装置(ユーザ端末)20のWebブラウザプログラム23aは、ユーザ指定のWebサイトのサーバ装置10へのアクセスに伴い、そのWebコンテンツ15aを取得し、当該Webコンテンツ15bのHTMLのタグから成るツリー構造を解析して、WebページとしてRAM24内のフレームバッファFBに画面展開し表示する機能を有する。そして、表示中のWebページのハイパーテキストにおけるリンクテキストがフォーカスにより指示されると、リンク先のWebページのハイパーテキストから前記リンクテキストに対応する内容の本文テキストを抽出し、その読み上げ音声を音声合成して出力する機能を有する。
The
そして、前記RAM24には、リンクテキスト類似要素メモリ24aおよび読み上げ対象テキストメモリ24bが備えられる。
The
前記リンクテキスト類似要素メモリ24aには、前記リンク先Webページのハイパーテキストから前記リンクテキストと同一あるいは類似の文字列を含むタグ要素がリストアップされて記憶される。
In the link text
前記読み上げ対象テキストメモリ24bには、前記リンクテキストの類似文字列を含むタグ要素の中で最も強いスタイルの文字列を含むタグ要素が判断され、それ以降のタグ要素から、設定数以上の読点を有し且つ設定数以上の文字からなるテキストが、前記リンクテキストに対応する本文テキストとして抽出されて記憶される。
In the reading
このようなリンク先本文テキストの抽出・音声出力機能は、例えば前記Webブラウザプログラム23aにプラグインあるいはアドオンするプログラムにより実現される。
Such link destination body text extraction / speech output function is realized, for example, by a program plug-in or add-on to the
図4は、前記クライアント装置20においてサーバ装置(A)10[http://www.sight.a.co.jp]から取得されたWebページPの画面表示例を示す図である。
FIG. 4 is a diagram showing a screen display example of the Web page P acquired from the server device (A) 10 [http://www.sight.a.co.jp] in the
図5は、前記図4におけるWebページPを記述したHTMLソースPhtmを示す図である。 FIG. 5 is a diagram showing an HTML source Phtm describing the Web page P in FIG.
図4に示すように、クライアント装置20の表示装置27に表示させたWebページPはハイパーテキストであり、タイトルT「今日の速報ニュース」で示される5項目の見出しが何れもリンクテキストLtxt1〜Ltxt5に設定されている。そして、当該各リンクテキストLtxt1〜Ltxt5は、図5に示すHTMLソースPhtmにおいて、何れも“A”で括られるタグ要素に記述され、リンク先WebページのURLが対応付けられている。
As shown in FIG. 4, the Web page P displayed on the
例えば表示装置27に表示されたWebページPにおいて、3番目のリンクテキスト「首相、内閣支持率に注文」Ltxt3にフォーカスすると、当該リンクテキストLtxt3を記述したHTMLソースPhtmから、破線aで囲んで示すように、リンク先WebページのURL[http://www.sight_b.co.jp/news002.html]が取得される。
For example, in the Web page P displayed on the
図6は、前記図5におけるリンクテキストLtxt3のリンク先URLに対応するWebページLPのHTMLソースLPhtmを示す図である。 FIG. 6 is a diagram showing the HTML source LPhtm of the Web page LP corresponding to the link destination URL of the link text Ltxt3 in FIG.
図7は、前記図6におけるHTMLソースLPhtmにより記述されたリンク先WebページLPの画面表示例を示す図である。 FIG. 7 is a diagram showing a screen display example of the linked Web page LP described by the HTML source LPhtm in FIG.
図6に示すように、リンク先WebページLPのHTMLソースLPhtmには、前記リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の見出しテキスト「首相、内閣支持率に注文」Mtxtを含んでいる“H1”で括られるタグ要素が存在する。 As shown in FIG. 6, the HTML source LPhtm of the link destination web page LP includes the same (or similar) heading text as the link text “Prime Minister, Order to Cabinet Support Rate” Ltxt3 focused on the link source web page P. There is a tag element enclosed in “H1” that contains Mtxt, “Prime Minister, Order to Cabinet Support”.
そして、前記見出しテキスト「首相、内閣支持率に注文」Mtxtに対応する本文テキストHtxtは、当該見出しテキスト「首相、内閣支持率に注文」Mtxtを含むタグ要素“H1”以降のタグ要素“P”において、幾つもの読点を有する比較的長い文字列として記述されている。 The body text Htxt corresponding to the heading text “Prime Minister, Order with Cabinet Support Rate” Mtxt is a tag element “P” after the tag element “H1” including the heading text “Order with Prime Minister, Cabinet Support Rate” Mtxt. Are described as a relatively long character string having several readings.
このため、リンク先WebページLPのHTMLソースLPhtmから、前記リンク元WbページPにてフォーカスしたリンクテキストLtxtnに対応する本文テキストHtxtを抽出するには、当該リンクテキストLtxtnと同一(あるいは類似)の見出しテキストMtxtを含んでいるタグ要素“H1”を検索し、これ以降のタグ要素“P”において、読点を設定個数以上含み且つ設定数以上の文字数からなるテキストを抽出すればよい。 For this reason, in order to extract the body text Htxt corresponding to the link text Ltxtn focused on the link source Wb page P from the HTML source LPhtm of the link destination Web page LP, the same (or similar) as the link text Ltxtn. The tag element “H1” including the headline text Mtxt is searched, and in the subsequent tag element “P”, the text including the set number of readings and the number of characters exceeding the set number may be extracted.
図8は、リンク元WebページPにてフォーカスしたリンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の画面表示例を示す図である。 FIG. 8 shows the linked web page LP ′ that includes a plurality of headline texts Mtxt1, Mtxt2 that are the same as (or similar to) Ltxt that is the link text “Prime Minister, Order to Cabinet Support Rate” Ltxt focused on the link source web page P. It is a figure which shows the example of a screen display.
このような、リンクテキスト「首相、内閣支持率に注文」Ltxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2を含んでいるリンク先WebページLP′の場合には、当該リンクテキストLtxtと同一(あるいは類似)の複数の見出しテキストMtxt1,Mtxt2から、最も「強い」文字列(フォントサイズ・フォントスタイル)からなる見出しテキストMtxt2を判断する。そして、この最も「強い」文字列からなる見出しテキストMtxt2を含んでいるタグ要素“H1”以降のタグ要素“P”において、読点を設定個数以上含み且つ設定数以上の文字数からなるテキストを抽出すればよい。 In the case of a linked Web page LP ′ including a plurality of headline texts Mtxt1 and Mtxt2 that are the same (or similar) as the link text “Prime Minister, Order from the Cabinet's Support Rate” Ltxt, From a plurality of the same (or similar) headline texts Mtxt1, Mtxt2, the headline text Mtxt2 composed of the most “strong” character string (font size / font style) is determined. Then, in the tag element “P” after the tag element “H1” including the heading text Mtxt2 composed of the most “strong” character string, the text including the set number of readings and the number of characters exceeding the set number is extracted. That's fine.
次に、前記構成のクライアント装置20におけるWebページ閲覧機能について説明する。
Next, the Web page browsing function in the
図9は、前記クライアント装置20によるWebページの閲覧に伴いリンク先Webページの本文テキストを取得してその読み上げ音声を出力するための読み上げ対象テキスト取得処理を示すフローチャートである。
FIG. 9 is a flowchart showing the text-to-speech acquisition process for acquiring the body text of the linked Web page and outputting the text to be read out as the
例えばサーバ装置(A)10のWebサイト[http://www.sight_a.co.jp/]から取得されたユーザ所望のWebコンテンツ(A)15aのページP(図4参照)が表示装置27に表示されると、図9における読み上げ対象テキスト取得処理が起動され、先ず、RAM24b内の読み上げ対象テキストメモリ24bの内容が初期化によりクリアされる(ステップS1)。
For example, the page P (see FIG. 4) of the Web content (A) 15a desired by the user acquired from the Web site [http://www.sight_a.co.jp/] of the server device (A) 10 is displayed on the
そして、この表示中のWebページPにおいて、所望のリンクテキスト(例えば「首相、内閣支持率に注文」Ltxt3)にフォーカスが移動されると、当該フォーカスの当たっているリンクテキストLtxt3がRAM24に記憶される(ステップS2)。
Then, when the focus is moved to the desired link text (for example, “Order by Prime Minister, Cabinet Support Rate” Ltxt3) on the displayed Web page P, the focused link text Ltxt3 is stored in the
すると、前記表示中のWebページPのHTMLソースPhtm(図5参照)から、前記フォーカスされたリンクテキストLtxt3に対応するリンク先WebページのURL[http://www.sight_b.co.jp/news002.html]が取得され、当該リンク先のHTMLソースLPhtm(図6参照)が取得される(ステップS3)。 Then, the URL [http://www.sight_b.co.jp/news002] of the linked web page corresponding to the focused link text Ltxt3 from the HTML source Phtm (see FIG. 5) of the web page P being displayed. .html] is acquired, and the linked HTML source LPhtm (see FIG. 6) is acquired (step S3).
すると、前記取得されたリンク先WebページのHTMLソースLPhtmから、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3と同じ(あるいは類似の)文字列を含むタグ要素を検索してリストアップする処理が、次の図10のフローチャートに従い実行される。 Then, a process of searching for and listing a tag element including the same (or similar) character string as the link text “Prime Minister, Order to Cabinet Support” Ltxt3 from the HTML source LPhtm of the acquired link destination web page Is executed according to the flowchart of FIG.
図10は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴うリンクテキストと同じ文字列を含む要素のリストアップ処理を示すフローチャートである。
FIG. 10 is a flowchart showing a list-up process of elements including the same character string as the link text accompanying the reading-target text acquisition process of the
このリストアップ処理が起動されると、RAM24内のリンクテキスト類似要素メモリ24aが初期化によりクリアされ(ステップA1)、前記ステップS3にて取得されたリンク先WebページのHTMLソースLPhtm(図6参照)において、テキストの記述を含むタグ要素が存在するか否か、当該HTMLソースLPhtmの先頭から各タグ要素毎に判断される(ステップA2)。
When this list-up process is started, the link text
ここで、テキストの記述を含むタグ要素が存在すると判断された場合には(ステップA2(yes))、当該タグ要素に含まれるテキストが、前記ステップS2にて記憶されたリンクテキスト「首相、内閣支持率に注文」Ltxt3と同じ(あるいは類似の)文字列を含むか否か判断される(ステップA3)。 If it is determined that there is a tag element including a description of the text (step A2 (yes)), the text included in the tag element is stored in the link text “Prime Minister, Cabinet” stored in step S2. It is determined whether or not the support rate includes the same (or similar) character string as “order” Ltxt3 (step A3).
そして、図6におけるリンク先WebページのHTMLソースLPhtmの“H1”で括られるタグ要素において、リンクテキスト「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の文字列(見出しテキスト「首相、内閣支持率に注文」Mtxt)を含んでいると判断されると(ステップA3(yes))、このタグ要素“H1”がRAM24内のリンクテキスト類似要素メモリ24aに登録される(ステップA4)。
Then, in the tag element enclosed by “H1” in the HTML source LPhtm of the linked Web page in FIG. 6, the same (or similar) character string (headline text “Prime Minister” If it is determined that the order “Mtxt) is included in the cabinet support rate (step A3 (yes)), this tag element“ H1 ”is registered in the link text
前記ステップA2において、テキストの記述を含まないタグ要素と判断された場合(ステップA2(no))、又は前記ステップA3において、テキストの記述を含んでいても前記リンクテキストLtxt3と同一(あるいは類似)の文字列を含まないと判断された場合(ステップA3(no))、又は前記ステップA4においてリンクテキストLtxt3と同一(あるいは類似)の文字列を含むタグ要素が登録されると、当該各ステップにおいて処理対象となったタグ要素がリンク先WebページのHTMLソースLPhtmにおける最後のタグ要素であるか否か判断される(ステップA5)。 If it is determined in step A2 that the tag element does not include a text description (step A2 (no)), or even if the text description is included in step A3, it is the same as (or similar to) the link text Ltxt3. If the tag element including the same (or similar) character string as the link text Ltxt3 is registered in the step A4, it is determined that the character string is not included (step A3 (no)). It is determined whether or not the tag element to be processed is the last tag element in the HTML source LPhtm of the link destination Web page (step A5).
ここで、リンク先WebページのHTMLソースLPhtmにおける最後のタグ要素でないと判断された場合には(ステップA5(no))、次のタグ要素を処理対象として前記ステップA2以降の処理が繰り返される(ステップA6→A2)。 Here, when it is determined that it is not the last tag element in the HTML source LPhtm of the link destination Web page (step A5 (no)), the process after the step A2 is repeated with the next tag element as a processing target ( Step A6 → A2).
こうした図10におけるリストアップ処理に基づき(ステップSA)、1以上のタグ要素がリストアップされたと判断されると(ステップS4(yes))、当該リストアップされたタグ要素は1つのみか否か判断される(ステップS5)。 Based on the list-up process in FIG. 10 (step SA), if it is determined that one or more tag elements are listed (step S4 (yes)), it is determined whether there is only one tag element listed. (Step S5).
ここで、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を含むタグ要素が1つのみでなく複数リストアップされたと判断された場合には(ステップS5(no))、当該リストアップされた複数のタグ要素にそれぞれ含まれる文字列のうち、最も「強い」文字列(フォントサイズ・フォントスタイル)を、リンク先Webページの本文テキストHtxtの直前に位置する文字列として抽出するための、図11における文字列の「強さ」の比較処理に移行される(ステップSB)。 Here, when it is determined that a plurality of tag elements including the same (or similar) character string as the link text Ltxtn are listed instead of only one (step S5 (no)), the list is listed. A diagram for extracting the most “strong” character string (font size / font style) from among character strings included in a plurality of tag elements as a character string located immediately before the body text Htxt of the linked Web page. 11 shifts to the comparison processing of the “strength” of the character string (step SB).
一方、前記図6で示したように、「首相、内閣支持率に注文」Ltxt3と同一(あるいは類似)の文字列(見出しテキストMtxt)を含むタグ要素が、“H1”の1つのみであると判断された場合には(ステップS5(yes))、当該1つのタグ要素“H1”に基づきリンク先Webページの本文テキストHtxtを抽出するための、図12における本文テキストの抽出処理に移行される(ステップSC)。 On the other hand, as shown in FIG. 6, there is only one tag element “H1” that includes the same (or similar) character string (heading text Mtxt) as “Prime, Order from Cabinet Support Rate” Ltxt3. If it is determined (step S5 (yes)), the process proceeds to the body text extraction process in FIG. 12 for extracting the body text Htxt of the linked web page based on the one tag element “H1”. (Step SC).
図11は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理を示すフローチャートである。
FIG. 11 is a flowchart showing a character string “strength” comparison process associated with the reading-target text acquisition process of the
前記リンクテキスト「首相、内閣支持率に注文」Ltxt3に対応するリンク先Webページが、例えば図8で示したように、当該リンクテキストLtxt3と同一(あるいは類似)の文字列(見出しテキストMtxt1,Mtxt2)を含むタグ要素が複数リストアップされたWebページLP′である場合(ステップS5(no))、図11における文字列の「強さ」比較処理に移行され(ステップSB)、先ず比較対象のタグ要素を管理するための変数x,yが、それぞれx=2,y=1として初期化される(ステップB1)。 As shown in FIG. 8, for example, the linked Web page corresponding to the link text “Prime Minister, Order to Cabinet Support Rate” Ltxt3 is the same (or similar) character string (headline text Mtxt1, Mtxt2). ) Is a Web page LP ′ listed in plural (step S5 (no)), the process proceeds to the character string “strength” comparison process in FIG. 11 (step SB). Variables x and y for managing tag elements are initialized as x = 2 and y = 1, respectively (step B1).
また、変数zに、前記リストアップ処理(ステップSA)に従いRAM24内のリンクテキスト類似要素メモリ24aに登録されたタグ要素の数(図8で示すリンク先Webページの場合は“2”)が代入される(ステップB2)。
Also, the number of tag elements registered in the link text
すると、前記テキスト類似要素メモリ24aに登録されたリスト上のx番目(x=2)のタグ要素に記述された文字列について、そのフォントサイズおよびフォントスタイルが取得される(ステップB3)。
Then, the font size and font style of the character string described in the xth (x = 2) tag element on the list registered in the text
そして、前記リスト上x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが比較され(ステップB4)、等しいか否か判断される(ステップB5)。 Then, the font size SZx of the character string of the x-th (x = 2) tag element on the list is compared with the font size SZy of the character string of the y-th (y = 1) tag element (step B4) and are equal. Is determined (step B5).
ここで、x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが等しくないと判断され(ステップB5(no))、y番目(y=1)よりx番目(x=2)が大きいと判断された場合には(ステップB6(yes))、当該変数xの値“2”が変数yに代入される(ステップB7)。 Here, it is determined that the font size SZx of the character string of the xth (x = 2) tag element is not equal to the font size SZy of the character string of the yth (y = 1) tag element (step B5 (no )), When it is determined that the xth (x = 2) is larger than the yth (y = 1) (step B6 (yes)), the value “2” of the variable x is assigned to the variable y. (Step B7).
逆に、y番目(y=1)よりx番目(x=2)が小さいと判断された場合には(ステップB6(no))、当該変数yの値はそのまま維持される。 Conversely, if it is determined that the xth (x = 2) is smaller than the yth (y = 1) (step B6 (no)), the value of the variable y is maintained as it is.
一方、前記ステップB5において、x番目(x=2)のタグ要素の文字列のフォントサイズSZxとy番目(y=1)のタグ要素の文字列のフォントサイズSZyとが等しいと判断された場合には(ステップB5(yes))、さらに当該x番目(x=2)のタグ要素の文字列のフォントスタイルSTxとy番目(y=1)のタグ要素の文字列のフォントスタイルSTyとが比較され(ステップB8)、x番目のフォントスタイルSTxのみボールドか(ステップB9)、またはy番目のフォントスタイルSTyのみボールドか(ステップB10)、または何れのフォントスタイルも同じであるか(ステップB10(no))が判断される。 On the other hand, when it is determined in step B5 that the font size SZx of the character string of the xth (x = 2) tag element is equal to the font size SZy of the character string of the yth (y = 1) tag element. (Step B5 (yes)), the font style STx of the character string of the x-th (x = 2) tag element is compared with the font style STy of the character string of the y-th (y = 1) tag element. (Step B8), whether only the xth font style STx is bold (step B9), only the yth font style STy is bold (step B10), or is any font style the same (step B10 (no) )) Is determined.
ここで、x番目(x=2)のタグ要素の文字列のフォントスタイルSTxのみボールドであると判断された場合には(ステップB9(yes))、当該変数xの値“2”が変数yに代入される(ステップB7)。 When it is determined that only the font style STx of the character string of the xth (x = 2) tag element is bold (step B9 (yes)), the value “2” of the variable x is set to the variable y. (Step B7).
逆に、y番目(y=1)のタグ要素の文字列のフォントスタイルSTyのみボールドであると判断された場合には(ステップB10(yes))、当該変数yの値はそのまま維持される。 Conversely, when it is determined that only the font style STy of the character string of the y-th (y = 1) tag element is bold (step B10 (yes)), the value of the variable y is maintained as it is.
そして、前記フォントサイズSZが大きい方、または当該フォンサイズSZが等しくてもそのフォンスタイルSTがボールドである方の文字列を含むタグ要素の出現番号が変数yに設定されると、変数xと変数zが等しい、つまり変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断されるまで(ステップB11
)、当該変数xがインクリメントされ(ステップB12)、前記ステップB3以降の処理が繰り返される(ステップB12→B3)。
When the appearance number of the tag element including the character string whose font size SZ is larger or whose font style SZ is equal but whose phone style ST is bold is set in the variable y, the variable x Until it is determined that the variables z are equal, that is, the variable x has reached the total number of tag elements registered in the link text
), The variable x is incremented (step B12), and the processing after step B3 is repeated (step B12 → B3).
一方、x番目のタグ要素の文字列のフォントサイズSZxとy番目のタグ要素の文字列のフォントサイズSZyとが等しく(ステップB5(yes))、しかも何れのフォントスタイルSTx,STyも同じであると判断された場合には(ステップB10(no))、変数xと変数zが等しい、つまり変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の数に達したと判断されるまでは(ステップB13)、変数xの値が変数yに代入された後(ステップB14)、当該変数xがインクリメントされ(ステップB12)、前記ステップB3以降の処理が繰り返される(ステップB12→B3)。
On the other hand, the font size SZx of the character string of the xth tag element is equal to the font size SZy of the character string of the yth tag element (step B5 (yes)), and both font styles STx and STy are the same. (Step B10 (no)), the variable x is equal to the variable z, that is, until it is determined that the variable x has reached the number of tag elements registered in the link text
なお、前記ステップB13において、変数xと変数zが等しく、当該変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断された場合には(ステップB13(yes))、リンク先WebページのHTMLソースにおいて、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を含む複数のタグ要素のうち、最も「強い」文字列含むタグ要素への絞り込みは不可としてエラー処理される(ステップB15)。
If it is determined in step B13 that the variable x is equal to the variable z and the variable x has reached the total number of tag elements registered in the link text
そして、前記ステップB11において、変数xと変数zが等しく、当該変数xが前記リンクテキスト類似要素メモリ24aに登録されたタグ要素の総数に達したと判断されると(ステップB11(yes))、当該登録されたリスト上のy番目のタグ要素が、最も「強い」文字列を含むタグ要素として設定される(ステップB16)。
In Step B11, when it is determined that the variable x is equal to the variable z and the variable x has reached the total number of tag elements registered in the link text
すなわち、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3に対応するリンク先Webページが、例えば図8で示したWebページLP′であって、当該リンクテキストLtxt3と同一(あるいは類似)の文字列(見出しテキストMtxt1,Mtxt2)を含む2つのタグ要素がリストアップされた場合には、フォントサイズSZの大きい方の見出しテキストMtxt2を含むy番目(y=2)のタグ要素が、最も「強い」文字列を含むタグ要素として設定される。 That is, the linked Web page corresponding to the link text “Prime Minister, Order to Cabinet Support Rate” Ltxt3 is, for example, the Web page LP ′ shown in FIG. 8, and the same (or similar) character as the link text Ltxt3. When two tag elements including a column (heading text Mtxt1, Mtxt2) are listed, the y-th (y = 2) tag element including the heading text Mtxt2 having the larger font size SZ is the strongest. "Is set as a tag element containing a character string.
こうした前記一連の文字列の「強さ」比較処理を経て、リンクテキストLtxtnと同一(あるいは類似)の最も「強い」文字列を含むタグ要素が抽出されたと判断されると(ステップS6(yes))、当該最も「強い」文字列を含むタグ要素に基づきリンク先Webページの本文テキストHtxtを抽出するための、図12における本文テキストの抽出処理に移行される(ステップSC)。 When it is determined that the tag element including the most “strong” character string that is the same (or similar) to the link text Ltxtn is extracted through the “strength” comparison process of the series of character strings (step S6 (yes)). ), The process proceeds to the body text extraction process in FIG. 12 for extracting the body text Htxt of the linked Web page based on the tag element including the most “strong” character string (step SC).
図12は、前記クライアント装置20の読み上げ対象テキスト取得処理に伴う本文テキストの抽出処理を示すフローチャートである。
FIG. 12 is a flowchart showing a body text extraction process associated with the reading target text acquisition process of the
この本文テキスト抽出処理が起動されると、先ず、前記リンクテキストLtxtnに対応するリンク先URLに従い取得されたWebページのHTMLソースにおいて、前記ステップSAにてリストアップされたリンクテキストLtxtnと同一(あるいは類似)の文字列を含む1つのタグ要素の次のタグ要素か、または前記ステップSBにて抽出されたリンクテキストLtxtnと同一(あるいは類似)で且つ最も「強い」文字列を含むタグ要素の次のタグ要素に注目する(ステップC1)。 When this body text extraction process is started, first, in the HTML source of the Web page acquired according to the link destination URL corresponding to the link text Ltxtn, the same as the link text Ltxtn listed in the step SA (or The next tag element after one tag element including a similar character string, or the next tag element that is the same (or similar) to the link text Ltxtn extracted in step SB and includes the most “strong” character string. Note the tag element (step C1).
そして、前記注目したタグ要素について、テキスト情報を含むタグ要素であるか否か判断される(ステップC2)。 Then, it is determined whether or not the noted tag element is a tag element including text information (step C2).
ここで、前記注目したタグ要素が、テキスト情報を含むタグ要素であると判断された場合には(ステップC2(yes))、当該テキスト情報は読点を設定個数Npunc以上含むか否か判断される(ステップC3)。 Here, when it is determined that the noted tag element is a tag element including text information (step C2 (yes)), it is determined whether or not the text information includes a set number Npunc of reading points. (Step C3).
そして、前記注目したタグ要素のテキスト情報が、読点を設定個数Npunc以上含むテキスト情報であると判断された場合には(ステップC3(yes))、さらに当該テキスト情報は設定文字数Mlen以上の長さであるか判断される(ステップC4)。 When it is determined that the text information of the noted tag element is text information including a set number of readings Npunc or more (step C3 (yes)), the text information has a length of the set number of characters Mlen or more. Is determined (step C4).
そして、前記注目したタグ要素のテキスト情報が、設定文字数Mlen以上の長さであると判断された場合には(ステップC4(yes))、当該テキスト情報が前記リンクテキストLtxtnに対応するリンク先WebページLPの読み上げ対象の本文テキストHtxtであるとして設定される(ステップC5)。 If it is determined that the text information of the noted tag element is longer than the set number of characters Mlen (step C4 (yes)), the link destination Web corresponding to the link text Ltxtn corresponds to the text information. It is set as the body text Htxt to be read out of the page LP (step C5).
すると、前記リンクテキストLtxtnに対応するリンク先WebページLPの本文テキストHtxtが抽出されたと判断され(ステップS7(yes))、当該リンクテキストLtxtnと抽出された本文テキストHtxtとがそれぞれRAM24内の読み上げ対象テキストメモリ24bに記憶される(ステップS8)。そして、この読み上げ対象テキストメモリ24bに記憶されたリンクテキストLtxtnと本文テキストHtxtとが、前記音声合成処理部29aにより音声信号に変換され、音声出力部29bを介してスピーカSPから音声出力される。
Then, it is determined that the body text Htxt of the link destination Web page LP corresponding to the link text Ltxtn is extracted (step S7 (yes)), and the link text Ltxtn and the extracted body text Htxt are read out in the
すなわち、前記図4で示したWebページPにおいて、リンクテキスト「首相、内閣支持率に注文」Ltxt3にフォーカスを移動させると、当該リンクテキストtxt3に対応するリンク先WebページLPのハイパーテキスト(図6参照)から本文テキスト「政権発足を受け、…と冷静に受け止めた。」Htxtが抽出され、前記リンクテキスト「首相、内閣支持率に注文」Ltxt3と共にその読み上げ音声が出力される。これにより、リンクテキストLtxtからそのリンク先WebページLPを実際に開いて表示させ、その内容を確認する必要なく、当該リンクテキストLtxtに対応する本文テキストHtxtの内容を簡単に知ることができ、所望のリンク先を時間のロスなく効率的に見つけて表示させることができる。 That is, in the Web page P shown in FIG. 4, when the focus is moved to the link text “Prime Minister, Order to the Cabinet Support Rate” Ltxt3, the hypertext of the link destination Web page LP corresponding to the link text txt3 (FIG. 6). Htxt is extracted from the text of the text “Refer to the administration, and received it calmly.” From the text, and the read-out voice is output together with the link text “Prime Minister, Order from the Cabinet” Ltxt3. As a result, it is possible to easily know the contents of the body text Htxt corresponding to the link text Ltxt without having to confirm the contents by actually opening and displaying the linked web page LP from the link text Ltxt. Can be found and displayed efficiently without loss of time.
一方、現在注目しているタグ要素がテキスト情報を含んでいないと判断された場合(ステップC2(no))、またはテキスト情報を含んでいると判断されても、当該テキスト情報は設定個数Npunc以上の読点を含まないと判断された場合(ステップC3(no))、または当該テキスト情報が設定個数Npunc以上の読点を含んでいても、設定文字数Mlen以上の長さがないと判断された場合には(ステップC4(no))、注目中のタグ要素がリンク先WebページのHTMLソースにおける最後のタグ要素か否か判断される(ステップC6)。 On the other hand, if it is determined that the tag element currently focused on does not include text information (step C2 (no)), or if it is determined that it includes text information, the text information is equal to or greater than the set number Npunc. If it is determined that it does not include a punctuation mark (step C3 (no)), or if it is determined that the text information includes a punctuation mark greater than or equal to the set number Npunc but does not have a length equal to or greater than the set character number Mlen (Step C4 (no)), it is determined whether or not the tag element under attention is the last tag element in the HTML source of the linked web page (step C6).
ここで、最後のタグ要素でないと判断された場合には(ステップC6(no))、次のタグ要素に注目し(ステップC7)、前記ステップC2以降の処理が繰り返される(ステップC7→C2)。 If it is determined that the tag element is not the last tag element (step C6 (no)), the next tag element is noticed (step C7), and the processes after step C2 are repeated (step C7 → C2). .
そして、前記ステップC6において、最後のタグ要素であると判断された場合には(ステップC6(yes))、前記リンクテキストtxtnに対応するリンク先WebページLPのハイパーテキストから本文テキストとしてのテキスト情報は抽出されなかったと判断され(ステップS7(no))、エラー処理される。 If it is determined in step C6 that it is the last tag element (step C6 (yes)), the text information as the body text from the hypertext of the linked web page LP corresponding to the link text txtn. Is not extracted (step S7 (no)), and error processing is performed.
したがって、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、現在表示中のWebページのハイパーテキストにおける任意のリンクテキストLtxtnに、カーソル操作などによって選択的にフォーカスを当てると、当該リンクテキストLtxtnに対応するリンク先URLに従い、そのリンク先Webページのハイパーテキスト(HTMLソース)が取得されると共に、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素がリストアップされる。そして、前記リンク先Webページのハイパーテキスト(HTMLソース)における、前記リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素に基づき、それ以降のタグ要素に含まれる本文テキストHtxtが抽出され、その読み上げ音声が音声合成されて出力される。このため、リンクテキストLtxtnからそのリンク先WebページLPを実際に開いて表示させ、その内容を確認する必要なく、当該リンクテキストLtxtに対応する本文テキストHtxtの内容を簡単に知ることができ、所望のリンク先を時間のロスなく効率的に見つけて表示させることができる。
Therefore, according to the Web page browsing function in the
また、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、リンク先Webページのハイパーテキスト(HTMLソース)から、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素が複数リストアップされた場合には、当該複数のタグ要素のうち、フォンサイズSZやフォントスタイルSTにおいて最も「強い」文字列を含むタグ要素が抽出され、この抽出されたタグ要素以降のタグ要素に含まれるテキスト情報から本文テキストHtxtが判断抽出され、その読み上げ音声が出力される。このため、リンク先Webページのハイパーテキスト(HTMLソース)に、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素が複数存在していても、当該リンクテキストLtxtnに対応する本文テキストHtxtを含んでいるタグ要素を従えたタグ要素を確実に抽出できる。
Further, according to the Web page browsing function in the
また、前記構成のクライアント装置20におけるWebページ閲覧機能によれば、リンクテキストLtxtnと同一(あるいは類似)の文字列を有するタグ要素以降のタグ要素に含まれるテキスト情報を本文テキストHtxtとして判断抽出するには、当該テキスト情報が設定個数Npunc以上の読点を含み、且つ設定文字数Mlen以上の長さであるかを判断して抽出する。このため、リンクテキストLtxtnに対応する本文テキストHtxtを正しく抽出してその読み上げ音声を出力できる。
Further, according to the Web page browsing function in the
なお、前記実施形態では、通常のサーバ・クライアント・システムにおけるクライアント装置20のWebブラウザ23aに対し前記Webページ閲覧機能を搭載して、表示中のWebページPのリンクテキストLtxtnに対応するリンク先サイトの本文テキストHtxtを抽出しその読み上げ音声を出力する場合について説明した。これに対し、サーバベース・コンピューティング・システムにおけるシン・クライアント端末にて表示中のWebページPのリンクテキストLtxtnに対応するリンク先サイトの本文テキストHtxtを抽出しその読み上げ音声を出力する場合には、当該シン・クライアント端末からの入力イベントによって起動するサーバ装置のWebブラウザに対し、前記同様のWebページ閲覧機能を搭載すればよい。
In the embodiment, the Web page browsing function is installed in the
なお、前記各実施形態において記載したWebページ閲覧装置による各処理の手法、すなわち、図9のフローチャートに示す読み上げ対象テキスト取得処理、図10のフローチャートに示す同読み上げ対象テキスト取得処理に伴うリンクテキストと同一文字列を含むタグ要素のリストアップ処理、図11のフローチャートに示す同読み上げ対象テキスト取得処理に伴う文字列の「強さ」比較処理、図12のフローチャートに示す同読み上げ対象テキスト取得処理に伴う本文テキスト抽出処理などの各手法は、何れもコンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード等)、磁気ディスク(フロッピディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の外部記憶装置25(15)の媒体に格納して配布することができる。そして、Webページ閲覧装置のコンピュータ(CPU21(11))は、この外部記憶装置25(15)の媒体に記憶されたプログラムを記憶装置(フラッシュROM23(13)やRAM24(14))に読み込み、この読み込んだプログラムによって動作が制御されることにより、前記各実施形態において説明したWebページ閲覧機能を実現し、前述した手法による同様の処理を実行することができる。 It should be noted that each processing method by the Web page browsing apparatus described in each of the above embodiments, that is, the reading target text acquisition process shown in the flowchart of FIG. 9, the link text accompanying the reading target text acquisition process shown in the flowchart of FIG. A process for listing tag elements including the same character string, a “strength” comparison process for character strings associated with the text-to-speech target text acquisition process shown in the flowchart of FIG. 11, and a text-to-speech target text acquisition process shown in the flowchart of FIG. Each method such as text extraction processing is a program that can be executed by a computer, such as a memory card (ROM card, RAM card, etc.), magnetic disk (floppy disk, hard disk, etc.), optical disc (CD-ROM, DVD, etc.). Etc.), semiconductor memory, etc. It may be distributed and stored in the medium of the external storage device 25 (15). Then, the computer (CPU 21 (11)) of the Web page browsing device reads the program stored in the medium of the external storage device 25 (15) into the storage device (flash ROM 23 (13) or RAM 24 (14)), and this By controlling the operation by the read program, the Web page browsing function described in each of the above embodiments can be realized, and the same processing by the above-described method can be executed.
また、前記各手法を実現するためのプログラムのデータは、プログラムコードの形態として通信ネットワーク(N)上を伝送させることができ、この通信ネットワーク(N)に接続されたコンピュータ装置(プログラムサーバ)から前記のプログラムデータを取り込んで記憶装置(フラッシュROM23(13)やRAM24(14))に記憶させ、前述したWebページ閲覧機能を実現することもできる。 Further, program data for realizing each of the above methods can be transmitted on the communication network (N) in the form of a program code, and from a computer device (program server) connected to the communication network (N). It is also possible to capture the program data and store it in a storage device (flash ROM 23 (13) or RAM 24 (14)) to realize the Web page browsing function described above.
なお、本願発明は、前記各実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、前記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、各実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が異なる形態にして組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。 Note that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the invention at the stage of implementation. Further, each of the embodiments includes inventions at various stages, and various inventions can be extracted by appropriately combining a plurality of disclosed constituent elements. For example, even if some constituent elements are deleted from all the constituent elements shown in each embodiment or some constituent elements are combined in different forms, the problems described in the column of the problem to be solved by the invention If the effects described in the column “Effects of the Invention” can be obtained, a configuration in which these constituent requirements are deleted or combined can be extracted as an invention.
10 …サーバ装置
20 …クライアント装置
11,21…CPU
12,22…バス
13,23…ROM
23a…Webブラウザプログラム
14,24…RAM
24a…リンクテキスト類似要素メモリ
24b…読み上げ対象テキストメモリ
15,25…外部記憶装置
15a…Webコンテンツ
16,26…入力装置
17,27…表示装置
18,28…通信I/F
29a…音声合成処理部
29b…音声出力部
SP …スピーカ
N …通信ネットワーク
FB …フレームバッファ
P …Webページ
Phtm…WebページのHTMLソース
LP …リンク先Webページ
LPhtm…リンク先WebページのHTMLソース
Ltxtn…リンクテキスト
Mtxt…見出しテキスト
Htxt…本文テキスト
DESCRIPTION OF
12, 22 ...
23a ...
24a ... Link text
29a ... speech
Claims (7)
前記ページ受信手段により受信されたページ情報を表示画面上に画面展開して表示するページ表示手段と、
前記ページ表示手段により表示されたページ情報に含まれるリンクテキストの中で、任意のリンクテキストにフォーカスが当たった段階で、そのフォーカスが当たっているリンクテキストに対応するリンク先ページ情報を取得するページ取得手段と、
前記ページ取得手段により取得されたリンク先ページ情報の中から、前記リンクテキストと同一あるいは類似の文字列を含む要素を抽出する要素抽出手段と、
前記要素抽出手段により抽出された要素以降に含まれる本文テキストを抽出するテキスト抽出手段と、
前記テキスト抽出手段により抽出された本文テキストを出力する出力手段と、
を備えたことを特徴とするページ閲覧装置。 Page receiving means for receiving page information;
Page display means for expanding and displaying the page information received by the page receiving means on a display screen;
A page that obtains linked page information corresponding to the link text that is in focus when any link text is focused on among the link text included in the page information displayed by the page display means. Acquisition means;
Element extraction means for extracting an element including a character string that is the same as or similar to the link text from the linked page information acquired by the page acquisition means;
Text extraction means for extracting the body text included after the element extracted by the element extraction means;
Output means for outputting the body text extracted by the text extraction means;
A page browsing device comprising:
前記出力手段は、前記ページ表示手段により表示されたページ情報に含まれるリンクテキストの中で、リンクテキストを選択することでそのリンクテキストに対応するリンク先ページ情報を開くためのジャンプ指示操作を行う前に、前記テキスト抽出手段により抽出された本文テキストを出力する、
ことを特徴とする請求項1に記載のページ閲覧装置。 The page acquisition means performs a jump instruction operation for opening link destination page information corresponding to the link text by selecting the link text from the link text included in the page information displayed by the page display means. Before doing, when the focus is on any link text, get the linked page information corresponding to the link text that has the focus,
The output means performs a jump instruction operation to open link destination page information corresponding to the link text by selecting the link text from the link text included in the page information displayed by the page display means. Before, output the body text extracted by the text extraction means,
The page browsing apparatus according to claim 1.
前記テキスト抽出手段は、前記要素抽出手段により要素が1つ抽出された場合には、当該要素以降に含まれる本文テキストを抽出し、前記要素抽出手段により複数の要素が抽出された場合には、前記強調要素抽出手段により抽出された要素以降に含まれる本文テキストを抽出する、
ことを特徴とする請求項1または2に記載のページ閲覧装置。 An emphasis element extraction means for extracting an element including an emphasized character string among character strings included in the plurality of elements when a plurality of elements are extracted by the element extraction means;
When one element is extracted by the element extracting unit, the text extracting unit extracts a body text included after the element, and when a plurality of elements are extracted by the element extracting unit, Extracting the body text included after the element extracted by the emphasized element extraction means;
The page browsing apparatus according to claim 1 , wherein the page browsing apparatus is characterized.
ことを特徴とする請求項3に記載のページ閲覧装置。 The emphasis element extraction unit extracts an element including the emphasized character string by using a character string having a large font size or a character string having a font style as an emphasis style as the emphasized character string.
The page browsing apparatus of Claim 3 characterized by the above-mentioned.
ことを特徴とする請求項1〜4の何れかに記載のページ閲覧装置。 The output means converts the body text into speech and outputs the speech.
The page browsing apparatus in any one of Claims 1-4 characterized by the above-mentioned.
ことを特徴とする請求項1〜5の何れかに記載のページ閲覧装置。 The output means expands the body text on the display screen for display output;
The page browsing apparatus in any one of Claims 1-5 characterized by the above-mentioned.
前記コンピュータを、
ページ情報を受信するページ受信手段、
このページ受信手段により受信されたページ情報を表示画面上に画面展開して表示するページ表示手段、
このページ表示手段により表示されたページ情報に含まれるリンクテキストの中で、任意のリンクテキストにフォーカスが当たった際は、そのフォーカスが当たっているリンクテキストに対応するリンク先ページ情報を取得するページ取得手段、
このページ取得手段により取得されたリンク先ページ情報の中から、前記リンクテキストと同一あるいは類似の文字列を含む要素を抽出する要素抽出手段、
この要素抽出手段により抽出された要素以降に含まれる本文テキストを抽出するテキスト抽出手段、
このテキスト抽出手段により抽出された本文テキストを出力する出力手段、
として機能させるようにしたコンピュータ読み込み可能なプログラム。 A program for controlling a computer of a page browsing device,
The computer,
Page receiving means for receiving page information,
Page display means for expanding and displaying the page information received by the page receiving means on the display screen;
When the link text included in the page information displayed by this page display means is focused on any link text, the page that obtains the linked page information corresponding to the focused link text Acquisition means,
Element extraction means for extracting an element including a character string that is the same as or similar to the link text from the linked page information acquired by the page acquisition means;
Text extraction means for extracting the body text included after the element extracted by the element extraction means;
Output means for outputting the body text extracted by the text extraction means;
A computer-readable program designed to function as a computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008324227A JP5338298B2 (en) | 2008-12-19 | 2008-12-19 | Page browsing device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008324227A JP5338298B2 (en) | 2008-12-19 | 2008-12-19 | Page browsing device and program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013154062A Division JP5729428B2 (en) | 2013-07-25 | 2013-07-25 | Page display device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010146381A JP2010146381A (en) | 2010-07-01 |
JP5338298B2 true JP5338298B2 (en) | 2013-11-13 |
Family
ID=42566743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008324227A Active JP5338298B2 (en) | 2008-12-19 | 2008-12-19 | Page browsing device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5338298B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5559104B2 (en) * | 2011-07-29 | 2014-07-23 | 日本電信電話株式会社 | Information extraction method, information extraction apparatus, and information extraction program |
KR101399473B1 (en) * | 2012-08-13 | 2014-05-28 | (주)투비소프트 | Method and apparatus for rendering processing by using multiple processings |
JP5661828B2 (en) * | 2013-02-20 | 2015-01-28 | ヤフー株式会社 | Terminal device, audio output method, and audio output program |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000276471A (en) * | 1999-03-23 | 2000-10-06 | Seiko Epson Corp | Method and device for presenting outline of link destination information and recording medium for recording processing program for presenting outline of link destination information |
JP2002091473A (en) * | 2000-06-30 | 2002-03-27 | Fujitsu Ltd | Information processor |
JP4014361B2 (en) * | 2001-01-31 | 2007-11-28 | シャープ株式会社 | Speech synthesis apparatus, speech synthesis method, and computer-readable recording medium recording speech synthesis program |
JP3894428B2 (en) * | 2002-02-20 | 2007-03-22 | 日本ビクター株式会社 | Information extraction method, information retrieval method, and information extraction computer program |
JP2003281093A (en) * | 2002-03-26 | 2003-10-03 | Rikogaku Shinkokai | Method and device for browsing link destination information in browser |
JP3794686B2 (en) * | 2002-07-11 | 2006-07-05 | 株式会社シーイーシー | Link destination screen display system, link destination screen display program, and storage medium storing the program |
JP2005032041A (en) * | 2003-07-07 | 2005-02-03 | Nippon Telegr & Teleph Corp <Ntt> | Continuous browsing support device and method of linked content, and display control method, and erasing control method of pop-up window |
JP4634461B2 (en) * | 2005-09-27 | 2011-02-16 | 富士通株式会社 | Document text-to-speech processing program and document browsing device |
US8429152B2 (en) * | 2006-07-28 | 2013-04-23 | Access Co., Ltd. | Terminal device, content displaying method, and content displaying program |
JP5056523B2 (en) * | 2008-03-24 | 2012-10-24 | 富士通株式会社 | Display control apparatus, display control method, and display control program |
-
2008
- 2008-12-19 JP JP2008324227A patent/JP5338298B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010146381A (en) | 2010-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8204950B2 (en) | Webpage search | |
US8707183B2 (en) | Detection of a user's visual impairment based on user inputs or device settings, and presentation of a website-related data for sighted or visually-impaired users based on those inputs or settings | |
JP2007264792A (en) | Voice browser program | |
JP5211266B1 (en) | Browsing system, terminal, image server, program, computer-readable recording medium storing program, and method | |
US20070157081A1 (en) | Browser with screen-reading function and browsing processing method | |
JP2011028747A (en) | System and method for generating search term | |
JP2007328510A (en) | Content conversion device, content display device, content browsing device, content conversion method, content browsing method and program | |
JP4386011B2 (en) | Web page re-editing method and system | |
JP5136087B2 (en) | Client device and client control program | |
JP5338298B2 (en) | Page browsing device and program | |
JP5267342B2 (en) | Mashup program, mashup device, and mashup method | |
JP5109759B2 (en) | Information processing apparatus and control program thereof | |
KR100491613B1 (en) | Device and method for close-up web document having frame and and recording the method | |
JP5858479B2 (en) | Terminal device and program | |
JP4935396B2 (en) | Web content providing apparatus, web content providing method, and program | |
JP5729428B2 (en) | Page display device and program | |
JP5682113B2 (en) | Information display device and program | |
JP4014361B2 (en) | Speech synthesis apparatus, speech synthesis method, and computer-readable recording medium recording speech synthesis program | |
JP2010033339A (en) | Server device of server-based computing system, server control program, display control device, and display control program | |
JP2008191879A (en) | Information display device, display method for information display device, information display program, and recording medium with information display program recorded | |
JP2009295122A (en) | Structured document processing system, structured document processing method, and structured document processing program | |
JP2009086597A (en) | Text-to-speech conversion service system and method | |
JP2000067071A (en) | Device and method for displaying document and record medium recorded with document display program | |
JP5939711B2 (en) | Information processing apparatus and control program thereof | |
KR100923942B1 (en) | Method, system and computer-readable recording medium for extracting text from web page, converting same text into audio data file, and providing resultant audio data file |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130709 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130722 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5338298 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |