JP2006277090A - Web page processing program - Google Patents

Web page processing program Download PDF

Info

Publication number
JP2006277090A
JP2006277090A JP2005092509A JP2005092509A JP2006277090A JP 2006277090 A JP2006277090 A JP 2006277090A JP 2005092509 A JP2005092509 A JP 2005092509A JP 2005092509 A JP2005092509 A JP 2005092509A JP 2006277090 A JP2006277090 A JP 2006277090A
Authority
JP
Japan
Prior art keywords
web page
processing program
block
target
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005092509A
Other languages
Japanese (ja)
Inventor
Jun Yoshida
潤 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Embedded Products Ltd
Original Assignee
NEC Embedded Products Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Embedded Products Ltd filed Critical NEC Embedded Products Ltd
Priority to JP2005092509A priority Critical patent/JP2006277090A/en
Publication of JP2006277090A publication Critical patent/JP2006277090A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technology capable of automatically extracting only a section which is necessary for processing from a web page. <P>SOLUTION: In this web page processing program 50, a computer executes: a step (A) for, when a link section 131 showing a link on a certain page 120 displayed at a display device 70 is designated, acquiring a text including the link section 131 as a link text 132; a step (B) for retrieving at least a portion of the link text 132 as a target 200 from a link destination page 150; and a step (C) for selecting the block including the retrieved target 200 as a target bloc TB from a block group included in the link destination page 150 with a computer. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、ウェブページを処理するための技術に関する。   The present invention relates to a technique for processing a web page.

一般的に、WWW(World Wide Web)上の情報は、HTML(Hyper Text Markup Language)形式で記述される。ユーザは、ウェブブラウザを用いることによって、読み込まれたHTMLファイルをディスプレイ上に表示させることができる。表示されるページは、以下、「ウェブページ」と参照される。HTMLにより記述されるウェブページの強力な機能の一つは、「リンク機能」である。ユーザは、あるウェブページ上のリンクを指定することによって、リンク先の新たなウェブページを参照することができる。   Generally, information on the WWW (World Wide Web) is described in an HTML (Hyper Text Markup Language) format. The user can display the read HTML file on the display by using a web browser. The displayed page is hereinafter referred to as a “web page”. One of the powerful functions of a web page described by HTML is a “link function”. The user can refer to a new linked web page by designating a link on a certain web page.

例えば、ニュースを扱うウェブページには、しばしば、カテゴリ別にリンクが設けられている。より具体的には、「社会、経済、国際」といったトピックが示されたナビゲーションメニューがニュースページには表示されている。ユーザは、例えば「社会」を選択することにより、社会関連のニュースがまとめられた新たなページを参照することができる。   For example, web pages dealing with news are often provided with links by category. More specifically, a navigation menu showing topics such as “society, economy, and international” is displayed on the news page. For example, by selecting “Society”, the user can refer to a new page in which social-related news is compiled.

このようなナビゲーションメニューは、ユーザにとって大変便利な機能である。しかしながら、場合によっては、そのようなナビゲーションメニューは、本当に知りたい情報にアクセスする際の障壁となり得る。そのような場合の1つとして、ウェブページに含まれる情報を音声で読み上げる場合が挙げられる。ウェブページの音声読み上げは、例えば、視覚障害者や高齢者や自動車のドライバにとって有用なツールとなっている。ところが、あるニュースページに対して音声読み上げ処理が実行される場合、知りたいニュースが読み上げられるまでに、ナビゲーションメニューや広告などが読み上げられる可能性がある。それは、音声読み上げ機能を利用するユーザにとっては、煩わしいものである。   Such a navigation menu is a very convenient function for the user. However, in some cases, such a navigation menu can be a barrier to accessing the information you really want to know. As one of such cases, there is a case where information included in a web page is read out by voice. Speech reading of web pages has become a useful tool for visually impaired people, elderly people, and automobile drivers, for example. However, when a speech reading process is executed for a certain news page, there is a possibility that a navigation menu, an advertisement, etc. may be read out before the news to be known is read out. This is troublesome for a user who uses the voice reading function.

特許文献1には、このナビゲーションメニューの煩わしさを抑えることを目的としたウェブブラウザ制御方法が開示されている。このウェブブラウザ制御方法によれば、読み込まれたウェブページは、「HTMLのタグ」に基づいて解析され、例えばナビゲーションメニューは、1つのブロックとして扱われる。これにより、あるニュースページ内のナビゲーションメニューが読み上げられた場合においても、ユーザがスキップ処理を実行することによって、そのナビゲーションメニューの読み上げをスキップすることができる。つまり、ユーザは、不要なナビゲーションメニュー部分の読み上げが終わるのを待つ必要がなく、次の項目を参照することができる。   Patent Document 1 discloses a web browser control method for the purpose of suppressing the troublesomeness of the navigation menu. According to this web browser control method, the read web page is analyzed based on the “HTML tag”, and for example, the navigation menu is handled as one block. Thereby, even when the navigation menu in a certain news page is read out, the user can skip reading out the navigation menu by executing the skip process. That is, the user does not need to wait for the unnecessary navigation menu portion to be read out, and can refer to the next item.

また、特許文献2には音声合成制御方法が開示されている。この技術によれば、まず、音声出力する対象となる文書データのうち、該文書データを表示するウインドウエリア内に含まれるテキストデータが取り出される。次に、予め記憶された設定内容に従って読み上げ対象が特定される。そして、特定された読み上げ対象について音声合成処理が行われる。   Patent Document 2 discloses a speech synthesis control method. According to this technique, first, text data included in a window area displaying the document data is extracted from the document data to be output as audio. Next, the reading target is specified according to the setting contents stored in advance. Then, speech synthesis processing is performed on the specified reading target.

また、特許文献3には、電子メールやHTML形式によるテキストデータから、読み上げに適した部分を適切に切り出すことを目的とした文書処理方法が開示されている。この文書処理方法によれば、入力されたテキストデータは、その構成に応じて所定のブロックに分割される。次に、得られたブロックの文書構造が解析され、そのブロックは文単位で分割される。得られた文には、上記テキストデータの構成に応じてタグ情報が付加され、構造化される。構造化された文に付与されたタグ情報に基づいて、文の切り出しが制御される。   Patent Document 3 discloses a document processing method for appropriately cutting out a part suitable for reading from text data in an electronic mail or HTML format. According to this document processing method, the input text data is divided into predetermined blocks according to the configuration. Next, the document structure of the obtained block is analyzed, and the block is divided into sentence units. Tag information is added to the sentence obtained according to the structure of the text data, and the sentence is structured. Based on the tag information given to the structured sentence, sentence extraction is controlled.

特許文献4に開示された文書読み上げシステムは、構造化文書を見出し毎に分割する手段と、見出しとその下位に位置する文書を対応づける手段と、テキストを音声に変換するテキスト音声合成部と、複数の音声再生部からなる。各見出しとその下位に位置する文章は、それぞれの音声再生部に対応づけられ、再生される。   A document reading system disclosed in Patent Document 4 includes a unit that divides a structured document into headings, a unit that associates headings with documents positioned below them, a text-to-speech synthesizer that converts text into speech, It consists of a plurality of audio playback units. Each heading and the sentence located below it are associated with each sound reproduction unit and reproduced.

特開2004−171111号公報JP 2004-171111 A 特開2003−44070号公報JP 2003-44070 A 特開2002−334070号公報JP 2002-334070 A 特開2000−75876号公報JP 2000-75876 A

本発明の目的は、ウェブページから処理に必要な部分だけを自動的に取り出すことができる技術を提供することにある。特に、本発明の目的は、リンク先のウェブページから処理に必要な部分だけを自動的に取り出すことができる技術を提供することにある。   An object of the present invention is to provide a technique capable of automatically extracting only a part necessary for processing from a web page. In particular, an object of the present invention is to provide a technique that can automatically extract only a portion necessary for processing from a linked web page.

本発明の他の目的は、コンピュータにウェブページを音声で読み上げさせる際に、ユーザの負担を軽減することができる技術を提供することにある。   Another object of the present invention is to provide a technique capable of reducing the burden on the user when a computer reads out a web page by voice.

以下に、[発明を実施するための最良の形態]で使用される番号・符号を用いて、[課題を解決するための手段]を説明する。これらの番号・符号は、[特許請求の範囲]の記載と[発明を実施するための最良の形態]との対応関係を明らかにするために括弧付きで付加されたものである。ただし、それらの番号・符号を、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。   [Means for Solving the Problems] will be described below using the numbers and symbols used in [Best Mode for Carrying Out the Invention]. These numbers and symbols are added in parentheses in order to clarify the correspondence between the description of [Claims] and [Best Mode for Carrying Out the Invention]. However, these numbers and symbols should not be used for the interpretation of the technical scope of the invention described in [Claims].

例えば、ニュースを扱うウェブページには、ニュース記事の一覧が表示されている場合がある。その一覧に示されている各項目は、ニュースの本文が記載されたページにリンクされている。ユーザが一覧中の知りたいニュース記事を指定すると、リンク先のページが表示される。このようにして、ユーザはニュースの本文を知ることができる。ここで、一覧中のリンク部分に表示されているテキストと、リンク先ページにおけるニュースタイトルとは一致している可能性が極めて高い。ニュースタイトルが表示されているブロックには、ユーザが知りたいニュースの本文が記されている。すなわち、一覧中のリンク部分に現れる表現は、リンク先ページにおいて知りたい情報を探すための強力なヒントとなり得る。よって、一覧ページのリンク部分に現れるテキストを、リンク先ページ内で検索することによって、不必要なナビゲーションメニューや広告を自動的に飛ばすことが可能である。   For example, a list of news articles may be displayed on a web page that handles news. Each item shown in the list is linked to a page on which the news text is written. When the user specifies a news article that the user wants to know in the list, the linked page is displayed. In this way, the user can know the text of the news. Here, there is a very high possibility that the text displayed in the link portion of the list matches the news title on the linked page. In the block in which the news title is displayed, the text of the news that the user wants to know is written. That is, the expression that appears in the link portion in the list can be a powerful hint for searching for information to be found on the linked page. Therefore, it is possible to automatically skip unnecessary navigation menus and advertisements by searching the link destination page for text that appears in the link portion of the list page.

本発明によれば、以上の観点に立脚した技術が提供される。具体的には、本発明によれば、ウェブページを処理するためのプログラム(ソフトウェア・プロダクト)であって、コンピュータに以下に示される機能を実現させるためのウェブページ処理プログラムが提供される。   According to the present invention, a technique based on the above viewpoint is provided. Specifically, according to the present invention, there is provided a program (software product) for processing a web page, and a web page processing program for causing a computer to realize the following functions.

本発明の第1の観点において、ウェブページ処理プログラム(50)は、(A)表示装置(70)に表示されたあるページ(120、320)上でリンクを示すリンク部分(131、331)が指定された際、リンク部分(131、331)を含むテキストをリンクテキスト(132、332)として取得するステップと、(B)リンクテキスト(132、332)のうち少なくとも一部をターゲット(200)として、リンクにより指定されるページであるリンク先ページ(150、350)から検索するステップと、(C)リンク先ページ(150、350)に含まれるブロック群から、検索されたターゲット(200)を含むブロックをターゲットブロック(TB)として選択するステップとをコンピュータに実行させる。   In the first aspect of the present invention, the web page processing program (50) includes (A) a link portion (131, 331) indicating a link on a certain page (120, 320) displayed on the display device (70). When specified, a step of acquiring text including a link portion (131, 331) as link text (132, 332), and (B) at least part of the link text (132, 332) as a target (200) A search from the linked pages (150, 350), which is a page specified by the link, and (C) a target (200) retrieved from the block group included in the linked pages (150, 350). Selecting a block as a target block (TB).

このウェブページ処理プログラム(50)は、更に、(D)ターゲットブロック(TB)に含まれる内容を読み上げるステップをコンピュータに実行させる。あるいは、このウェブページ処理プログラム(50)は、(D)ターゲットブロック(TB)の開始位置より下に表示される内容を読み上げるステップをコンピュータに実行させる。これらの機能は、視覚障害者や高齢者や自動車のドライバにとって有用である。あるいは、このウェブページ処理プログラム(50)は、(D)ターゲットブロック(TB)を拡大して表示装置(70)に表示させるステップをコンピュータに実行させる。これらの機能は、視覚障害者や高齢者にとって有用である。あるいは、このウェブページ処理プログラム(50)は、(D)ターゲットブロック(TB)に対応するデータを記憶装置(20)に保存するステップをコンピュータに実行させる。これにより、ニュース記事等のスクラップブック(23)を容易に作成することが可能となる。   The web page processing program (50) further causes the computer to execute (D) a step of reading the content included in the target block (TB). Or this web page processing program (50) makes a computer perform the step which reads out the content displayed below the start position of (D) target block (TB). These functions are useful for visually impaired people, elderly people, and automobile drivers. Alternatively, the web page processing program (50) causes the computer to execute a step of (D) enlarging the target block (TB) and displaying it on the display device (70). These functions are useful for the visually impaired and the elderly. Or this web page processing program (50) makes a computer perform the step which preserve | saves the data corresponding to (D) target block (TB) in a memory | storage device (20). This makes it possible to easily create a scrapbook (23) such as a news article.

上記(A)ステップにおいて、リンク部分(131、331)だけが、上記リンクテキスト(132、332)として取得されてもよい。また、上記(A)ステップにおいて、リンク部分(131、331)を含む一文が、上記リンクテキスト(132、332)として取得されてもよい。   In the step (A), only the link portion (131, 331) may be acquired as the link text (132, 332). In the step (A), a sentence including the link portions (131, 331) may be acquired as the link text (132, 332).

上記(B)ステップは、(b1)リンクテキスト(132、332)の全てをターゲット(200)として、リンク先ページ(150、350)から検索するステップを含んでもよい。この(b1)ステップにおいてターゲット(200)が発見されなかった場合、上記(B)ステップは、(b2)リンクテキスト(132、332)から、リンクテキスト(132、332)を構成する少なくとも1つの単語を抽出するステップと、(b3)抽出された単語をターゲット(200)として、リンク先ページ(150、350)から検索するステップとを含んでもよい。ユーザにより指定された禁止単語が記憶装置(20)に登録されている場合、上記(b2)ステップにおいて、登録された禁止単語を参照することにより、禁止単語以外の単語がリンクテキスト(132、332)から抽出されてもよい。   The step (B) may include a step of (b1) searching from the linked pages (150, 350) with all the link texts (132, 332) as targets (200). When the target (200) is not found in this (b1) step, the above (B) step is (b2) at least one word constituting the link text (132, 332) from the link text (132, 332). And (b3) searching from the linked pages (150, 350) using the extracted word as the target (200). When the prohibited word designated by the user is registered in the storage device (20), in the step (b2), by referring to the registered prohibited word, words other than the prohibited word are linked text (132, 332). ).

あるいは、ユーザにより指定された禁止単語が記憶装置(20)に登録されている場合、上記(B)ステップは、(b1)記憶装置(20)に登録された禁止単語を参照することにより、リンクテキスト(132、332)に含まれる単語のうち、禁止単語以外の単語を抽出するステップと、(b2)抽出された単語をターゲット(200)として、リンク先ページ(150、350)から検索するステップとを含んでもよい。   Alternatively, when the prohibited word designated by the user is registered in the storage device (20), the step (B) performs the link by referring to the prohibited word registered in the (b1) storage device (20). A step of extracting words other than the prohibited words among the words included in the text (132, 332); and (b2) a step of searching from the linked pages (150, 350) using the extracted word as a target (200). And may be included.

リンク先ページ(150、350)に含まれるブロック群のうち複数のブロックが上記ターゲット(200)を含む場合、上記(C)ステップにおいて、その複数のブロックのうち、リンク先ページ(150、350)の最も上に表示されたブロックが、上記ターゲットブロック(TB)として選択されてもよい。あるいは、その複数のブロックのうち、ユーザによって指定されたブロックが、上記ターゲットブロック(TB)として選択されてもよい。あるいは、上記(C)ステップは、(c1)複数のブロックを順番に上記ターゲットブロック(TB)として選択するステップと、(c2)選択されたターゲットブロック(TB)を、ユーザの指定に応じてスキップするステップを含んでもよい。   When a plurality of blocks in the block group included in the linked page (150, 350) includes the target (200), in the step (C), the linked page (150, 350) among the plurality of blocks. May be selected as the target block (TB). Alternatively, a block designated by the user among the plurality of blocks may be selected as the target block (TB). Alternatively, the step (C) includes (c1) a step of selecting a plurality of blocks in order as the target block (TB), and (c2) skipping the selected target block (TB) according to the user's specification. The step of performing may be included.

このウェブページ処理プログラム(50)は、更に、(E)リンク先ページ(150、350)に関連する情報と、上記(C)ステップにおいて選択されたターゲットブロック(TB)の位置情報とを、対応付けて記憶装置(20)に格納するステップをコンピュータに実行させてもよい。   The web page processing program (50) further associates (E) information related to the linked pages (150, 350) with the position information of the target block (TB) selected in the step (C). In addition, the step of storing in the storage device (20) may be executed by a computer.

そのリンク先ページ(150、350)に関連する情報は、例えば、リンク先ページ(150、350)のアドレスである。同じリンク先ページ(150、350)のアドレスが再び指定された場合、ウェブページ処理プログラム(50)は、(F)そのリンク先ページ(150、350)に対応付けられた位置情報を、記憶装置(20)から読み出すステップと、(G)そのリンク先ページ(150、350)から、位置情報により示される位置のブロックをターゲットブロック(TB)として選択するステップとをコンピュータに実行させる。また、そのリンク先ページ(150、350)のアドレスと共通部分を有する他のアドレスが指定された場合、ウェブページ処理プログラム(50)は、(F)上記リンク先ページ(150、350)に対応付けられた位置情報を、記憶装置(20)から読み出すステップと、(G)上記他のアドレスにより指定される他のページから、位置情報により示される位置のブロックをターゲットブロック(TB)として選択するステップとをコンピュータに実行させる。   The information related to the link destination page (150, 350) is, for example, the address of the link destination page (150, 350). When the address of the same linked page (150, 350) is designated again, the web page processing program (50) stores (F) the positional information associated with the linked page (150, 350) in the storage device. The step of reading from (20) and the step of (G) selecting the block at the position indicated by the position information as the target block (TB) from the linked pages (150, 350) are executed by the computer. When another address having a common part with the address of the linked page (150, 350) is designated, the web page processing program (50) corresponds to (F) the linked page (150, 350). A step of reading the attached position information from the storage device (20); and (G) selecting a block at a position indicated by the position information as a target block (TB) from another page specified by the other address. Causing the computer to execute the steps.

また、そのリンク先ページ(150、350)に関連する情報は、上記あるページ(120、320)(リンク元ページ)のアドレスであってもよい。そのリンク元ページに含まれる他のリンクが指定された場合、ウェブページ処理プログラム(50)は、(F)そのリンク元ページに対応付けられた位置情報を、記憶装置(20)から読み出すステップと、(G)上記他のリンクにより指定される他のページから、位置情報により示される位置のブロックをターゲットブロック(TB)として選択するステップとをコンピュータに実行させる。   The information related to the linked pages (150, 350) may be the address of the certain page (120, 320) (link source page). When another link included in the link source page is designated, the web page processing program (50) reads (F) the position information associated with the link source page from the storage device (20). (G) causing the computer to execute a step of selecting a block at a position indicated by position information as a target block (TB) from another page specified by the other link.

本発明の第2の観点において、ウェブページ処理プログラム(50)は、(AA)表示装置(70)に表示されたページから、ユーザにより指定された単語を検索するステップと、(BB)ページに含まれるブロック群から、検索された単語を含むブロックをターゲットブロック(TB)として選択するステップと、(CC)ターゲットブロック(TB)に含まれる内容を読み上げるステップとをコンピュータに実行させる。   In the second aspect of the present invention, the web page processing program (50) includes: (AA) searching for a word designated by the user from the page displayed on the display device (70); A step of selecting a block including the searched word as a target block (TB) from the included block group and (CC) reading out the content included in the target block (TB) are executed by the computer.

上記ブロック群のうち複数のブロックがその単語を含む場合、上記(BB)ステップにおいて、その複数のブロックのうちページの最も上に表示されたブロックが、上記ターゲットブロック(TB)として選択されてもよい。また、その複数のブロックのうち、ユーザによって指定されたブロックが、ターゲットブロック(TB)として選択されてもよい。あるいは、上記(BB)ステップは、(bb1)複数のブロックを順番にターゲットブロック(TB)として選択するステップと、(bb2)選択されたターゲットブロック(TB)を、ユーザの指定に応じてスキップするステップとを含んでもよい。   When a plurality of blocks in the block group include the word, the block displayed at the top of the page among the plurality of blocks is selected as the target block (TB) in the (BB) step. Good. Moreover, the block designated by the user among the plurality of blocks may be selected as the target block (TB). Alternatively, in the (BB) step, (bb1) a step of selecting a plurality of blocks in order as a target block (TB), and (bb2) the selected target block (TB) is skipped according to the user's specification. Steps may be included.

本発明によれば、ウェブページから処理に必要な部分だけを自動的に取り出すことが可能となる。特に、本発明によれば、リンク先のウェブページから処理に必要な部分だけを自動的に取り出すことが可能となる。これにより、例えば、コンピュータにウェブページを音声で読み上げさせる際に、ユーザの負担を軽減することが可能となる。   According to the present invention, it is possible to automatically extract only a part necessary for processing from a web page. In particular, according to the present invention, it is possible to automatically extract only a portion necessary for processing from a linked web page. Thereby, for example, when a computer reads out a web page by voice, it is possible to reduce the burden on the user.

添付図面を参照して、本発明によるウェブページ処理システム及びウェブページ処理プログラムを説明する。   A web page processing system and a web page processing program according to the present invention will be described with reference to the accompanying drawings.

図1は、あるウェブページの例を示している。このウェブページはニュースを扱うサイトのウェブページである。ブラウザ画面110の所定の領域にページ120が表示されている。このページ120は、ナビゲーションメニューや広告を含んでおり、内容に基づいて複数のブロック(ブロック群)B1〜B6に分割され得る。ブロックB1には、「天気、辞書、地図、案内、HOME」といった全般的なナビゲーションメニューが表示されている。ブロックB2には、広告が表示されている。ブロックB3には、「社会、経済、政治、国際、スポーツ、サイエンス」といった、ニュースに関するナビゲーションメニューが表示されている。ブロックB4には、広告が表示されている。ブロックB5には、特集記事の一覧が表示されている。ブロックB6には、社会記事の一覧が表示されている。この例で示されるように、「ブロック」とは、「フレームや、罫線や、HTMLタグや、段落等によって規定されるページ上の1つのかたまり」として定義される。   FIG. 1 shows an example of a certain web page. This web page is the web page of a site that handles news. A page 120 is displayed in a predetermined area of the browser screen 110. The page 120 includes a navigation menu and an advertisement, and can be divided into a plurality of blocks (block groups) B1 to B6 based on the contents. A general navigation menu such as “weather, dictionary, map, guidance, HOME” is displayed in the block B1. An advertisement is displayed in the block B2. In the block B3, a navigation menu related to news such as “society, economy, politics, international, sports, science” is displayed. An advertisement is displayed in block B4. In block B5, a list of feature articles is displayed. In block B6, a list of social articles is displayed. As shown in this example, a “block” is defined as “one block on a page defined by a frame, ruled line, HTML tag, paragraph, etc.”.

ブロックB6には、記事の一覧が表示されており、より具体的には、「地裁判決、特許侵害認める」や「N社、新型パソコンを発売」といったニュースの見出しが表示されている。各見出しはリンクと対応付けられており、各見出しにはリンクを示す下線が施されている。例えば、見出し「地裁判決、特許侵害認める」にはリンク130aが関連付けられており、見出し「N社、新型パソコンを発売」にはリンク130bが関連付けられている。このリンク機能は、HTMLの強力な機能の一つである。ユーザがポインタ140を用いてあるリンクを指定すると、そのリンクで指定されるリンク先ページがブロックB6に表示される。   In block B6, a list of articles is displayed, and more specifically, news headlines such as “Distribution of district court, patent infringement recognized” and “Company N, release new personal computer” are displayed. Each heading is associated with a link, and each heading is underlined to indicate a link. For example, a link 130a is associated with the heading “Local court decision, patent infringement recognized”, and a link 130b is associated with the heading “Company N, release new personal computer”. This link function is one of the powerful functions of HTML. When the user designates a link using the pointer 140, the link destination page designated by the link is displayed in the block B6.

図2は、リンク130aで指定されるリンク先ページ150を示している。リンク先ページ150のブロックB6には、指定された見出しに対応したニュースの全文が表示されている。具体的には、「地裁判決、特許侵害認める」というタイトル160の後に、ニュースの詳しい内容が表示されている。ユーザが知りたい情報は、他のブロックB1〜B5ではなく、このブロックB6に含まれている。従って、例えば、このリンク先ページ150をコンピュータに読み上げさせる際には、他のブロックB1〜B5が読み上げ対象から排除されればよい。ブロックB6だけが対象(ターゲットブロックTB)として選択されればよい。   FIG. 2 shows a link destination page 150 designated by the link 130a. In the block B6 of the linked page 150, the full text of the news corresponding to the designated headline is displayed. Specifically, the detailed content of the news is displayed after the title 160 “Local court decision, patent infringement recognized”. The information that the user wants to know is included in this block B6, not in the other blocks B1 to B5. Therefore, for example, when the link destination page 150 is read out by the computer, the other blocks B1 to B5 may be excluded from the reading target. Only block B6 needs to be selected as the target (target block TB).

本願発明者らは、リンク先ページ150におけるニュースタイトル160(「地裁判決、特許侵害認める」)と、リンク元ページ120における見出し(「地裁判決、特許侵害認める」)とが一致していることに着目した。一般的に、リンク部分に表示されているテキストと、リンク先ページにおいて知りたい情報との間には強い相関がある。リンク部分に表示されているテキストが、リンク先ページにおいて検索すべき情報である可能性は極めて高い。つまり、リンク部分に現れる表現は、リンク先ページにおいて知りたい情報を探すための強力なヒントとなり得る。本願発明者らは、この傾向に着目した。図1及び図2に示された例においては、リンク130aに現れたテキストをリンク先ページ150内で検索することによって、ブロックB6をターゲットブロックTBとして自動的に抽出することが可能である。不必要なナビゲーションメニューや広告が表示されたブロックB1〜B5は、自動的に対象から除外される。   The inventors of the present application agree that the news title 160 on the linked page 150 (“dismissal for district court decision, patent infringement”) matches the headline on the link source page 120 (“decision on district court decision, patent infringement”). Pay attention. In general, there is a strong correlation between the text displayed in the link portion and the information desired to be known on the linked page. It is very likely that the text displayed in the link portion is information to be searched on the linked page. That is, the expression that appears in the link portion can be a powerful hint for searching for information to be found on the linked page. The inventors of the present application focused on this tendency. In the example shown in FIG. 1 and FIG. 2, it is possible to automatically extract the block B6 as the target block TB by searching the link destination page 150 for the text appearing on the link 130a. Blocks B1 to B5 in which unnecessary navigation menus and advertisements are displayed are automatically excluded from the target.

以上に示された思想を実現するための具体的な構成及びアルゴリズムが、以下に説明される。   A specific configuration and algorithm for realizing the above-described idea will be described below.

図3は、本発明に係るウェブページ処理システムの構成を示すブロック図である。このウェブページ処理システム1は、演算処理装置10、記憶装置20、ネットワークインターフェース30、ウェブブラウザ40、ウェブページ処理プログラム50、入力装置60、表示装置70、及び音声出力装置80を備えている。   FIG. 3 is a block diagram showing the configuration of the web page processing system according to the present invention. The web page processing system 1 includes an arithmetic processing device 10, a storage device 20, a network interface 30, a web browser 40, a web page processing program 50, an input device 60, a display device 70, and an audio output device 80.

演算処理装置10は、CPUを含み、また、各装置にアクセス可能である。記憶装置20としてHDDが例示される。記憶装置20には、後述される履歴データ21、禁止単語データ22、スクラップブックデータ23などが格納される。このウェブページ処理システム1は、ネットワークインターフェース30により、インターネット100に接続可能である。入力装置60として、マウスやキーボードが例示される。表示装置70として、液晶ディスプレイが例示される。音声出力装置80としてはスピーカが例示される。   The arithmetic processing device 10 includes a CPU and can access each device. An HDD is exemplified as the storage device 20. The storage device 20 stores history data 21, prohibited word data 22, scrapbook data 23, and the like, which will be described later. The web page processing system 1 can be connected to the Internet 100 via a network interface 30. Examples of the input device 60 include a mouse and a keyboard. An example of the display device 70 is a liquid crystal display. As the audio output device 80, a speaker is exemplified.

ウェブブラウザ40は、演算処理装置10によって実行されるコンピュータプログラム(ソフトウェア・プロダクト)である。インターネット100を介して読み込まれたデータ(HTMLファイル)は、ウェブブラウザ40によって処理され、そのデータに対応したウェブページ(120、150)が、表示装置70に表示される。ユーザは、入力装置60を用いることによって、表示されたウェブページ内のリンクを指定することができる。   The web browser 40 is a computer program (software product) executed by the arithmetic processing device 10. Data (HTML file) read via the Internet 100 is processed by the web browser 40, and web pages (120, 150) corresponding to the data are displayed on the display device 70. The user can specify a link in the displayed web page by using the input device 60.

ウェブページ処理プログラム50は、演算処理装置10によって実行されるコンピュータプログラム(ソフトウェア・プロダクト)である。ウェブページ処理プログラム50は、ウェブページからターゲットブロックTBを抽出するターゲット選択部51と、テキストデータを音声データに変換するテキスト−音声変換部52を有している。このウェブページ処理プログラム50は、ウェブブラウザ40と協働して、以下に説明される機能を提供する。   The web page processing program 50 is a computer program (software product) executed by the arithmetic processing device 10. The web page processing program 50 includes a target selection unit 51 that extracts a target block TB from a web page, and a text-to-speech conversion unit 52 that converts text data into speech data. The web page processing program 50 provides functions described below in cooperation with the web browser 40.

(第1の実施の形態)
図4は、本発明の第1の実施の形態に係るウェブページ処理方法を示すフローチャートである。図3及び図4を参照することによって、図1及び図2に示された例に対するウェブページ処理システム1の動作を説明する。
(First embodiment)
FIG. 4 is a flowchart showing a web page processing method according to the first embodiment of the present invention. The operation of the web page processing system 1 for the example shown in FIGS. 1 and 2 will be described with reference to FIGS.

今、表示装置70に、図1に示されたページ120が表示されているとする。まず、ユーザは、入力装置60を用いることにより、ページ120に表示されたポインタ140を動かし、見たいニュースの見出し(リンク)を指定する(ステップS1)。例えば、リンク130aが指定されたとする。図5に示されるように、このリンク130aにより示される部分は、特に、「リンク部分131」と参照される。つまり、リンク部分131は、ハイパーリンクと関連付けられた部分として定義され得る。表示装置70上において、このリンク部分131(「地裁判決、特許侵害認める」)には、しばしば下線が施されている。   Assume that the page 120 shown in FIG. 1 is displayed on the display device 70. First, the user moves the pointer 140 displayed on the page 120 by using the input device 60, and designates a news headline (link) to be viewed (step S1). For example, assume that the link 130a is designated. As shown in FIG. 5, the portion indicated by the link 130 a is particularly referred to as a “link portion 131”. That is, the link part 131 can be defined as a part associated with a hyperlink. On the display device 70, this link portion 131 (“local court decision, patent infringement recognized”) is often underlined.

次に、ウェブページ処理プログラム50のターゲット選択部51は、リンク部分131にテキストがあるかどうか判定する(ステップS2)。本例においては、リンク部分131にテキストがある(ステップS2;Yes)。この場合、ターゲット選択部51は、そのリンク部分131を少なくとも含むテキストを、「リンクテキスト132」として取得する(ステップS3)。図5に示されるように、本実施の形態においては、リンク部分131とリンクテキスト132は一致するものとする。ターゲット選択部51は、リンク部分131の全体(「地裁判決、特許侵害認める」)を、リンクテキスト132として取得する。   Next, the target selection unit 51 of the web page processing program 50 determines whether or not there is text in the link portion 131 (step S2). In this example, there is text in the link portion 131 (step S2; Yes). In this case, the target selection unit 51 acquires text including at least the link portion 131 as “link text 132” (step S3). As shown in FIG. 5, in the present embodiment, it is assumed that the link portion 131 and the link text 132 match. The target selection unit 51 acquires the entire link portion 131 (“local court decision, patent infringement recognized”) as the link text 132.

次に、ウェブブラウザ40は、通常のリンク機能を実行する(ステップS4)。これにより、表示装置70には、リンク先ページ150が表示される。次に、ウェブページ処理プログラム50のターゲット選択部51は、リンク先ページ150の構造解析を行う(ステップS5)。具体的には、ターゲット選択部51は、HTMLタグに基づいて、リンク先ページ150を構成するブロック群B1〜B6を抽出する。また、ターゲット選択部51は、それらブロック群B1〜B6の配置を解析してもよい。次に、ターゲット選択部51は、リンク先ページ150に含まれるブロック群B1〜B6から、処理対象となるブロックをターゲットブロックTBとして抽出する(ステップS10)。   Next, the web browser 40 executes a normal link function (step S4). As a result, the link destination page 150 is displayed on the display device 70. Next, the target selection unit 51 of the web page processing program 50 performs a structural analysis of the linked page 150 (step S5). Specifically, the target selection unit 51 extracts the block groups B1 to B6 constituting the linked page 150 based on the HTML tag. Moreover, the target selection part 51 may analyze arrangement | positioning of these block groups B1-B6. Next, the target selection unit 51 extracts a block to be processed as a target block TB from the block groups B1 to B6 included in the link destination page 150 (step S10).

図6は、このステップS10の内容を更に詳しく示すフローチャートである。まず、上記リンクテキスト132に基づいて、「検索ターゲット200」が決定される(ステップS11)。このステップS11においては、リンクテキスト132のうち少なくとも一部が、検索ターゲット200として決定されればよい。図5に示されるように、本実施の形態においては、リンクテキスト132の全て(「地裁判決、特許侵害認める」)が、検索ターゲット200として採用されるとする。次に、リンク先ページ150内で、その検索ターゲット200の検索が実行される(ステップS12)。   FIG. 6 is a flowchart showing the details of step S10 in more detail. First, “search target 200” is determined based on the link text 132 (step S11). In step S <b> 11, at least a part of the link text 132 may be determined as the search target 200. As shown in FIG. 5, in the present embodiment, it is assumed that all of the link text 132 (“local court decision, patent infringement recognized”) is adopted as the search target 200. Next, the search for the search target 200 is executed within the link destination page 150 (step S12).

次に、リンク先ページ150内に検索ターゲット200が存在するかどうか判定される(ステップS13)。本実施の形態においては、ブロックB6に含まれるニュースタイトル160(「地裁判決、特許侵害認める」)が、検索ターゲット200に一致している。よって、そのブロックB6がターゲットブロックTBとして選択される(ステップS14)。このように、リンク先ページ150内において検索ターゲット200に該当する部分が検索され、該当部分を含むブロックが抽出される。その後、ステップS100が実行される。   Next, it is determined whether or not the search target 200 exists in the link destination page 150 (step S13). In the present embodiment, the news title 160 included in the block B 6 (“local court decision, patent infringement recognized”) matches the search target 200. Therefore, the block B6 is selected as the target block TB (step S14). In this manner, a portion corresponding to the search target 200 is searched in the link destination page 150, and a block including the corresponding portion is extracted. Thereafter, step S100 is executed.

リンク先ページ150内に該当部分(該当ブロック)が複数含まれる場合、ユーザが選択処理を行うかどうかが尋ねられる(ステップS15)。ユーザが選択処理を行うかどうかは、予め設定されていてもよい。ユーザが選択処理を行う場合(ステップS15;Yes)、ユーザは入力装置60を用いることによって、複数の該当ブロックから所望のブロックを選択する。ターゲット選択部51は、ユーザにより選択されたブロックをターゲットブロックTBとして抽出する(ステップS16)。ユーザが選択処理を行わない場合(ステップS15;No)、ターゲット選択部51は、所定のルールに従ってターゲットブロックTBを決定する。例えば、複数の該当ブロックのうち、リンク先ページ150の最も上に表示されたブロックが、ターゲットブロックTBとして選択される(ステップS17)。その後、ステップS100が実行される。   If there are a plurality of relevant portions (corresponding blocks) in the linked page 150, the user is asked whether or not to perform selection processing (step S15). Whether the user performs the selection process may be set in advance. When the user performs the selection process (step S15; Yes), the user selects a desired block from a plurality of corresponding blocks by using the input device 60. The target selection unit 51 extracts the block selected by the user as the target block TB (step S16). When the user does not perform the selection process (step S15; No), the target selection unit 51 determines the target block TB according to a predetermined rule. For example, among the plurality of corresponding blocks, the block displayed at the top of the linked page 150 is selected as the target block TB (step S17). Thereafter, step S100 is executed.

また、リンク先ページ150内に該当ブロックが存在しない場合も考えられる。例えば、図2に示されたリンク先ページ150に、タイトル160が表示されていなかったとする。その場合、ターゲット選択部51は、現在の検索ターゲット200(リンクテキスト132)の構文解析を実行する(ステップS21)。現在の検索ターゲット200である「地裁判決、特許侵害を認める」という文には、「地裁判決」や「特許侵害」といった要素単語が含まれている。この時、ターゲット選択部51は、いずれかの要素単語を新たな検索ターゲット200として設定する(ステップS22)。例えば、「特許侵害」という要素単語が、新たな検索ターゲット200に設定される。このように、ターゲット選択部51は、検索ターゲット200を構成する少なくとも1つの要素単語を抽出し、抽出された要素単語を新たな検索ターゲット200として決定する。その後、上記ステップS12以下の処理が再度実行される。新たな検索ターゲット200もリンク先ページ150内に存在しない場合(ステップS20;Yes)、ユーザは、入力装置60を用いることにより、複数のブロックB1〜B6から1つのブロックをターゲットブロックTBとして指定する(ステップS23)。その後、ステップS100が実行される。   Further, there may be a case where the corresponding block does not exist in the link destination page 150. For example, it is assumed that the title 160 is not displayed on the link destination page 150 shown in FIG. In that case, the target selection unit 51 executes syntax analysis of the current search target 200 (link text 132) (step S21). The current search target 200, which is a sentence “local court decision, accepts patent infringement”, includes element words such as “district court decision” and “patent infringement”. At this time, the target selection unit 51 sets any element word as a new search target 200 (step S22). For example, the element word “patent infringement” is set in the new search target 200. As described above, the target selection unit 51 extracts at least one element word constituting the search target 200 and determines the extracted element word as a new search target 200. Thereafter, the processing after step S12 is executed again. When the new search target 200 does not exist in the linked page 150 (step S20; Yes), the user designates one block from the plurality of blocks B1 to B6 as the target block TB by using the input device 60. (Step S23). Thereafter, step S100 is executed.

尚、検索ターゲット200から抽出されるべきではない要素単語が、「禁止単語」として、予め登録されていてもよい。禁止単語としては、助詞、「こちら」、「クリック」などが例示される。ユーザは、これら禁止単語を予め指定しておくことができる。禁止単語を示す禁止単語データ22は、予め記憶装置20に格納されている(図3参照)。この場合、上記ステップS21、S22において、ターゲット選択部51は、記憶装置20に格納された禁止単語データ22を参照し、登録された禁止単語以外の要素単語を、新たな検索ターゲット200として設定する。これにより、検索ターゲット200の検索精度が向上する。   Element words that should not be extracted from the search target 200 may be registered in advance as “prohibited words”. Examples of prohibited words include particles, “here”, “click”, and the like. The user can designate these prohibited words in advance. The prohibited word data 22 indicating the prohibited words is stored in advance in the storage device 20 (see FIG. 3). In this case, in steps S <b> 21 and S <b> 22, the target selection unit 51 refers to the prohibited word data 22 stored in the storage device 20 and sets element words other than the registered prohibited words as a new search target 200. . Thereby, the search accuracy of the search target 200 is improved.

また、図4に示されたステップS2において、リンク部分131にテキストがない場合(ステップS2;No)、ウェブブラウザ40は、通常のリンク機能を実行する(ステップS6)。これにより、表示装置70には、リンク先ページ150が表示される。ユーザは、入力装置60を用いることによって、リンク先ページ150からターゲットブロックTBを選択する(ステップS7)。その後、ステップS100が実行される。   Further, in step S2 shown in FIG. 4, when there is no text in the link portion 131 (step S2; No), the web browser 40 executes a normal link function (step S6). As a result, the link destination page 150 is displayed on the display device 70. The user selects the target block TB from the linked page 150 by using the input device 60 (step S7). Thereafter, step S100 is executed.

以上のような処理によって、ターゲットブロックTBが自動的に決定された後、あるいは、ユーザにより指定された後、ステップS100が実行される(図4参照)。ステップS100において、例えば、ターゲットブロックTBに含まれる内容がコンピュータにより読み上げられる。具体的には、ウェブページ処理プログラム50のテキスト−音声変換部52は、ターゲットブロックTBに含まれるテキストデータを音声データに変換する。得られた音声データは、音声出力装置80により処理される。このようにして、ターゲットブロックTBの内容が、音声により読み上げられる。すなわち、図2に示されたナビゲーションメニュー(ブロックB1,B3)や広告(ブロックB2)は、読み上げられることはなく、最初からブロックB6の内容が自動的に読み上げられる。よって、煩わしさが解消され、ユーザの負担も軽減される。   After the target block TB is automatically determined by the process as described above or designated by the user, step S100 is executed (see FIG. 4). In step S100, for example, the contents included in the target block TB are read out by the computer. Specifically, the text-to-speech conversion unit 52 of the web page processing program 50 converts text data included in the target block TB into speech data. The obtained audio data is processed by the audio output device 80. In this way, the contents of the target block TB are read out by voice. That is, the navigation menu (blocks B1 and B3) and the advertisement (block B2) shown in FIG. 2 are not read out, and the contents of the block B6 are automatically read out from the beginning. Therefore, bothering is eliminated and the burden on the user is reduced.

このステップS100において、ターゲットブロックTBに含まれる内容だけが読み上げられてもよい。あるいは、ターゲットブロックTBだけではなく、ターゲットブロックTBに続くブロックが読み上げられてもよい。つまり、ターゲットブロックTBの開始位置(ニュースタイトル160)より下に表示されたテキストが全て読み上げられてもよい。また、読み上げ処理を終了する位置は、ユーザにより予め指定されていてもよい。例えば、ニュースページであれば、図2に示されるように、ニュース本文の最後に日付が記載されている場合がある。この日付情報が終了マーク170として予め登録されていれば、音声読み上げ処理は、その終了マーク170の位置で終了する。終了マーク170としては、日付以外に、新聞社名や、記者名や、罫線などが挙げられる。   In step S100, only the contents included in the target block TB may be read out. Alternatively, not only the target block TB but also a block following the target block TB may be read out. That is, all the text displayed below the start position (news title 160) of the target block TB may be read out. Further, the position where the reading process ends may be designated in advance by the user. For example, in the case of a news page, as shown in FIG. 2, the date may be written at the end of the news text. If this date information is registered in advance as the end mark 170, the voice reading process ends at the position of the end mark 170. Examples of the end mark 170 include a newspaper company name, a reporter name, a ruled line, and the like in addition to the date.

また、上記ステップS12の結果、リンク先ページ150に含まれる複数のブロックに、検索ターゲット200が存在する場合、その複数のブロックのそれぞれに含まれる内容が順番に読み上げられてもよい。読み上げられた内容がユーザの望むものではない時、ユーザは、スキップを指示することができる。スキップが指示された場合、次のブロックに含まれる内容の読み上げが開始する。このような処理を実現するためには、ターゲット選択部51は、その複数のブロックを順番に1つずつターゲットブロックTBとして選択すればよい。ユーザがスキップを指示した場合、ターゲット選択部51は、現在のターゲットブロックTBをスキップし、次のブロックを新たなターゲットブロックTBに設定すればよい。   As a result of step S12, when the search target 200 exists in a plurality of blocks included in the link destination page 150, the contents included in each of the plurality of blocks may be read out in order. When the content read out is not what the user desires, the user can instruct skipping. When skipping is instructed, reading of contents included in the next block starts. In order to realize such processing, the target selection unit 51 may select the plurality of blocks one by one as the target block TB in order. When the user instructs to skip, the target selection unit 51 may skip the current target block TB and set the next block as a new target block TB.

更に、本発明は、ウェブページの音声読み上げ処理以外にも適用され得る。例えば、上述のように抽出されたターゲットブロックTBが、ステップS100において、拡大されて表示装置70に表示されてもよい。この機能は、視覚障害者や高齢者にとって有用である。また、ステップS100において、ターゲットブロックTBに対応するデータが、スクラップブックデータ23として記憶装置20に保存されてもよい。これにより、ニュース記事等のスクラップブックを容易に作成することが可能となる。このように、本発明に係るウェブページ処理プログラム50は、ウェブページから一部分を取り出す必要がある操作には全て適用され得る。   Furthermore, the present invention can be applied to other than the speech reading process of the web page. For example, the target block TB extracted as described above may be enlarged and displayed on the display device 70 in step S100. This function is useful for visually impaired and elderly people. In step S100, data corresponding to the target block TB may be stored in the storage device 20 as the scrapbook data 23. This makes it possible to easily create a scrapbook such as a news article. As described above, the web page processing program 50 according to the present invention can be applied to all operations that require extracting a part from a web page.

本発明によれば、ウェブページから処理に必要な部分だけを自動的に取り出すことが可能となる。特に、本発明によれば、リンク先のウェブページから処理に必要な部分だけを自動的に取り出すことが可能となる。これにより、例えば、コンピュータにウェブページを音声で読み上げさせる際に、ユーザの負担を軽減することが可能となる。   According to the present invention, it is possible to automatically extract only a part necessary for processing from a web page. In particular, according to the present invention, it is possible to automatically extract only a portion necessary for processing from a linked web page. Thereby, for example, when a computer reads out a web page by voice, it is possible to reduce the burden on the user.

(第2の実施の形態)
図7は、本発明の第2の実施の形態に係るウェブページ処理方法を説明するための図である。図7に示されるように、本実施の形態において、リンク部分131は、日付を含んでおり、「地裁判決、特許侵害を認める(04/01 21:58)」と表されるとする。この時、図4に示された上記ステップS3において、リンク部分131と同じ部分がリンクテキスト132として取得される。この場合は、検索ターゲット200から日付の部分が除外されると好ましい。
(Second Embodiment)
FIG. 7 is a diagram for explaining a web page processing method according to the second embodiment of the present invention. As shown in FIG. 7, in the present embodiment, it is assumed that the link portion 131 includes a date and is expressed as “local court decision, patent infringement recognized (04/01 21:58)”. At this time, the same part as the link part 131 is acquired as the link text 132 in step S3 shown in FIG. In this case, it is preferable that the date portion is excluded from the search target 200.

そのため、本実施の形態によれば、図6に示された上記ステップS11において、ターゲット選択部51は、リンクテキスト132の一部を検索ターゲット200として決定する。この機能を実現するためには、ターゲット選択部51が、リンクテキスト132の終わりの括弧部分を除外して検索ターゲット200を決定するようにプログラムされていればよい。ステップS11以外は、第1の実施の形態における処理と同様の処理が実行される。これにより、第1の実施の形態と同様の効果が得られる。   Therefore, according to the present embodiment, in step S <b> 11 shown in FIG. 6, the target selection unit 51 determines a part of the link text 132 as the search target 200. In order to realize this function, the target selection unit 51 may be programmed so as to determine the search target 200 by excluding the parentheses at the end of the link text 132. Except for step S11, processing similar to the processing in the first embodiment is executed. Thereby, the same effect as that of the first embodiment can be obtained.

(第3の実施の形態)
本発明の第3の実施の形態によれば、リンク先ページ150からターゲットブロックTBが抽出された後、その抽出されたターゲットブロックTBの位置が記憶装置20に保存される。これにより、リンク先ページ150が再度アクセスされる場合や、リンク先ページ150と同様の構成を有するウェブページがアクセスされる場合に、その位置情報を参照することによって、素早く簡単にターゲットブロックTBが抽出され得る。
(Third embodiment)
According to the third embodiment of the present invention, after the target block TB is extracted from the link destination page 150, the position of the extracted target block TB is stored in the storage device 20. Thereby, when the linked page 150 is accessed again or when a web page having the same configuration as the linked page 150 is accessed, the target block TB can be quickly and easily referred to by referring to the position information. Can be extracted.

図8は、本発明の第3の実施の形態に係るウェブページ処理方法を示すフローチャートである。本実施の形態によれば、上記第1あるいは第2の実施の形態と同様に、ステップS1〜S5が実行される(図4参照)。次に、ウェブページ処理プログラム50のターゲット選択部51は、記憶装置20に格納された履歴データ21を参照する(ステップS30)。   FIG. 8 is a flowchart showing a web page processing method according to the third embodiment of the present invention. According to the present embodiment, steps S1 to S5 are executed as in the first or second embodiment (see FIG. 4). Next, the target selection unit 51 of the web page processing program 50 refers to the history data 21 stored in the storage device 20 (step S30).

図9は、本発明に係る履歴データ21の内容を示す概念図である。履歴データ21には、リンク先ページに関連する情報と、そのリンク先ページにおいて過去に抽出(選択)されたターゲットブロックTBの位置情報とが、互いに対応付けられて格納されている。リンク先ページに関連する情報は、例えば、そのリンク先ページ150のアドレスである。例えば、図1に示されたリンク130aにより指定されるアドレス(URL)が、「http://A.com/.../0401/15.html」であるとする。そのアドレスで指定されるページ(リンク先ページ150)において一度ターゲットブロックTBが抽出されると、図9に示されるように、そのアドレスと抽出されたターゲットブロックTBの位置情報P1とが対応付けられて履歴データ21として保存される。   FIG. 9 is a conceptual diagram showing the contents of the history data 21 according to the present invention. In the history data 21, information related to the link destination page and position information of the target block TB extracted (selected) in the past in the link destination page are stored in association with each other. The information related to the linked page is, for example, the address of the linked page 150. For example, it is assumed that the address (URL) designated by the link 130a shown in FIG. 1 is “http://A.com/.../0401/15.html”. Once the target block TB is extracted in the page specified by the address (link destination page 150), the address is associated with the extracted position information P1 of the target block TB as shown in FIG. And saved as history data 21.

また、図1に示されたリンク130bにより指定されるアドレス(URL)が、「http://A.com/.../0401/17.html」であるとする。そのアドレスで指定されるページにおいて一度ターゲットブロックTBが抽出されると、図9に示されるように、そのアドレスと抽出されたターゲットブロックTBの位置情報P1とが対応付けられて履歴データ21として保存される。   Further, it is assumed that the address (URL) designated by the link 130b shown in FIG. 1 is “http://A.com/.../0401/17.html”. Once the target block TB is extracted from the page specified by the address, the address and the position information P1 of the extracted target block TB are associated with each other and stored as history data 21 as shown in FIG. Is done.

ここで、リンク130aのアドレスに対する位置情報と、リンク130bのアドレスに対する位置情報が同じであることに着目されるべきである。図1や図2に示されたニュースページにおいては、各リンク先ページの基本的な構成は、同じである場合が多い。つまり、ブロック群B1〜B6の位置関係は変わらず、ブロックB6に表示される内容だけが変わる場合が多い。よって、あるニュースページに関する履歴データ21に関しては、図9に示されるように、トップページあるいはリンク元ページのアドレス(http://A.com/)と、ターゲットブロックTBの位置情報P1だけで十分である可能性がある。すなわち、上述のリンク先ページに関連する情報は、トップページあるいはリンク元ページのアドレスでもよい。   Here, it should be noted that the position information for the address of the link 130a is the same as the position information for the address of the link 130b. In the news pages shown in FIGS. 1 and 2, the basic configuration of each linked page is often the same. That is, the positional relationship between the block groups B1 to B6 does not change, and only the content displayed in the block B6 often changes. Therefore, as for the history data 21 related to a certain news page, as shown in FIG. 9, only the address of the top page or the link source page (http://A.com/) and the position information P1 of the target block TB are sufficient. There is a possibility. That is, the information related to the link destination page may be the address of the top page or the link source page.

また、リンク130aにより指定されるアドレスと、リンク130bにより指定されるアドレス130とを比較すると、パスの部分が共通であり、ファイル名のみが異なっている。従って、リンク130bが指定された場合、リンク130aのアドレスに対応付けられた位置情報P1が参照されてもよい。より一般的に、あるリンクが指定された場合、そのリンクのアドレスと共通部分を有するアドレスに対応付けられた位置情報が参照されてもよい。   Further, when the address specified by the link 130a and the address 130 specified by the link 130b are compared, the path portion is common and only the file name is different. Therefore, when the link 130b is designated, the position information P1 associated with the address of the link 130a may be referred to. More generally, when a certain link is designated, position information associated with an address having a common part with the address of the link may be referred to.

本実施の形態によれば、あるリンクが指定された時、指定されたアドレス(以下、指定アドレスと参照される)に関連する情報が、履歴データ21に既に登録されているかどうかがチェックされる(ステップS31)。例えば、リンク130bが指定された場合、指定アドレスそのもの(http://A.com/.../0401/17.html)が、履歴データ21から検索されてもよい。あるいは、その指定アドレスと共通部分を有するアドレス(http://A.com/.../0401/15.html)が、履歴データ21から検索されてもよい。あるいは、そのリンク元ページ120のアドレス(http://A.com/)が、履歴データ21から検索されてもよい。   According to the present embodiment, when a certain link is designated, it is checked whether information related to the designated address (hereinafter referred to as a designated address) is already registered in the history data 21. (Step S31). For example, when the link 130b is designated, the designated address itself (http://A.com/.../0401/17.html) may be retrieved from the history data 21. Alternatively, an address (http://A.com/.../0401/15.html) having a common part with the designated address may be searched from the history data 21. Alternatively, the address (http://A.com/) of the link source page 120 may be searched from the history data 21.

指定アドレスに関連する情報が履歴データ21に登録されている場合(ステップS31;Yes)、その関連する情報に対応付けられた位置情報P1が読み出される。つまり、ターゲット選択部51は、過去に抽出されたターゲットブロックTBの位置情報P1を取得する(ステップS32)。次に、ターゲット選択部51は、リンク先ページから、その位置情報P1により示される位置のブロックを、今回のターゲットブロックTBとして選択する(ステップS33)。これにより、ターゲットブロックTBの選択にかかる時間を削減することが可能となる。その後、上述のステップS100が実行され、履歴データ21の更新が行われる(ステップS34)。   When information related to the specified address is registered in the history data 21 (step S31; Yes), position information P1 associated with the related information is read. That is, the target selection unit 51 acquires the position information P1 of the target block TB extracted in the past (step S32). Next, the target selection unit 51 selects the block at the position indicated by the position information P1 from the link destination page as the current target block TB (step S33). Thereby, it is possible to reduce the time required for selecting the target block TB. Thereafter, the above-described step S100 is executed, and the history data 21 is updated (step S34).

指定アドレスに関連する情報が未だ履歴データ21に登録されていない場合(ステップS31;No)、既出のステップS10(図6参照)が実行される。その後、上述のステップS100が実行され、履歴データ21の更新が行われる(ステップS34)。   When the information related to the designated address is not yet registered in the history data 21 (step S31; No), the above-described step S10 (see FIG. 6) is executed. Thereafter, the above-described step S100 is executed, and the history data 21 is updated (step S34).

以上に説明されたように、本実施の形態によれば、第1及び第2の実施の形態と同様の効果が得られる。更に、本実施の形態によれば、追加的な効果として、ターゲットブロックTBの選択にかかる時間が低減されるという効果が得られる。ニュースページのように、記事ページのアドレスは変わるが、記事本文が表示される位置が変わらない場合に、本実施の形態は特に有効である。   As described above, according to the present embodiment, the same effects as those of the first and second embodiments can be obtained. Furthermore, according to the present embodiment, as an additional effect, there is an effect that the time required for selecting the target block TB is reduced. This embodiment is particularly effective when the address of the article page changes as in the news page, but the position where the article text is displayed does not change.

(第4の実施の形態)
本発明が適用され得るのは、ニュースページに限られない。図10は、ある製品を販売している会社のウェブページの例を示している。ブラウザ画面310の所定の領域にページ320が表示されている。このページ320は、ナビゲーションメニューや広告を含んでおり、内容に基づいて複数のブロック(ブロック群)B1〜B5に分割され得る。ブロックB1には、社名が表示されている。ブロックB2には、「ホーム、ソリューション、製品情報、トピックス、サポート」といったナビゲーションメニューが表示されている。ブロックB3には、広告が表示されている。ブロックB4には、テキストや画像が表示されている。ブロックB5には、メニューが表示されている。
(Fourth embodiment)
The present invention is not limited to news pages. FIG. 10 shows an example of a web page of a company that sells a certain product. A page 320 is displayed in a predetermined area of the browser screen 310. The page 320 includes a navigation menu and an advertisement, and can be divided into a plurality of blocks (block groups) B1 to B5 based on the contents. The company name is displayed in the block B1. In block B2, a navigation menu such as “Home, Solution, Product Information, Topics, Support” is displayed. An advertisement is displayed in the block B3. Text and images are displayed in the block B4. A menu is displayed in block B5.

ブロックB4には、ある製品に対する要約的な説明が表示されており、「本製品の動作環境については、こちらをご覧下さい。」という文が表示されているとする。また、この文中の「こちら」という単語にリンク330が関連付けられているとする。例えば、「こちら」という単語には下線が施されており、その部分がリンクであることがユーザに示されている。ユーザがポインタ340を用いてそのリンク330を指定すると、そのリンク330で指定されるリンク先ページが表示される。   In block B4, a summary explanation for a certain product is displayed, and it is assumed that a sentence “Please see here for the operating environment of this product.” Is displayed. Further, it is assumed that the link 330 is associated with the word “here” in the sentence. For example, the word “here” is underlined to indicate to the user that the part is a link. When the user designates the link 330 using the pointer 340, the link destination page designated by the link 330 is displayed.

図11は、リンク330で指定されるリンク先ページ350を示している。リンク先ページ350においては、ブロックB6に製品名が表示され、ブロックB7に動作環境が箇条書きで表示され、ブロックB8にテーブルが表示されている。この例で示されるように、「ブロック」とは、「HTMLタグや、テーブルや、セル等によって規定されるページ上の1つのかたまり」としても定義され得る。ユーザが知りたい情報は、ブロックB7に含まれている。従って、例えば、このリンク先ページ350をコンピュータに読み上げさせる際には、他のブロックB1〜B6、及びB8が読み上げ対象から排除されればよい。ブロックB7だけが対象(ターゲットブロックTB)として選択されればよい。   FIG. 11 shows a linked page 350 designated by the link 330. In the link destination page 350, the product name is displayed in block B6, the operating environment is displayed in itemized form in block B7, and the table is displayed in block B8. As shown in this example, a “block” can also be defined as “one chunk on a page defined by an HTML tag, a table, a cell, or the like”. Information that the user wants to know is included in block B7. Therefore, for example, when the linked page 350 is read by the computer, the other blocks B1 to B6 and B8 may be excluded from the reading target. Only block B7 needs to be selected as the target (target block TB).

本実施の形態に係るウェブページ処理は、第1の実施の形態とほぼ同様である(図4参照)。今、表示装置70に、図10に示されたページ320が表示されているとする。まず、ユーザは、入力装置60を用いることにより、ページ320に表示されたポインタ340を動かし、リンク330を指定する(ステップS1)。図12に示されるように、この例において、リンク部分331は、「こちら」である。次に、ウェブページ処理プログラム50のターゲット選択部51は、リンク部分331にテキストがあるかどうか判定する(ステップS2)。本例においては、リンク部分331にテキストがある(ステップS2;Yes)。この場合、ターゲット選択部51は、そのリンク部分331を少なくとも含むテキストを、リンクテキスト332として取得する(ステップS3)。具体的には、図12に示されるように、ターゲット選択部51は、リンク部分331を含む一文(「本製品の動作環境については、こちらをご覧下さい」)を、リンクテキスト332として取得する。   Web page processing according to the present embodiment is substantially the same as that of the first embodiment (see FIG. 4). Now, assume that the page 320 shown in FIG. 10 is displayed on the display device 70. First, the user moves the pointer 340 displayed on the page 320 by using the input device 60, and designates the link 330 (step S1). As shown in FIG. 12, in this example, the link portion 331 is “here”. Next, the target selection unit 51 of the web page processing program 50 determines whether or not there is text in the link portion 331 (step S2). In this example, there is text in the link portion 331 (step S2; Yes). In this case, the target selection unit 51 acquires text including at least the link portion 331 as link text 332 (step S3). Specifically, as illustrated in FIG. 12, the target selection unit 51 acquires a sentence including the link portion 331 (“Please see here for the operating environment of this product”) as the link text 332.

次に、ウェブブラウザ40は、通常のリンク機能を実行する(ステップS4)。これにより、表示装置70には、リンク先ページ350が表示される。次に、ウェブページ処理プログラム50のターゲット選択部51は、リンク先ページ350の構造解析を行う(ステップS5)。具体的には、ターゲット選択部51は、HTMLタグに基づいて、リンク先ページ350を構成するブロック群B1〜B8を抽出する。また、ターゲット選択部51は、それらブロック群B1〜B8の配置を解析してもよい。次に、ターゲット選択部51は、リンク先ページ350に含まれるブロック群B1〜B8から、処理対象となるブロックをターゲットブロックTBとして抽出する(ステップS10)。   Next, the web browser 40 executes a normal link function (step S4). As a result, the link destination page 350 is displayed on the display device 70. Next, the target selection unit 51 of the web page processing program 50 performs a structural analysis of the linked page 350 (step S5). Specifically, the target selection unit 51 extracts the block groups B1 to B8 constituting the link destination page 350 based on the HTML tag. Moreover, the target selection part 51 may analyze arrangement | positioning of these block groups B1-B8. Next, the target selection unit 51 extracts a block to be processed as a target block TB from the block groups B1 to B8 included in the link destination page 350 (step S10).

図13は、本実施の形態に係るステップS10の内容を更に詳しく示すフローチャートである。まず、ターゲット選択部51は、上記リンクテキスト332の構文解析を実行し、そのリンクテキスト332を構成する要素単語を検索ターゲット200として決定する(ステップS41)。例えば、本例において、リンクテキスト332である「本製品の動作環境についてはこちらをご覧下さい」という文には、「本製品」や「動作環境」といった要素単語が含まれている。この時、ターゲット選択部51は、いずれかの要素単語を検索ターゲット200として設定する。例えば、図12に示されるように、「動作環境」という要素単語が、検索ターゲット200に設定される。このように、ターゲット選択部51は、リンクテキスト332を構成する少なくとも1つの要素単語を抽出し、抽出された要素単語を検索ターゲット200として決定する。   FIG. 13 is a flowchart showing the details of step S10 according to the present embodiment in more detail. First, the target selection unit 51 executes syntax analysis of the link text 332 and determines an element word constituting the link text 332 as the search target 200 (step S41). For example, in the present example, the link text 332 “Please see here for the operating environment of this product” includes element words such as “This product” and “Operating environment”. At this time, the target selection unit 51 sets any element word as the search target 200. For example, as shown in FIG. 12, the element word “operating environment” is set in the search target 200. As described above, the target selection unit 51 extracts at least one element word constituting the link text 332 and determines the extracted element word as the search target 200.

ここで、検索ターゲット200から抽出されるべきではない要素単語が、「禁止単語」として、予め登録されていてもよい。禁止単語としては、助詞、「こちら」、「本製品」などが例示される。ユーザは、これら禁止単語を予め指定しておくことができる。禁止単語を示す禁止単語データ22は、予め記憶装置20に格納されている(図3参照)。この場合、上記ステップS41において、ターゲット選択部51は、記憶装置20に格納された禁止単語データ22を参照し、登録された禁止単語以外の要素単語を、検索ターゲット200として設定する。これにより、検索ターゲット200の検索精度が向上する。   Here, element words that should not be extracted from the search target 200 may be registered in advance as “prohibited words”. Examples of prohibited words include particles, “here”, “this product”, and the like. The user can designate these prohibited words in advance. The prohibited word data 22 indicating the prohibited words is stored in advance in the storage device 20 (see FIG. 3). In this case, in step S <b> 41, the target selection unit 51 refers to the prohibited word data 22 stored in the storage device 20 and sets element words other than the registered prohibited words as the search target 200. Thereby, the search accuracy of the search target 200 is improved.

次に、リンク先ページ350内で、その検索ターゲット200の検索が実行される(ステップS42)。   Next, the search for the search target 200 is executed in the link destination page 350 (step S42).

次に、リンク先ページ350内に検索ターゲット200が存在するかどうか判定される(ステップS43)。本実施の形態においては、ブロックB7に含まれるテキスト(「動作環境」)が、検索ターゲット200に一致している。よって、そのブロックB7がターゲットブロックTBとして選択される(ステップS44)。このように、リンク先ページ350内において検索ターゲット200に該当する部分が検索され、該当部分を含むブロックが抽出される。その後、ステップS100が実行される。   Next, it is determined whether or not the search target 200 exists in the link destination page 350 (step S43). In the present embodiment, the text (“operating environment”) included in the block B 7 matches the search target 200. Therefore, the block B7 is selected as the target block TB (step S44). In this way, a portion corresponding to the search target 200 is searched in the link destination page 350, and a block including the corresponding portion is extracted. Thereafter, step S100 is executed.

リンク先ページ350内に該当部分(該当ブロック)が複数含まれる場合、ユーザが選択処理を行うかどうかが尋ねられる(ステップS45)。ユーザが選択処理を行うかどうかは、予め設定されていてもよい。ユーザが選択処理を行う場合(ステップS45;Yes)、ユーザは入力装置60を用いることによって、複数の該当ブロックから所望のブロックを選択する。ターゲット選択部51は、ユーザにより選択されたブロックをターゲットブロックTBとして抽出する(ステップS46)。ユーザが選択処理を行わない場合(ステップS45;No)、ターゲット選択部51は、所定のルールに従ってターゲットブロックTBを決定する。例えば、複数の該当ブロックのうち、リンク先ページ350の最も上に表示されたブロックが、ターゲットブロックTBとして選択される(ステップS47)。その後、ステップS100が実行される。   If there are a plurality of relevant portions (corresponding blocks) in the linked page 350, the user is asked whether or not to perform a selection process (step S45). Whether the user performs the selection process may be set in advance. When the user performs a selection process (step S45; Yes), the user selects a desired block from a plurality of corresponding blocks by using the input device 60. The target selection unit 51 extracts the block selected by the user as the target block TB (step S46). When the user does not perform the selection process (step S45; No), the target selection unit 51 determines the target block TB according to a predetermined rule. For example, among the plurality of corresponding blocks, the block displayed at the top of the linked page 350 is selected as the target block TB (step S47). Thereafter, step S100 is executed.

また、リンク先ページ350内に該当ブロックが存在しない場合も考えられる。この場合、ユーザは、入力装置60を用いることにより、複数のブロックB1〜B8から1つのブロックをターゲットブロックTBとして指定する(ステップS48)。その後、ステップS100が実行される。   Further, there may be a case where the corresponding block does not exist in the link destination page 350. In this case, the user designates one block from the plurality of blocks B1 to B8 as the target block TB by using the input device 60 (step S48). Thereafter, step S100 is executed.

以上のような処理によって、ターゲットブロックTBが自動的に決定された後、あるいは、ユーザにより指定された後、ステップS100が実行される。このステップS100は、第1の実施の形態と同様である。すなわち、ターゲットブロックTBに含まれる内容がコンピュータにより読み上げられる。これにより、ナビゲーションメニューや広告は読み上げられることはなく、最初からブロックB7の内容が自動的に読み上げられる。よって、煩わしさが解消され、ユーザの負担も軽減される。また、上記ステップS42の結果、複数のブロックに検索ターゲット200が存在する場合、その複数のブロックのそれぞれに含まれる内容が順番に読み上げられてもよい。読み上げられた内容がユーザの望むものではない時、ユーザは、スキップを指示することができる。スキップが指示された場合、次のブロックに含まれる内容の読み上げが開始する。   Step S100 is executed after the target block TB is automatically determined by the processing as described above, or after the user designates it. This step S100 is the same as that of the first embodiment. That is, the contents included in the target block TB are read out by the computer. Thereby, the navigation menu and the advertisement are not read out, and the contents of the block B7 are automatically read out from the beginning. Therefore, bothering is eliminated and the burden on the user is reduced. As a result of step S42, when the search target 200 exists in a plurality of blocks, the contents included in each of the plurality of blocks may be read out in order. When the content read out is not what the user desires, the user can instruct skipping. When skipping is instructed, reading of contents included in the next block starts.

また、抽出されたターゲットブロックTBが、ステップS100において、拡大されて表示装置70に表示されてもよい。この機能は、視覚障害者や高齢者にとって有用である。また、ターゲットブロックTBに対応するデータが、ステップS100において、スクラップブックデータ23として記憶装置20に保存されてもよい。このように、本発明に係るウェブページ処理プログラム50は、ウェブページから一部分を取り出す必要がある操作には全て適用され得る。   Further, the extracted target block TB may be enlarged and displayed on the display device 70 in step S100. This function is useful for visually impaired and elderly people. Further, data corresponding to the target block TB may be stored in the storage device 20 as the scrapbook data 23 in step S100. As described above, the web page processing program 50 according to the present invention can be applied to all operations that require extracting a part from a web page.

本発明によれば、ウェブページから処理に必要な部分だけを自動的に取り出すことが可能となる。特に、本発明によれば、リンク先のウェブページから処理に必要な部分だけを自動的に取り出すことが可能となる。これにより、例えば、コンピュータにウェブページを音声で読み上げさせる際に、ユーザの負担を軽減することが可能となる。   According to the present invention, it is possible to automatically extract only a part necessary for processing from a web page. In particular, according to the present invention, it is possible to automatically extract only a portion necessary for processing from a linked web page. Thereby, for example, when a computer reads out a web page by voice, it is possible to reduce the burden on the user.

(第5の実施の形態)
上記第4の実施の形態において、記憶装置20に格納された履歴データ21が参照されてもよい。その場合の処理は、第3の実施の形態と同様である(図8、図9参照)。これにより、第4の実施の形態と同様の効果が得られ、更に、ターゲットブロックTBの選択にかかる時間が低減されるという追加的な効果が得られる。
(Fifth embodiment)
In the fourth embodiment, the history data 21 stored in the storage device 20 may be referred to. The processing in that case is the same as that in the third embodiment (see FIGS. 8 and 9). As a result, the same effect as in the fourth embodiment can be obtained, and an additional effect that the time required for selecting the target block TB can be reduced.

(第6の実施の形態)
図14は、本発明の第6の実施の形態に係るウェブページ処理方法を示すフローチャートである。本実施の形態において、あるウェブページが表示装置70に表示されているとする。まず、ユーザは、入力装置60を用いることによって、検索対象である検索単語を入力する(ステップS51)。次に、表示されているウェブページ内で、その検索単語の検索が実行される(ステップS52)。
(Sixth embodiment)
FIG. 14 is a flowchart showing a web page processing method according to the sixth embodiment of the present invention. In the present embodiment, it is assumed that a certain web page is displayed on the display device 70. First, the user uses the input device 60 to input a search word that is a search target (step S51). Next, the search word is searched for in the displayed web page (step S52).

次に、ウェブページ内にその検索単語が存在するかどうか判定される(ステップS53)。ウェブページ内に検索単語が1つ含まれる場合、その検索単語を含むブロックがターゲットブロックTBとして選択される(ステップS54)。このように、ウェブページ内において検索単語に該当する部分が検索され、該当部分を含むブロックが抽出される。その後、ステップS100が実行される。   Next, it is determined whether or not the search word exists in the web page (step S53). When one search word is included in the web page, a block including the search word is selected as the target block TB (step S54). In this manner, a portion corresponding to the search word is searched in the web page, and a block including the corresponding portion is extracted. Thereafter, step S100 is executed.

ウェブページ内に該当部分(該当ブロック)が複数含まれる場合、ユーザが選択処理を行うかどうかが尋ねられる(ステップS55)。ユーザが選択処理を行うかどうかは、予め設定されていてもよい。ユーザが選択処理を行う場合(ステップS55;Yes)、ユーザは入力装置60を用いることによって、複数の該当ブロックから所望のブロックを選択する。ターゲット選択部51は、ユーザにより選択されたブロックをターゲットブロックTBとして抽出する(ステップS56)。ユーザが選択処理を行わない場合(ステップS55;No)、ターゲット選択部51は、所定のルールに従ってターゲットブロックTBを決定する。例えば、複数の該当ブロックのうち、ウェブページの最も上に表示されたブロックが、ターゲットブロックTBとして選択される(ステップS57)。その後、ステップS100が実行される。   When a plurality of corresponding portions (corresponding blocks) are included in the web page, the user is asked whether to perform selection processing (step S55). Whether the user performs the selection process may be set in advance. When the user performs a selection process (step S55; Yes), the user selects a desired block from a plurality of corresponding blocks by using the input device 60. The target selection unit 51 extracts the block selected by the user as the target block TB (step S56). When the user does not perform the selection process (step S55; No), the target selection unit 51 determines the target block TB according to a predetermined rule. For example, the block displayed at the top of the web page among the plurality of corresponding blocks is selected as the target block TB (step S57). Thereafter, step S100 is executed.

また、ウェブページ内に該当ブロックが存在しない場合も考えられる。この場合、ユーザは、入力装置60を用いることにより、1つのブロックをターゲットブロックTBとして指定する(ステップS58)。その後、ステップS100が実行される。   Also, there may be a case where the corresponding block does not exist in the web page. In this case, the user designates one block as the target block TB by using the input device 60 (step S58). Thereafter, step S100 is executed.

以上のような処理によって、ターゲットブロックTBが自動的に決定された後、あるいは、ユーザにより指定された後、ステップS100が実行される。このステップS100は、第1の実施の形態と同様である。すなわち、ターゲットブロックTBに含まれる内容がコンピュータにより読み上げられる。また、上記ステップS52の結果、複数のブロックに検索単語が存在する場合、その複数のブロックのそれぞれに含まれる内容が順番に読み上げられてもよい。読み上げられた内容がユーザの望むものではない時、ユーザは、スキップを指示することができる。スキップが指示された場合、次のブロックに含まれる内容の読み上げが開始する。   Step S100 is executed after the target block TB is automatically determined by the processing as described above, or after the user designates it. This step S100 is the same as that of the first embodiment. That is, the contents included in the target block TB are read out by the computer. Further, as a result of step S52, when search words exist in a plurality of blocks, the contents included in each of the plurality of blocks may be read out in order. When the content read out is not what the user desires, the user can instruct skipping. When skipping is instructed, reading of contents included in the next block starts.

また、抽出されたターゲットブロックTBが、ステップS100において、拡大されて表示装置70に表示されてもよい。この機能は、視覚障害者や高齢者にとって有用である。また、ターゲットブロックTBに対応するデータが、ステップS100において、スクラップブックデータ23として記憶装置20に保存されてもよい。このように、本発明に係るウェブページ処理プログラム50は、ウェブページから一部分を取り出す必要がある操作には全て適用され得る。   Further, the extracted target block TB may be enlarged and displayed on the display device 70 in step S100. This function is useful for visually impaired and elderly people. Further, data corresponding to the target block TB may be stored in the storage device 20 as the scrapbook data 23 in step S100. As described above, the web page processing program 50 according to the present invention can be applied to all operations that require extracting a part from a web page.

図1は、あるウェブページの模式図である。FIG. 1 is a schematic diagram of a certain web page. 図2は、リンク先のウェブページの模式図である。FIG. 2 is a schematic diagram of a linked web page. 図3は、本発明に係るウェブページ処理システムの構成を示すブロック図である。FIG. 3 is a block diagram showing the configuration of the web page processing system according to the present invention. 図4は、本発明の第1の実施の形態に係るウェブページ処理方法を示すフローチャートである。FIG. 4 is a flowchart showing a web page processing method according to the first embodiment of the present invention. 図5は、本発明の第1の実施の形態に係る検索ターゲットを説明するための図である。FIG. 5 is a diagram for explaining the search target according to the first embodiment of the present invention. 図6は、本発明の第1の実施の形態に係るウェブページ処理方法を示すフローチャートである。FIG. 6 is a flowchart showing a web page processing method according to the first embodiment of the present invention. 図7は、本発明の第2の実施の形態に係る検索ターゲットを説明するための図である。FIG. 7 is a diagram for explaining a search target according to the second embodiment of the present invention. 図8は、本発明の第3の実施の形態に係るウェブページ処理方法を示すフローチャートである。FIG. 8 is a flowchart showing a web page processing method according to the third embodiment of the present invention. 図9は、本発明に係る履歴データの内容を示す概念図である。FIG. 9 is a conceptual diagram showing the contents of the history data according to the present invention. 図10は、あるウェブページの模式図である。FIG. 10 is a schematic diagram of a certain web page. 図11は、リンク先のウェブページの模式図である。FIG. 11 is a schematic diagram of a linked web page. 図12は、本発明の第4の実施の形態に係る検索ターゲットを説明するための図である。FIG. 12 is a diagram for explaining a search target according to the fourth embodiment of the present invention. 図13は、本発明の第4の実施の形態に係るウェブページ処理方法を示すフローチャートである。FIG. 13 is a flowchart showing a web page processing method according to the fourth embodiment of the present invention. 図14は、本発明の第6の実施の形態に係るウェブページ処理方法を示すフローチャートである。FIG. 14 is a flowchart showing a web page processing method according to the sixth embodiment of the present invention.

符号の説明Explanation of symbols

1 ウェブページ処理システム
10 演算処理装置
20 記憶装置
21 履歴データ
22 禁止単語データ
23 スクラップブックデータ
30 ネットワークインターフェース
40 ウェブブラウザ
50 ウェブページ処理プログラム
51 ターゲット選択部
52 テキスト−音声変換部
60 入力装置
70 表示装置
80 音声出力装置
100 インターネット
110 ブラウザ画面
120 ページ
130 リンク
131 リンク部分
132 リンクテキスト
140 ポインタ
150 リンク先ページ
160 タイトル
170 終了マーク
200 検索ターゲット
310 ブラウザ画面
320 ページ
330 リンク
331 リンク部分
332 リンクテキスト
340 ポインタ
350 リンク先ページ
DESCRIPTION OF SYMBOLS 1 Web page processing system 10 Arithmetic processing device 20 Storage device 21 History data 22 Prohibited word data 23 Scrapbook data 30 Network interface 40 Web browser 50 Web page processing program 51 Target selection part 52 Text-speech conversion part 60 Input device 70 Display apparatus 80 Voice Output Device 100 Internet 110 Browser Screen 120 Page 130 Link 131 Link Part 132 Link Text 140 Pointer 150 Link Destination Page 160 Title 170 End Mark 200 Search Target 310 Browser Screen 320 Page 330 Link 331 Link Part 332 Link Text 340 Pointer 350 Link Destination page

Claims (25)

(A)表示装置に表示されたあるページ上でリンクを示すリンク部分が指定された際、前記リンク部分を含むテキストをリンクテキストとして取得するステップと、
(B)前記リンクテキストのうち少なくとも一部をターゲットとして、前記リンクにより指定されるページであるリンク先ページから検索するステップと、
(C)前記リンク先ページに含まれるブロック群から、前記検索されたターゲットを含むブロックをターゲットブロックとして選択するステップと
をコンピュータに実行させる
ウェブページ処理プログラム。
(A) when a link part indicating a link is specified on a certain page displayed on the display device, a step of acquiring text including the link part as link text;
(B) searching from a linked page that is a page specified by the link, targeting at least a part of the link text;
(C) The web page processing program which makes a computer perform the step which selects the block containing the said searched target as a target block from the block group contained in the said link destination page.
請求項1に記載のウェブページ処理プログラムであって、
更に、
(D)前記ターゲットブロックに含まれる内容を読み上げるステップ
をコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to claim 1,
Furthermore,
(D) A web page processing program for causing a computer to execute a step of reading out the content included in the target block.
請求項1に記載のウェブページ処理プログラムであって、
更に、
(D)前記ターゲットブロックの開始位置より下に表示される内容を読み上げるステップをコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to claim 1,
Furthermore,
(D) A web page processing program that causes a computer to execute a step of reading out the content displayed below the start position of the target block.
請求項1に記載のウェブページ処理プログラムであって、
更に、
(D)前記ターゲットブロックを拡大して前記表示装置に表示させるステップ
をコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to claim 1,
Furthermore,
(D) A web page processing program for causing a computer to execute a step of enlarging the target block and displaying the target block on the display device.
請求項1に記載のウェブページ処理プログラムであって、
更に、
(D)前記ターゲットブロックに対応するデータを記憶装置に保存するステップ
をコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to claim 1,
Furthermore,
(D) A web page processing program that causes a computer to execute a step of storing data corresponding to the target block in a storage device.
請求項1乃至5のいずれかに記載のウェブページ処理プログラムであって、
前記(A)ステップは、前記リンク部分だけを前記リンクテキストとして取得するステップを含む
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 5,
The step (A) includes a step of acquiring only the link portion as the link text.
請求項1乃至5のいずれかに記載のウェブページ処理プログラムであって、
前記(A)ステップは、前記リンク部分を含む一文を前記リンクテキストとして取得するステップを含む
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 5,
The step (A) includes a step of acquiring a sentence including the link portion as the link text.
請求項1乃至7のいずれかに記載のウェブページ処理プログラムであって、
前記(B)ステップは、
(b1)前記リンクテキストの全てを前記ターゲットとして、前記リンク先ページから検索するステップを含む
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 7,
The step (B)
(B1) A web page processing program including a step of searching from the link destination page using all of the link text as the target.
請求項8に記載のウェブページ処理プログラムであって、
前記(B)ステップは、更に、
(b2)前記(b1)ステップにおいて前記ターゲットが発見されなかった場合、前記リンクテキストから、前記リンクテキストを構成する少なくとも1つの単語を抽出するステップと、
(b3)前記抽出された単語を前記ターゲットとして、前記リンク先ページから検索するステップとを含む
ウェブページ処理プログラム。
A web page processing program according to claim 8,
The step (B) further includes:
(B2) If the target is not found in the step (b1), extracting at least one word constituting the link text from the link text;
(B3) A web page processing program including a step of searching from the linked page using the extracted word as the target.
請求項9に記載のウェブページ処理プログラムであって、
(α)ユーザにより指定された単語を禁止単語として、記憶装置に登録するステップを、更にコンピュータに実行させ、
前記(b2)ステップにおいて、前記記憶装置に登録された前記禁止単語を参照することにより、前記禁止単語以外の単語が前記リンクテキストから抽出される
ウェブページ処理プログラム。
A web page processing program according to claim 9, wherein
(Α) causing the computer to further execute a step of registering the word designated by the user as a prohibited word in the storage device;
In the step (b2), a web page processing program in which words other than the prohibited words are extracted from the link text by referring to the prohibited words registered in the storage device.
請求項1乃至7のいずれかに記載のウェブページ処理プログラムであって、
(α)ユーザにより指定された単語を禁止単語として、記憶装置に登録するステップを、更にコンピュータに実行させ、
前記(B)ステップは、
(b1)前記記憶装置に登録された前記禁止単語を参照することにより、前記リンクテキストに含まれる単語のうち、前記禁止単語以外の単語を抽出するステップと、
(b2)前記抽出された単語を前記ターゲットとして、前記リンク先ページから検索するステップとを含む
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 7,
(Α) causing the computer to further execute a step of registering the word designated by the user as a prohibited word in the storage device;
The step (B)
(B1) extracting a word other than the prohibited word from the words included in the link text by referring to the prohibited word registered in the storage device;
(B2) A web page processing program including a step of searching from the linked page using the extracted word as the target.
請求項1乃至11のいずれかに記載のウェブページ処理プログラムであって、
前記ブロック群のうち複数のブロックが前記ターゲットを含む場合、
前記(C)ステップは、前記複数のブロックのうち、前記リンク先ページの最も上に表示されたブロックを、前記ターゲットブロックとして選択するステップを含む
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 11,
When a plurality of blocks in the block group include the target,
The step (C) includes a step of selecting, as the target block, a block displayed at the top of the linked page among the plurality of blocks.
請求項1乃至11のいずれかに記載のウェブページ処理プログラムであって、
前記ブロック群のうち複数のブロックが前記ターゲットを含む場合、
前記(C)ステップは、前記複数のブロックのうち、ユーザによって指定されたブロックを、前記ターゲットブロックとして選択するステップを含む
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 11,
When a plurality of blocks in the block group include the target,
The step (C) includes a step of selecting a block designated by a user from the plurality of blocks as the target block.
請求項1乃至11のいずれかに記載のウェブページ処理プログラムであって、
前記ブロック群のうち複数のブロックが前記ターゲットを含む場合、
前記(C)ステップは、
(c1)前記複数のブロックを順番に前記ターゲットブロックとして選択するステップを含む
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 11,
When a plurality of blocks in the block group include the target,
The step (C) includes:
(C1) A web page processing program including a step of sequentially selecting the plurality of blocks as the target block.
請求項14に記載のウェブページ処理プログラムであって、
前記(C)ステップは、更に、
(c2)前記選択されたターゲットブロックを、ユーザの指定に応じてスキップするステップを含む
ウェブページ処理プログラム。
A web page processing program according to claim 14,
The step (C) further includes:
(C2) A web page processing program including a step of skipping the selected target block in accordance with a user designation.
請求項1乃至15のいずれかに記載のウェブページ処理プログラムであって、
更に、
(E)前記リンク先ページに関連する情報と、前記(C)ステップにおいて選択された前記ターゲットブロックの位置情報とを、対応付けて記憶装置に格納するステップ
をコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to any one of claims 1 to 15,
Furthermore,
(E) A web page processing program that causes a computer to execute a step of associating information related to the link destination page with the position information of the target block selected in step (C) in a storage device.
請求項16に記載のウェブページ処理プログラムであって、
前記リンク先ページに関連する情報は、前記リンク先ページのアドレスである
ウェブページ処理プログラム。
A web page processing program according to claim 16, comprising:
The information related to the linked page is an address of the linked page.
請求項17に記載のウェブページ処理プログラムであって、
更に、
(F)前記アドレスが再び指定された場合、前記リンク先ページに対応付けられた前記位置情報を、前記記憶装置から読み出すステップと、
(G)前記リンク先ページから、前記位置情報により示される位置のブロックを前記ターゲットブロックとして選択するステップと
をコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to claim 17,
Furthermore,
(F) When the address is designated again, reading the position information associated with the linked page from the storage device;
(G) A web page processing program that causes a computer to execute a step of selecting a block at a position indicated by the position information as the target block from the linked page.
請求項17に記載のウェブページ処理プログラムであって、
更に、
(F)前記アドレスと共通部分を有する他のアドレスが指定された場合、前記リンク先ページに対応付けられた前記位置情報を、前記記憶装置から読み出すステップと、
(G)前記他のアドレスにより指定される他のページから、前記位置情報により示される位置のブロックを前記ターゲットブロックとして選択するステップと
をコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to claim 17,
Furthermore,
(F) when another address having a common part with the address is designated, reading the position information associated with the linked page from the storage device;
(G) A web page processing program that causes a computer to execute a step of selecting a block at a position indicated by the position information as the target block from another page specified by the other address.
請求項16に記載のウェブページ処理プログラムであって、
前記リンク先ページに関連する情報は、前記あるページのアドレスである
ウェブページ処理プログラム。
A web page processing program according to claim 16, comprising:
The information related to the linked page is an address of the certain page.
請求項20に記載のウェブページ処理プログラムであって、
更に、
(F)前記あるページに含まれる他のリンクが指定された場合、前記あるページに対応付けられた前記位置情報を、前記記憶装置から読み出すステップと、
(G)前記他のリンクにより指定される他のページから、前記位置情報により示される位置のブロックを前記ターゲットブロックとして選択するステップと
をコンピュータに実行させる
ウェブページ処理プログラム。
A web page processing program according to claim 20,
Furthermore,
(F) when another link included in the certain page is designated, reading the position information associated with the certain page from the storage device;
(G) A web page processing program that causes a computer to execute a step of selecting a block at a position indicated by the position information as the target block from another page specified by the other link.
(AA)表示装置に表示されたページから、ユーザにより指定された単語を検索するステップと、
(BB)前記ページに含まれるブロック群から、前記検索された単語を含むブロックをターゲットブロックとして選択するステップと、
(CC)前記ターゲットブロックに含まれる内容を読み上げるステップと
をコンピュータに実行させる
ウェブページ処理プログラム。
(AA) searching for a word designated by the user from a page displayed on the display device;
(BB) selecting a block including the searched word as a target block from a block group included in the page;
(CC) A web page processing program that causes a computer to read out the content included in the target block.
請求項22に記載のウェブページ処理プログラムであって、
前記ブロック群のうち複数のブロックが前記単語を含む場合、
前記(BB)ステップは、前記複数のブロックのうち、前記ページの最も上に表示されたブロックを、前記ターゲットブロックとして選択するステップを含む
ウェブページ処理プログラム。
A web page processing program according to claim 22,
When a plurality of blocks in the block group include the word,
The (BB) step includes a step of selecting, as the target block, a block displayed at the top of the page among the plurality of blocks.
請求項22に記載のウェブページ処理プログラムであって、
前記ブロック群のうち複数のブロックが前記ターゲットを含む場合、
前記(BB)ステップは、前記複数のブロックのうち、ユーザによって指定されたブロックを、前記ターゲットブロックとして選択するステップを含む
ウェブページ処理プログラム。
A web page processing program according to claim 22,
When a plurality of blocks in the block group include the target,
The (BB) step includes a step of selecting a block designated by a user among the plurality of blocks as the target block.
請求項22に記載のウェブページ処理プログラムであって、
前記ブロック群のうち複数のブロックが前記ターゲットを含む場合、
前記(BB)ステップは、
(bb1)前記複数のブロックを順番に前記ターゲットブロックとして選択するステップと、
(bb2)前記選択されたターゲットブロックを、ユーザの指定に応じてスキップするステップとを含む
ウェブページ処理プログラム。
A web page processing program according to claim 22,
When a plurality of blocks in the block group include the target,
The step (BB) includes
(Bb1) selecting the plurality of blocks as the target blocks in order;
(Bb2) A web page processing program including a step of skipping the selected target block in accordance with a user designation.
JP2005092509A 2005-03-28 2005-03-28 Web page processing program Pending JP2006277090A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005092509A JP2006277090A (en) 2005-03-28 2005-03-28 Web page processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005092509A JP2006277090A (en) 2005-03-28 2005-03-28 Web page processing program

Publications (1)

Publication Number Publication Date
JP2006277090A true JP2006277090A (en) 2006-10-12

Family

ID=37211819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005092509A Pending JP2006277090A (en) 2005-03-28 2005-03-28 Web page processing program

Country Status (1)

Country Link
JP (1) JP2006277090A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269392A (en) * 2007-04-23 2008-11-06 Yahoo Japan Corp Device, method, and program for processing web page information
JP2014160387A (en) * 2013-02-20 2014-09-04 Yahoo Japan Corp Terminal device, audio output method, and audio output program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269392A (en) * 2007-04-23 2008-11-06 Yahoo Japan Corp Device, method, and program for processing web page information
JP2014160387A (en) * 2013-02-20 2014-09-04 Yahoo Japan Corp Terminal device, audio output method, and audio output program

Similar Documents

Publication Publication Date Title
US7296230B2 (en) Linked contents browsing support device, linked contents continuous browsing support device, and method and program therefor, and recording medium therewith
US5899975A (en) Style sheets for speech-based presentation of web pages
US8204950B2 (en) Webpage search
US20080235563A1 (en) Document displaying apparatus, document displaying method, and computer program product
JPH07160727A (en) Electronic manual display method
EP0913779A2 (en) Browser for documents with annotations
JP4768375B2 (en) Jump processing suppression program
JP2008262506A (en) Information extraction system, information extraction method, and information extraction program
KR100491613B1 (en) Device and method for close-up web document having frame and and recording the method
JPWO2006003714A1 (en) Browser program with reading function, browser with reading function, browsing processing method, and browser program recording medium
US20090031224A1 (en) Method, system, and computer program product for visually associating a static graphic image and html text on a web page
JP2006277090A (en) Web page processing program
JP4935396B2 (en) Web content providing apparatus, web content providing method, and program
JP2011216112A (en) Display program
JP2007133763A (en) Device and program for comparing element information
JPH10187112A (en) Information processing device and display control method
JP5338298B2 (en) Page browsing device and program
JP3237619B2 (en) Document display device, document display method, and recording medium recording document display program
JP4584166B2 (en) Web page text automatic detection device
JP2010049598A (en) Web-site creation support device and program
US20050216857A1 (en) Information processing technique to support browsing
JP2002251338A (en) Document display device having bookmark presenting function
JP2003058576A (en) Method and program for controlling display of web page
KR20040101320A (en) Presenting an information item on a media system
JP3537260B2 (en) Linked document search and display system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090416

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091029