JP2006259965A - Information processing apparatus, method, and program - Google Patents

Information processing apparatus, method, and program Download PDF

Info

Publication number
JP2006259965A
JP2006259965A JP2005074429A JP2005074429A JP2006259965A JP 2006259965 A JP2006259965 A JP 2006259965A JP 2005074429 A JP2005074429 A JP 2005074429A JP 2005074429 A JP2005074429 A JP 2005074429A JP 2006259965 A JP2006259965 A JP 2006259965A
Authority
JP
Japan
Prior art keywords
web page
search
character string
url
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005074429A
Other languages
Japanese (ja)
Inventor
Nobuyoshi Miyokawa
信義 三代川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005074429A priority Critical patent/JP2006259965A/en
Publication of JP2006259965A publication Critical patent/JP2006259965A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To detect the destination of a Web page by means of a small amount of data and with little processing burden. <P>SOLUTION: When a user directs a Web page to be registered as a bookmark, the URL of the Web page is registered and its HTML file is analyzed so that an entire character sequence described in a predetermined tag is saved. In the event that the Web page registered as a bookmark cannot be accessed according to the URL registered, a search server 3 searches for the Web page according to the character sequence saved; when the Web page containing the same character string that is saved is found, the Web page is accessed. Applicable to an apparatus having a Web browser. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、情報処理装置および方法、並びにプログラムに関し、特に、データ量の少ないデータを用いて、また、少ない処理負担でWebページの移動先を検出することができるようにする情報処理装置および方法、並びにプログラムに関する。   The present invention relates to an information processing apparatus and method, and a program, and in particular, an information processing apparatus and method that can detect a movement destination of a Web page using data with a small amount of data and with a small processing load. As well as programs.

Webブラウザに用意されるブックマーク機能で登録しておいたWebページが移動してしまった場合(HTML(Hyper Text Markup Language)ファイルの格納場所が変更された場合)、移動先を検出し、ユーザによる操作によらずに移動されたWebページに自動的にアクセスする技術が各種提案されている。   When the web page registered with the bookmark function provided in the web browser has moved (when the storage location of the HTML (Hyper Text Markup Language) file has been changed), the destination is detected and the user Various techniques have been proposed for automatically accessing a moved web page regardless of operation.

例えば、特許文献1には、ユーザによりアクセスが指示されたWebページが移動していた場合、あらかじめ保存しておいた、そのWebページのHTMLファイルからキーワードを抽出し、抽出したキーワードを検索エンジンにかけることによって、移動先を探し出す技術が開示されている。
特開2000−207418号公報
For example, in Japanese Patent Application Laid-Open No. H10-228707, when a Web page that is instructed to be accessed by a user has moved, a keyword is extracted from an HTML file of the Web page stored in advance and the extracted keyword is used as a search engine. A technique for finding a destination by making a call is disclosed.
JP 2000-207418 A

しかしながら、特許文献1に開示されている技術には以下の点で問題がある。   However, the technique disclosed in Patent Document 1 has problems in the following points.

第1の問題は、HTMLファイルの格納場所のリソースに関する問題である。すなわち、特許文献1の明細書の番号[0011]段落には、「ホームページA401のHTMLファイルをダウンロードし、外部記憶装置106に格納HTMLファイル(ファイル名はA.htmlとする)として格納」することが記載されており、この発明によれば、追跡対象とするWebページ全体のデータ(HTMLファイル)を保存しておく必要がある。   The first problem is related to the resource of the HTML file storage location. That is, in the number [0011] paragraph of the specification of Patent Document 1, “HTML file of home page A401 is downloaded and stored as an HTML file (file name is A.html) stored in external storage device 106”. According to the present invention, it is necessary to save data (HTML file) of the entire Web page to be tracked.

多くのWebページを登録した場合、これは、記憶容量の圧迫につながるから、例えば、携帯電話機のような記憶容量が比較的少ない装置においては、保存しておいたHTMLファイルを用いて移動先を検出するといった、このような検出手法を実現することが困難な場合がある。   When many web pages are registered, this leads to compression of the storage capacity. For example, in a device with a relatively small storage capacity such as a mobile phone, the destination can be set using a saved HTML file. There are cases where it is difficult to realize such a detection technique such as detection.

第2の問題は、キーワードの抽出に名詞辞書を利用している点である。特許文献1の明細書の番号[0015]段落には、「格納ページキーワード抽出機能1001は、格納HTMLファイルのタイトル部分、テキスト部分から、名詞辞書207を参照しながらページを特徴付けるキーワードを割り出す」ことが記載されており、キーワードの抽出を実現するためには、名詞辞書を装置が有していること、また、名詞辞書の参照処理を行うことが必要になる。   The second problem is that a noun dictionary is used for keyword extraction. In the number [0015] paragraph of the specification of Patent Document 1, “the stored page keyword extraction function 1001 calculates a keyword that characterizes a page from the title part and text part of the stored HTML file while referring to the noun dictionary 207”. In order to realize keyword extraction, it is necessary for the device to have a noun dictionary and to perform reference processing of the noun dictionary.

つまり、この処理の実現には、装置によっては比較的大きなデータになる名詞辞書を搭載することと、HTMLファイル内の文字列を、辞書に登録されているキーワードとマッチングさせるというCPU(Central Processing Unit)に負荷がかかる処理が必要になり、記憶媒体の容量などの点から名詞辞書を搭載しておくことができない装置や、マッチング処理を実行するのに十分な処理能力を有するCPUを搭載していない装置では実現が困難な場合がある。   In other words, this processing is implemented by installing a noun dictionary that becomes relatively large data depending on the device, and matching the character string in the HTML file with the keyword registered in the dictionary (CPU (Central Processing Unit) ), A device that cannot be equipped with a noun dictionary in terms of storage media capacity, etc., and a CPU that has sufficient processing power to perform matching processing. It may be difficult to implement with no device.

本発明はこのような状況に鑑みてなされたものであり、データ量の少ないデータを用いて、また、少ない処理負担でWebページの移動先を検出することができるようにするものである。   The present invention has been made in view of such a situation, and makes it possible to detect a destination of a Web page by using data with a small amount of data and with a small processing load.

本発明の情報処理装置は、WebページのURLを登録するとき、Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御手段と、登録しておいたURLに基づいてWebページにアクセスすることができなくなった場合、記憶制御手段により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバにWebページの検索を行わせ、検索サーバによる検索結果にWebページが挙がってこなかったとき、検索サーバに、記憶制御手段により記憶された複数の文字列のうちの一部の文字列に基づいて、Webページの検索を再度行わせる検索手段とを備えることを特徴とする。   The information processing apparatus of the present invention, when registering the URL of the Web page, storage control means for storing the entire character string described in a plurality of predetermined tags included in the HTML file for displaying the Web page; When the web page cannot be accessed based on the registered URL, the web page is searched for the search server connected via the network based on the character string stored by the storage control means. When the web page is not listed in the search results by the search server, the search server searches the web page based on a part of the plurality of character strings stored by the storage control means. And a search means for performing again.

ここで、文字列には、例えば、複数の文字からなる列の他、複数の数字からなる列、複数の記号からなる列、あるいは、複数の文字、数字、記号を組み合わせてなる列が含まれる。   Here, the character string includes, for example, a column composed of a plurality of characters, a column composed of a plurality of numbers, a column composed of a plurality of symbols, or a column composed of a combination of a plurality of characters, numbers, and symbols. .

記憶制御手段は、さらに、URLを登録したWebページへのアクセスが行われたとき、記憶しておいた文字列を、新たにアクセスしたWebページのHTMLファイルに基づいて更新するようにすることができる。   The storage control means may further update the stored character string based on the HTML file of the newly accessed web page when the web page registered with the URL is accessed. it can.

本発明の情報処理方法、およびプログラムは、WebページのURLを登録するとき、Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御ステップと、登録しておいたURLに基づいてWebページにアクセスすることができなくなった場合、記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバにWebページの検索を行わせ、検索サーバによる検索結果にWebページが挙がってこなかったとき、検索サーバに、記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、Webページの検索を再度行わせる検索ステップとを含むことを特徴とする。   The information processing method and program of the present invention store a whole character string described in a plurality of predetermined tags included in an HTML file for displaying a Web page when registering the URL of the Web page. When it becomes impossible to access the web page based on the control step and the registered URL, the search server connected via the network is based on the character string stored by the process of the storage control step. When a web page is searched, and the web page is not listed in the search results by the search server, the search server is based on some of the character strings stored in the storage control step. And a search step for searching the Web page again.

本発明の情報処理装置および方法、並びにプログラムにおいては、WebページのURLを登録するとき、Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体が記憶され、登録しておいたURLに基づいてWebページにアクセスすることができなくなった場合、記憶された文字列に基づいて、ネットワークを介して接続される検索サーバにWebページの検索を行わせることが行われる。また、検索サーバによる検索結果にWebページが挙がってこなかったとき、検索サーバに、複数の文字列のうちの一部の文字列に基づいて、Webページの検索を再度行わせることが行われる。   In the information processing apparatus, method, and program of the present invention, when registering the URL of a Web page, the entire character string described in a plurality of predetermined tags included in the HTML file for displaying the Web page is When it becomes impossible to access a web page based on the stored and registered URL, the search server connected via the network searches the web page based on the stored character string. Is done. In addition, when a web page is not listed in the search result by the search server, the search server is caused to search the web page again based on a part of the plurality of character strings.

本発明によれば、データ量の少ないデータを用いてWebページの移動先を検出することができる。   According to the present invention, it is possible to detect a destination of a Web page using data with a small amount of data.

また、本発明によれば、少ない処理負担でWebページの移動先を検出することができる。   Further, according to the present invention, it is possible to detect the destination of a Web page with a small processing load.

以下に本発明の実施の形態を説明するが、本明細書に記載の発明と、発明の実施の形態との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする実施の形態が本明細書に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、発明に対応するものとして、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その発明に対応するものではないことを意味するものではない。逆に、実施の形態が発明に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その発明以外の発明には対応しないものであることを意味するものでもない。   Embodiments of the present invention will be described below. The correspondence relationship between the invention described in this specification and the embodiments of the invention is exemplified as follows. This description is intended to assure that embodiments supporting the claimed invention are described in this specification. Therefore, although there is an embodiment which is described in the embodiment of the invention but is not described here as corresponding to the invention, it means that the embodiment is not It does not mean that it does not correspond to the invention. Conversely, even if an embodiment is described herein as corresponding to an invention, that means that the embodiment does not correspond to an invention other than the invention. Absent.

さらに、この記載は、本明細書に記載されている発明の全てを意味するものではない。換言すれば、この記載は、本明細書に記載されている発明であって、この出願では請求されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加される発明の存在を否定するものではない。   Further, this description does not mean all the inventions described in this specification. In other words, this description is for the invention described in the present specification and not claimed in this application, i.e., the existence of an invention that will be filed in the future or added by amendment. There is no denial.

請求項1に記載の情報処理装置は、WebページのURLを登録するとき、前記Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御手段(例えば、図4のブックマーク管理部31)と、登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御手段により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御手段により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索手段(例えば、図4の検索部35)とを備えることを特徴とする。   The information processing apparatus according to claim 1, when registering a URL of a Web page, stores the entire character string described in a plurality of predetermined tags included in an HTML file for displaying the Web page When it becomes impossible to access the Web page based on the storage control means (for example, the bookmark management unit 31 in FIG. 4) and the registered URL, it is based on the character string stored by the storage control means. When the search server connected via the network searches the Web page, and the Web page is not listed in the search result by the search server, the storage control means stores the search result in the search server. Search means (for example, the search unit 35 in FIG. 4) that makes the Web page search again based on a part of the plurality of character strings. And

請求項3に記載の情報処理方法は、WebページのURLを登録するとき、前記Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御ステップ(例えば、図5のステップS3)と、登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索ステップ(例えば、図6のステップS14)とを含むことを特徴とする。   The information processing method according to claim 3, when registering a URL of a Web page, stores the entire character string described in a plurality of predetermined tags included in an HTML file for displaying the Web page. When it becomes impossible to access the Web page based on the storage control step (for example, step S3 in FIG. 5) and the registered URL, it is based on the character string stored by the processing of the storage control step. The search server connected via the network performs the search of the Web page, and when the Web page is not listed in the search result by the search server, the search server is processed by the process of the storage control step. A search step (for example, step S14 in FIG. 6) for searching the web page again based on some of the stored character strings. ).

請求項4に記載のプログラムにおいても、各ステップが対応する実施の形態(但し一例)は、請求項3に記載の情報処理方法と同様である。   Also in the program according to the fourth aspect, the embodiment (however, an example) to which each step corresponds is the same as the information processing method according to the third aspect.

以下、本発明の実施の形態について図を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の一実施形態に係る通信システムの構成例を示す図である。   FIG. 1 is a diagram illustrating a configuration example of a communication system according to an embodiment of the present invention.

この通信システムは、例えば、情報処理装置1、Webページ管理サーバ2−1,2−2、および検索サーバ3がネットワーク4を介して接続されることによって構成される。   This communication system is configured, for example, by connecting the information processing apparatus 1, the Web page management servers 2-1 and 2-2, and the search server 3 via the network 4.

情報処理装置1にはWebブラウザ1Aが搭載されており、情報処理装置1のユーザは、Webブラウザ1Aを起動させることによって、Webページ管理サーバ2−1や2−2により管理されているWebページを、情報処理装置1のディスプレイ上で閲覧することができる。   The information processing apparatus 1 is equipped with a web browser 1A, and the user of the information processing apparatus 1 activates the web browser 1A to thereby manage the web page managed by the web page management server 2-1 or 2-2. Can be browsed on the display of the information processing apparatus 1.

Webブラウザ1Aは、ユーザにより指示されたWebページを登録する(WebページのURL、タイトル等を登録する)ブックマーク機能を有する。従って、ユーザは、気に入ったWebページを登録しておき、登録しておいたWebページの中から選択することによって、お気に入りのWebページを後から容易に閲覧することができる。   The web browser 1A has a bookmark function for registering a web page instructed by the user (registering the URL, title, etc. of the web page). Therefore, the user can easily browse a favorite Web page later by registering a favorite Web page and selecting from the registered Web pages.

Webブラウザ1Aは、あるWebページを表示している状態で、ユーザにより、表示しているWebページを登録することが指示された場合、URLを登録するとともに、いま表示しているWebページのHTMLファイルを解析し、HTMLファイルに含まれるタグのうち、所定のタグの中に記述されている文字列全体を抽出して保存する。文字列には、例えば、複数の文字からなる列の他、複数の数字からなる列、複数の記号からなる列、あるいは、複数の文字、数字、記号を組み合わせてなる列が含まれる。   When the web browser 1A is displaying a certain web page and the user instructs to register the displayed web page, the web browser 1A registers the URL and HTML of the currently displayed web page. The file is analyzed, and the entire character string described in a predetermined tag among the tags included in the HTML file is extracted and stored. The character string includes, for example, a column composed of a plurality of characters, a column composed of a plurality of numbers, a column composed of a plurality of symbols, or a column composed of a combination of a plurality of characters, numbers, and symbols.

例えば、Webページのタイトルが記述されるタイトルタグ(<TITLE>〜</TITLE>)、見出しの表示などに利用されるHタグ(H1,H2,H3タグ(<H○>〜</H○>))、および、テキストの位置を指定するPタグ(<P>〜</P>)などの、Webページの特徴を表す文字列の表示に用いられるようなタグの中の文字列が保存される。   For example, a title tag (<TITLE> to </ TITLE>) describing the title of a Web page, an H tag (H1, H2, H3 tag (<H ○> to </ H ○>) used for displaying a headline, etc. >)), And P tags (<P> to </ P>) that specify the position of the text, etc., and the character strings in tags that are used to display character strings that represent Web page features are saved. Is done.

図2は、HTMLファイルの例を示す図である。図2に示す記述のうち、図の左端に示す数字、アルファベットと「:(コロン)」は説明の便宜上付しているものであり、実際にHTMLファイルに記述されるものではない。   FIG. 2 is a diagram illustrating an example of an HTML file. In the description shown in FIG. 2, the numbers, alphabets, and “: (colon)” shown at the left end of the figure are attached for convenience of explanation, and are not actually described in the HTML file.

図2の例においては、第1行目に「<title>AAA製品情報</title>」が記述され、第n1行目に「<H1 ALINGN=罵eft #62;16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売</H1>」が記述されている。また、第n2行目に「<H2 ALINGN=罵eft #62;リアルで美しい 高画質な映像を創造するとともに映像を操作して楽しむ 新しい視聴スタイルを提案する“ボックス” 発売</H2>」が記述されている。 In the example of FIG. 2, “<title> AAA product information </ title>” is described in the first line, and “<H1 ALINGN = 罵 eft # 62; 16: 9 wide video” is described in the n1st line. "2.7-inch wide LCD monitor" that can be displayed as it is, 4 DV and DVD video cameras are released </ H1>. Also, on line n 2 “<H2 ALINGN = 罵 eft # 62;“ Box ”released </ H2> to propose a new viewing style that creates real and beautiful high-quality images and enjoys them by manipulating the images” ” Is described.

この場合、タイトルタグの中に記述される全ての文字列である「AAA製品情報」、H1タグの中に記述される全ての文字列である「16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売」、および、H2タグの中に記述される全ての文字列である「リアルで美しい 高画質な映像を創造するとともに映像を操作して楽しむ 新しい視聴スタイルを提案する“ボックス” 発売」が抽出され、保存される。すなわち、第1行目から第n1行目の間に置かれているタグの中の文字列、第n2行目以降に置かれているタグの中の文字列は保存されない。 In this case, “AAA product information” that is all character strings described in the title tag and “16: 9 wide video that is all character strings described in the H1 tag can be displayed as they are [2.7]. Wide-screen LCD ”equipped with 4 DV and DVD video cameras” and all character strings described in the H2 tag “Real and beautiful high-quality video creation and video manipulation” Enjoy “box release” that suggests a new viewing style is extracted and saved. That is, the character string in the tag placed between the first line and the n 1st line and the character string in the tag placed on the n 2nd line and thereafter are not saved.

なお、文字列の抽出対象となるタグの種類や数は、情報処理装置1のリソース制約などに基づいて適宜制限されるようにすることも可能である。   Note that the type and number of tags from which character strings are to be extracted may be appropriately limited based on resource constraints of the information processing apparatus 1.

図1の説明に戻り、Webブラウザ1Aは、このようにして保存した文字列を、登録しておいたURLに基づいてユーザのお気に入りのWebページにアクセスすることができなくなったときに用いる。例えば、Webページ管理サーバ2−1により管理されていたあるWebページが、Webページ管理サーバ2−2により管理されるものになったとき、すなわち、Webページが移動したときなどに、Webブラウザ1Aは、登録しておいたURLに基づいてお気に入りのWebページにアクセスすることができなくなる。   Returning to the description of FIG. 1, the Web browser 1 </ b> A uses the character string stored in this way when it becomes impossible to access the user's favorite Web page based on the registered URL. For example, when a certain web page managed by the web page management server 2-1 is managed by the web page management server 2-2, that is, when the web page is moved, the web browser 1A Will not be able to access your favorite web page based on the registered URL.

登録しておいたURLに基づいてアクセスを実行した結果、例えば、「お探しのWebページは存在しません」などのメッセージが返されたことから、ユーザのお気に入りのWebページにアクセスすることができなくなった場合(HTTP(Hyper Text Transfer Protocol)のリターンコードとして、404(Not Found)や302(Moved Temporarily)が返ってきた場合)、Webブラウザ1Aは、保存しておいた文字列の全てを、ネットワーク4を介して検索サーバ3に送信し、送信した文字列に基づいてWebページの検索(AND検索)を行わせる。後述するように、検索サーバ3は、他の装置から送信されてきた文字、数字、記号に基づいて、同じ文字、数字、記号を表示するWebページの検索エンジンを有するサーバである。   As a result of access based on the registered URL, for example, a message such as "The web page you are looking for does not exist" is returned, so you can access your favorite web page. When it disappears (when 404 (Not Found) or 302 (Moved Temporarily) is returned as the return code of HTTP (Hyper Text Transfer Protocol)), the Web browser 1A, The search is sent to the search server 3 via the network 4, and a search (AND search) of the Web page is performed based on the transmitted character string. As will be described later, the search server 3 is a server having a search engine for Web pages that display the same characters, numbers, and symbols based on characters, numbers, and symbols transmitted from other devices.

図2の例の場合、「AAA製品情報」、「16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売」、および、「リアルで美しい 高画質な映像を創造するとともに映像を操作して楽しむ 新しい視聴スタイルを提案する“ボックス” 発売」の3つの文字列が検索サーバ3に送信され、Webページの検索が行われる。   In the case of the example in Fig. 2, "AAA product information", "Release of 4 types of DV and DVD video cameras equipped with" 2.7-inch wide LCD monitor "that can display 16: 9 wide video as it is", and "Real Create a beautiful high-quality video and enjoy it by manipulating the video “Box” release, which proposes a new viewing style, is sent to the search server 3 to search the Web page.

検索サーバ3による検索により、送信した文字列と同じ文字列を表示するWebページが検出された場合、Webブラウザ1Aは、そのWebページを、ユーザがお気に入りのものとして登録しておいたWebページと同じWebページであるとし、ディスプレイに表示させる。   When the search by the search server 3 detects a Web page that displays the same character string as the transmitted character string, the Web browser 1A determines that the Web page is a Web page that the user has registered as a favorite one. Assume that they are the same web page, and display them on the display.

これにより、Webページが移動した場合であっても、Webブラウザ1Aは、ユーザのお気に入りのWebページを表示することができる。   Thereby, even if the web page is moved, the web browser 1A can display the user's favorite web page.

また、移動先を検出するために保存しておくデータは、タイトルタグ、Hタグなどのように、HTMLファイルに含まれる所定のタグの中に記述される文字列だけであるから、移動先を検出するためのデータとしてHTMLファイル全体を保存しておく場合に較べて、情報処理装置1の記憶媒体の容量を圧迫することを防止することができる。   Since the data stored for detecting the destination is only a character string described in a predetermined tag included in the HTML file, such as a title tag and an H tag, the destination is Compared to storing the entire HTML file as data for detection, it is possible to prevent the storage medium capacity of the information processing apparatus 1 from being compressed.

さらに、文字列の抽出はユーザによる操作によらずに自動的に行われるため、ユーザが明示的に文字列を登録する必要がない。   Furthermore, since the extraction of the character string is automatically performed regardless of the operation by the user, it is not necessary for the user to explicitly register the character string.

また、移動先を検出するためのデータとして、所定のタグの中に記述される文字列全体が用いられるから、HTMLファイルに記述される文字列の中から所定のキーワードを辞書を参照しながら抽出し、抽出したキーワードを用いて移動先を検出する場合に較べて、情報処理装置1の処理負担を軽減することができる。すなわち、情報処理装置1は、辞書を参照する必要がなく、従って、辞書を有しておく必要もない。   Since the entire character string described in the predetermined tag is used as data for detecting the destination, the predetermined keyword is extracted from the character string described in the HTML file with reference to the dictionary. In addition, the processing load on the information processing apparatus 1 can be reduced as compared with the case where the destination is detected using the extracted keyword. That is, the information processing apparatus 1 does not need to refer to a dictionary, and therefore does not need to have a dictionary.

記憶容量の圧迫を防止することや処理負担を軽減することは、情報処理装置1が、家庭内などに固定的に置かれる情報機器などと較べて、一般的に、記憶容量が少なかったり、処理能力が劣ったりする携帯機器である場合に特に有用なものになる。   In order to prevent the storage capacity from being compressed and to reduce the processing load, the information processing apparatus 1 generally has a small storage capacity or processing compared to information equipment that is fixedly installed in the home or the like. This is particularly useful when the mobile device has poor capability.

一方、検索サーバ3による検索の結果、送信した文字列と同じ文字列を表示するWebページ(Webページの移動先)が検出されなかった場合、Webブラウザ1Aは、検索に用いる文字列の数を減らし、再度、Webページの検索を検索サーバ3に行わせる。   On the other hand, as a result of the search by the search server 3, when a Web page (Web page destination) that displays the same character string as the transmitted character string is not detected, the Web browser 1 </ b> A determines the number of character strings used for the search. Decrease, and let the search server 3 search the Web page again.

上述したように、3つの文字列を用いて行われた検索サーバ3の検索結果に、ユーザのお気に入りのWebページが挙がってこなかった場合、Webブラウザ1Aは、例えば、文字列の数を1つ減らし、「AAA製品情報」と、「16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売」の2つの文字列だけに基づいて、再度、Webページの検索を検索サーバ3に行わせる。   As described above, when the user's favorite Web page is not listed in the search result of the search server 3 performed using three character strings, the Web browser 1A, for example, sets the number of character strings to one. Based on only two character strings, "AAA product information" and "DV / DVD system video camera 4 models released with" 2.7-inch wide LCD monitor "that can display 16: 9 wide video as it is" The search server 3 is made to search the Web page again.

再度行われた検索の結果に、ユーザのお気に入りのWebページが挙がってきた場合、Webブラウザ1Aは、そのWebページを表示し、一方、ユーザのお気に入りのWebページが挙がってこなかった場合、文字列の数を減らして、検索サーバ3による検索を繰り返す。   If the user's favorite web page is listed as a result of the search performed again, the web browser 1A displays the web page. On the other hand, if the user's favorite web page is not listed, a character string is displayed. And the search by the search server 3 is repeated.

これにより、Webページが移動しただけでなく、Webページの内容に変更が加えられた場合であっても、Webブラウザ1Aは、移動したユーザのお気に入りのWebページを表示することができる。   Thereby, not only the web page is moved, but also when the content of the web page is changed, the web browser 1A can display the favorite web page of the moved user.

以上のような情報処理装置1の動作についてはフローチャートを参照して後述する。   The operation of the information processing apparatus 1 as described above will be described later with reference to a flowchart.

図1のWebページ管理サーバ2−1および2−2は、HTMLファイルを格納し、ネットワーク4を介して行われる情報処理装置1からのアクセスに応じて、HTMLファイルを提供する。   Web page management servers 2-1 and 2-2 in FIG. 1 store an HTML file and provide the HTML file in response to access from the information processing apparatus 1 performed via the network 4.

検索サーバ3は検索エンジンを有しており、情報処理装置1から送信されてきた全ての文字列を表示するWebページを検索し、その検索結果を情報処理装置1に提供する。   The search server 3 has a search engine, searches for a Web page that displays all the character strings transmitted from the information processing apparatus 1, and provides the search result to the information processing apparatus 1.

図3は、情報処理装置1のハードウェア構成例を示すブロック図である。   FIG. 3 is a block diagram illustrating a hardware configuration example of the information processing apparatus 1.

CPU11は、ROM(Read Only Memory)12に記憶されているプログラム、または、記憶部18からRAM(Random Access Memory)13にロードされたプログラムに従って各種の処理を実行する。RAM13にはまた、CPU11が各種の処理を実行する上において必要なデータなどが適宜記憶される。   The CPU 11 executes various processes according to a program stored in a ROM (Read Only Memory) 12 or a program loaded from a storage unit 18 to a RAM (Random Access Memory) 13. The RAM 13 also appropriately stores data necessary for the CPU 11 to execute various processes.

CPU11、ROM12、およびRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インタフェース15も接続されている。   The CPU 11, ROM 12, and RAM 13 are connected to each other via a bus 14. An input / output interface 15 is also connected to the bus 14.

入出力インタフェース15には、キーボード、マウスなどよりなる入力部16、LCD(Liquid Crystal Display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部17、ハードディスクなどより構成される記憶部18、ネットワーク4を介しての通信処理を行う通信部19が接続されている。   The input / output interface 15 includes an input unit 16 including a keyboard and a mouse, a display including an LCD (Liquid Crystal Display), an output unit 17 including a speaker, a storage unit 18 including a hard disk, and a network 4. A communication unit 19 is connected to perform communication processing.

入出力インタフェース15にはまた、必要に応じてドライブ20が接続される。ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどよりなるリムーバブルメディア21が適宜装着され、それから読み出されたコンピュータプログラムが必要に応じて記憶部18にインストールされる。   A drive 20 is also connected to the input / output interface 15 as necessary. A removable medium 21 composed of a magnetic disk, an optical disk, a magneto-optical disk, a semiconductor memory, or the like is appropriately installed in the drive 20, and a computer program read therefrom is installed in the storage unit 18 as necessary.

図4は、情報処理装置1の機能構成例を示すブロック図である。図4に示す機能部は、図3のCPU11によりWebブラウザ1Aが実行されることによって実現される。   FIG. 4 is a block diagram illustrating a functional configuration example of the information processing apparatus 1. 4 is realized by the Web browser 1A being executed by the CPU 11 of FIG.

ブックマーク管理部31は、表示しているWebページをブックマークに登録することがユーザから指示された場合、WebページのHTMLファイルを表示制御部34から取得し、そのWebページのURLをURLデータベース32に記憶させる。また、このとき、ブックマーク管理部31は、表示制御部34から取得したHTMLファイルを解析することによって、所定のタグの中に記述されている文字列を抽出し、抽出した文字列を文字列データベース33に記憶させる。   When the user instructs the bookmark management unit 31 to register the displayed web page in the bookmark, the bookmark management unit 31 acquires the HTML file of the web page from the display control unit 34 and stores the URL of the web page in the URL database 32. Remember me. At this time, the bookmark management unit 31 extracts the character string described in a predetermined tag by analyzing the HTML file acquired from the display control unit 34, and the extracted character string is stored in the character string database. 33.

URLデータベース32は、ブックマーク管理部31から供給されてきたURLを保存する。URLデータベース32により保存されたURLは、適宜、表示制御部34により読み出される。   The URL database 32 stores the URL supplied from the bookmark management unit 31. The URL stored by the URL database 32 is read by the display control unit 34 as appropriate.

文字列データベース33は、ブックマーク管理部31から供給されてきた文字列を、その文字列を表示するWebページのURLと紐付けて保存する。文字列データベース33により保存された文字列は、適宜、検索部35により読み出される。   The character string database 33 stores the character string supplied from the bookmark management unit 31 in association with the URL of the Web page that displays the character string. The character string stored in the character string database 33 is read by the search unit 35 as appropriate.

表示制御部34は、ユーザによる指示に応じて所定のサーバにアクセスし、Webページをディスプレイ(出力部17)に表示させる。例えば、ユーザから、表示しているWebページを登録することが指示された場合、表示制御部34は、表示しているWebページのHTMLファイルをブックマーク管理部31に出力する。   The display control unit 34 accesses a predetermined server in accordance with an instruction from the user, and displays a Web page on the display (output unit 17). For example, when the user instructs to register the displayed web page, the display control unit 34 outputs the HTML file of the displayed web page to the bookmark management unit 31.

また、表示制御部34は、ブックマークに登録されたWebページにアクセスすることがユーザから指示された場合、そのWebページのURLをURLデータベース32から読み出し、読み出したURLに基づいて、ユーザのお気に入りのWebページを表示させる。表示制御部34は、URLデータベース32から読み出したURLに基づいて、ユーザのお気に入りのWebページにアクセスすることができなかった場合、そのことを検索部35に通知する。表示制御部34から検索部35に対する通知には、アクセスすることができなかったWebページのURLが含まれる。   In addition, when the user gives an instruction to access the Web page registered in the bookmark, the display control unit 34 reads the URL of the Web page from the URL database 32 and, based on the read URL, the user's favorite URL. Display a web page. Based on the URL read from the URL database 32, the display control unit 34 notifies the search unit 35 of the fact that the user's favorite Web page could not be accessed. The notification from the display control unit 34 to the search unit 35 includes the URL of the Web page that could not be accessed.

検索部35は、ユーザのお気に入りのWebページに、URLデータベース32から読み出したURLに基づいてアクセスすることができなかったことが表示制御部34から通知されてきた場合、その通知に含まれるURLと紐付けられている文字列を文字列データベース33から読み出し、読み出した文字列を検索サーバ3に送信してWebページの検索を行わせる。   When the display control unit 34 notifies the search unit 35 that the user's favorite web page could not be accessed based on the URL read from the URL database 32, the search unit 35 includes the URL included in the notification. The associated character string is read from the character string database 33, and the read character string is transmitted to the search server 3 to search the web page.

例えば、検索サーバ3による検索結果に、送信した文字列と同じ文字列を表示するWebページが挙がってきた場合、検索部35は、そのWebページのURLを表示制御部34に通知し、アクセスを行わせる。また、検索部35は、検索サーバ3による検索結果に、送信した文字列と同じ文字列を表示するWebページが挙がってこなかった場合、上述したようにして文字列の数を減らし、検索サーバ3にWebページの検索を繰り返し行わせる。   For example, when a Web page that displays the same character string as the transmitted character string is listed in the search result by the search server 3, the search unit 35 notifies the display control unit 34 of the URL of the Web page, and accesses it. Let it be done. Further, when the search result by the search server 3 does not include a Web page that displays the same character string as the transmitted character string, the search unit 35 reduces the number of character strings as described above, and the search server 3 Make web page search repeated.

次に、以上のような構成を有する情報処理装置1の動作について説明する。   Next, the operation of the information processing apparatus 1 having the above configuration will be described.

はじめに、図5のフローチャートを参照して、情報処理装置1(Webブラウザ1A)の登録処理について説明する。   First, the registration processing of the information processing apparatus 1 (Web browser 1A) will be described with reference to the flowchart of FIG.

Webページを登録することがユーザにより指示されたとき、ステップS1において、ブックマーク管理部31は、ユーザが閲覧しているWebページのHTMLファイルを表示制御部34から取得し、そのWebページのURLをURLデータベース32に記憶(登録)させる。   When the user instructs to register the web page, in step S1, the bookmark management unit 31 acquires the HTML file of the web page being browsed by the user from the display control unit 34, and sets the URL of the web page. Store (register) in the URL database 32.

ステップS2において、ブックマーク管理部31は、表示制御部34から取得したHTMLファイルのタグを解析し、所定のタグの中に記述されている文字列を抽出する。   In step S <b> 2, the bookmark management unit 31 analyzes the tag of the HTML file acquired from the display control unit 34 and extracts a character string described in a predetermined tag.

ステップS3において、ブックマーク管理部31は、ステップS2で抽出した文字列を、URLと紐付けて文字列データベース33に記憶させ、処理を終了させる。   In step S3, the bookmark management unit 31 stores the character string extracted in step S2 in the character string database 33 in association with the URL, and ends the process.

次に、図6のフローチャートを参照して、情報処理装置1の検索処理について説明する。   Next, the search process of the information processing apparatus 1 will be described with reference to the flowchart of FIG.

例えば、ブックマークに登録したものの中から所定のWebページが選択され、アクセスすることが指示された場合、ステップS11において、表示制御部34は、そのWebページのURLをURLデータベース32から読み出し、読み出したURLに基づいてアクセスを行う。   For example, when a predetermined web page is selected from those registered in the bookmark and an access is instructed, the display control unit 34 reads the URL of the web page from the URL database 32 and reads the URL in step S11. Access based on URL.

ステップS12において、表示制御部34は、アクセスが成功したか否かを判定し、アクセスが成功したと判定した場合、ステップS13に進み、ユーザが登録しておいたWebページを表示させる。その後、処理は終了される。   In step S12, the display control unit 34 determines whether or not the access is successful. If it is determined that the access is successful, the display control unit 34 proceeds to step S13 and displays the Web page registered by the user. Thereafter, the process is terminated.

一方、表示制御部34は、ステップS12において、例えば、Webページが移動し、Webページを表示することができないことを通知するメッセージが返されてきたことから、アクセスが成功していないと判定した場合、URLデータベース32から読み出したURLを検索部35に出力し、ステップS14に進む。   On the other hand, in step S12, for example, the display control unit 34 determines that the access is not successful because, for example, the Web page has moved and a message notifying that the Web page cannot be displayed is returned. In this case, the URL read from the URL database 32 is output to the search unit 35, and the process proceeds to step S14.

ステップS14において、検索部35は、表示制御部34から供給されてきたURLに紐付けられている文字列を文字列データベース33から読み出し、読み出した文字列を検索サーバ3に送信して、同じ文字列を表示するWebページの検索を行わせる。検索が終了したとき、検索結果が検索サーバ3から送信されてくる。   In step S <b> 14, the search unit 35 reads the character string associated with the URL supplied from the display control unit 34 from the character string database 33, transmits the read character string to the search server 3, and transmits the same character. Search for web pages that display columns. When the search is completed, the search result is transmitted from the search server 3.

ステップS15において、検索部35は、検索サーバ3から送信されてきた検索結果の中に、ユーザのお気に入りのWebページが挙がっている否かを判定する。   In step S <b> 15, the search unit 35 determines whether the user's favorite Web page is included in the search result transmitted from the search server 3.

例えば、検索部35は、ステップS15において、お気に入りのWebページが検索結果の中に挙がっていないと判定した場合、ステップS16に進み、文字列の数を減らした後、ステップS14以降の処理を繰り返し行う。これにより、文字列の数が順次減らされ、検索サーバ3による検索が繰り返される。   For example, if the search unit 35 determines in step S15 that the favorite web page is not listed in the search results, the search unit 35 proceeds to step S16, reduces the number of character strings, and then repeats the processes in and after step S14. Do. As a result, the number of character strings is sequentially reduced, and the search by the search server 3 is repeated.

文字列の数を減らした形でWebページの検索が繰り返し行われるから、Webページの表示内容の一部に変更が加えられた場合であっても、Webページを検出することが可能になる。   Since the Web page search is repeatedly performed with the number of character strings reduced, the Web page can be detected even when a part of the display content of the Web page is changed.

また、目的とするWebページが見つからない場合に文字列の数を減らした形で検索が繰り返されるようにすることにより、例えば、繰り返し行われる検索のうちの、1回目や2回目などの検索の最初の段階で、多くのWebページが検索結果として挙がってしまうことが防止される。   In addition, when the target Web page is not found, the search is repeated with a reduced number of character strings, so that, for example, the first or second search of the repeated searches is performed. In the first stage, many web pages are prevented from appearing as search results.

一方、ステップS15において、検索部35は、お気に入りのWebページが検索結果の中に挙がっていると判定した場合、移動先のURLを表示制御部34に出力する。その後、ステップS13に進み、検索により得られた新たなURLに基づいて、表示制御部34により、ユーザのお気に入りのWebページの表示が行われ、処理が終了される。   On the other hand, if it is determined in step S15 that the favorite web page is listed in the search result, the search unit 35 outputs the destination URL to the display control unit 34. Thereafter, the process proceeds to step S13, where the display control unit 34 displays the user's favorite web page based on the new URL obtained by the search, and the process ends.

なお、ここでは、図6の処理は、ユーザが、ブックマークに登録しておいたものの中から所定のWebページを選択したときに行われるものとしたが、これ以外にも、ユーザが所定の入力欄にURLを直接入力して所定のWebページにアクセスしようとしたときに行われるようにしてもよいし、あるWebページに表示されているリンクを選択し、リンク付けされているWebページにアクセスしようとしたときに行われるようにしてもよい。   Here, the processing in FIG. 6 is performed when the user selects a predetermined Web page from among those registered in the bookmark. This may be done when you try to access a given web page by directly entering the URL in the field, or select a link displayed on a web page and access the linked web page It may be performed when an attempt is made.

また、以上においては、検索サーバ3から送信されてくる検索結果にユーザのお気に入りのWebページが含まれていない場合、文字列の数を順次減らして検索を繰り返すものとしたが、文字列の数を減らすのではなく、1つの文字列のうちの文字の数を減らして、検索が繰り返されるようにしてもよい。   In the above description, when the user's favorite Web page is not included in the search result transmitted from the search server 3, the number of character strings is sequentially reduced and the search is repeated. Instead of reducing the number of characters, the number of characters in one character string may be reduced to repeat the search.

次に、図7のフローチャートを参照して、情報処理装置1の文字列更新処理について説明する。   Next, the character string update process of the information processing apparatus 1 will be described with reference to the flowchart of FIG.

ステップS21において、表示制御部34は、ユーザから指示されたWebページにアクセスする。   In step S21, the display control unit 34 accesses a web page instructed by the user.

表示制御部34は、ステップS22において、アクセスしたWebページのURLが登録されているか否かをURLデータベース32に記憶されている情報を参照して判定する。   In step S <b> 22, the display control unit 34 determines whether or not the URL of the accessed web page is registered with reference to information stored in the URL database 32.

ステップS22において、表示制御部34は、アクセスしたWebページのURLが登録されていないと判定した場合、処理を終了させ、一方、登録されていると判定した場合、ステップS23に進む。   In step S22, if the display control unit 34 determines that the URL of the accessed web page is not registered, the display control unit 34 terminates the processing. If the display control unit 34 determines that the URL is registered, the process proceeds to step S23.

ステップS23において、ブックマーク管理部31は、いま表示されているWebページのHTMLファイルを表示制御部34から取得し、取得したHTMLファイルから、所定のタグの中に記述されている文字列を抽出する。また、ブックマーク管理部31は、抽出した文字列を、表示しているWebページのURLと紐付けて文字列データベース33に登録することによって、それまで文字列データベース33に登録されていた文字列を更新させる。   In step S23, the bookmark management unit 31 acquires the HTML file of the currently displayed Web page from the display control unit 34, and extracts a character string described in a predetermined tag from the acquired HTML file. . In addition, the bookmark management unit 31 registers the extracted character string in the character string database 33 in association with the URL of the displayed Web page, so that the character string previously registered in the character string database 33 can be stored. Update.

以上の処理により、ブックマークに登録されているWebページについては、アクセスが行われる毎に文字列が更新されることから、Webページの内容に変更が加えられた場合であっても、Webブラウザ1Aは、より新しい情報(文字列)を用いて、より確実に、移動先を検出することが可能になる。   As a result of the above processing, the character string of the Web page registered in the bookmark is updated every time access is performed, so even if the content of the Web page is changed, the Web browser 1A Makes it possible to detect the destination more reliably by using newer information (character string).

なお、図7の文字列の更新処理も、上述したように、ブックマークに登録しておいたものの中から所定のWebページを選択したときに行われるだけでなく、ユーザが所定の入力欄にURLを直接入力して所定のWebページにアクセスしたときや、あるWebページに表示されているリンクを選択し、リンク付けされているWebページにアクセスしたときに行われるようにしてもよい。   As described above, the update process of the character string in FIG. 7 is not only performed when a predetermined Web page is selected from those registered in the bookmark, but the user also enters a URL in a predetermined input field. This may be performed when a predetermined web page is accessed by directly inputting the URL, or when a link displayed on a certain web page is selected and a linked web page is accessed.

上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。   The series of processes described above can be executed by hardware, but can also be executed by software.

一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば、汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。   When a series of processing is executed by software, a program constituting the software may execute various functions by installing a computer incorporated in dedicated hardware or various programs. For example, it is installed from a network or a recording medium into a general-purpose personal computer or the like.

この記録媒体は、図3に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(登録商標)(Mini-Disk)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア21により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM12や、記憶部18に含まれるハードディスクなどで構成される。   As shown in FIG. 3, the recording medium is distributed to provide a program to the user separately from the apparatus main body, and includes a magnetic disk (including a flexible disk) on which the program is recorded, an optical disk (CD- ROM (Compact Disk-Read Only Memory), DVD (including Digital Versatile Disk)), magneto-optical disk (including MD (registered trademark) (Mini-Disk)), or removable media 21 made of semiconductor memory, etc. In addition, it is configured by a ROM 12 in which a program is recorded and a hard disk included in the storage unit 18 provided to the user in a state of being incorporated in the apparatus main body in advance.

なお、本明細書において、各ステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。   In the present specification, each step includes not only processing performed in time series according to the described order but also processing executed in parallel or individually, although not necessarily performed in time series.

また、本明細書において、システムとは、複数の装置により構成される装置全体を表わすものである。   Further, in this specification, the system represents the entire apparatus composed of a plurality of apparatuses.

本発明の一実施形態に係る通信システムの構成例を示す図である。It is a figure which shows the structural example of the communication system which concerns on one Embodiment of this invention. HTMLファイルの例を示す図である。It is a figure which shows the example of an HTML file. 情報処理装置のハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of information processing apparatus. 情報処理装置の機能構成例を示すブロック図である。It is a block diagram which shows the function structural example of information processing apparatus. 情報処理装置の登録処理について説明するフローチャートである。It is a flowchart explaining the registration process of information processing apparatus. 情報処理装置の検索処理について説明するフローチャートである。It is a flowchart explaining the search process of information processing apparatus. 情報処理装置の文字列更新処理について説明するフローチャートである。It is a flowchart explaining the character string update process of information processing apparatus.

符号の説明Explanation of symbols

1 情報処理装置, 2−1,2−2 Webページ管理サーバ, 3 検索サーバ, 4 ネットワーク, 31 ブックマーク管理部, 32 URLデータベース, 33 文字列データベース, 34 表示制御部, 35 検索部   DESCRIPTION OF SYMBOLS 1 Information processing apparatus, 2-1 and 2-2 Web page management server, 3 Search server, 4 Network, 31 Bookmark management part, 32 URL database, 33 Character string database, 34 Display control part, 35 Search part

Claims (4)

WebページのURL(Uniform Resource Locator)を登録するとき、前記Webページを表示するためのHTML(Hyper Text Markup Language)ファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御手段と、
登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御手段により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御手段により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索手段と
を備えることを特徴とする情報処理装置。
When registering a URL (Uniform Resource Locator) of a Web page, the entire character string described in a plurality of predetermined tags included in an HTML (Hyper Text Markup Language) file for displaying the Web page is stored. Memory control means;
When it becomes impossible to access the web page based on the registered URL, the web page is connected to a search server connected via a network based on the character string stored by the storage control means. When a search is performed and the Web page is not listed in the search result by the search server, the search server is based on a part of a plurality of character strings stored by the storage control unit. And an information processing apparatus comprising: search means for re-searching the Web page.
前記記憶制御手段は、さらに、URLを登録した前記Webページへのアクセスが行われたとき、記憶しておいた文字列を、新たにアクセスした前記WebページのHTMLファイルに基づいて更新する
ことを特徴とする請求項1に記載の情報処理装置。
The storage control means further updates the stored character string based on the HTML file of the newly accessed web page when the web page where the URL is registered is accessed. The information processing apparatus according to claim 1.
WebページのURL(Uniform Resource Locator)を登録するとき、前記Webページを表示するためのHTML(Hyper Text Markup Language)ファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御ステップと、
登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索ステップと
を含むことを特徴とする情報処理方法。
When registering a URL (Uniform Resource Locator) of a Web page, the entire character string described in a plurality of predetermined tags included in an HTML (Hyper Text Markup Language) file for displaying the Web page is stored. A memory control step;
When it becomes impossible to access the Web page based on the registered URL, the Web page is connected to a search server connected via a network based on the character string stored by the processing of the storage control step. When a search for a page is performed and the Web page is not listed in a search result by the search server, some characters of the plurality of character strings stored in the storage control step are stored in the search server. And a search step for re-searching the Web page based on the column.
WebページのURL(Uniform Resource Locator)を登録するとき、前記Webページを表示するためのHTML(Hyper Text Markup Language)ファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御ステップと、
登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索ステップと
を含む処理をコンピュータに実行させるプログラム。
When registering a URL (Uniform Resource Locator) of a Web page, the entire character string described in a plurality of predetermined tags included in an HTML (Hyper Text Markup Language) file for displaying the Web page is stored. A memory control step;
When it becomes impossible to access the Web page based on the registered URL, the Web page is connected to a search server connected via a network based on the character string stored by the processing of the storage control step. When a search for a page is performed and the Web page is not listed in a search result by the search server, some characters of the plurality of character strings stored in the storage control step are stored in the search server. A program for causing a computer to execute a process including a search step for re-searching the Web page based on a column.
JP2005074429A 2005-03-16 2005-03-16 Information processing apparatus, method, and program Withdrawn JP2006259965A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005074429A JP2006259965A (en) 2005-03-16 2005-03-16 Information processing apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005074429A JP2006259965A (en) 2005-03-16 2005-03-16 Information processing apparatus, method, and program

Publications (1)

Publication Number Publication Date
JP2006259965A true JP2006259965A (en) 2006-09-28

Family

ID=37099173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005074429A Withdrawn JP2006259965A (en) 2005-03-16 2005-03-16 Information processing apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP2006259965A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011052526A1 (en) * 2009-10-30 2011-05-05 楽天株式会社 Characteristic content determination program, characteristic content determination device, characteristic content determination method, recording medium, content generation device, and related content insertion device
US8266942B2 (en) 2009-09-25 2012-09-18 Hong Fu Jin Precision (Shenzhen) Co., Ltd. Bending machine
JP2014502753A (en) * 2010-12-22 2014-02-03 ペキン・ユニヴァーシティ・ファウンダー・グループ・カンパニー・リミテッド Web page information detection method and system
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8266942B2 (en) 2009-09-25 2012-09-18 Hong Fu Jin Precision (Shenzhen) Co., Ltd. Bending machine
WO2011052526A1 (en) * 2009-10-30 2011-05-05 楽天株式会社 Characteristic content determination program, characteristic content determination device, characteristic content determination method, recording medium, content generation device, and related content insertion device
US10614134B2 (en) 2009-10-30 2020-04-07 Rakuten, Inc. Characteristic content determination device, characteristic content determination method, and recording medium
JP2014502753A (en) * 2010-12-22 2014-02-03 ペキン・ユニヴァーシティ・ファウンダー・グループ・カンパニー・リミテッド Web page information detection method and system
US9519718B2 (en) 2010-12-22 2016-12-13 Peking University Founder Group Co., Ltd. Webpage information detection method and system

Similar Documents

Publication Publication Date Title
KR100932352B1 (en) Electronic device and program recording medium having a web page browsing function
JP4438448B2 (en) Structured document display processing device, structured document display method, structured document display program
EP1422666A1 (en) Information processing apparatus and method
EP1310884A2 (en) Information retrieval system and information retrieving method therefor
JPH11242620A (en) Information processor, server device, information providing system and storage medium
JP2001236287A (en) Image display method and portable terminal for displaying image by the same
US20060101330A1 (en) Browser sitemap viewer
JP2007114942A (en) Metadata generation apparatus and metadata generation method
JP2006259965A (en) Information processing apparatus, method, and program
US9524076B2 (en) Web page management method and apparatus and storage medium thereof
JP5659500B2 (en) Web service storage program and Web service storage device
JP2000215138A (en) Information searching device and storage medium which stores program
JP4477931B2 (en) Search request device, search request method, search request program, and computer-readable recording medium storing search request program
JP2008197787A (en) Web content providing device, web content providing method, and program
JP2004054918A (en) Information processing system, information display device, computer program, and recording medium
JP3237619B2 (en) Document display device, document display method, and recording medium recording document display program
JP2004192276A (en) Information retrieval system, information retrieval device and computer program
JP2001034525A (en) Web page display method and recording medium where processing program thereof is recorded
EP1998283A1 (en) Information presenting apparatus and information presenting terminal
JP2009251655A (en) Filtering device, filtering method, program, and recording medium
JP2812357B2 (en) Database search system
JP2010146381A (en) Web page browsing apparatus and program
JP4692802B2 (en) Automatic address search device, automatic address search method, automatic address search program, and automatic address search program storage medium
JP2004086457A (en) Download method of contents and its system
US20020130901A1 (en) Enhanced program listing

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080603