JP2006259965A - Information processing apparatus, method, and program - Google Patents
Information processing apparatus, method, and program Download PDFInfo
- Publication number
- JP2006259965A JP2006259965A JP2005074429A JP2005074429A JP2006259965A JP 2006259965 A JP2006259965 A JP 2006259965A JP 2005074429 A JP2005074429 A JP 2005074429A JP 2005074429 A JP2005074429 A JP 2005074429A JP 2006259965 A JP2006259965 A JP 2006259965A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- search
- character string
- url
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、情報処理装置および方法、並びにプログラムに関し、特に、データ量の少ないデータを用いて、また、少ない処理負担でWebページの移動先を検出することができるようにする情報処理装置および方法、並びにプログラムに関する。 The present invention relates to an information processing apparatus and method, and a program, and in particular, an information processing apparatus and method that can detect a movement destination of a Web page using data with a small amount of data and with a small processing load. As well as programs.
Webブラウザに用意されるブックマーク機能で登録しておいたWebページが移動してしまった場合(HTML(Hyper Text Markup Language)ファイルの格納場所が変更された場合)、移動先を検出し、ユーザによる操作によらずに移動されたWebページに自動的にアクセスする技術が各種提案されている。 When the web page registered with the bookmark function provided in the web browser has moved (when the storage location of the HTML (Hyper Text Markup Language) file has been changed), the destination is detected and the user Various techniques have been proposed for automatically accessing a moved web page regardless of operation.
例えば、特許文献1には、ユーザによりアクセスが指示されたWebページが移動していた場合、あらかじめ保存しておいた、そのWebページのHTMLファイルからキーワードを抽出し、抽出したキーワードを検索エンジンにかけることによって、移動先を探し出す技術が開示されている。
しかしながら、特許文献1に開示されている技術には以下の点で問題がある。
However, the technique disclosed in
第1の問題は、HTMLファイルの格納場所のリソースに関する問題である。すなわち、特許文献1の明細書の番号[0011]段落には、「ホームページA401のHTMLファイルをダウンロードし、外部記憶装置106に格納HTMLファイル(ファイル名はA.htmlとする)として格納」することが記載されており、この発明によれば、追跡対象とするWebページ全体のデータ(HTMLファイル)を保存しておく必要がある。
The first problem is related to the resource of the HTML file storage location. That is, in the number [0011] paragraph of the specification of
多くのWebページを登録した場合、これは、記憶容量の圧迫につながるから、例えば、携帯電話機のような記憶容量が比較的少ない装置においては、保存しておいたHTMLファイルを用いて移動先を検出するといった、このような検出手法を実現することが困難な場合がある。 When many web pages are registered, this leads to compression of the storage capacity. For example, in a device with a relatively small storage capacity such as a mobile phone, the destination can be set using a saved HTML file. There are cases where it is difficult to realize such a detection technique such as detection.
第2の問題は、キーワードの抽出に名詞辞書を利用している点である。特許文献1の明細書の番号[0015]段落には、「格納ページキーワード抽出機能1001は、格納HTMLファイルのタイトル部分、テキスト部分から、名詞辞書207を参照しながらページを特徴付けるキーワードを割り出す」ことが記載されており、キーワードの抽出を実現するためには、名詞辞書を装置が有していること、また、名詞辞書の参照処理を行うことが必要になる。
The second problem is that a noun dictionary is used for keyword extraction. In the number [0015] paragraph of the specification of
つまり、この処理の実現には、装置によっては比較的大きなデータになる名詞辞書を搭載することと、HTMLファイル内の文字列を、辞書に登録されているキーワードとマッチングさせるというCPU(Central Processing Unit)に負荷がかかる処理が必要になり、記憶媒体の容量などの点から名詞辞書を搭載しておくことができない装置や、マッチング処理を実行するのに十分な処理能力を有するCPUを搭載していない装置では実現が困難な場合がある。 In other words, this processing is implemented by installing a noun dictionary that becomes relatively large data depending on the device, and matching the character string in the HTML file with the keyword registered in the dictionary (CPU (Central Processing Unit) ), A device that cannot be equipped with a noun dictionary in terms of storage media capacity, etc., and a CPU that has sufficient processing power to perform matching processing. It may be difficult to implement with no device.
本発明はこのような状況に鑑みてなされたものであり、データ量の少ないデータを用いて、また、少ない処理負担でWebページの移動先を検出することができるようにするものである。 The present invention has been made in view of such a situation, and makes it possible to detect a destination of a Web page by using data with a small amount of data and with a small processing load.
本発明の情報処理装置は、WebページのURLを登録するとき、Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御手段と、登録しておいたURLに基づいてWebページにアクセスすることができなくなった場合、記憶制御手段により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバにWebページの検索を行わせ、検索サーバによる検索結果にWebページが挙がってこなかったとき、検索サーバに、記憶制御手段により記憶された複数の文字列のうちの一部の文字列に基づいて、Webページの検索を再度行わせる検索手段とを備えることを特徴とする。 The information processing apparatus of the present invention, when registering the URL of the Web page, storage control means for storing the entire character string described in a plurality of predetermined tags included in the HTML file for displaying the Web page; When the web page cannot be accessed based on the registered URL, the web page is searched for the search server connected via the network based on the character string stored by the storage control means. When the web page is not listed in the search results by the search server, the search server searches the web page based on a part of the plurality of character strings stored by the storage control means. And a search means for performing again.
ここで、文字列には、例えば、複数の文字からなる列の他、複数の数字からなる列、複数の記号からなる列、あるいは、複数の文字、数字、記号を組み合わせてなる列が含まれる。 Here, the character string includes, for example, a column composed of a plurality of characters, a column composed of a plurality of numbers, a column composed of a plurality of symbols, or a column composed of a combination of a plurality of characters, numbers, and symbols. .
記憶制御手段は、さらに、URLを登録したWebページへのアクセスが行われたとき、記憶しておいた文字列を、新たにアクセスしたWebページのHTMLファイルに基づいて更新するようにすることができる。 The storage control means may further update the stored character string based on the HTML file of the newly accessed web page when the web page registered with the URL is accessed. it can.
本発明の情報処理方法、およびプログラムは、WebページのURLを登録するとき、Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御ステップと、登録しておいたURLに基づいてWebページにアクセスすることができなくなった場合、記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバにWebページの検索を行わせ、検索サーバによる検索結果にWebページが挙がってこなかったとき、検索サーバに、記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、Webページの検索を再度行わせる検索ステップとを含むことを特徴とする。 The information processing method and program of the present invention store a whole character string described in a plurality of predetermined tags included in an HTML file for displaying a Web page when registering the URL of the Web page. When it becomes impossible to access the web page based on the control step and the registered URL, the search server connected via the network is based on the character string stored by the process of the storage control step. When a web page is searched, and the web page is not listed in the search results by the search server, the search server is based on some of the character strings stored in the storage control step. And a search step for searching the Web page again.
本発明の情報処理装置および方法、並びにプログラムにおいては、WebページのURLを登録するとき、Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体が記憶され、登録しておいたURLに基づいてWebページにアクセスすることができなくなった場合、記憶された文字列に基づいて、ネットワークを介して接続される検索サーバにWebページの検索を行わせることが行われる。また、検索サーバによる検索結果にWebページが挙がってこなかったとき、検索サーバに、複数の文字列のうちの一部の文字列に基づいて、Webページの検索を再度行わせることが行われる。 In the information processing apparatus, method, and program of the present invention, when registering the URL of a Web page, the entire character string described in a plurality of predetermined tags included in the HTML file for displaying the Web page is When it becomes impossible to access a web page based on the stored and registered URL, the search server connected via the network searches the web page based on the stored character string. Is done. In addition, when a web page is not listed in the search result by the search server, the search server is caused to search the web page again based on a part of the plurality of character strings.
本発明によれば、データ量の少ないデータを用いてWebページの移動先を検出することができる。 According to the present invention, it is possible to detect a destination of a Web page using data with a small amount of data.
また、本発明によれば、少ない処理負担でWebページの移動先を検出することができる。 Further, according to the present invention, it is possible to detect the destination of a Web page with a small processing load.
以下に本発明の実施の形態を説明するが、本明細書に記載の発明と、発明の実施の形態との対応関係を例示すると、次のようになる。この記載は、請求項に記載されている発明をサポートする実施の形態が本明細書に記載されていることを確認するためのものである。従って、発明の実施の形態中には記載されているが、発明に対応するものとして、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その発明に対応するものではないことを意味するものではない。逆に、実施の形態が発明に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その発明以外の発明には対応しないものであることを意味するものでもない。 Embodiments of the present invention will be described below. The correspondence relationship between the invention described in this specification and the embodiments of the invention is exemplified as follows. This description is intended to assure that embodiments supporting the claimed invention are described in this specification. Therefore, although there is an embodiment which is described in the embodiment of the invention but is not described here as corresponding to the invention, it means that the embodiment is not It does not mean that it does not correspond to the invention. Conversely, even if an embodiment is described herein as corresponding to an invention, that means that the embodiment does not correspond to an invention other than the invention. Absent.
さらに、この記載は、本明細書に記載されている発明の全てを意味するものではない。換言すれば、この記載は、本明細書に記載されている発明であって、この出願では請求されていない発明の存在、すなわち、将来、分割出願されたり、補正により追加される発明の存在を否定するものではない。 Further, this description does not mean all the inventions described in this specification. In other words, this description is for the invention described in the present specification and not claimed in this application, i.e., the existence of an invention that will be filed in the future or added by amendment. There is no denial.
請求項1に記載の情報処理装置は、WebページのURLを登録するとき、前記Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御手段(例えば、図4のブックマーク管理部31)と、登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御手段により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御手段により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索手段(例えば、図4の検索部35)とを備えることを特徴とする。
The information processing apparatus according to
請求項3に記載の情報処理方法は、WebページのURLを登録するとき、前記Webページを表示するためのHTMLファイルに含まれる所定の複数のタグの中に記述される文字列全体を記憶させる記憶制御ステップ(例えば、図5のステップS3)と、登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索ステップ(例えば、図6のステップS14)とを含むことを特徴とする。
The information processing method according to
請求項4に記載のプログラムにおいても、各ステップが対応する実施の形態(但し一例)は、請求項3に記載の情報処理方法と同様である。 Also in the program according to the fourth aspect, the embodiment (however, an example) to which each step corresponds is the same as the information processing method according to the third aspect.
以下、本発明の実施の形態について図を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の一実施形態に係る通信システムの構成例を示す図である。 FIG. 1 is a diagram illustrating a configuration example of a communication system according to an embodiment of the present invention.
この通信システムは、例えば、情報処理装置1、Webページ管理サーバ2−1,2−2、および検索サーバ3がネットワーク4を介して接続されることによって構成される。
This communication system is configured, for example, by connecting the
情報処理装置1にはWebブラウザ1Aが搭載されており、情報処理装置1のユーザは、Webブラウザ1Aを起動させることによって、Webページ管理サーバ2−1や2−2により管理されているWebページを、情報処理装置1のディスプレイ上で閲覧することができる。
The
Webブラウザ1Aは、ユーザにより指示されたWebページを登録する(WebページのURL、タイトル等を登録する)ブックマーク機能を有する。従って、ユーザは、気に入ったWebページを登録しておき、登録しておいたWebページの中から選択することによって、お気に入りのWebページを後から容易に閲覧することができる。
The
Webブラウザ1Aは、あるWebページを表示している状態で、ユーザにより、表示しているWebページを登録することが指示された場合、URLを登録するとともに、いま表示しているWebページのHTMLファイルを解析し、HTMLファイルに含まれるタグのうち、所定のタグの中に記述されている文字列全体を抽出して保存する。文字列には、例えば、複数の文字からなる列の他、複数の数字からなる列、複数の記号からなる列、あるいは、複数の文字、数字、記号を組み合わせてなる列が含まれる。
When the
例えば、Webページのタイトルが記述されるタイトルタグ(<TITLE>〜</TITLE>)、見出しの表示などに利用されるHタグ(H1,H2,H3タグ(<H○>〜</H○>))、および、テキストの位置を指定するPタグ(<P>〜</P>)などの、Webページの特徴を表す文字列の表示に用いられるようなタグの中の文字列が保存される。 For example, a title tag (<TITLE> to </ TITLE>) describing the title of a Web page, an H tag (H1, H2, H3 tag (<H ○> to </ H ○>) used for displaying a headline, etc. >)), And P tags (<P> to </ P>) that specify the position of the text, etc., and the character strings in tags that are used to display character strings that represent Web page features are saved. Is done.
図2は、HTMLファイルの例を示す図である。図2に示す記述のうち、図の左端に示す数字、アルファベットと「:(コロン)」は説明の便宜上付しているものであり、実際にHTMLファイルに記述されるものではない。 FIG. 2 is a diagram illustrating an example of an HTML file. In the description shown in FIG. 2, the numbers, alphabets, and “: (colon)” shown at the left end of the figure are attached for convenience of explanation, and are not actually described in the HTML file.
図2の例においては、第1行目に「<title>AAA製品情報</title>」が記述され、第n1行目に「<H1 ALINGN=罵eft #62;16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売</H1>」が記述されている。また、第n2行目に「<H2 ALINGN=罵eft #62;リアルで美しい 高画質な映像を創造するとともに映像を操作して楽しむ 新しい視聴スタイルを提案する“ボックス” 発売</H2>」が記述されている。 In the example of FIG. 2, “<title> AAA product information </ title>” is described in the first line, and “<H1 ALINGN = 罵 eft # 62; 16: 9 wide video” is described in the n1st line. "2.7-inch wide LCD monitor" that can be displayed as it is, 4 DV and DVD video cameras are released </ H1>. Also, on line n 2 “<H2 ALINGN = 罵 eft # 62;“ Box ”released </ H2> to propose a new viewing style that creates real and beautiful high-quality images and enjoys them by manipulating the images” ” Is described.
この場合、タイトルタグの中に記述される全ての文字列である「AAA製品情報」、H1タグの中に記述される全ての文字列である「16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売」、および、H2タグの中に記述される全ての文字列である「リアルで美しい 高画質な映像を創造するとともに映像を操作して楽しむ 新しい視聴スタイルを提案する“ボックス” 発売」が抽出され、保存される。すなわち、第1行目から第n1行目の間に置かれているタグの中の文字列、第n2行目以降に置かれているタグの中の文字列は保存されない。 In this case, “AAA product information” that is all character strings described in the title tag and “16: 9 wide video that is all character strings described in the H1 tag can be displayed as they are [2.7]. Wide-screen LCD ”equipped with 4 DV and DVD video cameras” and all character strings described in the H2 tag “Real and beautiful high-quality video creation and video manipulation” Enjoy “box release” that suggests a new viewing style is extracted and saved. That is, the character string in the tag placed between the first line and the n 1st line and the character string in the tag placed on the n 2nd line and thereafter are not saved.
なお、文字列の抽出対象となるタグの種類や数は、情報処理装置1のリソース制約などに基づいて適宜制限されるようにすることも可能である。
Note that the type and number of tags from which character strings are to be extracted may be appropriately limited based on resource constraints of the
図1の説明に戻り、Webブラウザ1Aは、このようにして保存した文字列を、登録しておいたURLに基づいてユーザのお気に入りのWebページにアクセスすることができなくなったときに用いる。例えば、Webページ管理サーバ2−1により管理されていたあるWebページが、Webページ管理サーバ2−2により管理されるものになったとき、すなわち、Webページが移動したときなどに、Webブラウザ1Aは、登録しておいたURLに基づいてお気に入りのWebページにアクセスすることができなくなる。
Returning to the description of FIG. 1, the
登録しておいたURLに基づいてアクセスを実行した結果、例えば、「お探しのWebページは存在しません」などのメッセージが返されたことから、ユーザのお気に入りのWebページにアクセスすることができなくなった場合(HTTP(Hyper Text Transfer Protocol)のリターンコードとして、404(Not Found)や302(Moved Temporarily)が返ってきた場合)、Webブラウザ1Aは、保存しておいた文字列の全てを、ネットワーク4を介して検索サーバ3に送信し、送信した文字列に基づいてWebページの検索(AND検索)を行わせる。後述するように、検索サーバ3は、他の装置から送信されてきた文字、数字、記号に基づいて、同じ文字、数字、記号を表示するWebページの検索エンジンを有するサーバである。
As a result of access based on the registered URL, for example, a message such as "The web page you are looking for does not exist" is returned, so you can access your favorite web page. When it disappears (when 404 (Not Found) or 302 (Moved Temporarily) is returned as the return code of HTTP (Hyper Text Transfer Protocol)), the
図2の例の場合、「AAA製品情報」、「16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売」、および、「リアルで美しい 高画質な映像を創造するとともに映像を操作して楽しむ 新しい視聴スタイルを提案する“ボックス” 発売」の3つの文字列が検索サーバ3に送信され、Webページの検索が行われる。
In the case of the example in Fig. 2, "AAA product information", "Release of 4 types of DV and DVD video cameras equipped with" 2.7-inch wide LCD monitor "that can display 16: 9 wide video as it is", and "Real Create a beautiful high-quality video and enjoy it by manipulating the video “Box” release, which proposes a new viewing style, is sent to the
検索サーバ3による検索により、送信した文字列と同じ文字列を表示するWebページが検出された場合、Webブラウザ1Aは、そのWebページを、ユーザがお気に入りのものとして登録しておいたWebページと同じWebページであるとし、ディスプレイに表示させる。
When the search by the
これにより、Webページが移動した場合であっても、Webブラウザ1Aは、ユーザのお気に入りのWebページを表示することができる。
Thereby, even if the web page is moved, the
また、移動先を検出するために保存しておくデータは、タイトルタグ、Hタグなどのように、HTMLファイルに含まれる所定のタグの中に記述される文字列だけであるから、移動先を検出するためのデータとしてHTMLファイル全体を保存しておく場合に較べて、情報処理装置1の記憶媒体の容量を圧迫することを防止することができる。
Since the data stored for detecting the destination is only a character string described in a predetermined tag included in the HTML file, such as a title tag and an H tag, the destination is Compared to storing the entire HTML file as data for detection, it is possible to prevent the storage medium capacity of the
さらに、文字列の抽出はユーザによる操作によらずに自動的に行われるため、ユーザが明示的に文字列を登録する必要がない。 Furthermore, since the extraction of the character string is automatically performed regardless of the operation by the user, it is not necessary for the user to explicitly register the character string.
また、移動先を検出するためのデータとして、所定のタグの中に記述される文字列全体が用いられるから、HTMLファイルに記述される文字列の中から所定のキーワードを辞書を参照しながら抽出し、抽出したキーワードを用いて移動先を検出する場合に較べて、情報処理装置1の処理負担を軽減することができる。すなわち、情報処理装置1は、辞書を参照する必要がなく、従って、辞書を有しておく必要もない。
Since the entire character string described in the predetermined tag is used as data for detecting the destination, the predetermined keyword is extracted from the character string described in the HTML file with reference to the dictionary. In addition, the processing load on the
記憶容量の圧迫を防止することや処理負担を軽減することは、情報処理装置1が、家庭内などに固定的に置かれる情報機器などと較べて、一般的に、記憶容量が少なかったり、処理能力が劣ったりする携帯機器である場合に特に有用なものになる。
In order to prevent the storage capacity from being compressed and to reduce the processing load, the
一方、検索サーバ3による検索の結果、送信した文字列と同じ文字列を表示するWebページ(Webページの移動先)が検出されなかった場合、Webブラウザ1Aは、検索に用いる文字列の数を減らし、再度、Webページの検索を検索サーバ3に行わせる。
On the other hand, as a result of the search by the
上述したように、3つの文字列を用いて行われた検索サーバ3の検索結果に、ユーザのお気に入りのWebページが挙がってこなかった場合、Webブラウザ1Aは、例えば、文字列の数を1つ減らし、「AAA製品情報」と、「16:9のワイド映像がそのまま表示できる『2.7型ワイド液晶モニター』搭載 DV方式・DVD方式のビデオカメラ4機種発売」の2つの文字列だけに基づいて、再度、Webページの検索を検索サーバ3に行わせる。
As described above, when the user's favorite Web page is not listed in the search result of the
再度行われた検索の結果に、ユーザのお気に入りのWebページが挙がってきた場合、Webブラウザ1Aは、そのWebページを表示し、一方、ユーザのお気に入りのWebページが挙がってこなかった場合、文字列の数を減らして、検索サーバ3による検索を繰り返す。
If the user's favorite web page is listed as a result of the search performed again, the
これにより、Webページが移動しただけでなく、Webページの内容に変更が加えられた場合であっても、Webブラウザ1Aは、移動したユーザのお気に入りのWebページを表示することができる。
Thereby, not only the web page is moved, but also when the content of the web page is changed, the
以上のような情報処理装置1の動作についてはフローチャートを参照して後述する。
The operation of the
図1のWebページ管理サーバ2−1および2−2は、HTMLファイルを格納し、ネットワーク4を介して行われる情報処理装置1からのアクセスに応じて、HTMLファイルを提供する。
Web page management servers 2-1 and 2-2 in FIG. 1 store an HTML file and provide the HTML file in response to access from the
検索サーバ3は検索エンジンを有しており、情報処理装置1から送信されてきた全ての文字列を表示するWebページを検索し、その検索結果を情報処理装置1に提供する。
The
図3は、情報処理装置1のハードウェア構成例を示すブロック図である。
FIG. 3 is a block diagram illustrating a hardware configuration example of the
CPU11は、ROM(Read Only Memory)12に記憶されているプログラム、または、記憶部18からRAM(Random Access Memory)13にロードされたプログラムに従って各種の処理を実行する。RAM13にはまた、CPU11が各種の処理を実行する上において必要なデータなどが適宜記憶される。
The
CPU11、ROM12、およびRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インタフェース15も接続されている。
The
入出力インタフェース15には、キーボード、マウスなどよりなる入力部16、LCD(Liquid Crystal Display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部17、ハードディスクなどより構成される記憶部18、ネットワーク4を介しての通信処理を行う通信部19が接続されている。
The input /
入出力インタフェース15にはまた、必要に応じてドライブ20が接続される。ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどよりなるリムーバブルメディア21が適宜装着され、それから読み出されたコンピュータプログラムが必要に応じて記憶部18にインストールされる。
A
図4は、情報処理装置1の機能構成例を示すブロック図である。図4に示す機能部は、図3のCPU11によりWebブラウザ1Aが実行されることによって実現される。
FIG. 4 is a block diagram illustrating a functional configuration example of the
ブックマーク管理部31は、表示しているWebページをブックマークに登録することがユーザから指示された場合、WebページのHTMLファイルを表示制御部34から取得し、そのWebページのURLをURLデータベース32に記憶させる。また、このとき、ブックマーク管理部31は、表示制御部34から取得したHTMLファイルを解析することによって、所定のタグの中に記述されている文字列を抽出し、抽出した文字列を文字列データベース33に記憶させる。
When the user instructs the
URLデータベース32は、ブックマーク管理部31から供給されてきたURLを保存する。URLデータベース32により保存されたURLは、適宜、表示制御部34により読み出される。
The
文字列データベース33は、ブックマーク管理部31から供給されてきた文字列を、その文字列を表示するWebページのURLと紐付けて保存する。文字列データベース33により保存された文字列は、適宜、検索部35により読み出される。
The
表示制御部34は、ユーザによる指示に応じて所定のサーバにアクセスし、Webページをディスプレイ(出力部17)に表示させる。例えば、ユーザから、表示しているWebページを登録することが指示された場合、表示制御部34は、表示しているWebページのHTMLファイルをブックマーク管理部31に出力する。
The
また、表示制御部34は、ブックマークに登録されたWebページにアクセスすることがユーザから指示された場合、そのWebページのURLをURLデータベース32から読み出し、読み出したURLに基づいて、ユーザのお気に入りのWebページを表示させる。表示制御部34は、URLデータベース32から読み出したURLに基づいて、ユーザのお気に入りのWebページにアクセスすることができなかった場合、そのことを検索部35に通知する。表示制御部34から検索部35に対する通知には、アクセスすることができなかったWebページのURLが含まれる。
In addition, when the user gives an instruction to access the Web page registered in the bookmark, the
検索部35は、ユーザのお気に入りのWebページに、URLデータベース32から読み出したURLに基づいてアクセスすることができなかったことが表示制御部34から通知されてきた場合、その通知に含まれるURLと紐付けられている文字列を文字列データベース33から読み出し、読み出した文字列を検索サーバ3に送信してWebページの検索を行わせる。
When the
例えば、検索サーバ3による検索結果に、送信した文字列と同じ文字列を表示するWebページが挙がってきた場合、検索部35は、そのWebページのURLを表示制御部34に通知し、アクセスを行わせる。また、検索部35は、検索サーバ3による検索結果に、送信した文字列と同じ文字列を表示するWebページが挙がってこなかった場合、上述したようにして文字列の数を減らし、検索サーバ3にWebページの検索を繰り返し行わせる。
For example, when a Web page that displays the same character string as the transmitted character string is listed in the search result by the
次に、以上のような構成を有する情報処理装置1の動作について説明する。
Next, the operation of the
はじめに、図5のフローチャートを参照して、情報処理装置1(Webブラウザ1A)の登録処理について説明する。
First, the registration processing of the information processing apparatus 1 (
Webページを登録することがユーザにより指示されたとき、ステップS1において、ブックマーク管理部31は、ユーザが閲覧しているWebページのHTMLファイルを表示制御部34から取得し、そのWebページのURLをURLデータベース32に記憶(登録)させる。
When the user instructs to register the web page, in step S1, the
ステップS2において、ブックマーク管理部31は、表示制御部34から取得したHTMLファイルのタグを解析し、所定のタグの中に記述されている文字列を抽出する。
In step S <b> 2, the
ステップS3において、ブックマーク管理部31は、ステップS2で抽出した文字列を、URLと紐付けて文字列データベース33に記憶させ、処理を終了させる。
In step S3, the
次に、図6のフローチャートを参照して、情報処理装置1の検索処理について説明する。
Next, the search process of the
例えば、ブックマークに登録したものの中から所定のWebページが選択され、アクセスすることが指示された場合、ステップS11において、表示制御部34は、そのWebページのURLをURLデータベース32から読み出し、読み出したURLに基づいてアクセスを行う。
For example, when a predetermined web page is selected from those registered in the bookmark and an access is instructed, the
ステップS12において、表示制御部34は、アクセスが成功したか否かを判定し、アクセスが成功したと判定した場合、ステップS13に進み、ユーザが登録しておいたWebページを表示させる。その後、処理は終了される。
In step S12, the
一方、表示制御部34は、ステップS12において、例えば、Webページが移動し、Webページを表示することができないことを通知するメッセージが返されてきたことから、アクセスが成功していないと判定した場合、URLデータベース32から読み出したURLを検索部35に出力し、ステップS14に進む。
On the other hand, in step S12, for example, the
ステップS14において、検索部35は、表示制御部34から供給されてきたURLに紐付けられている文字列を文字列データベース33から読み出し、読み出した文字列を検索サーバ3に送信して、同じ文字列を表示するWebページの検索を行わせる。検索が終了したとき、検索結果が検索サーバ3から送信されてくる。
In step S <b> 14, the
ステップS15において、検索部35は、検索サーバ3から送信されてきた検索結果の中に、ユーザのお気に入りのWebページが挙がっている否かを判定する。
In step S <b> 15, the
例えば、検索部35は、ステップS15において、お気に入りのWebページが検索結果の中に挙がっていないと判定した場合、ステップS16に進み、文字列の数を減らした後、ステップS14以降の処理を繰り返し行う。これにより、文字列の数が順次減らされ、検索サーバ3による検索が繰り返される。
For example, if the
文字列の数を減らした形でWebページの検索が繰り返し行われるから、Webページの表示内容の一部に変更が加えられた場合であっても、Webページを検出することが可能になる。 Since the Web page search is repeatedly performed with the number of character strings reduced, the Web page can be detected even when a part of the display content of the Web page is changed.
また、目的とするWebページが見つからない場合に文字列の数を減らした形で検索が繰り返されるようにすることにより、例えば、繰り返し行われる検索のうちの、1回目や2回目などの検索の最初の段階で、多くのWebページが検索結果として挙がってしまうことが防止される。 In addition, when the target Web page is not found, the search is repeated with a reduced number of character strings, so that, for example, the first or second search of the repeated searches is performed. In the first stage, many web pages are prevented from appearing as search results.
一方、ステップS15において、検索部35は、お気に入りのWebページが検索結果の中に挙がっていると判定した場合、移動先のURLを表示制御部34に出力する。その後、ステップS13に進み、検索により得られた新たなURLに基づいて、表示制御部34により、ユーザのお気に入りのWebページの表示が行われ、処理が終了される。
On the other hand, if it is determined in step S15 that the favorite web page is listed in the search result, the
なお、ここでは、図6の処理は、ユーザが、ブックマークに登録しておいたものの中から所定のWebページを選択したときに行われるものとしたが、これ以外にも、ユーザが所定の入力欄にURLを直接入力して所定のWebページにアクセスしようとしたときに行われるようにしてもよいし、あるWebページに表示されているリンクを選択し、リンク付けされているWebページにアクセスしようとしたときに行われるようにしてもよい。 Here, the processing in FIG. 6 is performed when the user selects a predetermined Web page from among those registered in the bookmark. This may be done when you try to access a given web page by directly entering the URL in the field, or select a link displayed on a web page and access the linked web page It may be performed when an attempt is made.
また、以上においては、検索サーバ3から送信されてくる検索結果にユーザのお気に入りのWebページが含まれていない場合、文字列の数を順次減らして検索を繰り返すものとしたが、文字列の数を減らすのではなく、1つの文字列のうちの文字の数を減らして、検索が繰り返されるようにしてもよい。
In the above description, when the user's favorite Web page is not included in the search result transmitted from the
次に、図7のフローチャートを参照して、情報処理装置1の文字列更新処理について説明する。
Next, the character string update process of the
ステップS21において、表示制御部34は、ユーザから指示されたWebページにアクセスする。
In step S21, the
表示制御部34は、ステップS22において、アクセスしたWebページのURLが登録されているか否かをURLデータベース32に記憶されている情報を参照して判定する。
In step S <b> 22, the
ステップS22において、表示制御部34は、アクセスしたWebページのURLが登録されていないと判定した場合、処理を終了させ、一方、登録されていると判定した場合、ステップS23に進む。
In step S22, if the
ステップS23において、ブックマーク管理部31は、いま表示されているWebページのHTMLファイルを表示制御部34から取得し、取得したHTMLファイルから、所定のタグの中に記述されている文字列を抽出する。また、ブックマーク管理部31は、抽出した文字列を、表示しているWebページのURLと紐付けて文字列データベース33に登録することによって、それまで文字列データベース33に登録されていた文字列を更新させる。
In step S23, the
以上の処理により、ブックマークに登録されているWebページについては、アクセスが行われる毎に文字列が更新されることから、Webページの内容に変更が加えられた場合であっても、Webブラウザ1Aは、より新しい情報(文字列)を用いて、より確実に、移動先を検出することが可能になる。
As a result of the above processing, the character string of the Web page registered in the bookmark is updated every time access is performed, so even if the content of the Web page is changed, the
なお、図7の文字列の更新処理も、上述したように、ブックマークに登録しておいたものの中から所定のWebページを選択したときに行われるだけでなく、ユーザが所定の入力欄にURLを直接入力して所定のWebページにアクセスしたときや、あるWebページに表示されているリンクを選択し、リンク付けされているWebページにアクセスしたときに行われるようにしてもよい。 As described above, the update process of the character string in FIG. 7 is not only performed when a predetermined Web page is selected from those registered in the bookmark, but the user also enters a URL in a predetermined input field. This may be performed when a predetermined web page is accessed by directly inputting the URL, or when a link displayed on a certain web page is selected and a linked web page is accessed.
上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。 The series of processes described above can be executed by hardware, but can also be executed by software.
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば、汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。 When a series of processing is executed by software, a program constituting the software may execute various functions by installing a computer incorporated in dedicated hardware or various programs. For example, it is installed from a network or a recording medium into a general-purpose personal computer or the like.
この記録媒体は、図3に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(登録商標)(Mini-Disk)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア21により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM12や、記憶部18に含まれるハードディスクなどで構成される。
As shown in FIG. 3, the recording medium is distributed to provide a program to the user separately from the apparatus main body, and includes a magnetic disk (including a flexible disk) on which the program is recorded, an optical disk (CD- ROM (Compact Disk-Read Only Memory), DVD (including Digital Versatile Disk)), magneto-optical disk (including MD (registered trademark) (Mini-Disk)), or
なお、本明細書において、各ステップは、記載された順序に従って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。 In the present specification, each step includes not only processing performed in time series according to the described order but also processing executed in parallel or individually, although not necessarily performed in time series.
また、本明細書において、システムとは、複数の装置により構成される装置全体を表わすものである。 Further, in this specification, the system represents the entire apparatus composed of a plurality of apparatuses.
1 情報処理装置, 2−1,2−2 Webページ管理サーバ, 3 検索サーバ, 4 ネットワーク, 31 ブックマーク管理部, 32 URLデータベース, 33 文字列データベース, 34 表示制御部, 35 検索部
DESCRIPTION OF
Claims (4)
登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御手段により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御手段により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索手段と
を備えることを特徴とする情報処理装置。 When registering a URL (Uniform Resource Locator) of a Web page, the entire character string described in a plurality of predetermined tags included in an HTML (Hyper Text Markup Language) file for displaying the Web page is stored. Memory control means;
When it becomes impossible to access the web page based on the registered URL, the web page is connected to a search server connected via a network based on the character string stored by the storage control means. When a search is performed and the Web page is not listed in the search result by the search server, the search server is based on a part of a plurality of character strings stored by the storage control unit. And an information processing apparatus comprising: search means for re-searching the Web page.
ことを特徴とする請求項1に記載の情報処理装置。 The storage control means further updates the stored character string based on the HTML file of the newly accessed web page when the web page where the URL is registered is accessed. The information processing apparatus according to claim 1.
登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索ステップと
を含むことを特徴とする情報処理方法。 When registering a URL (Uniform Resource Locator) of a Web page, the entire character string described in a plurality of predetermined tags included in an HTML (Hyper Text Markup Language) file for displaying the Web page is stored. A memory control step;
When it becomes impossible to access the Web page based on the registered URL, the Web page is connected to a search server connected via a network based on the character string stored by the processing of the storage control step. When a search for a page is performed and the Web page is not listed in a search result by the search server, some characters of the plurality of character strings stored in the storage control step are stored in the search server. And a search step for re-searching the Web page based on the column.
登録しておいたURLに基づいて前記Webページにアクセスすることができなくなった場合、前記記憶制御ステップの処理により記憶された文字列に基づいて、ネットワークを介して接続される検索サーバに前記Webページの検索を行わせ、前記検索サーバによる検索結果に前記Webページが挙がってこなかったとき、前記検索サーバに、前記記憶制御ステップの処理により記憶された複数の文字列のうちの一部の文字列に基づいて、前記Webページの検索を再度行わせる検索ステップと
を含む処理をコンピュータに実行させるプログラム。 When registering a URL (Uniform Resource Locator) of a Web page, the entire character string described in a plurality of predetermined tags included in an HTML (Hyper Text Markup Language) file for displaying the Web page is stored. A memory control step;
When it becomes impossible to access the Web page based on the registered URL, the Web page is connected to a search server connected via a network based on the character string stored by the processing of the storage control step. When a search for a page is performed and the Web page is not listed in a search result by the search server, some characters of the plurality of character strings stored in the storage control step are stored in the search server. A program for causing a computer to execute a process including a search step for re-searching the Web page based on a column.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005074429A JP2006259965A (en) | 2005-03-16 | 2005-03-16 | Information processing apparatus, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005074429A JP2006259965A (en) | 2005-03-16 | 2005-03-16 | Information processing apparatus, method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006259965A true JP2006259965A (en) | 2006-09-28 |
Family
ID=37099173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005074429A Withdrawn JP2006259965A (en) | 2005-03-16 | 2005-03-16 | Information processing apparatus, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006259965A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011052526A1 (en) * | 2009-10-30 | 2011-05-05 | 楽天株式会社 | Characteristic content determination program, characteristic content determination device, characteristic content determination method, recording medium, content generation device, and related content insertion device |
US8266942B2 (en) | 2009-09-25 | 2012-09-18 | Hong Fu Jin Precision (Shenzhen) Co., Ltd. | Bending machine |
JP2014502753A (en) * | 2010-12-22 | 2014-02-03 | ペキン・ユニヴァーシティ・ファウンダー・グループ・カンパニー・リミテッド | Web page information detection method and system |
US10614134B2 (en) | 2009-10-30 | 2020-04-07 | Rakuten, Inc. | Characteristic content determination device, characteristic content determination method, and recording medium |
-
2005
- 2005-03-16 JP JP2005074429A patent/JP2006259965A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8266942B2 (en) | 2009-09-25 | 2012-09-18 | Hong Fu Jin Precision (Shenzhen) Co., Ltd. | Bending machine |
WO2011052526A1 (en) * | 2009-10-30 | 2011-05-05 | 楽天株式会社 | Characteristic content determination program, characteristic content determination device, characteristic content determination method, recording medium, content generation device, and related content insertion device |
US10614134B2 (en) | 2009-10-30 | 2020-04-07 | Rakuten, Inc. | Characteristic content determination device, characteristic content determination method, and recording medium |
JP2014502753A (en) * | 2010-12-22 | 2014-02-03 | ペキン・ユニヴァーシティ・ファウンダー・グループ・カンパニー・リミテッド | Web page information detection method and system |
US9519718B2 (en) | 2010-12-22 | 2016-12-13 | Peking University Founder Group Co., Ltd. | Webpage information detection method and system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100932352B1 (en) | Electronic device and program recording medium having a web page browsing function | |
JP4438448B2 (en) | Structured document display processing device, structured document display method, structured document display program | |
EP1422666A1 (en) | Information processing apparatus and method | |
EP1310884A2 (en) | Information retrieval system and information retrieving method therefor | |
JPH11242620A (en) | Information processor, server device, information providing system and storage medium | |
JP2001236287A (en) | Image display method and portable terminal for displaying image by the same | |
US20060101330A1 (en) | Browser sitemap viewer | |
JP2007114942A (en) | Metadata generation apparatus and metadata generation method | |
JP2006259965A (en) | Information processing apparatus, method, and program | |
US9524076B2 (en) | Web page management method and apparatus and storage medium thereof | |
JP5659500B2 (en) | Web service storage program and Web service storage device | |
JP2000215138A (en) | Information searching device and storage medium which stores program | |
JP4477931B2 (en) | Search request device, search request method, search request program, and computer-readable recording medium storing search request program | |
JP2008197787A (en) | Web content providing device, web content providing method, and program | |
JP2004054918A (en) | Information processing system, information display device, computer program, and recording medium | |
JP3237619B2 (en) | Document display device, document display method, and recording medium recording document display program | |
JP2004192276A (en) | Information retrieval system, information retrieval device and computer program | |
JP2001034525A (en) | Web page display method and recording medium where processing program thereof is recorded | |
EP1998283A1 (en) | Information presenting apparatus and information presenting terminal | |
JP2009251655A (en) | Filtering device, filtering method, program, and recording medium | |
JP2812357B2 (en) | Database search system | |
JP2010146381A (en) | Web page browsing apparatus and program | |
JP4692802B2 (en) | Automatic address search device, automatic address search method, automatic address search program, and automatic address search program storage medium | |
JP2004086457A (en) | Download method of contents and its system | |
US20020130901A1 (en) | Enhanced program listing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080603 |