JP2004295663A - Information processing method and computer program - Google Patents

Information processing method and computer program Download PDF

Info

Publication number
JP2004295663A
JP2004295663A JP2003089074A JP2003089074A JP2004295663A JP 2004295663 A JP2004295663 A JP 2004295663A JP 2003089074 A JP2003089074 A JP 2003089074A JP 2003089074 A JP2003089074 A JP 2003089074A JP 2004295663 A JP2004295663 A JP 2004295663A
Authority
JP
Japan
Prior art keywords
hit data
score
search keyword
computer
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003089074A
Other languages
Japanese (ja)
Inventor
Hidetaka Tamai
英貴 玉井
Kyoko Shinohara
恭子 篠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003089074A priority Critical patent/JP2004295663A/en
Publication of JP2004295663A publication Critical patent/JP2004295663A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processing method and computer program capable of reducing the number of hit data to be outputted by extracting hit data having scores of a target score or more from a hit data list received from a retrieval system. <P>SOLUTION: A retrieval keyword is transmitted from an information processor 10 to the retrieval system 20, and the hit data list of hit data hit to the transmitted retrieval keyword with scores added thereto is returned from the retrieval system 20 to the information processor 10. At that time, the target score is accepted by the information processor 10, and hit data having scores of the accepted target score or more are extracted from the hit data list received from the retrieval system 20 in the information processor 10. Information for the extracted hit data is outputted from the information processor 10. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信及び出力する情報処理方法、及び、コンピュータに、検索キーワードを送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムに関する。
【0002】
【従来の技術】
インターネットの普及に伴い、必要な情報をインターネットから検索する機会が増加する傾向にある。必要な情報を検索する際、検索サイトにアクセスし、必要な情報に関係する検索キーワードを入力して検索を行う。しかし、インターネット上の情報量は膨大であり、検索キーワードに大量のデータ(ウェブページ)がヒットする場合が多い。ヒットデータ(ヒットページ)が大量の場合、検索キーワードを再考する必要が生じたり、何度も検索をやり直す場合が多くなるため、検索には手間がかかる。
【0003】
検索サイトの中には、各ヒットデータ(ヒットページ)に、検索サイトが独自に算出したスコア(又はポイント)を付加して、ユーザがスコアを参考にしてヒットデータの閲覧を行えるようにしているところもある。スコアは、例えばヒットデータ内の検索キーワード数に基づいて決定したり、ヒットデータへのリンク数に基づいて決定するなど、各検索サイトが独自に決定しており、一般的に、スコアが高いほど、検索キーワードに関連の深い情報である場合が多い。
【0004】
また、過去に入力された検索キーワードをデータベース化し、ユーザの入力した文字に前方一致する検索キーワード候補リストを表示することにより、検索キーワードの入力を補助する方法もある(例えば、特許文献1参照)。
【0005】
【特許文献1】
特開2001−249933号公報
【0006】
【発明が解決しようとする課題】
各ヒットページにスコアを付加することにより、スコアを参考にして各ヒットページを閲覧できるが、従来と同様に、ユーザは大量のヒットページを含むヒットページリストを受取ることになる。また、検索キーワード候補リストを表示する方法では、検索キーワードの入力効率が向上するだけであり、従来と同様に、ユーザは大量のヒットページを含むヒットページリストを受取ることになる。
【0007】
また、インターネット内の情報は、日々変化しており、新しいページが追加されたり、アドレス(URL)が変更されたりしている。新しく追加されたページ又はアドレスが変更されたページを検索する場合も、上述したように、大量のヒットページを調べる必要があり、手間がかかる。
【0008】
本発明は斯かる事情に鑑みてなされたものであり、検索システムから受信したヒットデータリストの中から、スコアが目標スコア以上のヒットデータを抽出することにより、出力を行うヒットデータ数を減少させることが可能な情報処理方法及びコンピュータプログラムを提供することを目的とする。
【0009】
また、本発明は、スコアが目標スコア以上のヒットデータを抽出できなかった場合、元の検索キーワードを含み、最高スコアが目標スコア以上の検索キーワードを出力することにより、再検索用の検索キーワードの決定を補助することが可能なコンピュータプログラムを提供することを他の目的とする。
【0010】
また、本発明は、定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリスト内のヒットデータを記憶部に記憶することにより、所定検索キーワードにヒットした目標スコア以上の新規ヒットデータの一覧を出力することが可能なコンピュータプログラムを提供することを他の目的とする。
【0011】
また、本発明は、アクセスできなくなったヒットデータに対して過去に行った検索に関する検索キーワード及び内容情報に基づいて、前記アクセスできなくなったヒットデータを検索することが可能なコンピュータプログラムを提供することを他の目的とする。
【0012】
【課題を解決するための手段】
第1発明に係る情報処理方法は、検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信及び出力する情報処理方法において、目標スコアを情報処理装置で受付けるステップと、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを情報処理装置で抽出するステップとを有し、前記抽出したヒットデータに関する情報を情報処理装置から出力することを特徴とする。
【0013】
第2発明に係るコンピュータプログラムは、コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、目標スコアを受付けさせる手順と、コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順とを含むことを特徴とする。
【0014】
第3発明に係るコンピュータプログラムは、コンピュータに、複数キーワードの組合せ又は1キーワードを含む検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを所定記憶領域に記憶させる手順と、コンピュータに、目標スコアを受付けさせる手順と、コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、コンピュータに、目標スコア以上のヒットデータが抽出できなかった場合、前記所定記憶領域から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを読出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報又は前記読出した検索キーワードを出力させる手順とを含むことを特徴とする。
【0015】
第4発明に係るコンピュータプログラムは、コンピュータに、所定検索キーワードを定期的に検索システムへ送信させ、送信した所定検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、目標スコアを受付けさせる手順と、コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報を所定記憶領域に記憶させる手順と、コンピュータに、前記所定記憶領域に新しく記憶されたヒットデータに関する情報を検出させる手順と、コンピュータに、前記検出したヒットデータに関する情報を出力させる手順とを含むことを特徴とする。
【0016】
第5発明に係るコンピュータプログラムは、コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータが含まれるヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを所定記憶領域に記憶させる手順と、コンピュータに、ヒットデータのアドレスを受付けさせる手順と、コンピュータに、前記受付けたアドレスに対応する内容情報及び検索キーワードを前記所定記憶領域から読出させる手順と、コンピュータに、前記読出した検索キーワードを検索システムへ送信させる手順と、コンピュータに、前記検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順とを含むことを特徴とする。
【0017】
第1又は第2発明においては、目標スコアを受付け、検索システムから受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出し、抽出したヒットデータに関する情報を出力する。一般的に、検索システムから受信したヒットデータリストは、大量のヒットデータを含むことが多く、また、スコアが高いほど、検索キーワードに関連の深い情報である場合が多い。大量のヒットデータを含むヒットデータリストの中から、スコアが目標スコア以上のヒットデータを抽出することにより、出力を行うヒットデータ数を減少することが可能である。また、抽出したヒットデータのスコアは目標スコア以上であり、出力を行うヒットデータは、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0018】
第3発明においては、検索システムから受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを記憶部に記憶する。目標スコアを受付け、検索システムから受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出し、抽出したヒットデータに関する情報を出力する。また、スコアが目標スコア以上のヒットデータを抽出できなかった場合は、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを前記記憶部から読出して、読出した検索キーワードを出力する。一般的に、スコアが高いヒットデータほど、検索キーワードに関連の深い情報であることが多く、ヒットデータリストに含まれるヒットデータのスコアのうちの最高スコアが目標スコアより低い場合は、検索キーワードに関連の深いヒットデータがあまり含まれていない可能性が高いと考えられる。出力を行った検索キーワードは、検索に使用した検索キーワードを含んでおり、絞込検索に使用できる検索キーワードであり、再検索の参考に用いることが可能である。また、前記出力を行った検索キーワードは、最高スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0019】
第4発明においては、目標スコアを受付け、定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出し、抽出したヒットデータに関する情報を記憶部に記憶する。記憶部に新しく記憶されたヒットデータに関する情報を検出し、検出したヒットデータに関する情報を出力する。定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリスト内のヒットデータを記憶部に記憶しているため、記憶部に新しく記憶されたヒットデータは、新規に検索されたヒットデータであり、所定検索キーワードにヒットした新規のヒットデータの一覧を出力することが可能である。また、記憶部に記憶されているヒットデータは、スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0020】
第5発明においては、検索システムから受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを記憶部に記憶する。ヒットデータのアドレスを受付け、受付けたアドレスのヒットデータの内容情報及び検索キーワードを記憶部から読出し、読出した検索キーワードを検索システムに送信する。検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出し、抽出したヒットデータを出力する。インターネットなどの不特定多数のサーバが接続された通信ネットワークにおいては、新規データが追加又は変更されるのは勿論、公開されていたデータが他のサーバに移転される場合も多く、今までアクセスできていたデータに急にアクセスできなくなることもある。アクセスできなくなったデータのアドレスが記憶部に記憶されている場合は、前記アクセスできなくなったヒットデータに対して過去に行った検索に関する検索キーワード及び内容情報が取得でき、取得した検索キーワードで再度検索を行うことが可能である。検索結果のうち、内容情報が前記取得した内容情報と類似しているヒットデータは、前記アクセスできなくなったデータのアドレス移動先である可能性が高い。
【0021】
【発明の実施の形態】
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
(第1の実施の形態)
図1に本発明に係る情報処理装置10の例を示す。情報処理装置10は、CPU(Central Processing Unit)11と、DRAM等のRAM(Random Access Memory)12と、ハードディスクドライブ(以下、ハードディスクと略す)13と、フレキシブルディスクドライブ又はCD−ROMドライブ等の外部記憶部14と、キーボード又はマウス等の入力部15と、表示装置又はプリンタ等の出力部16と、インターネットなどの通信ネットワーク22との通信制御を行う通信部17とを備える。
【0022】
CPU11は、上述した各部12〜17の制御を行う。また、CPU11は、入力部15又は通信部17から受付けたプログラム又はデータ、あるいはハードディスク13又は外部記憶部14から読出したプログラム又はデータ等をRAM12に記憶し、RAM12に記憶したプログラムの実行又はデータの演算等の各種処理を行い、各種処理結果又は各種処理に用いる一時的なデータをRAM12に記憶する。RAM12に記憶した演算結果等のデータは、CPU11により、ハードディスク13に記憶されたり、出力部16又は通信部17から出力される。
【0023】
通信ネットワーク22には、検索システム20が接続されている。検索システム20は、検索キーワードを受付け、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。本説明においては、検索システムは、受付けた検索キーワードにヒットした各ヒットデータにスコア(又はポイント)を付加している。スコアは、例えばヒットデータに含まれる検索キーワード数に応じて決定されたり、ヒットデータへのリンク数に応じて決定されるなど、検索システム毎に様々な方法で決定されており、一般的に、スコアが高いヒットデータは、スコアが低いヒットデータに比べて、検索キーワードに関連の深い情報である場合が多い。ヒットデータリスト内では、スコアが高い順にヒットデータが並べられている。
【0024】
情報処理装置10は、例えば入力部15で検索キーワードを受付け、入力部15で受付けた検索キーワードをCPU11の制御でRAM12に記憶して通信部17から検索システム20に送信する。また、情報処理装置10は、検索システム20から返信されたヒットデータリストを通信部17で受信し、受信したヒットデータリストをCPU11の制御でRAM12に記憶して出力部16に出力することが可能である。
【0025】
また、例えば通信部17でユーザ端末(通信ネットワーク22に接続されている図示しない端末装置)から検索キーワードを受付け、通信部17で受付けた検索キーワードをCPU11の制御でRAM12に記憶して通信部17から検索システム20に送信し、検索システム20から返信されたヒットデータリストを通信部17で受信し、受信したヒットデータリストをCPU11の制御でRAM12に記憶して通信部17から前記ユーザ端末に送信することも可能である。
【0026】
入力部15(又は通信部17)は、希望スコア(目標スコア)を受付ける手段として動作する。CPU11は、検索システム20から受信したヒットデータリストの中から、スコアが入力部15(又は通信部17)の受付けた希望スコア以上のヒットデータを抽出する手段として動作し、抽出したヒットデータに関する情報を出力部16に出力する(又は通信部17から送信する)。
【0027】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0028】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。本説明では、入力部15から検索キーワード及び希望スコア(目標スコア)を受付け、検索結果(ヒットデータリスト)を出力部15から出力するものとする。図2にデータ検索手順の例を示す。
【0029】
CPU11はハードディスク13に記憶されている検索画面をRAM12に読出して出力部16に出力するなどして、検索キーワード及び希望スコアを受付ける(S10)。検索画面の例を図3に示す。検索画面は、検索キーワードの入力欄32、希望スコアの入力欄34、検索ボタン36及びキャンセルボタン38などを有する。利用者は、例えば入力部15を操作して、入力欄32に検索キーワードを入力し、入力欄34に希望スコアを入力し、検索ボタン36をクリックする。検索ボタン36がクリックされた場合、CPU11の制御により、入力された検索キーワード及び希望スコアはRAM12に記憶されると共に、通信部17から検索システム20に送信される。
【0030】
情報処理装置10から検索キーワードを受付けた検索システム20は、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを情報処理装置10に返信する。通信部17が検索システム20から受付けた(S12)ヒットデータリストは、CPU11の制御によりRAM12に記憶される。CPU11は、RAM12に記憶したヒットデータリストの中からスコアが希望スコア以上のヒットデータを抽出し(S16)、抽出したヒットデータに関する各種情報をRAM12に記憶する(S18)。CPU11は、前記抽出したヒットデータの一覧を出力部16に出力する(S20)。
【0031】
例えば検索システム20が1〜100のスコアをヒットデータに付加しており、希望スコアが80で、ヒットデータリスト内の全ヒットデータ数が386、スコアが80以上のヒットデータ数が63の場合、CPU11により、386個のヒットデータの中から、スコアが80以上の63個のヒットデータが抽出され、出力部16に出力される。
【0032】
上述した第1の実施の形態においては、インターネットなどの通信ネットワーク22に接続された情報処理装置10及び検索システム20を例にして説明を行ったが、例えば情報処理装置10及び検索システム20は社内LAN(Local Area Network)などの通信ネットワークに接続されていてもよい。
【0033】
(第2の実施の形態)
図4(a)に本発明に係る情報処理装置10の例を示す。情報処理装置10は、第1の実施の形態(図1)と同様に、CPU11、RAM12、ハードディスク13、外部記憶部14、入力部15、出力部16及び通信部17を備え、通信部17は通信ネットワーク22を介して検索システム20と接続されている。検索システム20は、第1の実施の形態と同様に、検索キーワードを受付けて、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。各ヒットデータには、スコアが付加されている。
【0034】
本実施の形態では、通信ネットワーク22には、ユーザが操作するユーザ端末24が接続されており、情報処理装置10は、通信部17がユーザ端末24から受付けた検索キーワードを、CPU11の制御によって通信部17から検索システム20に送信し、検索システム20から受付けたヒットデータリストを、CPU11の制御によって通信部17から前記ユーザ端末24に出力(送信)する。
【0035】
ハードディスク13は、検索システム20から受信したヒットデータリストに含まれる各ヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを記憶する記憶部として動作する。本説明では、受信したヒットデータリストに含まれる各ヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを含む検索結果情報が、ハードディスク13に記憶されている。
【0036】
検索結果情報の例を図4(b)に示す。検索結果情報は、各検索キーワードに付与されたキーワードNo、検索に使用された検索キーワード(複数キーワードの組合せの場合もある)、前記検索キーワードにヒットしたヒットデータのうちの最高スコアなどを含む。CPU11は、通信部17が検索システム20からヒットデータリストを受信した場合、ヒットデータリストに含まれる各ヒットデータのスコアのうちの最高スコアを抽出し、抽出した最高スコアを検索キーワードと共に検索結果情報に登録する。
【0037】
通信部17は、希望スコア(目標スコア)を受付ける手段として動作する。また、CPU11は、通信部17が受信したヒットデータリストの中に、スコアが入力部15の受付けた希望スコア以上のヒットデータがある場合、スコアが希望スコア以上のヒットデータを抽出する手段、及び、スコアが前記希望スコア以上のヒットデータが無い場合は、ハードディスク13(検索結果情報)から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが前記希望スコア以上のヒットデータリストに対応する検索キーワードを読出す手段として動作し、抽出したヒットデータに関する情報又は読出した検索キーワードを通信部17からユーザ端末24に出力する。
【0038】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0039】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。図5にデータ検索手順の例を示す。
CPU11はハードディスク13に記憶されている検索画面を通信部17からユーザ端末24に送信するなどして、通信部17でユーザ端末24から検索キーワード及び希望スコア(目標スコア)を受付ける(S10)。利用者は、ユーザ端末を操作して、例えば図3に示した検索画面の入力欄32に検索キーワードを入力し、入力欄34に希望スコアを入力し、検索ボタン36をクリックする。検索ボタン36がクリックされた場合、ユーザ端末24から情報処理装置10に検索キーワード及び希望スコアが送信され、情報処理装置10の通信部17が受付けた検索キーワード及び希望スコアはCPU11の制御によってRAM12に記憶され、受付けた検索キーワードは通信部17から検索システム20に送信される。
【0040】
情報処理装置10から検索キーワードを受付けた検索システム20は、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを情報処理装置10に返信する。通信部17が検索システム20から受付けた(S12)ヒットデータリストは、CPU11の制御によりRAM12に記憶される。CPU11は、RAM12に記憶したヒットデータリストの最高スコアを抽出してRAM12に記憶し、検索キーワード及び抽出した最高スコアを検索結果情報に登録する。CPU11は、前記ヒットデータリストから抽出した最高スコアとユーザ端末24から受付けた希望スコアとを比較し、最高スコアが希望スコア以上の場合(S14:YES)、スコアが希望スコア以上のヒットデータを抽出し(S16)、抽出したヒットデータに関する各種情報をRAM12に記憶する(S18)。CPU11は、抽出したヒットデータの一覧を通信部17からユーザ端末24に出力する(S20)。
【0041】
最高スコアが希望スコアよりも低い場合(S14:NO)、CPU11は、受付けた検索キーワードを包含する他の検索キーワードを検索結果情報から読出す(S22)。前記他の検索キーワードが無い場合(S24:NO)は、処理を終了する。前記他の検索キーワードがある場合(S24:YES)、CPU11により、前記読出した他の検索キーワードに対応するヒットデータの最高スコアを検索結果情報から読出して、前記読出した検索キーワードと共にRAM12に記憶し、読出した最高スコアと希望スコアとを比較する。読出した最高スコアが希望スコアよりも低い場合(S26:NO)、処理を終了する。読出した最高スコアが希望スコア以上の場合(S26:YES)、CPU11は、最高スコア及び前記読出した他の検索キーワードを通信部17からユーザ端末24に出力する(S28)。
【0042】
読出した他の検索キーワード及び最高スコアの出力画面の例を図6に示す。図6の例では、図3に示した検索画面の下段に、読出した他の検索キーワード及び最高スコアが表示されている。読出した他の検索キーワード(図6では「aaaa」,「bbbb」及び「cccc」と、「aaaa」,「bbbb」及び「dddd」)は、通信部17でユーザ端末24から受付けた元の検索キーワード(図6では「aaaa」及び「bbbb」)を含んだ検索キーワードである。利用者は、読出した他の検索キーワード及び最高スコアを参考にして、前記読出した他の検索キーワード又は新たな検索キーワードを入力欄32に入力して再検索を行うことが可能である。
【0043】
(第3の実施の形態)
図7に本発明に係る情報処理装置10の例を示す。情報処理装置10は、第2の実施の形態(図4)と同様に、CPU11、RAM12、ハードディスク13、外部記憶部14、入力部15、出力部16及び通信部17を備え、通信部17は通信ネットワーク22を介して検索システム20及びユーザ端末24と接続されている。検索システム20は、第1の実施の形態と同様に、検索キーワードを受付けて、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。各ヒットデータにはスコアが付加されている。
【0044】
本実施の形態では、通信部17により、通信ネットワーク22に接続されたユーザ端末24から検索キーワード及び検索実行日時とを予め受付けておき、CPU11の制御により、受付けた検索実行日時に、受付けた検索キーワードを通信部17から検索システム20に送信し、検索を行う。また、CPU11の制御により、通信部17が検索システム20から受付けた検索結果(ヒットデータリスト)をハードディスク13に保存する。本説明では、インターネット上のウェブサイトを構成するHTML(Hyper Text Markup Language)データの検索を例にして説明を行う。各ヒットデータ(HTMLデータ)は、アドレス(URL:Universal Resource Locator)、タイトル及びテキスト(表示文字部分)を有する。
【0045】
通信部17は、ユーザ端末24から希望スコア(目標スコア)を受付ける手段として動作し、CPU11は、通信部17が受信したヒットデータリストの中から、スコアが通信部17の受付けた希望スコア以上のヒットデータを抽出する手段として動作し、ハードディスク13は、前記CPU11が抽出したヒットデータに関する情報を記憶する記憶部として動作する。また、CPU11は、ハードディスク13に新しく記憶されたヒットデータに関する情報を検出する手段として動作し、検出したヒットデータに関する情報を通信部17からユーザ端末24に出力(送信)する。
【0046】
ハードディスク13には、検索を行う利用者に関する利用者情報、利用者が指定した検索キーワード及び希望ヒット率などに関するキーワード情報、及び、利用者が指定した検索キーワードにヒットしたヒットデータに関するヒットデータ情報が記憶される。利用者情報の例を図8(a)に示す。利用者情報は、各利用者を識別する利用者No、利用者名、パスワード、電子メールアドレス、自動巡回頻度、巡回時刻などを含む。自動巡回頻度は、例えば毎日、毎週月曜日、又は、毎月10日などの頻度が設定される。利用者情報の「利用者名」、「パスワード」、「電子メールアドレス」、「自動巡回頻度」、「巡回時刻」などは、通信部17でユーザ端末24から受付けた設定に基づいて、CPU11で更新する。
【0047】
キーワード情報の例を図8(b)に示す。キーワード情報は、例えば利用者No、検索キーワード(複数キーワードの組合せの場合もあり)を識別するキーワードNo、検索キーワード、希望スコア、最高スコアなどを含む。キーワード情報の「検索キーワード」、「希望スコア」などは、通信部17でユーザ端末24から受付けた設定に基づいて、CPU11で更新する。また、キーワード情報の「最高スコア」は、例えば第2の実施の形態と同様にして、検索システム20から受付けたヒットデータリストに基づいてCPU11で更新することが可能である。
【0048】
ヒットデータ情報の例を図8(c)に示す。ヒットデータ情報は、例えば利用者No、ヒットデータを識別するヒットデータNo、ヒットデータ(HTMLデータ)のURL、ヒットデータのタイトル、ヒットデータの検索に使用したキーワードNo、ヒットデータのスコア、新着であるか否か(“1:新着”or“0:出力済み”)を示す新着フラグ、ヒットデータのテキストなどを含む。ヒットデータ情報の「URL」、「タイトル」、「キーワードNo」、「スコア」、「テキスト」は、例えば検索システム20から受付けたヒットデータリストに基づいてCPU11で更新することが可能である。また、ヒットデータ情報の「新着フラグ」は、例えば通信部17からユーザ端末24に出力する際、CPU11で“0”に更新することが可能である。
【0049】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0050】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。
検索キーワード、希望スコア、自動巡回頻度及び巡回時刻などの設定は、通信部17でユーザ端末24から受付け、CPU11によりハードディスク13の利用者情報又はキーワード情報に予め記憶されている。CPU11は、現日時を監視し、利用者情報に含まれる自動巡回頻度及び巡回時刻に達した場合は、自動巡回処理を行う。自動巡回処理の実行手順の例を図9に示す。
【0051】
CPU11は、ハードディスク13に記憶されているキーワード情報から、検索キーワード及び及び希望スコア(目標スコア)を読出して(S40)、RAM12に記憶する。CPU11の制御により、読出した検索キーワードは通信部17から検索システム20に送信される。情報処理装置10から検索キーワードを受付けた検索システム20は、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを情報処理装置10に送信する。通信部17が検索システム20から受付けた(S42)ヒットデータリストは、CPU11の制御によりRAM12に記憶される。
【0052】
CPU11は、RAM12に記憶したヒットデータリストの最高スコアを抽出してRAM12に記憶し、抽出した最高スコアと希望スコアとを比較し、最高スコアが希望スコア以上の場合(S44:YES)、スコアが希望スコア以上のヒットデータを抽出し(S46)、ヒットデータ情報に基づいて、前記抽出したヒットデータのURLが新規であるか否かを判定する。URLが新規な場合(S48:YES)、CPU11は、抽出したヒットデータに関する各種情報をヒットデータ情報(ただし、新着フラグは“1”)に記憶する(S50)。
【0053】
抽出したヒットデータを記憶(S50)した場合、最高スコアが希望スコアよりも低い場合(S44:NO)、又は、URLが新規でない場合(S48:NO)、CPU11は、キーワード情報を参照して他の検索キーワードの有無を判定する。他の検索キーワードがある場合(S52:YES)、同様の検索処理を行う。他の検索キーワードが無い場合(S52:NO)、CPU11は、新規ヒットデータ(新着フラグ=“1”)の一覧を通信部17からユーザ端末24に出力する(S54)。出力した新規ヒットデータの新着フラグは、CPU11により、“0”に更新される。
【0054】
前記抽出したヒットデータの出力画面の例を図10に示す。図10に示す例では、キーワード情報に含まれる検索キーワード及び希望スコアと、ヒットデータ情報に含まれる前記抽出したヒットデータ(HTMLデータ)のタイトル、スコア及びURLが表示されている。
【0055】
上述した第3の実施の形態においては、情報処理装置10の通信部17でユーザ端末24から利用者情報及びキーワード情報に関する各種設定を受付け、新着情報を通信部17からユーザ端末24に出力したが、第1の実施の形態(図1)と同様に、ユーザ端末24を使用せず、入力部15でユーザから利用者情報及びキーワード情報に関する各種設定を受付け、新着情報を出力部16に出力することも可能である。
【0056】
(第4の実施の形態)
図11に本発明に係る情報処理装置10の例を示す。情報処理装置10は、第2の実施の形態(図4)と同様に、CPU11、RAM12、ハードディスク13、外部記憶部14、入力部15、出力部16及び通信部17を備え、通信部17は通信ネットワーク22を介して検索システム20及びユーザ端末24と接続されている。検索システム20は、第1の実施の形態と同様に、検索キーワードを受付けて、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。
【0057】
本説明では、インターネット上のウェブサイトを構成するHTML(Hyper Text Markup Language)データの検索を例にして説明を行う。各ヒットデータ(HTMLデータ)は、URL(Universal Resource Locator)、タイトル及びテキスト(表示文字部分)を有する。本実施の形態において、ハードディスク13は、通信部17が検索システム20から受付けたヒットデータリストに含まれる各ヒットデータのアドレス、テキスト(内容情報)及び検索キーワードを含んだヒットデータ情報を記憶する記憶部として動作する。
【0058】
ヒットデータ情報の例を図12(a)に示す。ヒットデータ情報は、例えばヒットデータを識別するヒットデータNo、ヒットデータ(HTMLデータ)のURL、ヒットデータのタイトル、ヒットデータの検索に使用した検索キーワード(複数キーワードの組合せの場合もある)、ヒットデータのスコア、及び、ヒットデータのテキストなどを含む。ヒットデータ情報の「URL」、「タイトル」、「検索キーワード」、「スコア」、「テキスト」は、例えば検索システム20から受付けたヒットデータリストに基づいてCPU11で更新することが可能である。
【0059】
通信部17は、通信ネットワーク22に接続されたユーザ端末24から、ヒットデータ(HTMLデータ)のURL(アドレス)を受付ける手段として動作し、CPU11は、通信部17が受付けたURLのヒットデータに対応するテキスト(内容情報)及び検索キーワードをハードディスク(ヒットデータ情報)13から読出す手段、及び、読出した検索キーワードを通信部17から検索システム20に送信する手段として動作する。
【0060】
また、CPU11は、検索システム20から受信したヒットデータリストに含まれる各ヒットデータの中から、テキスト(内容情報)が前記読出したテキスト(内容情報)に類似するヒットデータを検出する手段として動作し、検出したヒットデータに関する情報をハードディスク13(URL変更情報)に記憶すると共に、通信部17からユーザ端末17に出力する。URL変更情報の例を図12(b)に示す。URL変更情報は、通信部17でユーザ端末24から受付けたURLのヒットデータのヒットデータNo、前記検出したヒットデータのURL(候補URL)及びタイトルを含む。
【0061】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0062】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。
CPU11は、通信部17でユーザ端末24から受付けた検索キーワードを通信部17から検索システム20に送信し、通信部17が検索システム20から受付けたヒットデータリストの各ヒットデータ(HTMLデータ)に関する情報及び検索キーワードをヒットデータ情報に記憶している。アクセスが不能になったURLの検索手順の例を図13に示す。
【0063】
CPU11は、通信部17でユーザ端末24からアクセス不能になったURLを受付けた(S60)場合、受付けたURLに関する検索キーワード及びテキストなどの各種情報をヒットデータ情報から読出して(S62)、RAM12に記憶する。前記受付けたURLに対応する検索キーワードを読出した場合(S64:YES)、CPU11により、前記読出した検索キーワードを通信部17から検索システム20に送信し、検索システム20からヒットデータリストを受付ける(S66)。検索キーワードを読出せなかった場合(S64:NO)は、処理を終了する。
【0064】
通信部17が検索システム20から受付けたヒットデータリストは、CPU11の制御により、RAM12に記憶され、候補URLの抽出が行われる(S68)。例えば、CPU11により、受付けたヒットデータリストの各ヒットデータのテキストを抽出してRAM12に記憶し、受付けたURLのヒットデータの中から、テキストが前記読出したテキストと類似するヒットデータを抽出する。テキストの類似は、テキスト内の文字一致部分の割合が所定値以上の場合、類似していると判定することが可能である。
【0065】
候補URLがある場合(S70:YES)、CPU11は、候補URLに関する情報をハードディスク13のURL変更情報に記憶すると共に、通信部17からユーザ端末24に出力する(S72)。候補URLがない場合(S70:NO)は、処理を終了する。候補URLに関する情報の出力画面の例を図14に示す。図14の例では、通信部17でユーザ端末24から受付けたURLと、受付けたURLに対応するヒットデータのタイトル及び検索キーワードと、候補URL及びタイトルが表示されている。
【0066】
上述した第1又は第2の実施の形態、第3の実施の形態及び第4の実施の形態は、3つのうちの任意の2つを組合せたり、3つ全てを組合せることが可能である。スコアは、検索システム側で各ヒットデータに付加する数値であり、検索システムごとに呼び名が変わる場合もあるが、数値が高いほどヒットデータリストの先頭側に配置される。また、スコアは、検索システム側が各ヒットデータに付加する指標であり、数値に限定はされず、例えば“A”〜“E”の5段階のレベルで表される場合、又は、棒グラフで表される場合などもある。
【0067】
(付記1) 検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信及び出力する情報処理方法において、
目標スコアを情報処理装置で受付けるステップと、
受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを情報処理装置で抽出するステップと
を有し、前記抽出したヒットデータに関する情報を情報処理装置から出力することを特徴とする情報処理方法。
(付記2) 検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信する情報処理システムにおいて、
前記情報処理装置は、
目標スコアを受付ける受付手段と、
検索システムから受信したヒットデータリストの中から、スコアが受付手段の受付けた目標スコア以上のヒットデータを抽出する抽出手段と
を備え、該抽出手段が抽出したヒットデータに関する情報を出力するように構成されていることを特徴とする情報処理システム。
(付記3) 検索キーワードを検索システムに送信する送信手段を備え、該送信手段が送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信する情報処理装置において、
目標スコアを受付ける受付手段と、
受信したヒットデータリストの中から、スコアが受付手段の受付けた目標スコア以上のヒットデータを抽出する抽出手段と
を備え、該抽出手段が抽出したヒットデータに関する情報を出力するように構成されていることを特徴とする情報処理装置。
(付記4) コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
(付記5) コンピュータに、複数キーワードの組合せ又は1キーワードを含む検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、目標スコア以上のヒットデータが抽出できなかった場合、前記所定記憶領域から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを読出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報又は前記読出した検索キーワードを出力させる手順と
を含むことを特徴とするコンピュータプログラム。
(付記6) コンピュータに、所定検索キーワードを定期的に検索システムへ送信させ、送信した所定検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を所定記憶領域に記憶させる手順と、
コンピュータに、前記所定記憶領域に新しく記憶されたヒットデータに関する情報を検出させる手順と、
コンピュータに、前記検出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
(付記7) コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータが含まれるヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、ヒットデータのアドレスを受付けさせる手順と、
コンピュータに、前記受付けたアドレスに対応する内容情報及び検索キーワードを前記所定記憶領域から読出させる手順と、
コンピュータに、前記読出した検索キーワードを検索システムへ送信させる手順と、
コンピュータに、前記検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
【0068】
【発明の効果】
第1又は第2発明によれば、検索システムから受信したヒットデータリストの中から、スコアが目標スコア以上のヒットデータを抽出することにより、出力を行うヒットデータ数を減少させることが可能である。また、抽出したヒットデータのスコアは目標スコアよりも高く、出力を行うヒットデータは、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0069】
第3発明によれば、スコアが目標スコア以上のヒットデータを抽出できなかった場合、検索に使用した検索キーワードを含み、最高スコアが目標スコア以上の検索キーワードを過去の検索結果から取得して出力することにより、再検索用の検索キーワードの決定を補助することが可能である。また、前記出力を行った検索キーワードは、最高スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0070】
第4発明によれば、定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリストから、スコアが目標スコア以上のヒットデータを抽出して記憶部に記憶することにより、所定検索キーワードにヒットした新規のヒットデータの一覧を出力することが可能である。また、前記出力される新規のヒットデータは、スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0071】
第5発明によれば、検索システムから受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを記憶部に記憶しておくことにより、アクセスできなくなったヒットデータに対して過去に行った検索に関する検索キーワード及び内容情報を記憶部から取得することができ、取得した検索キーワード及び内容情報に基づいて、アクセスできなくなったヒットデータを検索することが可能である。
【図面の簡単な説明】
【図1】本発明に係る情報処理装置の例を示すブロック図である。
【図2】データ検索手順の例を示すフローチャートである。
【図3】検索画面の例を示す図である。
【図4】(a)は本発明に係る情報処理装置の例を示すブロック図であり、(b)は検索結果情報の例を示す図である。
【図5】データ検索手順の例を示すフローチャートである。
【図6】出力画面の例を示す図である。
【図7】本発明に係る情報処理装置の例を示すブロック図である。
【図8】(a)は利用者情報の例を示す図であり、(b)はキーワード情報の例を示す図であり、(c)はヒットデータ情報の例を示す図である。
【図9】自動巡回処理の実行手順の例を示すフローチャートである。
【図10】出力画面の例を示す図である。
【図11】本発明に係る情報処理装置の例を示すブロック図である。
【図12】(a)はヒットデータ情報の例を示す図であり、(b)はURL変更情報の例を示す図である。
【図13】アクセスが不能になったURLの検索手順の例を示すフローチャートである。
【図14】出力画面の例を示す図である。
【符号の説明】
10 情報処理装置
11 CPU
12 RAM
13 ハードディスク(記憶部)
14 外部記憶部
15 入力部
16 出力部
17 通信部
20 検索システム
22 通信ネットワーク
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an information processing method of transmitting a search keyword from an information processing apparatus to a search system, and receiving and outputting, by the information processing apparatus, a hit data list in which a score is added to hit data hitting the transmitted search keyword, and The present invention relates to a computer program that causes a computer to transmit a search keyword and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword.
[0002]
[Prior art]
With the spread of the Internet, the opportunity to search for necessary information from the Internet tends to increase. When searching for necessary information, access a search site and enter a search keyword related to the required information to perform a search. However, the amount of information on the Internet is enormous, and a large amount of data (web page) hits a search keyword in many cases. When there is a large amount of hit data (hit pages), it becomes necessary to reconsider the search keyword or to repeat the search many times.
[0003]
Some search sites add a score (or point) uniquely calculated by the search site to each hit data (hit page) so that the user can browse the hit data with reference to the score. There are places. The score is determined by each search site independently, for example, based on the number of search keywords in the hit data or based on the number of links to the hit data.In general, the higher the score, the higher the score In many cases, the information is closely related to the search keyword.
[0004]
Also, there is a method of assisting the input of a search keyword by creating a database of search keywords input in the past and displaying a search keyword candidate list that matches forward with the character input by the user (for example, see Patent Document 1). .
[0005]
[Patent Document 1]
JP 2001-249933 A
[0006]
[Problems to be solved by the invention]
By adding a score to each hit page, each hit page can be browsed with reference to the score. However, the user receives a hit page list including a large number of hit pages as in the related art. In the method of displaying the search keyword candidate list, only the input efficiency of the search keyword is improved, and the user receives a hit page list including a large number of hit pages as in the related art.
[0007]
In addition, information in the Internet changes every day, and new pages are added or addresses (URLs) are changed. When searching for a newly added page or a page whose address has been changed, as described above, it is necessary to check a large number of hit pages, which is troublesome.
[0008]
The present invention has been made in view of such circumstances, and reduces the number of hit data to be output by extracting hit data whose score is equal to or more than a target score from a hit data list received from a search system. It is an object of the present invention to provide an information processing method and a computer program capable of performing the same.
[0009]
Further, according to the present invention, when hit data whose score is equal to or higher than the target score cannot be extracted, the search keyword including the original search keyword and having the highest score equal to or higher than the target score is output, so that the search keyword for re-search is output. Another object is to provide a computer program capable of assisting a decision.
[0010]
In addition, the present invention periodically transmits a predetermined search keyword to a search system and stores hit data in a hit data list received from the search system in a storage unit, so that a target score equal to or more than a target score hit by the predetermined search keyword is obtained. It is another object to provide a computer program capable of outputting a list of new hit data.
[0011]
Further, the present invention provides a computer program capable of searching for the inaccessible hit data based on a search keyword and content information relating to a search performed in the past for the inaccessible hit data. For other purposes.
[0012]
[Means for Solving the Problems]
An information processing method according to a first invention transmits a search keyword from an information processing apparatus to a search system, and receives and outputs a hit data list in which a score is added to hit data hit by the transmitted search keyword. In the information processing method, a target score is received by the information processing device, and, from the received hit data list, the information processing device has a step of extracting hit data whose score is equal to or greater than the received target score by the information processing device, The information on the extracted hit data is output from an information processing device.
[0013]
A computer program according to a second aspect of the present invention is a computer program that causes a computer to transmit a search keyword to a search system and receive a hit data list in which a score is added to hit data hit by the transmitted search keyword. Receiving the target score, causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score, and causing the computer to output information on the extracted hit data. And a procedure.
[0014]
A computer program according to a third aspect of the present invention causes a computer to transmit a search keyword including a combination of a plurality of keywords or one keyword to a search system, and generates a hit data list in which a score is added to hit data hit by the transmitted search keyword. In the computer program to be received, a procedure for causing the computer to store the highest score among the scores of the hit data included in the received hit data list and a search keyword corresponding to the hit data list in a predetermined storage area; A step of receiving a score; and a step of causing a computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score. If so, from the predetermined storage area, a step of causing the computer to read a search keyword corresponding to the hit data list including the search keyword corresponding to the received hit data list and having the highest score equal to or higher than the target score, Outputting information on the extracted hit data or the read search keyword.
[0015]
A computer program according to a fourth aspect of the present invention causes a computer to periodically transmit a predetermined search keyword to a search system, and to receive a hit data list in which a score is added to hit data that hits the transmitted predetermined search keyword. A step of causing the computer to receive a target score; a step of causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score; and A step of storing information about the hit data newly stored in the predetermined storage area, and a step of causing the computer to output information about the detected hit data. Including It is characterized in.
[0016]
A computer program according to a fifth aspect of the present invention is a computer program for causing a computer to transmit a search keyword to a search system and to receive a hit data list including hit data hit by the transmitted search keyword. A procedure for storing the address of the hit data, the content information, and the search keyword included in the list in a predetermined storage area; a procedure for causing the computer to accept the address of the hit data; A step of reading a search keyword from the predetermined storage area, a step of causing a computer to transmit the read search keyword to a search system, and a step of causing the computer to search for hit data received in response to the transmission of the search keyword. A step of extracting, from among the hit data included in the list, hit data whose content information is similar to the read content information, and a step of causing a computer to output information relating to the extracted hit data. I do.
[0017]
In the first or second invention, a target score is received, hit data whose score is equal to or greater than the received target score is extracted from the hit data list received from the search system, and information on the extracted hit data is output. . In general, the hit data list received from the search system often includes a large amount of hit data, and the higher the score, the more often the information is related to the search keyword. The number of hit data to be output can be reduced by extracting hit data whose score is equal to or greater than the target score from a hit data list including a large amount of hit data. The score of the extracted hit data is equal to or higher than the target score, and it is considered that the hit data to be output is likely to be information closely related to the search keyword.
[0018]
In the third invention, the highest score among the scores of the hit data included in the hit data list received from the search system and the search keyword corresponding to the hit data list are stored in the storage unit. A target score is received, hit data having a score equal to or higher than the received target score is extracted from the hit data list received from the search system, and information on the extracted hit data is output. If the hit data whose score is equal to or more than the target score cannot be extracted, the search keyword including the search keyword corresponding to the received hit data list and the highest score corresponding to the hit data list whose target score is equal to or more than the target score is used. The search keyword is read from the storage unit, and the read search keyword is output. In general, hit data with a higher score is often more relevant to the search keyword, and if the highest score among the hit data included in the hit data list is lower than the target score, It is highly likely that the hit data that is closely related is not included much. The output search keyword includes the search keyword used for the search, is a search keyword that can be used for a refined search, and can be used as a reference for a re-search. Further, it is considered that the output search keyword has the highest score equal to or higher than the target score, and is likely to be information closely related to the search keyword.
[0019]
In the fourth invention, a target score is received, a predetermined search keyword is periodically transmitted to a search system, and hit data whose score is equal to or greater than the received target score is extracted from a hit data list received from the search system. Then, information on the extracted hit data is stored in the storage unit. The information on the hit data newly stored in the storage unit is detected, and the information on the detected hit data is output. Since the predetermined search keyword is periodically transmitted to the search system and the hit data in the hit data list received from the search system is stored in the storage unit, the hit data newly stored in the storage unit is newly searched. It is possible to output a list of new hit data that hit the predetermined search keyword. The hit data stored in the storage unit has a score equal to or higher than the target score, and is considered to be highly likely to be information closely related to the search keyword.
[0020]
In the fifth invention, the address, the content information, and the search keyword of the hit data included in the hit data list received from the search system are stored in the storage unit. The address of the hit data is received, the content information of the hit data at the received address and the search keyword are read from the storage unit, and the read search keyword is transmitted to the search system. Hit data whose content information is similar to the read content information is extracted from hit data included in the hit data list received in response to the transmission of the search keyword, and the extracted hit data is output. In a communication network to which an unspecified number of servers such as the Internet are connected, not only new data is added or changed, but also published data is often transferred to another server, and it is possible to access until now. You may suddenly lose access to your data. In the case where the address of the inaccessible data is stored in the storage unit, a search keyword and content information relating to a search performed in the past with respect to the hit data inaccessible can be obtained, and the search is performed again using the obtained search keyword. It is possible to do. Of the search results, hit data whose content information is similar to the acquired content information is highly likely to be the address destination of the inaccessible data.
[0021]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be specifically described with reference to the drawings showing the embodiments.
(First Embodiment)
FIG. 1 shows an example of an information processing apparatus 10 according to the present invention. The information processing apparatus 10 includes a CPU (Central Processing Unit) 11, a RAM (Random Access Memory) 12 such as a DRAM, a hard disk drive (hereinafter abbreviated as a hard disk) 13, and an external device such as a flexible disk drive or a CD-ROM drive. The storage unit 14 includes an input unit 15 such as a keyboard or a mouse, an output unit 16 such as a display device or a printer, and a communication unit 17 that controls communication with a communication network 22 such as the Internet.
[0022]
The CPU 11 controls each of the units 12 to 17 described above. The CPU 11 stores the program or data received from the input unit 15 or the communication unit 17 or the program or data read from the hard disk 13 or the external storage unit 14 in the RAM 12, and executes the program or data of the program stored in the RAM 12. Various processes such as calculation are performed, and various process results or temporary data used for various processes are stored in the RAM 12. Data such as a calculation result stored in the RAM 12 is stored in the hard disk 13 by the CPU 11 or output from the output unit 16 or the communication unit 17.
[0023]
The search system 20 is connected to the communication network 22. The search system 20 accepts the search keyword and returns a hit data list that is a list of hit data that hit the received search keyword. In the present description, the search system adds a score (or point) to each hit data that hits the received search keyword. The score is determined by various methods for each search system, for example, is determined according to the number of search keywords included in the hit data, or determined according to the number of links to the hit data. Hit data with a high score is often more relevant to a search keyword than hit data with a low score. In the hit data list, hit data is arranged in descending order of the score.
[0024]
The information processing apparatus 10 receives, for example, a search keyword at the input unit 15, stores the search keyword received at the input unit 15 in the RAM 12 under the control of the CPU 11, and transmits the search keyword from the communication unit 17 to the search system 20. In addition, the information processing apparatus 10 can receive the hit data list returned from the search system 20 by the communication unit 17, store the received hit data list in the RAM 12 under the control of the CPU 11, and output the hit data list to the output unit 16. It is.
[0025]
Further, for example, the communication unit 17 receives a search keyword from a user terminal (a terminal device (not shown) connected to the communication network 22), and stores the search keyword received by the communication unit 17 in the RAM 12 under the control of the CPU 11. To the search system 20, the hit data list returned from the search system 20 is received by the communication unit 17, the received hit data list is stored in the RAM 12 under the control of the CPU 11, and transmitted from the communication unit 17 to the user terminal. It is also possible.
[0026]
The input unit 15 (or the communication unit 17) operates as a unit that receives a desired score (target score). The CPU 11 operates as a means for extracting, from the hit data list received from the search system 20, hit data whose score is equal to or higher than the desired score received by the input unit 15 (or the communication unit 17), and information on the extracted hit data. Is output to the output unit 16 (or transmitted from the communication unit 17).
[0027]
By reading out the computer program recorded on the recording medium 19 such as a CD-ROM in the external storage unit 14 and storing it in the hard disk 13 or the RAM 12 and causing the CPU 11 to execute the same, the CPU 11 can operate as the above-described units. is there. Further, the communication unit 17 can receive a computer program from another device and store the computer program in the hard disk 13 or the RAM 12.
[0028]
Next, a data search using the information processing apparatus according to the present invention will be described. In this description, it is assumed that a search keyword and a desired score (target score) are received from the input unit 15 and a search result (hit data list) is output from the output unit 15. FIG. 2 shows an example of the data search procedure.
[0029]
The CPU 11 receives the search keyword and the desired score by reading the search screen stored in the hard disk 13 into the RAM 12 and outputting it to the output unit 16 (S10). FIG. 3 shows an example of the search screen. The search screen includes a search keyword input field 32, a desired score input field 34, a search button 36, a cancel button 38, and the like. For example, the user operates the input unit 15 to input a search keyword in the input field 32, input a desired score in the input field 34, and click a search button 36. When the search button 36 is clicked, the input search keyword and desired score are stored in the RAM 12 and transmitted from the communication unit 17 to the search system 20 under the control of the CPU 11.
[0030]
The search system 20 that has received the search keyword from the information processing device 10 returns a hit data list, which is a list of hit data that has hit the received search keyword, to the information processing device 10. The hit data list received by the communication unit 17 from the search system 20 (S12) is stored in the RAM 12 under the control of the CPU 11. The CPU 11 extracts hit data whose score is equal to or greater than the desired score from the hit data list stored in the RAM 12 (S16), and stores various information on the extracted hit data in the RAM 12 (S18). The CPU 11 outputs the list of the extracted hit data to the output unit 16 (S20).
[0031]
For example, when the search system 20 adds a score of 1 to 100 to hit data, the desired score is 80, the total number of hit data in the hit data list is 386, and the number of hit data with a score of 80 or more is 63, The CPU 11 extracts 63 hit data having a score of 80 or more from the 386 hit data, and outputs the data to the output unit 16.
[0032]
In the first embodiment, the information processing apparatus 10 and the search system 20 connected to the communication network 22 such as the Internet have been described as examples. It may be connected to a communication network such as a LAN (Local Area Network).
[0033]
(Second embodiment)
FIG. 4A shows an example of the information processing apparatus 10 according to the present invention. The information processing apparatus 10 includes a CPU 11, a RAM 12, a hard disk 13, an external storage unit 14, an input unit 15, an output unit 16, and a communication unit 17, as in the first embodiment (FIG. 1). The search system 20 is connected via a communication network 22. As in the first embodiment, the search system 20 receives a search keyword and returns a hit data list, which is a list of hit data that hit the received search keyword. A score is added to each hit data.
[0034]
In the present embodiment, a user terminal 24 operated by a user is connected to the communication network 22, and the information processing apparatus 10 communicates the search keyword received from the user terminal 24 by the communication unit 17 under the control of the CPU 11. The hit data list transmitted from the search unit 17 to the search system 20 and received from the search system 20 is output (transmitted) from the communication unit 17 to the user terminal 24 under the control of the CPU 11.
[0035]
The hard disk 13 operates as a storage unit that stores the highest score among the scores of each hit data included in the hit data list received from the search system 20, and the search keyword corresponding to the hit data list. In this description, the hard disk 13 stores the highest score among the scores of each hit data included in the received hit data list and the search result information including the search keyword corresponding to the hit data list.
[0036]
FIG. 4B shows an example of the search result information. The search result information includes the keyword No. assigned to each search keyword, the search keyword used in the search (may be a combination of a plurality of keywords), the highest score among the hit data hitting the search keyword, and the like. When the communication unit 17 receives the hit data list from the search system 20, the CPU 11 extracts the highest score among the scores of each hit data included in the hit data list, and extracts the extracted highest score together with the search keyword and the search result information. Register with.
[0037]
The communication unit 17 operates as a means for receiving a desired score (target score). If the hit data list received by the communication unit 17 includes hit data whose score is equal to or greater than the desired score received by the input unit 15, the CPU 11 extracts hit data whose score is equal to or greater than the desired score; If there is no hit data whose score is equal to or greater than the desired score, the hit data list including the search keyword corresponding to the received hit data list from the hard disk 13 (search result information) and having the highest score equal to or greater than the desired score And outputs information on the extracted hit data or the read search keyword from the communication unit 17 to the user terminal 24.
[0038]
By reading out the computer program recorded on the recording medium 19 such as a CD-ROM in the external storage unit 14 and storing it in the hard disk 13 or the RAM 12 and causing the CPU 11 to execute the same, the CPU 11 can operate as the above-described units. is there. Further, the communication unit 17 can receive a computer program from another device and store the computer program in the hard disk 13 or the RAM 12.
[0039]
Next, a data search using the information processing apparatus according to the present invention will be described. FIG. 5 shows an example of the data search procedure.
The CPU 11 transmits the search screen stored in the hard disk 13 from the communication unit 17 to the user terminal 24, and receives the search keyword and the desired score (target score) from the user terminal 24 in the communication unit 17 (S10). The user operates the user terminal to input a search keyword in the input box 32 of the search screen shown in FIG. 3, input a desired score in the input box 34, and click the search button 36, for example. When the search button 36 is clicked, the search keyword and the desired score are transmitted from the user terminal 24 to the information processing device 10, and the search keyword and the desired score received by the communication unit 17 of the information processing device 10 are stored in the RAM 12 under the control of the CPU 11. The stored and accepted search keywords are transmitted from the communication unit 17 to the search system 20.
[0040]
The search system 20 that has received the search keyword from the information processing device 10 returns a hit data list, which is a list of hit data that has hit the received search keyword, to the information processing device 10. The hit data list received by the communication unit 17 from the search system 20 (S12) is stored in the RAM 12 under the control of the CPU 11. The CPU 11 extracts the highest score of the hit data list stored in the RAM 12, stores the highest score in the RAM 12, and registers the search keyword and the extracted highest score in the search result information. The CPU 11 compares the highest score extracted from the hit data list with the desired score received from the user terminal 24, and if the highest score is equal to or higher than the desired score (S14: YES), extracts hit data whose score is equal to or higher than the desired score. Then, various information related to the extracted hit data is stored in the RAM 12 (S18). The CPU 11 outputs a list of the extracted hit data from the communication unit 17 to the user terminal 24 (S20).
[0041]
When the highest score is lower than the desired score (S14: NO), the CPU 11 reads another search keyword including the received search keyword from the search result information (S22). If there is no other search keyword (S24: NO), the process ends. If there is another search keyword (S24: YES), the CPU 11 reads out the highest score of hit data corresponding to the read another search keyword from the search result information and stores it in the RAM 12 together with the read search keyword. Then, the read highest score is compared with the desired score. If the read highest score is lower than the desired score (S26: NO), the process is terminated. If the read highest score is equal to or higher than the desired score (S26: YES), the CPU 11 outputs the highest score and the read other search keyword from the communication unit 17 to the user terminal 24 (S28).
[0042]
FIG. 6 shows an example of an output screen of another read keyword and the highest score. In the example of FIG. 6, the read other search keywords and the highest score are displayed in the lower part of the search screen shown in FIG. The other read search keywords (“aaaa”, “bbbb”, and “cccc”, and “aaaa”, “bbbb”, and “dddd” in FIG. 6) are the same as the original search keyword received from the user terminal 24 by the communication unit 17. This is a search keyword that includes a keyword (“aaa” and “bbbb” in FIG. 6). The user can input the read other search keyword or a new search keyword in the input field 32 with reference to the read other search keywords and the highest score, and perform a search again.
[0043]
(Third embodiment)
FIG. 7 shows an example of the information processing apparatus 10 according to the present invention. The information processing apparatus 10 includes a CPU 11, a RAM 12, a hard disk 13, an external storage unit 14, an input unit 15, an output unit 16, and a communication unit 17, as in the second embodiment (FIG. 4). It is connected to a search system 20 and a user terminal 24 via a communication network 22. As in the first embodiment, the search system 20 receives a search keyword and returns a hit data list, which is a list of hit data that hit the received search keyword. A score is added to each hit data.
[0044]
In the present embodiment, the search keyword and the search execution date and time are received in advance from the user terminal 24 connected to the communication network 22 by the communication unit 17, and the received search execution date and time are received under the control of the CPU 11 under the control of the CPU 11. The keyword is transmitted from the communication unit 17 to the search system 20, and the search is performed. Further, under the control of the CPU 11, the search result (hit data list) received by the communication unit 17 from the search system 20 is stored in the hard disk 13. In this description, an example will be described in which HTML (Hyper Text Markup Language) data constituting a website on the Internet is searched. Each hit data (HTML data) has an address (URL: Universal Resource Locator), a title, and a text (display character portion).
[0045]
The communication unit 17 operates as a unit that receives a desired score (target score) from the user terminal 24. The CPU 11 determines, from the hit data list received by the communication unit 17, that the score is equal to or greater than the desired score received by the communication unit 17. The hard disk 13 operates as a unit that extracts hit data, and the hard disk 13 operates as a storage unit that stores information about the hit data extracted by the CPU 11. Further, the CPU 11 operates as means for detecting information on hit data newly stored in the hard disk 13, and outputs (transmits) information on the detected hit data from the communication unit 17 to the user terminal 24.
[0046]
The hard disk 13 stores user information relating to a user performing a search, keyword information relating to a search keyword designated by the user, a desired hit rate, and the like, and hit data information relating to hit data that has hit a search keyword designated by the user. It is memorized. FIG. 8A shows an example of the user information. The user information includes a user number for identifying each user, a user name, a password, an e-mail address, an automatic patrol frequency, a patrol time, and the like. As the automatic patrol frequency, for example, a frequency such as every day, every Monday, or every tenth is set. The user information “user name”, “password”, “e-mail address”, “automatic tour frequency”, “tour time”, and the like are determined by the CPU 11 based on the settings received from the user terminal 24 by the communication unit 17. Update.
[0047]
FIG. 8B shows an example of the keyword information. The keyword information includes, for example, a user number, a keyword number for identifying a search keyword (in some cases, a combination of a plurality of keywords), a search keyword, a desired score, a highest score, and the like. The keyword information “search keyword”, “desired score”, and the like are updated by the CPU 11 based on the settings received from the user terminal 24 by the communication unit 17. The “highest score” of the keyword information can be updated by the CPU 11 based on the hit data list received from the search system 20, for example, in the same manner as in the second embodiment.
[0048]
FIG. 8C shows an example of hit data information. The hit data information includes, for example, a user No., a hit data No. identifying the hit data, a URL of the hit data (HTML data), a title of the hit data, a keyword No. used for searching the hit data, a score of the hit data, and a new arrival. A new arrival flag indicating whether or not there is (“1: new arrival” or “0: already output”), a text of hit data, and the like are included. The hit data information “URL”, “title”, “keyword No”, “score”, and “text” can be updated by the CPU 11 based on the hit data list received from the search system 20, for example. Also, the “new arrival flag” of the hit data information can be updated to “0” by the CPU 11 when it is output from the communication unit 17 to the user terminal 24, for example.
[0049]
By reading out the computer program recorded on the recording medium 19 such as a CD-ROM in the external storage unit 14 and storing it in the hard disk 13 or the RAM 12 and causing the CPU 11 to execute the same, the CPU 11 can operate as the above-described units. is there. Further, the communication unit 17 can receive a computer program from another device and store the computer program in the hard disk 13 or the RAM 12.
[0050]
Next, a data search using the information processing apparatus according to the present invention will be described.
Settings such as a search keyword, a desired score, an automatic tour frequency, and a tour time are received from the user terminal 24 by the communication unit 17 and stored in advance in the user information or the keyword information of the hard disk 13 by the CPU 11. The CPU 11 monitors the current date and time, and performs an automatic tour process when the automatic tour frequency and the tour time included in the user information have been reached. FIG. 9 shows an example of an execution procedure of the automatic patrol process.
[0051]
The CPU 11 reads out a search keyword and a desired score (target score) from the keyword information stored in the hard disk 13 (S40), and stores it in the RAM 12. Under the control of the CPU 11, the read search keyword is transmitted from the communication unit 17 to the search system 20. The search system 20 that has received the search keyword from the information processing device 10 transmits a hit data list that is a list of hit data that has hit the received search keyword to the information processing device 10. The hit data list received by the communication unit 17 from the search system 20 (S42) is stored in the RAM 12 under the control of the CPU 11.
[0052]
The CPU 11 extracts the highest score of the hit data list stored in the RAM 12, stores the highest score in the RAM 12, compares the extracted highest score with the desired score, and if the highest score is equal to or more than the desired score (S44: YES), the score is Hit data having a desired score or higher is extracted (S46), and it is determined based on the hit data information whether or not the URL of the extracted hit data is new. If the URL is new (S48: YES), the CPU 11 stores various information related to the extracted hit data in hit data information (however, the new arrival flag is "1") (S50).
[0053]
When the extracted hit data is stored (S50), when the highest score is lower than the desired score (S44: NO), or when the URL is not new (S48: NO), the CPU 11 refers to the keyword information and performs other processing. The presence or absence of the search keyword is determined. When there is another search keyword (S52: YES), a similar search process is performed. When there is no other search keyword (S52: NO), the CPU 11 outputs a list of new hit data (new arrival flag = “1”) from the communication unit 17 to the user terminal 24 (S54). The CPU 11 updates the new arrival flag of the output new hit data to “0”.
[0054]
FIG. 10 shows an example of an output screen of the extracted hit data. In the example shown in FIG. 10, a search keyword and a desired score included in the keyword information, and a title, a score, and a URL of the extracted hit data (HTML data) included in the hit data information are displayed.
[0055]
In the above-described third embodiment, the communication unit 17 of the information processing apparatus 10 receives various settings related to user information and keyword information from the user terminal 24, and outputs new arrival information to the user terminal 24 from the communication unit 17. As in the first embodiment (FIG. 1), the input unit 15 accepts various settings relating to user information and keyword information from the user without using the user terminal 24, and outputs new arrival information to the output unit 16. It is also possible.
[0056]
(Fourth embodiment)
FIG. 11 shows an example of the information processing apparatus 10 according to the present invention. The information processing apparatus 10 includes a CPU 11, a RAM 12, a hard disk 13, an external storage unit 14, an input unit 15, an output unit 16, and a communication unit 17, as in the second embodiment (FIG. 4). It is connected to a search system 20 and a user terminal 24 via a communication network 22. As in the first embodiment, the search system 20 receives a search keyword and returns a hit data list, which is a list of hit data that hit the received search keyword.
[0057]
In this description, an example will be described in which HTML (Hyper Text Markup Language) data constituting a website on the Internet is searched. Each hit data (HTML data) has a URL (Universal Resource Locator), a title, and a text (display character portion). In the present embodiment, the hard disk 13 stores hit data information including the address, text (content information), and search keyword of each hit data included in the hit data list received from the search system 20 by the communication unit 17. Act as a unit.
[0058]
FIG. 12A shows an example of hit data information. The hit data information includes, for example, hit data No for identifying hit data, URL of hit data (HTML data), title of hit data, search keyword used for search of hit data (may be a combination of plural keywords), hit It includes the score of the data and the text of the hit data. The “URL”, “title”, “search keyword”, “score”, and “text” of the hit data information can be updated by the CPU 11 based on the hit data list received from the search system 20, for example.
[0059]
The communication unit 17 operates as a unit that receives a URL (address) of hit data (HTML data) from the user terminal 24 connected to the communication network 22, and the CPU 11 responds to the hit data of the URL received by the communication unit 17. It operates as a means for reading out text (content information) and a search keyword to be performed from the hard disk (hit data information) 13 and a means for transmitting the read out search keyword from the communication unit 17 to the search system 20.
[0060]
Further, the CPU 11 operates as means for detecting, from each hit data included in the hit data list received from the search system 20, hit data whose text (content information) is similar to the read text (content information). The information on the detected hit data is stored in the hard disk 13 (URL change information), and is output from the communication unit 17 to the user terminal 17. FIG. 12B shows an example of the URL change information. The URL change information includes the hit data No. of the hit data of the URL received by the communication unit 17 from the user terminal 24, the URL of the hit data detected (candidate URL), and the title.
[0061]
By reading out the computer program recorded on the recording medium 19 such as a CD-ROM in the external storage unit 14 and storing it in the hard disk 13 or the RAM 12 and causing the CPU 11 to execute the same, the CPU 11 can operate as the above-described units. is there. Further, the communication unit 17 can receive a computer program from another device and store the computer program in the hard disk 13 or the RAM 12.
[0062]
Next, a data search using the information processing apparatus according to the present invention will be described.
The CPU 11 transmits the search keyword received from the user terminal 24 by the communication unit 17 to the search system 20 from the communication unit 17, and information on each hit data (HTML data) in the hit data list received from the search system 20 by the communication unit 17. And the search keyword are stored in the hit data information. FIG. 13 shows an example of a procedure for searching for a URL that has become inaccessible.
[0063]
When the communication unit 17 receives the URL that has become inaccessible from the user terminal 24 in the communication unit 17 (S60), the CPU 11 reads various information such as a search keyword and a text related to the received URL from the hit data information (S62), and stores it in the RAM 12. Remember. When the search keyword corresponding to the received URL is read (S64: YES), the CPU 11 transmits the read search keyword from the communication unit 17 to the search system 20, and receives a hit data list from the search system 20 (S66). ). If the search keyword has not been read (S64: NO), the process ends.
[0064]
The hit data list received by the communication unit 17 from the search system 20 is stored in the RAM 12 under the control of the CPU 11, and a candidate URL is extracted (S68). For example, the CPU 11 extracts the text of each hit data in the received hit data list, stores the text in the RAM 12, and extracts hit data whose text is similar to the read text from the hit data of the received URL. Text similarity can be determined to be similar if the proportion of character matching portions in the text is greater than or equal to a predetermined value.
[0065]
If there is a candidate URL (S70: YES), the CPU 11 stores information on the candidate URL in the URL change information of the hard disk 13, and outputs the information from the communication unit 17 to the user terminal 24 (S72). If there is no candidate URL (S70: NO), the process ends. FIG. 14 shows an example of an output screen of information on the candidate URL. In the example of FIG. 14, the URL received from the user terminal 24 by the communication unit 17, the title and search keyword of the hit data corresponding to the received URL, and the candidate URL and title are displayed.
[0066]
In the first or second embodiment, the third embodiment, and the fourth embodiment, any two of the three can be combined or all three can be combined. . The score is a numerical value added to each hit data on the search system side, and the name may change for each search system. However, the higher the numerical value, the higher the score is placed at the head of the hit data list. The score is an index added to each hit data by the search system, and is not limited to a numerical value. For example, the score is represented by five levels of “A” to “E”, or is represented by a bar graph. There are some cases.
[0067]
(Supplementary Note 1) In an information processing method, a search keyword is transmitted from an information processing apparatus to a search system, and a hit data list in which a score is added to hit data hit by the transmitted search keyword is received and output by the information processing apparatus.
Receiving the target score by the information processing device;
Extracting, from the received hit data list, hit data whose score is equal to or greater than the received target score by the information processing device;
An information processing method comprising: outputting information on the extracted hit data from an information processing apparatus.
(Supplementary Note 2) In an information processing system, a search keyword is transmitted from an information processing apparatus to a search system, and a hit data list in which a score is added to hit data hit by the transmitted search keyword is received by the information processing apparatus.
The information processing device,
A receiving means for receiving the target score;
Extracting means for extracting, from the hit data list received from the search system, hit data whose score is equal to or higher than the target score received by the receiving means;
And an information processing system configured to output information relating to the hit data extracted by the extraction means.
(Supplementary Note 3) An information processing apparatus, comprising: a transmission unit that transmits a search keyword to a search system; and a hit data list in which a score is added to hit data that hits the search keyword transmitted by the transmission unit.
A receiving means for receiving the target score;
Extracting means for extracting hit data whose score is equal to or higher than the target score received by the receiving means from the received hit data list;
And an information processing apparatus configured to output information on the hit data extracted by the extraction means.
(Supplementary Note 4) In a computer program that causes a computer to transmit a search keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword,
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
Causing the computer to output information on the extracted hit data; and
A computer program characterized by including:
(Supplementary note 5) A computer program that causes a computer to transmit a search keyword including a combination of a plurality of keywords or one keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword. ,
A step of causing the computer to store, in a predetermined storage area, the highest score among the scores of the hit data included in the received hit data list and the search keyword corresponding to the hit data list;
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
If the computer does not extract hit data having a target score or more, the search data includes a search keyword corresponding to the received hit data list, and the highest score corresponds to the hit data list having the target score or more. A procedure for reading the search keyword;
Causing the computer to output information on the extracted hit data or the read search keyword;
A computer program characterized by including:
(Supplementary Note 6) In a computer program for causing a computer to periodically transmit a predetermined search keyword to a search system and receive a hit data list in which a score is added to hit data hitting the transmitted predetermined search keyword,
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
A procedure for causing a computer to store information on the extracted hit data in a predetermined storage area;
Causing the computer to detect information about hit data newly stored in the predetermined storage area;
Causing the computer to output information about the detected hit data; and
A computer program characterized by including:
(Supplementary Note 7) In a computer program for causing a computer to transmit a search keyword to a search system and receive a hit data list including hit data hit by the transmitted search keyword,
A procedure for causing the computer to store the address, the content information, and the search keyword of the hit data included in the received hit data list in a predetermined storage area;
Steps to make the computer accept the address of the hit data,
Causing the computer to read content information and a search keyword corresponding to the received address from the predetermined storage area;
Causing a computer to transmit the read search keyword to a search system;
Causing the computer to extract, from the hit data included in the hit data list received in response to the transmission of the search keyword, hit data whose content information is similar to the read content information,
Causing the computer to output information on the extracted hit data; and
A computer program characterized by including:
[0068]
【The invention's effect】
According to the first or second aspect of the present invention, it is possible to reduce the number of hit data to be output by extracting hit data whose score is equal to or more than the target score from the hit data list received from the search system. . Also, the score of the extracted hit data is higher than the target score, and it is considered that the hit data to be output is likely to be information closely related to the search keyword.
[0069]
According to the third invention, when hit data whose score is equal to or higher than the target score cannot be extracted, a search keyword including the search keyword used for the search and having the highest score equal to or higher than the target score is obtained from the past search results and output. By doing so, it is possible to assist in determining a search keyword for re-search. Further, it is considered that the output search keyword has the highest score equal to or higher than the target score, and is likely to be information closely related to the search keyword.
[0070]
According to the fourth aspect, a predetermined search keyword is periodically transmitted to the search system, and hit data having a score equal to or higher than the target score is extracted from the hit data list received from the search system and stored in the storage unit. It is possible to output a list of new hit data hitting the predetermined search keyword. In addition, the new hit data to be output has a score equal to or higher than the target score, and is considered to be highly likely to be information closely related to the search keyword.
[0071]
According to the fifth aspect, by storing the address, the content information, and the search keyword of the hit data included in the hit data list received from the search system in the storage unit, the hit data which cannot be accessed is stored in the past. The search keyword and the content information relating to the search performed can be acquired from the storage unit, and it is possible to search for hit data that has become inaccessible based on the acquired search keyword and content information.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of an information processing apparatus according to the present invention.
FIG. 2 is a flowchart illustrating an example of a data search procedure.
FIG. 3 is a diagram showing an example of a search screen.
FIG. 4A is a block diagram illustrating an example of an information processing apparatus according to the present invention, and FIG. 4B is a diagram illustrating an example of search result information.
FIG. 5 is a flowchart illustrating an example of a data search procedure.
FIG. 6 is a diagram illustrating an example of an output screen.
FIG. 7 is a block diagram illustrating an example of an information processing apparatus according to the present invention.
8A is a diagram illustrating an example of user information, FIG. 8B is a diagram illustrating an example of keyword information, and FIG. 8C is a diagram illustrating an example of hit data information.
FIG. 9 is a flowchart illustrating an example of an execution procedure of an automatic patrol process.
FIG. 10 is a diagram illustrating an example of an output screen.
FIG. 11 is a block diagram illustrating an example of an information processing apparatus according to the present invention.
12A is a diagram illustrating an example of hit data information, and FIG. 12B is a diagram illustrating an example of URL change information.
FIG. 13 is a flowchart illustrating an example of a search procedure of a URL whose access has been disabled.
FIG. 14 is a diagram illustrating an example of an output screen.
[Explanation of symbols]
10 Information processing device
11 CPU
12 RAM
13 Hard disk (storage unit)
14 External storage unit
15 Input section
16 Output section
17 Communication unit
20 Search system
22 Communication Network

Claims (5)

検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを前記情報処理装置で受信及び出力する情報処理方法において、
目標スコアを前記情報処理装置で受付けるステップと、
受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを前記情報処理装置で抽出するステップと
を有し、前記抽出したヒットデータに関する情報を前記情報処理装置から出力することを特徴とする情報処理方法。
An information processing method of transmitting a search keyword from an information processing apparatus to a search system, and receiving and outputting, by the information processing apparatus, a hit data list in which a score is added to hit data hitting the transmitted search keyword,
Receiving a target score in the information processing device;
Extracting, from the received hit data list, hit data whose score is equal to or greater than the received target score by the information processing device, and outputting information on the extracted hit data from the information processing device. An information processing method characterized by the following.
コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
A computer program that causes a computer to transmit a search keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword.
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
Causing the computer to output information on the extracted hit data.
コンピュータに、複数キーワードの組合せ又は1キーワードを含む検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、目標スコア以上のヒットデータが抽出できなかった場合、前記所定記憶領域から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを読出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報又は前記読出した検索キーワードを出力させる手順と
を含むことを特徴とするコンピュータプログラム。
A computer program that causes a computer to transmit a search keyword including a combination of a plurality of keywords or one keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword.
A step of causing the computer to store, in a predetermined storage area, the highest score among the scores of the hit data included in the received hit data list and the search keyword corresponding to the hit data list;
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
If the computer does not extract hit data having a target score or more, the search data includes a search keyword corresponding to the received hit data list, and the highest score corresponds to the hit data list having the target score or more. A procedure for reading the search keyword;
Causing the computer to output the information on the extracted hit data or the read search keyword.
コンピュータに、所定検索キーワードを定期的に検索システムへ送信させ、送信した所定検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を所定記憶領域に記憶させる手順と、
コンピュータに、前記所定記憶領域に新しく記憶されたヒットデータに関する情報を検出させる手順と、
コンピュータに、前記検出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
A computer program for causing a computer to periodically transmit a predetermined search keyword to a search system and to receive a hit data list in which a score is added to hit data hitting the transmitted predetermined search keyword,
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
A procedure for causing a computer to store information on the extracted hit data in a predetermined storage area;
Causing the computer to detect information about hit data newly stored in the predetermined storage area;
Causing the computer to output information relating to the detected hit data.
コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータが含まれるヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、ヒットデータのアドレスを受付けさせる手順と、
コンピュータに、前記受付けたアドレスに対応する内容情報及び検索キーワードを前記所定記憶領域から読出させる手順と、
コンピュータに、前記読出した検索キーワードを検索システムへ送信させる手順と、
コンピュータに、前記検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
A computer program which causes a computer to transmit a search keyword to a search system and receive a hit data list including hit data hit by the transmitted search keyword,
A procedure for causing the computer to store the address, the content information, and the search keyword of the hit data included in the received hit data list in a predetermined storage area;
Steps to make the computer accept the address of the hit data,
Causing the computer to read content information and a search keyword corresponding to the received address from the predetermined storage area;
Causing a computer to transmit the read search keyword to a search system;
Causing the computer to extract, from the hit data included in the hit data list received in response to the transmission of the search keyword, hit data whose content information is similar to the read content information,
Causing the computer to output information on the extracted hit data.
JP2003089074A 2003-03-27 2003-03-27 Information processing method and computer program Pending JP2004295663A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003089074A JP2004295663A (en) 2003-03-27 2003-03-27 Information processing method and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003089074A JP2004295663A (en) 2003-03-27 2003-03-27 Information processing method and computer program

Publications (1)

Publication Number Publication Date
JP2004295663A true JP2004295663A (en) 2004-10-21

Family

ID=33403041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003089074A Pending JP2004295663A (en) 2003-03-27 2003-03-27 Information processing method and computer program

Country Status (1)

Country Link
JP (1) JP2004295663A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8032524B2 (en) 2008-03-27 2011-10-04 Brother Kogyo Kabushiki Kaisha Content management system and content management method
US8239360B2 (en) 2008-03-27 2012-08-07 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8032524B2 (en) 2008-03-27 2011-10-04 Brother Kogyo Kabushiki Kaisha Content management system and content management method
US8239360B2 (en) 2008-03-27 2012-08-07 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method
US8694484B2 (en) 2008-03-27 2014-04-08 Brother Kogyo Kabushiki Kaisha Content management device, content management system, and content management method

Similar Documents

Publication Publication Date Title
US9940398B1 (en) Customization of search results for search queries received from third party sites
JP4638439B2 (en) Personalized web search
US8135725B2 (en) System and method for providing tag-based relevance recommendations of bookmarks in a bookmark and tag database
JP5084858B2 (en) Summary creation device, summary creation method and program
US20080071739A1 (en) Using anchor text to provide context
JP2009282957A (en) Document processing system and document processing method
JP2008186452A (en) Retrieval system and retrieval method
JP2011138248A (en) Search supporting program, search supporting device, and method for search supporting
JP5068728B2 (en) Related blog presentation device, method and program
JP2003091552A (en) Retrieval requested information extraction method, its operating system and processing program of the same
JP4824070B2 (en) Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log
JP2007128367A (en) Information retrieval knowhow management system
JP2007334590A (en) Method, device and program for information ranking, and computer readable recording medium
JP2001265774A (en) Method and device for retrieving information, recording medium with recorded information retrieval program and hypertext information retrieving system
JP5141144B2 (en) Information retrieval system and information retrieval program
JP2006268771A (en) Retrieval result providing device
JP5524160B2 (en) Important query extraction device, important query extraction method, and important query extraction program
JP5286007B2 (en) Document search device, document search method, and document search program
JP2004295663A (en) Information processing method and computer program
JP4860439B2 (en) Automatic question generation system
JP4477931B2 (en) Search request device, search request method, search request program, and computer-readable recording medium storing search request program
JP2006185167A (en) File retrieval method, file retrieval device, and file retrieval program
JP2006236221A (en) Management server for web page retrieval
KR100371805B1 (en) Method and system for providing related web sites for the current visitting of client
JP2010282403A (en) Document retrieval method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050407

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080826