JP2001155021A - Information retrieval device and method, and record medium recorded with program - Google Patents

Information retrieval device and method, and record medium recorded with program

Info

Publication number
JP2001155021A
JP2001155021A JP33460099A JP33460099A JP2001155021A JP 2001155021 A JP2001155021 A JP 2001155021A JP 33460099 A JP33460099 A JP 33460099A JP 33460099 A JP33460099 A JP 33460099A JP 2001155021 A JP2001155021 A JP 2001155021A
Authority
JP
Japan
Prior art keywords
electronic information
information
page
similarity
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP33460099A
Other languages
Japanese (ja)
Other versions
JP4417497B2 (en
Inventor
Hiroyasu Nogami
宏康 野上
Tsutomu Kawada
勉 河田
Setsu Suzuoka
節 鈴岡
Akiko Okumura
明子 奥村
Kazuo Sumita
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP33460099A priority Critical patent/JP4417497B2/en
Publication of JP2001155021A publication Critical patent/JP2001155021A/en
Application granted granted Critical
Publication of JP4417497B2 publication Critical patent/JP4417497B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To efficiently retrieve electronic information, in which a comment on a designated theme is inserted, from a lot of electronic information (Web pages). SOLUTION: This information retrieval device is provided with an information acquiring means 12 for acquiring plural kinds of electronic information (Web pages), an electronic information extracting means 15 for extracting electronic information, which includes a comment expression in contents, out of respective kinds of electronic information acquired by this information acquiring means, a similarity calculating means 18 for calculating similarity showing the number of generated designated themes or importance of generation in each of electronic information, which includes the comment expression, extracted by this electronic information extracting means, and a retrieved result editing means 19 for editing the theme and electronic information specification information (address) for specifying the electronic information of high similarity to the relevant theme as the retrieved result to be outputted.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、膨大な量の電子情
報からユーザが指定したテーマに関する電子情報を検索
して該当ユーザに提供する情報検索技術に係わり、特に
当該テーマに対する批評が記述された電子情報を検索す
る情報検索装置、情報検索方法、及びプログラムを記憶
した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieval technique for retrieving electronic information relating to a theme designated by a user from an enormous amount of electronic information and providing the retrieved information to the user. The present invention relates to an information search device for searching electronic information, an information search method, and a storage medium storing a program.

【0002】[0002]

【従来の技術】近年、ワードプロセッサーや電子計算機
の普及、インターネットなどの計算機ネットワークを介
したWebページ、電予メール、電予ニュースの普及に
伴い、文書の電子化が加速的に進みつつある。電予出版
という言葉が示すように、今後は新聞、雑誌や本の情報
も電子的に提供されることが一般的になると考えられ
る。
2. Description of the Related Art In recent years, with the spread of word processors and electronic computers, and the spread of Web pages, electronic mails, and electronic news via computer networks such as the Internet, the digitization of documents has been accelerated. As the word "Denyo Publishing" implies, it is expected that information on newspapers, magazines, and books will be provided electronically in the future.

【0003】これにより、個人にとってリアルタイムで
入手可能となる前述したWebページ、電予メール、電
予ニュースや電予出版物等の電子情報の量は膨大になっ
ていくと予測される。これに伴い、Webページ、新
聞、雑誌などの膨大な電子情報からユーザの要求・興味
にあったものを選出してユーザに提供する検索サービ
ス、また検索した結果を定期的にユーザに提供する情報
フィルタリングサービスなどの霞要が高まりつつある。
以降、本明細書では、情報検索という用語は、情報フィ
ルタも含んだ意味で使用する。
[0003] As a result, the amount of electronic information such as the Web pages, electronic mails, electronic news, electronic publications, and the like that can be obtained in real time by individuals is expected to become enormous. Along with this, a search service for selecting and providing the user with a user's request / interest from a vast amount of electronic information such as Web pages, newspapers, magazines, etc., and information for periodically providing the user with the search results Kasumi, such as filtering services, is increasing.
Hereinafter, in this specification, the term information search is used in a sense that also includes an information filter.

【0004】これまで、テキスト記事を対象とした情報
フィルタリングシステムがすでに開発されており、その
システムを用いたサービスを提供している例がある(特
開平11―53392号公報)。
Until now, an information filtering system for text articles has already been developed, and there is an example in which a service using the system is provided (Japanese Patent Laid-Open No. 11-53392).

【0005】このシステムでは、当日発生した記事の配
信を複数のニュースソースから受け、予めユーザが指定
した検索条件に適合するテキスト記事のみを利用者に送
信するものである。この検索条件とは、ユーザがある特
定のテーマに対して記述した電子情報を得たいと希望し
た場合、このテーマをキーワードとして、各電子情報を
検索するための検索条件である。
[0005] In this system, distribution of an article that occurred on the day is received from a plurality of news sources, and only a text article that meets a search condition specified in advance by a user is transmitted to the user. The search condition is a search condition for searching for each piece of electronic information using the theme as a keyword when the user desires to obtain electronic information described for a specific theme.

【0006】そして、検索条件と配信された電子情報と
の間で、その検索条件に対してどのくらい適合している
かを示す類似度を算出する。具体的には、類似度は例え
ば前述したテーマの発生回数や発生の重要度を示す。そ
して、類似度を求め、類似度の高い電子情報の順にソー
トし、類似度の高い電子情報のみをユーザに提供する。
[0006] Then, a similarity between the search condition and the distributed electronic information indicating how much the search condition matches the search condition is calculated. Specifically, the similarity indicates, for example, the number of occurrences of the above-described theme or the importance of the occurrence. Then, the similarity is obtained, the electronic information having the highest similarity is sorted, and only the electronic information having the high similarity is provided to the user.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、上述し
たシステムにおいてもまだ解消すべき次のような課題が
あった。
However, the above-mentioned system still has the following problems to be solved.

【0008】すなわち、上述したように、上述したシス
テムにおいては、ユーザが指定したテーマに関連する電
子情報を該当ユーザに提供することが可能である。しか
し、そのテーマに関する評価や批判等の批評に関して記
述した電子情報のみを抽出してユーザに提供することは
できなかった。
That is, as described above, in the above-described system, it is possible to provide the relevant user with electronic information related to the theme specified by the user. However, it has not been possible to extract and provide only electronic information describing criticism such as evaluation or criticism on the subject to the user.

【0009】本発明はこのような事情に鑑みてなされた
ものであり、ユーザが指定したテーマに関する情報が記
載された電子情報の中から該当テーマに対する批評が記
載された電子情報のみを確実に検索できる情報検索装
置、及び情報検索方法、並びにプログラムを記憶した記
憶媒体を提供することを目的とする。
The present invention has been made in view of such circumstances, and reliably searches only electronic information in which criticism about a subject is described from electronic information in which information on a theme designated by a user is described. An object of the present invention is to provide an information search device, an information search method, and a storage medium that stores a program that can be used.

【0010】さらに、該当テーマに対する批評が記載さ
れた電子情報を参照すべきと記載した電子情報をも検索
することにより、該当テーマに対する世間の批評をより
正確に定量的に把握できる情報検索装置、及び情報検索
方法、並びにプログラムを記憶した記憶媒体を提供する
ことを目的とする。
[0010] Further, an information retrieval apparatus capable of more accurately and quantitatively grasping public criticism of the subject by searching for electronic information describing that the criticism of the subject should be referred to. And an information search method, and a storage medium storing a program.

【0011】[0011]

【課題を解決するための手段】上記課題を解決するため
に、本発明の請求項1の情報検索装置においては、複数
の電子情報を取得する情報取得手段と、この情報取得手
段で取得された各電子情報のうちその内容に批評表現を
含む電子情報を抽出する電子情報抽出手段と、この電子
情報抽出手段で抽出された批評表現を含む各電子情報に
おける指定されたテーマの発生数や発生の重要度を示す
類似度を算出する類似度算出手段と、テーマ及び該当テ
ーマに対する類似度が高い電子情報を特定する電子情報
特定情報を出力すべき検索結果として編集する検索結果
編集手段とを備えている。
According to an aspect of the present invention, there is provided an information retrieval apparatus, comprising: an information acquisition unit for acquiring a plurality of pieces of electronic information; Electronic information extracting means for extracting electronic information including a critical expression in the content of each electronic information, and the number of occurrences and occurrences of a specified theme in each electronic information including the critical expression extracted by the electronic information extracting means; A similarity calculation unit configured to calculate similarity indicating importance; and a search result editing unit configured to edit, as a search result to be output, electronic information specifying information that specifies a theme and electronic information having a high similarity to the subject. I have.

【0012】このように構成された情報検索装置におい
ては、情報取得手段で取得された各電子情報のうちその
内容に批評表現を含む電子情報が抽出されて、この抽出
された各電子情報の中から、例えばこの装置のユーザが
指定するテーマのテーマの発生数や発生の重要度を示す
類似度が高い電子情報が該当テーマと共に編集されて出
力される。
[0012] In the information retrieval apparatus thus configured, electronic information including a critique expression in its content is extracted from each electronic information obtained by the information obtaining means, and the extracted electronic information is included in each of the extracted electronic information. Thus, for example, electronic information having a high degree of similarity indicating the number of occurrences and the importance of occurrence of the theme specified by the user of the device is edited and output together with the theme.

【0013】したがって、この装置のユーザとしては、
自己が指定したテーマに対する批評及び該当批評を載せ
た電子情報の名称やアドレスを確実に把握できる。
Therefore, as a user of this device,
It is possible to reliably grasp the criticism of the theme designated by the user and the name and address of the electronic information on which the criticism is posted.

【0014】請求項2の発明は、上述した発明の情報検
索装置における情報取得手段は、予め指定された監視対
象の複数の電子情報の内容を周期的に読取り、この内容
が1つ前の周期で読取った内容と異なる場合のみ、該当
電子情報を取得した電子情報として電子情報抽出手段へ
送出するようにしている。
According to a second aspect of the present invention, the information acquiring means in the information retrieval apparatus according to the above-mentioned invention periodically reads the contents of a plurality of electronic information to be monitored which are designated in advance, and the contents are stored in the previous period. Only when the content is different from the content read in step (1), the corresponding electronic information is sent to the electronic information extracting means as acquired electronic information.

【0015】このように構成された情報検索装置におい
ては、各種のテーマに対して頻繁に批評を行う電子情報
が予め選択されており、この選択された複数の電子情報
の内容が周期的に読取られ、内容が更新された電子情報
に対してのみ上述した処理が実施される。
In the information retrieval apparatus thus configured, electronic information that frequently criticizes various themes is selected in advance, and the contents of the selected plurality of electronic information are periodically read. The above-described processing is performed only on the electronic information whose contents have been updated.

【0016】したがって、ユーザが指定したテーマに対
する批評が記載されている電子情報をより効率的に検索
できる。
Therefore, it is possible to more efficiently search for electronic information in which criticisms about the theme specified by the user are described.

【0017】請求項3の発明は、上述した発明の情報検
索装置に対して、さらに、類似度が高い電子情報を参照
すべきと記載した内容を有する参照電子情報を検索する
参照電子情報検索手段を付加している。
According to a third aspect of the present invention, in the information retrieval apparatus of the above-mentioned invention, a reference electronic information search means for searching for reference electronic information having a content indicating that electronic information having a high degree of similarity should be referenced. Is added.

【0018】すなわち、電子情報の記述内容には参照す
べき電子情報の名称又はアドレスが記載されていること
がしばしばある。このように、自己以外の他の電子情報
に参照すべきと記載された電子情報はより多くの注目が
注がれることになる。
That is, the description content of the electronic information often describes the name or address of the electronic information to be referred to. As described above, more attention is paid to the electronic information that is described to be referred to other electronic information than the self.

【0019】例えば、販売開始した新商品の反響を評価
する場合、該当新商品(テーマ)を直接批評した電子情
報の他に、「この新商品の批評がxxxの電子情報に載
っているよ」と記載した電子情報が存在する。
For example, when evaluating the repercussions of a new product that has begun to be sold, in addition to the electronic information that directly criticizes the new product (theme), “the criticism of this new product is included in the electronic information of xxx”. There is electronic information described as:

【0020】したがって、このテーマを批評する電子情
報を参照すべきと記述した電子情報、すなわち参照電子
情報の名称又はアドレスやその参照電子情報数を把握す
ることはユーザが指定するテーマに対する世間の反響を
高い精度で得る上で重要なことである。
Therefore, to grasp the electronic information describing that the electronic information that criticizes this theme should be referred to, that is, to know the name or address of the reference electronic information and the number of the reference electronic information, it is necessary to have a public response to the theme specified by the user. Is important in obtaining high accuracy.

【0021】そこで、この請求項3においては、上述し
た参照電子情報をも検索することによって、該当テーマ
に対する批評をより正確に定量的に把握できる。
Therefore, in the present invention, the criticism of the subject can be grasped more accurately and quantitatively by searching the above-mentioned reference electronic information.

【0022】請求項4の発明は、上述した発明の情報検
索装置の検索結果編集手段は、出力すべき検索結果に参
照電子情報検索手段で検索された参照電子情報を付加す
るようにしている。
According to a fourth aspect of the present invention, the search result editing means of the information search apparatus of the above invention adds the reference electronic information searched by the reference electronic information search means to the search result to be output.

【0023】このように構成された情報検索装置におい
ては、ユーザが指定したテーマと該当テーマを批評した
電子情報を特定する名称やアドレス等の電子情報特定情
報と参照電子情報を特定する名称やアドレス等が1セッ
トとしてまとめて編集されるので、ユーザとしては非常
に見やすくなる。
In the information retrieval apparatus configured as described above, electronic information specifying information such as a name and an address for specifying a theme specified by a user and electronic information that criticized the theme, and a name and an address for specifying reference electronic information. And so on are edited as one set, which makes it very easy for the user to see.

【0024】また、本発明の請求項5の情報検索装置に
おいては、複数の電子情報を取得する情報取得手段と、
この情報取得手段で取得された各電子情報における指定
されたテーマの発生数や発生の重要度を示す類似度を算
出する類似度算出手段と、類似度が高い電子情報を参照
すべきと記載した内容を有する参照電子情報を検索する
参照電子情報検索手段と、テーマと該当テーマに対する
類似度が高い電子情報を特定する電子情報特定情報と参
照電子情報とを出力すべき検索結果として編集する検索
結果編集手段とを備えている。
[0024] In the information retrieval apparatus according to claim 5 of the present invention, an information acquiring means for acquiring a plurality of electronic information,
The similarity calculating means for calculating the similarity indicating the number of occurrences and the importance of occurrence of the designated theme in each electronic information acquired by the information acquiring means, and that the electronic information having a high similarity should be referred to Reference electronic information search means for searching for reference electronic information having contents, and a search result for editing, as search results to be output, electronic information specifying information for specifying a theme and electronic information having a high degree of similarity to the subject and reference electronic information Editing means.

【0025】このように構成された情報検索装置におい
ては、ユーザが指定したテーマに対する批評はともかく
として、該当テーマを取上げた電子情報及び参照電子情
報を定量的に把握できる。
In the information retrieval apparatus configured as described above, it is possible to quantitatively grasp the electronic information and the reference electronic information picked up for the theme, irrespective of the criticism of the theme specified by the user.

【0026】請求項6の情報検索方法は、複数の電子情
報を取得するステップと、この取得された各電子情報の
うちその内容に批評表現を含む電子情報を抽出するステ
ップと、この抽出された批評表現を含む各電子情報にお
ける指定されたテーマの発生数や発生の重要度を示す類
似度を算出するステップと、テーマ及び該当テーマに対
する類似度が高い電子情報を特定する電子情報特定情報
を出力すべき検索結果として編集するステップとを有す
る。
According to a sixth aspect of the present invention, there is provided an information retrieval method comprising: acquiring a plurality of electronic information; extracting electronic information including a critique expression in the content of the acquired electronic information; Calculating the similarity indicating the number of occurrences and the importance of occurrence of the designated theme in each electronic information including the criticism expression, and outputting the electronic information specifying information identifying the theme and the electronic information having a high similarity to the theme; Editing as a search result to be performed.

【0027】このように構成された情報検索方法におい
ては、前出した請求項1の情報検索装置とほぼ同様の作
用効果を奏することが可能である。
The information retrieval method thus configured can provide substantially the same operation and effect as the information retrieval device of the first aspect.

【0028】請求項7の情報検索方法は、上述した情報
検索方法の複数の電子情報を取得するステップは、予め
指定された監視対象の複数の電子情報の内容を周期的に
読取り、この内容が1つ前の周期で読取った内容と異な
る場合のみ、該当電子情報を取得した電子情報として電
子情報を抽出するステップへ送出するようにしている。
According to a seventh aspect of the present invention, the step of acquiring a plurality of pieces of electronic information in the above information search method includes periodically reading the contents of a plurality of pieces of electronic information to be monitored which are designated in advance. Only when the content is different from the content read in the previous cycle, the corresponding electronic information is sent to the step of extracting the electronic information as the acquired electronic information.

【0029】このように構成された情報検索方法におい
ては、前出した請求項2の情報検索装置とほぼ同様の作
用効果を奏することが可能である。
In the information retrieval method thus configured, it is possible to achieve substantially the same operation and effect as the above-described information retrieval apparatus of the second aspect.

【0030】請求項8の情報検索方法は、上述した情報
検索方法における類似度を算出するステップの後に、類
似度が高い電子情報を参照すべきと記載した内容を有す
る参照電子情報を検索するステップを付加している。
According to an eighth aspect of the present invention, after the step of calculating the similarity in the above-described information search method, a step of searching for reference electronic information having a content stating that electronic information having a high similarity should be referred to Is added.

【0031】このように構成された情報検索方法におい
ては、前出した請求項3の情報検索装置とほぼ同様の作
用効果を奏することが可能である。
According to the information retrieval method having the above-described configuration, it is possible to obtain substantially the same operation and effect as the information retrieval apparatus according to the third aspect.

【0032】請求項9の発明は、情報検索装置に組込ま
れたプログラムを記憶した記憶媒体である。そして、こ
のプログラムはコンピユータに対して、複数の電子情報
を取得するステップと、この取得された各電子情報のう
ちその内容に批評表現を含む電子情報を抽出するステッ
プと、この抽出された批評表現を含む各電子情報におけ
る指定されたテーマの発生数や発生の重要度を示す類似
度を算出するステップと、テーマ及び該当テーマに対す
る類似度が高い電子情報を特定する電子情報特定情報を
出力すべき検索結果として編集するステップとを実現さ
せる。
A ninth aspect of the present invention is a storage medium storing a program incorporated in an information search device. The program provides the computer with a step of acquiring a plurality of electronic information, a step of extracting electronic information including a critical expression in the content of the acquired electronic information, and a step of extracting the extracted critical expression. Calculating the similarity indicating the number of occurrences and the importance of occurrence of the specified theme in each piece of electronic information including, and outputting electronic information specifying information for specifying the theme and electronic information having a high degree of similarity to the theme. Editing as search results.

【0033】また、請求項10の発明のプログラムを記
憶した記憶媒体は、上述したプログラムを記憶した記憶
媒体において、複数の電子情報を取得するステップは、
予め指定された監視対象の複数の電子情報の内容を周期
的に読取り、この内容が1つ前の周期で読取った内容と
異なる場合のみ、該当電子情報を取得した電子情報とし
て前記電子情報を抽出するステップへ送出する。
According to a tenth aspect of the present invention, in the storage medium storing the program, the step of acquiring a plurality of pieces of electronic information in the storage medium storing the above-described program comprises:
The contents of a plurality of pieces of electronic information to be monitored which are specified in advance are periodically read, and only when the contents are different from the contents read in the previous cycle, the electronic information is extracted as the obtained electronic information. To the step to be performed.

【0034】さらに、請求項11のプログラムを記憶し
た記憶媒体は、上述したプログラムを記憶した記憶媒体
において、類似度を算出するステップの後に、類似度が
高い電子情報を参照すべきと記載した内容を有する参照
電子情報を検索するステップを付加している。
Further, the storage medium storing the program according to claim 11 is a storage medium storing the above-mentioned program, in which after the step of calculating the similarity, the electronic information having a high similarity should be referred to. The step of searching for reference electronic information having the following is added.

【0035】このように構成されたプログラムを記憶し
た記憶媒体を用いることによって、例えば、汎用のパー
ソナルコンピユータを簡単に上述した機能を有した情報
検索装置とすることが可能である。
By using the storage medium storing the program configured as described above, for example, a general-purpose personal computer can be simply made an information search device having the above-described functions.

【0036】[0036]

【発明の実施の形態】以下、本発明の各実施形態を図面
を用いて説明する。 (第1実施形態)図1は本発明の第1実施形態に係る情
報検索方法が適用される情報検索装置のハード構成図で
あり、図2は同第1実施形態の情報検索装置のソフト構
成図である。
Embodiments of the present invention will be described below with reference to the drawings. (First Embodiment) FIG. 1 is a hardware configuration diagram of an information search device to which an information search method according to a first embodiment of the present invention is applied, and FIG. 2 is a software configuration of the information search device of the first embodiment. FIG.

【0037】図1に示すように、この第1実施形態の情
報検索装置は、オペレーティングシステム(OS)やユ
ーティリティを含む各種アプリケーションプログラム
(検索処埋を行なう各種プログラムもこれらに含まれ
る)を実行制御するCPUIと、このCPUIに対し
て、システムバス2を介して接続された、アプリケーシ
ヨンプログラムや各種データを格納する記億装置3、通
信ネットワーク4を介して多数のWebサイト(Web
サーバ)から各種電子情報(Webページ)を読込むた
めの回線入出力装置5からなる。
As shown in FIG. 1, the information retrieval apparatus according to the first embodiment controls execution of various application programs (including various programs for performing search processing) including an operating system (OS) and utilities. CPUI, a storage device 3 for storing application programs and various data connected to the CPUI via a system bus 2, and a number of Web sites (Web sites) via a communication network 4.
A line input / output device 5 for reading various electronic information (Web pages) from a server).

【0038】図2に示す第1実施形態の情報検索装置の
ソフト構成図において、各部の動作を制御する制御部1
1に対して、通信ネットワーク4を介して多数のWeb
サイト(Webサーバ)から各種電子情報(Webペー
ジ)を取込む情報取得部12、書式解析部13、批評表
現辞書14を有する電子情報抽出手段としての批評表現
抽出部15、検索対象テーマメモリ16に記憶されたテ
ーマの検索式17を用いて各電子情報(Webページ)
の類似度を算出する類似度算出部18、検索結果編集部
19、編集された検索結果を例えばユーザに送信した
り、表示器に表示出力する出力部20が接続されてい
る。
In the software configuration diagram of the information search apparatus of the first embodiment shown in FIG. 2, a control unit 1 for controlling the operation of each unit
1 to a large number of Web sites via the communication network 4
An information acquisition unit 12, a format analysis unit 13, and a critical expression extraction unit 15 as an electronic information extraction unit having a critical expression dictionary 14, which takes in various electronic information (Web pages) from a site (Web server). Each electronic information (Web page) using the stored theme search expression 17
A similarity calculating unit 18 for calculating the similarity of the search result, a search result editing unit 19, and an output unit 20 for transmitting the edited search result to, for example, a user or displaying the edited result on a display unit are connected.

【0039】次に各部12〜20の動作を説明する。Next, the operation of each of the units 12 to 20 will be described.

【0040】情報取得部12は、自己に内蔵したホーム
ページ検索ソフトに従って無作為に又は一定の方式に従
って、通信ネットワーク4を介して各Webサイト(W
ebサーバ)から電子情報としてのHTML形式の文書
が記載されたページ(Webページ)を順次取込んで制
御部11へ送出する。
The information acquisition section 12 randomly or in accordance with a predetermined system according to homepage search software built in the information acquisition section 12, via the communication network 4 to each Web site (WWW)
A page (Web page) in which an HTML document as electronic information is described is sequentially fetched from an (e.g., web server) and sent to the control unit 11.

【0041】書式解析部13は、ページにおけるHTM
L形式の文書のデータに付与されている各タグに基づい
て、該当ページの情報を通常の内部構造の文書に変換す
る。HTMLは、SGMLのサブセットであり、一般
に、開始タグと終了タグによって論理的な構造を規定し
ている。
The format analysis unit 13 performs the HTM
The information of the corresponding page is converted into a document having a normal internal structure based on each tag added to the data of the document in the L format. HTML is a subset of SGML, and generally defines a logical structure by a start tag and an end tag.

【0042】例えば、HTMLでは、開始タグ<TIT
LE>と終了タグ</TITLE>とに囲まれた部分が
夕イトルであり、また、開始タグ<UL>と終了タグ<
/UL>とに囲まれた部分が箇条書きと定義されてい
る。また、段落を規定する<P>や、箇条書きの各項目
を表現する<LI>のように、終了タグを省略してよい
タグも存在する。これらのタグについては、同じ開始タ
グが出現した時点で終了タグが存在したものと見なされ
る。
For example, in HTML, the start tag <TIT
LE> and an end tag </ TITLE> are the evening title, and a start tag <UL> and an end tag <
/ UL> is defined as an itemized list. There are also tags that may omit the end tag, such as <P> that specifies a paragraph and <LI> that expresses each item in a bulleted list. Regarding these tags, it is considered that an end tag exists when the same start tag appears.

【0043】書式解析部13では、入力されたページの
文字列をスキャンしてHTMLの開始タグを検出する。
そして、その開始夕グに対応する終了タグを検出するこ
とにより、各タグに対応する情報を取り出す。
The format analysis unit 13 scans the character string of the input page to detect an HTML start tag.
Then, by detecting an end tag corresponding to the start evening, information corresponding to each tag is extracted.

【0044】電子情報抽出手段としての批評表現抽出部
15の処理は批評表現辞書14を使用する。批評表現辞
書14内には、図3に示すように、批判や評価等の多数
の批評表現(ワード)が登録されている。
The process of the critical expression extracting unit 15 as the electronic information extracting means uses the critical expression dictionary 14. As shown in FIG. 3, a number of criticism expressions (words) such as criticism and evaluation are registered in the criticism expression dictionary 14.

【0045】批評表現抽出部13の処理手順を図4の流
れ図を用いて説明する。制御部11から1つのページが
入力すると(ステップA1)、該当ページを批評表現辞
書14に登録されている各表現(ワード)で検索する
(A2)。そして、批評表現の有無を判定する(A
3)。その有無判定結果を制御部11へ返信する。
The processing procedure of the critical expression extracting unit 13 will be described with reference to the flowchart of FIG. When one page is input from the control unit 11 (step A1), the corresponding page is searched by each expression (word) registered in the critical expression dictionary 14 (A2). Then, it is determined whether there is a critical expression (A
3). The result of the presence / absence determination is returned to the control unit 11.

【0046】次に、類似度算出部18の処理を説明す
る。検索対象テーマメモリ16内には、この情報検索装
置のユーザや検索依頼者が指定する消費者や世間の批評
を調査する対象となる各テーマが記憶されている。例え
ば、このテーマとして、業界名、商品ジャンル名、商品
名、サービス名、会社名、社長名、役員名等がある。
Next, the processing of the similarity calculating section 18 will be described. The search target theme memory 16 stores themes to be examined for criticism of consumers and the public specified by the user of the information search device and the search requester. For example, the theme includes an industry name, a product genre name, a product name, a service name, a company name, a president name, an executive name, and the like.

【0047】そして、この検索対象テーマメモリ16内
からユーザが指定した1個または複数のテーマをそれぞ
れ各検索式17に組込む。
Then, one or a plurality of themes specified by the user from the search target theme memory 16 are incorporated into each search formula 17.

【0048】そして、類似度算出部18においては、制
御部11から入力された各ページに対して各検索式17
のテーマの発生数や発生の重要度を示す類似度を算出し
て制御部11へ返信する。具体的には、例えば検索式1
7に格納されたテーマを含む検索条件と処理対象となる
ページとをそれぞれ単語頻度のベクトルとして表現し、
これらベクトル間の内積をとることによって類似度を求
めるといった従来公知の算出方法を流用する。
Then, the similarity calculation unit 18 searches each page input from the control unit 11 for each search expression 17
The number of occurrences of the theme and the similarity indicating the importance of occurrence are calculated and returned to the control unit 11. Specifically, for example, search expression 1
The search condition including the theme stored in 7 and the page to be processed are respectively expressed as word frequency vectors,
A conventionally known calculation method, such as obtaining a degree of similarity by taking an inner product between these vectors, is used.

【0049】次に、検索結果編集部19の編集処理動作
を図5の流れ図を参照して説明する。制御部11から類
似度が付された各ページが入力されると、この各ページ
を類似度順にソートする(B1)。次に、このソーティ
ング結果の順に、各ページの見出しを箇条書きの形式で
編集する(B2)。さらに、ページの地の文(本文)か
ら要約を生成して編集する(B3).要約の生成として
は、例えば、ページの前方から数文を取り出すといった
簡単な処理でもよい。最後に、編集結果を制御部11へ
返信する(B4)。
Next, the editing processing operation of the search result editing unit 19 will be described with reference to the flowchart of FIG. When each page with similarity is input from the control unit 11, the pages are sorted in order of similarity (B1). Next, the headings of each page are edited in a bulleted format in the order of the sorting results (B2). Further, an abstract is generated from the sentence (text) on the ground of the page and edited (B3). The generation of the summary may be a simple process of extracting several sentences from the front of the page, for example. Finally, the editing result is returned to the control unit 11 (B4).

【0050】出力部20は、制御部11からの指示に従
って編集済みの検索結果を例えばユーザにメールで送信
したり、表示器に表示出力する。図6及び図7は、表示
器に表示出力された検索結果を示す図である。図6は検
索結果の目次画面であり、この目次画面に表示された
「A社」、「OO製品」、「ΔΔサービス」等のテーマ
をマウスで選択すると、図7に示す検索結果が表示され
る。
The output unit 20 sends the edited search result to the user by e-mail or displays it on a display unit in accordance with an instruction from the control unit 11. 6 and 7 are diagrams showing search results displayed and output on the display. FIG. 6 is a table of contents of the search result. When a theme such as “Company A”, “OO product”, or “ΔΔ service” displayed on the table of contents is selected with a mouse, the search result shown in FIG. 7 is displayed. You.

【0051】なお、図7においては、「ノートパソコン
NI」のテーマ21を選択した例を示す。図示するよう
に、テーマ21と、検索された各ページの見出し22
と、ページを特定するアドレス23と、本文の要約24
が表示される。
FIG. 7 shows an example in which the theme 21 of "notebook personal computer NI" is selected. As shown in the figure, a theme 21 and a heading 22 of each searched page are displayed.
, An address 23 for specifying a page, and a summary 24 of the text
Is displayed.

【0052】なお、本実施形態では、表示器の表示画面
に対してHTMLブラウザで表示することを想定してい
るため、HTML形式で検索結果を出力している。これ
は、検索処理で検索された文書のオリジナルをアクセス
する場合に、その文書形式との統一性を図るためであ
る。したがって、必ずしもHTMLブラウザに限定する
ものでなく、特殊なブラウザで取込める形式のデータに
変換するように変形することはごく容易である。
In this embodiment, since it is assumed that an HTML browser is used to display the display screen of the display device, the search result is output in the HTML format. This is to ensure consistency with the document format when accessing the original of the document retrieved by the retrieval process. Therefore, the present invention is not necessarily limited to the HTML browser, and it is very easy to transform the data so that the data is converted into data in a format that can be captured by a special browser.

【0053】次に、上述した各部12〜20を制御する
制御部11の処理動作を図8の流れ図を用いて説明す
る。先ず、情報取得部12へアクセスして(C1)、情
報取得部12から1つの電子情報としてのページ(We
bページ)が入力されると(C2)、このページ(We
bページ)を書式解析部13へ送出して通常の文書のペ
ージに変換した後(C3)、批評表現抽出部15へ送出
する(C4)。該当ページに批評表現が存在しなければ
(C5)、このページを破棄して、C1に戻り、次のペ
ージの取得を開始する。
Next, the processing operation of the control unit 11 for controlling the above-described units 12 to 20 will be described with reference to the flowchart of FIG. First, the information acquisition unit 12 is accessed (C1), and a page (We) as one piece of electronic information is
When page (b) is input (C2), this page (We)
b) is sent to the format analysis unit 13 and converted into a normal document page (C3), and then sent to the critical expression extraction unit 15 (C4). If there is no critique expression in the corresponding page (C5), this page is discarded, the process returns to C1, and the acquisition of the next page is started.

【0054】該当ページに批評表現が存在すれば(C
5)、このページを類似度算出部18へ送出して(C
6)、類似度を得る。そして、該当ページと類似度とを
記憶保持する(C7)。
If a critique expression exists on the page, (C
5), and sends this page to the similarity calculating section 18 (C
6) Obtain similarity. Then, the corresponding page and the similarity are stored and held (C7).

【0055】C2において、取得対象の全部のページに
対する批評表現無判定処理、及び批評表現が含まれるペ
ージの類似度算出処理が終了すると、記憶した全てのペ
ージと類似度とを検索結果編集部19へ送出する(C
8)。そして、その編集された検索結果を出力部20へ
送出する(C9)。
At C2, when the critical expression non-judgment process for all the pages to be acquired and the similarity calculation process for the page including the critical expression are completed, the search result editing unit 19 retrieves all the stored pages and similarities. To (C
8). Then, the edited search result is sent to the output unit 20 (C9).

【0056】このように構成された第1実施形態の情報
検索装置においては、情報取得部12で取得された各ペ
ージのうちその内容に批評表現を含むページのみが批評
表現抽出部15で抽出される。そして、この抽出された
各ページの中から、類似度算出部18において、例えば
この情報検索装置のユーザや調査依頼者が指定する業界
名、商品ジャンル名、商品名、サービス名、会社名、社
長名、役員名等のテーマの発生数や発生の重要度を示す
類似度が算出される。
In the information retrieval apparatus of the first embodiment configured as described above, of the pages acquired by the information acquisition unit 12, only the page containing the critical expression in its content is extracted by the critical expression extraction unit 15. You. Then, from among the extracted pages, the similarity calculating unit 18 determines, for example, an industry name, a product genre name, a product name, a service name, a company name, and a president, which are designated by a user of the information search device or a research client. The similarity indicating the number of occurrences of themes such as names, officer names, and the likelihood of occurrence is calculated.

【0057】そして、検索結果編集部19にて、高い類
似度のページが該当テーマと共に編集されて出力部20
にて例えば図6、図7に示すように出力される。
Then, in the search result editing section 19, the page having the high similarity is edited together with the corresponding theme and output to the output section 20.
Are output as shown in FIGS. 6 and 7, for example.

【0058】したがって、この情報検索装置のユーザや
調査依頼者は、自己が指定したテーマに対する批評及び
該当批評を載せたページの名称やアドレスを確実に把握
できる。
Therefore, the user of the information retrieval apparatus and the research requester can surely understand the criticism of the theme specified by the user and the name and address of the page on which the criticism is placed.

【0059】(第2実施形態)図9は本発明の第2実施
形態に係わる情報検索装置の概略構成を示すブロック図
である。図2に示す第1実施形態の情報検索装置と同一
部分には同一符号を付して重複する部分の詳細説明を省
略する。この第2実施形態の情報検索装置においては、
第1実施形態の情報検索装置の情報取得部12を図示す
る新たな情報取得部12aに置き換えている。その他の
構成は第1実施形態の情報検索装置とほぼ同一である。
(Second Embodiment) FIG. 9 is a block diagram showing a schematic configuration of an information retrieval apparatus according to a second embodiment of the present invention. The same parts as those of the information search apparatus of the first embodiment shown in FIG. 2 are denoted by the same reference numerals, and detailed description of the overlapping parts will be omitted. In the information search device of the second embodiment,
The information acquisition unit 12 of the information search device according to the first embodiment is replaced with a new information acquisition unit 12a illustrated. Other configurations are almost the same as those of the information search device of the first embodiment.

【0060】この第2実施形態の情報検索装置における
情報取得部12a内には、通信ネットワーク4を介して
指定された各Webサイトからページ(Webページ)
を取得するページアクセス部25、監視ページリスト2
6、更新判定部27、及び前回ページメモリ28が設け
られている。
The information acquisition unit 12a of the information retrieval apparatus according to the second embodiment stores a page (Web page) from each Web site designated via the communication network 4.
Access unit 25 for acquiring the information, monitoring page list 2
6, an update determination unit 27, and a previous page memory 28 are provided.

【0061】監視ページリスト26内には、図10に示
すように、検索対象テーマメモリ16内に記憶された各
テーマに対して比較的頻繁に批評を載せるページの各ア
ドレス(Webサイト)が記憶されている。例えば、B
BSサイト、チャットサイト、特定の個人ホームページ
サイト、フォームサイト等がある。また、ネットワーク
ニュース(USENET)、メールマガジン、フォーラ
ムなどがある。
As shown in FIG. 10, in the monitoring page list 26, each address (Web site) of a page on which criticism is relatively frequently posted for each theme stored in the search target theme memory 16 is stored. Have been. For example, B
There are BS sites, chat sites, specific personal homepage sites, form sites, and the like. There are also network news (USENET), mail magazines, forums, and the like.

【0062】前回ページメモリ28内には、監視ページ
リスト26に記憶された各アドレスの1回分のページの
内容(テキストデータ)が記憶されている。更新判定部
27は、今回の周期で取得したページの内容が前回の周
期で取得したページの内容と異なったか否かを判定す
る。
The contents (text data) of one page of each address stored in the monitoring page list 26 are stored in the previous page memory 28. The update determination unit 27 determines whether the content of the page acquired in the current cycle is different from the content of the page acquired in the previous cycle.

【0063】このような構成の情報取得部12aは、例
えば1日24時間等の一定周期毎に、図11の流れ図に
従ってページの取得処理を実施する。又は、検索処理を
実行する直前に取得することも可能である、監視ページ
リスト26に未アクセスのアドレスがあれば(D1)、
この監視ページリスト26から未アクセスのアドレスの
ホームページをアクセスして、該当ページを取得する
(D2)。そして、この取得した今回ページの内容と前
回ページメモリ28に記憶されている1周期前の同一ア
ドレスの前回ページの内容とを比較する(D3)。前回
ページの内容に対して更新されていれば(D4)、今回
のページを制御部11へ送信する(D5)、そして、前
回ページメモリ28の前回ページの内容を今回ページの
内容に更新する(D6)。そして、D1へ戻り、監視ペ
ージリスト26における未アクセスのアドレスに対する
アクセスを開始する。また、D4にて、更新されていな
ければ、なにもせずに、D1へ戻り、監視ページリスト
26における未アクセスのアドレスに対するアクセスを
開始する。
The information acquiring unit 12a having such a configuration performs a page acquiring process in accordance with the flowchart of FIG. 11 at regular intervals such as 24 hours a day. Alternatively, if there is an unaccessed address in the monitoring page list 26, which can be obtained immediately before executing the search processing (D1),
The homepage of the address not accessed is accessed from the monitoring page list 26, and the corresponding page is acquired (D2). Then, the acquired contents of the current page are compared with the contents of the previous page at the same address one cycle before stored in the previous page memory 28 (D3). If the content of the previous page has been updated (D4), the current page is transmitted to the control unit 11 (D5), and the content of the previous page in the previous page memory 28 is updated to the content of the current page (D4). D6). Then, the process returns to D1, and access to an unaccessed address in the monitoring page list 26 is started. If it has not been updated in D4, the process returns to D1 without doing anything, and access to an unaccessed address in the monitoring page list 26 is started.

【0064】そして、D1にて、監視ページリスト26
に未アクセスのアドレスがなくなると、今回の周期に対
する全アクセスが終了したことを制御部11へ返信する
(D7)。
Then, at D1, the monitoring page list 26
When there are no unaccessed addresses, the control unit 11 returns to the control unit 11 that all accesses for the current cycle have been completed (D7).

【0065】このように、情報取得部12aは、監視ペ
ージリスト26に登録された各アドレスを一定周期でア
クセスして、変更(更新)のあったページのみを制御部
11へ送信している。
As described above, the information acquisition unit 12a accesses each address registered in the monitoring page list 26 at a constant cycle, and transmits only the changed (updated) page to the control unit 11.

【0066】また、制御部11の処理動作を図12の流
れ図を用いて説明する。先ず、情報取得部12aへ起動
指令を送出する(E1)、情報取得部12aから1つの
ページが入力されると(E2)、このページを書式解析
部13へ送出して通常の文書のページに変換した後(E
3)、批評表現抽出部15へ送出する(E4)。該当ペ
ージに批評表現が存在しなければ(E5)、このページ
を破棄して、E2へ戻り、次のページの入力を待つ。
The processing operation of the control unit 11 will be described with reference to the flowchart of FIG. First, a start command is sent to the information acquisition unit 12a (E1). When one page is input from the information acquisition unit 12a (E2), this page is sent to the format analysis unit 13 and becomes a page of a normal document. After conversion (E
3), and send it to the critical expression extraction unit 15 (E4). If there is no critical expression on the page (E5), the page is discarded, the process returns to E2, and the input of the next page is awaited.

【0067】該当ページに批評表現が存在すれば(E
5)、このページを類似度算出部18へ送出して(E
6)、類似度を得る。そして、該当ページと類似度とを
記憶保持する(E7)。
If a critique expression exists on the corresponding page (E
5) Then, this page is sent to the similarity calculation unit 18 (E
6) Obtain similarity. Then, the corresponding page and the similarity are stored and held (E7).

【0068】E8において、情報取得部12aから今回
の周期におけるページのアクセス終了通知が入力する
と、記憶した全てのページと類似度とを検索結果編集部
19へ送出する(E9)。そして、その編集された検索
結果を出力部20へ送出する(E10)。
At E8, when a page access end notification in this cycle is input from the information acquisition unit 12a, all the stored pages and the similarity are sent to the search result editing unit 19 (E9). Then, the edited search result is sent to the output unit 20 (E10).

【0069】このように構成された第2実施形態の情報
検索装置においては、ユーザが指定した各テーマに対し
て頻繁に批評を行うWebサイト(ホームページ)のア
ドレスが予め選択されており、この選択された複数のペ
ージの内容が周期的に読取られ、内容が更新されたペー
ジに対してのみ、批評表現抽出処理及び類似度算出処理
が実施される。したがって、ユーザが指定したテーマに
対する批評が記載されているページをより効率的に検索
できる。また、監視することが可能となる。
In the information retrieval apparatus of the second embodiment configured as described above, the address of a Web site (home page) that frequently criticizes each theme specified by the user is selected in advance, and this selection is performed. The contents of the plurality of pages thus read are periodically read, and only the pages whose contents have been updated are subjected to the critical expression extraction processing and the similarity calculation processing. Therefore, it is possible to more efficiently search for a page in which criticism of the theme specified by the user is described. In addition, it becomes possible to monitor.

【0070】(第3実施形態)図13は本発明の第3実
施形態に係わる情報検索装置の概略構成を示すブロック
図である。図9に示す第2実施形態の情報検索装置と同
一部分には同一符号を付して重複する部分の詳細説明を
省略する。
(Third Embodiment) FIG. 13 is a block diagram showing a schematic configuration of an information retrieval apparatus according to a third embodiment of the present invention. The same portions as those of the information search device of the second embodiment shown in FIG. 9 are denoted by the same reference numerals, and detailed description of the overlapping portions will be omitted.

【0071】この第3実施形態の情報検索装置において
は、第2実施形態の情報検索装置の検索結果編集部19
を図示する新たな検索結果編集部19aに置き換え、さ
らに、検索結果編集部19aに参照ページ(参照電子情
報)検索部29が接続され、参照ページデータベース3
0及び参照ページデータベース作成部31が設けられて
いる。その他の構成は図9に示す第2実施形態の情報検
索装置とほぼ同一である。
In the information search device of the third embodiment, the search result editing unit 19 of the information search device of the second embodiment
Is replaced by a new search result editing unit 19a shown in the figure, and a reference page (reference electronic information) search unit 29 is connected to the search result editing unit 19a.
0 and a reference page database creation unit 31 are provided. Other configurations are almost the same as those of the information search device of the second embodiment shown in FIG.

【0072】参照ページデータベース30内には、図1
4に示すように、例えば、情報取得部12aにて取得し
た各ページを特定するアドレスと、該当アドレスのペー
ジの本文内に参照すべきと記載(引用)されたアドレス
とが記憶されている。図15は、1つのページ内におけ
る「ページのアドレス」と「ページ内で引用されたアド
レス」との関係を示す図である。
In the reference page database 30, FIG.
As shown in FIG. 4, for example, an address specifying each page acquired by the information acquiring unit 12a and an address described (quoted) to be referred to in the text of the page of the corresponding address are stored. FIG. 15 is a diagram showing the relationship between the “page address” and the “address quoted in the page” in one page.

【0073】例えば、2番目の「def.ne.jp/def.html」
のアドレスを有するページには、「ccc.co.jp/xxx/pc.h
tml」と「abc.ne.jp/~xxx/pcn1.html」との2つのアド
レスが記載(引用)されていることを示す。
For example, the second “def.ne.jp/def.html”
Page with the address `` ccc.co.jp/xxx/pc.h
two addresses of tml "and" abc.ne.jp/ ~ xxx / pcn1.html "indicating that have been described (reference) is.

【0074】この参照ページデータベース30に対する
「ページのアドレス」と「ページ内で引用されたアドレ
ス」の登録は、係員が手作業で実施してもよいが、参照
ページデータベース作成部31が自動で登録することも
可能である。この場合、参照ページデータベース作成部
31は、図19の流れ図に従って、作成処理を実施す
る。
The registration of the “page address” and the “address quoted in the page” in the reference page database 30 may be manually performed by a staff member, but the reference page database creation unit 31 automatically registers the address. It is also possible. In this case, the reference page database creation unit 31 performs the creation process according to the flowchart of FIG.

【0075】情報取得部12aにて取得した各ページか
ら1個又は複数の引用アドレスを抽出する(H1)。そ
して、ページのアドレスと引用アドレスとの関係を参照
ページデータベース30へ登録する(H2)。
One or more cited addresses are extracted from each page obtained by the information obtaining unit 12a (H1). Then, the relationship between the page address and the quoted address is registered in the reference page database 30 (H2).

【0076】具体的には、図16において、変数「*A
*」には「abc.ne.jp/~xxx/pcnl.html」などが、参照ペ
ージとして認識されることになる。
Specifically, in FIG. 16, the variable “* A
* The "and" abc.ne.jp/ ~ xxx / pcnl.html ", is to be recognized as a reference page.

【0077】参照ページ検索部29は、検索結果編集部
19aから指定された、テーマに対して類似度が高いペ
ージのアドレスを本文中(ページ内)に記載(引用)し
たページを示す参照ページを、参照ページデータベース
30を用いて検索する。したがって、参照ページデータ
ベース30における「ページのアドレス」が参照ページ
となる。
The reference page search section 29 retrieves a reference page indicating a page in which the address of a page having a high degree of similarity to the theme is specified (quoted) in the text (within the page) specified by the search result editing section 19a. , Using the reference page database 30. Therefore, the “page address” in the reference page database 30 is the reference page.

【0078】そして、検索結果編集部19aは図17の
流れ図に従って制御部11から入力された各ページに対
する編集処理を実施する。
Then, the search result editing unit 19a performs an editing process on each page input from the control unit 11 according to the flowchart of FIG.

【0079】制御部11から類似度が付された各ページ
が入力されると、この各ページを類似度順にソートする
(F1)。次に、このソーティング結果の順に、各ペー
ジの見出しを箇条書きの形式で編集する(F2)。次
に、各ページ毎に、該当ページのアドレスを本文中に引
用する他のページ、すなわち参照ページを検索するため
の図20、図21に示す参照ページボタン32を付加す
る。
When each page with similarity is input from the control section 11, the pages are sorted in order of similarity (F1). Next, the headings of each page are edited in a bulleted format in the order of the sorting results (F2). Next, for each page, a reference page button 32 shown in FIGS. 20 and 21 for searching for another page that quotes the address of the corresponding page in the text, that is, a reference page, is added.

【0080】次に、参照ページ検索部29に対して、入
力された各ページに対する参照ページの検索指令を送出
して、各ページに対する参照ページの各アドレス(参照
アドレス)を得る(F4)。このアドレスに基づいて、
参照ページ検索画面を作成し(F5)、前記参照ページ
ボタン32からこのページへリンクする。
Next, a reference page search command for each input page is sent to the reference page search unit 29 to obtain each address (reference address) of the reference page for each page (F4). Based on this address,
A reference page search screen is created (F5), and the reference page button 32 is linked to this page.

【0081】さらに、ページの地の文(本文)から要約
を生成して編集する(F6).要約の生成としては、た
とえば、ページの前方から数文を取り出すといった簡単
な処理でもよい。最後に、各ページの編集結果及び各ペ
ージの参照ページ(参照アドレス)の検索結果を制御部
11へ返信する(F7)。
Further, a summary is generated from the sentence (text) on the ground of the page and edited (F6). The generation of the summary may be a simple process of extracting several sentences from the front of the page, for example. Finally, the editing result of each page and the search result of the reference page (reference address) of each page are returned to the control unit 11 (F7).

【0082】参照ページ検索部29は、図18に示す流
れ図に従って、各ページに対する参照ページの検索処理
を実行する。
The reference page search unit 29 executes a reference page search process for each page according to the flowchart shown in FIG.

【0083】制御部11から入力されたページのアドレ
スが、図18に示す流れ図に従って、参照ページ検索結
果画面を作成する。例えば、入力されたページのアドレ
スが「http://abc.ne.jp/~xxx/pcnl.html」の場合、「a
bc.ne.jp/~xxx/pcnl.html」というページを本文中に引
用(記載)しているページ(参照ページ)を検索する
(G1)。「abc.ne.jp/~xxx/pcnl.html」は、参照ペー
ジデータベース30内の2番目の右欄に記載されている
ので、2番目の左欄に記載されているページのアドレス
である「def.ne.jp/def.html」が参照ページのアドレス
となる。
The page address input from the control unit 11 creates a reference page search result screen according to the flowchart shown in FIG. For example, if the address of the input page is "http://abc.ne.jp/ ~ xxx / pcnl.html", "a
bc.ne.jp/ ~ xxx / pcnl.html "quoted the page in the text that (as described) and to find the page (see page) and (G1). Since “abc.ne.jp/ ~ xxx / pcnl.html” is described in the second right column in the reference page database 30, it is the address of the page described in the second left column. def.ne.jp/def.html "is the address of the reference page.

【0084】参照ページのアドレスが検索されると(G
2)、この参照ページのアドレスを検索結果編集部19
aへ返信する(G3)。参照ページのアドレスが検索さ
れないと(G3)、参照ページ無しを検索結果編集部1
9aへ返信する(G4)。
When the address of the reference page is searched (G
2), the address of this reference page is entered into the search result editing unit 19
Reply to a (G3). If the address of the reference page is not searched (G3), the search result editing unit 1 determines that there is no reference page.
Reply to 9a (G4).

【0085】出力部20は、制御部11から入力された
検索結果編集部19aで編集された各ぺージ及び各ペー
ジの参照ページを例えば表示器に表示出力する。
The output unit 20 displays each page and the reference page of each page edited by the search result editing unit 19a input from the control unit 11, for example, on a display.

【0086】上記の説明では、参照ページの検索結果画
面に対するアクセスでは、参照ページボタン32からそ
のページへのリンクとしたが、直接参照ページ検索装置
への検索式としてもよい。その例を図23に示す。
In the above description, in accessing the search result screen of the reference page, the reference page button 32 is used as a link to the page. However, a search formula for the direct reference page search device may be used. An example is shown in FIG.

【0087】ここで、検索式、「../cig-bin/kensaku./
cig/?kw=abc.ne.jp/~xxx/pcnl.html」は、参照ページ検
索装置(kensaku.cgi)に対して、「abc.ne.jp/~xxx/pc
nl.html」というページを検索するように指示すること
を意味している。
Here, the search expression “../cig-bin/kensaku./
cig /? kw = abc.ne.jp / ~ xxx / pcnl.html ”indicates to the reference page search device (kensaku.cgi) that“ abc.ne.jp/ ~ xxx / pc
nl.html ".

【0088】図20〜図27にその表示出力例を示す。FIGS. 20 to 27 show examples of the display output.

【0089】図20の例においては、1,2,3の各ペ
ージが類似度順に配列されているが、各ページは、見出
し22と、アドレス23と、要約24と、参照ページボ
タン32とが表示される。図21の例においては、図2
0の例に対して参照ページボタン32の位置が異なるの
みである。
In the example shown in FIG. 20, pages 1, 2, and 3 are arranged in order of similarity. Each page has a heading 22, an address 23, a summary 24, and a reference page button 32. Is displayed. In the example of FIG.
Only the position of the reference page button 32 is different from the example of 0.

【0090】図22の例においては、図20、図21に
おける類似度が最も高い1番のページの参照ページボタ
ン32をクリックした場合における該当ページを本文中
に参照すべきと引用されたページ(参照ページ)の一覧
を示す。
In the example shown in FIG. 22, when the reference page button 32 of the first page having the highest similarity in FIGS. Page).

【0091】図23は、図20をHTML形式で記載し
た例である。さらに、図24は、参照ページ数を表示し
た例である。また、図25は、各ページを参照ページ数
順に並べ替えた例である。
FIG. 23 is an example in which FIG. 20 is described in the HTML format. FIG. 24 is an example in which the number of reference pages is displayed. FIG. 25 is an example in which each page is rearranged in the order of the number of reference pages.

【0092】図26は、各ページにおける参照ページ数
が前回の周期に比較して増加したか減少したかを示した
例である。さらに、図27は、1つのページにおける参
照ページ数の時間経緯を示す図である。
FIG. 26 is an example showing whether the number of reference pages in each page has increased or decreased compared to the previous cycle. FIG. 27 is a diagram illustrating the time history of the number of reference pages in one page.

【0093】このように構成された第3実施形態の情報
検索装置においては、ユーザが指定したテーマを批評す
るページを本文中に参照すべきとき記述したページ、す
なわち参照ページのアドレスやその参照ページ数が検索
される。
In the information retrieval apparatus of the third embodiment configured as described above, a page describing a page that criticizes a theme specified by a user when it should be referred to in the text, that is, the address of the reference page and the reference page thereof The number is searched.

【0094】したがって、ユーザは、自己が指定するテ
ーマに対する世間の批評を高い精度で得ることが可能で
ある。
Therefore, the user can obtain public criticism with respect to the theme specified by the user with high accuracy.

【0095】なお、本発明は上述した各実施形態に限定
されるものではない。例えば、図13の第3実施形態の
情報検索装置において、批評表現抽出部15及び批評表
現辞書14を除去することが可能である。また、情報所
得部12aに代えて図2に示す第1実施形態の情報検索
装置における情報所得部12を採用することが可能であ
る。
The present invention is not limited to the above embodiments. For example, in the information search device of the third embodiment shown in FIG. 13, the critical expression extraction unit 15 and the critical expression dictionary 14 can be eliminated. Further, the information income unit 12 in the information search device of the first embodiment shown in FIG. 2 can be used instead of the information income unit 12a.

【0096】このように構成された情報検索装置におい
ては、ユーザは、自己が指定したテーマに対して、その
批判や評価の批評はともかく、該当テーマにおける世間
の注目度を定量的に把握できる。
In the information retrieval apparatus configured as described above, the user can quantitatively grasp the degree of public attention on the theme specified by the user, regardless of criticism or evaluation of the theme specified by the user.

【0097】また、上記の例では、Webページについ
て説明したが、電子メール、ニュース、そのほか種々の
電子情報に対しても応用することはもちろん可能であ
る。また、あるページを参照しているページ情報の提供
は、今回の実施形態の情報検索装置のように、ページの
文書を検索する装置のみに限らない。一定の文書を提供
する情報提供装置の場合に関しても、文書格納表現の抽
出及びそれから得られた文書格納位置をキーとした参照
文書(参照ページ)の検索を行なうことにより、参照文
書(参照ページ)を提供することは可能である。
In the above example, a Web page has been described, but it is of course possible to apply to electronic mail, news, and various other electronic information. Further, the provision of the page information referring to a certain page is not limited to the apparatus for searching the document of the page as in the information search apparatus of the present embodiment. In the case of an information providing apparatus for providing a certain document, the reference document (reference page) is extracted by extracting the document storage expression and searching for the reference document (reference page) using the obtained document storage position as a key. It is possible to provide

【0098】また、この発明の手法をサーバ側で実現
し、関連情報を付与した文書を電子メールで送付するこ
とも可能であるし、ユーザ側のクライアントがHTTP
のプロトコルに従って読み出すように実現することも可
能である。また、単純のシステムとして実現した場合に
は、個人のパーソナルコンピュータやワークステーショ
ン上などで動作させて、ハイパーテキストを表示するた
めのブラウザで読み出させることでも実現可能である。
It is also possible to implement the method of the present invention on the server side and send a document to which related information has been added by e-mail.
It is also possible to realize so as to read out according to the protocol described above. When the system is realized as a simple system, it can be realized by operating on a personal computer or a work station of an individual and reading it out by a browser for displaying hypertext.

【0099】なお、各実施形態に説明した各情報検索装
置は、記憶媒体に格納したプログラムをコンピュータに
読み込ませることで実現させることができる。
Each information search device described in each embodiment can be realized by causing a computer to read a program stored in a storage medium.

【0100】ここで本発明における記憶媒体としては、
磁気ディスク、フロッピーディスク、ハードディスク、
光ディスク(CD−ROM、CD−R、DVD等)、光
磁気ディスク(MO等)、半導体メモリ等、プログラム
を記憶でき、かつコンピュータが読み取り可能な記憶媒
体であれば、その記憶形式は何れの形態であってもよ
い。
Here, as the storage medium in the present invention,
Magnetic disk, floppy disk, hard disk,
Any storage medium that can store a program and can be read by a computer, such as an optical disk (CD-ROM, CD-R, DVD, etc.), a magneto-optical disk (MO, etc.), a semiconductor memory, etc. It may be.

【0101】また、記憶媒体からコンピュータにインス
トールされたプログラムの指示に基づきコンピュータ上
で稼働しているOS(オペレーティングシステム)や、
データベース管理ソフト、ネットワークソフト等のMW
(ミドルウェア)等が本実施形態を実現するための各処
理の一部を実行してもよい。
An OS (Operating System) running on the computer based on instructions of a program installed in the computer from the storage medium,
MW for database management software, network software, etc.
(Middleware) or the like may execute a part of each process for realizing the present embodiment.

【0102】さらに、本発明における記憶媒体は、コン
ピュータと独立した媒体に限らず、LANやインターネ
ット等により伝送されたプログラムをダウンロードして
記憶又は一時記憶した記憶媒体も含まれる。
Further, the storage medium in the present invention is not limited to a medium independent of a computer, but also includes a storage medium in which a program transmitted via a LAN, the Internet, or the like is downloaded and stored or temporarily stored.

【0103】また、記憶媒体は1つに限らず、複数の媒
体から本実施形態における処理が実行される場合も本発
明における記憶媒体に含まれ、媒体構成は何らの構成で
あってもよい。
The number of storage media is not limited to one, and the case where the processing in this embodiment is executed from a plurality of media is also included in the storage media of the present invention, and the media configuration may be any configuration.

【0104】なお、本発明におけるコンピュータは、記
憶媒体に記憶されたプログラムに基づき、本実施形態に
おける各処理を実行するものであって、パソコン等の1
つからなる装置、複数の装置がネットワーク接続された
システム等の何れの構成であってもよい。
The computer according to the present invention executes each process in the present embodiment based on a program stored in a storage medium.
Any configuration such as a single device, a system in which a plurality of devices are connected to a network, or the like may be used.

【0105】また、本発明におけるコンピュータとは、
パソコンに限らず、情報処理機器に含まれる演算処理装
置、マイコン等も含み、プログラムによって本発明の機
能を実現することが可能な機器、装置を総称している。
Further, the computer in the present invention is:
It is not limited to a personal computer, but also includes a processing device, a microcomputer, and the like included in an information processing device, and generically refers to a device and a device capable of implementing the functions of the present invention by a program.

【0106】[0106]

【発明の効果】以上説明したように、本発明の情報検索
装置、情報検索方法、及びプログラムを記憶した記憶媒
体においては、ユーザが指定したテーマに関する情報が
記載されたWebページ等の電子情報の中から該当テー
マに対する批評が記載された電子情報のみを確実に検索
できる。
As described above, in the information search device, the information search method, and the storage medium storing the program of the present invention, electronic information such as a Web page in which information on a theme designated by a user is described. It is possible to reliably search only electronic information in which criticisms on the subject are described.

【0107】さらに、該当テーマに対する批評が記載さ
れた電子情報を参照すべきと記載した電子情報をも検索
している。したがって、該当テーマに対する世間の批評
をより正確に定量的に把握できる。
[0107] Further, the electronic information in which it is necessary to refer to the electronic information in which the criticism of the subject is described is searched. Therefore, public criticism of the subject can be grasped more accurately and quantitatively.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1実施形態に係わる情報検索装置の
ハード構成図
FIG. 1 is a hardware configuration diagram of an information search device according to a first embodiment of the present invention.

【図2】同第1実施形態に係わる情報検索装置の概略構
成を示すブロック図
FIG. 2 is a block diagram showing a schematic configuration of an information search device according to the first embodiment;

【図3】同第1実施形態に係わる情報検索装置に組込ま
れた批評表現辞書の記憶内容を示す図
FIG. 3 is a diagram showing storage contents of a critical expression dictionary incorporated in the information search device according to the first embodiment;

【図4】同第1実施形態に係わる情報検索装置に組込ま
れた批評表現抽出部の処理内容を示す流れ図
FIG. 4 is a flowchart showing the processing contents of a critical expression extracting unit incorporated in the information search device according to the first embodiment;

【図5】同第1実施形態に係わる情報検索装置に組込ま
れた検出結果編集部の処理内容を示す流れ図
FIG. 5 is a flowchart showing processing contents of a detection result editing unit incorporated in the information search device according to the first embodiment;

【図6】同第1実施形態に係わる情報検索装置に組込ま
れた出力部にて出力された検索結果を示す図
FIG. 6 is a view showing a search result output from an output unit incorporated in the information search device according to the first embodiment;

【図7】同第1実施形態に係わる情報検索装置に組込ま
れた出力部にて出力された検索結果を示す図
FIG. 7 is a view showing a search result output from an output unit incorporated in the information search device according to the first embodiment;

【図8】同第1実施形態に係わる情報検索装置に組込ま
れた制御部の処理内容を示す流れ図
FIG. 8 is a flowchart showing the processing contents of a control unit incorporated in the information search device according to the first embodiment.

【図9】本発明の第2実施形態に係わる情報検索装置の
概略構成を示すブロック図
FIG. 9 is a block diagram showing a schematic configuration of an information search device according to a second embodiment of the present invention.

【図10】同第2実施形態に係わる情報検索装置に組込
まれた監視ページリストの記憶内容を示す図
FIG. 10 is a diagram showing storage contents of a monitoring page list incorporated in the information search device according to the second embodiment.

【図11】同第2実施形態に係わる情報検索装置に組込
まれた情報取得部の処理内容を示す流れ図
FIG. 11 is a flowchart showing the processing contents of an information acquisition unit incorporated in the information search device according to the second embodiment.

【図12】同第2実施形態に係わる情報検索装置に組込
まれた制御部の処理内容を示す流れ図
FIG. 12 is a flowchart showing processing contents of a control unit incorporated in the information search device according to the second embodiment.

【図13】本発明の第3実施形態に係わる情報検索装置
の概略構成を示すブロック図
FIG. 13 is a block diagram illustrating a schematic configuration of an information search device according to a third embodiment of the present invention.

【図14】同第3実施形態に係わる情報検索装置に組込
まれた参照ページデータベースの記憶内容を示す図
FIG. 14 is a diagram showing storage contents of a reference page database incorporated in the information search device according to the third embodiment.

【図15】ページのアドレスとページ内で引用されたア
ドレスとの関係を説明するための図
FIG. 15 is a view for explaining a relationship between a page address and an address quoted in the page;

【図16】ページ参照表現パターンと参照ページとの関
係を示す図
FIG. 16 is a diagram showing a relationship between a page reference expression pattern and a reference page.

【図17】同第3実施形態に係わる情報検索装置に組込
まれた検索結果編集部の処理内容を示す流れ図
FIG. 17 is a flowchart showing the processing contents of a search result editing unit incorporated in the information search device according to the third embodiment;

【図18】同第3実施形態に係わる情報検索装置に組込
まれた参照ページ検索部の処理内容を示す流れ図
FIG. 18 is a flowchart showing the processing contents of a reference page search unit incorporated in the information search device according to the third embodiment.

【図19】同第3実施形態に係わる情報検索装置に組込
まれた参照ページデータベース作成部の処理内容を示す
流れ図
FIG. 19 is a flowchart showing processing contents of a reference page database creation unit incorporated in the information search device according to the third embodiment.

【図20】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 20 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment;

【図21】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 21 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment.

【図22】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 22 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment.

【図23】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 23 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment.

【図24】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 24 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment.

【図25】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 25 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment.

【図26】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 26 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment.

【図27】同第3実施形態に係わる情報検索装置に組込
まれた出力部にて出力された検索結果を示す図
FIG. 27 is a diagram showing a search result output from an output unit incorporated in the information search device according to the third embodiment.

【符号の説明】[Explanation of symbols]

11…制御部 12,12a…情報取得部 13…書式解析部 14…批評表現辞書 15…批評表現抽出部 16…検索対象テーマメモリ 17…検索式 18…類似度算出部 19,19a…検索結果編集部 20…出力部 21…テーマ 25…ページアクセス部 26…監視ページリスト 27…更新判定部 28…前回ページメモリ 29…参照ページ検索部 30…参照ページデータベース 31…参照ページデータベース作成部 32…参照ページボタン DESCRIPTION OF SYMBOLS 11 ... Control part 12, 12a ... Information acquisition part 13 ... Format analysis part 14 ... Critic expression dictionary 15 ... Critic expression extraction part 16 ... Search target theme memory 17 ... Search formula 18 ... Similarity calculation part 19, 19a ... Search result editing Unit 20 Output unit 21 Theme 25 Page access unit 26 Monitored page list 27 Update determination unit 28 Previous page memory 29 Reference page search unit 30 Reference page database 31 Reference page database creation unit 32 Reference page button

───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴岡 節 東京都港区芝浦一丁目1番1号 株式会社 東芝本社事務所内 (72)発明者 奥村 明子 東京都港区芝浦一丁目1番1号 株式会社 東芝本社事務所内 (72)発明者 住田 一男 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B075 KK07 ND03 PR06 PR08 QM08 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Setsu Suzuoka, Inventor 1-1-1, Shibaura, Minato-ku, Tokyo Inside Toshiba Corporation Head Office (72) Inventor Akiko Okumura 1-1-1, Shibaura, Minato-ku, Tokyo Stock (72) Inventor Kazuo Sumita 1st location, Komukai Toshiba-cho, Saiwai-ku, Kawasaki-shi, Kanagawa F-term (Reference) 5B075 KK07 ND03 PR06 PR08 QM08

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 複数の電子情報を取得する情報取得手段
と、 この情報取得手段で取得された各電子情報のうちその内
容に批評表現を含む電子情報を抽出する電子情報抽出手
段と、 この電子情報抽出手段で抽出された批評表現を含む各電
子情報における指定されたテーマの発生数や発生の重要
度を示す類似度を算出する類似度算出手段と、 前記テーマ及び該当テーマに対する類似度が高い電子情
報を特定する電子情報特定情報を出力すべき検索結果と
して編集する検索結果編集手段とを備えたことを特徴と
する情報検索装置。
1. An information acquisition unit for acquiring a plurality of electronic information, an electronic information extraction unit for extracting electronic information including a critique expression in the content of each electronic information acquired by the information acquisition unit, A similarity calculating means for calculating the similarity indicating the number of occurrences and the importance of occurrence of the designated theme in each piece of electronic information including the critique expression extracted by the information extracting means; An information search device comprising: a search result editing unit that edits electronic information specifying information for specifying electronic information as a search result to be output.
【請求項2】 前記情報取得手段は、予め指定された監
視対象の複数の電子情報の内容を周期的に読取り、この
内容が1つ前の周期で読取った内容と異なる場合のみ、
該当電子情報を取得した電子情報として前記電子情報抽
出手段へ送出することを特徴とする請求項1記載の情報
検索装置。
2. The information acquisition means periodically reads the contents of a plurality of electronic information to be monitored which are designated in advance, and only when the contents are different from the contents read in the immediately preceding cycle,
2. The information retrieval apparatus according to claim 1, wherein said electronic information is transmitted to said electronic information extracting means as acquired electronic information.
【請求項3】 前記類似度が高い電子情報を参照すべき
と記載した内容を有する参照電子情報を検索する参照電
子情報検索手段を備えたことを特徴とする請求項1又は
2記載の情報検索装置。
3. The information retrieval device according to claim 1, further comprising: reference electronic information retrieval means for retrieving reference electronic information having contents indicating that the electronic information having a high similarity should be referred to. apparatus.
【請求項4】 前記検索結果編集手段は、前記出力すべ
き検索結果に前記参照電子情報検索手段で検索された参
照電子情報を付加することを特徴とする請求項3記載の
情報検索装置。
4. The information search apparatus according to claim 3, wherein the search result editing means adds the reference electronic information searched by the reference electronic information search means to the search result to be output.
【請求項5】 複数の電子情報を取得する情報取得手段
と、 この情報取得手段で取得された各電子情報における指定
されたテーマの発生数や発生の重要度を示す類似度を算
出する類似度算出手段と、 前記類似度が高い電子情報を参照すべきと記載した内容
を有する参照電子情報を検索する参照電子情報検索手段
と、 前記テーマと該当テーマに対する類似度が高い電子情報
を特定する電子情報特定情報と前記参照電子情報とを出
力すべき検索結果として編集する検索結果編集手段とを
備えたことを特徴とする情報検索装置。
5. An information acquisition unit for acquiring a plurality of electronic information, and a similarity for calculating a similarity indicating the number of occurrences and the importance of occurrence of a designated theme in each electronic information acquired by the information acquisition unit. Calculating means; reference electronic information searching means for searching for reference electronic information having contents stating that the electronic information having a high similarity should be referred to; and electronic specifying the electronic information having a high similarity to the theme and the relevant theme An information search device comprising: a search result editing unit that edits information specifying information and the reference electronic information as search results to be output.
【請求項6】 複数の電子情報を取得するステップと、 この取得された各電子情報のうちその内容に批評表現を
含む電子情報を抽出するステップと、 この抽出された批評表現を含む各電子情報における指定
されたテーマの発生数や発生の重要度を示す類似度を算
出するステップと、 前記テーマ及び該当テーマに対する類似度が高い電子情
報を特定する電子情報特定情報を出力すべき検索結果と
して編集するステップとを有することを特徴とする情報
検索方法。
6. A step of acquiring a plurality of electronic information, a step of extracting electronic information including a critical expression in the content of each of the acquired electronic information, and a step of acquiring each electronic information including the extracted critical expression Calculating the similarity indicating the number of occurrences and the importance of the occurrence of the specified theme, and editing electronic information specifying information for specifying the theme and electronic information having high similarity to the theme as a search result to be output Performing an information search.
【請求項7】 前記複数の電子情報を取得するステップ
は、予め指定された監視対象の複数の電子情報の内容を
周期的に読取り、この内容が1つ前の周期で読取った内
容と異なる場合のみ、該当電子情報を取得した電子情報
として前記電子情報を抽出するステップへ送出すること
を特徴とする請求項6記載の情報検索方法。
7. The step of acquiring a plurality of pieces of electronic information includes periodically reading contents of a plurality of pieces of electronic information to be monitored which are specified in advance, and when the contents are different from contents read in a previous cycle. 7. The information search method according to claim 6, wherein only the electronic information is sent to the step of extracting the electronic information as the acquired electronic information.
【請求項8】 前記類似度を算出するステップの後に、
前記類似度が高い電子情報を参照すべきと記載した内容
を有する参照電子情報を検索するステップを付加したこ
とを特徴とする請求項6又は7記載の情報検索方法。
8. After the step of calculating the similarity,
8. The information retrieval method according to claim 6, further comprising a step of retrieving reference electronic information having contents indicating that the electronic information having a high similarity should be referred to.
【請求項9】 情報検索装置に組込まれたプログラムを
記憶した記憶媒体であって、前記プログラムはコンピユ
ータに対して、 複数の電子情報を取得するステップと、 この取得された各電子情報のうちその内容に批評表現を
含む電子情報を抽出するステップと、 この抽出された批評表現を含む各電子情報における指定
されたテーマの発生数や発生の重要度を示す類似度を算
出するステップと、 前記テーマ及び該当テーマに対する類似度が高い電子情
報を特定する電子情報特定情報を出力すべき検索結果と
して編集するステップとを実現させるためのコンピユー
タ読取可能なプログラムを記憶した記憶媒体。
9. A storage medium storing a program incorporated in an information search device, said program providing a computer with a step of obtaining a plurality of pieces of electronic information; Extracting the electronic information including the critical expression in the content; calculating the similarity indicating the number of occurrences and the importance of the occurrence of the specified theme in each electronic information including the extracted critical expression; And a step of editing electronic information specifying electronic information having a high degree of similarity to the relevant theme as a search result to be output as a search result to be output.
【請求項10】 前記複数の電子情報を取得するステッ
プは、予め指定された監視対象の複数の電子情報の内容
を周期的に読取り、この内容が1つ前の周期で読取った
内容と異なる場合のみ、該当電子情報を取得した電子情
報として前記電子情報を抽出するステップへ送出するこ
とを特徴とする請求項9記載のコンピユータ読取可能な
プログラムを記憶した記憶媒体。
10. The step of acquiring a plurality of pieces of electronic information includes periodically reading contents of a plurality of pieces of electronic information to be monitored which are specified in advance, and when the contents are different from the contents read in a previous cycle. 10. The storage medium storing a computer-readable program according to claim 9, wherein only the electronic information is sent to the step of extracting the electronic information as the acquired electronic information.
【請求項11】 前記類似度を算出するステップの後
に、前記類似度が高い電子情報を参照すべきと記載した
内容を有する参照電子情報を検索するステップを付加し
たことを特徴とする請求項9又は10記載のコンピユー
タ読取可能なプログラムを記憶した記憶媒体。
11. The method according to claim 9, further comprising a step of searching for reference electronic information having a content indicating that the electronic information having a high similarity should be referred to, after the step of calculating the similarity. Or a storage medium storing the computer-readable program according to 10.
JP33460099A 1999-11-25 1999-11-25 Information retrieval apparatus and storage medium storing program Expired - Fee Related JP4417497B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33460099A JP4417497B2 (en) 1999-11-25 1999-11-25 Information retrieval apparatus and storage medium storing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33460099A JP4417497B2 (en) 1999-11-25 1999-11-25 Information retrieval apparatus and storage medium storing program

Publications (2)

Publication Number Publication Date
JP2001155021A true JP2001155021A (en) 2001-06-08
JP4417497B2 JP4417497B2 (en) 2010-02-17

Family

ID=18279214

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33460099A Expired - Fee Related JP4417497B2 (en) 1999-11-25 1999-11-25 Information retrieval apparatus and storage medium storing program

Country Status (1)

Country Link
JP (1) JP4417497B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139412A (en) * 2004-11-10 2006-06-01 Denso It Laboratory Inc Apparatus and method of browsing information
JP2008299842A (en) * 2007-05-29 2008-12-11 Nhn Corp Reaction information providing method by advertisement execution, computer readable recording medium, and reaction information providing system by advertisement execution
US7599926B2 (en) 2006-02-17 2009-10-06 Fujitsu Limited Reputation information processing program, method, and apparatus
WO2010024184A1 (en) * 2008-08-26 2010-03-04 日本電気株式会社 Rumor information detecting system, rumor information detecting method, and program
JP2010074573A (en) * 2008-09-19 2010-04-02 Konica Minolta Business Technologies Inc Image processing apparatus, image forming apparatus, index generating method, and index generating program
JP2010108517A (en) * 2010-01-13 2010-05-13 Fujitsu Ltd Content retrieval program, content retrieval method, and content retrieval device

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006139412A (en) * 2004-11-10 2006-06-01 Denso It Laboratory Inc Apparatus and method of browsing information
JP4498892B2 (en) * 2004-11-10 2010-07-07 株式会社デンソーアイティーラボラトリ Information browsing apparatus and information browsing method
US7599926B2 (en) 2006-02-17 2009-10-06 Fujitsu Limited Reputation information processing program, method, and apparatus
JP2008299842A (en) * 2007-05-29 2008-12-11 Nhn Corp Reaction information providing method by advertisement execution, computer readable recording medium, and reaction information providing system by advertisement execution
WO2010024184A1 (en) * 2008-08-26 2010-03-04 日本電気株式会社 Rumor information detecting system, rumor information detecting method, and program
JP2010074573A (en) * 2008-09-19 2010-04-02 Konica Minolta Business Technologies Inc Image processing apparatus, image forming apparatus, index generating method, and index generating program
JP4720884B2 (en) * 2008-09-19 2011-07-13 コニカミノルタビジネステクノロジーズ株式会社 Image processing apparatus, image forming apparatus, index generation method, and index generation program
US8154740B2 (en) 2008-09-19 2012-04-10 Konica Minolta Business Technologies, Inc. Image processing apparatus for concatenating a read document image, method of generating an index of a concatenated image, and computer-readable recording medium having index generation program recorded
JP2010108517A (en) * 2010-01-13 2010-05-13 Fujitsu Ltd Content retrieval program, content retrieval method, and content retrieval device

Also Published As

Publication number Publication date
JP4417497B2 (en) 2010-02-17

Similar Documents

Publication Publication Date Title
US7783644B1 (en) Query-independent entity importance in books
JPH10143532A (en) Information filtering device/method
EP2019361A1 (en) A method and apparatus for extraction of textual content from hypertext web documents
JP2007122513A (en) Content retrieval method, and content retrieval server
US20100030813A1 (en) Automatic updating of content included in research documents
JP2003228585A (en) Method of controlling file, and file controller capable of using the method
JPH11224256A (en) Information retrieving method and record medium recording information retrieving program
JP4091146B2 (en) Document retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP2003271609A (en) Information monitoring device and information monitoring method
US20110252313A1 (en) Document information selection method and computer program product
KR100455439B1 (en) Internet resource retrieval and browsing method based on expanded web site map and expanded natural domain names assigned to all web resources
JP2007188330A (en) Structured document extractor, structured document extraction method, and structured document extraction program
JP4417497B2 (en) Information retrieval apparatus and storage medium storing program
JP2009086944A (en) Information processor and information processing program
JP4610543B2 (en) Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program
JP2006302024A (en) Relevant document display method and program
JP3683687B2 (en) Information filtering apparatus and information filtering method
JP2001209655A (en) Information providing device, information updating method, recording medium having information providing program recorded thereon and information providing system
JP2001265774A (en) Method and device for retrieving information, recording medium with recorded information retrieval program and hypertext information retrieving system
JPH11143885A (en) Method and device for information retrieval, storage medium for storing information retrieval program, method and device for information transmission, and storage medium for storing information transmission program
JP2002288189A (en) Method and apparatus for classifying documents, and recording medium with document classification processing program recorded thereon
JP2002049638A (en) Document information retrieval device, method, document information retrieval program and computer readable recording medium storing document information retrieval program
JP3543726B2 (en) Knowledge search service method and apparatus for supporting search of books and the like
JP2011086156A (en) System and program for tracking of leaked information
KR100371805B1 (en) Method and system for providing related web sites for the current visitting of client

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20041203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070320

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070518

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070710

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091126

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees