JPH10289244A - Method and device for document retrieval delivering - Google Patents

Method and device for document retrieval delivering

Info

Publication number
JPH10289244A
JPH10289244A JP9096929A JP9692997A JPH10289244A JP H10289244 A JPH10289244 A JP H10289244A JP 9096929 A JP9096929 A JP 9096929A JP 9692997 A JP9692997 A JP 9692997A JP H10289244 A JPH10289244 A JP H10289244A
Authority
JP
Japan
Prior art keywords
search
news
search condition
document
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9096929A
Other languages
Japanese (ja)
Inventor
Takuya Okamoto
卓哉 岡本
Hideko Murata
英子 村田
Natsuko Sugaya
菅谷  奈津子
Mitsuru Akisawa
充 秋沢
Noriyuki Yamazaki
山崎  紀之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9096929A priority Critical patent/JPH10289244A/en
Publication of JPH10289244A publication Critical patent/JPH10289244A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a system which changes a retrieval condition automatically or after a user's confirmation and sets a retrieval condition with higher accuracy when much news is distributed. SOLUTION: A news clipping system 101 preliminarily retrieves news that is sent to a clipping process 108 on a retrieval condition that is set by a user by utilizing a WWW(world wide wave) browser 121, a mail reader 122, etc. Only news that is suitable for the retrieval condition is fetched, and a news distribution process 109 distributes the information to a user and counts the number of news that are distributed to each user. When the value exceeds a value set by a user, a retrieval condition change request process 115 notifies to the user that he should change a retrieval condition expression because the number of distributed news exceeds the set value.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、インターネットを
利用した文書検索配信システムに関する。特に、複数ユ
ーザが設定した検索条件について、条件を満たす文書を
各ユーザに即座に配送する情報フィルタリングシステム
に適用できる。また、大量の文書データから必要な文書
を取得する文書検索装置にも適用できる。
[0001] 1. Field of the Invention [0002] The present invention relates to a document search and delivery system using the Internet. In particular, the present invention can be applied to an information filtering system that immediately delivers a document that satisfies a search condition set by a plurality of users to each user. Further, the present invention can be applied to a document search device that acquires a necessary document from a large amount of document data.

【0002】[0002]

【従来の技術】インターネットを利用したメールシステ
ムやニュースシステム、WWW(WorldWide Web)による
情報の取得などの技術が広範囲に利用されている。これ
らの技術は、コンピュータを繋ぐネットワークを利用し
て、各種のプロトコルに基づくコンピュータ間の通信技
術を利用しており、この技術によってメールやニュー
ス、WWWでの情報の配送が実現されている。
2. Description of the Related Art Technologies such as a mail system and a news system using the Internet, and information acquisition by the WWW (World Wide Web) are widely used. These technologies utilize a communication technology between computers based on various protocols using a network connecting the computers, and the delivery of mail, news, and WWW information is realized by this technology.

【0003】検索条件に適合したニュースを配信するた
めの従来技術としては、1日分のニュースを蓄積して、
情報の分類および検索条件に対するスコアの取得を行
い、スコアの上位から所定の件数のニュースを選択し、
1日1回配送する蓄積型の情報フィルタリングシステムが
ある。
[0003] As a conventional technique for distributing news meeting search conditions, one day's worth of news is accumulated.
Classify information and obtain scores for search conditions, select a predetermined number of news from the top of the score,
There is a storage-type information filtering system that delivers once a day.

【0004】複数の文書から共通して出現するワードを
抽出し、得られたワードによる文書グループを作成する
手法は、特開平8−153121号公報「文書情報分類
方法および文書情報分類装置」などに示されており、本
手法では形態素解析で得られた単語を基に、複数文書の
グループ化を実施している。
A technique of extracting words that appear in common from a plurality of documents and creating a document group based on the obtained words is disclosed in Japanese Patent Application Laid-Open No. 8-153121, “Document Information Classification Method and Document Information Classification Device”. As shown, in this method, multiple documents are grouped based on words obtained by morphological analysis.

【0005】即時性が求められるニュース配送システム
としては、本出願人が出願した特願平8−201348
号「文書検索配送方法及び装置」に、複数ユーザの検索
条件を統合して、1度のテキストスキャンにより複数ユ
ーザの条件式を処理する方法が示されている。本方法に
より、与えられた検索条件に適合するニュースをリアル
タイムでユーザに送信するニュースクリッピングシステ
ムを実現することができる。
[0005] As a news delivery system requiring immediacy, Japanese Patent Application No. 8-201348 filed by the present applicant has been proposed.
In the issue “Document Search and Delivery Method and Apparatus”, a method of integrating search conditions of a plurality of users and processing a conditional expression of a plurality of users by one text scan is disclosed. According to this method, it is possible to realize a news clipping system that transmits news that matches a given search condition to a user in real time.

【0006】検索条件には、複数のキーワードの出現の
有無を組み合わせた論理式を作成し、この論理式が成立
したか否かで判定する方法が多く用いられる。論理式の
処理に関しては、特開平8−101841号公報「文書
検索方法及びその装置」などで高速化の手法が提案され
ている。本手法は、各タームの出現の有無をチェックし
たのち、検索条件式を論理積の要素の論理和で得られる
式に変形した上で、処理を行なう手法である。論理積は
その式を構成する1つの要素でも成立しない場合は、全
体が不成立となり、論理和は式を構成する要素が1つだ
けでも成立すれば全体が成立するという性質を利用し、
全てのタームの存在の有無をチェックしなくても論理式
の成立、不成立を評価することができる。例えば、
「(A&B)|C」は、タームAとタームBが出現する
か、あるいは、タームCが出現すれば論理式が成立する
検索条件である。この場合、各タームの出現の有無をチ
ェックした上で、タームAとタームBのいずれも出現し
ているか否かのチェック、タームCが出現しているか否
かのチェックを行なう。いずれかの条件が成立していれ
ば、この条件は成立することになるので、A&Bが成立
した時点で、Cの評価を行なわなくても、本論理式の評
価を終えることができるため、高速な論理判定が可能で
ある。
As a search condition, a method is often used in which a logical expression combining the presence or absence of a plurality of keywords is created, and a determination is made based on whether the logical expression is satisfied. Regarding the processing of logical expressions, a technique for speeding up the processing is proposed in Japanese Patent Application Laid-Open No. H8-101841, "Document Search Method and Apparatus". This method is a method in which, after checking whether or not each term appears, a search condition expression is transformed into an expression obtained by a logical sum of elements of a logical product, and then processing is performed. If the logical product does not hold even for one element that constitutes the expression, the whole will be unsatisfied, and the logical sum uses the property that if only one element that makes up the expression holds, the whole will hold,
It is possible to evaluate whether a logical expression has been established or not, without checking for the presence or absence of all the terms. For example,
“(A & B) | C” is a search condition in which a term A and a term B appear, or a logical expression holds when the term C appears. In this case, after checking whether or not each term has appeared, it is checked whether or not both term A and term B have appeared, and whether or not term C has appeared. If any one of the conditions is satisfied, this condition is satisfied. Therefore, when A & B is satisfied, the evaluation of the present logical expression can be completed without performing the evaluation of C. Logical judgment is possible.

【0007】また、日本語文書の検索を行なう場合に、
表記方法の違い(以下、異表記と呼ぶ)を吸収する必要
がある。例えば、「インターフォン」という単語は、
「インタフォン」、「インターホン」、「インタホン」
等の異表記で記述される場合がある。これらの異表記を
全て展開した文字列を作成し、それぞれの文字列を別個
にオートマトンに登録することで、これらの異表記も検
索対象とする方法を用いると、部分的な異表記の違いの
組み合わせを全て作成し、作成された異表記を登録しな
ければならない。外来語の表示にはカタカナが用いら
れ、「ディジタルオーディオテープレコーダ」など、長
いタームがキーワードとなる場合がある。ターム長が伸
びると、部分異表記の数の増加に伴い、指数関数的に異
表記の数が増加することになる。上記手法を用いると、
登録するタームの数が増加するため、これに比例して処
理時間が増大するという問題がある。この問題を解決す
るには、畠山らの特許(特開平3−15980「文字列
検索のための異表記及び同義語展開方法」)などに示さ
れた手法を用いることで、異表記を部分的な組み合わせ
に切り分け、それぞれの部分を展開したオートマトンを
作成することで、全ての展開結果を生成することなく、
異表記の組み合わせを全て処理することができる。
[0007] Also, when searching for a Japanese document,
It is necessary to absorb the difference in the notation method (hereinafter, called different notation). For example, the word "intercom"
"Intercom", "Intercom", "Intercom"
Etc. may be described in a different notation. By creating a character string that expands all these notations and registering each character string separately in the automaton, using a method that also searches for these different notations, the difference in partial All combinations must be created and the created variant notation must be registered. Katakana is used to display foreign words, and long terms such as "digital audio tape recorders" may be keywords. As the term length increases, the number of different notations increases exponentially with the increase in the number of partial notations. Using the above method,
Since the number of terms to be registered increases, there is a problem that the processing time increases in proportion to this. To solve this problem, the technique described in the patent of Hatakeyama et al. (Japanese Unexamined Patent Application Publication No. Hei 3-15980, "Method of expanding different synonyms and synonyms for character string search") can be used to partially By creating an automaton that expands each part by dividing it into various combinations, without generating all expansion results,
All combinations of different notations can be processed.

【0008】[0008]

【発明が解決しようとする課題】[Problems to be solved by the invention]

(1)蓄積型の情報フィルタリングシステムは、一定期
間ニュースを蓄積してから情報の検索と、その検索結果
に基づく発信を行なうため、株価の変動を監視、推測す
る業務など、できるだけ早く情報を入手しようとする用
途には適さない。このような用途には、即座に情報をユ
ーザに送るためにニュースの受信時にリアルタイムに検
索条件判定を行なう、「ニュースクリッピングシステ
ム」が適している。しかし、このようなニュースクリッ
ピングシステムの問題は、検索条件の設定内容によって
は、多くの情報が適合するため、大量のニュースがユー
ザに送られる場合があることである。
(1) The storage-type information filtering system searches for information after accumulating news for a certain period of time and transmits information based on the search results. Not suitable for the intended use. For such an application, a “news clipping system” that performs search condition determination in real time when news is received so as to immediately send information to a user is suitable. However, a problem of such a news clipping system is that a large amount of news may be sent to the user because a large amount of information is suitable depending on the setting contents of the search condition.

【0009】(2)また、ニュースクリッピングシステ
ムだけでなく、その他の文書検索システムにおいて高速
処理を実現するためには、論理式の処理の高速化が必要
となる。特開平8−101841「文書検索方法及びそ
の装置」に示された手法で論理式の処理を行なった場
合、論理式を構成する検索ターム数が増大すると、これ
に比例して処理時間が大きくなるという問題がある。例
えば、本手法により、論理式{(A|B|C|D)&
(E|F|G|H)}を処理する場合、A,B,C,D
のいずれかの検索タームが存在し、かつ、E,F,G,
Hのいずれかの検索タームが存在すれば、本論理式が成
立することが分かる。逆の表現をすると、A,B,C,
Dのタームがすべて存在しないこと、あるいは、E,
F,G,Hのタームの全てが存在しないことを確認しな
ければ、本論理式に当てはまらないことが分からない。
一般的に検索条件は大量の情報から絞り込みを行なう目
的で設定していることから、多くの情報はこの論理式に
当てはまらないことになる。したがって、本従来方法を
用いると、より高い絞り込みを実現しようと、多くの検
索タームを含んだ検索条件を設定すると、論理式のチェ
ックにより多くの時間を費やすことになるという問題が
起きる。
(2) In order to realize high-speed processing not only in the news clipping system but also in other document search systems, it is necessary to speed up the processing of logical expressions. When a logical expression is processed by the method described in Japanese Patent Application Laid-Open No. H8-101841 "Document Searching Method and Apparatus", when the number of search terms constituting the logical expression increases, the processing time increases in proportion to this. There is a problem. For example, according to this method, the logical expression {(A | B | C | D) &
(E | F | G | H)}, A, B, C, D
Exists, and E, F, G,
If any search term of H exists, it is understood that the present logical expression is established. In other words, A, B, C,
That all the terms of D do not exist, or that E,
Unless it is confirmed that all of the terms of F, G, and H do not exist, it cannot be understood that the logical formula does not apply.
In general, search conditions are set for the purpose of narrowing down a large amount of information, so that much information does not apply to this logical expression. Therefore, when the conventional method is used, if a search condition including a large number of search terms is set in order to achieve a higher refinement, there is a problem that a lot of time is spent for checking a logical expression.

【0010】(3)特願平8−201348「文書検索
配送方法および装置」に、複数ユーザから指定された検
索条件の中の検索タームを抽出する処理が高速に実現で
きることが示されている。本手法により、検索条件を統
合して、1度のテキストスキャンにより複数ユーザの検
索条件を処理することができる。また、日本語の同義語
・異表記の処理に関しては、特開平3−15980「文
字列検索のための異表記及び同義語展開方法」などの手
法により高速化が可能である。しかし、これらの手法を
組み合わせて、複数ユーザに対する同義語・異表記検索
処理を行なおうとしても、以下の問題が残る。図17に
示したオートマトンを作成することで同義語・異表記検
索処理は実現できる。しかし、複数ユーザの検索条件を
統合して1つのオートマトンで処理する「ニュースクリ
ッピングシステム」などのシステムにおいては、ユーザ
ごとに同義語・異表記の展開を行なうか否かを設定でき
る。本図に示したオートマトンを利用して、同義語・異
表記の検索処理を行なうと、オートマトンのターム取得
状態が同じであるため、同義語・異表記を経由したのか
否かの区別がつかない。このため、ユーザごとに同義語
・異表記の指定ができないことになる。図18に示した
ように、全ての同義語・異表記を展開して、個々のター
ムとして登録すれば、この問題は解決するが、同義語・
異表記の組み合わせの増加とこれに伴うオートマトン作
成時間の増大という問題が残る。
[0010] (3) Japanese Patent Application No. 8-201348 "Document Search and Delivery Method and Apparatus" discloses that a process for extracting a search term from search conditions designated by a plurality of users can be realized at high speed. With this method, search conditions can be integrated, and search conditions of a plurality of users can be processed by one text scan. In addition, the processing of Japanese synonyms / different notations can be speeded up by a method such as Japanese Unexamined Patent Publication No. Heisei 3-15980, "Method of developing different notations and synonyms for character string search". However, even if these methods are combined to perform a synonym / different notation search process for a plurality of users, the following problem remains. By creating the automaton shown in FIG. 17, a synonym / different notation search process can be realized. However, in a system such as a “news clipping system” that integrates search conditions of a plurality of users and processes them with one automaton, it is possible to set whether or not to develop synonyms and different notations for each user. When the search processing for synonyms / different notations is performed using the automaton shown in this figure, it is indistinguishable whether or not the term has passed via synonyms / different notations, since the term acquisition state of the automata is the same. . For this reason, it is impossible to specify synonyms and different notations for each user. As shown in FIG. 18, this problem can be solved by expanding all synonyms and variants and registering them as individual terms.
There remains a problem that the number of combinations of different notations increases and the time required for creating an automaton increases accordingly.

【0011】本発明が解決しようとする課題は、第一
に、大量のニュースが配信される場合に、自動的あるい
はユーザの確認の後に検索条件を変更し、より高い精度
の検索条件を設定できるシステムを提供することであ
る。第二に、検索条件式が複雑になった場合の論理式の
処理の高速化を実現する方式を提供することにある。第
三に、複数ユーザの検索処理を実施する場合に、異表記
の検索処理を高速に実現する方法を提供することにあ
る。
The problem to be solved by the present invention is that, first, when a large amount of news is distributed, the search conditions can be changed automatically or after confirmation of the user, and the search conditions can be set with higher accuracy. Is to provide a system. Second, it is an object of the present invention to provide a method for speeding up processing of a logical expression when a search condition expression is complicated. Third, it is an object of the present invention to provide a method for realizing a search process of a different notation at a high speed when a search process of a plurality of users is performed.

【0012】[0012]

【課題を解決するための手段】上記第一の課題に対処す
るため、所定の時間あるいは所定日数に取得する情報数
の上限を決めておき、これを超えるようであれば、さら
に情報を絞り込むための追加条件の設定をユーザに要求
する手段を用いる。この際に、配送対象となった文書中
に多く出現するキーワードを提示することで、検索条件
設定の支援を行なう手段を用いる。または、検索条件を
自動的に変更する手段を用いる。
In order to cope with the first problem, an upper limit of the number of pieces of information to be acquired in a predetermined time or a predetermined number of days is determined. If the upper limit is exceeded, the information is further narrowed down. Means for requesting the user to set the additional condition. At this time, means for supporting the setting of search conditions by presenting keywords that appear frequently in the document to be delivered is used. Alternatively, a means for automatically changing the search condition is used.

【0013】また、第二の課題に対処するため、論理式
で論理和(OR)結合されているタームは、全て同じタ
ームとみなし、出現の有無を1つのカウンタで判定する
手段を用いる。
Further, in order to cope with the second problem, terms which are logically ORed by a logical expression are regarded as the same term, and a means for judging the presence or absence of occurrence by one counter is used.

【0014】次に、第三の課題に対処するため、同義語
・異表記の処理を行なう場合に、2つ以上のオートマト
ンを用意し、異表記を持たないタームを処理するオート
マトンと異表記を持つタームを処理するオートマトン
を、別々のオートマトンとする検索手段を用いる。
Next, in order to cope with the third problem, when performing processing of synonyms and different notations, two or more automata are prepared, and an automaton that processes terms having no different notation and a different notation are used. A search means is used in which the automata for processing the held terms are set to different automata.

【0015】[0015]

【発明の実施の形態】図1に、本発明を利用した第1の
実施例である、ニュースクリッピングシステム(10
1)の構成図を示す。本システムの処理内容は以下に示
す通りである。まず、ニュースリソース(120−1、
120−2)からは定期的にネットワーク網(124)
を経由して、ニュースが送信されてくる。ニュースクリ
ッピングシステム(101)では、ネットワーク接続プ
ロセス(102)を介して得られるこれらのニュース
を、ニュース収集プロセス(103)で受信し、順にク
リッピングプロセス(108)に送信する。ユーザは、
あらかじめ、WWWブラウザ(121)や、メールリー
ダ(122)などを利用して、検索条件や情報配送手
段、最大配信数などを設定しておく。ニュースクリッピ
ングシステム(101)では、設定された検索条件や情
報配送手段を、ネットワーク網(124)を経由して、
ネットワーク接続プロセス(102)で受信し、メール
受信プロセス(104)、WWWサーバプロセス(10
5)を経由して、検索条件取得プロセス(106)で受
け取る。検索条件取得プロセス(106)は、受信した
内容を解析し、検索条件と情報配送手段、ニュース配信
最大数等の情報を、検索条件・情報配信手段DB(10
7)に格納する。クリッピングプロセス(108)は、
検索条件・情報配信手段DB(107)から、各ユーザ
の検索条件式を読み出し、クリッピング処理用のエンジ
ンを生成する。そして、ニュース収集プロセス(10
3)から送られてくるニュースに対して、各ユーザが設
定した検索条件に対応したクリッピング処理を行ない、
検索条件に適合するニュースだけを取り出し、ニュース
配信プロセス(109)に送る。ニュース配信プロセス
(109)では、情報配信手段を、検索条件・情報配信
手段DB(107)から読み出し、検索条件式と一致し
たユーザの情報配信手段を用いて、該当情報を配信す
る。情報配信手段の1つとしては、一旦、WWW閲覧ニ
ュースDB(110)に各ユーザの検索条件に適合する
ニュースを格納した上で、HTML作成プロセス(11
1)で、ニュースの内容をWWWブラウザで見える形
式、すなわちHTML形式に変換して、WWWサーバプ
ロセス(105)から、ネットワーク網(124)を経
由して、WWWブラウザ(121)へ表示する手段があ
る。2つめの情報配信手段としては、配信するニュース
の内容をメールの形式に変換し、メール発信プロセス
(112)から、ネットワーク網(124)を経由し
て、指定されたアドレスへメールを送信する手段があ
る。ユーザは、メールリーダ(122)を用いてニュー
スを閲覧することができる。3つめの情報配信手段とし
ては、ニュースDB(113)の中のユーザの指定した
ニュースグループに検索条件に適合したニュースを格納
する手段がある。ユーザは、ニュースリーダ(123)
を用いて、ネットワーク網(124)、ニュースサーバ
プロセス(114)を経由して、そのニュースを閲覧す
る。1日毎に、各ユーザに配信したニュースの数は、ニ
ュース配信プロセス(109)でカウントされ、この値
がユーザが設定した値を超えた場合、検索条件変更要求
プロセス(115)で、ニュースの配信数が設定値を超
えているため検索条件式を変更するように通知する。そ
の通知は、ニュースの配信と同様にWWW、メール、ニ
ュースで送信される。
FIG. 1 shows a news clipping system (10) according to a first embodiment of the present invention.
The configuration diagram of 1) is shown. The processing contents of this system are as shown below. First, news resources (120-1,
From 120-2), the network (124) is periodically updated.
News is sent via. In the news clipping system (101), these news obtained via the network connection process (102) are received by the news collection process (103) and transmitted to the clipping process (108) in order. The user
Using a WWW browser (121), a mail reader (122), or the like, search conditions, information delivery means, maximum number of distributions, and the like are set in advance. In the news clipping system (101), the set search conditions and information delivery means are transmitted via the network (124).
It is received by the network connection process (102), the mail reception process (104), the WWW server process (10
The information is received by the retrieval condition acquisition process (106) via 5). The search condition acquisition process (106) analyzes the received content, and stores the search conditions and information such as information delivery means and the maximum number of news deliveries in the search condition / information delivery means DB (10).
7). The clipping process (108)
The search condition expression of each user is read from the search condition / information distribution means DB (107), and an engine for clipping processing is generated. And the news collection process (10
The clipping process corresponding to the search condition set by each user is performed on the news sent from 3),
Only news that matches the search condition is extracted and sent to the news distribution process (109). In the news distribution process (109), the information distributing means is read from the search condition / information distributing means DB (107), and the relevant information is distributed using the information distributing means of the user who matches the search condition expression. As one of the information distribution means, once a news meeting the search condition of each user is stored in the WWW browsing news DB (110), an HTML creation process (11
In 1), means for converting the content of news into a format that can be viewed with a WWW browser, that is, an HTML format, and displaying it from a WWW server process (105) to a WWW browser (121) via a network (124) is provided. is there. As the second information distribution means, means for converting the content of the news to be distributed into a mail format and transmitting the mail from the mail transmission process (112) to the designated address via the network (124) There is. The user can browse the news using the mail reader (122). As a third information distributing means, there is a means for storing news that matches a search condition in a news group specified by the user in the news DB (113). The user can use the news reader (123)
To browse the news via the network (124) and the news server process (114). The number of news distributed to each user every day is counted in the news distribution process (109). If this value exceeds the value set by the user, the news distribution is performed in the search condition change request process (115). Since the number exceeds the set value, the user is notified to change the search condition expression. The notification is transmitted by WWW, mail, and news in the same manner as news distribution.

【0016】図2は、ニュースクリッピング処理の内容
を示したフローチャートである。まず、最初に既に登録
済みのユーザの初期検索条件を読み出す(201)。そ
して、初期化処理として、検索処理用のオートマトンを
クリアし、読み出した検索条件を全て、オートマトンに
登録する(202)。初期化処理(202)の内容につ
いては、後で図3を用いて説明する。さらに、ニュース
クリッピングシステムが取得した情報をチェックし、検
索条件を取得したのであれば(203)、取得した条件
に合わせて、更新処理として、ニュースクリッピングシ
ステムの検索条件を処理するオートマトンを更新する
(204)。更新処理(204)の詳細については、後
で図6のフローチャートを用いて説明する。ニュースを
取得したのであれば(205)、このニュースに対する
クリッピング処理を行なう(206)。クリッピング処
理については、後で図7を用いて説明する。クリッピン
グ処理の結果、設定した検索条件に適合するユーザがあ
れば(207)、これらのユーザに対して、ニュースの
内容を配信する(208)。ニュース配信処理(20
8)の内容については、後で図9のフローチャートを用
いて説明する。ニュースを配信する際に、各ユーザに配
信したニュースの数を1日単位でカウントしておき(2
09)、この値が設定された値をオーバした場合は(2
10)、該当するユーザに対して、検索条件内容の変更
要求処理を実施する(211)。ニュース配信数のチェ
ック(209)については、図11のフローチャートを
用いて後述する。処理の終了を通知された場合は、ニュ
ースクリッピング処理を終了する。その他の情報であれ
ば無視して、次の情報を取得し、処理を行なう(21
2)。
FIG. 2 is a flowchart showing the contents of the news clipping process. First, an initial search condition of a user who has already been registered is read out (201). Then, as initialization processing, the automaton for search processing is cleared, and all the read search conditions are registered in the automaton (202). The contents of the initialization process (202) will be described later with reference to FIG. Further, the information obtained by the news clipping system is checked, and if the search condition is obtained (203), the automaton that processes the search condition of the news clipping system is updated as update processing according to the obtained condition ( 204). The details of the update process (204) will be described later with reference to the flowchart in FIG. If the news has been acquired (205), clipping processing for this news is performed (206). The clipping process will be described later with reference to FIG. As a result of the clipping process, if there is any user who satisfies the set search condition (207), the contents of the news are distributed to these users (208). News distribution processing (20
The content of 8) will be described later with reference to the flowchart of FIG. When news is distributed, the number of news distributed to each user is counted in units of one day (2
09), when this value exceeds the set value (2)
10) The search condition change request processing is performed for the corresponding user (211). The check of the number of news distributions (209) will be described later with reference to the flowchart of FIG. When the end of the process is notified, the news clipping process ends. If it is other information, it is ignored and the next information is obtained and the processing is performed (21).
2).

【0017】本実施例で説明する、検索用のオートマト
ンを利用した複数ユーザの検索条件の処理をテキストに
対する1度のサーチで実現する手法については、特願平
8−201348「文書検索配送方法および装置」に述
べられている手法を利用して実現できる。オートマトン
への検索タームの登録、検索処理の実施に関しても、本
公知例で述べられている方法を利用する。
A method of realizing processing of search conditions of a plurality of users using a search automaton described in the present embodiment by one search for text is described in Japanese Patent Application No. 8-201348, entitled "Document Search and Delivery Method and It can be realized using the method described in “Apparatus”. The registration of the search term in the automaton and the execution of the search process also use the method described in this known example.

【0018】図3は、初期化処理の内容を示したフロー
チャートである。まず、検索条件が存在するか否かをチ
ェックし(301)、存在するなら、保存されている検
索条件情報を読み出す(302)。読み出した検索条件
情報から、検索に必要な検索ターム、論理条件等の検索
条件の情報を抽出し(303)、抽出されたタームを検
索用のオートマトンに追加登録する(304)。
FIG. 3 is a flowchart showing the contents of the initialization processing. First, it is checked whether or not a search condition exists (301), and if so, the stored search condition information is read (302). From the read search condition information, information on search conditions such as search terms and logical conditions necessary for the search is extracted (303), and the extracted terms are additionally registered in a search automaton (304).

【0019】検索条件情報は、図4に示した形式で検索
条件格納ファイル(401)に格納されている。検索条
件名称(402)は、この検索条件を識別するため情報
である。論理条件(403)は、設定された検索ターム
の論理的な結合条件を示し、ANDの場合は論理積、つま
り全てのタームが出現する場合だけ適合すると判定され
る。ORの場合は論理和、つまりいずれかのタームが1つ
でも出現すれば、条件に適合することになる。同義語・
異表記(404)は、設定された検索タームの同義語お
よび異表記も検索タームとするか否かを設定する。
「同」は、同義語展開を行なうことを、「異」は、異表
記展開を行なうことを示す。検索ターム数(405)
は、設定された検索タームの数を示す。検索ターム(4
06−1、2)には、検索タームを順に記述する。情報
配送方法(407−1、2、3)には、WWW経由での
HTML文書の配信を希望する場合は、「HTML」と記述
し、続けてサーバ上でのニュースの保存日数を指定す
る。本図の例では、5日間の保存が指定されている。メ
ールシステムを利用して配送する場合は、「MAIL」と記
述し、続けて配信先のメールアドレスを記述する。本図
の例では「tarou@hitachi.co.jp」がメールアドレスと
して設定されている。指定したニュースグループに格納
する場合は、先頭に「NEWS」と記述し、続けて格納する
ニュースグループ名を記述する。本図の例では、「hita
chi.tarou」というニュースグループに配信ニュースが
格納されることになる。最大配信数(408)は、ユー
ザが1日に受信する最大のニュース数を設定する。
The search condition information is stored in the search condition storage file (401) in the format shown in FIG. The search condition name (402) is information for identifying the search condition. The logical condition (403) indicates a logical combination condition of the set search terms. In the case of AND, a logical product, that is, it is determined that the search condition is satisfied only when all the terms appear. In the case of OR, logical OR, that is, if any one of the terms appears, the condition is satisfied. synonym·
The different notation (404) sets whether or not a synonym and a different notation of the set search term are also used as the search term.
"Same" indicates that synonym expansion is performed, and "different" indicates different notation expansion. Number of search terms (405)
Indicates the number of set search terms. Search terms (4
In 06-1, 2), search terms are described in order. In the information delivery method (407-1, 2, 3), if distribution of an HTML document via the WWW is desired, "HTML" is described, and then the number of days for storing news on the server is specified. In the example of this figure, storage for five days is specified. When delivering using the mail system, write "MAIL" followed by the mail address of the delivery destination. In the example of this figure, "tarou@hitachi.co.jp" is set as the mail address. When storing in a specified newsgroup, "NEWS" is described at the beginning, followed by the name of the newsgroup to be stored. In the example of this figure, "hita
The distribution news will be stored in the newsgroup "chi.tarou". The maximum number of distributions (408) sets the maximum number of news that the user receives in one day.

【0020】検索条件設定のためのユーザインタフェー
スは図5に示した内容となる。ここで示した内容は、W
WWのブラウザ上で入力する場合の表示画面の例であ
る。ここで、ユーザは、検索条件名称(501)を決
め、検索の論理条件としてAND(502)かOR(5
03)の選択、検索ターム(504)などの検索条件を
設定する。さらにニュース配信方法として、メールでの
送信ならMAIL(505)を指定し、送信先のアドレ
ス(506)を指定する。WWWでの閲覧であれば、H
TML(507)を指定し、保存日数(508)を指定
する。ニュースによる配信であれば、NEWS(50
9)を選択し、配信先のニュースグループ(510)を
指定する。さらに、1日当たりの最大配信数(511)
を設定し、送信ボタン(512)をクリックすること
で、設定された内容をニュースクリッピングシステムに
送信することができる。取消ボタン(513)をクリッ
クすれば、設定内容が取り消される。
The user interface for setting the search condition has the contents shown in FIG. The content shown here is W
It is an example of a display screen when inputting on a WW browser. Here, the user determines a search condition name (501), and AND (502) or OR (5) as a search logical condition.
03), and set search conditions such as a search term (504). Further, as a news distribution method, for mail transmission, MAIL (505) is specified, and a destination address (506) is specified. For browsing on WWW, H
TML (507) is specified, and the number of storage days (508) is specified. For news distribution, NEWS (50
Select 9) and specify the newsgroup (510) of the distribution destination. Furthermore, the maximum number of distributions per day (511)
Is set, and the transmission button (512) is clicked, whereby the set contents can be transmitted to the news clipping system. If the cancel button (513) is clicked, the settings are cancelled.

【0021】図6は、更新処理の内容を示したフローチ
ャートである。まず、受信した検索条件を読み出す(6
01)。さらに検索条件の内容を解析し(602)、既
に登録されている検索条件名称と一致するか否かを判定
する(603)。一致した場合は、一致した検索条件名
称で登録された検索タームのエントリを、検索用のオー
トマトンから削除する(604)。そして削除した後
に、新しい検索条件を追加登録する(605)。新規に
登録された検索条件名称であれば、そのまま、検索用の
タームを検索用のオートマトンに追加登録する(60
5)。オートマトンへの登録後、検索条件は図4に示し
た検索条件格納ファイル(401)と同様な形式に変換
した後、検索条件・情報配信手段DBに保存する(60
6)。オートマトンへの検索タームの追加、削除の処理
は、特願平8−201348「情報検索配送方法及び装
置」に示された方法が適用できる。
FIG. 6 is a flowchart showing the contents of the updating process. First, the received search condition is read (6
01). Further, the contents of the search condition are analyzed (602), and it is determined whether or not the search condition matches a registered search condition name (603). If they match, the entry of the search term registered under the matching search condition name is deleted from the search automaton (604). After the deletion, a new search condition is additionally registered (605). If it is a newly registered search condition name, a search term is additionally registered as it is in the search automaton (60).
5). After registration in the automaton, the search conditions are converted into a format similar to the search condition storage file (401) shown in FIG. 4, and then stored in the search condition / information distribution means DB (60).
6). The processing shown in Japanese Patent Application No. 8-201348 "Information Search and Delivery Method and Apparatus" can be applied to the processing of adding and deleting search terms to an automaton.

【0022】図7に示した検索用オートマトンおよびユ
ーザ毎の出現タームカウンタは、検索条件としてユーザ
1が{「検索」&「検査」}、ユーザ2が、{「検索」
&(「情報」|「ニュース」)}の検索条件を設定した
場合(ここで、&は論理積、|は論理和を示す)であ
る。本図に示したオートマトンは、検索対象のテキスト
から入力された文字によって状態が遷移するオートマト
ンであり、遷移先がない場合(すなわち、フェイル時)
の処理は省略している。また、ユーザ2の設定した検索
タームの出現数カウンタを「情報」、「ニュース」で同
じカウンタ(701)とすることで、論理式の論理和部
分に関しては、本カウンタの値をチェックすることで実
現できるため、高速な処理が可能となる。
The search automaton and the appearance term counter for each user shown in FIG. 7 are such that the user 1 has {"search"&"inspection"} as the search conditions and the user 2 has {"search"
& (“Information” | “news”)} is set (here, & indicates a logical product and | indicates a logical sum). The automaton shown in this figure is an automaton in which the state changes according to the character input from the text to be searched, and when there is no transition destination (that is, at the time of failure)
Is omitted. Also, by setting the same number counter (701) for the appearance term of the search term set by the user 2 for "information" and "news", the value of this counter can be checked for the logical sum part of the logical expression. Since it can be realized, high-speed processing can be performed.

【0023】クリッピング処理は、図7に示したオート
マトンにニュース内の文字列を入力することで実現でき
る。このオートマトンに「ニュースに対する検索と内容
の検査を行なう。」という文字列が入力された場合、4
文字目の「ス」、10文字目の「索」の文字と、16文
字目の「査」の文字で、オートマトンの状態がタームヒ
ットの状態となり、この状態から、ユーザのタームカウ
ンタに張られたリンクを辿ることで、どのユーザの何番
目のタームにヒットしているかが分かる。
The clipping process can be realized by inputting a character string in news into the automaton shown in FIG. When a character string “Search for news and check contents” is input to this automaton, 4
The state of the automaton becomes a term hit state by the character of "su" of the character, the character of "the character" of the tenth character, and the character of the "examination" of the sixteenth character. By following the link, it is possible to determine which user's term is being hit by which user.

【0024】また、タームの最初の1文字に一致した場
合に、その位置を記録しておくことで、タームが一致し
た状態に到達した時点で、ヒットしたタームの開始位
置、終了位置を得ることができる。このヒットしたター
ムの位置情報は、タームのハイライト表示などで利用す
る。
When the first character of the term matches, the position is recorded, so that when the state where the terms match is reached, the start position and end position of the hit term can be obtained. Can be. The location information of the hit term is used for highlighting the term.

【0025】同義語・異表記については、図8に示した
構成でオートマトンを作成する。ユーザの設定した検索
条件で、同義語・異表記の展開を指定された場合、「ニ
ュース」を検索タームとして、設定された場合、本図に
示すように、同義語である「報道」は異表記以外用のオ
ートマトン(801)に登録する。「ニュース」が異表
記を持つ場合は、特開平3−15980号公報「文字列
検索のための異表記及び同義語展開方法」に示された方
法などによって構成した、異表記用のオートマトン(8
02)に登録する。このようにテキストを複数のオート
マトンへの入力とすることで、異表記展開を利用するユ
ーザと、利用しないユーザの共存が可能となる。本方式
を用いることで、ユーザ数の増大にかかわらず、オート
マトン毎にテキストの1度の走査により、各ユーザのタ
ームを抽出できる。また、論理式のチェックは、ユーザ
数分行なわなければならないため、利用人数が増加した
場合、オートマトンによるタームの抽出処理が全体に占
める割合が小さくなるため、オートマトンを複数作成し
ても、処理時間に大きな影響は出ないと考えられる。
For synonyms / different notations, an automaton is created with the configuration shown in FIG. If the search condition set by the user specifies the development of synonyms / different notations, and if “news” is set as the search term, the synonym “report” is different as shown in this figure. Register in the automaton (801) for non-notation. When "news" has a different notation, an automaton for different notation (8) constituted by a method described in Japanese Patent Application Laid-Open No. Hei 3-15980, "Method of Different Notation and Synonym Expansion for Character String Search", etc.
02). By using the text as input to a plurality of automata in this way, it is possible for a user who uses different notation development and a user who does not use it to coexist. By using this method, the terms of each user can be extracted by scanning the text once for each automaton regardless of the increase in the number of users. In addition, since the logical expressions must be checked for the number of users, if the number of users increases, the ratio of term extraction processing by the automaton to the whole becomes small. Is not expected to have a significant effect on

【0026】図9は、ニュース配信の処理内容を示した
フローチャートである。処理対象のニュースに対して、
ヒットしたユーザについて順に処理する。まず、処理す
べきユーザが残っているか否かをチェックし(90
1)、存在しなければ処理を終了する。次に、処理対象
のユーザのニュース配信方法を読み出し(902)、W
WWによる配信が設定されているなら(903)、WW
Wによる配信処理を実施する(904)。WWWでの配
信は、配信するニュースをWWWでの文書の標準形式で
あるHTMLに変換した後、WWWサーバを経由して、
ユーザのWWWブラウザ上に表示することで実現する。
メールでの配信方法が設定されているなら(905)、
メールでニュースを配信する(906)。メールでのニ
ュースの配信は、メールサーバに対して、送信先のユー
ザのメールアドレス、及びニュース本体を送信すること
で実現する。ユーザは、メールリーダで配信されたニュ
ースを見ることができる。ニュースでの配送が指定され
ているなら(907)、指定されたニュースグループに
格納することで配信を実現する(908)。ユーザは、
ニュースリーダでニュースクリッピングシステムに接続
し、ニュースグループ名を指定して配信されたニュース
を読むことができる。
FIG. 9 is a flow chart showing the contents of the news distribution process. For news to be processed,
Process the hit users in order. First, it is checked whether there are any remaining users to be processed (90).
1) If not, the process ends. Next, the news distribution method of the user to be processed is read out (902), and W
If distribution by WW is set (903), WW
The distribution processing by W is performed (904). For distribution on the WWW, news to be distributed is converted into HTML, which is a standard format of documents on the WWW, and then converted via a WWW server.
This is realized by displaying on the user's WWW browser.
If the mail delivery method is set (905),
News is distributed by mail (906). News distribution by e-mail is realized by transmitting the e-mail address of the destination user and the news body to the mail server. The user can see the news delivered by the mail reader. If the delivery by news is specified (907), the delivery is realized by storing it in the specified news group (908). The user
A news reader can connect to the news clipping system and read the news delivered by specifying the newsgroup name.

【0027】図10は、配信されたニュースの例であ
る。本図は、WWWブラウザを利用して配信結果を表示
したものである。1001は配信ニュースの一覧で、1
002のニュースを選択すると、1003に示すように
ニュースの内容が表示される。1004、1005のよ
うにヒットした検索タームに対しては、ハイライト処理
を行なう。ハイライト処理は、検索用のオートマトンで
取得した検索タームのヒット位置にハイライト用の情報
(HTMLにおけるハイライトタグ)を埋め込むことで実現
する。
FIG. 10 is an example of the news that has been distributed. In this figure, a distribution result is displayed using a WWW browser. 1001 is a list of distribution news, 1
When the news 002 is selected, the content of the news is displayed as indicated by 1003. Highlight processing is performed on search terms that have been hit, such as 1004 and 1005. The highlight processing is realized by embedding highlight information (highlight tag in HTML) at a hit position of a search term acquired by the search automaton.

【0028】図11は、ニュース配信数のチェック処理
を示したフローチャートである。まず、ユーザを管理す
る番号のカウンタiを初期化(“1”に)する(110
1)。次に、既にユーザiへ検索条件を変更するように
要求したか否かをチェックする(1102)。ユーザの
情報はニュース配信管理ファイルで管理する。ニュース
配信管理ファイルの内容は、図12を用いて後述する。
チェックの結果、既に送信していれば、次のユーザのチ
ェックを行なう。送信していなければ、ユーザiに対し
て送信したニュースの数が設定された値をオーバしてい
るか否かをチェックする(1103)。ここで送信した
ニュースの数が設定された値をオーバしていれば、検索
条件の変更をユーザに要求する(1104)。検索条件
の変更要求の処理内容は、図13を用いて後述する。次
にユーザ管理番号のカウンタiを1つ増加し(110
5)、次のユーザが存在するか否かをチェックする(1
106)。存在すれば1102の処理に戻り、存在しな
ければ処理を終える。
FIG. 11 is a flowchart showing a process for checking the number of news distributions. First, the counter i of the number for managing the user is initialized (to "1") (110).
1). Next, it is checked whether the user i has already been requested to change the search condition (1102). User information is managed in a news distribution management file. The contents of the news distribution management file will be described later with reference to FIG.
As a result of the check, if the transmission has already been performed, the next user is checked. If not transmitted, it is checked whether the number of news transmitted to the user i exceeds a set value (1103). If the number of news transmitted here exceeds the set value, the user is requested to change the search condition (1104). The processing content of the search condition change request will be described later with reference to FIG. Next, the counter i of the user management number is increased by one (110
5) Check whether the next user exists (1)
106). If it exists, the process returns to step 1102; otherwise, the process ends.

【0029】図12は、ニュース配信数を管理するため
のニュース配信管理ファイルの内容である。ユーザ数
(1201)と、ユーザ番号管理テーブル(1202)
と、変更要求通知管理テーブル(1203)と、検索条
件設定日時(1204)、最大配信ニュース数管理テー
ブル(1205)と、配信済みニュース数管理テーブル
(1206)により構成される。変更要求通知管理テー
ブル(1203)は、ユーザが検索条件を更新すると未
通知の状態になり、検索条件変更通知を行なうと通知済
に設定される。設定日時(1204)は、検索条件が変
更された日時を格納する。最大配信ニュース数管理テー
ブル(1205)は、検索条件と共に受信されるため、
検索条件の設定と同時に設定される。配信済みニュース
管理テーブル(1206)は、検索条件変更後のニュー
ス送信数を記録する。したがって、1日平均のニュース
配信数は、配信済みニュース数管理テーブルの値を、設
定日時からの経過日数で割ることで得られる。この値
が、最大配信ニュース数管理テーブルの値を超えれば、
1日あたりのニュース配信数が設定値を超えたと判定さ
れる。判定の開始は、システム側で5日以降などと設定
しこれを利用する。あるいは、判定開始までの日数をユ
ーザの設定条件中に含めてもよい。
FIG. 12 shows the contents of a news distribution management file for managing the number of news distributions. Number of users (1201) and user number management table (1202)
, A change request notification management table (1203), a search condition setting date and time (1204), a maximum distribution news number management table (1205), and a distribution news number management table (1206). The change request notification management table (1203) is in an unreported state when the user updates the search condition, and is set to be notified when the search condition change notification is performed. The set date and time (1204) stores the date and time when the search condition was changed. Since the maximum distribution news number management table (1205) is received together with the search condition,
Set at the same time as the search condition is set. The delivered news management table (1206) records the number of news transmissions after the change of the search condition. Therefore, the average number of news distributions per day can be obtained by dividing the value of the distributed news number management table by the number of days elapsed from the set date and time. If this value exceeds the value in the maximum news distribution management table,
It is determined that the number of news distributions per day has exceeded the set value. The start of the determination is set on the system side after 5 days and the like and used. Alternatively, the number of days until the start of the determination may be included in the user setting conditions.

【0030】図13は、検索条件変更要求処理の処理内
容を示すフローチャートである。まず、これまでに配信
されたニュースの中に出現する単語のチェックを行なう
(1301)。これらの単語のうちで、検索条件中の検
索タームと一致しないものを求め、このうち出現頻度の
高いものを得る(1302)。複数文書に共通する単語
を抽出し、文書を分類する方法としては、特開平8−1
53121「文書情報分類方法および文書情報分類装
置」に開示されている方法を用いることができる。そし
て、これらの単語と検索条件中の検索タームを論理積で
結合した検索条件を生成し、生成された検索条件式を用
いた場合に、適合するニュースの数を調べる。ここで得
られるニュースの数が、最大配信ニュース数より少ない
場合は、この検索条件式を検索条件変更案とする(13
03)。この際、あらかじめ最小配信数を設定してお
き、配信済みのニュース中から抽出された、いずれのタ
ームを選択しても、最小配信数より少ないニュースしか
配信されない場合は、絞り込み能力が高すぎると判定し
て、複数のタームを論理和条件で結合して、この条件と
元の検索条件を論理積条件で結合した場合の検索条件を
作成する方法を用いても良い。そして、作成された検索
条件変更案を、ユーザに送付することで、検索条件の変
更を要求する(1304)。
FIG. 13 is a flowchart showing the contents of the search condition change request processing. First, a word that appears in the news distributed so far is checked (1301). Among these words, words that do not match the search terms in the search conditions are obtained, and words having a high appearance frequency are obtained (1302). A method for extracting words common to a plurality of documents and classifying the documents is disclosed in
53121 “Method of Classifying Document Information and Document Information Classifying Apparatus” can be used. Then, a search condition is generated by combining these words and the search terms in the search condition with a logical product, and when the generated search condition expression is used, the number of news items that match is searched. If the number of news obtained here is less than the maximum number of news distributions, this search condition formula is used as a search condition change plan (13).
03). At this time, if the minimum number of distributions is set in advance and no news is distributed below the minimum number of distributions regardless of which term is selected from the distributed news, if the narrowing down capability is too high It is also possible to use a method in which a judgment is made, a plurality of terms are combined by a logical sum condition, and a search condition is created when this condition and the original search condition are combined by a logical product condition. Then, by sending the created search condition change plan to the user, a change of the search condition is requested (1304).

【0031】図14は、検索条件変更要求の際に送信す
る文面の例である。本例は、WWW上での検索条件の変
更要求例であり、表示された検索条件を選択すること
で、本条件に適合するニュース一覧(1401)が表示
される。番号(1402)を選択し、条件式番号(14
03)を入力することで、検索条件が更新される。新規
(1404)を選択し、提示された検索条件例を参考に
して、新規に検索条件式(1405)を作成することも
できる。送信する際は、送信ボタン(1406)を押
す。取消ボタン(1407)を押せば、設定した内容が
消去される。
FIG. 14 shows an example of the text transmitted when a search condition change request is made. This example is a request example for changing the search condition on the WWW. By selecting the displayed search condition, a news list (1401) meeting the condition is displayed. No. (1402) is selected and the conditional expression number (14
By inputting 03), the search condition is updated. New (1404) can be selected, and a new search condition formula (1405) can be created with reference to the presented search condition example. When transmitting, the transmission button (1406) is pressed. When the cancel button (1407) is pressed, the set contents are deleted.

【0032】第2の実施例として、第1の実施例のシス
テムの構成を変更し、検索条件を変更した後、変更内容
を通知する構成とすることもできる。
As a second embodiment, the configuration of the system of the first embodiment may be changed, the search conditions may be changed, and then the changed contents may be notified.

【0033】図15は、図1の構成を一部変更した第2
の実施例のシステムブロック図である。変更点は、図1
の検索条件変更要求プロセス(115)を、検索条件変
更プロセス(116)と検索条件変更通知プロセス(1
17)に変更したところにある。したがって、ニュース
配信数が既定値をオーバした場合は、自動的に検索条件
の変更処理を行ない、その上で変更結果をユーザに通知
するような構成となっている。ユーザは通知された変更
内容で良ければ、特に検索条件の変更を指示する必要は
なく、不満がある場合にのみ、別の検索条件を設定すれ
ばよい。
FIG. 15 shows a second modification of the configuration of FIG.
FIG. 3 is a system block diagram of the embodiment of FIG. The changes are in Figure 1.
Of the search condition change request process (115) and the search condition change notification process (1).
17). Therefore, when the number of news distributions exceeds a predetermined value, the search condition is automatically changed, and the change result is notified to the user. If the user is satisfied with the notified change content, there is no need to give an instruction to change the search condition, and another search condition may be set only when there is dissatisfaction.

【0034】図16は、第2の実施例の処理手順を示し
たフローチャートである。図2のフローチャートからの
変更点は、図2の検索条件変更要求処理(211)の代
わりに検索条件変更処理(213)と検索条件変更通知
処理(214)を行なっているところにある。検索条件
変更処理(213)では、図13で示した検索条件変更
要求処理と同様の方法で作成した検索条件変更案に検索
条件を自動的に変更する。さらに、検索条件変更通知処
理(114)も、図13の1304の検索条件変更要求
送信と同様の手法で行なう。このように、検索条件を自
動的に更新する構成に変更することで、ユーザに到着す
るニュースをできる限り早く削減することが可能にな
る。例えば、メールシステムにより蓄積可能な文書数が
制限されている場合などに、有効である。
FIG. 16 is a flowchart showing a processing procedure of the second embodiment. The difference from the flowchart of FIG. 2 lies in that a search condition change process (213) and a search condition change notification process (214) are performed instead of the search condition change request process (211) of FIG. In the search condition change process (213), the search condition is automatically changed to a search condition change proposal created by the same method as the search condition change request process shown in FIG. Further, the search condition change notification process (114) is performed in the same manner as the search condition change request transmission of 1304 in FIG. As described above, by changing to a configuration in which the search condition is automatically updated, it is possible to reduce news arriving at the user as soon as possible. For example, this is effective when the number of storable documents is limited by the mail system.

【0035】[0035]

【発明の効果】本発明を利用することで、大量のニュー
スから必要なニュースだけを取得して、速度の向上を図
ることが可能となる。
By using the present invention, it is possible to obtain only necessary news from a large amount of news and improve the speed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施例1のニュースクリッピングシステムの構
成図である。
FIG. 1 is a configuration diagram of a news clipping system according to a first embodiment.

【図2】実施例1のニュースクリッピング処理のフロー
チャートである。
FIG. 2 is a flowchart of a news clipping process according to the first embodiment.

【図3】初期化処理のフローチャートである。FIG. 3 is a flowchart of an initialization process.

【図4】検索条件格納ファイルの内容である。FIG. 4 shows the contents of a search condition storage file.

【図5】検索条件入力画面例である。FIG. 5 is an example of a search condition input screen.

【図6】更新処理のフローチャートである。FIG. 6 is a flowchart of an update process.

【図7】論理和処理用のオートマトンである。FIG. 7 is an automaton for an OR operation.

【図8】同義語・異表記処理用のオートマトンである。FIG. 8 is an automaton for synonym / different notation processing.

【図9】ニュース配信処理のフローチャートである。FIG. 9 is a flowchart of a news distribution process.

【図10】WWWによるニュース配信例である。FIG. 10 is an example of news distribution by WWW.

【図11】ニュース配信数チェック処理のフローチャー
トである。
FIG. 11 is a flowchart of a news distribution number check process.

【図12】ニュース配信管理ファイルの内容である。FIG. 12 shows the contents of a news distribution management file.

【図13】検索条件式変更要求処理のフローチャートで
ある。
FIG. 13 is a flowchart of a search condition formula change request process.

【図14】検索条件式変更要求例である。FIG. 14 is an example of a search condition formula change request.

【図15】実施例2のニュースクリッピングシステムの
構成図である。
FIG. 15 is a configuration diagram of a news clipping system according to a second embodiment.

【図16】実施例2のニュースクリッピング処理のフロ
ーチャートである。
FIG. 16 is a flowchart of a news clipping process according to the second embodiment.

【図17】従来技術の同義語・異表記処理用オートマト
ンの構成である。
FIG. 17 shows a configuration of a synonym / different notation processing automaton according to the related art.

【図18】従来技術との比較のための同義語・異表記処
理用オートマトンの構成である。
FIG. 18 shows a configuration of a synonym / different notation processing automaton for comparison with the related art.

【符号の説明】[Explanation of symbols]

101…ニュースクリッピングシステム、102…ネッ
トワーク接続プロセス、103…ニュース収集プロセ
ス、104…メール受信プロセス、 105…WWWサ
ーバプロセス、106…検索条件取得プロセス、107
…検索条件・情報配信手段格納DB、108…クリッピ
ングプロセス、109…ニュース配信プロセス、110
…WWW閲覧ユース格納DB、111…HTML作成プ
ロセス、112…メール発信プロセス、 113…ニ
ュースDB、114…ニュースサーバプロセス、115
…検索条件変更要求プロセス、116…検索条件変更プ
ロセス、 117…検索条件変更通知プロセス、120
…ニュースリソース、 121…WWWブラウザ、
122…メールリーダ、123…ニュースリーダ、12
4…ネットワーク網、1201…ニュース配信管理ファ
イルのユーザ数テーブル、1202…ニュース配信管理
ファイルのユーザ番号テーブル、1203…ニュース配
信管理ファイルの変更要求通知管理テーブル、1204
…ニュース配信管理ファイルの検索条件設定日時テーブ
ル、1205…ニュース配信管理ファイルの最大配信ニ
ュース数テーブル、1206…ニュース配信管理ファイ
ルの配信済みニュース数テーブル。
101: News clipping system, 102: Network connection process, 103: News collection process, 104: E-mail receiving process, 105: WWW server process, 106: Search condition acquisition process, 107
... Search condition / information distribution means storage DB, 108 ... Clipping process, 109 ... News distribution process, 110
... WWW browsing use storage DB, 111 ... HTML creation process, 112 ... Mail sending process, 113 ... News DB, 114 ... News server process, 115
... search condition change request process, 116 ... search condition change process, 117 ... search condition change notification process, 120
... News resources, 121 ... WWW browser,
122: mail reader, 123: news reader, 12
4. Network network 1201 News distribution management file user number table 1202 News distribution management file user number table 1203 News distribution management file change request notification management table 1204
... Search condition setting date and time table of news distribution management file, 1205. Maximum distribution news number table of news distribution management file, 1206.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 秋沢 充 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所情報・通信開発本部内 (72)発明者 山崎 紀之 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア開発本部内 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Mitsuru Akizawa 890 Kashimada, Saiwai-ku, Kawasaki-shi, Kanagawa Prefecture Inside the Information & Communication Development Division, Hitachi, Ltd. Hitachi, Ltd. Software Development Division

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】各情報発信源から時々刻々と配信される文
書情報に対して、複数のユーザがあらかじめ検索のため
に設定した条件である検索条件を満たしている文書であ
るか否かを判定する文書クリッピング手段と、 上記文書クリッピング手段により設定された検索条件を
満たしていると判定されたユーザに文書情報を配送す
る、ニュース配送手段とを有する文書検索配送装置にお
いて、 あらかじめユーザが、所定時間での最大購読件数を設定
し、設定された値を超える件数の文書情報が配送される
場合は、検索条件の追加または変更を行ない、変更以降
の文書情報の配送件数を減らす、検索条件変更手段を有
することを特徴とした文書検索配送装置。
1. A method for determining whether a document satisfies a search condition, which is a condition set in advance by a plurality of users, for document information distributed from time to time from each information source. A document search and delivery device having a document clipping means for performing a search and a news delivery means for delivering document information to a user determined to satisfy the search condition set by the document clipping means. If the maximum number of subscriptions is set and the number of document information exceeding the set value is delivered, search conditions are added or changed, and the number of delivery of document information after the change is reduced. A document search and delivery device comprising:
【請求項2】請求項1に記載の文書検索配送装置におい
て、 上記文書クリッピング手段は、各ユーザが登録した検索
条件を統合して、検索条件中に含まれる検索対象の文字
列である検索タームを抽出するための文書検索用のオー
トマトンと、ユーザの設定した検索ターム毎の出現数を
カウントするカウンタを作成する検索オートマトン作成
手段と、 複数のユーザが設定した検索条件の中で、論理和で結合
される検索タームについては、各検索ターム毎に出現の
有無のチェックを行なわず、1つのカウンタを利用して
各検索タームの出現数の合計値をカウントする合計値カ
ウンタを設けることで、論理和の成立、不成立を判定す
る、論理和統合手段とを有することを特徴とした文書検
索配送装置。
2. The document search / delivery device according to claim 1, wherein the document clipping means integrates search conditions registered by each user and forms a search term which is a character string to be searched included in the search conditions. A search automaton for extracting documents, a search automaton creation means for creating a counter that counts the number of appearances for each search term set by the user, and a search condition set by a plurality of users. Regarding the search terms to be combined, the presence / absence check is not performed for each search term, and a total value counter that counts the total number of occurrences of each search term using one counter is provided. A document retrieval / delivery device comprising: a logical sum integration means for determining whether a sum is established or not.
【請求項3】請求項1に記載の文書検索配送装置におい
て、 上記検索条件変更手段は、各ユーザに対して、ユーザ毎
に設定された値以上の件数のニュースが到着している旨
の通知及び検索条件の追加、変更の要求を行う検索条件
変更要求手段および、ユーザが検索条件を追加、変更し
た後は、文書クリッピング手段で用いる検索条件を変更
することを特徴とした文書検索配送装置。
3. The document search and delivery device according to claim 1, wherein said search condition changing means notifies each user that news of a number equal to or greater than a value set for each user has arrived. And a search condition change request unit for requesting addition and change of search conditions, and a document search / delivery device which changes search conditions used by the document clipping unit after a user adds or changes search conditions.
【請求項4】請求項3に記載の文書検索配送装置におい
て、 上記検索条件変更要求手段は、現在設定されている検索
条件はヒットした文書から、共通する複数のキーワード
を抽出してこれらのキーワードを基に新規の検索条件を
作成する検索条件生成手段と、作成された検索条件をユ
ーザに提示する検索条件提示手段と、ユーザが適切と考
える検索条件を指定することにより検索条件を変更する
検索条件変更手段を用いることを特徴とした文書検索配
送装置。
4. The document search / delivery apparatus according to claim 3, wherein the search condition change request means extracts a plurality of common keywords from a hit document whose search condition is currently set, and extracts these keywords. Search condition generating means for creating a new search condition based on a search condition, search condition presenting means for presenting the created search condition to a user, and a search for changing the search condition by specifying a search condition that the user considers appropriate A document search and delivery device characterized by using condition changing means.
【請求項5】請求項3に記載の文書検索配送装置におい
て、 上記検索条件変更手段は、現在設定されている検索条件
により得られた文書から抽出された複数のキーワードを
基に作成した新規の検索条件に変更し、変更された条件
を以降の文書クリッピング手段で用いる検索条件に適用
する検索条件自動更新手段と、 変更された検索条件をユーザに通知する検索条件変更通
知手段を有することを特徴とした文書検索配送装置。
5. The document search / delivery device according to claim 3, wherein said search condition changing means is a new search condition creation unit based on a plurality of keywords extracted from a document obtained by a currently set search condition. A search condition automatic updating unit that changes the search condition and applies the changed condition to a search condition used in the subsequent document clipping unit, and a search condition change notification unit that notifies the user of the changed search condition. Document search and delivery device.
JP9096929A 1997-04-15 1997-04-15 Method and device for document retrieval delivering Pending JPH10289244A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9096929A JPH10289244A (en) 1997-04-15 1997-04-15 Method and device for document retrieval delivering

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9096929A JPH10289244A (en) 1997-04-15 1997-04-15 Method and device for document retrieval delivering

Publications (1)

Publication Number Publication Date
JPH10289244A true JPH10289244A (en) 1998-10-27

Family

ID=14178046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9096929A Pending JPH10289244A (en) 1997-04-15 1997-04-15 Method and device for document retrieval delivering

Country Status (1)

Country Link
JP (1) JPH10289244A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002083083A (en) * 2000-09-06 2002-03-22 Sankyo Kk Method for supplying game center information
JP2002092465A (en) * 2000-09-13 2002-03-29 E Advisor Kk Financial planning information providing device, financial planning information providing system, and financial planning information providing method
JP2002092246A (en) * 2000-09-14 2002-03-29 Sankyo Kk Method for providing game hall information
JP2002140364A (en) * 2000-10-31 2002-05-17 Seiko Epson Corp Information retrieval system, contents retrieval system contents distribution system, and storage medium
JP2002197100A (en) * 2000-12-27 2002-07-12 Nec Corp Retrieval service system, its method, recording medium and information mediating method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002083083A (en) * 2000-09-06 2002-03-22 Sankyo Kk Method for supplying game center information
JP2002092465A (en) * 2000-09-13 2002-03-29 E Advisor Kk Financial planning information providing device, financial planning information providing system, and financial planning information providing method
JP2002092246A (en) * 2000-09-14 2002-03-29 Sankyo Kk Method for providing game hall information
JP2002140364A (en) * 2000-10-31 2002-05-17 Seiko Epson Corp Information retrieval system, contents retrieval system contents distribution system, and storage medium
JP2002197100A (en) * 2000-12-27 2002-07-12 Nec Corp Retrieval service system, its method, recording medium and information mediating method

Similar Documents

Publication Publication Date Title
JP3860347B2 (en) Link processing device
US7809710B2 (en) System and method for extracting content for submission to a search engine
JP4318741B2 (en) Database system, database search method and recording medium
US6208988B1 (en) Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes
US6799199B1 (en) Media monitor system
US8386513B2 (en) System and method for analyzing, integrating and updating media contact and content data
US8296324B2 (en) Systems and methods for analyzing, integrating and updating media contact and content data
EP1246087A2 (en) A computer implemented method and system for information retrieval
US20080183710A1 (en) Automated Media Analysis And Document Management System
US20060294476A1 (en) Browsing and previewing a list of items
JP2000090102A (en) Information transmission device
KR100393176B1 (en) Internet information searching system and method by document auto summation
JP2002222138A (en) Contents transmission method, contents receiving method, and contents delivery system
EP1100023A2 (en) Contents update state monitoring method, apparatus and program
JPH11136276A (en) Electronic bulletin board system and recording medium recording program to build up the electronic bulletin board system
JPH10289244A (en) Method and device for document retrieval delivering
JP4405695B2 (en) Update information automatic display method, apparatus, medium, and program
US20030055823A1 (en) System for managing information registered in a plurality of locations and a method thereof
JP5259436B2 (en) Knowledge sharing support apparatus, method and program thereof
US7207003B1 (en) Method and apparatus in a data processing system for word based render browser for skimming or speed reading web pages
US20020062341A1 (en) Interested article serving system and interested article serving method
JP3588507B2 (en) Information filtering device
KR20080028031A (en) System extracting and displaying keyword and contents related with the keyword and method using the system
JP3465815B2 (en) Text filtering system
US20050138027A1 (en) Filtering server, filtering system, and filtering method