JPH1115835A - Sorting information presenting device and medium recording sorting information presenting program - Google Patents

Sorting information presenting device and medium recording sorting information presenting program

Info

Publication number
JPH1115835A
JPH1115835A JP9163647A JP16364797A JPH1115835A JP H1115835 A JPH1115835 A JP H1115835A JP 9163647 A JP9163647 A JP 9163647A JP 16364797 A JP16364797 A JP 16364797A JP H1115835 A JPH1115835 A JP H1115835A
Authority
JP
Japan
Prior art keywords
classification
document
information
holding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9163647A
Other languages
Japanese (ja)
Inventor
Yoshihiro Ueda
良寛 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP9163647A priority Critical patent/JPH1115835A/en
Publication of JPH1115835A publication Critical patent/JPH1115835A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To grasp how to change or transit the distribution and overall tendency of an information group in accordance with a different period to be sorted. SOLUTION: A document storing means 1 stores plural documents la to 1c,... to which information generation time is applied. A specification storing means 3 stores a sorting specification including a retrieving expression and a period to be sorted which are inputted from an input device 2. A retrieving means 4 retrieves a document suited to the retrieving expression stored in the means 3 among the documents to which information generation time within the period to be sorted stored in the means 3 is applied. The detected document is transferred to a sorting means 5. The means 5 sorts the document detected by the means 4 in accordance with similarity. A sorting history storing means 6 stores the sorting result of the means 5 together with sorting specification. A sort presenting means 7 displays plural sorting history 8a to 8c stored in the means 6 on the screen of a display device 8.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は分類情報提示装置及
び分類情報提示プログラムを記録した媒体に関し、特に
情報群の分布等の概要を提示する分類情報提示装置及び
そのような情報の提示をコンピュータに実行させるため
の分類情報提示プログラムを記録した媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a classification information presenting apparatus and a medium storing a classification information presenting program, and more particularly to a classification information presenting apparatus for presenting an outline of the distribution of information groups and the like and presenting such information to a computer. The present invention relates to a medium recording a classification information presentation program to be executed.

【0002】[0002]

【従来の技術】膨大な情報の内容がどのような傾向にあ
るのかを知りたいという要求がある。例えば、研究論文
を集め、その内容を分類すれば、どのような研究課題が
注目されているのかを判断することができる。このよう
な判断を正確に行うには、大量の情報を分析しなければ
ならない。その作業を、人間の手作業で行っていたので
は時間がかかり過ぎてしまう。そこで、大量の情報を分
類し、情報の分布状況をユーザに提示する技術が開発さ
れてきた。例として以下のようなものがある。
2. Description of the Related Art There is a demand for knowing the tendency of a huge amount of information. For example, by collecting research papers and classifying their contents, it is possible to determine what research issues are receiving attention. To make such a decision accurately, a large amount of information must be analyzed. It would take too much time if the work was done manually by humans. Therefore, a technique for classifying a large amount of information and presenting the distribution state of the information to a user has been developed. Examples include the following:

【0003】まず、予め与えた固定分類に分類するもの
がある。これは、分野を限定して、情報が必ず規定の分
類枠にうまく入る場合にはよいが、新聞記事などのよう
に、話題の分布が常に推移するようなものには向かな
い。
[0003] First, there are some which are classified into fixed classifications given in advance. This is good when the information is surely well within the prescribed classification frame by limiting the field, but it is not suitable for the case where the distribution of topics always changes, such as newspaper articles.

【0004】これを解決するものとして、ベクトル類似
度による分類探索方法がある。これは、文書を内容に含
まれる単語ベクトルにより分類、提示して、選択させ、
選択されたものをさらに分類していくことにより、順次
絞り込みを行うものである。これにより、予め分類を設
定する必要がなくなり、話題の推移に応じて、その時点
において適した分類項目で分類することができる。とこ
ろが、分類結果はリストでしか表示されず、ある時点で
の情報の傾向を大局的に把握するのが困難である。ま
た、その傾向の推移も把握しにくい。
To solve this problem, there is a classification search method based on vector similarity. This categorizes, presents, and selects documents by word vectors contained in the content,
By narrowing down the selected ones, narrowing down is sequentially performed. As a result, it is not necessary to set the classification in advance, and the classification can be performed with the appropriate classification item at that time according to the transition of the topic. However, the classification result is displayed only in a list, and it is difficult to grasp the tendency of information at a certain point in time. Also, it is difficult to grasp the transition of the trend.

【0005】そこで、分類において、情報群の傾向を把
握することを目指したものに、2次元空間中に情報を配
置し、しかも類似度の高い情報同士は近くに配置するよ
うにしたものがある。これにより分布の全体像を把握す
ることは容易になっている。
[0005] Therefore, in the classification, there is an object which aims to grasp the tendency of the information group by arranging information in a two-dimensional space and arranging information having high similarity close to each other. . This makes it easy to grasp the whole image of the distribution.

【0006】また、視点に基づく分類を行うもの(例え
ば、特願平7−178778号公報「情報探索装置」)
がある。他の手法が単一の分類基準( 同じ言葉が使われ
ている) から分類しているのに対して、この手法で、言
葉と言葉の関係の違いを視点の違いとみなして、複数の
分類方法を提供する。また、シソーラスを用いて、別の
文書で異なった語が用いられても、同じ分類に落とすこ
とができる。
[0006] Further, a device that performs classification based on viewpoints (for example, Japanese Patent Application No. 7-178778, "Information search device")
There is. Unlike other methods that classify based on a single classification criterion (the same words are used), this method considers differences in the relationship between words Provide a way. Also, using a thesaurus, even if different words are used in different documents, they can be classified into the same classification.

【0007】[0007]

【発明が解決しようとする課題】しかし、従来技術によ
り、内容が固定された情報群の傾向を把握することはで
きるが、情報群の内容が刻々と変化してく場合に、その
傾向が時間経過によってどう変わるかの推移状況を把握
することは難しいという問題点があった。
However, according to the prior art, it is possible to grasp the tendency of the information group whose contents are fixed. However, when the contents of the information group change every moment, the tendency becomes longer. There is a problem that it is difficult to grasp the transition status of how it changes according to.

【0008】本発明はこのような点に鑑みてなされたも
のであり、異なった分類対象期間により、情報群の分
布、全体傾向がどのように変化、推移するかを把握でき
る分類情報提示装置を提供することを目的とする。
The present invention has been made in view of such a point, and a classification information presenting apparatus capable of grasping how the distribution and overall tendency of an information group changes and changes according to different classification target periods. The purpose is to provide.

【0009】[0009]

【課題を解決するための手段】本発明では上記課題を解
決するために、情報群の分布状況を提示する分類情報提
示装置において、情報発生時刻が与えられた文書を保持
する文書保持手段と、検索式と分類検索対象期間とを含
む分類仕様を保持する仕様保持手段と、前記仕様保持手
段に保持された検索式に適合し、前記仕様保持手段に保
持された分類対象期間内の情報発生時刻が与えられた文
書を、前記文書保持手段から検索する検索手段と、前記
検索手段の検出した文書を、類似性にしたがって複数の
文書集合に分類する分類手段と、前記分類手段による分
類結果を保持する分類履歴保持手段と、前記分類履歴保
持手段の中の複数の分類結果が指定されると、指定され
た分類結果を表示装置に表示する分類提示手段と、を有
することを特徴とする分類情報提示装置が提供される。
According to the present invention, in order to solve the above-mentioned problems, in a classification information presentation device for presenting a distribution state of an information group, a document holding means for holding a document given an information generation time; A specification holding unit that holds a classification specification including a search expression and a classification search target period; and an information generation time within the classification target period that matches the search expression held by the specification holding unit and is held by the specification holding unit. Search means for searching the given document from the document holding means, a classification means for classifying the documents detected by the search means into a plurality of document sets according to similarity, and holding a classification result by the classification means Classification history holding means, and, when a plurality of classification results in the classification history holding means are specified, a classification presentation means for displaying the specified classification result on a display device, Classification information presentation device is provided that.

【0010】この分類情報提示装置によれば、文書検索
手段により、仕様保持手段に保持されている検索式と分
類対象期間に合致する文書が、文書保持手段から検索さ
れる。検出された文書は、分類手段により、類似性にし
たがって複数の文書集合に分類される。分類結果は、分
類履歴保持手段に保持される。そして、分類履歴保持手
段の中の複数の分類結果が指定されると、分類提示手段
により、指定された分類結果が表示装置に表示される。
[0010] According to this classification information presentation device, the document search means searches the document storage means for a document that matches the search formula stored in the specification storage means and the classification target period. The detected documents are classified by the classification unit into a plurality of document sets according to similarity. The classification result is stored in the classification history storage unit. Then, when a plurality of classification results in the classification history holding means are specified, the specified classification results are displayed on the display device by the classification presenting means.

【0011】また、情報群の分布状況をコンピュータに
提示させるための分類情報提示プログラムを記録した媒
体において、情報発生時刻が与えられた文書を保持する
文書保持手段、検索式と分類対象期間とを含む分類仕様
を保持する仕様保持手段、前記仕様保持手段に保持され
た検索式に適合し、前記仕様保持手段に保持された分類
対象期間内の情報発生時刻が与えられた文書を、前記文
書保持手段から検索する検索手段と、前記検索手段の検
出した文書を、類似性にしたがって複数の文書集合に分
類する分類手段、前記分類手段による分類結果を保持す
る分類履歴保持手段、前記分類履歴保持手段の中の複数
の分類結果が指定されると、指定された分類結果を表示
装置に表示する分類提示手段、としてコンピュータを機
能させるための分類情報提示プログラムを記録した媒体
が提供される。
[0011] Further, in a medium recording a classification information presentation program for causing a computer to present the distribution state of an information group, a document holding means for holding a document given an information occurrence time, a search formula and a classification target period are stored. A specification holding unit that holds a classification specification including the document, and a document that matches a search expression held by the specification holding unit and is given a time of information occurrence within a classification target period held by the specification holding unit; Search means for searching from means, classification means for classifying documents detected by the search means into a plurality of document sets according to similarity, classification history holding means for holding the classification result by the classification means, and classification history holding means When a plurality of classification results are designated, a classification presentation unit for displaying the designated classification results on a display device, a function for causing a computer to function as Medium recording information presentation program is provided.

【0012】この媒体に記録された分類情報提示プログ
ラムをコンピュータに実行させることにより、コンピュ
ータに分類仕様を保持させ、複数の分類結果を指定すれ
ば、コンピュータの表示装置に複数の分類結果が表示さ
れる。
By causing the computer to execute the classification information presentation program recorded on the medium, the computer retains the classification specification, and when a plurality of classification results are designated, the plurality of classification results are displayed on the display device of the computer. You.

【0013】[0013]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は、本発明の原理構成図であ
る。文書保持手段1は、情報発生時刻が与えられた複数
の文書1a,1b,1c,…を保持している。また、仕
様保持手段3は、入力装置2から入力された検索式と分
類対象期間とを含む分類仕様を保持する。検索手段4
は、仕様保持手段3に保持された分類対象期間内の情報
発生時刻が与えられている文書の中から、仕様保持手段
3に保持されている検索式に適合する文書を検索する。
検出された文書は、分類手段5に渡される。分類手段5
は、検索手段4の検出した文書を、類似性にしたがって
分類する。分類履歴保持手段6は、分類手段5による分
類結果を分類仕様と共に保持する。分類提示手段7は、
分類履歴保持手段6に保持された複数の分類結果8a〜
8cを表示装置8の画面に表示する。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram illustrating the principle of the present invention. The document holding means 1 holds a plurality of documents 1a, 1b, 1c,... Given information generation times. The specification holding unit 3 holds the classification specification including the search formula and the classification target period input from the input device 2. Search means 4
Searches for a document that matches the search expression held in the specification holding unit 3 from among the documents provided with the information occurrence times within the classification target period held in the specification holding unit 3.
The detected document is passed to the classifying means 5. Classification means 5
Classifies documents detected by the search means 4 according to similarity. The classification history storage unit 6 stores the classification result by the classification unit 5 together with the classification specification. Classification presentation means 7
A plurality of classification results 8 a to 8 held in the classification history holding unit 6
8c is displayed on the screen of the display device 8.

【0014】これにより、分類対象期間の異なる分類仕
様を仕様保持手段3に保持させる度に、その分類対象期
間内に生成された文書の分類結果が、分類履歴保持手段
6に保持される。そして、分類対象期間の異なる複数の
分類結果を指定し、表示装置に表示させれば、情報群の
内容の時間的な推移状況を把握するすることができる。
Thus, each time the specification holding unit 3 holds a classification specification having a different classification target period, the classification result of the document generated within the classification target period is stored in the classification history storage unit 6. Then, if a plurality of classification results having different classification target periods are designated and displayed on the display device, it is possible to grasp a temporal transition state of the content of the information group.

【0015】図2は、本発明の第1の実施の形態の概略
構成を示す図である。この実施の形態は、文書情報を保
持する大規模文書集合11、シソーラスを保持するシソ
ーラス保持部12、検索式等の仕様を入力する入力装置
13、入力された仕様を保持する仕様保持部14、検索
を行う検索機構部15、検索結果を保持する初期文書集
合保持部16、検索結果を分類する分類機構部17、分
類結果を保持する分類履歴保持部18、分類結果の提示
を行う分類提示機構部19及びCRT(Cathode-Ray Tub
e)などの表示装置20で構成される。各構成要素の機能
の詳細を以下に説明する。
FIG. 2 is a diagram showing a schematic configuration of the first embodiment of the present invention. This embodiment includes a large document set 11 for holding document information, a thesaurus holding unit 12 for holding a thesaurus, an input device 13 for inputting specifications such as a search formula, a specification holding unit 14 for holding the input specifications, Search mechanism unit 15 for performing search, initial document set storage unit 16 for storing search results, classification mechanism unit 17 for classifying search results, classification history storage unit 18 for storing classification results, classification presentation mechanism for presenting classification results Part 19 and CRT (Cathode-Ray Tub
e) and the like. The details of the function of each component will be described below.

【0016】大規模文書集合11は、情報発生時刻が付
加された大量の文書情報を格納している。この大規模文
書集合11には、刻々と新しい文書が格納される。シソ
ーラス保持部12は、単語相互間の関連(同義語関係や
階層関係)を明確にしたシソーラス(類語辞書)を保持
している。
The large document set 11 stores a large amount of document information to which information generation time is added. In the large-scale document set 11, new documents are stored every moment. The thesaurus holding unit 12 holds a thesaurus (synonym dictionary) that clarifies the relation between words (synonym relation and hierarchical relation).

【0017】図3は、シソーラスの例を示す図である。
シソーラス12aは、単語間の類似関係が木構造で表さ
れており、ルートを「レベル0」とし、ルートから階層
が下がる毎に、レベルの値が1ずつ増加する。
FIG. 3 is a diagram showing an example of a thesaurus.
In the thesaurus 12a, the similarity relationship between words is represented by a tree structure, the root is set to "level 0", and the level value increases by one each time the hierarchy goes down from the root.

【0018】入力装置13は、キーボードやマウスなど
である。この入力装置13をユーザが操作することによ
り、検索や分類の仕様を設定することができる。具体的
には、検索式、分割数、視点仕様及び分類対象期間を入
力する。ここでの検索式は、全文検索を行うことを前提
にキーワードを1個入力する(この検索式は1個または
それ以上のキーワードでも良いし、文書の書誌的条項に
対する指定を含むBoolean演算による論理式でも
良い)。分割数は、情報を分類する際に、いくつのクラ
スタ(類似した概念の文書集合)に分けるのかを指定す
る値である。視点とは、中心概念(ここでは、検索式と
して入力された語句を中心概念とする)に対してどのよ
うな関係にある単語により分類を行うのかの指定であ
り、「動作主体」や「対象」のように指定する。例え
ば、「自動車」が中心概念であり、「対象」という視点
で分類する場合、「自動車を開発する」や「自動車を販
売する」といった表現が抽出され、自動車を対象する動
作である「開発」や「販売」といった語句に基づいて情
報の分類を行うことになる。なお、この図では入力装置
13は仕様保持部14にしか接続されていないが、他の
構成要素に対して各種指令(表示装置20に表示する分
類結果の指定等)を入力することもできる。
The input device 13 is a keyboard, a mouse, or the like. By operating the input device 13 by the user, it is possible to set search and classification specifications. Specifically, a search formula, the number of divisions, a viewpoint specification, and a classification target period are input. In this case, one keyword is input on the premise that a full-text search is performed (this search expression may be one or more keywords, or a logic based on a Boolean operation including designation of a bibliographic clause of a document). Expression). The number of divisions is a value that specifies how many clusters (document sets with similar concepts) are to be divided when classifying information. The viewpoint is a specification of how words are classified based on a central concept (here, a phrase input as a search formula is the central concept). ". For example, when “car” is the central concept and classification is performed from the viewpoint of “object”, expressions such as “develop car” and “sell car” are extracted, and “development” is an operation targeting car. The information is categorized based on phrases such as “sales” and “sales”. In this figure, the input device 13 is connected only to the specification holding unit 14. However, it is also possible to input various commands (such as designation of a classification result to be displayed on the display device 20) to other components.

【0019】仕様保持部14は、入力装置13により入
力された仕様を保持する。各仕様は個別の記憶領域に保
持される。検索式は、検索式保持部14aに保持され
る。分割数は、分割数レジスタ14bに保持される。視
点は、視点仕様保持部14cに保持される。分類対象期
間は、分類対象期間レジスタ14dに保持される。
The specification holding unit 14 holds the specification input by the input device 13. Each specification is held in a separate storage area. The search formula is held in the search formula holding unit 14a. The division number is held in the division number register 14b. The viewpoint is held in the viewpoint specification holding unit 14c. The classification target period is held in the classification target period register 14d.

【0020】検索機構部15は、検索式保持部14aに
保持されている検索式と、分類対象期間レジスタ14d
に保持されている分類対象期間を参照し、分類対象期間
内に発生した文書の中で、検索式に適合する文書を、大
規模文書集合11から検索する。この検索結果を、初期
文書集合保持部16に格納する。このとき、実際には全
文書をコピーする必要はなく、文書をアクセスするため
に必要なポインタ( 文書IDまたはアドレス) だけを集
めてくる。また、ここでは、文書に与えられた生成日時
の情報を同時に渡す。それ以外に予め文書に各種属性や
抽出されたキーワードなどまたはテキストの解析結果が
与えてある場合などは、それら(若しくはそれらへのポ
インタ)とともに文書ポインタを渡しても良い。
The search mechanism 15 includes a search formula stored in the search formula storage 14a and a classification target period register 14d.
Is searched from the large-scale document set 11 for documents that match the search formula among the documents generated within the classification target period. This search result is stored in the initial document set holding unit 16. At this time, it is not necessary to actually copy the entire document, and only the pointers (document ID or address) necessary for accessing the document are collected. Also, here, the information of the generation date and time given to the document is passed at the same time. In addition to this, when various attributes, extracted keywords, or the like or a text analysis result are given to the document in advance, a document pointer may be passed along with them (or a pointer to them).

【0021】分類機構部17は、シソーラス保持部12
に格納されたシソーラスを用い、初期文書集合に含まれ
る文書を、類似した文書で形成されるクラスタにまとめ
る。この処理は、分割数レジスタ14bに指定されてい
る値以下のクラスタ数となった時点で終了する。
The classification mechanism section 17 includes the thesaurus holding section 12
The documents included in the initial document set are grouped into clusters formed by similar documents using the thesaurus stored in. This processing ends when the number of clusters becomes equal to or less than the value specified in the division number register 14b.

【0022】類似度の計算は、「Vector Spa
ce Model」(Salton,G.”Autom
atic Text Processing”Addi
son−Wesley 1989)等を用いることがで
きる。この類似度計算手法では、各文書を、単語の重み
を要素とするベクトルで表現し、ベクトルの類似度(例
えば内積)を文書の類似とする。分類方法としては、特
開平5−225256号公報に示す方法(Scatte
r/Gather)や、Kohonenの「Self−
Organizing Map」を用いる方法がある。
The calculation of the degree of similarity is performed by using the “Vector Spa
ce Model "(Salton, G." Autom
atic Text Processing ”Addi
son-Wesley 1989) can be used. In this similarity calculation method, each document is represented by a vector having the weight of a word as an element, and the similarity (for example, inner product) of the vector is set to be similar to the document. As a classification method, a method disclosed in JP-A-5-225256 (Scatte
r / Gather) and Kohonen's "Self-
There is a method using “Organizing Map”.

【0023】この実施の形態では、視点に基づいた分類
を行う。視点に基づいた分類を行うには、まず、初期文
書集合保持部16内の文書集合のテキスト情報部分を解
析し、入力装置13より入力された中心概念(検索式中
の語句)と所定の関係を持つ語とその関係を抽出する。
そして、中心概念に対し、視点仕様保持部14cに格納
された視点に該当する関係を有する単語を抽出する。抽
出された語をカテゴリカウントテーブルに登録する。
In this embodiment, classification is performed based on viewpoints. In order to perform the classification based on the viewpoint, first, the text information portion of the document set in the initial document set holding unit 16 is analyzed, and a predetermined relationship between the central concept (words in the search formula) input from the input device 13 and And the relations between them are extracted.
Then, with respect to the central concept, a word having a relation corresponding to the viewpoint stored in the viewpoint specification holding unit 14c is extracted. Register the extracted words in the category count table.

【0024】図4は、カテゴリカウントテーブルの例を
示す図である。カテゴリカウントテーブル30は、「カ
テゴリ」とそのカテゴリに属する文書数(カウント)か
らなる。初期状態では、抽出された語がそのまま「カテ
ゴリ」に登録される。そして、その語の出現数が「カウ
ント」に設定される。
FIG. 4 is a diagram showing an example of the category count table. The category count table 30 includes a “category” and the number of documents (count) belonging to the category. In the initial state, the extracted words are registered in the “category” as they are. Then, the number of occurrences of the word is set to “count”.

【0025】このカテゴリカウントテーブルのカテゴリ
数が、分割数レジスタ14bの値よりも多い場合には、
単語マージアルゴリズムに基づきカテゴリの統合を行
う。以下、単語マージアルゴリズムについて説明する。 〔S1〕カテゴリカウントテーブルの最も出現数の少な
いカテゴリを選択する。 〔S2〕シソーラスを参照し、選択したカテゴリを含む
一つ上の概念を特定する。この概念を「W0」とする。 〔S3〕カテゴリカウントテーブルのカテゴリフィール
ドに登録されている単語の中で、シソーラス中で「W
0」の下位概念に該当するすべての単語を、「W0」に
置き換える。 〔S4〕カテゴリカウントテーブル中で、カテゴリフィ
ールドに「W0」と登録されているレコードのカウント
数を合計を計算する。その値を「C0」とする。 〔S5〕カテゴリカウントテーブル中のカテゴリフィー
ルドに「W0」と登録されている既存レコードをすべて
削除し、カウントが「C0」である新たなカテゴリ「W
0」のレコードを登録する。
If the number of categories in this category count table is larger than the value of the division number register 14b,
Combines categories based on the word merge algorithm. Hereinafter, the word merging algorithm will be described. [S1] The category with the least number of appearances in the category count table is selected. [S2] The upper level concept including the selected category is specified with reference to the thesaurus. This concept is referred to as “W0”. [S3] Among words registered in the category field of the category count table, "W
All words corresponding to the lower concept of “0” are replaced with “W0”. [S4] In the category count table, the total count of the records registered as "W0" in the category field is calculated. The value is set to “C0”. [S5] All existing records registered as "W0" in the category field in the category count table are deleted, and a new category "W" whose count is "C0" is deleted.
The record of "0" is registered.

【0026】例えば、図4に示したカテゴリカウントテ
ーブル30では、「W/S(ワークステーション)」が
最も頻度の小さい単語となっている。図3のシソーラス
を参照すると、「ワークステーション」の上位概念は
「計算機」となっている。「計算機」の下には、「パソ
コン」、「PDA」などがある。また、「パソコン」の
下には「デスクトップ」などがある。これらをすべて
「計算機」の概念の元に統合する。
For example, in the category count table 30 shown in FIG. 4, "W / S (workstation)" is the least frequent word. Referring to the thesaurus of FIG. 3, the superordinate concept of “workstation” is “computer”. Under the “computer”, there are “PC”, “PDA” and the like. In addition, there is a “desktop” under the “PC”. These are all integrated under the concept of "computer".

【0027】図5は、カテゴリ統合処理後のカウントテ
ーブルを示す図である。カテゴリ統合処理後のカウント
テーブル30aでは、図4における「パソコン」「W/
S」のカテゴリは消滅し、それらのカウント数は「計算
機」に加算されている。
FIG. 5 is a diagram showing a count table after the category integration processing. In the count table 30a after the category integration processing, the “PC”, “W /
The category of "S" has disappeared, and their count has been added to "Calculator".

【0028】カテゴリの数が、分割数レジスタ14bに
格納されている値以下になるまで、上記のようなカテゴ
リ統合処理を繰り返し実行する。さらに、分類機構部1
7は、分類された集合同士の類似度により、各集合を2
次元空間に配置する。これには「パソコン多次元尺度構
成法」( 岡太・今泉著、共立出版社) のクルスカルの方
法を用いる。そして、集合の要素数に応じて、分類を示
す領域の広さを広くする。または、その領域の色の濃度
を変えることにより、要素数の大小関係を視覚的に分か
り易くする。
Until the number of categories becomes equal to or less than the value stored in the division number register 14b, the above category integration processing is repeatedly executed. Further, the classification mechanism unit 1
7 indicates that each set is 2 based on the similarity between the classified sets.
Place in dimensional space. For this, we use the method of Kruskull of "PC multidimensional scale construction method" (Okata / Imaizumi, Kyoritsu Shuppan). Then, according to the number of elements in the set, the area indicating the classification is widened. Alternatively, by changing the color density of the area, the magnitude relation of the number of elements can be visually easily understood.

【0029】次に、分類機構部17はラベル付けを行
う。クラスタの分類ラベルのフィールドにそのクラスタ
を示す文字列を与える。ここでは、シソーラスのラベル
をそのまま用いる。なお、別の方法として、そのクラス
ターで多く用いられているキーワードの上位数個をラベ
ルとする方法もある。
Next, the classification mechanism 17 performs labeling. A character string indicating the cluster is given in the cluster label field. Here, the label of the thesaurus is used as it is. In addition, as another method, there is a method in which the top few keywords frequently used in the cluster are used as labels.

【0030】分類履歴保持部18は、分類機構部17に
よる分類結果を保持する。図6は、分類履歴保持部18
の保持内容を示す図である。情報は3つのテーブル3
1,32,33に分けて保持されている。
The classification history holding section 18 holds the classification result by the classification mechanism section 17. FIG. 6 shows the classification history holding unit 18.
It is a figure which shows the holding content. Information is three tables 3
1, 32, and 33 are held separately.

【0031】テーブル31には、「分類ID」、「日
付」、「期間」、「中心概念」、「視点」、「クラス
タ」及び「分類画面」の項目が登録される。「分類I
D」は、分類履歴を特定するための識別番号である。
「日付」は、分類対象とした期間(分類対象期間)の最
初の日の日付である。「期間」は、「日付」に示された
日から何日分の文書を分類対象としたのかを示してい
る。「中心概念」は、分類した際の中心概念を示してい
る。「視点」は、どのような視点に基づいて分類したの
かを示している。「クラスタ」には、分類することによ
り得られたクラスタの識別番号(分類ID)が登録され
ている。「分類画面」には、分類結果を2次元のイメー
ジ画像で表した分類画面31a,31bが格納されてい
る。 テーブル32には、「分類ID」、「分類ラベ
ル」、「個数」及び「メンバー」の項目が登録されてい
る。「分類ID」は、分類されたクラスタを特定するた
めの識別番号である。「分類ラベル」は、そのクラスタ
に付加されたラベルである。「個数」は、そのクラスタ
に含まれる文書数である。「メンバー」は、そのクラス
タに含まれる各文書の識別番号「文書ID」である。
In the table 31, items of "classification ID", "date", "period", "center concept", "viewpoint", "cluster" and "classification screen" are registered. "Category I
"D" is an identification number for specifying the classification history.
“Date” is the date of the first day of the period to be classified (classification target period). The “period” indicates how many days from the date indicated in the “date” were classified. The “center concept” indicates the center concept at the time of classification. The “viewpoint” indicates what kind of viewpoint is used for classification. In the “cluster”, the identification number (classification ID) of the cluster obtained by the classification is registered. The "classification screen" stores classification screens 31a and 31b in which the classification results are represented by two-dimensional image images. In the table 32, items of "classification ID", "classification label", "number", and "member" are registered. “Classification ID” is an identification number for specifying a classified cluster. “Classification label” is a label added to the cluster. “Number” is the number of documents included in the cluster. “Member” is the identification number “Document ID” of each document included in the cluster.

【0032】テーブル33には、「文書ID」と「表
題」が登録されている。「文書ID」は、各文書の識別
番号である。「表題」は、その文書の表題である。
In the table 33, "document ID" and "title" are registered. “Document ID” is an identification number of each document. "Title" is the title of the document.

【0033】分類提示機構部19は、入力装置13より
画面表示すべき分類履歴の指定を受け、その分類履歴の
分類画面を分類履歴保持部18から取り出し、表示装置
20の画面に表示する。
The classification presentation mechanism 19 receives designation of a classification history to be displayed on the screen from the input device 13, takes out the classification screen of the classification history from the classification history holding unit 18, and displays it on the screen of the display device 20.

【0034】図7は、分類画面の表示例を示す図であ
る。分類画面40には、複数の履歴アイコン41が表示
されている。各履歴アイコン41は分類履歴と対応して
おり、任意の履歴アイコン41を選択することにより、
対応する分類履歴を表示させることができる。
FIG. 7 is a diagram showing a display example of the classification screen. A plurality of history icons 41 are displayed on the classification screen 40. Each history icon 41 corresponds to a classification history, and by selecting an arbitrary history icon 41,
The corresponding classification history can be displayed.

【0035】選択された分類履歴は、第一分類画面42
と第二分類画面43とに表示される。このように2つの
分類履歴を並べて表示することにより、相違点を容易に
判断することができる。
The selected classification history is displayed on the first classification screen 42.
And the second classification screen 43. By displaying the two classification histories side by side in this way, the difference can be easily determined.

【0036】情報内容表示ウィンドウ44には、文書が
特定された場合に、その文書の内容を表示する。文書を
特定するには、例えば、第一分類画面42と第二分類画
面43の中から任意のクラスタを選択し、そのクラスタ
に含まれる文書の表題のリストを表示する。そして、表
題を参照して文書を選択することにより、その文書の内
容を情報表示ウィンドウ44に表示する。
When a document is specified, the information content display window 44 displays the content of the document. To specify a document, for example, an arbitrary cluster is selected from the first classification screen 42 and the second classification screen 43, and a list of titles of documents included in the cluster is displayed. Then, by selecting a document with reference to the title, the content of the document is displayed in the information display window 44.

【0037】図8は、分類画面の例を示す図である。こ
の分類画面45の左上の視点表示部45aには、中心概
念が「自動車」であり、視点が「対象」である旨を表示
している。すなわち、「自動車を対象として何をするの
か」という視点で分類がなされている。そして、分類画
面45内に、分類されたクラスタを示す楕円の図形45
b〜45jがラベルと共に表示されている。
FIG. 8 is a diagram showing an example of a classification screen. The viewpoint display section 45a at the upper left of the classification screen 45 indicates that the central concept is “car” and the viewpoint is “target”. That is, the classification is made from the viewpoint of "what to do with the automobile". Then, an elliptical figure 45 indicating the classified cluster is displayed in the classification screen 45.
b to 45j are displayed together with the label.

【0038】このようにして、複数の分類履歴を同時に
ユーザに提示することが可能となる。したがって、ユー
ザは、分類対象文書の期間が異なる2つの分類履歴を第
一分類画面42と第二分類画面43とに表示させること
により、その期間の間に、話題の分布がどのように推移
したのかを知ることができる。
In this way, a plurality of classification histories can be simultaneously presented to the user. Therefore, the user displays two classification histories with different periods of the document to be classified on the first classification screen 42 and the second classification screen 43, and how the distribution of topics changes during that period. You can know what.

【0039】次に、第2の実施の形態について説明す
る。この実施の形態は、2つの分類の表示画面の間の複
数の表示画面を作成し、これを順次表示することで、連
続的にクラスタが拡大縮小、分裂統合する様子を可視化
するものである。
Next, a second embodiment will be described. In this embodiment, a plurality of display screens between two types of display screens are created and sequentially displayed, thereby visualizing a state in which clusters are continuously enlarged, reduced, and integrated.

【0040】図9は、第2の実施の形態の概略構成を示
す図である。なお、この実施の形態において、大規模文
書集合51、シソーラス保持部52、入力装置53、仕
様保持部54(検索式保持部54a、分割数レジスタ5
4b、視点仕様保持部54c及び分類対象期間レジスタ
54dも含む)、検索機構部55、初期文書集合保持部
56、分類機構部57、分類履歴保持部58に関して
は、第1の実施の形態(図2に示す)における同名の構
成要素と同じ機能を有しているため、説明を省略する。
FIG. 9 is a diagram showing a schematic configuration of the second embodiment. In this embodiment, a large document set 51, a thesaurus storage unit 52, an input device 53, a specification storage unit 54 (a search expression storage unit 54a, a division number register 5
4b, a viewpoint specification storage unit 54c and a classification target period register 54d), a search mechanism unit 55, an initial document set storage unit 56, a classification mechanism unit 57, and a classification history storage unit 58 are described in the first embodiment (FIG. 2) have the same functions as the components of the same name in FIG.

【0041】文書クラスタ同定装置59は、入力装置5
3からの入力により指定された2つの分類結果に関し、
クラスタの包含関係を判断する。この実施の形態では、
シソーラス保持部52に保持されたシソーラスを用い
て、包含関係を判断する。すなわち、上位概念のクラス
タと、その下位概念のクラスタが存在していれば、下位
概念のクラスタは上位概念のクラスタに包含される。例
えば、「計算機」と「ワークステーション(W/S)」
のクラスタがあれば、「W/S」は「計算機」に包含さ
れる。
The document cluster identification device 59 is provided by the input device 5
Regarding the two classification results specified by the input from 3,
Determine the inclusion relationship of the cluster. In this embodiment,
The inclusion relation is determined using the thesaurus held in the thesaurus holding unit 52. That is, if there is a superordinate concept cluster and a subordinate concept cluster, the subordinate concept cluster is included in the superordinate concept cluster. For example, "computer" and "workstation (W / S)"
If there is a cluster of “W / S”, “W / S” is included in “computer”.

【0042】この結果、2つの分類履歴を比較すると、
各クラスタを「同一のクラスタ」、「包含関係にあるク
ラスタ」、「一方にのみ存在するクラスタ」の3種類に
分けられる。
As a result, comparing the two classification histories,
Each cluster is divided into three types: a "same cluster", a "cluster in an inclusive relationship", and a "cluster that exists in only one".

【0043】分類補間機構部60は、文書クラスタ同定
装置59の判断した包含関係に基づいて、2つの分類履
歴の表示画面を補間する複数の画面を生成する。なお、
前提として、クラスタを示す楕円は、中心座標(x、
y)と半径rで示される円のy軸方向を一定比率で縮小
して表すこととする。ここでは、60%とする。
The classification interpolator 60 generates a plurality of screens for interpolating the display screens of the two classification histories based on the inclusion relation determined by the document cluster identification device 59. In addition,
As a premise, an ellipse indicating a cluster has center coordinates (x,
The y-axis direction of a circle represented by y) and a radius r is reduced and represented at a fixed ratio. Here, it is set to 60%.

【0044】文書クラスタ同定装置59により「同一の
クラスタ」と判断された場合、以下のように補間処理を
行う。まず、一方の分類履歴(第1の分類)のクラスタ
を示す楕円をIB(0)とし、他方の分類履歴(第2の
分類)のクラスタを示す楕円をIB(9)とする。ここ
で、IB(0)の中心座標を(x0,y0)、半径をr
0とし、IB(9)の中心座標を(x9,y9)、半径
をr9とする。このときIB(i)(i=1,2,3,
・・・,8)の中心と半径は、
When the document cluster identifying device 59 determines that the clusters are the same, an interpolation process is performed as follows. First, an ellipse indicating a cluster of one classification history (first classification) is IB (0), and an ellipse indicating a cluster of the other classification history (second classification) is IB (9). Here, the center coordinates of IB (0) are (x0, y0), and the radius is r
0, the center coordinate of IB (9) is (x9, y9), and the radius is r9. At this time, IB (i) (i = 1, 2, 3,
..., 8) the center and radius are

【0045】[0045]

【数1】 (Equation 1)

【0046】[0046]

【数2】 (Equation 2)

【0047】[0047]

【数3】 となる。(Equation 3) Becomes

【0048】文書クラスタ同定装置59により「包含関
係にあるクラスタ」と判断された場合、以下のように補
間処理を行う。ここで、第1の分類におけるクラスタA
が、第2の分類では2つのクラスタB,Cに分裂する場
合を考える。このとき、クラスタAは順次消滅し、クラ
スタB、Cは、順次発生させなければならない。ここで
は、まず順次消滅させる方法を説明する。
If the document cluster identifying device 59 determines that the cluster is in an inclusive relation, an interpolation process is performed as follows. Here, cluster A in the first classification
However, in the second classification, consider a case where the cluster is divided into two clusters B and C. At this time, the cluster A sequentially disappears, and the clusters B and C must be sequentially generated. Here, a method of sequentially extinguishing them will be described.

【0049】IB(9)にクラスタAの仮想位置を設定
する。これは、クラスタB,Cを統合させたときにクラ
スタAが占めるであろう領域を計算する。その中心を
(x9,y9)、半径を(r9)とする。これにより、
上記式(1)〜式(3)により、IB(i)(i=1,
2,3,・・・,8)の楕円の形状が求まる。
The virtual position of cluster A is set in IB (9). This calculates the area that cluster A will occupy when clusters B and C are integrated. The center is (x9, y9) and the radius is (r9). This allows
According to the above equations (1) to (3), IB (i) (i = 1,
An elliptical shape of 2, 3, ..., 8) is obtained.

【0050】また、楕円内部がフラットな色付けがなさ
れているものとして、その色をRGB(赤、緑、青)の
三色で表すと、クラスタAの色は(R0,G0,B0)
で表される。IB(9)のクラスタAは表示しないの
で、そのRGB値(R9,G9,B9)は背景と同じ色
(さらに大きなクラスタの一部である場合には、そのク
ラスタの色)にする。そこで、
Further, assuming that the inside of the ellipse is colored flat, and that color is represented by three colors of RGB (red, green, blue), the color of cluster A is (R0, G0, B0)
It is represented by Since the cluster A of IB (9) is not displayed, its RGB values (R9, G9, B9) are set to the same color as the background (or the color of the cluster if it is part of a larger cluster). Therefore,

【0051】[0051]

【数4】 (Equation 4)

【0052】[0052]

【数5】 (Equation 5)

【0053】[0053]

【数6】 により、楕円IB(i)の色が求まる。(Equation 6) With this, the color of the ellipse IB (i) is obtained.

【0054】これにより、クラスタAが消滅する場合の
補間が図形が定義できる。クラスタB,Cが発生する際
の補間図形は、上記の処理により得られる図形を逆の順
番で並べればよい。
As a result, a figure can be defined for interpolation when the cluster A disappears. As the interpolated figures when the clusters B and C occur, the figures obtained by the above processing may be arranged in reverse order.

【0055】文書クラスタ同定装置59により「一方に
のみ存在するクラスタ」と判断された場合、以下のよう
に補間処理を行う。第1の分類におけるクラスタAが第
2の分類には存在していない場合には、前述のクラスタ
Aが分裂によって消滅する場合と同様にして消滅させ
る。この場合、IB(9)の中心座標と半径について
は、IB(0)と同じ値を用いる。
When the document cluster identification device 59 determines that the cluster is a cluster that exists only on one side, the interpolation process is performed as follows. When the cluster A in the first class does not exist in the second class, the cluster A is erased in the same manner as when the cluster A is erased by division. In this case, the same values as IB (0) are used for the center coordinates and the radius of IB (9).

【0056】第1の分類には存在しないクラスタが第2
の分類で発生している場合も、上記の分裂によって発生
するクラスタB,Cと同様にして順次発生させる。ラベ
ルについても同様の補間を行う。すなわち、ラベルを初
期位置から最終位置へ順次移動させる。消滅する場合
は、順次背景色に変えていく。なお、ラベルに関して
は、補間を行わず初期画面と最終画面のみに表示しても
良い。
The cluster that does not exist in the first classification is the second cluster.
Are generated sequentially in the same manner as the clusters B and C generated by the above division. Similar interpolation is performed for labels. That is, the label is sequentially moved from the initial position to the final position. When it disappears, it is sequentially changed to the background color. Note that labels may be displayed only on the initial screen and the final screen without performing interpolation.

【0057】以上の補間処理の全てを行うことにより、
第1の分類と第2の分類との間を補間する8つの表示画
面を得ることができる。このようにして分類補間機構部
60で補間された表示画面が、第1の分類と第2の分類
との分類画面と共に表示バッファ61に送られる。
By performing all of the above interpolation processing,
Eight display screens that interpolate between the first classification and the second classification can be obtained. The display screen interpolated by the classification interpolation mechanism unit 60 in this way is sent to the display buffer 61 together with the classification screens of the first classification and the second classification.

【0058】表示バッファ61は、10個の表示画面を
蓄えることができる。そして、分類補間機構部60から
送られた表示画面を順次蓄える。分類提示機構部62
は、表示バッファ61に蓄えられた表示画面を表示装置
63に表示する。
The display buffer 61 can store 10 display screens. Then, the display screens sent from the classification interpolation mechanism unit 60 are sequentially stored. Classification presentation mechanism 62
Displays the display screen stored in the display buffer 61 on the display device 63.

【0059】これにより、クラスタの成長、衰退、分
裂、統合をアニメーションで表示することができる。図
10は、アニメーション表示された分類の変化を示す図
である。これは、クラスタ71が2つのクラスタに分裂
し、クラスタ71自身は消滅する場合である。図中、左
端が第1の分類であり、右端が第2の分類である。その
間を補間する画面を2つだけ図示している。
Thus, the growth, decay, division, and integration of the cluster can be displayed by animation. FIG. 10 is a diagram showing a change in the classification displayed as an animation. This is a case where the cluster 71 splits into two clusters and the cluster 71 itself disappears. In the figure, the left end is the first classification, and the right end is the second classification. Only two screens for interpolating between them are shown.

【0060】クラスタ71は、第2の画面に近づくに従
い、色が薄くなり消滅する。一方、クラスタ72,73
は、薄い色が次第に濃くなり、第2の分類では明瞭に表
示されている。
The cluster 71 becomes lighter in color and disappears as it approaches the second screen. On the other hand, clusters 72 and 73
Are gradually darker in light color and are clearly displayed in the second classification.

【0061】次に、第3の実施の形態について説明す
る。これは、詳細を見たいクラスタを指定し、2つの分
類の間に複数の中間分類を見る場所を指定すると、情報
抽出装置が、履歴に蓄えられた部分計算結果を基に順次
一定区間の分類を行うものである。
Next, a third embodiment will be described. This is because, when a cluster for which details are to be specified is specified and a place where a plurality of intermediate classifications are to be viewed between two classifications is specified, the information extraction device sequentially classifies certain sections based on partial calculation results stored in the history. Is what you do.

【0062】この実施の形態に必要な構成要素は、第2
の実施の形態と同様であるため、図9に示した構成を用
いて第3の実施の形態の処理内容を説明する。複数の中
間分類のために、ユーザは、入力装置53を用いて以下
のようなパラメータを与える。 「分類対象期間の長さ」(例えば2ヶ月) 「初期分類の年月日」(例えば1996年3月1日) 「最終分類の年月日」(例えば現在) 「移動のステップ」(例えば15日) 分類補間機構部60は、このようなパラメータにしたが
って、初期分類、最終分類、及び中間分類の間を補間す
る。上記のパラメータに従えば、次にようになる。初期
分類が「1996年1月1日−1996年3月1日」に
発生した情報群の分類。第1の中間分類が「1996年
1月15日−1996年3月15日」に発生した情報群
の分類。
The components necessary for this embodiment are the second
Since the third embodiment is the same as the third embodiment, the processing contents of the third embodiment will be described using the configuration shown in FIG. For a plurality of intermediate classifications, the user gives the following parameters using the input device 53. "Length of classification target period" (for example, 2 months) "Date of initial classification" (for example, March 1, 1996) "Date and time of final classification" (for example, present) "Step of movement" (for example, 15) Day) The classification interpolation mechanism unit 60 interpolates between the initial classification, the final classification, and the intermediate classification according to such parameters. According to the above parameters: Classification of the information group whose initial classification occurred on "January 1, 1996-March 1, 1996". Classification of the information group in which the first intermediate classification occurred on "January 15, 1996-March 15, 1996".

【0063】以降、同様に対象期間が15日ずつ移動さ
せた分類履歴を分類履歴保持部58から取得する。ここ
で、もし適切な時間間隔のものがなければ、分類履歴保
持部58に格納されている単位区間分類を部分計算結果
とし、それらを合成することで、必要な期間の分類履歴
を生成する。なお、単位区間分類を生成するには、検索
機構部55に予め単位期間を与えておき、単位期間ごと
に定期的に検索を行わせる。検索機構部55が定期的に
検索を行えば、それに応じて分類機構部57が単位区間
分類を生成し、生成された単位区間分類が分類履歴保持
部58に保持される。
Thereafter, the classification history whose target period is shifted by 15 days is similarly acquired from the classification history holding unit 58. If there is no appropriate time interval, the unit section classification stored in the classification history holding unit 58 is used as a partial calculation result, and these are combined to generate a classification history of a necessary period. To generate a unit section classification, a unit period is given to the search mechanism unit 55 in advance, and the search is periodically performed for each unit period. If the search mechanism unit 55 performs the search periodically, the classification mechanism unit 57 generates a unit section classification accordingly, and the generated unit section classification is stored in the classification history storage unit 58.

【0064】図11は、第3の実施の形態における分類
対象期間を示す図である。この図の横軸は時間である。
初期分類の対象期間81は、初期分類の年月日である
「1996年3月1日」までの2ヶ月間である。第1の
中間分類の対象期間82は、初期分類の対象期間81か
ら15日移動させた期間である。以後同様に、第2の中
間分類の対象期間83、第3の中間分類の対象期間8
4、最終分類の対象期間85が定められられる。
FIG. 11 is a diagram showing classification target periods according to the third embodiment. The horizontal axis in this figure is time.
The initial classification target period 81 is a two-month period up to “March 1, 1996” which is the date of the initial classification. The target period 82 of the first intermediate classification is a period shifted by 15 days from the target period 81 of the initial classification. Thereafter, similarly, the target period 83 of the second intermediate classification and the target period 8 of the third intermediate classification
4. The target period 85 for the final classification is determined.

【0065】単位区間分類91〜98は、15日毎の分
類である。これらの単位区間分類91〜98の中の必要
なものをマージすることにより、必要な分類対象期間に
おける分類履歴を生成することができる。単位区間分類
をマージするには、それらのカテゴリカウントテーブル
を単純にマージし、同じカテゴリのカウントを合計す
る。そして、前述の単語マージアルゴリズムにより、カ
テゴリ数が指定分割数になるまでクラスタのマージを繰
り返す。これにより、単位区間分類から必要とする期間
の分類履歴を得ることができる。
The unit section classifications 91 to 98 are classifications every 15 days. By merging necessary ones of these unit section classifications 91 to 98, a classification history in a necessary classification target period can be generated. To merge the unit section classifications, those category count tables are simply merged and the counts of the same category are summed. Then, cluster merging is repeated by the above-described word merging algorithm until the number of categories reaches the designated number of divisions. Thereby, a classification history of a required period can be obtained from the unit section classification.

【0066】そして、これらの分類履歴の間を分類補間
機構部60が補間する。すなわち、初期分類と第1の中
間分類との間、第1の中間分類と第2の中間分類との
間、第2の中間分類と第3の中間分類との間、及び第3
の中間分類と最終分類との間を補間する。その結果が表
示バッファ61に格納される(この場合、第2の実施の
形態よりも容量の大きな表示バッファが必要である)。
そして、分類提示機構部62が表示バッファの内容を順
次表示装置63に表示する。
Then, the classification interpolator 60 interpolates between these classification histories. That is, between the initial classification and the first intermediate classification, between the first intermediate classification and the second intermediate classification, between the second intermediate classification and the third intermediate classification, and
Is interpolated between the intermediate classification and the final classification. The result is stored in the display buffer 61 (in this case, a display buffer having a larger capacity than in the second embodiment is required).
Then, the classification and presentation mechanism unit 62 sequentially displays the contents of the display buffer on the display device 63.

【0067】このように、複数の中間分類を求め、それ
らの間を補間してアニメーション表示することにより、
例えば、情報量が一度増加した後に消滅した場合など、
初期分類と最終分類だけでは知り得ない情報を、アニメ
ーションで表示することができる。
As described above, by obtaining a plurality of intermediate classifications and interpolating between them to display an animation,
For example, if the amount of information increases once and then disappears,
Information that cannot be known from the initial classification and the final classification alone can be displayed in an animation.

【0068】なお、上記の処理機能は、コンピュータに
よって実現することができる。その場合、分類情報提示
装置が有しているべき機能の処理内容は、コンピュータ
で読み取り可能な記録媒体に記録されたプログラムに記
述されており、このプログラムをコンピュータで実行す
ることにより、上記処理がコンピュータで実現される。
コンピュータで読み取り可能な記録媒体としては、磁気
記録装置や半導体メモリ等がある。市場を流通させる場
合には、CD−ROMやフロッピーディスケット等の可
搬型記録媒体にプログラムを格納して流通させたり、ネ
ットワークを介して接続されたコンピュータの記憶装置
に格納しておき、ネットワークを通じて他のコンピュー
タに転送することもできる。コンピュータで実行する際
には、コンピュータ内のハードディスク装置等にプログ
ラムを格納しておき、メインメモリにロードして実行す
る。
The above processing functions can be realized by a computer. In that case, the processing contents of the functions that the classification information presentation device should have are described in a program recorded on a computer-readable recording medium, and the above processing is executed by executing this program on a computer. Implemented by computer.
Examples of the computer-readable recording medium include a magnetic recording device and a semiconductor memory. When distributing in the market, the program is stored and distributed on a portable recording medium such as a CD-ROM or a floppy diskette, or stored in a storage device of a computer connected via a network. Can also be transferred to a computer. When the program is executed by the computer, the program is stored in a hard disk device or the like in the computer, and is loaded into the main memory and executed.

【0069】[0069]

【発明の効果】以上説明したように本発明の分類情報提
示装置では、対象とする文書の発生時刻を時間的に限定
し、時間区分の異なる分類結果を保持しておき、複数の
分類結果が指定されると、それらを表示装置に表示する
ため、情報の分布状況が時間の経過と共にどのように変
化したのかを容易に把握することができる。
As described above, in the classification information presentation apparatus of the present invention, the generation time of a target document is limited in time, classification results having different time divisions are held, and a plurality of classification results are stored. When specified, they are displayed on the display device, so that it is easy to grasp how the distribution state of the information has changed over time.

【0070】また、本発明の分類情報提示プログラムを
記録した媒体では、記録された分類情報提示プログラム
をコンピュータで実行することにより、時間区分の異な
る分類結果をコンピュータに保持させ、複数の分類結果
をコンピュータに表示させることができる。その結果、
情報の分布状況が時間の経過と共にどのように変化した
のかを容易に把握できるような分類情報の提示をコンピ
ュータに行わせることが可能となる。
Further, in the medium on which the classification information presentation program of the present invention is recorded, the recorded classification information presentation program is executed by a computer, whereby the classification results having different time divisions are stored in the computer, and a plurality of classification results are stored. It can be displayed on a computer. as a result,
It is possible to cause a computer to present classification information so that it is easy to grasp how the distribution state of information has changed over time.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】本発明の第1の実施の形態の概略構成を示す図
である。
FIG. 2 is a diagram showing a schematic configuration of a first embodiment of the present invention.

【図3】シソーラスの例を示す図である。FIG. 3 is a diagram illustrating an example of a thesaurus.

【図4】カテゴリカウントテーブルの例を示す図であ
る。
FIG. 4 is a diagram showing an example of a category count table.

【図5】カテゴリ統合処理後のカウントテーブルを示す
図である。
FIG. 5 is a diagram showing a count table after category integration processing.

【図6】分類履歴保持部の保持内容を示す図である。FIG. 6 is a diagram showing contents held by a classification history holding unit.

【図7】分類画面の表示例を示す図である。FIG. 7 is a diagram showing a display example of a classification screen.

【図8】分類画面の例を示す図である。FIG. 8 is a diagram showing an example of a classification screen.

【図9】第2の実施の形態の概略構成を示す図である。FIG. 9 is a diagram illustrating a schematic configuration of a second embodiment.

【図10】アニメーション表示された分類の変化を示す
図である。
FIG. 10 is a diagram illustrating a change in classification displayed as an animation.

【図11】第3の実施の形態における分類対象期間を示
す図である。
FIG. 11 is a diagram illustrating classification target periods according to the third embodiment.

【符号の説明】[Explanation of symbols]

1 文書保持手段 2 入力装置 3 仕様保持手段 4 検索手段 5 分類手段 6 分類履歴保持手段 7 分類提示手段 8 表示装置 DESCRIPTION OF SYMBOLS 1 Document holding means 2 Input device 3 Specification holding means 4 Search means 5 Classification means 6 Classification history holding means 7 Classification presentation means 8 Display device

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 情報群の分布状況を提示する分類情報提
示装置において、 情報発生時刻が与えられた文書を保持する文書保持手段
と、 検索式と分類対象期間とを含む分類仕様を保持する仕様
保持手段と、 前記仕様保持手段に保持された検索式に適合し、前記仕
様保持手段に保持された分類対象期間内の情報発生時刻
が与えられた文書を、前記文書保持手段から検索する検
索手段と、 前記検索手段の検出した文書を、類似性にしたがって複
数の文書集合に分類する分類手段と、 前記分類手段による分類結果を保持する分類履歴保持手
段と、 前記分類履歴保持手段の中の複数の分類結果が指定され
ると、指定された分類結果を表示装置に表示する分類提
示手段と、 を有することを特徴とする分類情報提示装置。
1. A classification information presentation device for presenting a distribution state of an information group, comprising: a document holding unit for holding a document given an information generation time; and a specification for holding a classification specification including a search formula and a classification target period. Holding means, and a search means for searching, from the document holding means, a document which matches the search expression held in the specification holding means and which is given the information occurrence time within the classification target period held in the specification holding means. A classification unit that classifies the documents detected by the search unit into a plurality of document sets according to similarity; a classification history storage unit that stores the classification result by the classification unit; And a classifying means for displaying the specified classification result on a display device when the classification result is specified.
【請求項2】 前記分類手段は、分類結果として、分類
された個々の文書集合が1つの図形で表された画像情報
を生成することを特徴とする請求項1記載の分類情報提
示装置。
2. The classification information presentation device according to claim 1, wherein the classification unit generates, as a classification result, image information in which the classified individual document sets are represented by one graphic.
【請求項3】 前記分類履歴保持手段の中の2つの分類
結果が指定されると、指定された分類結果の一方の分類
結果から他方の分類結果へ、文書集合が徐々に移り変わ
る様子を示す補間画面を生成する分類補間手段をさらに
有し、 前記分類提示手段は、指定された2つの分類結果の間に
前記分類補間手段が生成した補間画面をはさんで、連続
的に表示することを特徴とする請求項1記載の分類情報
提示装置。
3. When two classification results in the classification history holding means are designated, an interpolation showing a state in which a document set gradually changes from one of the designated classification results to the other classification result. A classification interpolating unit that generates a screen, wherein the classification presenting unit continuously displays the interpolation screen generated by the classification interpolating unit between two designated classification results. The classification information presentation device according to claim 1, wherein
【請求項4】 前記検索手段は、予め与えられた期間毎
に検索処理を実行することを特徴とする請求項1記載の
分類情報提示装置。
4. The classification information presenting apparatus according to claim 1, wherein said search means executes a search process every predetermined period.
【請求項5】 情報群の分布状況をコンピュータに提示
させるための分類情報提示プログラムを記録した媒体に
おいて、 情報発生時刻が与えられた文書を保持する文書保持手
段、 検索式と分類対象期間とを含む分類仕様を保持する仕様
保持手段、 前記仕様保持手段に保持された検索式に適合し、前記仕
様保持手段に保持された分類対象期間内の情報発生時刻
が与えられた文書を、前記文書保持手段から検索する検
索手段と、 前記検索手段の検出した文書を、類似性にしたがって複
数の文書集合に分類する分類手段、 前記分類手段による分類結果を保持する分類履歴保持手
段、 前記分類履歴保持手段の中の複数の分類結果が指定され
ると、指定された分類結果を表示装置に表示する分類提
示手段、 としてコンピュータを機能させるための分類情報提示プ
ログラムを記録した媒体。
5. A medium storing a classification information presentation program for causing a computer to present the distribution status of an information group, a document holding means for holding a document given an information generation time, a search formula and a classification target period. A specification holding unit that holds a classification specification including the document, and a document that matches the search expression held by the specification holding unit and is given the information occurrence time within the classification target period held by the specification holding unit. Search means for searching from means, classification means for classifying the documents detected by the search means into a plurality of document sets according to similarity, classification history holding means for holding the classification result by the classification means, classification history holding means When a plurality of classification results are designated, the classification presentation means for displaying the designated classification results on a display device, Medium recording information presentation program.
JP9163647A 1997-06-20 1997-06-20 Sorting information presenting device and medium recording sorting information presenting program Pending JPH1115835A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9163647A JPH1115835A (en) 1997-06-20 1997-06-20 Sorting information presenting device and medium recording sorting information presenting program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9163647A JPH1115835A (en) 1997-06-20 1997-06-20 Sorting information presenting device and medium recording sorting information presenting program

Publications (1)

Publication Number Publication Date
JPH1115835A true JPH1115835A (en) 1999-01-22

Family

ID=15777925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9163647A Pending JPH1115835A (en) 1997-06-20 1997-06-20 Sorting information presenting device and medium recording sorting information presenting program

Country Status (1)

Country Link
JP (1) JPH1115835A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143796A (en) * 1997-11-10 1999-05-28 Nippon Telegr & Teleph Corp <Ntt> Mailing list service system
JP2002230012A (en) * 2000-12-01 2002-08-16 Sumitomo Electric Ind Ltd Document clustering device
JP2002245065A (en) * 2001-02-14 2002-08-30 Ricoh Co Ltd Document processor, document processing method, program and recording medium
JP2003099446A (en) * 2001-09-21 2003-04-04 Ricoh Co Ltd Document sorting device and method, and recording medium with the same recorded thereon
JP2004326476A (en) * 2003-04-25 2004-11-18 Hitachi Ltd Document analysis system for integrating data into text
JP2004355484A (en) * 2003-05-30 2004-12-16 Fuji Xerox Co Ltd Method, device and program for supporting sharing of information
JP2005122683A (en) * 2003-09-22 2005-05-12 Nippon Telegr & Teleph Corp <Ntt> Information providing method and system, and information providing program
JP2006323627A (en) * 2005-05-19 2006-11-30 Hitachi East Japan Solutions Ltd Classification list creation support system and program
JP2010176667A (en) * 2009-01-27 2010-08-12 Palo Alto Research Center Inc System and method for using banded topic relevance and time for article prioritization
JP2011048802A (en) * 2009-08-30 2011-03-10 Yahoo Japan Corp Bookmark service providing device, and operation method of the bookmark service providing device
JP5494999B1 (en) * 2012-04-26 2014-05-21 日本電気株式会社 Text mining system, text mining method and program
JP2017187823A (en) * 2016-04-01 2017-10-12 前田建設工業株式会社 Expression addition device, expression addition method, and expression addition program
WO2023228902A1 (en) * 2022-05-26 2023-11-30 ダイキン工業株式会社 Assessment assistance device, assessment method, and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0371194A (en) * 1989-08-07 1991-03-26 American Teleph & Telegr Co <Att> Dynamic graphics apparatus for use in computer and method for dynamic display of data generated at time interval
JPH0876951A (en) * 1994-09-07 1996-03-22 Toshiba Corp System and method for displaying map of hypermedia

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0371194A (en) * 1989-08-07 1991-03-26 American Teleph & Telegr Co <Att> Dynamic graphics apparatus for use in computer and method for dynamic display of data generated at time interval
JPH0876951A (en) * 1994-09-07 1996-03-22 Toshiba Corp System and method for displaying map of hypermedia

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143796A (en) * 1997-11-10 1999-05-28 Nippon Telegr & Teleph Corp <Ntt> Mailing list service system
JP2002230012A (en) * 2000-12-01 2002-08-16 Sumitomo Electric Ind Ltd Document clustering device
JP2002245065A (en) * 2001-02-14 2002-08-30 Ricoh Co Ltd Document processor, document processing method, program and recording medium
JP2003099446A (en) * 2001-09-21 2003-04-04 Ricoh Co Ltd Document sorting device and method, and recording medium with the same recorded thereon
JP2004326476A (en) * 2003-04-25 2004-11-18 Hitachi Ltd Document analysis system for integrating data into text
JP2004355484A (en) * 2003-05-30 2004-12-16 Fuji Xerox Co Ltd Method, device and program for supporting sharing of information
JP2005122683A (en) * 2003-09-22 2005-05-12 Nippon Telegr & Teleph Corp <Ntt> Information providing method and system, and information providing program
JP4490871B2 (en) * 2005-05-19 2010-06-30 株式会社 日立東日本ソリューションズ Classification list creation support system and classification list creation support program
JP2006323627A (en) * 2005-05-19 2006-11-30 Hitachi East Japan Solutions Ltd Classification list creation support system and program
JP2010176667A (en) * 2009-01-27 2010-08-12 Palo Alto Research Center Inc System and method for using banded topic relevance and time for article prioritization
JP2011048802A (en) * 2009-08-30 2011-03-10 Yahoo Japan Corp Bookmark service providing device, and operation method of the bookmark service providing device
JP5494999B1 (en) * 2012-04-26 2014-05-21 日本電気株式会社 Text mining system, text mining method and program
US10409848B2 (en) 2012-04-26 2019-09-10 Nec Corporation Text mining system, text mining method, and program
JP2017187823A (en) * 2016-04-01 2017-10-12 前田建設工業株式会社 Expression addition device, expression addition method, and expression addition program
WO2023228902A1 (en) * 2022-05-26 2023-11-30 ダイキン工業株式会社 Assessment assistance device, assessment method, and program
JP2023174573A (en) * 2022-05-26 2023-12-07 ダイキン工業株式会社 Evaluation assistance device, evaluation assistance method, and program

Similar Documents

Publication Publication Date Title
US11663230B2 (en) Interface including graphic representation of relationships between search results
EP0722145B1 (en) Information retrieval system and method of operation
JP4116329B2 (en) Document information display system, document information display method, and document search method
JP3303926B2 (en) Structured document classification apparatus and method
Dou et al. Hierarchicaltopics: Visually exploring large text collections using topic hierarchies
JP3001460B2 (en) Document classification device
US6301579B1 (en) Method, system, and computer program product for visualizing a data structure
JP3049636B2 (en) Data analysis method
EP0615201B1 (en) Document detection system using detection result presentation for facilitating user&#39;s comprehension
US6745183B2 (en) Document retrieval assisting method and system for the same and document retrieval service using the same
JP3577819B2 (en) Information search apparatus and information search method
US6532469B1 (en) Determining trends using text mining
US6026409A (en) System and method for search and retrieval of digital information by making and scaled viewing
US20060225000A1 (en) Graphical application interface using browser
US8077178B2 (en) Displaying multi-ownership in a tree-map visualization
US20020091679A1 (en) System for searching collections of linked objects
US20060224983A1 (en) Graphical visualization of data using browser
US20060224999A1 (en) Graphical visualization of data product using browser
US20060224984A1 (en) Apparatus for creating graphical visualization of data with a browser
US20060224972A1 (en) Graphical application interface with a browser
JP2003345810A (en) Method and system for document retrieval and document retrieval result display system
US20020099581A1 (en) Computer-implemented dimension engine
JP2004287725A (en) Retrieval processing method and program
JPH1115835A (en) Sorting information presenting device and medium recording sorting information presenting program
JP3577822B2 (en) Information presentation apparatus and information presentation method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040525

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041005