JP3367174B2 - Document group analyzing apparatus and method - Google Patents

Document group analyzing apparatus and method

Info

Publication number
JP3367174B2
JP3367174B2 JP29127493A JP29127493A JP3367174B2 JP 3367174 B2 JP3367174 B2 JP 3367174B2 JP 29127493 A JP29127493 A JP 29127493A JP 29127493 A JP29127493 A JP 29127493A JP 3367174 B2 JP3367174 B2 JP 3367174B2
Authority
JP
Japan
Prior art keywords
category
step
search
document
categories
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP29127493A
Other languages
Japanese (ja)
Other versions
JPH07121552A (en
Inventor
慎太郎 古城
Original Assignee
富士ゼロックス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士ゼロックス株式会社 filed Critical 富士ゼロックス株式会社
Priority to JP29127493A priority Critical patent/JP3367174B2/en
Publication of JPH07121552A publication Critical patent/JPH07121552A/en
Application granted granted Critical
Publication of JP3367174B2 publication Critical patent/JP3367174B2/en
Anticipated expiration legal-status Critical
Application status is Expired - Fee Related legal-status Critical

Links

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、文書を保管管理するデータベースから文書群を検索し、その分析を行う文書群分析装置および方法に関する。 BACKGROUND OF THE INVENTION [0001] [Technical Field of the Invention The present invention retrieves the documents from a database to store managing documents, relating to the document group analyzing apparatus and method for the analysis. 【0002】 【従来の技術】文書を自動分類する方法として、特定の文字列を含んでいるかどうかで判断する、という方法があった。 [0002] As a method of the Related Art Automatic classify documents, judged by whether it contains a specific character string, there is a method of. それに加え、複数の文字列を総称する「カテゴリー」を定義して、厳密な文字列照合では取りこぼしてしまう、表記のゆれや類似語に対応する方法も提案されている(特開平2−105973号公報)。 Additionally, by defining a "category" as a generic term for multiple strings, resulting in missed an exact string matching method corresponding to the Spelling and similar language has been proposed (JP-A-2-105973 Publication). しかし、いずれにしても文字列あるいはカテゴリーの扱いは固定的である。 However, the handling of the string or category in any event is fixed. この方法は、予め想定される分類項目に、無理にでも仕分るための方式を取っている。 This method is, in categories that are assumed in advance, is taking a scheme for Ru forcibly even sorting. こうしたやり方は、(1)単語の頻度が今後も変化しない、(2)新たに設けるべき分類項目はない、といった仮定に基づいており、これは現実と一致しない。 Such approach, (1) frequency of the word does not change in the future, (2) new categories are not to be provided, based on the assumption such, this is inconsistent with reality. 例え、しばらくの間は、ある程度有効に動作していたとしても、いずれはシステムの改編は免れないようになるだろう。 For example, for a while, even though operating effective to some extent, one is going to be as inevitable system of reorganization. つまり、予め想定した分類のためにカテゴリーを利用するにとどまっており、新しい分類項目が現れることを見逃している。 In other words, has remained to take advantage of the category for pre-assumed classification, we have missed the fact that new categories appear. 分類すべき文書群の性質が一定であるときは、それなりに有用であるかもしれないが、文書の性質は一般的には変わりうるものであるから、分類方式も時々変化すべき性質をもつべきである。 When the nature of the documents to be classified is constant, but may be useful in its own way, the nature of the documents because generally one in which may vary, classification scheme also should have the property to be changed from time to time it is. 【0003】 【発明が解決しようとする課題】前述のように従来の技術では固定的な分類がなされ、動的な分類ができない。 [0003] Fixed classification is made in THE INVENTION It is an object Solved] The foregoing as prior art, it can not be dynamically classified.
例えば、従来の技術を利用して「コンピュータ」関連の文書と「医療」関連の文書を別々の場所に分けて置いておくと、医療分野にコンピュータメーカーがこぞって参入しはじめた、といった状況に対応することができない。 For example, if keep in using conventional techniques divide the "computer" related documents and "medical" related documents in a separate location, computer manufacturers began to enter gang in the medical field, corresponding to a situation such as Can not do it. つまり、従来のやりかたでは、どちらかに入れられてしまうからである。 In other words, in the conventional manner, it is because the would be placed in either. こういうときには、「コンピュータかつ医療」についての文書を他からより分けて見たいはずである。 In such case, should you want to see and sort through the document for the "computer and medical care" from the other. 前もって分類項目を想定するのは、変化の激しい状況においては、得策ではない。 It is to assume the pre-classification item, in the intense situation of change, not a good idea. また、分類より先にカテゴリーの方が来るべきであり、分類はカテゴリーを適当に組み合せることで得られるべきである。 In addition, previously should come more categories than classification, classification should be obtained by combining the appropriate category. 分類のためにカテゴリーを定義するのでは本末顛倒である。 Classification of defining the category for which is a cause and effect beetle.
本発明は、このような従来の技術の問題点を解消し、文書群分析装置において、検索のためのカテゴリーの有効な活用を図り、かつ、即時的な分類が得られ、ある語が別のカテゴリーに移るといった操作にも耐える柔軟なシステム構築をすることを目的とする。 The present invention is to solve the problems inherent in the prior art, the document group analyzing apparatus, achieving effective utilization categories for retrieval, and immediate classification obtained, a word is in a different and an object thereof is to also flexible system construction to withstand operation such moves to categories. また、最新の情報に対応したカテゴリーの定義の変更を容易に行うことができるようにすることを目的とする。 Another object is to allow easily change the definition of the categories corresponding to the latest information. 【0004】 【課題を解決するための手段】本発明の文書群分析装置は、分析対象の複数の文書を記憶する対象記憶手段(図1の15)と、検索用の複数のカテゴリーの語を組み合わせて入力する入力手段(図1の11)と、カテゴリーが定義され、カテゴリーの語を展開するために用いる展開情報記憶手段(図1の12)と、前記入力されたカテゴリーの語を前記展開情報記憶手段を参照して下位の階 [0004] Means for Solving the Problems A document group analyzing apparatus of the present invention, the object storage means for storing a plurality of documents to be analyzed (15 of FIG. 1), the words of the plurality of categories for the search combination input means for inputting (11 in FIG. 1), category is defined, and deployment information storage means used to deploy the word categories (12 in FIG. 1), before the word of the input category Symbol lower floor with reference to the expansion information storage means
層のカテゴリー要素およびその類義語の集合へ展開する用語展開手段(図1の13)と、 前記用語展開手段によ The term development means for developing the set of categories elements and their synonyms layer (13 in FIG. 1), the term expansion means
り展開されたカテゴリー要素および類義語により前記対象記憶手段の文書を検索する検索手段(図1の14) Retrieval means for retrieving a document of the target storage means by expanded category elements and synonyms Ri (14 in FIG. 1)
と、検索された文書群を、前記入力されたカテゴリー When the retrieved documents, the input category
組み合わせによって定まる新たなカテゴリー群に分類、 Classification to a new category group, which is determined by the combination,
集計する集計手段(図1の16)と、集計結果を指定の表示形式により表示する表示手段(図1の17)とを備えたことを特徴とする。 And aggregation means for aggregating (16 in FIG. 1), characterized by comprising a display means for displaying (17 in FIG. 1) by the display format of the designated count results. また、上記構成において、前記展開情報記憶手段のカテゴリーの定義を編集するための編集手段(図1の18)を設けることができる。 In the above structure, it is possible to provide an editing unit (18 in FIG. 1) for editing the definition of categories of the expansion information storage means. また、 Also,
本発明の文書群分析方法は、 ユーザの入力を受ける入力 Document group analysis method of the present invention includes an input for receiving an input of a user
手段と、分析対象の複数の文書を記憶する対象記憶手段 Target storage means for storing and means, a plurality of documents to be analyzed
と、検索用の複数のカテゴリーが定義された展開情報記 If, expand information recording in which a plurality of categories for the search has been defined
憶手段とを有する文書群分析装置が実行する文書群分析 Document group analysis document group analyzing device having a憶means executes
方法であって、検索用の複数のカテゴリーの語を組み合 A method, if set a word of multiple categories for the search
わせを前記入力手段で受けるステップと、前記入力され A step of receiving the Align by the input means, the inputted
たカテゴリーの語を前記展開情報記憶手段を参照して下 Below was the word of the category by referring to the expansion information storage means
位の階層のカテゴリー要素およびその類義語の集合へ展 Exhibition to a collection of category elements and their synonyms of much of the hierarchy
開するステップと、前記展開されたカテゴリー要素およ A step of opening, Oyo the expanded category elements
び類義語により前記対象記憶手段の文書を検索するステ Stearyl search for documents of the object storage means by the fine Synonyms
ップと、検索された文書群を、前記入力されたカテゴリ And-up, the retrieved documents, has been the input category
ーの組み合わせによって定まる新たなカテゴリー群に分 Minute in a new category group, which is determined by a combination of over
類、集計するステップと、集計結果を指定の表示形式に Kind, the method comprising the steps of: aggregate, the aggregate result to specify the display format
より表示するステップとを備えたことを特徴とする。 Characterized by comprising a step of further displaying. 【0005】 【作用】入力手段によりユーザが分析しようとする文書群に関係ありそうな複数のカテゴリーの語の組合せを入力すると、用語展開手段は展開情報記憶手段に記憶されたカテゴリーの定義に従って、検索用のキーとなる語を得る。 [0005] [action] When the user by the input means inputs the word combination of trying several likely relevant to the group of documents category analysis, the term expansion means according to the definition of stored in the expansion information storage means category, get the word to be the key for the search. 検索手段は用語展開手段によって得られた検索用のキーとなる語により、対象記憶手段に記憶された文書を検索する。 Retrieval means by the term a key for the search obtained by the term development means, to search for documents stored in the target storage unit. その検索によって得られた文書群は入力手段によって入力された複数のカテゴリー(例えば、「製品」「競合」「地域」)の範囲のすべてが網羅されている。 Group of documents obtained by the search multiple categories that have been input by the input means (for example, "product" "competitive," "regional") all of the range of are covered. 集計手段は、前記検索された文書群を前記入力された複数のカテゴリーのそれぞれの要素(「製品」カテゴリーに属する「複写機」「ファクシミリ」「ワークステーション」、「競合」カテゴリーに属する「P社」「Q Aggregation means, each element of the plurality of categories that the retrieved documents are the input (belonging to "Product" category "Copier", "facsimile", "Workstation", belonging to the "competitive" category "Company P "" Q
社」、「第二四半期」カテゴリーに属する「4月」「5 Company "," "April belongs to the second quarter" category "," 5
月」「6月」など)間の論理演算によって定まる組み合わせのカテゴリー群に分類、集計する。 Moon "," June ", etc.) classified in category group of the combination, which is determined by the logical operation between, to aggregate. 表示手段は集計結果を指定の表示形式(図13)で一覧表示する。 Display means list in the specified display format count results (Figure 13). 本発明によれば、入力した複数のカテゴリーを定義によって展開し、定義された範囲の文書をすべて索出し、定義されたカテゴリー要素間の論理演算によって得られるカテゴリーの新たな組み合わせ対して分類集計するので、即時的な分類が得られ、動的な分類ができる。 According to the present invention, developed by defining a plurality of categories entered, out of all the documents in the defined range search, classifying aggregate for new combinations of the obtained category by a logical operation between the defined category elements since immediate classification is obtained, it is dynamic classification. また、細かな分類もできる。 In addition, it is also fine classification. 従って、ある語が別のカテゴリーに移るといった操作にも耐える柔軟なシステム構築をすることができる。 Therefore, it is possible to a flexible system construction to withstand operations such a word is passed to another category. それを表示する際には、複数のキー語の分布状態を一回のユーザ入力で調べることができる。 When displaying it can examine the distribution of the plurality of keys words in a single user input. それによって文書群全体からの傾向を見て取ることや、文書群どうしの関連などが具体的にわかる。 It by or be seen a tendency of the whole document group, such as related documents each other is understood to specifically. また、展開情報記憶手段のカテゴリーの定義を編集するための編集手段を設けた場合には、カテゴリーの定義を随時変更することができるので、最新の情報に対応したカテゴリーの定義の変更を容易に行うことができる。 Further, in case of providing the editing means for editing the definition of categories of development information storage means, it is possible to change the definition of categories at any time, easily changing the definition of categories corresponding to the latest information It can be carried out. 【0006】 【実施例】図1は本発明の実施例による文書群分析装置の構成を示す図である。 [0006] [Embodiment] FIG. 1 is a diagram showing a configuration of a document group analyzing apparatus according to an embodiment of the present invention. この文書群分析装置は、図1に示すように、文書群分析用コマンドを含む操作指示情報や表示用のデータ形式等を入力するための入力部11 The document group analyzing apparatus, as shown in FIG. 1, an input unit 11 for inputting data format or the like for operation instruction information and display that includes a command for document group analysis
と、文書群分析用コマンドで指定する検索の用語(カテゴリー)をそれに関連するカテゴリ要素や類義語などの検索に用いる用語群と対応させた情報を格納する用語展開用データベース12と、文書群分析用コマンドから用語展開用データベース12を用いて、適切な検索コマンドに変換する検索条件作成部13と、インデックスを有し、文書を検索可能に保管した検索対象データベース1 When the term expanded database 12 for storing information search terms specified in the document group for analysis command (category) is associated with the term group is used to search for such categories elements and synonyms related thereto, document group analyzing using the terms deployment database 12 from the command, the search condition creation unit 13 for converting the appropriate search command has an index, the search target database 1 stores the document searchable
5と、検索条件作成部13から与えられた検索コマンドにより検索対象データベース14をインデックス等を用いて検索し、検索結果を集計部16に渡す問合せエンジン14と、検索結果に対して集計を行う集計部16と、 5, the search database 14 by the search command given from the search condition creation unit 13 searches using the index, and performs the query engine 14 to pass the search results to the aggregating unit 16, a summary for the search result counting and part 16,
集計の結果を入力部11から指示された表示形式に従って表示を行う表示部17と、用語展開用データの編集を行う用語展開用データ編集部18を備えている。 A display unit 17 for display according to the display format instructed to the results of the aggregation from the input unit 11, and a term deployment data editing unit 18 for editing the data term deployment. 【0007】次に、以上のように構成された本実施例の文書群分析装置の動作(処理)について説明する。 [0007] Next, a description will be given above of configured operation of the document group analyzing apparatus of this embodiment, as (process). 図2 Figure 2
は本文書群分析装置による文書群の分析の処理の概要を示すフローチャートである。 Is a flow chart showing an outline of a process of analysis of the document group according to the document group analyzing apparatus. 入力部11においては、使用するカテゴリーの指定を行う(ステップS21)。 In the input unit 11 performs designation of categories to be used (step S21). また、表示方法の指定を行う(ステップS22)。 Further, to designate a display method (step S22). 検索条件作成部13は入力部11から指定されたカテゴリーを用語展開用データベース12を用いて下位の階層のカテゴリー要素およびその類義語の集合へと展開する(ステップS23)。 The search condition creation unit 13 is developed into a set of categories elements and their synonyms lower hierarchy using the terms deployment database 12 the specified category from the input unit 11 (step S23). 問合せエンジン15は、検索条件作成部13で得られたそれぞれの類義語を用いて検索対象データベース14を全文検索により検索する(ステップS2 Query engine 15, the search database 14 searches the full-text search using the respective synonyms obtained in the search condition creation unit 13 (Step S2
4)。 4). 集計部16は検索結果をカテゴリー別に集計する(ステップS25)。 Counting unit 16 counts the search results by category (step S25). 表示部17は入力部11の指定する表示形式に従って表示を行う(ステップS26)。 The display unit 17 performs display according to the display format designated by the input unit 11 (step S26). ユーザはその表示を見て望ましい表示か否かを判断し、望ましい表示が得られていないときには、入力部11により表示方法の指定を変える。 The user determines whether look desirable display the display, when the display desired is not obtained, changing the designation of the display method by the input unit 11. そして、ステップS23〜 Then, step S23~
26の処理が再び実行されて、新しい表示方法により表示する。 Process 26 is performed again, and displays the new display method. このような操作を繰り返して望ましい表示が得られたら、ステップS28に進む。 When desired display is obtained by repeating such an operation, the process proceeds to step S28. ステップS28ではさらに再分類を試みるか否かをユーザが判断する(ステップS28)。 Step S28 In attempting to further reclassification whether the user is determined (step S28). 望ましい結果(つまり文書群から、そのとき求められている端的な結論といったもの)が得られるまで、ステップS22〜ステップS28の処理を繰り返す。 Desirable results to (from i.e. documents, then the sought-after things like straightforward conclusions) are obtained, and repeats the processing of step S22~ step S28. このように試行錯誤をしながら、文書群を捜しまわって文書群の分析を行う。 While thus the trial and error, the analysis of documents with Sagashimawa' the documents. 各部の処理の詳細を以下に説明する。 Describing details of each part of the process below. 【0008】(入力部11)入力部11はカテゴリーの組み合わせを指示することができるのならどのような方式で入力するように構成してもよい。 [0008] (input unit 11) input unit 11 may be configured to enter the Save any method capable of directing the combination of categories. また、この入力部11はどのように表示をするのかを同時に指定する。 Also it specifies whether to the input unit 11 how displayed simultaneously. 図3の例は、X軸にカテゴリー「製品」と「競合」の組合わせ、Y軸に「第二四半期」を置いて、全文書を分析する指定を行った例を示すものである。 The example of FIG. 3, the combination of "competitive" and category "product" in the X-axis, at the "second quarter" in the Y-axis shows the example in which the designation of analyzing all documents . 例えば、「製品」 For example, "product"
以下の階層の「複写機」、「ファクシミリ」・・・のような「製品」の要素カテゴリーについては入力する必要はない。 The following hierarchy of "copying machine", there is no need to input for the element category of "facsimile" ... such as the "product". その結果がどのように示されるかは表示部17 The display unit 17 whether the result is how shown
の説明において後述する。 It will be described later in the description of the. 図3の例での入力データのデータ構造は図4に示すような分析軸とその軸でのカテゴリーを対応させたものである。 Data structure of the input data in the example of FIG. 3 is made to correspond to categories of analysis shaft and its axis as shown in FIG. 【0009】(用語展開用データベース12) 用語展開用データベース12において、カテゴリーを下位の階層あるいは末端のカテゴリー要素や類義語に展開するための構造はどのような構造であってもよい。 [0009] In (term deployment database 12) The term expansion database 12, the structure for deploying the categories lower hierarchy or terminal category elements and synonyms may be any structure. 一般的には図5に示すように階層構造で表す。 Generally expressed in a hierarchical structure as shown in FIG. この場合、ルートカテゴリー51をルートとしてその下の階層にサブカテゴリー52がいくつかあって、末端カテゴリー53 In this case, there subcategory 52 Several in the lower hierarchy of the root category 51 as root, terminal category 53
で終わっている。 It ends with. 末端カテゴリー53にいくつかの類義語54が対応している。 Some of the synonyms 54 to end category 53 is compatible. 図6は用語展開用データ編集部18により用語展開用データベース12を編集している表示画面の例を示すものである。 6 shows an example of a display screen are editing the term deployment database 12 by the term expanded data editing unit 18. この画面例においては、左側にカテゴリーが階層構造で表示され、右側に左側のハイライトされた末端カテゴリーに対応する類義語が表示されている。 In this screen example, category on the left side are displayed in a hierarchical structure, synonyms corresponding to the left highlighted end categories are displayed on the right. 図6の左側に表示されたカテゴリーの例において、「競合」 「製品」「地域」…等がルートカテゴリーであり、 「コンピュータ」「中国」…等はサ<br>ブカテゴリーであり、「複写機」「ファクシミリ」…等は末端カテゴリーである。 In the example of the displayed category on the left side of FIG. 6, "competitive," "product," "regional" ... such is the root category, "computer", "China" ... such is the difference <br> Breakfast category, "copy machine "," facsimile "... etc. is a terminal category. 右側の類義語には末端カテゴリーのハイライトされた「パーソナルコンピュータ」に対応する類義語が表示されている。 On the right side of synonyms synonyms corresponding to the highlight of the end category "personal computer" is displayed. これらはこの表示された編集画面上において任意に編集することが可能であり、その編集の結果は直ちに用語展開用データに反映される。 These can be arbitrarily edited in the displayed editing screen, the result of the editing is reflected immediately in terms deployment data. 【0010】(検索条件作成部13)入力条件作成部1 [0010] (search condition creation unit 13) input condition creation unit 1
3は、入力部11で指定されたカテゴリーの組合せについて適合するものを求める検索条件を検索エンジンに提示する。 3 presents the search condition obtaining one to meet the combination of the specified category in the input unit 11 to the search engine. 用語展開用データベース12の内容に従って、 In accordance with the contents of the term expansion for the database 12,
カテゴリーを実際に検索する語のレベルまで展開する。 To deploy up to actually search term level of the category.
類義語が定義されている場合は、すべての類義語で検索するので、問合せ回数がそのぶん増えることになる。 If synonyms are defined, since the search in all synonyms, so that the number of queries increases sentence thereof. この作業は、結局、図7に示すようなカテゴリー要素と類義語の対応表をつくることである。 This work eventually is to create a correspondence table category elements and synonyms such as shown in FIG. 図8によりカテゴリーの展開の処理を説明する。 The Figure 8 illustrating a process of expansion of the category. 検索条件作成部13は入力部11から入力されたカテゴリーが用語展開用データベース12に登録されている語であるか否かを調べる(ステップS81)。 The search condition creation unit 13 checks whether or not it is a word that is input from the input unit 11 categories registered in the term deployment database 12 (step S81). 登録されていなかったときは入力されたカテゴリーの語をそのまま出力する(ステップS8 When that was not registered as it is to output the word of the input category (step S8
2)。 2). 入力されたカテゴリーが用語展開用データベース12に登録されていたときには、そのカテゴリーに属する語をカテゴリー要素として出力する(ステップS8 When the input category is registered in terms deployment database 12 outputs a word belonging to the category as a category element (step S8
3)。 3). さらに、そのカテゴリー要素がサブカテゴリーを持っているかを調べる(ステップS84)。 Furthermore, it is checked whether the category element has a sub-category (step S84). その結果、 as a result,
サブカテゴリーをもっていた場合には、そのサブカテゴリーを対象として(ステップS88)、ステップS83 When it had subcategory, targeting the subcategories (step S88), step S83
の処理を繰り返す。 Repeat the process. そしてサブカテゴリーを持っていないカテゴリー要素に達したならば、それに対応する類義語を出力する(ステップS85)。 And if reached category elements that do not have a sub-category, and outputs synonyms corresponding thereto (step S85). そして次のカテゴリーを対象として、ステップS83からの処理を繰り返して、カテゴリー要素や類義語を出力して行く。 And as for the following categories, repeat the process from step S83, go to output the category elements and synonyms. 次のカテゴリーがなくなったときカテゴリーの展開を終了する。 To terminate the development of the category when the next category was gone. 【0011】(問合せエンジン14)問合せエンジン1 [0011] (query engine 14) query engine 1
4は検索対象データベース15に全文検索を実施して返答をする。 4 is a reply to implement a full-text search in the search database 15. これは、検索対象データベース15の形式に応じたモジュールである。 This is a module in accordance with the format of the search target database 15. 検索条件作成部13で得られたすべてのカテゴリー要素と類義語をそれぞれ検索語として検索し、その検索語を含む文書のID(ファイル名、物理的アドレスなど)を検索の結果として集めてくる。 The search condition creation unit all 13 obtained in category elements and synonyms were searched as each search word, ID (file name, physical address) of the document containing the search word coming collected as a result of searching. 図9は、その問合せ処理のフローを示すものである。 Figure 9 shows a flow of the query processing. カテゴリー要素をキーにして検索対象データベース15を検索する(ステップS91)。 And the category element as a key to search the search database 15 (step S91). そのカテゴリー要素に対応する類義語を一つずつキーにして順次検索を行い(ステップS92、ステップS94)、そのカテゴリー要素に対応するすべての類義語での検索が終了する(ステップS93でYの判定になったとき)と、次のカテゴリー要素を取り出して(ステップS96)、同様の処理(ステップS91〜ステップS94)を行う。 As the synonyms one by one key corresponding to the category element sequentially perform a search (step S92, step S94), in the search for all synonyms for the categories element is completed (step S93 becomes the determination of Y that time), remove the following categories element (step S96), the same processing (step S91~ step S94) performed. 検索条件作成部13から与えられたすべてのカテゴリー要素とそれに対応する類義語による検索が終了するまで(ステップS95)上記の処理を繰り返す。 Until search by all categories elements given from the search condition creation unit 13 synonyms corresponding thereto is completed (step S95) and repeats the above processing. 【0012】(検索対象データベース15)検索対象データベース15には、速度を気にする必要がないのなら、どういう方式でもかまわない。 [0012] (the search target database 15) the search target database 15, if the there is no need to worry about speed, it may be and in what manner. しかし、一般的には、速度は速いほうがよく、そのためには用語についてインデクスを持っているべきである。 However, in general, speed is often the faster is, in order that should have an index of terms. もっとも単純には、図10に示すような形式のインデクスになる。 The simplest would index format as shown in FIG. 10.
「語」も「文書ID」もスペース効率を考えるなら圧縮されているべきである。 "Word" should also have been compressed If you think about the even space efficiency "document ID". 【0013】(集計部16)集計部16は、検索した結果得られた文書IDの個数を数えたり、論理演算(例えば、Aを含みかつBを含む文書求める)を実施して表示に備える。 [0013] (totaling unit 16) counting unit 16 is provided or count the number of retrieved results obtained document ID, the display by implementing logic operations (e.g., determining the document includes hints and B to A). 作業は主に2段階に分かれる。 Work is mainly divided into two stages. 【0014】(作業1) 類義語についてまとめるカテゴリー要素「パソコン」の類義語として「PC」 [0014] (Task 1) "PC" as a synonym of the category element "PC" to summarize the synonyms
「パーソナルコンピュータ」があったとして、 〈1〉語「パソコン」を含む文書={文書1、文書2} 〈2〉語「PC」を含む文書={文書2} 〈3〉語「パーソナルコンピュータ」を含む文書={文書7、文書8、文書11} という検索結果が得られたとしたら、カテゴリー要素「パソコン」を含む文書はこれらのすべての文書をマージしたもの、つまり{文書1、文書2、文書7、文書8、文書11}となる。 As was "personal computer" is, <1> word document = include "PC" {document 1, document 2} Article = {Document} <3> word "personal computer" including <2> term "PC" Article = including if we {document 7, a document 8, the document 11} search results that are obtained, as the document containing the category element "PC" merging all these documents, i.e. {document 1, document 2, Article 7, Article 8, the document 11}. 【0015】(作業2) カテゴリー要素をつかって分類する例えば、後述する表示部17で必要とされる、「パソコン」かつ「A社」かつ「4月」なる文書を求めるには、 〈1〉カテゴリー要素「パソコン」を含む文書={文書1、文書2} 〈2〉カテゴリー要素「A社」を含む文書={文書2、 [0015] (Task 2) to classify by using a category element, for example, is required by the display unit 17, which will be described later, to determine the documents to be "PC" and "Company A" and "April" is, <1> Article = Categories include element "PC" {document 1, document 2} <2> Article = {document 2 containing category element "Company a",
文書7、文書8、文書11} 〈3〉カテゴリー要素「4月」を含む文書={文書2、 Article 7, Article 8, Article 11} <3> Article = {document 2 containing category element "April",
文書8} としたら、その結果は、{文書2}となる。 Once a document 8}, the result is a {document 2}. 【0016】以上の処理の詳細について流れ図にしたのが図11および図12である。 [0016] to that in the flow diagram details of the above process is shown in FIG. 11 and FIG. 12. 集計部の作業1においては、図11に示すように、空リストを作成する(ステップS111)。 The work 1 aggregate portion, as shown in FIG. 11, to create an empty list (step S111). カテゴリー要素による検索結果をマージする(ステップS112)。 To merge the search results by category element (step S112). そのカテゴリーに対応する類義語による検索結果をマージする(ステップS11 Merging Search Results synonyms corresponding to the category (step S11
3)。 3). 最後の類義語になるまで(ステップS114で判定)、次々と類義語をマージしてゆき、一つのカテゴリー要素に対応するすべての類義語のマージが終わると次のカテゴリー要素について、同様にステップS112ないしステップS115の処理を繰返しマージを行い、最後のカテゴリー要素とそれに対応する類義語による検索結果のマージが終わると(ステップS116で判定)、 Until the end of the synonyms (determined in step S114), Yuki merges synonyms one after another, the merging of all the synonyms corresponding to one category element ends for the next category elements, also step S112 to step S115 processing repeated merges and merging last category elements and Search results synonyms corresponding ends (determination in step S116),
図12の作業2の処理へ移る。 Turning to the working second process in FIG. 12. 作業1の終了時点ではカテゴリー要素自身とその類義語を含む文書群のリストが得られる。 List of documents, including its synonyms and category element itself is at the end of the work 1 is obtained. 次の作業2で、表示用のデータとなる項目を算出する。 In the next task 2, and calculates an item to which the data for display. 【0017】集計部の作業2の一例として、図12に示すのは、「製品」「競合」「第二四半期」の3つのカテゴリーで分析を行った場合の処理であり、図13の表示をするためのデータを生成する。 [0017] As an example of a work 2 the summing section, that shown in FIG. 12 is a process when analyzed in three categories of "product", "competition", "the second quarter" in FIG. 13 to generate the data for the display. この例では「製品」のカテゴリーには「複写機」「ファクシミリ」「パーソナルコンピュータ」「ワークステーション」等のカテゴリー要素があり、「競合」のカテゴリーには「A社」「B The categories in this example, "product" has category elements such as "copier", "facsimile", "personal computer", "workstation", the category of "competitive", "Company A", "B
社」等のカテゴリー要素があり、「第二四半期」のカテゴリーには「4月」「5月」「6月」等のカテゴリー要素がある。 There is a category elements of the company "and the like, in the category of" second quarter "there is a category element such as" April "," May "," June ". 図12の処理では、「製品」「競合」「第二四半期」の3つのカテゴリーのカテゴリー要素の組み合わせを順次に作って行き、各組み合わせに対して共通に含まれる文書を出力する(ステップS123)。 In the process of FIG. 12, "product", "competition", "the second quarter" of the go sequentially make the combination of category elements of the three categories, and outputs the documents included in common to each combination (Step S123). ステップS120、S128およびS129からなるループは「製品」のカテゴリー要素を順次選択し、ステップS1 Step S120, S128 and the loop consisting of S129 is sequentially select a category element of "product", step S1
21、S126およびS127からなるループは「競合」のカテゴリー要素を順次選択し、ステップS12 21, S126 and the loop consisting of S127 is sequentially select a category element of "competitive", step S12
2、S124およびS125からなるループは「第二四半期」のカテゴリー要素を順次選択する。 2, S124 and loop consisting of S125 is sequentially select a category element of "second quarter". これらの入れ子処理により3種のカテゴリー要素のあらゆる組合せが生成され、それぞれの組み合わせに対して共通に含まれる文書が出力される。 These any combination of the three categories elements by nesting process is created, the document included in common for each combination are outputted. 図13には「製品」のカテゴリー要素「複写機」と、「競合」のカテゴリー要素「P社」 In FIG. 13 and category elements of the "product", "copying machine", category element "Company P" of "competitive"
と、第二四半期の「4月」のカテゴリー要素の組み合わせに対して共通に含まれる文書がAであることが示されている。 If, documents contained in common to the combination of category elements "April" in the second quarter has been shown to be A. 分析のために指定するカテゴリーを多く指定すればするほど、処理の入れ子は深くなって行く。 The more you specify a lot of categories that you specify for analysis, nesting of processing is going deeper. また、 Also,
常にこのような計算が必要なわけではなく、結果をキャッシュしておくことにより、計算回数を少なくすることもできる。 Always such calculations are not always necessary, By caching a result, it is also possible to reduce the number of calculations. 【0018】(表示部17)表示部17は、入力部11 [0018] (display unit 17) display unit 17, input unit 11
からの表示形式の指示に従い表示する。 To display according to the instructions of the display format from. 入力部11で例として挙げた検索結果は図13ような表として表現できる。 Results as examples in the input unit 11 can be expressed as 13 as a table. それぞれの枠の中に文書は分類されている。 Document in each of the frame has been classified. 例えば、Aは「4月」かつ「複写機」かつ「P社」なる文書であり、Bは「4月」かつ「複写機」かつ「Q社」なる文書になる。 For example, A is a document of "April" and "copier" and "Company P", B is in a document as "April" and "copier" and "Q company". これら該当する文書の個数をグラフとしてもよいし、それぞれの文書に直接アクセスできるようにしてもよい。 May be the number of relevant documents as a graph, it may be direct access to each document. 【0019】(用語展開用データ編集部18)用語展開用データ編集部18は、用語展開用データベース12に記憶されているカテゴリーの定義を、削除、追加、貼付け等の編集を行い、また、類義語の追加や削除等の処理を行う。 [0019] (the term deployment for data editing section 18) term deployment for data editing unit 18 performs the definition of the category, which is stored in the term deployment for database 12, delete, add, edit, such as stuck, also, synonyms carry out the additional and processing of deletion. 図14その処理のイベントループを示すもので、イベントを受け付けて、そのイベントの種類に応じて、開始処理(ステップS141)、終了処理(ステップS142)、保存処理(ステップS143)、カテゴリー選択処理(ステップS144)、カテゴリー削除処理(ステップS145)、カテゴリー追加処理(ステップS146)、カテゴリー貼付処理(ステップS14 Figure 14 shows the processing of an event loop receives an event, according to the type of event, start processing (step S141), ends the processing (step S142), the storage processing (step S143), category selection process ( step S144), category deletion process (step S145), category additional processing (step S146), category paste processing (step S14
7)、類義語削除処理(ステップS148)、類義語追加処理(ステップS149)のいずれかの処理を行う。 7), synonyms deletion processing (step S148), do any of the synonyms addition processing (step S149).
図6の表示画面は、編集を行うためのインタフェースの画面であり、この画面上のアイコンや特定の位置をマウスによりクリックすることあるいはその他の原因により、イベントが発生し、処理が行われることになる。 The display screen of FIG. 6 is a screen interface for editing an icon or specific location on the screen by, or other causes of clicking by a mouse, the event occurs and the processing is performed Become. 【0020】図15は、図14の開始処理の詳細を示すものである。 [0020] FIG. 15 shows the details of the start processing of FIG. 14. この開始処理においては、用語展開用データベースオープンの操作が行われるれる(ステップS1 In this starting process, the operation term deployment database open is performed (step S1
51)。 51). オープンできなれば、エラー終了し、オープンできたときには、用語展開用データベース12の内容をメモリへロードする(ステップS153)。 If be opened, an error end, when be opened, to load the contents of the term expansion for the database 12 to the memory (step S153). メモリが不足していないかを調べ(ステップS154)、編集用ウィンドウに表示する(ステップS155)。 Examine whether the memory is not insufficient (step S154), to display in the editing window (step S155). 表示用のメモリが不足していないを調べ(ステップS156)、不足していなければ、開始処理を終わる。 Check the memory for display is not insufficient (step S156), if not in short supply, ending the start processing. 主メモリあるいは表示用メモリが不足していたときには、用語展開用データベースをクローズする(ステップS159)。 When a main memory or display memory is insufficient closes the database for terms expansion (step S159). 【0021】図16は終了処理を示すフローチャートである。 [0021] FIG. 16 is a flowchart illustrating the termination process. 保存後メモリに変更があるかを調べ(ステップS After the memory storage examine whether or not there is a change (step S
161)、変更があればユーザに保存するかどうかユーザに問い合わせる(ステップS162)ユーザが保存することを選択したときには、保存処理を行う(ステップS164)。 161), when querying whether the user is stored in the user any changes (step S162) the user has selected to save the storage process (step S164). ステップS161でメモりに変更がなかったとき、あるいはステップS163でユーザがOKを選択しなかったときには、用語展開用データベースの編集処理用のファイルをクローズする(ステップS16 When there is no change in the memory in step S161, or when the user has not selected the OK in step S163, the file is closed for editing database for terms expanded (step S16
4)。 4). そしてウィンドウおよびメモリのリリースをする(ステップS166〜167)。 And the release of the window and the memory (step S166~167). 【0022】図17は、保存処理を示すもので、用語展開用データベースへの書き込みを行う。 [0022] Figure 17 shows the storage process, writing to term deployment database. 【0023】図18は、カテゴリ選択処理のフローを示すものである。 FIG. 18 shows a flow of a category selection process. 新規に選択されたカテゴリー(=Cn) Newly selected category (= Cn)
を取得する(ステップS181)。 To get (step S181). 選択されているカテゴリー(=Cs)が新規に選択されたカテゴリーCnが一致するか否かを判定し、もし一致していれば選択を解除する。 Category is selected (= Cs), it is determined whether the newly selected category Cn matches, deselecting If they match it. そしてCiにnilを設定する。 And it is set to nil Ci. CsとCnが一致しなかった場合には、新規カテゴリーを選択しCs If the Cs and Cn do not match, select the new category Cs
にCnを入れる。 Put the Cn to. 【0024】図19は、カテゴリー削除処理の処理フロー図である。 [0024] FIG. 19 is a process flow diagram of the category deletion process. カテゴリー削除処理においては、まず、選択されているカテゴリー(=Cs)が空か否かを調べ(ステップS191)、空でなければカテゴリーのカットバッファ(=Cb))をクリアする(ステップS19 In the category deletion processing, first, clears the category is selected (= Cs) examines if is empty (step S191), the cut buffer categories not empty (= Cb)) (step S19
2)。 2). 選択されているカテゴリーCsとそのサブカテゴリーをカットバッファCbにコピーする(ステップS1 Copying categories Cs and its sub-categories are selected to cut buffer Cb (step S1
93)。 93). 選択されているカテゴリーCsを抹消する(ステップS194)。 It deletes the category Cs that has been selected (step S194). そして選択を解除し、Csをnil And deselect, nil the Cs
に設定する。 It is set to. 【0025】図20は、カテゴリー追加処理の処理フロー図である。 [0025] FIG. 20 is a process flow diagram of the category additional processing. カテゴリー追加処理においては、ユーザにカテゴリー名を入力させる(ステップS201)。 In the category additional processing, to input the category name to the user (step S201). 入力がキャンセル、または空文字列が入力されるされたかを判定し(ステップS202)、Yesであれば追加処理は行わないで終了する。 Input cancellation, or an empty string and determines if it has been input (step S202), the additional processing if Yes terminated without performing. 入力のキャンセルまたは文字列が入力されたときには、新規にカテゴリCnを生成する(ステップS203)。 When canceling or string of input is input, it generates a new category Cn (step S203). 選択カテゴリー(Cs)が空であるか否かを判定し(ステップS204)、空であればCnをルートカテゴリに入れる。 Select category (Cs) is equal to or empty (step S204), if the empty add Cn root category. 空でないときにはカテゴリーCnを選択カテゴリーCsのサブカテゴリーとして挿入する。 When not empty inserts category Cn as subcategories of the selected category Cs. 【0026】図21は、カテゴリー貼付け処理の処理フロー図である。 [0026] FIG. 21 is a process flow diagram of a category attaching process. カテゴリのカットバッファCbが空かいなかを調べる(ステップS211)。 Category of the cut buffer Cb investigate is empty countryside (step S211). 空であれば張り付けるものがないので直ちに終了する。 Immediately terminated because there is nothing to be attached if it is empty. 空であれば選択カテゴリーCsが空か否かを調べ(ステップS212)、 If empty examined whether selected category Cs is empty (step S212),
空であれば、カッとバッファCb以下のサブカテゴリーをルートカテゴリーに挿入する。 If empty, insert the following subcategories cut and the buffer Cb root category. 空でない場合にはカッとバッファCb以下のサブカテゴリーを選択カテゴリーCsのサブカテゴリーとして挿入する(ステップS20 If not empty inserts the following subcategories cut and the buffer Cb as subcategories of the selected category Cs (step S20
6)。 6). 【0027】図22は、類義語削除処理の処理フローを示す図である。 [0027] FIG. 22 is a diagram depicting a processing flow synonyms deletion process. 類義語削除処理においては、選択されている類義語(=Rs)が空かを調べ(ステップS22 In the synonym deletion process, synonyms are selected (= Rs) is checked empty (step S22
1)、空であれば削除処理は終了し、空でなければ類義語Rsの内容を抹消して(ステップS222)、終了する。 1), the deletion process if the sky is terminated, after deleting the contents of the synonyms Rs if it is not empty (step S222), to the end. 【0028】以上のような処理を組み合わせることによって、カテゴリー(用語体系)の編集を行うことができる。 [0028] By combining the processing as described above, it is possible to perform the editing of the category (nomenclature). 例えば、あるカテゴリーを今までと別のサブカテゴリーに移動する場合についてて説明する。 For example, a description Tsuite when moving a category to another sub-category and ever. 今まで「A水産」は「遠洋漁業船の経営をしている会社」とのみの認識しかなく、「漁業」というカテゴリーにしていいたのを、「食品メーカー」に入れ直すという場合には、次のような操作を行う。 "A Fisheries" until now there is only recognized only as a "company that the deep-sea fishing vessels management", the was good in the category of "fishing", in the case of cycling in the "food manufacturers" is, of the following perform operations such as. カテゴリー「A水産」の選択→カテゴリーの削除→カテゴリー「食品メーカー」の選択→カテゴリーの張り付け。 Crucifixion of selection → category of category selection of the "A Fisheries" → deletion of category → category "food manufacturers". 【0029】また、他の例として、類義語を追加して新規な呼称に対応する場合について説明する。 [0029] In addition, as another example, a case will be described in which to add a synonym corresponding to the new designation. カテゴリー「紙詰まり」にカテゴリー「ジャム」という言葉が一般的に使われるようになったので、類義語として登録する。 Now that the word category "jam" in the category "paper jam" is generally used, to register as a synonym. その場合の操作は、カテゴリー「紙詰まり」の選択→類義語「ジャム」の追加【0030】これらの操作の結果は即座に文書群の分析結果に反映されるので、試行錯誤しながら文書群の性質や、設定した用語の体系の妥当性などを調べることができる。 In that case the operation, since the category added [0030] The results of these operations in the selection of the "paper jam" → synonym "jam" is reflected in the analysis of the documents immediately, the nature of the document set by trial and error and, it is possible to examine the appropriateness of the system of terminology which has been set. 【0031】 【発明の効果】本発明によれば、次のような効果を奏することができる。 According to the present invention can exhibit the following effects. (1) 動的に分類ができる本発明によれば、入力した複数のカテゴリーを定義によって展開し、定義された範囲の文書をすべて索出し、定義されたカテゴリー要素間の論理演算によって得られるカテゴリーの新たな組み合わせ対して分類集計するので、即時的な分類が得られ、動的な分類ができる。 (1) According to the present invention, which may dynamically classify, expand by defining a plurality of categories entered, out of all the documents in the defined range search, categories obtained by logical operation between the defined category elements since classifying aggregate for new combinations of immediate classification is obtained, it is dynamic classification. 形骸化した分類法に頼って無意味な仕分作業をするのではなく、つねに最新の分類を最新のデータに基づいて実施できる。 Relying on mere facade the taxonomy rather than a meaningless sorting task can be performed based on always the latest classification to the latest data. 【0032】(2) カテゴリーの組合せによる細かな分類本発明によれば分類をしたうえで、それを更に細分していくことができる。 [0032] (2) in terms of the classification according to the fine classification present invention by the combination of the categories, it can be further gradually subdivided. これは、定義したカテゴリーの組合せを編集手段により変更することにより実現できる。 This can be achieved by changing the editing means a combination of defined categories. 例えば、陸上競技というジャンルにしぼった上で、まったくこのジャンルに関係のないカテゴリー「薬物」を利用して、ドーピングの問題を取り上げることができる。 For example, after having squeezed the genre of athletics, by using the category "drug" is not related at all to this genre, it is possible to pick up the doping problem. 【0033】(3) 用語の体系の自在な変更本発明によれば、編集手段を設けた場合、カテゴリーの定義の変更がいつでも可能である。 [0033] (3) According to the terms of freely changing the invention systematically, the case of providing the editing means changes the category of definition can be at any time. つまり、認識モデルの更新が簡単になるわけである。 In other words, the update of the recognition model is not made easy. 例えば、今まで「A水産」は「遠洋漁船の経営をしている会社」とのみの認識しかなく、「漁業」というカテゴリーにしていたのが、 For example, "A Fisheries" until now there is only recognized only as a "company that the management of deep-sea fishing boat", that had been in the category of "fishing",
「食品メーカー」に入れたほうがよい、といった処理ができる。 "Food manufacturers" is better to put in, such as the process can be. 【0034】(4) 試行錯誤による発見キーワードを含んだ文書をリトリーブするだけでなく、 [0034] (4) as well as to retrieve the document that contains the discovery keyword by trial and error,
それを表示する際には、複数のキーワードの分布状態を、一回のユーザー入力で調べることができる。 When displaying it, the distribution of the plurality of keywords can be examined in a single user input. それによって、文書群全体からの傾向を見て取ることや、文書群どうしの関連などが具体的に分かる。 Thereby, it and be seen a tendency of the whole document group, such as related documents each other is understood to specifically. また、用語展開用データベースの内容を変更することによる表示の変化を観察することで、文書中から有為な情報を抽出できる。 Further, by observing the change in display by changing the contents of the database for terms expand, it can be extracted significance information from the document.

【図面の簡単な説明】 【図1】本発明の実施例の文書群分析装置の構成を示すブロック図【図2】実施例による文書群の分析処理の全体の流れを示す図【図3】入力部11の入力画面の一例を示す図【図4】入力データのデータ構造の例を示す図【図5】用語展開用データベースの内容を説明するための図【図6】用語展開用データベースを編集している画面の例を示す図【図7】検索条件作成部で作成された検索条件の例を示す図【図8】カテゴリーの展開の処理フロー図【図9】問合せエンジンによる対象データベースの検索の処理フロー図【図10】検索の結果を示す図【図11】集計部の作業1の処理フロー図【図12】集計部の作業1の処理フロー図【図13】表示部による分析結果の表示の例を示す図。 BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1. FIG. 3 showing the overall flow of analysis processing of the document group by the block diagram Figure 2 Example showing the configuration of a document group analyzing apparatus according to an embodiment of the invention, FIG Figure 6 database for terms development for explaining the contents of Figure 5 shows a database for terms expand illustrating an example of FIG. 4 shows the data structure of the input data indicating an example of an input screen of the input unit 11 It shows an example of a screen editing 7 search processing flow of the deployment conditions created Figure 8 shows an example of the search condition created by the unit category view 9 of the target database by query engine shows a process flow diagram 10 shows the search result of the search [11] the process flow diagram of the work 1 in the counting unit 12 is a process flow diagram of the work 1 in the summing section 13 analyzes the display unit results diagram illustrating an example of a display of. 【図14】用語展開用データ編集部の処理フロー図【図15】用語展開用データ編集部の処理における開始処理のフロー図【図16】用語展開用データ編集部の処理における終了処理のフロー図【図17】用語展開用データ編集部の処理における保存処理のフロー図【図18】用語展開用データ編集部の処理におけるカテゴリー選択処理のフロー図【図19】用語展開用データ編集部の処理におけるカテゴリー削除処理のフロー図【図20】用語展開用データ編集部の処理における追加処理のフロー図【図21】用語展開用データ編集部の処理における張付処理のフロー図【図22】用語展開用データ編集部の処理における類義語削除処理のフロー図【図23】用語展開用データ編集部の処理における類義語追加処理のフロー図【符号の説明 [14] the process flow of the term expanded data editing unit view [15] Flow of starting processing in the processing of the term expanded data editing unit Figure 16 shows a flow diagram of a termination process in the processing of the term expanded data editing unit in Figure 17 the flow of storage processing in the processing of the term expanded data editing unit Figure 18 shows a flow diagram of a category selection processing in the processing of the term expanded data editing unit 19 term deployment data editing unit of the processing flow diagram of the category deletion processing FIG. 20 is a flow of additional processing in the processing of term deployment for data editing section view FIG. 21 is a flow diagram of Zhang with processing in the processing of term deployment for data editing unit [Figure 22] for term expansion flow diagram of synonyms deletion processing in the processing of the data editing unit [23] flow diagram of synonyms additional processing in the processing of the term expanded data editing unit [description of Reference numerals 11…入力部、12…用語展開用データベース、13… 11 ... input section, 12 ... term deployment for database, 13 ...
検索条件作成部、14…問合せエンジン、15…検索用データベース、16…集計部、17…表示部、18…用語展開用データ編集部。 The search condition creation unit, 14 ... query engine, 15 ... search database, 16 ... totaling unit, 17 ... display unit, 18 ... term deployment for data editing unit.

フロントページの続き (56)参考文献 特開 昭63−157229(JP,A) 特開 昭63−157228(JP,A) 特開 昭61−67128(JP,A) 特開 平6−282578(JP,A) 特開 平6−96136(JP,A) 特開 平5−120358(JP,A) 特開 平5−89173(JP,A) 特開 平4−106664(JP,A) 特開 平1−237878(JP,A) (58)調査した分野(Int.Cl. 7 ,DB名) G06F 17/30 Front page of the continuation (56) Reference Patent Sho 63-157229 (JP, A) JP Akira 63-157228 (JP, A) JP Akira 61-67128 (JP, A) JP flat 6-282578 (JP , A) Patent Rights 6-96136 (JP, A) Patent Rights 5-120358 (JP, A) Patent Rights 5-89173 (JP, A) Patent Rights 4-106664 (JP, A) Patent Rights 1-237878 (JP, a) (58 ) investigated the field (Int.Cl. 7, DB name) G06F 17/30

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 分析対象の複数の文書を記憶する対象記憶手段と、 検索用の複数のカテゴリーの語を組み合わせて入力する入力手段と、 カテゴリーが定義され、カテゴリーの語を展開するために用いる展開情報記憶手段と、 前記入力されたカテゴリーの語を前記展開情報記憶手段を参照して下位の階層のカテゴリー要素およびその類義 (57) and target storage means which stores [claimed is: 1. A document of analyte, input means for inputting a combination of words of a plurality of categories for the search, categories are defined, and development information storage means used to deploy the word category, category elements of a lower hierarchy with reference to previous SL expansion information storage means word of the input category and its synonymous
    語の集合へ展開する用語展開手段と、 前記用語展開手段により展開されたカテゴリー要素およ And terminology development means for developing the set of words, Oyo category elements were developed by the term expansion means
    び類義語 により前記対象記憶手段の文書を検索する検索手段と、 検索された文書群を、前記入力されたカテゴリーの組み Search means for searching for documents in the target storage unit by fine synonyms, the retrieved documents, set the input category
    合わせによって定まる新たなカテゴリー群に分類、集計する集計手段と、 集計結果を指定の表示形式により表示する表示手段とを備えたことを特徴とする文書群分析装置。 Fall into a new category group defined by mating, and aggregation means to aggregate, aggregation result document group analyzing apparatus characterized by comprising a display means for displaying the designated display format. 【請求項2】 前記展開情報記憶手段のカテゴリーの定義を編集するための編集手段を設けたことを特徴とする請求項1記載の文書群分析装置。 Wherein said expansion information storage means Department document group analyzing apparatus according to claim 1, characterized in that a editing means for editing the definition of. 【請求項3】ユーザの入力を受ける入力手段と、分析対 Wherein receiving an input of user input means, analyze pairs
    象の複数の文書を記憶する対象記憶手段と、検索用の複 A target storage means for storing a plurality of documents elephant, double for search
    数のカテゴリーが定義された展開情報記憶手段とを有す Having a the expansion information storage means for the number of categories is defined
    る文書群分析装置が実行する文書群分析方法であって、 検索用の複数のカテゴリーの語を組み合わせを前記入力 A document group analyzing how the document group analyzing apparatus executes that, the input combination word of a plurality of categories for the search
    手段で受けるステップと、 前記入力されたカテゴリーの語を前記展開情報記憶手段 A step of receiving by means, the expansion information storage means word of the input category
    を参照して下位の階層のカテゴリー要素およびその類義 Category element of the reference to the lower level and its synonymous
    語の集合へ展開するステップと、 前記展開されたカテゴリー要素および類義語により前記 A step of deploying to a collection of words, said by expanded category elements and synonyms
    対象記憶手段の文書を検索するステップと、 検索された文書群を、前記入力されたカテゴリーの組み Retrieving documents target storage means, the retrieved documents, set the input category
    合わせによって定まる新たなカテゴリー群に分類、集計 Classification to a new category group, which is determined by the combined aggregate
    するステップと、 集計結果を指定の表示形式により表示するステップと、 を備えたことを特徴とする文書群分析方法。 Step a, the document group analyzing method characterized by comprising the step of displaying the designated display format count results, a to.
JP29127493A 1993-10-27 1993-10-27 Document group analyzing apparatus and method Expired - Fee Related JP3367174B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29127493A JP3367174B2 (en) 1993-10-27 1993-10-27 Document group analyzing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29127493A JP3367174B2 (en) 1993-10-27 1993-10-27 Document group analyzing apparatus and method

Publications (2)

Publication Number Publication Date
JPH07121552A JPH07121552A (en) 1995-05-12
JP3367174B2 true JP3367174B2 (en) 2003-01-14

Family

ID=17766761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29127493A Expired - Fee Related JP3367174B2 (en) 1993-10-27 1993-10-27 Document group analyzing apparatus and method

Country Status (1)

Country Link
JP (1) JP3367174B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5905866A (en) * 1996-04-30 1999-05-18 A.I. Soft Corporation Data-update monitoring in communications network
WO2000055765A1 (en) * 1999-03-05 2000-09-21 Cai Co., Ltd. Method for sorting/searching/abstracting documents
US8886657B2 (en) * 2011-09-30 2014-11-11 The Boeing Company Associative memory visual evaluation tool

Also Published As

Publication number Publication date
JPH07121552A (en) 1995-05-12

Similar Documents

Publication Publication Date Title
Metzler et al. A Markov random field model for term dependencies
Ipeirotis et al. Probe, count, and classify: categorizing hidden web databases
US6654738B2 (en) Computer program embodied on a computer-readable medium for a document retrieval service that retrieves documents with a retrieval service agent computer
US8793232B2 (en) Methods and systems for managing data
JP2710547B2 (en) Graphical user interface
Gudivada et al. Information retrieval on the world wide web
US6415282B1 (en) Method and apparatus for query refinement
US5913215A (en) Browse by prompted keyword phrases with an improved method for obtaining an initial document set
Adar et al. Haystack: Per-user information environments
US5819210A (en) Method of lazy contexted copying during unification
US8239381B2 (en) System and method for dynamically generating a selectable search extension
US5694594A (en) System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms
Rao et al. Rich interaction in the digital library
CN1240011C (en) File classifying management system and method for operation system
US6336112B2 (en) Method for interactively creating an information database including preferred information elements, such as, preferred-authority, world wide web pages
US6915308B1 (en) Method and apparatus for information mining and filtering
Li et al. Text document clustering based on frequent word meaning sequences
US9767161B2 (en) Methods and systems for managing data
US8650190B2 (en) Computer-implemented system and method for generating a display of document clusters
US7774326B2 (en) Methods and systems for managing data
CN101430698B (en) Methods and systems for searching and storing data
JP5423030B2 (en) Determination of word related to the word set
US7953745B2 (en) Intelligent container index and search
US5806061A (en) Method for cost-based optimization over multimeida repositories
US20020091661A1 (en) Method and apparatus for automatic construction of faceted terminological feedback for document retrieval

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071108

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081108

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091108

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101108

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111108

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees