JP3090233B2 - A method for identifying associations between complex information - Google Patents

A method for identifying associations between complex information

Info

Publication number
JP3090233B2
JP3090233B2 JP04031069A JP3106992A JP3090233B2 JP 3090233 B2 JP3090233 B2 JP 3090233B2 JP 04031069 A JP04031069 A JP 04031069A JP 3106992 A JP3106992 A JP 3106992A JP 3090233 B2 JP3090233 B2 JP 3090233B2
Authority
JP
Japan
Prior art keywords
information
time
amount
speech
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP04031069A
Other languages
Japanese (ja)
Other versions
JPH05233719A (en
Inventor
英昭 小澤
透 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04031069A priority Critical patent/JP3090233B2/en
Publication of JPH05233719A publication Critical patent/JPH05233719A/en
Application granted granted Critical
Publication of JP3090233B2 publication Critical patent/JP3090233B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、映像として提供される
情報、活字として提供される情報、その他の情報伝達媒
体を介して提供される複合的な情報を利用するデータベ
ースシステムにおいて、各情報間の関連度の識別に用い
られる複合的な情報間の関連性識別方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a database system utilizing information provided as video, information provided as print, and complex information provided through other information transmission media. The present invention relates to a method for identifying the association between complex information used for identifying the degree of association.

【0002】[0002]

【従来の技術】従来のマルチメディア情報を扱うデータ
ベースシステムでは、扱うメディアの種類や対象によっ
てデータベース中で利用するデータの構造やデータ間の
関係が異なるために、それらをデータベースの作成時に
定義していた。したがって、個々のデータベースで扱え
る情報は、地図の情報やドキュメントの情報などのよう
に当初に計画されていたアプリケーションに依存し、デ
ータベース固有に定義されたデータ間の関連性のもとで
しか利用できなかった。
2. Description of the Related Art In a conventional database system for handling multimedia information, the structure of data used in the database and the relationship between the data differ depending on the type and target of the media to be handled. Was. Therefore, the information that can be handled by each database depends on the originally planned application, such as map information and document information, and can be used only with the relationship between data defined in the database. Did not.

【0003】さらに、関連性の表現には主にキーワード
が用いられているが、必要なデータを検索するために適
当なキーワードや属性をデータベースに与える作業は、
ユーザにとって大きな負担になっていた。
[0003] Furthermore, keywords are mainly used in the expression of relevance, but the task of giving appropriate keywords and attributes to a database in order to search for necessary data is as follows.
This was a heavy burden for the user.

【0004】[0004]

【発明が解決しようとする課題】ところで、地図のデー
タベースやドキュメントのデータベースといった個々に
独立に作成されたデータベース間において、例えばドキ
ュメントのデータから地図のデータを参照したいという
ように、個々のメディアやデータベースを越えたマルチ
メディアのデータを利用したいという要求がある。
By the way, between individually created databases such as a map database and a document database, for example, it is desired to refer to map data from document data by using individual media or database. There is a demand to use multimedia data that exceeds the standard.

【0005】しかし、従来技術では、例えば2つのデー
タベース間で新たに必要となった関連性を表現するため
には、新しい関係を検索することが可能なキーワードを
付加した上で、新しい参照関係を示すデータベースを作
成する必要があった。
However, in the prior art, for example, in order to express a newly required relationship between two databases, a keyword capable of searching for a new relationship is added, and then a new reference relationship is created. It was necessary to create the database shown.

【0006】本発明は、任意に作成されたマルチメディ
アのデータベースに対して関連性を識別する機構によ
り、新しい参照関係が必要になっても新しい参照関係デ
ータベースを作成することなく、任意のマルチメディア
情報間に多様な関連付けを行うことができる複合的な情
報間の関連性識別方法を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention provides a mechanism for identifying relevance to an arbitrarily created multimedia database, thereby creating an arbitrary multimedia database without creating a new reference database even when a new reference relationship is required. It is an object of the present invention to provide a method for identifying association between multiple pieces of information that can make various associations between pieces of information.

【0007】[0007]

【課題を解決するための手段】請求項1に記載の発明
は、画像情報、音声情報、テキスト情報、その他各メデ
ィア情報を含む複合的な情報間の関連性識別方法におい
て、前記各情報に、個々の特徴を自然言語で表現した特
徴表現文と、その情報の発生時刻データとを付加し、前
記各情報の特徴表現文を自然言語解析して各特徴量を抽
出し、前記各情報の発生時刻データと、各情報の特徴表
現文を自然言語解析して抽出した時間に関する情報とを
用いて、その情報が実際に発生した絶対時間に変換し、
前記各情報の特徴量および絶対時間の比較により前記各
情報間の関連度を算出することを特徴とする。
According to a first aspect of the present invention, there is provided a method for identifying a relationship between complex information including image information, audio information, text information, and other media information. A feature expression sentence expressing each feature in natural language and the time of occurrence of the information are added, the feature expression sentence of each information is analyzed by natural language to extract each feature amount, and the generation of each information is generated. Using the time data and information on the time extracted by performing a natural language analysis on the characteristic expression sentence of each information, the information is converted into the absolute time at which the information actually occurred,
The degree of association between the pieces of information is calculated by comparing the feature amount of each piece of information and the absolute time.

【0008】請求項2に記載の発明は、請求項1に記載
の複合的な情報間の関連性識別方法において、各情報の
特徴表現文を自立語と修飾語の品詞ごとに分類し、品詞
ごとの単語が一致する量により品詞ごとの関連度を算出
し、各情報の特徴表現文中の副詞と日時を表す語を用い
て、各情報の発生時刻データを絶対時間に変換し、前記
各品詞の個数をnとしたときに、各品詞ごとの単語の一
致量と各情報の絶対時間をn+1次元の空間上の各軸に
それぞれ割り当て、それらの大きさから前記各情報間の
関連度をn+1次元の空間上の擬似的な距離として算出
することを特徴とする。
According to a second aspect of the present invention, in the method for associating multiple pieces of information according to the first aspect, the characteristic expression sentence of each information is classified into a part of speech of an independent word and a modifier, and The degree of relevance of each part of speech is calculated based on the amount of words that match each word, and the occurrence time data of each piece of information is converted into absolute time using words representing the adverb and the date and time in the characteristic expression sentence of each piece of information. And the absolute time of each piece of information is assigned to each axis in an n + 1-dimensional space, and the degree of association between the pieces of information is determined by n + 1 It is characterized in that it is calculated as a pseudo distance in a dimensional space.

【0009】請求項3に記載の発明は、請求項2に記載
の複合的な情報間の関連性識別方法において、各品詞ご
との単語の一致量と各情報の絶対時間をn+1次元の空
間上の各軸にそれぞれ割り当てるときに、所定の軸上で
扱える距離の範囲を指定してn+1次元上の距離を制御
することを特徴とする。
According to a third aspect of the present invention, in the method for identifying the relation between the complex information according to the second aspect, the amount of coincidence of the word for each part of speech and the absolute time of each information are determined on an n + 1-dimensional space. When assigning to each of the axes, a range of a distance that can be handled on a predetermined axis is designated to control the distance on the (n + 1) -dimensional.

【0010】請求項4に記載の発明は、請求項2に記載
の複合的な情報間の関連性識別方法において、各品詞ご
との単語が一致する量を計算する際に、特徴表現文の係
受けを解析して情報の大意を表す部分とそれを修飾する
部分とに分離し、各情報の修飾部分で一致する量に対し
て、大意を表す部分で一致する量を加重計算することを
特徴とする。
According to a fourth aspect of the present invention, in the method for identifying the relation between complex information according to the second aspect, when calculating the amount of matching of the words of each part of speech, the relation of the characteristic expression sentence is calculated. Analyzing the information and separating it into a part that expresses the meaning of the information and a part that modifies it, weights the amount that matches in the part that expresses the significance with respect to the amount that matches in the modified part of each information. And

【0011】[0011]

【作用】本発明は、各メディアに対応する情報に個々の
特徴を自然言語で表現した特徴表現文を付加し、それぞ
れの特徴表現文を自然言語解析して抽出された各特徴量
を比較することにより、各情報間の関連度を算出する。
なお、自然言語解析の処理方法について、地域的な属性
の抽出、人物の抽出などを変化させることにより、各情
報間で複数の関連性を得ることができる。
According to the present invention, a feature expression sentence in which individual features are expressed in natural language is added to information corresponding to each media, and each feature expression sentence is analyzed by natural language to compare each feature amount extracted. Thereby, the degree of association between the pieces of information is calculated.
In addition, regarding the processing method of the natural language analysis, a plurality of relevances can be obtained between pieces of information by changing extraction of a regional attribute, extraction of a person, and the like.

【0012】また、各情報にその情報の発生時刻データ
を付加し、各情報の特徴表現文の解析と発生時刻データ
からその情報が実際に発生した絶対時間を割り出し、各
情報を時間軸上に整列させる。
[0012] Further, the occurrence time data of the information is added to each information, the characteristic expression sentence of each information is analyzed, and the absolute time when the information actually occurs is calculated from the occurrence time data, and each information is plotted on a time axis. Align.

【0013】ここで、各情報の特徴量および絶対時間を
比較することにより、各情報間の関連度を正確に得るこ
とができる。すなわち、複数のデータベース間で構造や
キーワードに捕らわれずに各情報の関連性を識別するこ
とができる。
Here, by comparing the feature amount and the absolute time of each information, it is possible to accurately obtain the degree of association between each information. That is, it is possible to identify the relevance of each information between a plurality of databases without being caught by a structure or a keyword.

【0014】[0014]

【実施例】図1は、本発明の複合的な情報間の関連性の
識別方法を実現するマルチメディアデータベースシステ
ムの実施例構成を示すブロック図である。なお、本実施
例では、データベース化された新聞とテレビのニュース
を例として、ある記事Aに類似した記事BやニュースC
を検索する過程について説明する。
FIG. 1 is a block diagram showing the configuration of an embodiment of a multimedia database system for realizing a method for identifying a relationship between complex information according to the present invention. In the present embodiment, an article B and a news C similar to a certain article A are taken as examples of newspaper and television news in a database.
The process of searching for will be described.

【0015】図において、本実施例のマルチメディアデ
ータベースシステムは、それぞれテレビや新聞などの個
々のメディアに対応したテレビニュースデータベース1
1や新聞記事データベース102 と、牽引リンクモジ
ュール20と、構造リンクモジュール30と、検索条件
出力モジュール40と、検索結果獲得モジュール50
と、内容リンクモジュール60と、時間リンクモジュー
ル70と、制御モジュール80とにより構成される。
Referring to FIG. 1, a multimedia database system according to the present embodiment has a television news database 1 corresponding to individual media such as a television and a newspaper.
0 and 1 and newspaper articles database 10 2, the traction link module 20, the structural link module 30, a search condition output module 40, the search result acquisition module 50
, A content link module 60, a time link module 70, and a control module 80.

【0016】牽引リンクモジュール20は、各メディア
対応の個々のデータに付加されたキーワードによる関連
付けを行う。構造リンクモジュール30は、各メディア
対応の個々のデータの構造を操作する。検索条件出力モ
ジュール40は、牽引リンクモジュール20および構造
リンクモジュール30によって作成される検索条件で各
データベース101 ,102 をアクセスする。検索結果
獲得モジュール50は、検索条件出力モジュール40に
よって検索された情報を受け、内容リンクモジュール6
0および時間リンクモジュール70に送出する。内容リ
ンクモジュール60は、各情報の特徴表現文を用いて関
連付けを行う。時間リンクモジュール70は、各情報の
発生時刻を用いて関連付けを行う。制御モジュール80
は、ユーザとのインタフェースをとりながら各モジュー
ルを制御し、内容リンクモジュール60および時間リン
クモジュール70で関連付けられた情報から最終的な検
索結果を作成する。
The tow link module 20 associates individual data corresponding to each medium with a keyword added thereto. The structure link module 30 operates the structure of individual data corresponding to each medium. The search condition output module 40 accesses each of the databases 10 1 and 10 2 with the search conditions created by the towing link module 20 and the structure link module 30. The search result acquisition module 50 receives the information searched by the search condition output module 40, and receives the content link module 6
0 and time link module 70. The content link module 60 performs association using the characteristic expression sentence of each information. The time link module 70 performs association using the occurrence time of each piece of information. Control module 80
Controls each module while interfacing with the user, and creates a final search result from the information associated with the content link module 60 and the time link module 70.

【0017】ここで、内容リンクモジュール60および
時間リンクモジュール70の構成を図2に示す。図にお
いて、内容リンクモジュール60は、検索文解析部61
と、結果文解析部62と、形態素解析部63と、比較モ
ジュール64とにより構成される。検索文解析部61
は、制御モジュール80から与えられる検索対象の記事
Aの特徴表現文を比較要素に基づいて解析し、その結果
を比較モジュール64に与える。結果文解析部62は、
検索結果獲得モジュール15を介して各データベースの
検索結果を取り込み、同様に比較要素に基づいて記事
B,ニュースCの特徴表現文を解析し、その結果を比較
モジュール64に与える。形態素解析部63は、検索文
解析部61および結果文解析部62における特徴表現文
の解析を助ける。比較モジュール64は、検索文解析部
61および結果文解析部62での解析結果と、制御モジ
ュール80から与えられる閾値との比較を行い、記事
B,ニュースCの各特徴量を付与する。
Here, the configurations of the content link module 60 and the time link module 70 are shown in FIG. In the figure, a content link module 60 includes a search sentence analyzing unit 61.
, A result sentence analysis unit 62, a morphological analysis unit 63, and a comparison module 64. Search sentence analyzer 61
Analyzes the characteristic expression sentence of the article A to be searched, which is provided from the control module 80, based on the comparison element, and provides the result to the comparison module 64. The result sentence analysis unit 62
The search result of each database is fetched through the search result acquisition module 15, the characteristic expression sentences of the articles B and news C are similarly analyzed based on the comparison elements, and the result is given to the comparison module 64. The morphological analysis unit 63 assists the search sentence analysis unit 61 and the result sentence analysis unit 62 in analyzing the characteristic expression sentence. The comparison module 64 compares the analysis results of the search sentence analysis unit 61 and the result sentence analysis unit 62 with the threshold value given from the control module 80, and gives each feature amount of the article B and the news C.

【0018】時間リンクモジュール70は、検索時間決
定部71と、結果文解析部72と、絶対時間演算部73
と、比較モジュール74とにより構成される。検索時間
決定部71は、制御モジュール80から与えられる検索
対象の記事Aの特徴表現文と発生時間から検索対象の基
準となる時間を決め、その結果を比較モジュール74に
与える。結果文解析部72は、検索結果獲得モジュール
50を介して各データベースの検索結果を取り込み、記
事B,ニュースCの特徴表現文と発生時刻から各記事の
時間を決め、その結果を比較モジュール74に与える。
絶対時間演算部73は、検索時間決定部71および結果
文解析部72の各特徴表現文中から「昨日」、「今日」
等といった時間情報を抽出し、その時間を年月日などに
よる絶対時間に変換する。比較モジュール74は、検索
された記事B,ニュースCのデータが検索時間決定部7
1で決められた時間範囲内にあるか否かを判定し、記事
B,ニュースCの各特徴量を付与する。
The time link module 70 includes a search time determining section 71, a result sentence analyzing section 72, and an absolute time calculating section 73.
And a comparison module 74. The search time determination unit 71 determines a reference time of the search target from the characteristic expression sentence of the article A to be searched and the occurrence time provided from the control module 80, and provides the result to the comparison module 74. The result sentence analysis unit 72 takes in the search results of each database via the search result acquisition module 50, determines the time of each article from the characteristic expression sentences of the articles B and news C and the time of occurrence, and sends the result to the comparison module 74. give.
The absolute time calculation unit 73 selects “Yesterday”, “Today” from the characteristic expression sentences of the search time determination unit 71 and the result sentence analysis unit 72.
The time information such as is extracted, and the time is converted into an absolute time such as a date. The comparison module 74 converts the data of the searched article B and news C into the search time determination unit 7.
It is determined whether or not the time is within the time range determined in step 1, and the respective feature amounts of the article B and the news C are added.

【0019】次に、制御モジュール80の構成を図3に
示す。図において、制御モジュール80は、検索対象文
格納部81と、内容リンク閾値格納部82と、時間範囲
格納部83と、解析方法格納部84と、比較要素決定部
85と、関連度計算部86と、検索結果格納部87とに
より構成される。検索対象文格納部81は、検索対象の
記事を格納して内容リンクモジュール60へ与える。内
容リンク閾値格納部82は、内容リンクモジュール60
における特徴量計算に用いる閾値を格納して内容リンク
モジュール60へ与える。時間範囲格納部83は、時間
リンクモジュール70における特徴量計算に用いる時間
範囲を格納して時間リンクモジュール70へ与える。解
析方法格納部84は、関連度の計算アルゴリズムを格納
して比較要素決定部85および関連度計算部86へ与え
る。比較要素決定部85は、関連度の計算に必要な名
詞,固有名詞などの比較要素を決定して内容リンクモジ
ュール60へ与える。関連度計算部86は、内容リンク
モジュール60および時間リンクモジュール70によっ
て決定された特徴量を取り込み、関連度の計算アルゴリ
ズムを用いて関連度を算出して検索結果格納部87に与
える。検索結果格納部87は、最終的に関連度ありと判
断されたデータを格納する。
Next, the configuration of the control module 80 is shown in FIG. In the figure, the control module 80 includes a search target sentence storage unit 81, a content link threshold storage unit 82, a time range storage unit 83, an analysis method storage unit 84, a comparison element determination unit 85, and an association degree calculation unit 86. And a search result storage unit 87. The search target sentence storage unit 81 stores the articles to be searched and gives them to the content link module 60. The content link threshold storage unit 82 stores the content link module 60
Are stored and given to the content link module 60. The time range storage unit 83 stores a time range used for calculating the feature amount in the time link module 70 and provides the time range to the time link module 70. The analysis method storage unit 84 stores an algorithm for calculating the degree of relevance and provides it to the comparison element determination unit 85 and the degree of relevancy calculation unit 86. The comparison element determination unit 85 determines comparison elements such as nouns and proper nouns necessary for calculating the degree of relevance and supplies the comparison elements to the content link module 60. The relevance calculating unit 86 takes in the feature amounts determined by the content link module 60 and the time link module 70, calculates the relevance using an algorithm for calculating the relevance, and provides the relevance to the search result storage unit 87. The search result storage unit 87 stores data that is finally determined to be relevant.

【0020】以下、記事Aに類似した記事Bやニュース
Cを検索する過程の動作手順について、以上示した各部
の構成と、図4に示すフローチャートを参照して説明す
る。まず、ユーザは制御モジュール80に、検索対象の
記事Aと、関連度計算の解析方法のアルゴリズムと、時
間範囲と、閾値とを設定することにより、制御モジュー
ル80は動作を開始する。
Hereinafter, an operation procedure in a process of searching for an article B or a news C similar to the article A will be described with reference to the configuration of each unit described above and the flowchart shown in FIG. First, the user sets the article A to be searched, the algorithm of the method of analyzing the relevance calculation, the time range, and the threshold value in the control module 80, and the control module 80 starts operating.

【0021】制御モジュール80は、比較要素決定部8
5で関連度の計算に必要な比較要素を決定し、記事Aの
特徴表現文、閾値とともに内容リンクモジュール60に
設定する(ステップ1)。
The control module 80 includes a comparison element determining unit 8
In step 5, a comparison element required for calculating the degree of relevance is determined, and set in the content link module 60 together with the characteristic expression sentence of the article A and the threshold (step 1).

【0022】次に、制御モジュール80は、記事Aの特
徴表現文、発生時間および時間範囲を時間リンクモジュ
ール70に設定する(ステップ2)。次に、制御モジュ
ール80は、各データベースをキーワード検索するため
のキーワードを牽引リンクモジュール20に設定する
(ステップ3)。さらに、例えば新聞記事から写真の部
分のみを得るといった構造を操作するための条件、すな
わち抽出したい構造表現を構造リンクモジュール30に
設定する(ステップ4)。
Next, the control module 80 sets the characteristic expression sentence, occurrence time, and time range of the article A in the time link module 70 (step 2). Next, the control module 80 sets a keyword for keyword search of each database in the towing link module 20 (step 3). Further, a condition for operating a structure such as obtaining only a photograph portion from a newspaper article, that is, a structure expression to be extracted is set in the structure link module 30 (step 4).

【0023】検索条件出力モジュール40では、牽引リ
ンクモジュール20および構造リンクモジュール30に
設定された条件を用いて、テレビニュースデータベース
10 1 および新聞記事データベース102 を検索する
(ステップ5)。検索された結果は、検索結果獲得モジ
ュール50を介して内容リンクモジュール60および時
間リンクモジュール70に送られる。なお、検索結果獲
得モジュール50は、ここではバッファの役割を果たし
ている。
In the search condition output module 40, the
Link module 20 and structural link module 30
Using the set conditions, TV news database
10 1And newspaper article database 10TwoSearch for
(Step 5). The search result is the search result acquisition module.
Module 50 and the content link module 60
Sent to the inter-link module 70. In addition, search results
The gain module 50 serves here as a buffer.
ing.

【0024】内容リンクモジュール60では、検索文解
析部61で記事Aの特徴表現文について形態素解析した
後に、比較要素に従って解析に必要なデータを生成し、
比較モジュール64に格納する。また、結果文解析部6
2では、検索された記事B,ニュースCの特徴表現文に
ついて形態素解析した後に、比較要素に従って比較対象
のデータを生成し、比較モジュール64に格納する。比
較モジュール64では、記事Aと記事B,ニュースCの
各解析データを比較し、閾値よりも多くの一致があるデ
ータには0.00以上1.00未満の特徴量を付加し、閾値より
も一致が少ないデータには1.00の特徴量を付加し、各記
事のデータとともに制御モジュール80に送出する(ス
テップ6)。
In the content link module 60, after performing a morphological analysis on the characteristic expression sentence of the article A by the search sentence analyzing unit 61, data necessary for the analysis is generated according to the comparison element.
It is stored in the comparison module 64. The result sentence analysis unit 6
In step 2, after performing a morphological analysis on the feature expression sentences of the retrieved articles B and news C, data to be compared is generated according to the comparison elements and stored in the comparison module 64. The comparison module 64 compares the analysis data of the article A with the analysis data of the article B and the news C, adds a feature amount of 0.00 or more and less than 1.00 to data having more matches than the threshold value, and adds data with less matches than the threshold value. To the control module 80 together with the data of each article (step 6).

【0025】時間リンクモジュール70では、検索時間
決定部71で記事Aの特徴表現文および発生時間を用い
て、例えば「昨日」という時間情報を「1991年9月10
日」のような絶対時間に変換し、時間範囲によって「19
91年8月から1991年10月」のような時間の区間に変換
し、比較モジュール74に格納する。また、結果文解析
部72では、検索された記事B,ニュースCの特徴表現
文から、例えば事件のあった日付、報道された日付のデ
ータを抽出して比較モジュール74に格納する。比較モ
ジュール74では、記事Aと記事B,ニュースCの各時
間データを比較し、時間範囲内に存在するデータには0.
00以上1.00未満の特徴量を付加し、時間範囲外のデータ
には1.00の特徴量を付加し、制御モジュール80に送出
する(ステップ7)。
In the time link module 70, the search time determination unit 71 uses the characteristic expression sentence of the article A and the occurrence time to, for example, convert the time information “yesterday” to “September 10, 1991”.
Converts to absolute time, such as days, and depending on the time range,
It is converted into a time section such as “August 1991 to October 1991” and stored in the comparison module 74. The result sentence analyzing unit 72 extracts, for example, data on the date of the incident and the date of the news report from the feature expression sentences of the retrieved articles B and news C, and stores the data in the comparison module 74. The comparison module 74 compares the time data of the article A with the time data of the article B and the news C, and sets the data existing within the time range to 0.
A feature value of not less than 00 and less than 1.00 is added, and a feature value of 1.00 is added to data outside the time range, and the data is sent to the control module 80 (step 7).

【0026】制御モジュール80では、関連度計算部8
6に内容リンクモジュール60および時間リンクモジュ
ール70によって決定された特徴量を取り込み、与えら
れた解析方法を用いて関連度を算出する(ステップ
8)。関連性判定の一例としては、内容リンクモジュー
ル60から得られた特徴量をαi (i=1〜n)、時間リ
ンクモジュール70から得られた特徴量をβとし、それ
らを擬似的な距離と見なして、
In the control module 80, the relevance calculating section 8
6, the feature amounts determined by the content link module 60 and the time link module 70 are fetched, and the degree of association is calculated using a given analysis method (step 8). As an example of the relevance determination, the feature amount obtained from the content link module 60 is α i (i = 1 to n), the feature amount obtained from the time link module 70 is β, Regarding,

【0027】[0027]

【数1】 の計算式により、相対的な距離を計算する。ここで、解
析方法中に指示された所定の距離内にあるデータに関し
てのみ関連性ありと判断する。
(Equation 1) The relative distance is calculated by the following formula. Here, it is determined that there is relevance only for data within a predetermined distance designated during the analysis method.

【0028】検索結果格納部87では、関連性ありと判
断されたデータについて、相対的な距離から関連度の高
い順に並べ替えて格納する(ステップ9)。ここで、特
徴表現文、データ構造、関連度計算のアルゴリズムにお
ける空間、時間リンクモジュール70における特徴量の
決め方、内容リンクモジュール60で得られる特徴量の
決め方についてその一例を説明する。
The search result storage section 87 sorts and stores the data determined to be relevant in descending order of relative relevance from the relative distance (step 9). Here, an example will be described of a feature expression sentence, a data structure, a space in an algorithm for calculating the degree of association, a method of determining a feature amount in the temporal link module 70, and a method of determining a feature amount obtained in the content link module 60.

【0029】特徴表現文は、新聞や雑誌のような活字の
メディアでは本文のデータ、テレビやラジオのような映
像・音声のメディアではスクリプトを用いることにより
実現できる。
The characteristic expression sentence can be realized by using text data in print media such as newspapers and magazines, and by using scripts in video and audio media such as television and radio.

【0030】データ構造は、テレビニュースを例にとる
と、映像、音声、特徴表現文、放映日時およびキーワー
ドからなる。キーワードには、例えば日本などの地名や
経済などのジャンルといったものが付けられる。
In the case of television news, the data structure is composed of video, audio, feature expression, broadcast date and time, and keywords. The keywords include, for example, place names such as Japan and genres such as economy.

【0031】関連度計算のアルゴリズムにおける空間
は、内容リンクモジュール60で生成される特徴量の中
で、特徴表現文の中に多数存在し情報を大まかに示して
いる名詞による特徴量と、動作の状態を示すサ変名詞に
よる特徴量と、事件のあった場所や関わった人物などを
示す固有名詞による特徴量と、「昨日」といった時間を
表す副詞や「4月」といった時間を表す数詞から生成さ
れる特徴量とを用い、4次元の空間として表現する。
The space in the relevance calculation algorithm includes, among the feature quantities generated by the content link module 60, a feature quantity by a noun which is present in a large number of feature expression sentences and roughly indicates information; It is generated from a feature quantity using a paranoun that indicates the state, a feature quantity using a proper noun that indicates the place where the incident occurred, the person involved, etc. And expressed as a four-dimensional space by using

【0032】例えば、情報Xとの間の特徴量について、
名詞の特徴量が0.30、サ変名詞の特徴量が0.60、固有名
詞の特徴量が0.20であり、時間リンクモジュール70で
得られた特徴量が0.00である情報Yに対して、動作手順
のステップ8で述べた (1)式により、擬似的な距離は0.
70となる。また、名詞の特徴量が0.30、サ変名詞の特徴
量が0.60、固有名詞の特徴量が0.60であり、時間リンク
モジュール70で得られた特徴量が0.00である情報Zに
対して、擬似的な距離は0.90となる。したがって、情報
Yの方が情報Xに類似した情報と判定される。
For example, regarding the characteristic amount between the information X and
Step 8 of the operation procedure is performed on the information Y whose feature amount of the noun is 0.30, feature amount of the sa noun is 0.60, feature amount of the proper noun is 0.20, and the feature amount obtained by the time link module 70 is 0.00. According to equation (1), the pseudo distance is 0.
It becomes 70. In addition, for information Z in which the feature quantity of the noun is 0.30, the feature quantity of the sa-variant noun is 0.60, the feature quantity of the proper noun is 0.60, and the feature quantity obtained by the time link module 70 is 0.00, The distance is 0.90. Therefore, the information Y is determined to be information similar to the information X.

【0033】この他に各軸の特徴量を変化させることに
より、擬似的な距離を変化させることも可能である。た
とえば、 (1)式に各軸の影響度を示す軸強度μi (i=1
〜n)、μB を加えて、
In addition, it is also possible to change the pseudo distance by changing the feature amount of each axis. For example, the axial strength μ i (i = 1) indicating the degree of influence of each axis in equation (1)
~n), added mu B,

【0034】[0034]

【数2】 とする。ただし、μi 、μB は、0.00以上の実数で、標
準は1.0 である。この場合、例えば固有名詞の軸強度が
0.010 であったとすると、情報Xとの間の特徴量につい
て、名詞の特徴量が0.30、サ変名詞の特徴量が0.60、固
有名詞の特徴量が0.20であり、時間リンクモジュール7
0で得られた特徴量が0.00である情報Yの擬似的な距離
は0.67となる。また、名詞の特徴量が0.30、サ変名詞の
特徴量が0.60、固有名詞の特徴量が0.60であり、時間リ
ンクモジュール70で得られた特徴量が0.00である情報
Zの擬似的な距離も0.67となる。したがって、情報Yお
よび情報Zの情報Xに対する類似度は同じと判定され
る。このように、軸強度を変えることで、例えば固有名
詞の軸の影響を弱めれば、サ変名詞が表現する事件が類
似しているといった観点での類似度が強調され、逆に固
有名詞の軸の影響を強めれば人物や場所などの類似が強
調され、関連性の識別に多様性を与えることができる。
(Equation 2) And Here, μ i and μ B are real numbers of 0.00 or more, and the standard is 1.0. In this case, for example, the axial strength of the proper noun is
Assuming that it is 0.010, the feature amount of the noun is 0.30, the feature amount of the sa-variable noun is 0.60, the feature amount of the proper noun is 0.20, and the time link module 7
The pseudo distance of the information Y whose feature amount obtained at 0 is 0.00 is 0.67. In addition, the pseudo-distance of the information Z in which the characteristic amount of the noun is 0.30, the characteristic amount of the sa-variant noun is 0.60, the characteristic amount of the proper noun is 0.60, and the characteristic amount obtained by the time link module 70 is 0.007. Becomes Therefore, it is determined that the similarity of information Y and information Z to information X is the same. In this way, by changing the axis strength, for example, if the influence of the axis of the proper noun is weakened, the similarity in terms of the similarity of the cases represented by the sa noun is emphasized, and conversely the axis of the proper noun is emphasized. If the influence of is strengthened, the similarity of a person or a place is emphasized, and diversity can be given to the identification of relevance.

【0035】時間リンクモジュール70における特徴量
の決め方は、時間リンクモジュール70が記事Aと同日
のみの情報しか扱わない場合を0.00とし、無限に古い情
報までを扱う場合を1.00として、時間幅を双曲線関数的
に表現することで達成できる。たとえば、記事Aとの時
間差Xを日数で表し、特徴量Yを Y=1.00−1/(X+1) …(3) と表すと、記事Aと同日の記事について時間リンクモジ
ュール70で抽出される特徴量は0.00となり、1年前の
情報は0.997 となる。
The method of determining the feature quantity in the time link module 70 is 0.00 when the time link module 70 handles only information on the same day as the article A, 1.00 when it handles infinitely old information, and the time width is hyperbolic. This can be achieved by expressing it functionally. For example, if the time difference X from the article A is represented by the number of days and the feature amount Y is represented by Y = 1.00-1 / (X + 1) (3), the feature extracted by the time link module 70 for the article on the same day as the article A The amount is 0.00, and the information one year ago is 0.997.

【0036】特徴量Yの他の決め方は、メディアの種類
に応じて時間リンクモジュール70が特徴量を決定すれ
ば、テレビと新聞とのように異なるメディアに対して
は、情報が発生してから報道されるまでの時間差を吸収
することができる。たとえば、時間リンクモジュール7
0に入力された記事Aが午後のテレビニュースであった
場合に、新聞で翌日の朝刊の記事に対しては時間リンク
モジュール70で得られる特徴量を0.00とし、他の情報
に対しては双曲線関数で表現する。また、時間リンクモ
ジュール70に入力された記事Aが午前のテレビニュー
スであれば新聞の夕刊の記事、記事Aが新聞の朝刊であ
れば前日のテレビニュース、記事Aが新聞の夕刊であれ
ばお昼までのテレビニュースに対しては、時間リンクモ
ジュール70で得られる特徴量を0.00とする。この結
果、新聞とテレビニュースとの間にあるメディアによる
時間差を吸収することができ、ある記事に最も類似した
記事を検索し易くすることができる。
Another method of determining the characteristic amount Y is that if the time link module 70 determines the characteristic amount according to the type of the medium, the information is generated for different media such as television and newspaper after the information is generated. It can absorb the time lag before being reported. For example, time link module 7
When the article A input to 0 is TV news in the afternoon, the feature amount obtained by the time link module 70 for an article published in the morning on the next day in a newspaper is set to 0.00, and the hyperbolic curve is obtained for other information. Express with a function. Also, if the article A input to the time link module 70 is the morning TV news, an evening newspaper article, if the article A is a newspaper morning newspaper, the previous day's television news, and if the article A is an evening newspaper, lunch time For the TV news up to, the feature amount obtained by the time link module 70 is set to 0.00. As a result, it is possible to absorb the time difference between the newspaper and the television news due to the media, and to easily search for the article most similar to the article.

【0037】内容リンクモジュール60で得られる特徴
量の決め方は、検索対象の記事Aの特徴表現文から得ら
れた比較対象データと、データベースからの検索文から
得られた単語とが完全に一致する場合を0.00とし、まっ
たく一致しない場合を1.00としたときに、一致した単語
数をa、比較対象データの単語数をbとすると、その特
徴量Wは、 W=1.00−a/b …(4) として表現される。たとえば、記事Aにおいて名詞が10
個存在したときに、検索した記事中に一致する名詞が8
個存在すれば、特徴量はO.20となる。なお、内容リンク
モジュール60の閾値は外部から設定される。
The method of determining the feature amount obtained by the content link module 60 is such that the comparison target data obtained from the feature expression sentence of the article A to be searched and the word obtained from the search sentence from the database completely match. Assuming that the number of matched words is a and the number of words of the comparison target data is b when the case is set to 0.00 and the case of no match is set to 1.00, the characteristic amount W is W = 1.00−a / b (4) ). For example, in article A, the noun is 10
When there are multiple matches, the noun that matches in the searched article is 8
If there are, the feature amount is O.20. The threshold of the content link module 60 is set from outside.

【0038】特徴量Wの他の決め方は、内容リンクモジ
ュール60の特徴量の計算において特徴表現文を係受け
解析し、文の主題を表現する文節と、それを修飾する文
節に分離する。すなわち、内容リンクモジュール60に
入力された記事Aと、データベースから得られた記事の
それぞれの特徴表現文を係受け解析し、主題(大意)を
表す文節から得られた単語と修飾する文節から得られた
単語とを分類する。例えば比較対象データにおいて、主
題を表す文節から名詞が10個得られ、検索した記事中の
主題を表す文節中に一致する名詞が7個あり、修飾する
文節どうしでは6個中3個の名詞が一致したとすると、
修飾する文節の影響を0.30、主題の文節の影響を0.70と
すれば、特徴量Wは、0.70×0.70+0.30×0.50=0.36と
なる。この結果、副次的情報による関連性の計算への悪
影響を排除することができる。
In another method of determining the characteristic amount W, the characteristic expression sentence is subjected to the analysis in the calculation of the characteristic amount of the content link module 60, and is separated into a phrase expressing the subject of the sentence and a phrase modifying the sentence. That is, the article A input to the content link module 60 and the characteristic expression sentence of each of the articles obtained from the database are subjected to the parsing and analyzed, and the words obtained from the words representing the subject (general) and the words to be modified are obtained. Classified words and. For example, in the data to be compared, ten nouns are obtained from the phrase representing the subject, there are seven matching nouns in the phrase representing the subject in the retrieved article, and three out of six nouns are used in the modifying phrases. If they match,
Assuming that the effect of the clause to be modified is 0.30 and the effect of the subject clause is 0.70, the feature amount W is 0.70 × 0.70 + 0.30 × 0.50 = 0.36. As a result, it is possible to eliminate adverse effects on the calculation of relevance due to the side information.

【0039】[0039]

【発明の効果】以上説明したように、本発明の複合的な
情報間の関連性識別方法では、例えば新聞記事とテレビ
ニュースのような異なるメディアの情報間に存在する関
連性を容易に識別することができる。すなわち、それぞ
れ異なる作成者により構築されたマルチメディアデータ
ベースに対して、高機能の情報検索サービスを提供する
ことができる。
As described above, in the method for identifying the relationship between complex information of the present invention, the relationship existing between information of different media such as newspaper articles and television news can be easily identified. be able to. That is, a high-performance information retrieval service can be provided for multimedia databases constructed by different creators.

【0040】さらに、本発明方法では、個々の情報に特
徴表現文と発生時刻データとを付加するだけでよく、複
数のデータベースに渡ってキーワードなどの関連性を考
慮する必要がなくなり、データベース作成者への負担を
大幅に軽減することができる。
Further, in the method of the present invention, it is only necessary to add a characteristic expression sentence and occurrence time data to individual information, and it is not necessary to consider the relevance of keywords and the like across a plurality of databases. The burden on the user can be greatly reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の複合的な情報間の関連性の識別方法を
実現するマルチメディアデータベースシステムの実施例
構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of an embodiment of a multimedia database system for realizing a method for identifying association between complex information according to the present invention.

【図2】内容リンクモジュール60および時間リンクモ
ジュール70の構成例を示すブロック図である。
FIG. 2 is a block diagram showing a configuration example of a content link module 60 and a time link module 70.

【図3】制御モジュール80の構成例を示すブロック図
である。
FIG. 3 is a block diagram illustrating a configuration example of a control module 80.

【図4】本発明実施例の動作手順を説明するフローチャ
ートである。
FIG. 4 is a flowchart illustrating an operation procedure of the embodiment of the present invention.

【符号の説明】[Explanation of symbols]

101 テレビニュースデータベース 102 新聞記事データベース 20 牽引リンクモジュール 30 構造リンクモジュール 40 検索条件出力モジュール 50 検索結果獲得モジュール 60 内容リンクモジュール 61 検索文解析部 62 結果文解析部 63 形態素解析部 64 比較モジュール 70 時間リンクモジュール 71 検索時間決定部 72 結果文解析部 73 絶対時間演算部 74 比較モジュール 80 制御モジュール 81 検索対象文格納部 82 内容リンク閾値格納部 83 時間範囲格納部 84 解析方法格納部 85 比較要素決定部 86 関連度計算部 87 検索結果格納部10 1 TV news database 10 2 Newspaper article database 20 Tow link module 30 Structural link module 40 Search condition output module 50 Search result acquisition module 60 Content link module 61 Search sentence analysis unit 62 Result sentence analysis unit 63 Morphological analysis unit 64 Comparison module 70 Time link module 71 Search time determination unit 72 Result sentence analysis unit 73 Absolute time operation unit 74 Comparison module 80 Control module 81 Search target sentence storage unit 82 Content link threshold storage unit 83 Time range storage unit 84 Analysis method storage unit 85 Comparison element determination Unit 86 relevance calculation unit 87 search result storage unit

フロントページの続き (56)参考文献 特開 平2−287876(JP,A) 特開 平2−287768(JP,A) 特開 平3−176690(JP,A) 特開 平4−54564(JP,A) 特開 平4−84271(JP,A) 特開 平1−243116(JP,A) 特開 昭61−248160(JP,A) 特開 平1−278171(JP,A) 特開 平2−98779(JP,A) 特開 平2−232771(JP,A) 特開 昭64−26225(JP,A) 特開 平4−24871(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06F 17/28 JICSTファイル(JOIS)Continuation of the front page (56) References JP-A-2-287876 (JP, A) JP-A-2-287768 (JP, A) JP-A-3-176690 (JP, A) JP-A-4-54564 (JP) JP-A-4-84271 (JP, A) JP-A-1-243116 (JP, A) JP-A-61-248160 (JP, A) JP-A-1-278171 (JP, A) 2-98779 (JP, A) JP-A-2-232771 (JP, A) JP-A-64-26252 (JP, A) JP-A-4-24871 (JP, A) (58) Fields investigated (Int. Cl. 7, DB name) G06F 17/30 G06F 17/28 JICST file (JOIS)

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 画像情報、音声情報、テキスト情報、そ
の他各メディア情報を含む複合的な情報間の関連性識別
方法において、 前記各情報に、個々の特徴を自然言語で表現した特徴表
現文と、その情報の発生時刻データとを付加し、 前記各情報の特徴表現文を自然言語解析して各特徴量を
抽出し、 前記各情報の発生時刻データと、各情報の特徴表現文を
自然言語解析して抽出した時間に関する情報とを用い
て、その情報が実際に発生した絶対時間に変換し、 前記各情報の特徴量および絶対時間の比較により前記各
情報間の関連度を算出することを特徴とする複合的な情
報間の関連性識別方法。
1. A method for identifying the association between complex information including image information, audio information, text information, and other media information, wherein each of the information includes a feature expression sentence expressing individual features in a natural language. , Adding the occurrence time data of the information, extracting the feature amounts by analyzing the characteristic expression sentence of each information in natural language, and extracting the occurrence time data of each information and the characteristic expression sentence of each information in natural language. Using the information on the time extracted by analysis, the information is converted into an absolute time at which the information actually occurs, and the degree of association between the pieces of information is calculated by comparing the feature amount of the information and the absolute time. A method for identifying the relationship between featured complex information.
【請求項2】 請求項1に記載の複合的な情報間の関連
性識別方法において、 各情報の特徴表現文を自立語と修飾語の品詞ごとに分類
し、品詞ごとの単語が一致する量により品詞ごとの関連
度を算出し、 各情報の特徴表現文中の副詞と日時を表す語を用いて、
各情報の発生時刻データを絶対時間に変換し、 前記各品詞の個数をnとしたときに、各品詞ごとの単語
の一致量と各情報の絶対時間をn+1次元の空間上の各
軸にそれぞれ割り当て、それらの大きさから前記各情報
間の関連度をn+1次元の空間上の擬似的な距離として
算出することを特徴とする複合的な情報間の関連性識別
方法。
2. The method according to claim 1, wherein the characteristic expression sentence of each information is classified into a part of speech of a self-sufficient word and a modifier, and an amount of matching of the word of each part of speech is obtained. , The degree of relevance of each part of speech is calculated using the adverb and the word indicating the date and time in the feature expression sentence of each information.
The occurrence time data of each piece of information is converted into absolute time, and when the number of each part of speech is n, the amount of word matching for each part of speech and the absolute time of each piece of information are plotted on each axis in an n + 1-dimensional space. A method for identifying associations between complex information, comprising: allocating and calculating a degree of association between the pieces of information from the sizes thereof as a pseudo distance in an n + 1-dimensional space.
【請求項3】 請求項2に記載の複合的な情報間の関連
性識別方法において、 各品詞ごとの単語の一致量と各情報の絶対時間をn+1
次元の空間上の各軸にそれぞれ割り当てるときに、所定
の軸上で扱える距離の範囲を指定してn+1次元上の距
離を制御することを特徴とする複合的な情報間の関連性
識別方法。
3. The method according to claim 2, wherein the amount of coincidence between words of each part of speech and the absolute time of each piece of information are n + 1.
A method for identifying relevance between complex information, comprising specifying a range of a distance that can be handled on a predetermined axis and controlling a distance on an (n + 1) -dimensional plane when assigning to each axis in a dimensional space.
【請求項4】 請求項2に記載の複合的な情報間の関連
性識別方法において、 各品詞ごとの単語が一致する量を計算する際に、特徴表
現文の係受けを解析して情報の大意を表す部分とそれを
修飾する部分とに分離し、各情報の修飾部分で一致する
量に対して、大意を表す部分で一致する量を加重計算す
ることを特徴とする複合的な情報間の関連性識別方法。
4. A method according to claim 2, wherein, when calculating the amount of matching of the words of each part of speech, the dependency of the characteristic expression sentence is analyzed by calculating the amount of matching of the words. The complex information is separated into a part that expresses the meaning and a part that modifies it, and weights the amount that matches in the part that indicates the meaning with respect to the amount that matches in the modification part of each information. Relevance identification method.
JP04031069A 1992-02-18 1992-02-18 A method for identifying associations between complex information Expired - Lifetime JP3090233B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04031069A JP3090233B2 (en) 1992-02-18 1992-02-18 A method for identifying associations between complex information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04031069A JP3090233B2 (en) 1992-02-18 1992-02-18 A method for identifying associations between complex information

Publications (2)

Publication Number Publication Date
JPH05233719A JPH05233719A (en) 1993-09-10
JP3090233B2 true JP3090233B2 (en) 2000-09-18

Family

ID=12321163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04031069A Expired - Lifetime JP3090233B2 (en) 1992-02-18 1992-02-18 A method for identifying associations between complex information

Country Status (1)

Country Link
JP (1) JP3090233B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3340208B2 (en) * 1993-10-14 2002-11-05 富士通株式会社 Multimedia information collection device
JPH09322089A (en) * 1996-05-27 1997-12-12 Fujitsu Ltd Broadcasting program transmitter, information transmitter, device provided with document preparation function and terminal equipment
JP2000148793A (en) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> Method and device for similar retrieval of composite media document and storage medium stored with similar retrieval program for composite media document
JP4623811B2 (en) * 2000-10-05 2011-02-02 株式会社デジタル・ナレッジ Information transmission device
JP4430882B2 (en) 2003-03-19 2010-03-10 富士通株式会社 COMPOSITE MEDIA CONTENT CONVERSION DEVICE, CONVERSION METHOD, AND COMPOSITE MEDIA CONTENT CONVERSION PROGRAM
JP5078674B2 (en) 2008-02-29 2012-11-21 インターナショナル・ビジネス・マシーンズ・コーポレーション Analysis system, information processing apparatus, activity analysis method, and program
JP5255333B2 (en) * 2008-06-16 2013-08-07 ドーサ アドバンスズ エルエルシー Broadcast program information transmitter
JP5910222B2 (en) 2012-03-23 2016-04-27 富士ゼロックス株式会社 Information processing apparatus and information processing program

Also Published As

Publication number Publication date
JPH05233719A (en) 1993-09-10

Similar Documents

Publication Publication Date Title
US6826576B2 (en) Very-large-scale automatic categorizer for web content
US6442540B2 (en) Information retrieval apparatus and information retrieval method
US6199103B1 (en) Electronic mail determination method and system and storage medium
US5523945A (en) Related information presentation method in document processing system
EP1396799B1 (en) Content management system
US6366908B1 (en) Keyfact-based text retrieval system, keyfact-based text index method, and retrieval method
US5895464A (en) Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects
US7912868B2 (en) Advertisement placement method and system using semantic analysis
US7970768B2 (en) Content data indexing with content associations
US6286000B1 (en) Light weight document matcher
CN102915299B (en) Word segmentation method and device
US7333985B2 (en) Dynamic content clustering
US20060167930A1 (en) Self-organized concept search and data storage method
US7523109B2 (en) Dynamic grouping of content including captive data
WO2005041063A1 (en) Information retrieval
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
US5842217A (en) Method for recognizing compound terms in a document
JP3090233B2 (en) A method for identifying associations between complex information
US7593844B1 (en) Document translation systems and methods employing translation memories
JPH09153064A (en) Information filtering device
JP4497337B2 (en) Concept search device and recording medium recording computer program
JP2002183195A (en) Concept retrieving system
RU2266560C1 (en) Method utilized to search for information in poly-topic arrays of unorganized texts
JPH0628416A (en) Multi-media information retrieving system
JPH11134364A (en) Systematized knowledge analyzing method and device therefor, and classifying method and device therefor

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070721

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080721

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080721

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 12