JPH05233719A - 複合的な情報間の関連性識別方法 - Google Patents

複合的な情報間の関連性識別方法

Info

Publication number
JPH05233719A
JPH05233719A JP4031069A JP3106992A JPH05233719A JP H05233719 A JPH05233719 A JP H05233719A JP 4031069 A JP4031069 A JP 4031069A JP 3106992 A JP3106992 A JP 3106992A JP H05233719 A JPH05233719 A JP H05233719A
Authority
JP
Japan
Prior art keywords
information
time
module
link module
identifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4031069A
Other languages
English (en)
Other versions
JP3090233B2 (ja
Inventor
Hideaki Ozawa
英昭 小澤
Toru Nakagawa
透 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04031069A priority Critical patent/JP3090233B2/ja
Publication of JPH05233719A publication Critical patent/JPH05233719A/ja
Application granted granted Critical
Publication of JP3090233B2 publication Critical patent/JP3090233B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は、映像情報、活字情報、その他の情
報伝達媒体を介して提供される複合的な情報を利用する
データベースシステムにおいて、各情報間の関連度の識
別に用いられる複合的な情報間の関連性識別方法に関
し、任意のマルチメディア情報間に多様な関連付けを行
うことができることを目的とする。 【構成】 画像情報、音声情報、テキスト情報、その他
各メディア情報を含む複合的な情報間の関連性識別方法
において、各情報に、個々の特徴を自然言語で表現した
特徴表現文と、その情報の発生時刻データとを付加し、
各情報の特徴表現文を自然言語解析して各特徴量を抽出
し、各情報の発生時刻データと、各情報の特徴表現文を
自然言語解析して抽出した時間に関する情報とを用い
て、その情報が実際に発生した絶対時間に変換し、各情
報の特徴量および絶対時間の比較により各情報間の関連
度を算出することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、映像として提供される
情報、活字として提供される情報、その他の情報伝達媒
体を介して提供される複合的な情報を利用するデータベ
ースシステムにおいて、各情報間の関連度の識別に用い
られる複合的な情報間の関連性識別方法に関する。
【0002】
【従来の技術】従来のマルチメディア情報を扱うデータ
ベースシステムでは、扱うメディアの種類や対象によっ
てデータベース中で利用するデータの構造やデータ間の
関係が異なるために、それらをデータベースの作成時に
定義していた。したがって、個々のデータベースで扱え
る情報は、地図の情報やドキュメントの情報などのよう
に当初に計画されていたアプリケーションに依存し、デ
ータベース固有に定義されたデータ間の関連性のもとで
しか利用できなかった。
【0003】さらに、関連性の表現には主にキーワード
が用いられているが、必要なデータを検索するために適
当なキーワードや属性をデータベースに与える作業は、
ユーザにとって大きな負担になっていた。
【0004】
【発明が解決しようとする課題】ところで、地図のデー
タベースやドキュメントのデータベースといった個々に
独立に作成されたデータベース間において、例えばドキ
ュメントのデータから地図のデータを参照したいという
ように、個々のメディアやデータベースを越えたマルチ
メディアのデータを利用したいという要求がある。
【0005】しかし、従来技術では、例えば2つのデー
タベース間で新たに必要となった関連性を表現するため
には、新しい関係を検索することが可能なキーワードを
付加した上で、新しい参照関係を示すデータベースを作
成する必要があった。
【0006】本発明は、任意に作成されたマルチメディ
アのデータベースに対して関連性を識別する機構によ
り、新しい参照関係が必要になっても新しい参照関係デ
ータベースを作成することなく、任意のマルチメディア
情報間に多様な関連付けを行うことができる複合的な情
報間の関連性識別方法を提供することを目的とする。
【0007】
【課題を解決するための手段】請求項1に記載の発明
は、画像情報、音声情報、テキスト情報、その他各メデ
ィア情報を含む複合的な情報間の関連性識別方法におい
て、前記各情報に、個々の特徴を自然言語で表現した特
徴表現文と、その情報の発生時刻データとを付加し、前
記各情報の特徴表現文を自然言語解析して各特徴量を抽
出し、前記各情報の発生時刻データと、各情報の特徴表
現文を自然言語解析して抽出した時間に関する情報とを
用いて、その情報が実際に発生した絶対時間に変換し、
前記各情報の特徴量および絶対時間の比較により前記各
情報間の関連度を算出することを特徴とする。
【0008】請求項2に記載の発明は、請求項1に記載
の複合的な情報間の関連性識別方法において、各情報の
特徴表現文を自立語と修飾語の品詞ごとに分類し、品詞
ごとの単語が一致する量により品詞ごとの関連度を算出
し、各情報の特徴表現文中の副詞と日時を表す語を用い
て、各情報の発生時刻データを絶対時間に変換し、前記
各品詞の個数をnとしたときに、各品詞ごとの単語の一
致量と各情報の絶対時間をn+1次元の空間上の各軸に
それぞれ割り当て、それらの大きさから前記各情報間の
関連度をn+1次元の空間上の擬似的な距離として算出
することを特徴とする。
【0009】請求項3に記載の発明は、請求項2に記載
の複合的な情報間の関連性識別方法において、各品詞ご
との単語の一致量と各情報の絶対時間をn+1次元の空
間上の各軸にそれぞれ割り当てるときに、所定の軸上で
扱える距離の範囲を指定してn+1次元上の距離を制御
することを特徴とする。
【0010】請求項4に記載の発明は、請求項2に記載
の複合的な情報間の関連性識別方法において、各品詞ご
との単語が一致する量を計算する際に、特徴表現文の係
受けを解析して情報の大意を表す部分とそれを修飾する
部分とに分離し、各情報の修飾部分で一致する量に対し
て、大意を表す部分で一致する量を加重計算することを
特徴とする。
【0011】
【作用】本発明は、各メディアに対応する情報に個々の
特徴を自然言語で表現した特徴表現文を付加し、それぞ
れの特徴表現文を自然言語解析して抽出された各特徴量
を比較することにより、各情報間の関連度を算出する。
なお、自然言語解析の処理方法について、地域的な属性
の抽出、人物の抽出などを変化させることにより、各情
報間で複数の関連性を得ることができる。
【0012】また、各情報にその情報の発生時刻データ
を付加し、各情報の特徴表現文の解析と発生時刻データ
からその情報が実際に発生した絶対時間を割り出し、各
情報を時間軸上に整列させる。
【0013】ここで、各情報の特徴量および絶対時間を
比較することにより、各情報間の関連度を正確に得るこ
とができる。すなわち、複数のデータベース間で構造や
キーワードに捕らわれずに各情報の関連性を識別するこ
とができる。
【0014】
【実施例】図1は、本発明の複合的な情報間の関連性の
識別方法を実現するマルチメディアデータベースシステ
ムの実施例構成を示すブロック図である。なお、本実施
例では、データベース化された新聞とテレビのニュース
を例として、ある記事Aに類似した記事BやニュースC
を検索する過程について説明する。
【0015】図において、本実施例のマルチメディアデ
ータベースシステムは、それぞれテレビや新聞などの個
々のメディアに対応したテレビニュースデータベース1
1や新聞記事データベース102 と、牽引リンクモジ
ュール20と、構造リンクモジュール30と、検索条件
出力モジュール40と、検索結果獲得モジュール50
と、内容リンクモジュール60と、時間リンクモジュー
ル70と、制御モジュール80とにより構成される。
【0016】牽引リンクモジュール20は、各メディア
対応の個々のデータに付加されたキーワードによる関連
付けを行う。構造リンクモジュール30は、各メディア
対応の個々のデータの構造を操作する。検索条件出力モ
ジュール40は、牽引リンクモジュール20および構造
リンクモジュール30によって作成される検索条件で各
データベース101 ,102 をアクセスする。検索結果
獲得モジュール50は、検索条件出力モジュール40に
よって検索された情報を受け、内容リンクモジュール6
0および時間リンクモジュール70に送出する。内容リ
ンクモジュール60は、各情報の特徴表現文を用いて関
連付けを行う。時間リンクモジュール70は、各情報の
発生時刻を用いて関連付けを行う。制御モジュール80
は、ユーザとのインタフェースをとりながら各モジュー
ルを制御し、内容リンクモジュール60および時間リン
クモジュール70で関連付けられた情報から最終的な検
索結果を作成する。
【0017】ここで、内容リンクモジュール60および
時間リンクモジュール70の構成を図2に示す。図にお
いて、内容リンクモジュール60は、検索文解析部61
と、結果文解析部62と、形態素解析部63と、比較モ
ジュール64とにより構成される。検索文解析部61
は、制御モジュール80から与えられる検索対象の記事
Aの特徴表現文を比較要素に基づいて解析し、その結果
を比較モジュール64に与える。結果文解析部62は、
検索結果獲得モジュール15を介して各データベースの
検索結果を取り込み、同様に比較要素に基づいて記事
B,ニュースCの特徴表現文を解析し、その結果を比較
モジュール64に与える。形態素解析部63は、検索文
解析部61および結果文解析部62における特徴表現文
の解析を助ける。比較モジュール64は、検索文解析部
61および結果文解析部62での解析結果と、制御モジ
ュール80から与えられる閾値との比較を行い、記事
B,ニュースCの各特徴量を付与する。
【0018】時間リンクモジュール70は、検索時間決
定部71と、結果文解析部72と、絶対時間演算部73
と、比較モジュール74とにより構成される。検索時間
決定部71は、制御モジュール80から与えられる検索
対象の記事Aの特徴表現文と発生時間から検索対象の基
準となる時間を決め、その結果を比較モジュール74に
与える。結果文解析部72は、検索結果獲得モジュール
50を介して各データベースの検索結果を取り込み、記
事B,ニュースCの特徴表現文と発生時刻から各記事の
時間を決め、その結果を比較モジュール74に与える。
絶対時間演算部73は、検索時間決定部71および結果
文解析部72の各特徴表現文中から「昨日」、「今日」
等といった時間情報を抽出し、その時間を年月日などに
よる絶対時間に変換する。比較モジュール74は、検索
された記事B,ニュースCのデータが検索時間決定部7
1で決められた時間範囲内にあるか否かを判定し、記事
B,ニュースCの各特徴量を付与する。
【0019】次に、制御モジュール80の構成を図3に
示す。図において、制御モジュール80は、検索対象文
格納部81と、内容リンク閾値格納部82と、時間範囲
格納部83と、解析方法格納部84と、比較要素決定部
85と、関連度計算部86と、検索結果格納部87とに
より構成される。検索対象文格納部81は、検索対象の
記事を格納して内容リンクモジュール60へ与える。内
容リンク閾値格納部82は、内容リンクモジュール60
における特徴量計算に用いる閾値を格納して内容リンク
モジュール60へ与える。時間範囲格納部83は、時間
リンクモジュール70における特徴量計算に用いる時間
範囲を格納して時間リンクモジュール70へ与える。解
析方法格納部84は、関連度の計算アルゴリズムを格納
して比較要素決定部85および関連度計算部86へ与え
る。比較要素決定部85は、関連度の計算に必要な名
詞,固有名詞などの比較要素を決定して内容リンクモジ
ュール60へ与える。関連度計算部86は、内容リンク
モジュール60および時間リンクモジュール70によっ
て決定された特徴量を取り込み、関連度の計算アルゴリ
ズムを用いて関連度を算出して検索結果格納部87に与
える。検索結果格納部87は、最終的に関連度ありと判
断されたデータを格納する。
【0020】以下、記事Aに類似した記事Bやニュース
Cを検索する過程の動作手順について、以上示した各部
の構成と、図4に示すフローチャートを参照して説明す
る。まず、ユーザは制御モジュール80に、検索対象の
記事Aと、関連度計算の解析方法のアルゴリズムと、時
間範囲と、閾値とを設定することにより、制御モジュー
ル80は動作を開始する。
【0021】制御モジュール80は、比較要素決定部8
5で関連度の計算に必要な比較要素を決定し、記事Aの
特徴表現文、閾値とともに内容リンクモジュール60に
設定する(ステップ1)。
【0022】次に、制御モジュール80は、記事Aの特
徴表現文、発生時間および時間範囲を時間リンクモジュ
ール70に設定する(ステップ2)。次に、制御モジュ
ール80は、各データベースをキーワード検索するため
のキーワードを牽引リンクモジュール20に設定する
(ステップ3)。さらに、例えば新聞記事から写真の部
分のみを得るといった構造を操作するための条件、すな
わち抽出したい構造表現を構造リンクモジュール30に
設定する(ステップ4)。
【0023】検索条件出力モジュール40では、牽引リ
ンクモジュール20および構造リンクモジュール30に
設定された条件を用いて、テレビニュースデータベース
10 1 および新聞記事データベース102 を検索する
(ステップ5)。検索された結果は、検索結果獲得モジ
ュール50を介して内容リンクモジュール60および時
間リンクモジュール70に送られる。なお、検索結果獲
得モジュール50は、ここではバッファの役割を果たし
ている。
【0024】内容リンクモジュール60では、検索文解
析部61で記事Aの特徴表現文について形態素解析した
後に、比較要素に従って解析に必要なデータを生成し、
比較モジュール64に格納する。また、結果文解析部6
2では、検索された記事B,ニュースCの特徴表現文に
ついて形態素解析した後に、比較要素に従って比較対象
のデータを生成し、比較モジュール64に格納する。比
較モジュール64では、記事Aと記事B,ニュースCの
各解析データを比較し、閾値よりも多くの一致があるデ
ータには0.00以上1.00未満の特徴量を付加し、閾値より
も一致が少ないデータには1.00の特徴量を付加し、各記
事のデータとともに制御モジュール80に送出する(ス
テップ6)。
【0025】時間リンクモジュール70では、検索時間
決定部71で記事Aの特徴表現文および発生時間を用い
て、例えば「昨日」という時間情報を「1991年9月10
日」のような絶対時間に変換し、時間範囲によって「19
91年8月から1991年10月」のような時間の区間に変換
し、比較モジュール74に格納する。また、結果文解析
部72では、検索された記事B,ニュースCの特徴表現
文から、例えば事件のあった日付、報道された日付のデ
ータを抽出して比較モジュール74に格納する。比較モ
ジュール74では、記事Aと記事B,ニュースCの各時
間データを比較し、時間範囲内に存在するデータには0.
00以上1.00未満の特徴量を付加し、時間範囲外のデータ
には1.00の特徴量を付加し、制御モジュール80に送出
する(ステップ7)。
【0026】制御モジュール80では、関連度計算部8
6に内容リンクモジュール60および時間リンクモジュ
ール70によって決定された特徴量を取り込み、与えら
れた解析方法を用いて関連度を算出する(ステップ
8)。関連性判定の一例としては、内容リンクモジュー
ル60から得られた特徴量をαi (i=1〜n)、時間リ
ンクモジュール70から得られた特徴量をβとし、それ
らを擬似的な距離と見なして、
【0027】
【数1】 の計算式により、相対的な距離を計算する。ここで、解
析方法中に指示された所定の距離内にあるデータに関し
てのみ関連性ありと判断する。
【0028】検索結果格納部87では、関連性ありと判
断されたデータについて、相対的な距離から関連度の高
い順に並べ替えて格納する(ステップ9)。ここで、特
徴表現文、データ構造、関連度計算のアルゴリズムにお
ける空間、時間リンクモジュール70における特徴量の
決め方、内容リンクモジュール60で得られる特徴量の
決め方についてその一例を説明する。
【0029】特徴表現文は、新聞や雑誌のような活字の
メディアでは本文のデータ、テレビやラジオのような映
像・音声のメディアではスクリプトを用いることにより
実現できる。
【0030】データ構造は、テレビニュースを例にとる
と、映像、音声、特徴表現文、放映日時およびキーワー
ドからなる。キーワードには、例えば日本などの地名や
経済などのジャンルといったものが付けられる。
【0031】関連度計算のアルゴリズムにおける空間
は、内容リンクモジュール60で生成される特徴量の中
で、特徴表現文の中に多数存在し情報を大まかに示して
いる名詞による特徴量と、動作の状態を示すサ変名詞に
よる特徴量と、事件のあった場所や関わった人物などを
示す固有名詞による特徴量と、「昨日」といった時間を
表す副詞や「4月」といった時間を表す数詞から生成さ
れる特徴量とを用い、4次元の空間として表現する。
【0032】例えば、情報Xとの間の特徴量について、
名詞の特徴量が0.30、サ変名詞の特徴量が0.60、固有名
詞の特徴量が0.20であり、時間リンクモジュール70で
得られた特徴量が0.00である情報Yに対して、動作手順
のステップ8で述べた (1)式により、擬似的な距離は0.
70となる。また、名詞の特徴量が0.30、サ変名詞の特徴
量が0.60、固有名詞の特徴量が0.60であり、時間リンク
モジュール70で得られた特徴量が0.00である情報Zに
対して、擬似的な距離は0.90となる。したがって、情報
Yの方が情報Xに類似した情報と判定される。
【0033】この他に各軸の特徴量を変化させることに
より、擬似的な距離を変化させることも可能である。た
とえば、 (1)式に各軸の影響度を示す軸強度μi (i=1
〜n)、μB を加えて、
【0034】
【数2】 とする。ただし、μi 、μB は、0.00以上の実数で、標
準は1.0 である。この場合、例えば固有名詞の軸強度が
0.010 であったとすると、情報Xとの間の特徴量につい
て、名詞の特徴量が0.30、サ変名詞の特徴量が0.60、固
有名詞の特徴量が0.20であり、時間リンクモジュール7
0で得られた特徴量が0.00である情報Yの擬似的な距離
は0.67となる。また、名詞の特徴量が0.30、サ変名詞の
特徴量が0.60、固有名詞の特徴量が0.60であり、時間リ
ンクモジュール70で得られた特徴量が0.00である情報
Zの擬似的な距離も0.67となる。したがって、情報Yお
よび情報Zの情報Xに対する類似度は同じと判定され
る。このように、軸強度を変えることで、例えば固有名
詞の軸の影響を弱めれば、サ変名詞が表現する事件が類
似しているといった観点での類似度が強調され、逆に固
有名詞の軸の影響を強めれば人物や場所などの類似が強
調され、関連性の識別に多様性を与えることができる。
【0035】時間リンクモジュール70における特徴量
の決め方は、時間リンクモジュール70が記事Aと同日
のみの情報しか扱わない場合を0.00とし、無限に古い情
報までを扱う場合を1.00として、時間幅を双曲線関数的
に表現することで達成できる。たとえば、記事Aとの時
間差Xを日数で表し、特徴量Yを Y=1.00−1/(X+1) …(3) と表すと、記事Aと同日の記事について時間リンクモジ
ュール70で抽出される特徴量は0.00となり、1年前の
情報は0.997 となる。
【0036】特徴量Yの他の決め方は、メディアの種類
に応じて時間リンクモジュール70が特徴量を決定すれ
ば、テレビと新聞とのように異なるメディアに対して
は、情報が発生してから報道されるまでの時間差を吸収
することができる。たとえば、時間リンクモジュール7
0に入力された記事Aが午後のテレビニュースであった
場合に、新聞で翌日の朝刊の記事に対しては時間リンク
モジュール70で得られる特徴量を0.00とし、他の情報
に対しては双曲線関数で表現する。また、時間リンクモ
ジュール70に入力された記事Aが午前のテレビニュー
スであれば新聞の夕刊の記事、記事Aが新聞の朝刊であ
れば前日のテレビニュース、記事Aが新聞の夕刊であれ
ばお昼までのテレビニュースに対しては、時間リンクモ
ジュール70で得られる特徴量を0.00とする。この結
果、新聞とテレビニュースとの間にあるメディアによる
時間差を吸収することができ、ある記事に最も類似した
記事を検索し易くすることができる。
【0037】内容リンクモジュール60で得られる特徴
量の決め方は、検索対象の記事Aの特徴表現文から得ら
れた比較対象データと、データベースからの検索文から
得られた単語とが完全に一致する場合を0.00とし、まっ
たく一致しない場合を1.00としたときに、一致した単語
数をa、比較対象データの単語数をbとすると、その特
徴量Wは、 W=1.00−a/b …(4) として表現される。たとえば、記事Aにおいて名詞が10
個存在したときに、検索した記事中に一致する名詞が8
個存在すれば、特徴量はO.20となる。なお、内容リンク
モジュール60の閾値は外部から設定される。
【0038】特徴量Wの他の決め方は、内容リンクモジ
ュール60の特徴量の計算において特徴表現文を係受け
解析し、文の主題を表現する文節と、それを修飾する文
節に分離する。すなわち、内容リンクモジュール60に
入力された記事Aと、データベースから得られた記事の
それぞれの特徴表現文を係受け解析し、主題(大意)を
表す文節から得られた単語と修飾する文節から得られた
単語とを分類する。例えば比較対象データにおいて、主
題を表す文節から名詞が10個得られ、検索した記事中の
主題を表す文節中に一致する名詞が7個あり、修飾する
文節どうしでは6個中3個の名詞が一致したとすると、
修飾する文節の影響を0.30、主題の文節の影響を0.70と
すれば、特徴量Wは、0.70×0.70+0.30×0.50=0.36と
なる。この結果、副次的情報による関連性の計算への悪
影響を排除することができる。
【0039】
【発明の効果】以上説明したように、本発明の複合的な
情報間の関連性識別方法では、例えば新聞記事とテレビ
ニュースのような異なるメディアの情報間に存在する関
連性を容易に識別することができる。すなわち、それぞ
れ異なる作成者により構築されたマルチメディアデータ
ベースに対して、高機能の情報検索サービスを提供する
ことができる。
【0040】さらに、本発明方法では、個々の情報に特
徴表現文と発生時刻データとを付加するだけでよく、複
数のデータベースに渡ってキーワードなどの関連性を考
慮する必要がなくなり、データベース作成者への負担を
大幅に軽減することができる。
【図面の簡単な説明】
【図1】本発明の複合的な情報間の関連性の識別方法を
実現するマルチメディアデータベースシステムの実施例
構成を示すブロック図である。
【図2】内容リンクモジュール60および時間リンクモ
ジュール70の構成例を示すブロック図である。
【図3】制御モジュール80の構成例を示すブロック図
である。
【図4】本発明実施例の動作手順を説明するフローチャ
ートである。
【符号の説明】
101 テレビニュースデータベース 102 新聞記事データベース 20 牽引リンクモジュール 30 構造リンクモジュール 40 検索条件出力モジュール 50 検索結果獲得モジュール 60 内容リンクモジュール 61 検索文解析部 62 結果文解析部 63 形態素解析部 64 比較モジュール 70 時間リンクモジュール 71 検索時間決定部 72 結果文解析部 73 絶対時間演算部 74 比較モジュール 80 制御モジュール 81 検索対象文格納部 82 内容リンク閾値格納部 83 時間範囲格納部 84 解析方法格納部 85 比較要素決定部 86 関連度計算部 87 検索結果格納部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 画像情報、音声情報、テキスト情報、そ
    の他各メディア情報を含む複合的な情報間の関連性識別
    方法において、 前記各情報に、個々の特徴を自然言語で表現した特徴表
    現文と、その情報の発生時刻データとを付加し、 前記各情報の特徴表現文を自然言語解析して各特徴量を
    抽出し、 前記各情報の発生時刻データと、各情報の特徴表現文を
    自然言語解析して抽出した時間に関する情報とを用い
    て、その情報が実際に発生した絶対時間に変換し、 前記各情報の特徴量および絶対時間の比較により前記各
    情報間の関連度を算出することを特徴とする複合的な情
    報間の関連性識別方法。
  2. 【請求項2】 請求項1に記載の複合的な情報間の関連
    性識別方法において、 各情報の特徴表現文を自立語と修飾語の品詞ごとに分類
    し、品詞ごとの単語が一致する量により品詞ごとの関連
    度を算出し、 各情報の特徴表現文中の副詞と日時を表す語を用いて、
    各情報の発生時刻データを絶対時間に変換し、 前記各品詞の個数をnとしたときに、各品詞ごとの単語
    の一致量と各情報の絶対時間をn+1次元の空間上の各
    軸にそれぞれ割り当て、それらの大きさから前記各情報
    間の関連度をn+1次元の空間上の擬似的な距離として
    算出することを特徴とする複合的な情報間の関連性識別
    方法。
  3. 【請求項3】 請求項2に記載の複合的な情報間の関連
    性識別方法において、 各品詞ごとの単語の一致量と各情報の絶対時間をn+1
    次元の空間上の各軸にそれぞれ割り当てるときに、所定
    の軸上で扱える距離の範囲を指定してn+1次元上の距
    離を制御することを特徴とする複合的な情報間の関連性
    識別方法。
  4. 【請求項4】 請求項2に記載の複合的な情報間の関連
    性識別方法において、 各品詞ごとの単語が一致する量を計算する際に、特徴表
    現文の係受けを解析して情報の大意を表す部分とそれを
    修飾する部分とに分離し、各情報の修飾部分で一致する
    量に対して、大意を表す部分で一致する量を加重計算す
    ることを特徴とする複合的な情報間の関連性識別方法。
JP04031069A 1992-02-18 1992-02-18 複合的な情報間の関連性識別方法 Expired - Lifetime JP3090233B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04031069A JP3090233B2 (ja) 1992-02-18 1992-02-18 複合的な情報間の関連性識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04031069A JP3090233B2 (ja) 1992-02-18 1992-02-18 複合的な情報間の関連性識別方法

Publications (2)

Publication Number Publication Date
JPH05233719A true JPH05233719A (ja) 1993-09-10
JP3090233B2 JP3090233B2 (ja) 2000-09-18

Family

ID=12321163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04031069A Expired - Lifetime JP3090233B2 (ja) 1992-02-18 1992-02-18 複合的な情報間の関連性識別方法

Country Status (1)

Country Link
JP (1) JP3090233B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07110822A (ja) * 1993-10-14 1995-04-25 Fujitsu Ltd マルチメディア情報収集装置
JPH09322089A (ja) * 1996-05-27 1997-12-12 Fujitsu Ltd 放送番組送信装置と情報送信装置と文書作成機能を持つ装置と端末装置
JP2000148793A (ja) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 複合メディア文書の類似検索方法及び装置及び複合メディア文書の類似検索プログラムを格納した記憶媒体
JP2002117072A (ja) * 2000-10-05 2002-04-19 Digital Knowledge Co Ltd 情報伝達装置及び方法並びに記録媒体
JP2008252937A (ja) * 2008-06-16 2008-10-16 Dosa Advances Llc 放送番組情報送信装置
US7702996B2 (en) 2003-03-19 2010-04-20 Fujitsu Limited Apparatus and method for converting multimedia contents
US8095652B2 (en) 2008-02-29 2012-01-10 International Business Machines Corporation Analysis system, information processing apparatus, activity analysis method and program product
US9224305B2 (en) 2012-03-23 2015-12-29 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium storing information processing program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07110822A (ja) * 1993-10-14 1995-04-25 Fujitsu Ltd マルチメディア情報収集装置
JPH09322089A (ja) * 1996-05-27 1997-12-12 Fujitsu Ltd 放送番組送信装置と情報送信装置と文書作成機能を持つ装置と端末装置
JP2000148793A (ja) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 複合メディア文書の類似検索方法及び装置及び複合メディア文書の類似検索プログラムを格納した記憶媒体
JP2002117072A (ja) * 2000-10-05 2002-04-19 Digital Knowledge Co Ltd 情報伝達装置及び方法並びに記録媒体
US7702996B2 (en) 2003-03-19 2010-04-20 Fujitsu Limited Apparatus and method for converting multimedia contents
US8095652B2 (en) 2008-02-29 2012-01-10 International Business Machines Corporation Analysis system, information processing apparatus, activity analysis method and program product
JP2008252937A (ja) * 2008-06-16 2008-10-16 Dosa Advances Llc 放送番組情報送信装置
US9224305B2 (en) 2012-03-23 2015-12-29 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium storing information processing program

Also Published As

Publication number Publication date
JP3090233B2 (ja) 2000-09-18

Similar Documents

Publication Publication Date Title
US6442540B2 (en) Information retrieval apparatus and information retrieval method
US6199103B1 (en) Electronic mail determination method and system and storage medium
US5895464A (en) Computer program product and a method for using natural language for the description, search and retrieval of multi-media objects
EP1396799B1 (en) Content management system
US5523945A (en) Related information presentation method in document processing system
US6366908B1 (en) Keyfact-based text retrieval system, keyfact-based text index method, and retrieval method
US5404295A (en) Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
US7912868B2 (en) Advertisement placement method and system using semantic analysis
US5737734A (en) Query word relevance adjustment in a search of an information retrieval system
US5873076A (en) Architecture for processing search queries, retrieving documents identified thereby, and method for using same
US6826576B2 (en) Very-large-scale automatic categorizer for web content
US5742816A (en) Method and apparatus for identifying textual documents and multi-mediafiles corresponding to a search topic
US6321189B1 (en) Cross-lingual retrieval system and method that utilizes stored pair data in a vector space model to process queries
US7213205B1 (en) Document categorizing method, document categorizing apparatus, and storage medium on which a document categorization program is stored
US20030135725A1 (en) Search refinement graphical user interface
JP2001075966A (ja) データ分析システム
JP3090233B2 (ja) 複合的な情報間の関連性識別方法
KR20200098381A (ko) 콘텐츠를 검색하는 방법, 장치, 기기 및 저장 매체
CN110866086A (zh) 一种文章配图系统
JP2000163437A (ja) 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体
JP2000172691A (ja) 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体
CN114661892A (zh) 稿件摘要生成方法和装置、设备及存储介质
JP4497337B2 (ja) 概念検索装置およびコンピュータプログラムを記録した記録媒体
CN111339391B (zh) 一种基于公开数据的新型搜索方法
JP2004178351A (ja) 数量表現検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070721

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080721

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080721

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 12