JPH05233730A - 関係情報抽出・表示装置 - Google Patents

関係情報抽出・表示装置

Info

Publication number
JPH05233730A
JPH05233730A JP4061004A JP6100492A JPH05233730A JP H05233730 A JPH05233730 A JP H05233730A JP 4061004 A JP4061004 A JP 4061004A JP 6100492 A JP6100492 A JP 6100492A JP H05233730 A JPH05233730 A JP H05233730A
Authority
JP
Japan
Prior art keywords
sentence
document
relation
company
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4061004A
Other languages
English (en)
Inventor
Hiroto Inagaki
博人 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4061004A priority Critical patent/JPH05233730A/ja
Publication of JPH05233730A publication Critical patent/JPH05233730A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 時間やキーワードなどの文書のキーがなくて
も、文内容の生起する時間夜分間の類似性を判別し、文
書中に記述されている文書の関係を解析し、表示可能と
する。 【構成】 文書入力部1と、入力された文書中で企業の
活動に関係する述語を持つ文だけを抽出する文書一次選
択部2と、抽出した文の述語と名詞句の関係、文の様
相、文内容の生起する時間を解析する企業関係抽出部3
と、述語と名詞句、ユーザが設定した述語間や様相間等
の関係を解析する企業関係解析部4と、解析した結果を
グラフ表現する企業関係情報表示部5とを備えたことを
特徴としている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書中に書かれてい
る、例えば企業に関係する情報を抽出し、その情報を解
析することにより、文内容の生起する時間、文の様相、
述語と名詞句の関係を取得し、その情報を用いて時間と
類似性を軸として文をグラフ表現し、様相ごとに文を分
類表示する関係情報抽出・表示装置に関するものであ
る。
【0002】
【従来の技術】以下、説明の都合上、関係する情報とし
て企業に関係する情報を用いる。
【0003】従来、企業の関係に関する情報を抽出し
て、その情報を時間と類似性の軸でグラフ表現する場
合、文書が作成された時間や類似性を表すキーワードの
出現分布を用いて表示する方法があった。
【0004】
【発明が解決しようとする課題】しかし、すべての文書
に対して、時間やキーワードなどのキーを付与しなけれ
ばならず、キーワードの適切さが装置の精度を左右した
り、文書の作成された時間と文の内容の生起時間が異な
るなどの点で処理限界があった。
【0005】また、時間やキーワードなどのキーが付与
されていないような文書を対象とすることができず、さ
らに、文書中の文単位に関係を解析することができなか
った。
【0006】本発明の目的は、前記従来技術において問
題であった時間やキーワードなどの文書のキーがなくて
も、文書中の各文の表現から、文内容の生起する時間や
文間の類似性を判別し、文書中に記述されている文書の
関係を解析し、表示可能とする関係情報抽出・表示装置
を提供することにある。
【0007】
【課題を解決するための手段】本発明にかかる関係情報
抽出・表示装置は、文書を読み込む文書入力部と、前記
入力された文書中で、活動に関係する述語を持つ文だけ
を抽出する文書一次選択部と、活動に関係する述語と該
述語に必要な名詞句と文で述べている様相と発話内容の
生起する時間の関係を記述した関係知識を用いて前記抽
出した文の述語と名詞句と文の様相と発話内容の生起す
る時間の関係を解析する関係抽出部と、前記述語と名詞
句の関係の中で同一の統合、ユーザが設定した述語間と
分の様相間の関係の解析、必然的な述語間と様相間の関
係を解析を行う関係解析部と、前記関係を時間と述語と
名詞句の類似性によりグラフ表現するとともに、文の様
相ごとに情報を分類表示する関係情報表示部とを具備し
たものである。
【0008】
【作用】本発明においては、時間やキーワードなどの情
報が付与されていない文書においても、目的とする活動
に関係する情報を抽出し、解析することにより、文間の
類似性、文内容の生起時間、文の様相を取得し、時間と
類似性を軸として文の関係をグラフ表現したり、文の様
相により文を分類表示することを可能にする。
【0009】
【実施例】以下、本発明の実施例について説明する。な
お、本実施例は、企業関係情報を対象にしたものであ
る。まず、本発明にかかる企業情報抽出・表示装置の全
体構成について述べる。
【0010】図1は本発明の一実施例の構成を示すブロ
ック図である。1は文書入力部で、文書を本装置に適し
たコード情報に変換する。2は文書一時選択部で、コー
ド化された文書を一次企業関係知識2Aを用いて、企業
活動に関係する情報と企業活動に関係しない情報とに分
け、企業に関係する情報のみを後の処理に渡す。3は企
業関係抽出部で、文書一次選択部2で選択された文を二
次企業関係知識3Aを用いて、形態素解析、構文解析、
関係解析する。4は企業関係解析部で、企業関係抽出部
3で抽出した企業に関係する文に対して、同一の関係を
統合したり、企業間の関係について記述したスクリプト
4Aに基づき文間の関係付けを行う。5は企業関係情報
表示部で、関係解析された企業関係の文を、その文の生
起した時間、文間の類似性にしたがってグラフ表現する
とともに、文に記述されている話者の様態にしたがって
分類表示する。
【0011】図2に企業関係情報抽出・表示装置のシス
テム構成ブロック図を示す。また、システム全体の処理
の流れ図を図3,4に示す。なお(S0)〜(S5)は
各ステップを示す。CPU10は立ち上げ時に起動用の
ROM11に記録されている初期設定を行い、入力待状
態に入る。初期設定では、各入力機器の接続チェック、
初期化を行った後、処理に必要な知識データとプログラ
ムをDISK40からRAM30にロードする。知識デ
ータ、プログラムのロードが終了した後、文書の入力待
状態となる(S0)。
【0012】文書入力部1(S1)としては、通常のK
B(キーボード)20とCRT(ディスプレイ)21、
FD(フロッピーディスク)22、MT(マグネチック
テープ)23を用いてコード情報を直接入力する場合
と、IR(イメージリーダ)24、HS(ハンドスキャ
ナ)25から入力したイメージ情報をコード情報に変換
するCR(文字認識器)26を利用する場合の2種類を
用意している。コード情報に変換された後は、RAM3
0にコード情報が転送される(S2)。
【0013】DISK40に記憶されている知識データ
類としては、一次企業関係用知識41、形態素解析用知
識42、構文解析用知識43、企業関係抽出用知識4
4、スクリプト用知識45がある。図1における一次企
業関係知識2Aは、図2における一次企業関係用知識4
1(41a)に当る。図1における二次企業関係知識3
Aは、図2における形態素解析用知識42(42a)、
構文解析用知識43(43a)、企業関係抽出用知識4
4(44a)に当る。図1におけるスクリプト4Aは図
2におけるスクリプト用知識45(45a)に当る。こ
れらの知識データ類は、起動時にRAM30上に転送さ
れ、一次企業関係用知識41a,形態素解析用知識42
a,構文解析用知識43a,企業関係抽出用知識44
a,スクリプト用知識45aが構築され、RAM30に
登録される。一次企業関係用知識41,41aは文書か
ら企業に関係する文を簡単なルールで抽出するために使
用し、形態素解析用知識42,42aは文書の形態素解
析を行うために使用し、構文解析用知識43,43aは
文書の構文解析を行うために使用する。企業関係抽出用
知識44,44aは企業に関する情報を抽出するために
使用し、スクリプト用知識45,45aは抽出した企業
の情報を関係付けるために使用される。
【0014】文書一次選択部2(S2)では、RAM3
0に記録されたコード情報から企業の活動に関係する情
報を選択する。一次企業関係用知識41aを用いて企業
活動に関係するパターンであるかどうかを判断する。パ
ターンと一致する文があった場合、そのパターンまでを
企業活動に関係する文と認定し、後の処理に渡すバッフ
ァの中にその先頭からそのパターンまでを記憶させる。
それ以降にさらにパターンと一致した文があれば、それ
も同様に企業活動に関係する文と認定し、バッファに入
れる。もし、それ以降パターンと一致しなければ、それ
以降の文は破棄する。また、全くパターンが一致しなけ
ればその文は企業に関係しない文であるとして破棄す
る。
【0015】パターン検査終了後、バッファに記憶され
た文のみを後の処理に渡す。企業関係抽出部3(S3)
では、文の構造を解析する。文構造の解析においては、
まず、文の形態素解析を行う。形態素解析では、RAM
30上にある形態素解析用知識42aを用いて、文を分
かち書きし、形態素情報を付与する。形態素情報として
は、表記、読み、品詞、活用形、意味カテゴリ等を付与
する。構文解析としては、構文解析用知識43aを用
い、係り受け解析を基本とした手法を用いる。係り受け
解析の代表的な手法としては、稲垣ら(稲垣、小橋:係
り受け解析方法、特願昭62−173011号)の発明
がある。この係り受け解析手法を用いて文を解析したの
ち、企業関係抽出用知識44aを用いて、文構造を解析
する。
【0016】実例を用いて、図1の文書入力部1から企
業関係情報表示部5までの処理を示す。
【0017】入力する文書として図5のような文書を考
える。この文書がKB20、HS25等から入力され、
RAM30上にコード情報化されて記憶されているとす
る。文書一次選択部2(S2)では、まず、入力された
文書の内容のうち、企業活動に関する文のみを対象とし
て抽出する。ステップ(S2)で使用するのは、一次企
業関係用知識41aで、この知識データの中には、図6
の企業述語データと図7の様相表現データが記述されて
いる。企業述語データは、企業に関係する述語の見出し
とインデックスが記述されている。様相表現データは、
文の様相に関係する語の見出しとインデックスが記述さ
れている。この2つのデータを利用して処理が行われ
る。
【0018】まず、入力された文書から文を抽出し、以
下のようなパターンで文を区切る。 (企業述語)+{{<平仮名>}* +{(様相表現)}
* +{<平仮名>}** +{「。」|「、」}* 但し、(企業述語)とは、企業述語データに記載されて
いる見出しで、かつその見出し以降に平仮名か企業述語
データの見出しか様相表現データの見出しが出現する場
合。(様相表現)とは、様相表現データに記載されてい
る見出しで、かつその見出し以降に、平仮名か様相表現
データの見出しか文字種の同じキャラクタがある場合。
{}* は、その文字が0個以上出現すること示す。A|
Bにおける“|”はAまたはBのどちらかを表す。A+
BはAの後にBが続くことを示す。「。」は句
点、「、」は読点を表す。<平仮名>は、平仮名を表
す。
【0019】パターンと一致する文があった場合、その
パターンまでを企業活動に関係する文と認定し、後の処
理に渡すバッファーの中にその先頭からそのパターンま
でを記憶させる。それ以降にさらにパターンと一致した
文があれば、それも同様に企業活動に関係する文と認定
し、バッファーに入れる。もし、それ以降パターンと一
致しなければ、それ以降の文字は破棄する。また、全く
パターンが一致しなければ、その文は企業に関係しない
文であるとして破棄する。
【0020】図5に対して、対象文のみを表示すると図
8のようになる。つまり、図8のような出力が文書一次
選択部2から企業関係抽出部3に渡される。
【0021】企業関係抽出部3では、文書一次選択部2
から渡された文だけを解析する。解析においては、先に
述べたように、形態素解析、構文解析を用いて、形態素
情報や構文情報を得、その情報を用いて解析する。その
結果、文は、単語単位に分割され、個々の単語に企業関
係用知識情報が付与される。その様子を示したのが図9
である。
【0022】企業関係抽出用知識44aは、例えば図1
0のように構成されている。つまり、1つの単語(見出
し)に対して1つのリストに情報が記述されている。こ
のリストを素性リストと呼ぶ。構文解析後の情報に対し
てこの素性リストの情報を加えたものを、まず作成する
(図9)。素性リストは、それぞれ以下のような情報が
記述されている。 (<見出し><分野><意味素性><制約><数量・時
間><様相><係先番号<) で、6項目の情報からなる。各項目は以下のような意味
を持つ。 <見出し>=(string)対応する素性リストが付
与されるべき文字列 <分野>=その語の使用される分野。企業の場合、co
mpanyと記述され、どの分野でも可能な場合、
表示される。 <意味素性>=<見出し>の働きを示す。見出しの働き
は、図11のような素性モデルを考える。つまり、その
語が、企業活動における知的個体となり得る場合*indvi
dual*(company)、動作実体の場合*element*(company)、
変化する個体では、人間は*man*(company)、金銭は*mon
ey*(company)、生産物は*product*(company)となる。さ
らに動作は*action*(company) 、時間は*time*(compan
y) 、場所は*location*(company) で表される。また、
文の中で、その文の様相を表している語には、modality
という意味素性を付与する。 <制約>=その素性リストが成り立つための条件。条件
は、その語の周辺の語の素性リストがどのような素性リ
ストを持たなければならないかを記述する。無名変数
)か変数(頭に がある文字)の場合、どのような
リスト、値ともマッチする。それ以外の文字、数字、s
tringは完全に一致しなければならない。 <数量・時間>=数量を計算するためのリスト。リスト
の最初の値は数値、第2項目は秒、分、時、日、付き、
年のリストが示される。timeという意味素性で表される
見出しについては、その見出しの意味する時間が第2項
目に記述される。例えば10月であれば5番目に10が
あるリスト( 10 ))となる。 <様相>=文の表す様相について記述される。様相とし
ては<時間情報>、<相情報>、<様態情報>の3つが
記述され、リストで(、時間情報><相情報><様態情
報>)と表現される。 <時制情報>は、3項目からなる。(過去 現在 未
来)の3項目がリストで表される。適切な時制が文字で
表され、それ以外については、無名変数( )で表され
る。例えば、“過去”は(過去 )となる。 <相情報>は、11項目からなる。それぞれ、(未然
開始直前 開始 開始直後 始動 継続 終了直前 終
了 終了直後 完了 結果)で、<時制情報>と同様に
適切な相が文字で表され、それ以外は無名変数( )。 <様態情報>は、10項目からなる。(企業の予想、否
定 企業の構え 企業の狙い 企業の期待 企業の意向
断定 義務 記者の推測 記者の提案)で、<時制情
報>と同様に適切な様態が文字で表され、それ以外につ
いては無名変数( )。 <係先番号>=係先の単語番号。単語番号は先頭から数
えた単語の数(付属語は含めず)。
【0023】図9は文が単語単位に分割され、各単語に
素性リストが付与された状態を示している。さらに、各
素性リストに書かれている<制約>を満足するかどうか
を検査する。<制約>の検査は、例えば稲垣らのような
パターンマッチング器(特願平3−261306号)を
用いることにより検査できる。例えば、 文字列 素性リスト A社 (“A社” company *individual*(company) 5) は (“は” 5) のようなリストでは、素性リスト3項目に記載されいて
いる<制約>はないため、どのような条件でもパターン
マッチングができることになる。
【0024】そのため、パターンマッチングした結果
は、 文字列 素性リスト A社は (“A社は” company *individual*(company) 5) のようになる。同様に、 文字列 素性リスト A社は (“今年” time 1992))5) 10月 (“10月” time ((10)( 10 1992))5) に (“に” ) も同様に<制約>が記述されていないので、 文字列 素性リスト 今年10月に (“今年10月に” time ((10) 10 1992)) 5) となる。
【0025】<制約>が記述されているのは、単語番号
5番目の“建設”である。“建設”の素性リストは以下
のようになっている。 文字列 素性リスト 建設 (“建設”company *action*(company) (( agent *individual*(company) ) ( time *time*(company) ) ( object company *element*(company) ) ( action company *action*(company) ) ( modality )) ) <制約>は、 (( agent *individual*(company) ) ( time *time*(company) ) ( object company *element*(company) ) ( action company *action*(company) ) ( modality )) で、意味としては、文の一番最初の素性リストは、 ( agent *individual*(company) ) に一致しなければならないということである。もし、<
制約>に一致しない場合、その文の解釈に失敗したとし
て、別の素性リストを適用する。最終的な結果として、
図12を得る。また、変数(図では文字の先頭が で示
されるもの。設定した変数を図13に示す。)の値は、
以下のような値となる。
【0026】
【表1】 企業関係解析部4(S4)では、同一関係の融合、関係
間のリンク付けの2処理を行う。同一関係の融合は、同
一の文の変数に束縛されている値の比較で実行する。つ
まり、企業関係抽出処理で、抽出した情報の自立語成分
を比較し、完全に一致した場合、その文間は同一関係で
あると判断する。
【0027】例えば、上記変数の束縛状態であった場
合、マッチングは、以下のような内容に対して行われ
る。
【0028】
【表2】 互いに重複している変数については、完全に一致するこ
とが要求され、重複していない変数については、一致す
る必要がない。
【0029】もし、同一関係であると判断された場合、
同一関係にある2つの文を結合して1つの文情報にす
る。
【0030】関係間のリンク付けでは、RAM30上に
ある関係間のリンク条件を記述したスクリプト用知識4
5aを用いて処理が進められる。スクリプト用知識45
aは、関係間のリンク条件を陽に表示した知識である
が、初期状態では、必然的関係について記述される。そ
の例としては、開始と終了の関係や、ある出来事が起動
された後、別の出来事が起動される関係(例として、企
業の向上が完成した後に操業を開始する)などがある。
必然的な関係以外は、ユーザの設定したスクリプトから
関係を決定する。例えば、ある特定企業の株投機スクリ
プト、企業の資産投資スクリプト等は直接ユーザーが記
述する。
【0031】まず、ユーザーにスクリプトを追加するか
を聞く。もし、ユーザーがYESと答えた場合、装置が
用意するスクリプト用知識45aにユーザーの追加した
スクリプト用知識を加えて処理を行う。スクリプト用知
識45aの形式は、 {(<方向性>(<前接続文を特定するための制約>) (<後接続文を特定するための制約>)}* <方向性>:SorB Sは一方向性を示す。Bは関係が
両方向性を示す。 <文を特定するための制約>=(<変数名><束縛値
>)or(<素性リスト>となっている。一方向性とは、
時系列において、その文が時間的に継続して生起するこ
とを表し、両方向性とは、時系列的関係が弱く、時間的
には同時であったり、継続したり両方の場合がある関係
である。図14にスクリプト用知識45aの例を示す。
【0032】処理は、スクリプト用知識45aに記述さ
れている関係であるかどうかを、まず判断して、スクリ
プト用知識45aに記述されている関係である場合、ス
クリプト用知識45aに記載されている内容に基づい
て、関係間のリンク付けを行う。ユーザーの設定したス
クリプトを関係解析時に使用することができるため、ユ
ーザはただ単に、スクリプト用知識(45または45
a)に希望する関係を登録するだけで、自分に必要な情
報に特化した要約情報を得ることが可能となる。
【0033】例えば、図15のような文がある場合、図
12の方は、modalityが“予定”で、図15の方は、mo
dalityが“開始”である。そのため、図14のスクリプ
ト知識 (S(“予定” modality)(“開始” modalit
y)) と一致することが判定され、図12と図15の文の間に
一方向性({図12}→{図15})のリンク関係が付
与される。
【0034】文の関係の統合処理は、すべての文に対し
て上記の作業を繰り返し行う処理である。最終的には個
々の文に対してリンクが張られたネットワーク形式とな
る。
【0035】企業関係情報表示部5(S5)は、企業関
係解析部4で抽出した文とリンク関係を用いて、企業に
関して述べた文の関係を分類表示する。
【0036】時間と関係間の類似性のグラフ表現では、
X軸にその文の内容で表記される事柄が生起する時間を
示し、Y軸に関係間の類似性が示される。
【0037】X軸の時間は、企業情報関係解析で得られ
た解析情報の中に記述されているtime意味素性を持つ文
字列の<数量・時間>から取得する。<数量・時間>の
秒・分・時・日・月・年からユニバーサルタイムを計算
し、ユニバーサルタイムの小さい順にX軸に記述する。
陽に<数量・時間>素性に記述されていず、リンク関係
だけで示されているものに関しては、一方向性の場合、
リンクの左側なら対象より左側、リンクの右側なら対象
より右側に記述する。もし、リンク関係で文の生起した
時間範囲が決定できる場合、その時間範囲の中間に表示
する。また、<時制情報>が“過去”なら左端、“未
来”なら右端の値を取る。
【0038】文間の類似性については、リンク関係にあ
る文については、最も近い値とする。それ以外について
は、変数の束縛値の一致率から判断する。つまり、一致
した変数の個数を全変数で割った値で計算する。そし
て、まず、一番最初の文を基点として、それに対して最
も値の近い文(アイコン)を適切なX軸上に表示し、次
に、今設定した文(アイコン)を基点として類似性を計
算し、適切なX軸上に表示する。そして、すべての文に
ついて計算・表示が終了した時点で表示を終える。
【0039】図16にグラフ表現した例を示す。各文は
楕円のアイコンで示されている。さらに、文の<様相>
に応じて文を分類し、表示する。<様相>は、各文のmo
dality意味素性を持つ文字列から取得する。<様相>が
全く付与されていない文は分類名は“客観的事実”であ
るとする。それ以外については、<様相>で付与されて
いる値を直接分類名として用い分類する。次に文書での
出現順に文を接続して、それぞれの分類名を付与して表
示する。図17に文の様相に応じて文処分を分類、接続
して表示した例を示す。
【0040】なお、上記の実施例は企業関係情報を例と
して説明したが、本発明はその他の関係情報に関しても
適用可能であることはいうまでもない。
【0041】
【発明の効果】本発明は、以上説明したように、文書を
読み込む文書入力部と、入力された文書中で、活動に関
係する述語を持つ文だけを抽出する文書一次選択部と、
述語に必要な名詞句、文の様相、文内容の生起する時間
を解析するための知識を記述した関係知識を用いて、抽
出した文の述語と名詞句の関係、文の様相、文内容の生
起する時間を解析する関係抽出部と、同一の述語と名詞
句の関係、ユーザが設定した述語間や様相間の関係、必
然的な述語間と様相間の関係を解析する関係解析部と、
解析した文内容の生起する時間と、述語や名詞句の類似
性を用いてグラフ表現するとともに、文の様相ごとに情
報を分類表示する関係情報表示部とを具備したので、時
間の概念やキーワードが付与されていない文書におい
て、その文書を解析し、目的とする活動に関係する情報
のみ選択的に処理し、文書の関係解析により、文の時間
概念、類似性、様相を解析し、時間と類似性を軸とし
て、文をグラフ的に表現でき、さらに、文の様相によっ
て文書に書かれている内容を分類・表示することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】企業関係情報抽出・表示装置のシステム構成ブ
ロック図である。
【図3】本システムの処理の流れを示すフローである。
【図4】本システムの処理の流れを示すフローである。
【図5】入力文書例である。
【図6】企業述語データ例を示す図である。
【図7】様相表現データ例を示す図である。
【図8】入力文書から企業情報を抽出した例を示す図で
ある。
【図9】構文解析結果の例を示す図である。
【図10】企業関係用知識例を示す図である。
【図11】意味素性値を示す図である。
【図12】企業間関係抽出結果例を示す図である。
【図13】設定した変数を示す図である。
【図14】スクリプト用知識例を示す図である。
【図15】スクリプト用知識を使用した例を示す図であ
る。
【図16】文書の内容を文の類似性と時間との関係でグ
ラフ表現した例を示す図である。
【図17】文書の内容を文の様相表現によって分類表示
した例を示す図である。
【符号の説明】
1 文書入力部 2 文書一次選択部 2A 一次企業関係知識 3 企業関係抽出部 3A 二次企業関係用知識 4 企業関係解析部 4A スクリプト 5 企業関係情報表示部 10 CPU 11 ROM 20 KB(キーボード) 21 CRT(ディスプレイ) 22 FD(フロッピーディスク) 23 MT(マグネットテープ) 24 IR(イメージリーダ) 25 HS(ハンドスキャナ) 26 CR(文字認識器) 30 RAM 40 DISK(ディスク) 41 一次企業関係用知識 42 形態素解析用知識 43 構文解析用知識 44 企業関係用知識 45 スクリプト用知識 41a RAMに搭載された一次企業関係知識 42a RAMに搭載された形態素解析用知識 43a RAMに搭載された構文解析用知識 44a RAMに搭載された企業関係抽出用知識 45a RAMに搭載されたスクリプト用知識

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 活動に関する情報を抽出し、該情報の関
    係を画面に表示する関係情報抽出・表示装置において、
    文書を読み込む文書入力部と、前記入力された文書中
    で、の活動に関係する述語を持つ文だけを抽出する文書
    一次選択部と、前記述語に必要な名詞句、文の様相、文
    内容の生起する時間を解析するための知識を記述した関
    係知識を用いて、前記抽出した文の述語と名詞句の関
    係、文の様相、文内容の生起する時間を解析する関係抽
    出部と、同一の述語と名詞句の関係、ユーザが設定した
    述語間や様相間の関係、必然的な述語間と様相間の関係
    を解析する関係解析部と、前記解析した文内容の生起す
    る時間と、述語や名詞句の類似性を用いてグラフ表現す
    るとともに、文の様相ごとに情報を分類表示する関係情
    報表示部とを具備したことを特徴とする関係情報抽出・
    表示装置。
JP4061004A 1992-02-18 1992-02-18 関係情報抽出・表示装置 Pending JPH05233730A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4061004A JPH05233730A (ja) 1992-02-18 1992-02-18 関係情報抽出・表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4061004A JPH05233730A (ja) 1992-02-18 1992-02-18 関係情報抽出・表示装置

Publications (1)

Publication Number Publication Date
JPH05233730A true JPH05233730A (ja) 1993-09-10

Family

ID=13158774

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4061004A Pending JPH05233730A (ja) 1992-02-18 1992-02-18 関係情報抽出・表示装置

Country Status (1)

Country Link
JP (1) JPH05233730A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07121565A (ja) * 1993-10-26 1995-05-12 Fuji Xerox Co Ltd 情報提示装置
JPH07121567A (ja) * 1993-10-27 1995-05-12 Fuji Xerox Co Ltd 情報提示装置
JPH0883281A (ja) * 1994-09-13 1996-03-26 Fuji Xerox Co Ltd 情報提示装置
JPH08287092A (ja) * 1995-04-17 1996-11-01 Nippon Telegr & Teleph Corp <Ntt> 日本語質問メッセージ解析方法及び装置
JP2008171109A (ja) * 2007-01-10 2008-07-24 Nec Corp 情報検索システム及び情報検索方法並びにプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07121565A (ja) * 1993-10-26 1995-05-12 Fuji Xerox Co Ltd 情報提示装置
JPH07121567A (ja) * 1993-10-27 1995-05-12 Fuji Xerox Co Ltd 情報提示装置
JPH0883281A (ja) * 1994-09-13 1996-03-26 Fuji Xerox Co Ltd 情報提示装置
JPH08287092A (ja) * 1995-04-17 1996-11-01 Nippon Telegr & Teleph Corp <Ntt> 日本語質問メッセージ解析方法及び装置
JP2008171109A (ja) * 2007-01-10 2008-07-24 Nec Corp 情報検索システム及び情報検索方法並びにプログラム

Similar Documents

Publication Publication Date Title
JP4306894B2 (ja) 自然言語処理装置及びその方法、及び自然言語認識装置
US20110099052A1 (en) Automatic checking of expectation-fulfillment schemes
US20140082488A1 (en) Methods Of Offering Guidance On Common Language Usage
US11386269B2 (en) Fault-tolerant information extraction
WO2007105202A2 (en) Automatic reusable definitions identification (rdi) method
CN110633393A (zh) 显示系统、程序以及存储介质
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JP4423004B2 (ja) テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム
JP6917400B2 (ja) 文書審査支援方法、文書審査支援装置及びコンピュータプログラム
JP4005343B2 (ja) 情報検索システム
JPH05233730A (ja) 関係情報抽出・表示装置
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
KR100631086B1 (ko) Xml을 이용한 텍스트 정규화 방법 및 장치
JP2002278982A (ja) 情報抽出方法および情報検索方法
JP4965766B2 (ja) 関係情報抽出装置および属性情報抽出装置
JP2000293537A (ja) データ分析支援方法および装置
JP2002366556A (ja) 情報検索方法
JPH11102372A (ja) 文書要約装置及びコンピュータ読み取り可能な記録媒体
JP3029403B2 (ja) 文章データ音声変換システム
Sinclair 4.2 Corpus processing
JP5109615B2 (ja) 文書解析支援装置およびプログラム
JP4017407B2 (ja) 知識獲得装置、そのための記録媒体およびプログラム
JP4088176B2 (ja) 質問応答装置及び質問応答プログラム
Iftikhar et al. Identification of textual entailments in business rules
JP2007241900A (ja) ネーミングシステム及びネーミング自動化方法