JP4965766B2 - 関係情報抽出装置および属性情報抽出装置 - Google Patents

関係情報抽出装置および属性情報抽出装置 Download PDF

Info

Publication number
JP4965766B2
JP4965766B2 JP2001086646A JP2001086646A JP4965766B2 JP 4965766 B2 JP4965766 B2 JP 4965766B2 JP 2001086646 A JP2001086646 A JP 2001086646A JP 2001086646 A JP2001086646 A JP 2001086646A JP 4965766 B2 JP4965766 B2 JP 4965766B2
Authority
JP
Japan
Prior art keywords
word
time information
expression
attribute
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001086646A
Other languages
English (en)
Other versions
JP2002288166A (ja
Inventor
雅子 望主
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001086646A priority Critical patent/JP4965766B2/ja
Publication of JP2002288166A publication Critical patent/JP2002288166A/ja
Application granted granted Critical
Publication of JP4965766B2 publication Critical patent/JP4965766B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書中から関係情報を抽出する関係情報抽出装置および文書中から属性情報を抽出する属性情報抽出装置に関する。
【0002】
【従来の技術】
文書中から特定の情報を抽出する情報抽出という技術がある。これは、対象となる文書から、特定の意味を持つ語や、語と語の関係を品詞や構文的な情報によって自動的に抽出するものである。例えば、特開平7−85041号公報では、関係付けられる語句のパターンから、語句とその関係を抽出するもので、関係とそれを表す表現をあらかじめ登録しておき、同義語や上位下位概念を抽出するようにしている。また、特開平7−85041号公報では、特にシソーラスなどの静的な辞書情報を構築することを目的としている。また、特開平7−85071号公報では、語の構文的な関係から例えば、主語の位置にたつ語であれば、その語が未登録でも、文全体の動詞(例:開発)等から、意味(例:開発者)ということを推定するようにしている。
【0003】
しかし、以上のように文書中から語の意味や語と語の関係を抽出した場合、百科辞典的な一般的なシソーラス等では時間が経過しても、その記述内容は変わらないが、情報によっては時間の経過によって変化するものがある。
例えば、人に関する情報について考えてみた場合、
(株)AAA社長 山田
という表現があり、「山田」という人物が「(株)AAA」の社長という関係で結びつけることができる。あるいは「山田」という人物の意味属性として、「(株)AAA社長」を結び付けることができる。
しかし、このような事柄は時間によって変化する場合があり、
(株)AAA社長 小島
という表現が抽出された場合に、情報の間の衝突がおきてしまう。
【0004】
【発明が解決しようとする課題】
本発明は、以上の点に鑑み、文書中から抽出された意味属性や関係の情報を、文書が作成された年月日などの時間情報とともに格納することで、抽出された結果に対する信頼度情報の提供や絞り込みによって、より正確な情報抽出技術を提供することにある。
【0005】
【課題を解決するための手段】
請求項1の発明は、文書中の表現を解析して複数の語を得る解析部と、前記解析部で得た複数の語から、語同士の関係を示す関係表現と該関係表現で関係が示される語とを抽出する抽出部と、前記抽出部で抽出した関係表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、前記格納部で格納した関係表現及び語を前記第1の時間情報とともに出力する出力部とを備え、前記格納部は、語と、前記第1の時間情報に追加する時間表現を示す追加時間情報とを対応付けて記憶する第1記憶部と、前記抽出部で抽出した前記関係表現が、前記第1記憶部に記憶された語を含む場合は、当該語に対応する前記追加時間情報を前記第1記憶部から読み出し、その読み出した前記追加時間情報を前記第1の時間情報に追加することにより第2の時間情報に変換する変換手段を有し、前記抽出部で抽出した関係表現及び語と前記変換手段で変換された第2の時間情報とを対応付けて格納し、前記出力部は、前記格納部で格納した関係表現及び語を前記第2の時間情報とともに出力することを特徴としたものである。
【0006】
請求項2の発明は、文書中の表現を解析して複数の語を得る解析部と、前記解析部で得た複数の語から、語同士の関係を示す関係表現と該関係表現で関係が示される語とを抽出する抽出部と、前記抽出部で抽出した関係表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、前記格納部で格納した関係表現及び語を前記第1の時間情報とともに出力する出力部とを備え、前記格納部は、前記格納部は、語と、時間的な変化がないことを示す情報を前記第1の時間情報に追加することを示す意味情報とを対応付けて記憶する第2記憶部と、前記抽出部で抽出した前記関係表現が、前記第2記憶部に記憶された語を含む場合は、時間的な変化がないことを示す情報を前記第1の時間情報に追加することにより第3の時間情報に変換する変換部を有し、前記抽出部で抽出した関係表現及び語と前記変換手段で変換された第3の時間情報とを対応付けて格納し、前記出力部は、前記格納部で格納した前記関係表現及び語を前記第3の時間情報とともに出力することを特徴としたものである。
【0007】
請求項3の発明は、請求項1または2の発明において、前記抽出部は、語同士の関係を示す関係表現と該関係表現で関係が示される語とこれらの出現順序とを規定した関係表現辞書を用いて、前記解析部で得た複数の語を照合することにより、前記解析部で得た複数の語から、語同士の関係を示す関係表現と該関係表現で関係が示される語とを抽出することを特徴としたものである。
【0008】
請求項4の発明は、 文書中の表現を解析して複数の語を得る解析部と、前記解析部で得た複数の語から、語の属性を示す属性表現と該属性表現で属性が示される語とを抽出する抽出部と、前記抽出部で抽出した属性表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、前記格納部で格納した属性表現及び語を前記第1の時間情報とともに出力する出力部とを備え、前記格納部は、語と、前記第1の時間情報に追加する時間表現を示す追加時間情報とを対応付けて記憶する第1記憶部と、前記抽出部で抽出した前記属性表現が、前記第1記憶部に記憶された語を含む場合は、当該語に対応する前記追加時間情報を前記第1記憶部から読み出し、その読み出した前記追加時間情報を前記第1の時間情報に追加することにより第2の時間情報に変換する変換手段を有し、前記出力部は、前記格納部で格納した属性表現及び語を前記第2の時間情報とともに出力することを特徴としたものである。
【0009】
請求項5の発明は、文書中の表現を解析して複数の語を得る解析部と、前記解析部で得た複数の語から、語の属性を示す属性表現と該属性表現で属性が示される語とを抽出する抽出部と、前記抽出部で抽出した属性表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、前記格納部で格納した属性表現及び語を前記第1の時間情報とともに出力する出力部とを備え、前記格納部は、語と、時間的な変化がないことを示す情報を前記第1の時間情報に追加することを示す意味情報とを対応付けて記憶する第2記憶部と、前記抽出部で抽出した前記属性表現が、前記第2記憶部に記憶された語を含む場合は、時間的な変化がないことを示す情報を前記第1の時間情報に追加することにより第3の時間情報に変換する変換部を有し、前記抽出部で抽出した属性表現及び語と前記変換手段で変換された第3の時間情報とを対応付けて格納し、前記出力部は、前記格納部で格納した前記属性表現及び語を前記第3の時間情報とともに出力することを特徴としたものである。
【0010】
請求項6の発明は、請求項4または5の発明において、前記抽出部は、語の属性を示す属性表現と該属性表現で属性が示される語とこれらの出現順序とを規定した属性表現辞書を用いて、前記解析部で得た複数の語を照合することにより、前記解析部で得た複数の語から、語の属性を示す属性表現と該属性表現で関係が示される語とを抽出することを特徴としたものである。
【0013】
【発明の実施の形態】
請求項1〜2の発明]
図1は、本発明に係る関係情報抽出装置および属性情報抽出装置の一構成例を示す図で、形態素解析部1、パターン照合部2、情報抽出部3からなる。対象となる文書が入力されると、まず、形態素解析部1で形態素解析を行ない、文書中の語句を語に分割し、品詞を得、この結果に対して、パターン照合部2と情報抽出部3とで情報を抽出、付与、格納する。
【0014】
図2は、本発明のパターン照合部と情報抽出部の処理の流れを示すフロー図で、関係表現パターン辞書、あるいは意味属性パターン辞書に記述のパターンを順に照合する(S1)。文書中の未照合の位置から語を照合する(S2)。パターンと一致した語の並びがあれば(S3)、それらを抽出し、指定の順で格納する(S4)。さらに格納された情報に、文書の時間に関する情報(文書の作成日や発行日等の時間に関する情報)を共に格納する(S5)。文書中のすべての語について照合が終了すると(S6)、次のパターンについて同様に照合を行なう(S1)。文書に関する時間の情報の抽出自体は、文書の書誌情報やヘッダの情報から抽出するものであり、従来技術で可能である。
【0015】
請求項3の発明]
図3は、請求項1〜2に用いられる関係表現パターン辞書の例である。文書中の現われる語の表記、品詞、意味のパターンを記述してある。ここでは意味に関する情報には先頭に「$」を、品詞に関する情報には先頭に「#」が、それ以外は語の表記自身としている。1行めの例では、意味が人名である語のあとに、表記が「の」である語、次に意味が人物関係名である語、次に表記が「の」である語、その後に意味が人名である語の並びを規定している。また、意味や品詞などの指示とともに、抽出された語がどのような意味となるのかを対応付けるために、パターンの規定とともにアルファベットの記述を付与している。
【0016】
最初のパターンが一致すれば、最初の語は、抽出結果の表やデータベース中で、「A」と指定してある個所に格納されるべきものという意味になる。この抽出結果への対応付けは、一例であり、他の方法でもよい。2行目のパターンの例は、意味ではなく、品詞を指定した場合であり、辞書に意味情報がなくても照合が可能であることを示している。また、このパターンは正規表現形式のものでもよい。
【0017】
図4は、請求項1に用いられる単語辞書の例である。語の表記、品詞、意味の情報からなる。語に特に意味の指定がない場合には、意味の欄は空欄になる。パターン辞書の説明同様、意味には「$」、品詞には「#」が付与されている。これらの区別は、他の記号や他の方法でもよい。
【0018】
請求項1〜3の実施例]
文書中に以下の表現がある場合、例)山田の弟子の小島が完成させた。形態素解析され、表記:山田|の|弟子|の|小島|が|完成|させ|た|。
品詞:#固有名詞|#助詞|#名詞|#助詞|#固有名詞|#助詞|#サ変名詞|#助動詞|#助動詞|#句点を得る。
【0019】
ここでは、辞書によって各語に意味の情報を付与する。以下になる。この処理自体は、パターン照合時に辞書をひいて照合する方法でもよい。
表記:山田|の|弟子|の|小島|が|完成|させ|た|。
品詞:#固有名詞|#助詞|#名詞|#助詞|#固有名詞|#助詞|#サ変名詞|#助動詞|#助動詞|#句点
意味:$人名||$人物関係名||$人名|||||
【0020】
次に、関係表現パターン辞書によって、パターンを照合する。最初のパターンを照合すると、語「山田」が$人名であり、パターンの先頭と一致する。次のパターンの記述は表記「の」であり、一致する。同様にして、「弟子」「小島」まで一致する。パターンの記述が照合されたので、照合された文書中の語句を抽出し、パターンで指示された位置に基づいてデータベース中に格納する。結果として、人名「山田」と人名「小島」が「弟子」という関係にあることが得られる。そして、この情報に対して、文書が作成された日付の情報を得、対応付けて格納する。図5に抽出結果の例を示す。
【0021】
[請求項の発明]
図6は、請求項4,5に用いられる意味属性パターン辞書の例である。文書中の現われる語の表記、品詞、意味のパターンを記述してある。ここでは意味に関する情報には先頭に「$」を、品詞に関する情報には先頭に「#」が、それ以外は語の表記自身としている。1行めの例では、意味が組織名である語のあとに、意味が役職名である語、次に表記が「の」である語、その後に意味が人名である語の並びを規定している。また、意味や品詞などの指示とともに、抽出された語がどのような意味となるのかを対応付けるために、パターンの規定とともにアルファベットで記述されている。最初のパターンが一致すれば、最初の語は、抽出結果の表やデータベース中で、「A」と指定してある個所に格納されるべきものという意味になる。この抽出結果への対応付けは、一例であり、他の方法でもよい。図7に単語辞書の例を示す。
【0022】
請求項4,5の前半部分の実施例]
文書中に以下の表現がある場合で説明する。
例)AAA社社長の桜井が発言した。
形態素解析され、表記:AAA社|社長|の|桜井|が|発言|し|た|。
品詞:#固有名詞|#名詞|#助詞|#固有名詞|#助詞|#サ変名詞|#助動詞|#助動詞|#句点を得る。
【0023】
ここでは、辞書によって各語に意味の情報を付与する。以下になる。この処理自体は、パターン照合時に辞書をひいて照合する方法でもよい。
表記:AAA社|社長|の|桜井|が|発言|し|た|。
品詞:#固有名詞|#名詞|#助詞|#固有名詞|#助詞|#サ変名詞|#助動詞|#助動詞|#句点
意味:$組織名|$役職名||$人名|||||
【0024】
次に、意味属性パターン辞書によって、パターンを照合する。
最初のパターンを照合すると、語「AAA社」が$組織名であり、パターンの先頭と一致する。次のパターンの記述は語「社長」であり、一致する。同様にして、「の」「桜井」まで一致する。パターンの記述が照合されたので、照合された文書中の語句を抽出し、パターンで指示された位置に基づいてデータベース中に格納する。
【0025】
結果として、人名「桜井」に関する意味的な情報として、組織名が「AAA社」、役職が「社長」という情報を得ることができる。本例では、人物を中心にその人物の属する組織名、役職を意味情報として対応付けたが、例えば、組織名を中心にして、その役職と人物名を意味情報とすることも可能である。さらにこの情報に対して、文書が作成された日付の情報を得、共に格納する。図8に抽出結果の例を示す。
【0026】
上述した処理すべてを行なったのち、以下の処理を行なうものである。図9に時間情報による抽出結果の選択の流れを示す。抽出結果に対して、項目と関係あるいは意味の情報が同じデータがあった場合には(S11)、時間情報のより新しいデータを選択し、識別表示するか、そのデータだけを表示あるいは、格納データ中からそのデータだけにする(S12)。また、時間順にデータを並べ、表示する。
【0027】
関係を抽出するところまでは請求項4の前半部分と同じである。語「山本太郎」と関係「妻」が一致するデータが2つある。時間情報をみると異なっており、1行目のデータの方が時間的に新しい。この例では抽出結果の選択の欄に「*」をつけることによって、識別する。図10に関係の抽出結果例を示す。本例では、抽出した特定の語に着目し、複数の結果がある場合に、例えば、これを時間情報の新しい順、古い順などに並べて表示あるいは格納することもできる。
【0028】
関係を抽出するところまでは請求項4の前半部分と同じである。人名「桜井」と組織名「AAA社」の一致するデータが2つある。時間情報をみると異なっており、2行目のデータの方が時間的に新しい。この例では抽出結果の選択の欄に「*」をつけることによって、識別する。図11にその結果例を示す。
【0029】
ここでも、抽出した特定の語に着目し、複数の結果がある場合に、例えば、これを時間情報の新しい順、古い順などに並べて表示あるいは格納することもできる。組織名と役職名に着目し、時間情報の順に並べることもできる。図12にその結果例を示す。
【0030】
請求項1,4の後半部分の発明]
前述の請求項1,4の前半部分の処理すべてを行なったのち、以下の処理を行なうものである。図13は、時間順序語を含む辞書の例である。語の表記と、追加時間表現とからなる。抽出時に照合された表現の中で、本辞書の表記があった場合に、追加時間表現の欄の表現を時間情報中に追加し、照合された語を削除する。図14に時間順序語による時間情報の追加の流れを示す。抽出結果の関係名に時間順序語の表現が含まれるかどうかを調べ(S21)、あれば時間情報に追加時間表現の欄の表現を追加する。かつ、関係名から時間順序語の部分を削除したものを関係名とする(S22)。
【0031】
[請求項1の後半部分の実施例]
例)山本太郎の前妻山本雅子が死去した。
関係を抽出するところまでは前述した処理と同じである。語「山本太郎」と関係「前妻」によって、語「山本太郎」と語「山本雅子」、関係「前妻」が得られる。関係には、辞書の追加時間表現の欄に記述のある「前」が含まれるので、時間情報の1992.2に追加時間表現の「以前」を加え、関係「前妻」から「前」を削除する。図15に関係の抽出結果例を示す。
【0032】
請求項4の後半部分の実施例]
例)AAA社の前社長桜井が訪問した。関係を抽出するところまでは請求項1の前半部分と同じである。人名「桜井」組織名「AAA社」役職名「前社長」がえられる。時間情報は「1999.5」である。抽出した語の中で役職名に「前」が含まれており、時間情報に辞書の追加時間表現である「以前」を加え、かつ役職名から「前」を削除する。図16に語と意味属性の抽出結果例を示す。
【0033】
請求項2の後半部分の発明]
処理概要は請求項1と同じである。本発明は、関係抽出後に、辞書に絶対順序である情報がある語が照合された場合は、時間情報に時間的な変化なしという情報を追加するもので、図17は、その場合の絶対順序情報の追加の流れを示すフロー図である。図17において、関係抽出結果中に、語の関係(意味)に絶対順序が含まれている場合(S31)は、時間情報に、変化のない情報である旨を付加する(S32)。図18は、関係表現パターン辞書を示し、形式は請求項1と同じである。図19は、単語辞書を示すが、この単語辞書の形式も請求項1と同じである。しかし、関係を表す表現「長女」について、絶対的な順序であることが、意味情報に記述される。
【0034】
請求項2の後半部分の実施例]
以下を解析対象とする。
例)小島の長女雅子が訪問した。形態素解析後、パターン照合すると、第1のパターンが照合される。パターンの位置情報にしたがって、情報を抽出する。照合した関係名「長女」には意味情報に「絶対順序」とあるので、抽出した結果の時間情報に「変化なし」という情報を付加する。図20に抽出結果例を示す。
【0035】
請求項5の後半部分の発明]
処理概要は請求項4と同じである。本発明では、語と意味属性抽出後に、辞書に絶対順序である情報がある語が照合された場合は、時間情報に時間的な変化なしという情報を追加するもので、図17は、その場合の絶対順序情報の追加の流れを示すフロー図である。図21は、意味属性パターン辞書で、その形式は請求項4と同じである。図22の単語辞書の形式も請求項4と同じであるが、語「初代」の意味属性に「絶対順序」が記述され、絶対的な順序であることを示す。
【0036】
請求項5の後半部分の実施例]
以下を解析対象とする。
例)初代ワシントン大統領だ。
形態素解析後、パターン照合すると、第1のパターンが照合される。パターンの位置情報にしたがって、情報を抽出する。照合した語のうち「初代」の意味情報に「絶対順序」なので、抽出した結果の時間情報に「初代」とともに「変化なし」という情報を付加する。図23に抽出結果の例を示す。
【0037】
【発明の効果】
請求項1の効果]
語の並びによって特定の関係にある語を抽出し、かつ、その関係が認められた時点の情報を得るので、語の関係自体の情報の信頼性を判断でき、より正確な情報を提供できる。また、抽出した関係に対応付けて付与された時間情報によって、その関係が文書中により新しく出現した情報の方を得ることができるので、精度の高い語の関係を抽出できる。本発明では、関係名に含まれる時間的な順序の情報も、時間情報に加えることでより精度のよい情報を抽出できる。本発明の実施ののち、時間情報によってより新しい情報を選択することもできる。
【0038】
請求項2の効果]
語の並びによって特定の関係にある語を抽出し、かつ、その関係が認められた時点の情報を得るので、語の関係自体の情報の信頼性を判断でき、より正確な情報を提供できる。また、抽出した関係に時間情報を付与し、かつ時間情報が時間の経過とともに変化しない情報である旨を記述できるので、より信頼性の高い情報を抽出できる。
【0039】
請求項3の効果]
語同士の関係を示す関係表現と該関係表現で関係が示される語とこれらの出現順序とを規定した関係表現辞書を用いて、解析部で得た複数の語を照合するようにしたので、解析部で得た複数の語から関係表現と該関係表現で関係が示される語とを容易に抽出することができる。
ことにより関係表現辞書を用いる
【0040】
請求項4の効果]
語の並びによって特定の語とその語の意味的な情報を抽出し、かつ、その記述のなされた時点の情報を得るので、語の意味の情報の信頼性を判断でき、より正確な情報を提供できる。また、抽出した意味属性に対応付けて付与された時間情報によって、その関係が文書中により新しく出現した情報の方を得ることができるので、精度の高い語の関係を抽出できる。本発明では、意味属性を表現する語に含まれる時間的な順序の情報も、時間情報に加えることでより精度のよい情報を抽出できる。本発明の実施ののち、時間情報によってより新しい情報を選択することもできる。
【0041】
請求項5の効果]
語の並びによって特定の語とその語の意味的な情報を抽出し、かつ、その記述のなされた時点の情報を得るので、語の意味の情報の信頼性を判断でき、より正確な情報を提供できる。また、抽出した語と意味属性に時間情報を付与し、かつ時間情報が時間の経過とともに変化しない情報である旨を記述できるので、より信頼性の高い情報を抽出できる。
【0042】
請求項6の効果]
語の属性を示す属性表現と該属性表現で属性が示される語とこれらの出現順序とを規定した属性表現辞書を用いて、解析部で得た複数の語を照合するようにしたので、解析部で得た複数の語から属性表現と該属性表現で関係が示される語とを容易に抽出することができる。
【図面の簡単な説明】
【図1】 本発明に係る文書中から関係情報を抽出する関係情報抽出装置および文書中から属性情報を抽出する属性情報抽出装置の一構成例を示す図である。
【図2】 本発明のパターン照合部と情報抽出部の処理の流れを示すフロー図である。
【図3】 請求項1の関係表現パターン辞書の例である。
【図4】 請求項1の単語辞書の例である。
【図5】 抽出結果の例を示す図である。
【図6】 請求項の意味属性パターン辞書の例である。
【図7】 単語辞書の例を示す図である。
【図8】 抽出結果の例を示す図である。
【図9】 時間情報による抽出結果の選択の流れを示すフロー図である。
【図10】 関係の抽出結果例を示す図である。
【図11】 結果例を示す図である。
【図12】 結果例を示す図である。
【図13】 時間順序語を含む辞書の例である。
【図14】 時間順序語による時間情報の追加の流れを示すフロー図である。
【図15】 関係の抽出結果例を示す図である。
【図16】 語と意味属性の抽出結果例を示す図である。
【図17】 絶対順序情報の追加の流れを示すフロー図である。
【図18】 関係表現パターン辞書を示す図である。
【図19】 単語辞書を示す図である。
【図20】 抽出結果例を示す図である。
【図21】 意味属性パターン辞書を示す図である。
【図22】 単語辞書を示す図である。
【図23】 抽出結果の例を示す図である。
【符号の説明】
1…形態素解析部、2…パターン照合部、3…情報抽出部。

Claims (6)

  1. 文書中の表現を解析して複数の語を得る解析部と、
    前記解析部で得た複数の語から、語同士の関係を示す関係表現と該関係表現で関係が示される語とを抽出する抽出部と、
    前記抽出部で抽出した関係表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、
    前記格納部で格納した関係表現及び語を前記第1の時間情報とともに出力する出力部とを備え、
    前記格納部は、語と、前記第1の時間情報に追加する時間表現を示す追加時間情報とを対応付けて記憶する第1記憶部と、前記抽出部で抽出した前記関係表現が、前記第1記憶部に記憶された語を含む場合は、当該語に対応する前記追加時間情報を前記第1記憶部から読み出し、その読み出した前記追加時間情報を前記第1の時間情報に追加することにより第2の時間情報に変換する変換手段を有し、前記抽出部で抽出した関係表現及び語と前記変換手段で変換された第2の時間情報とを対応付けて格納し、
    前記出力部は、前記格納部で格納した関係表現及び語を前記第2の時間情報とともに出力する
    ことを特徴とする関係情報抽出装置。
  2. 文書中の表現を解析して複数の語を得る解析部と、
    前記解析部で得た複数の語から、語同士の関係を示す関係表現と該関係表現で関係が示される語とを抽出する抽出部と、
    前記抽出部で抽出した関係表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、
    前記格納部で格納した関係表現及び語を前記第1の時間情報とともに出力する出力部とを備え、
    前記格納部は、語と、時間的な変化がないことを示す情報を前記第1の時間情報に追加することを示す意味情報とを対応付けて記憶する第2記憶部と、前記抽出部で抽出した前記関係表現が、前記第2記憶部に記憶された語を含む場合は、時間的な変化がないことを示す情報を前記第1の時間情報に追加することにより第3の時間情報に変換する変換部を有し、前記抽出部で抽出した関係表現及び語と前記変換手段で変換された第3の時間情報とを対応付けて格納し、
    前記出力部は、前記格納部で格納した前記関係表現及び語を前記第3の時間情報とともに出力することを特徴とする関係情報抽出装置。
  3. 請求項1または請求項2に記載の関係情報抽出装置において、
    前記抽出部は、語同士の関係を示す関係表現と該関係表現で関係が示される語とこれらの出現順序とを規定した関係表現辞書を用いて、前記解析部で得た複数の語を照合することにより、前記解析部で得た複数の語から、語同士の関係を示す関係表現と該関係表現で関係が示される語とを抽出することを特徴とする関係情報抽出装置。
  4. 文書中の表現を解析して複数の語を得る解析部と、
    前記解析部で得た複数の語から、語の属性を示す属性表現と該属性表現で属性が示される語とを抽出する抽出部と、
    前記抽出部で抽出した属性表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、
    前記格納部で格納した属性表現及び語を前記第1の時間情報とともに出力する出力部とを備え、
    前記格納部は、語と、前記第1の時間情報に追加する時間表現を示す追加時間情報とを対応付けて記憶する第1記憶部と、前記抽出部で抽出した前記属性表現が、前記第1記憶部に記憶された語を含む場合は、当該語に対応する前記追加時間情報を前記第1記憶部から読み出し、その読み出した前記追加時間情報を前記第1の時間情報に追加することにより第2の時間情報に変換する変換手段を有し、
    前記出力部は、前記格納部で格納した属性表現及び語を前記第2の時間情報とともに出力する
    ことを特徴とする属性情報抽出装置。
  5. 文書中の表現を解析して複数の語を得る解析部と、
    前記解析部で得た複数の語から、語の属性を示す属性表現と該属性表現で属性が示される語とを抽出する抽出部と、
    前記抽出部で抽出した属性表現及び語と前記文書に付加された日付を示す第1の時間情報とを対応付けて格納する格納部と、
    前記格納部で格納した属性表現及び語を前記第1の時間情報とともに出力する出力部とを備え、
    前記格納部は、語と、時間的な変化がないことを示す情報を前記第1の時間情報に追加することを示す意味情報とを対応付けて記憶する第2記憶部と、前記抽出部で抽出した前記属性表現が、前記第2記憶部に記憶された語を含む場合は、時間的な変化がないことを示す情報を前記第1の時間情報に追加することにより第3の時間情報に変換する変換部を有し、前記抽出部で抽出した属性表現及び語と前記変換手段で変換された第3の時間情報とを対応付けて格納し、
    前記出力部は、前記格納部で格納した前記属性表現及び語を前記第3の時間情報とともに出力する
    ことを特徴とする属性情報抽出装置。
  6. 請求項4または5に記載の属性情報抽出装置において、
    前記抽出部は、語の属性を示す属性表現と該属性表現で属性が示される語とこれらの出現順序とを規定した属性表現辞書を用いて、前記解析部で得た複数の語を照合することにより、前記解析部で得た複数の語から、語の属性を示す属性表現と該属性表現で関係が示される語とを抽出する
    ことを特徴とする属性情報抽出装置。
JP2001086646A 2001-03-26 2001-03-26 関係情報抽出装置および属性情報抽出装置 Expired - Fee Related JP4965766B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001086646A JP4965766B2 (ja) 2001-03-26 2001-03-26 関係情報抽出装置および属性情報抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001086646A JP4965766B2 (ja) 2001-03-26 2001-03-26 関係情報抽出装置および属性情報抽出装置

Publications (2)

Publication Number Publication Date
JP2002288166A JP2002288166A (ja) 2002-10-04
JP4965766B2 true JP4965766B2 (ja) 2012-07-04

Family

ID=18941991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001086646A Expired - Fee Related JP4965766B2 (ja) 2001-03-26 2001-03-26 関係情報抽出装置および属性情報抽出装置

Country Status (1)

Country Link
JP (1) JP4965766B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195535A (ja) * 2005-01-11 2006-07-27 Ntt Data Corp 情報抽出装置及び情報抽出方法並びに情報抽出プログラム
CN102043817B (zh) * 2009-10-12 2014-11-12 深圳市世纪光速信息技术有限公司 呈现人物关联词的方法和装置
CN102214186B (zh) * 2010-04-07 2013-04-24 腾讯科技(深圳)有限公司 展示对象关系的方法和系统
US20150018023A1 (en) * 2012-03-01 2015-01-15 Nikon Corporation Electronic device
JP6554804B2 (ja) * 2015-02-04 2019-08-07 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4361655B2 (ja) * 2000-01-06 2009-11-11 富士通株式会社 文章入力装置及び記録媒体

Also Published As

Publication number Publication date
JP2002288166A (ja) 2002-10-04

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
US20150081277A1 (en) System and Method for Automatically Classifying Text using Discourse Analysis
JP2002215617A (ja) 品詞タグ付けをする方法
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP4160548B2 (ja) 文書要約作成システム、方法、及びプログラム
JP3372532B2 (ja) 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体
JP4502114B2 (ja) データベース検索装置
KR101333485B1 (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
JP4965766B2 (ja) 関係情報抽出装置および属性情報抽出装置
JPH09198395A (ja) 文書検索装置
JPH0844771A (ja) 情報検索装置
JP2002278982A (ja) 情報抽出方法および情報検索方法
JP4057962B2 (ja) 質問応答装置、質問応答方法及びプログラム
JP4588657B2 (ja) 翻訳装置
JP2006119697A (ja) 質問応答システム、質疑応答方法および質疑応答プログラム
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JPH06124305A (ja) 文書検索方法
JP2885489B2 (ja) 文書内容検索装置
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JP2002073656A (ja) 異表記正規化処理・異表記展開処理方法および該処理方法による文書検索方法、該処理装置および文書検索装置並びにプログラム記録媒体
JP2002366556A (ja) 情報検索方法
JPH07296005A (ja) 日本語テキスト登録・検索装置
JP2007241900A (ja) ネーミングシステム及びネーミング自動化方法
JP2004326461A (ja) 固有名認識装置および方法
JP2006134062A (ja) 翻訳支援装置、翻訳装置、翻訳支援プログラム及び翻訳プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080324

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110126

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110519

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120330

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees