JP3707044B2 - 情報抽出装置 - Google Patents

情報抽出装置 Download PDF

Info

Publication number
JP3707044B2
JP3707044B2 JP10599099A JP10599099A JP3707044B2 JP 3707044 B2 JP3707044 B2 JP 3707044B2 JP 10599099 A JP10599099 A JP 10599099A JP 10599099 A JP10599099 A JP 10599099A JP 3707044 B2 JP3707044 B2 JP 3707044B2
Authority
JP
Japan
Prior art keywords
word
words
similarity
information
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP10599099A
Other languages
English (en)
Other versions
JP2000298673A (ja
Inventor
淳一 福本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10599099A priority Critical patent/JP3707044B2/ja
Publication of JP2000298673A publication Critical patent/JP2000298673A/ja
Application granted granted Critical
Publication of JP3707044B2 publication Critical patent/JP3707044B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、自然言語で記述された文書中より文書の内容を表すいくつかの重要語句を抽出する情報抽出装置に関する。
【0002】
【従来の技術】
従来の、自然言語で記述された文書から重要語句を抽出する方法として、例えば、文献:亀田雅之 疑似キーワード相関法による重要キーワードと重要文の抽出、言語処理学会第2回年次大会発表論文集、pp.97〜100 1996等で示されているように、文書中の各文の形態素解析結果から、文書中で用いられている各単語の認識を行い、また、認識された単語の部分的な一致度を利用する等の手段も利用することで、文書中の各単語の頻度情報を計算し、頻度の高いものを順に抽出するという手法が用いられてきた。
【0003】
【発明が解決しようとする課題】
上記のように、文書内容の把握を支援するためには、文書からその内容を示す重要語句を抽出する。しかしながら、上記従来のように、文書中での各単語の頻度情報のみを用いるだけでは、それらの語句間の関係が捉えられておらず、意味的に関係の深いものが別々に示される可能性がある等、文書の内容を把握するためには不十分であった。また、頻度の高いものを示すことだけでその文書の内容を十分に把握できるかどうかについても問題がある。
【0004】
このような点から、文書の内容を十分に把握することのできる情報抽出装置の実現が望まれていた。
【0005】
【課題を解決するための手段】
本発明は、前述の課題を解決するため次の構成を採用する。
〈構成1〉
入力文書に含まれる単語のうち、予め定められた規則に基づき、主題提示語句を抽出する主題情報抽出部と、入力文書に含まれる各単語間の類似度を各単語の入力文書中の出現頻度に基づき計算する単語間類似度解析部と、単語間類似度解析部で計算された単語間類似度情報に基づき、主題情報抽出部において抽出された主題提示語句を構成する単語に対して類似度の高い単語を抽出する重要語句抽出部と、重要語句抽出部で抽出された単語を主題提示語句を構成する単語とリンク付けして表示する出力部とを備えたことを特徴とする情報抽出装置。
【0006】
〈構成2〉
構成1に記載の情報抽出装置において、主題情報抽出部には、文書中の主題提示情報である助詞情報を抽出することで、その助詞の付属している連続する自立語である単語情報のうち、その単語に対して修飾関係にないものを除いた単語情報を抽出することを特徴とする情報抽出装置。
【0007】
〈構成3〉
構成1または2に記載の情報抽出装置において、単語間類似度解析部は、文書中の各文において同一文中に存在する単語対の頻度を計算し、その頻度情報を利用して単語対の一方を中心として他方を要素とすることによって各単語を単語ベクトルとして表現し、各単語ベクトルの値の内積によって文書中の各単語間の類似度を求めるよう構成されていることを特徴とする情報抽出装置。
【0008】
〈構成4〉
構成1〜3のいずれかに記載の情報抽出装置において、出力部は、重要語句抽出部で抽出された単語のうち、予め決められた個数の単語とリンク付けして表示するよう構成されていることを特徴とする情報抽出装置。
【0009】
〈構成5〉
構成1〜3のいずれかに記載の情報抽出装置において、出力部は、重要語句抽出部で抽出された単語のうち、予め設定された類似度の値以上を持つ単語とリンク付けして表示するよう構成されていることを特徴とする情報抽出装置。
【0010】
〈構成6〉
入力文書に含まれる単語のうち、予め定められた規則に基づき、主題提示語句を抽出する主題情報抽出部と、主題提示語句のうち、ユーザからの任意の主題提示語句の選択を受け付ける入力部と、入力文書に含まれる各単語間の類似度を各単語の入力文書中の出現頻度に基づき計算する単語間類似度解析部と、単語間類似度解析部で計算された単語間類似度情報に基づき、主題情報抽出部において抽出された主題提示語句を構成する単語に対して類似度の高い単語を抽出する重要語句抽出部と、入力部でいずれかの主題提示語句が指定された場合、重要語句抽出部が抽出した、主題提示語句を構成する単語に対して類似度の高い単語を表示する出力部とを備えたことを特徴とする情報抽出装置。
【0011】
【発明の実施の形態】
本発明は、文書中の各文中の語句の頻度情報だけでは文書の内容を示すための語句をうまく扱うことが困難であるといった問題を解決するために、文書中において提示されている主題提示表現の言語的機能である文の主題提示機能に着目している。即ち、文中の主題提示された語句である単語情報を中心にし、それと関連のある語句を単語間の類似度を用いて計算し、類似度の高いものから順に取りして、文書中の重要部分である語句を意味的に関連の深いもの同士を示すことにより、文書の内容の把握を容易にしている。
【0012】
また、類似度の高いものを順に取り出された単語情報を用いることで、文書中の重要部分である語句を意味的に関連の深い順番で示すことにより、文書の内容の把握を容易にしている。
【0013】
以下、本発明の実施の形態を具体例を用いて詳細に説明する。
《具体例1》
〈構成〉
図1は本発明の情報抽出装置の具体例1を示す構成図である。
図の装置は、マイクロコンピュータ等からなり、入力部1、形態素解析処理部2、主題情報抽出部3、単語間類似度解析部4、重要語句抽出部5、出力部6を備えている。
【0014】
入力部1は、重要部分の抽出対象となる文書の入力を行う機能部であり、具体的には、ネットワークとのインタフェース、フロッピディスクやCD−ROMといった記録媒体からの読取装置、あるいはキーボード等のユーザインタフェース等からなる。
【0015】
形態素解析処理部2は、入力部1から入力された文書中の各文を既知の手段を用いて単語に分割する処理を行う機能を有している。
【0016】
主題情報抽出部3は、入力された文書中から、予め決められた規則に基づいて、主題として提示された語句の情報を抽出する機能を有している。
【0017】
単語間類似度解析部4は、形態素解析処理部2で形態素解析された単語情報を用い、各単語の入力文中の出現頻度に基づいて文書中の各単語間の類似度を計算する機能を有している。
【0018】
重要語句抽出部5は、計算された単語間類似度情報と抽出された主題提示語句の情報を基にして重要語句を抽出し、主題提示情報と関連のある順である類似度の高い順に並べ替えを行う機能を有している。尚、これら形態素解析処理部2〜重要語句抽出部5は、各機能部に対応したソフトウェアとこれを実行するプロセッサやメモリ等で機能構成されるか、あるいは専用ハードウェアで構成されている。
【0019】
出力部6は、抽出された重要語句の出力を行う機能を有し、具体的には、ディスプレイやプリンタといった出力機器からなる。
【0020】
〈動作〉
先ず、本装置では、入力部1において入力された文書中の各文の単語の認識処理を行う。ここで、単語の認識処理のために用いる形態素解析の手法としては、例えば「田中穂積:自然言語解析の基礎、産業図書(1989)」等においても示されるような方法を用いることが可能である。
【0021】
形態素解析処理部2では入力部1から入力された文書の形態素解析を行う。
図2および図3は、形態素解析結果の説明図である。
図において、各入力文の文番号が順に、s1,s2,s3,s4,s5,s6,s7,s8であり、それぞれの文に対して行った形態素解析処理により各単語が「/」によって区切られ、また、各単語の品詞情報が各単語の右の「()」内に示されている。
【0022】
次に、単語間類似度解析部4では、各文の形態素解析の結果を用いて各文中の単語間の類似度を計算する。類似度の計算は、文書中の各単語の共起頻度として同じ文に二つの単語が同時に存在する頻度を計算し、その共起頻度情報を基にして、ある単語とそれに共起する単語との共起頻度を要素とする単語ベクトルとして表現し、各単語の単語ベクトルの内積によって得ることが可能である。
【0023】
図4は、図2および図3において示された文書中の単語の共起頻度の情報を示す説明図である。
例えば、単語「スクラップ(普通名詞)」と「ディーラー(普通名詞)」は、それぞれ2回、6回文書中に現れ、同時に2回現れている。同様に、その他の単語ともそれぞれの共起頻度を持っている。この情報を基にして、各単語の単語ベクトルを求める。例えば、図4において示された情報においては、単語「スクラップ(普通名詞)」の単語ベクトルv(i)は、それと共起する単語の頻度を要素とすることで、(121112121)と表現される。ベクトルの各要素は、図4にも示されているように、順に、単語「ギロチン(普通名詞)」「ディーラー(普通名詞)」「メーカー(普通名詞)」「ヤード(普通名詞)」「業者(普通名詞)」「材(普通名詞)」「電炉(普通名詞)」「買値(普通名詞)」「母(普通名詞)」との共起頻度である。
【0024】
各単語の間の類似度情報をこれらの単語ベクトルを用いて求める。単語ベクトルvと単語ベクトルvの内積ip(x,y)は次の式によって計算される。
【0025】
ip(x,y)=Σv(i)×v(i)
【0026】
ここで、Σは、v(i)×v(i)において、i=1〜nまでの合計を表しており、nは単語数を示している。
【0027】
例えば、v,vの一例として、単語「スクラップ(普通名詞)」と単語「ディーラー(普通名詞)」とを考える。
【0028】
図5は、単語「ディーラー(普通名詞)」と共起している単語を示す説明図である。尚、この図では図4に示すような単語1の頻度と単語2の頻度は省略している。
【0029】
図5に示すように、単語「ディーラー(普通名詞)」の単語ベクトルは、単語「ディーラー(普通名詞)」が共起している単語とその頻度が普通名詞についてのみでは、「ギロチン(普通名詞)」が1、「コスト(普通名詞)」が1、「スクラップ(普通名詞)」が1、「メーカー(普通名詞)」が1、「ヤード(普通名詞)」が1、「圧力(普通名詞)」が1、「一策(普通名詞)」が1、「窮余(普通名詞)」が1、「業者(普通名詞)」が1、「採算(普通名詞)」が1、「材(普通名詞)」が2、「電炉(普通名詞)」が1、「買値(普通名詞)」が3、「拍車(普通名詞)」が1、「母(普通名詞)」が1、「末端(普通名詞)」が1、「目先(普通名詞)」が1である。
【0030】
ここで、単語「スクラップ(普通名詞)」と共に共起しているもので、品詞が普通名詞についてのみでは、「ギロチン(普通名詞)」、「メーカー(普通名詞)」、「ヤード(普通名詞)」、「業者(普通名詞)」、「材(普通名詞)」、「電炉(普通名詞)」、「買値(普通名詞)」、「母(普通名詞)」である(図中、※で示す)。ここで、単語「スクラップ(普通名詞)」と共通する単語のみについての単語ベクトルは、(101112131)と表現される。
【0031】
従って、単語「スクラップ(普通名詞)」と単語「ディーラー(普通名詞)」の各単語ベクトルの内積は、1×1+2×0+1×1+1×1+1×1+2×2+1×1+2×3+1×1の16となり、類似度は16であると計算される。
【0032】
次に、文書中で主題として提示されている主題提示語句の抽出を行う。日本語においては、主題が副助詞の「は」を用いることで提示されることから、主題として提示される語句は「は(副助詞)」の付属する連続した自立語として抽出することが可能である。
【0033】
但し、主題提示語に対して修飾される用言は除くものとする。例えば、文s7中の「苦しむ(動詞)」「電炉(普通名詞)」「メーカー(普通名詞)」「各社(普通名詞)」「は(副助詞)」における「苦しむ(動詞)」は除外される用言である。
【0034】
図2および図3において示された文書において抽出される主題提示語句は、文s3については、「ヤード(普通名詞)/ディーラー(普通名詞)/は(副助詞)/」、「ヤード(普通名詞)/ディーラー(普通名詞)/買値(普通名詞)/は(副助詞)/」、文s6については、「輸送(サ変名詞)/コスト(普通名詞)/は(副助詞)/」、文s7については、「電炉(普通名詞)/メーカー(普通名詞)/各社(普通名詞)は(副助詞)/」、文s8については、「仕入れ(動詞)/値(普通名詞)/引き下げ(サ変名詞)/は(副助詞)/」がある。
【0035】
以上のようにして抽出された各主題提示語句について、主題提示語句中の各単語と共に高い類似度を持つ単語を抽出する。
【0036】
図6は、主題提示語句「ヤード(普通名詞)/ディーラー(普通名詞)/は(副助詞)/」の単語「ヤード(普通名詞)」と単語「ディーラー(普通名詞)」のそれぞれと類似度の高い単語情報を示す説明図である。
【0037】
例えば、単語「末端(普通名詞)」は、単語「ヤード(普通名詞)」「ディーラー(普通名詞)」の両方と類似度129をとる。また、例えば、「業者(普通名詞)」は、単語「ヤード(普通名詞)」「ディーラー(普通名詞)」とそれぞれ類似度115、118をとる。
【0038】
このようにして、主題提示語句中の各単語と同時に高い類似度をとるものを抽出することで、主題提示語句と関連の高い単語を抽出することが可能である。主題提示語句「ヤード(普通名詞)/ディーラー(普通名詞)/は(副助詞)/」の場合、例えば、類似度の高い上位10個を抽出することで、「ヤード/ディーラー」と類似度の高いものとして、図6の類似度情報から「末端(普通名詞)」「業者(普通名詞)」「棒鋼(普通名詞)」「市況(普通名詞)」「鋼材(普通名詞)」「量(普通名詞)」「法定(普通名詞)」「道交法(普通名詞)」「道(普通名詞)」を抽出することが可能である。
【0039】
同様の手法を用いることで、次の主題提示語句である「輸送(サ変名詞)/コスト(普通名詞)/は(副助詞)/」の構成単語である「輸送(サ変名詞)」「コスト(普通名詞)」についてもそれぞれの単語と類似度の高いものとして、「末端(普通名詞)」「スクラップ(普通名詞)」「業者(普通名詞)」「棒鋼(普通名詞)」「市況(普通名詞)」「鋼材(普通名詞)」「増(普通名詞)」「売値(普通名詞)」「原料(普通名詞)」「量(普通名詞)」「法定(普通名詞)」「法(普通名詞)」「道路(普通名詞)」「道交法(普通名詞)」「母(普通名詞)」「材(普通名詞)」「半面(普通名詞)」「鉄(普通名詞)」「先(普通名詞)」がこの順で抽出される。更に、残りの主題提示語句についても同様に抽出される。
【0040】
最後に、各主題提示語句から抽出された類似語句を表示する。
図7は、表示の一例を示す説明図である。
図示のように、各主題提示語句と共通の類似語句を持つものは、その共通の類似語句からリンクを張る。また、共通の類似語句がないものについては、それを単独で表示する。
【0041】
例えば、図7においては、単語「末端(普通名詞)」は主題提示語句「ヤード(普通名詞)/ディーラー(普通名詞)/は(副助詞)/」と「輸送(サ変名詞)/コスト(普通名詞)/は(副助詞)」の両方から類似語句として抽出されたものである。また、単語「スクラップ(普通名詞)」は、主題提示語句「輸送(サ変名詞)/コスト(普通名詞)/は(副助詞)/」から類似語句として抽出されたものである。
【0042】
〈効果〉
以上のように、具体例1によれば、文書中の各文の形態素解析された結果から単語の認識処理を行い、文中の主題提示された語句である単語情報を中心にし、それと関連のある語句を単語間の類似度を用いて計算し、主題提示された語句の構成要素である各単語と類似度の高い単語を文書から順に取り出し、主題提示された語句と類似度の高いもののうちいくつかを主題提示された語句の構成要素である各単語とリンク付けして表示するようにしたので、文書中の重要部分である語句を意味的に関連の深いもの同士を示すことができ、文書の内容の把握を容易に行うことができる。
【0043】
《具体例2》
具体例2は、ユーザにより、主題提示語句の選択ができるようにし、選択された場合は、その主題提示語句に対応した重要語句を表示するようにしたものである。
【0044】
〈構成〉
図面上の構成は具体例1と同様であるため、図1を援用して説明する。具体例2では、入力部1において、ユーザからの主題提示語句の指定を受け付け、この指定された主題提示語句の情報を出力するよう構成されている。また、出力部6は、入力部1でいずれかの主題提示語句が指定された場合、重要語句抽出部5が抽出した、主題提示語句を構成する単語に対して類似度の高い単語を表示するよう構成されている。これ以外の構成は具体例1と同様であるため、ここでの説明は省略する。
【0045】
〈動作〉
入力部1から入力された文書に対する形態素解析処理部2、主題情報抽出部3、単語間類似度解析部4、重要語句抽出部5および出力部6の処理は、具体例1と同様であるため、ここでの説明は省略する。
【0046】
図8は、出力部6の表示画面の説明図である。
図示のように、入力された文書が表示され、この文書中に主題情報抽出部3で抽出された主題部分が下線によって示されている。
【0047】
次に、入力部1において、例えば、図8中に示されている主題提示語句のうち、「ヤードディーラーは」が選択されたとする。そして、「ヤードディーラーは」の構成要素である「ヤード」と「ディーラー」のそれぞれについて重要語句抽出部5において予め計算された結果によって抽出された重要語句として、「末端(普通名詞)」「業者(普通名詞)」「棒鋼(普通名詞)」「市況(普通名詞)」「鋼材(普通名詞)」「量(普通名詞)」「法定(普通名詞)」「道交法(普通名詞)」「法(普通名詞)」「道路(普通名詞)」の語句がこの順で得られていた場合、この順で、例えば「末端」の部分を主題提示語句として同様に下線を引くなどの表示方法でユーザに示すことが可能である。
【0048】
図9は、ユーザによって選択された主題提示語句に対応した重要語句が表示された場合の説明図である。
図示例では、図8で示された文書の中で、「末端」「業者」「棒鋼」「市況」「鋼材」に対して下線が付与され表示された場合を示している。そして、新たに下線を引かれた単語についても主題提示語句の構成単語と同様にユーザによって選択対象の語句として扱うことも可能である。
【0049】
〈効果〉
以上のように、具体例2によれば、具体例1の構成に加えて、ユーザによる主題提示語句の指定を可能とし、かつ、指定された主題提示語句に対応した重要語句を表示するようにしたので、具体例1の効果に加えて、ユーザが求める情報をより的確に表示することが可能である。
【0050】
尚、上記具体例1、2では、重要語句抽出部5で類似度の高い上位10個の単語情報を抽出し、これを出力部6で表示するようにしたが、10個に限定されるものではない。また、情報抽出としての信頼度を重視する場合、上位10個といった個数ではなく、類似度がある値以上の単語情報を表示するよう構成してもよい。
【0051】
更に、上記具体例2では、主題提示語句や重要語句に対して下線を引くことによって識別するようにしたが、この表示に限定されるものではなく、例えば表示色を変える等であってもよい。
【図面の簡単な説明】
【図1】本発明の情報抽出装置の具体例1を示す構成図である。
【図2】本発明の情報抽出装置の具体例1における形態素解析結果の説明図(その1)である。
【図3】本発明の情報抽出装置の具体例1における形態素解析結果の説明図(その2)である。
【図4】文書中の単語の共起頻度の情報を示す説明図である。
【図5】単語「ディーラー(普通名詞)」と共起している単語を示す説明図である。
【図6】主題提示語句を構成する単語と類似度の高い単語情報を示す説明図である。
【図7】本発明の情報抽出装置の具体例1における表示の一例を示す説明図である。
【図8】本発明の情報抽出装置の具体例2における表示画面の説明図である。
【図9】ユーザによって選択された主題提示語句に対応した重要語句が表示された場合の説明図である。
【符号の説明】
1 入力部
2 形態素解析処理部
3 主題情報抽出部
4 単語間類似度解析部
5 重要語句抽出部
6 出力部

Claims (6)

  1. 入力文書に含まれる単語のうち、予め定められた規則に基づき、主題提示語句を抽出する主題情報抽出部と、
    前記入力文書に含まれる各単語間の類似度を各単語の入力文書中の出現頻度に基づき計算する単語間類似度解析部と、
    前記単語間類似度解析部で計算された単語間類似度情報に基づき、前記主題情報抽出部において抽出された主題提示語句を構成する単語に対して類似度の高い単語を抽出する重要語句抽出部と、
    前記重要語句抽出部で抽出された単語を前記主題提示語句を構成する単語とリンク付けして表示する出力部とを備えたことを特徴とする情報抽出装置。
  2. 請求項1に記載の情報抽出装置において、
    主題情報抽出部には、文書中の主題提示情報である助詞情報を抽出することで、その助詞の付属している連続する自立語である単語情報のうち、その単語に対して修飾関係にないものを除いた単語情報を抽出することを特徴とする情報抽出装置。
  3. 請求項1または2に記載の情報抽出装置において、
    単語間類似度解析部は、文書中の各文において同一文中に存在する単語対の頻度を計算し、その頻度情報を利用して単語対の一方を中心として他方を要素とすることによって各単語を単語ベクトルとして表現し、各単語ベクトルの値の内積によって文書中の各単語間の類似度を求めるよう構成されていることを特徴とする情報抽出装置。
  4. 請求項1〜3のいずれかに記載の情報抽出装置において、
    出力部は、重要語句抽出部で抽出された単語のうち、予め決められた個数の単語とリンク付けして表示するよう構成されていることを特徴とする情報抽出装置。
  5. 請求項1〜3のいずれかに記載の情報抽出装置において、
    出力部は、重要語句抽出部で抽出された単語のうち、予め設定された類似度の値以上を持つ単語とリンク付けして表示するよう構成されていることを特徴とする情報抽出装置。
  6. 入力文書に含まれる単語のうち、予め定められた規則に基づき、主題提示語句を抽出する主題情報抽出部と、
    前記主題提示語句のうち、ユーザからの任意の主題提示語句の選択を受け付ける入力部と、
    前記入力文書に含まれる各単語間の類似度を各単語の入力文書中の出現頻度に基づき計算する単語間類似度解析部と、
    前記単語間類似度解析部で計算された単語間類似度情報に基づき、前記主題情報抽出部において抽出された主題提示語句を構成する単語に対して類似度の高い単語を抽出する重要語句抽出部と、
    前記入力部でいずれかの主題提示語句が指定された場合、前記重要語句抽出部が抽出した、当該主題提示語句を構成する単語に対して類似度の高い単語を表示する出力部とを備えたことを特徴とする情報抽出装置。
JP10599099A 1999-04-14 1999-04-14 情報抽出装置 Expired - Lifetime JP3707044B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10599099A JP3707044B2 (ja) 1999-04-14 1999-04-14 情報抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10599099A JP3707044B2 (ja) 1999-04-14 1999-04-14 情報抽出装置

Publications (2)

Publication Number Publication Date
JP2000298673A JP2000298673A (ja) 2000-10-24
JP3707044B2 true JP3707044B2 (ja) 2005-10-19

Family

ID=14422177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10599099A Expired - Lifetime JP3707044B2 (ja) 1999-04-14 1999-04-14 情報抽出装置

Country Status (1)

Country Link
JP (1) JP3707044B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5530393B2 (ja) * 2011-04-11 2014-06-25 日本電信電話株式会社 文書要約装置、文書要約方法、及びプログラム
JP6230190B2 (ja) * 2014-01-09 2017-11-15 日本放送協会 重要語抽出装置、及びプログラム
WO2021084631A1 (ja) * 2019-10-29 2021-05-06 日本電信電話株式会社 情報処理装置、抽出方法および抽出プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2572314B2 (ja) * 1991-05-31 1997-01-16 株式会社テレマティーク国際研究所 キーワード抽出装置
JPH10254883A (ja) * 1997-03-10 1998-09-25 Mitsubishi Electric Corp 文書自動分類方法

Also Published As

Publication number Publication date
JP2000298673A (ja) 2000-10-24

Similar Documents

Publication Publication Date Title
Shwartz et al. Still a pain in the neck: Evaluating text representations on lexical composition
CN107491531A (zh) 基于集成学习框架的中文网络评论情感分类方法
JP4576397B2 (ja) 評価情報抽出装置、評価情報抽出方法およびそのプログラム
CN108885617B (zh) 语句解析系统以及程序
JP2003157254A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP3707044B2 (ja) 情報抽出装置
JP3402599B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP3955522B2 (ja) データ分析装置及び方法、並びにプログラム
JP4361299B2 (ja) 評価表現抽出装置、プログラム、及び記憶媒体
John et al. Topic modeling to extract information from nutraceutical product reviews
JPH1078969A (ja) 情報検索装置
JP2008204133A (ja) 回答検索装置及びコンピュータプログラム
Porntrakoon et al. Text summarization for Thai food reviews using simplified sentiment analysis
JP4342235B2 (ja) アンケート分析装置およびアンケート分析プログラム
Lee Use-centric mining of customer reviews
JP3764058B2 (ja) 翻訳装置、翻訳方法及び翻訳プログラム
JP3402598B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JPH0619968A (ja) 専門用語自動抽出装置
JP2885489B2 (ja) 文書内容検索装置
JP2008204010A (ja) 質問内容抽出装置と質問内容抽出方法
Nelli Textual Data Analysis with NLTK
Alasmary Comparing lexical bundles across three advanced mathematical text types: a corpus-based genre-focused investigation
JP2000137718A (ja) 単語の類似性判別方法および単語の類似性判別プログラムを記録した記録媒体
JP3013388B2 (ja) 言語情報検索装置
JP4088176B2 (ja) 質問応答装置及び質問応答プログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050722

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090812

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090812

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100812

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100812

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110812

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120812

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130812

Year of fee payment: 8

EXPY Cancellation because of completion of term