JP2003157271A - テキストマイニング装置および方法 - Google Patents

テキストマイニング装置および方法

Info

Publication number
JP2003157271A
JP2003157271A JP2001355150A JP2001355150A JP2003157271A JP 2003157271 A JP2003157271 A JP 2003157271A JP 2001355150 A JP2001355150 A JP 2001355150A JP 2001355150 A JP2001355150 A JP 2001355150A JP 2003157271 A JP2003157271 A JP 2003157271A
Authority
JP
Japan
Prior art keywords
expression
extraction
unit
result
related expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001355150A
Other languages
English (en)
Inventor
Akito Nagai
明人 永井
Yasuhiro Takayama
泰博 高山
Katsushi Suzuki
克志 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001355150A priority Critical patent/JP2003157271A/ja
Publication of JP2003157271A publication Critical patent/JP2003157271A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 Webページも含めて分析対象にできるよう
な汎用性を有するテキストマイニング装置および方法を
得る。 【解決手段】 特徴表現抽出規則記憶部1と、意図抽出
表現を含む第1の記述単位を抽出して特徴表現抽出結果
とし、抽出意図とともに出力する特徴表現抽出部2と、
第1の記述単位毎の関係名と関係表現とを対応付ける関
連表現抽出規則記憶部3と、特徴表現抽出結果から第2
の記述単位を抽出して関連表現抽出結果とし、関係名と
ともに出力する関連表現抽出部4と、特徴表現と関連表
現とを第1の記述単位毎の関係に基づいて統合する関連
表現統合知識記憶部5と、関連表現統合結果を出力する
関連表現統合部5と、関連表現統合結果を抽出意図の内
容に応じて分類する分類部7とを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、入力される文書
中のテキストを解析して特徴的な表現を抽出するテキス
トマイニング装置および方法に関し、特に、抽出された
表現と関係を持つ関連表現をさらに抽出して関係付ける
ことのできるテキストマイニング装置および方法に関す
るものである。
【0002】
【従来の技術】近年、インタネット上のWebページや
電子メール、または蓄積されたテキストデータなどの電
子化文書は、非常な勢いで増加しており、人手で全文書
の内容を読んで調査することは、最早、不可能になって
きている。
【0003】そこで、これらの大量の文書から必要な情
報を検索して、内容に応じて分類したり、業務上の分析
に役立つ情報を抽出するという技術が、ますます要求さ
れつつある。
【0004】従来より、上記要求に応える装置として、
たとえば特開2001−101199号公報(以下、
「文献1」という)に記載された「文書処理装置」、ま
たは、特開2001−147937号公報(以下、「文
献2」という)に記載された「業務支援システム」など
が提案されている。
【0005】文献1においては、製品のサポート窓口に
送られてきたユーザの電子メールを分析の対象としてお
り、製品の不具合を指摘する電子メールの内容を形態素
解析し、形態素を概念に結び付けるための概念分類体系
(シソーラス)を用いて、形態素間の係り受け関係に基
づいて、概念間の関係を抽出している。
【0006】また、文献2においては、営業報告書を分
析の対象としており、製品の売れ行き情報に関する概念
と表現を定義した概念定義辞書を用いて、営業報告内容
から概念を抽出し、接続表現と概念関係との対応を定義
した接続関係定義辞書を用いて概念間の関係を抽出して
いる。
【0007】また、文献2に関連した特開2001−1
84351号公報(以下、「文献3」という)に記載さ
れた「文書情報抽出装置および文書分類装置」において
は、文献2で用いられる概念定義辞書のメンテナンスを
容易にするために、辞書登録すべき候補の一覧を提示す
るための技術が開示されている。
【0008】また、特開2000−357170号公報
(以下、「文献4」という)に記載された「文書の参照
理由を用いて情報検索を行う装置」)においては、技術
論文のように、文献間に「参照/被参照関係」が存在す
る場合に、参照理由を同定して、参照理由を用いて文書
を検索する装置が開示されている。
【0009】さらに、立石健二、石黒義英および福島俊
一による情報処理学会研究会資料の「インターネットか
らの評判情報検索」(自然言語処理144−11、第7
5〜82頁、2001年7月16日)(以下、「文献
5」という)においては、インターネットのWebペー
ジから商品の評価表現を抽出する技術が開示されてい
る。
【0010】図10は上記文献5に記載されたシステム
構成を示すブロック構成図である。図10において、1
0は商品カテゴリに対応した単語を指定する評価表現辞
書、11はクローラ12および索引ファイル13を有す
るWebページ収集部である。
【0011】14は商品名を入力情報とする意見収集部
であり、評価表現辞書10およびWebページ収集部1
1に関連した近接演算処理部15と、近接演算処理部1
5の出力側に挿入された適正値判定処理部16とを有す
る。
【0012】17は意見収集部14の出力情報を分析す
る分類・分析部であり、肯定・否定分類処理部18を有
する。分類・分析部17による処理情報は、検索結果と
して出力される。
【0013】図10に示した従来システムにおいて、評
価表現辞書10およびWebページ収集部11に関連し
た意見収集部14と分類・分析部17とによる評価表現
の抽出動作は、以下のようになる。
【0014】まず、意見収集部14内の近接演算処理部
15は、Webページ収集部11に商品名を入力し、索
引ファイル13により得られたインターネット全文検索
結果から、別途指定された商品カテゴリに対応する評価
表現辞書10を用いて、評価表現の単語を含む文章を抽
出する。
【0015】たとえば、商品名が「モバイルギア」であ
って、商品カテゴリが「コンピュータ」であった場合、
評価表現辞書10に記憶された「速い」、「重い」、
「壊れやす」などの単語や、「好き」、「いい」、「勧
め」などの単語を含む文章が、全文検索結果から抽出さ
れる。
【0016】次に、分類・分析部17内の肯定・否定分
類処理部18は、意見収集部14により抽出された文章
に対して、肯定/否定の分類を行い、商品名に対する評
価表現の検索結果として出力する。
【0017】
【発明が解決しようとする課題】従来のテキストマイニ
ング装置および方法は以上のように、文献1および文献
2に記載された装置および方法によれば、業務内容に関
する概念およびシソーラスを業務内容や製品毎に構築す
る必要があることから、シソーラスの構築に非常に手間
がかかるので、適用する業務内容の変更を容易に行うこ
とができないという問題点があった。
【0018】また、上記文献1および文献2の装置およ
び方法では、広範囲な概念を含み、且つ新規の概念や新
語も発生するWebページのような文書内容に対して
は、あらかじめ概念を定義することができないので、適
用することができないという問題点があった。
【0019】また、文献2に記載された装置および方法
によれば、概念間の関係を抽出する処理において、関係
を表わす表現(「そこで」、「しかし」など)を文書中
より抽出し、これらの表現に対応付けられた関係IDを
同定した後に、関係IDの前後に最も近接する概念を関
係付けており、概念の関係を隣接する二項関係として扱
っているので、抽出すべき概念間の関係を取りこぼして
しまうという問題点があった。
【0020】たとえば、上記文献2の装置および方法で
は、「商品Aは売れている。サンプルを配布したため。
しかし、値段が高いという不満がある。」という文書の
場合、「値段が高い」という概念は、商品Aに関する
「売れ行きが良い」という概念に対して逆接に関係付け
られるべきであるが、最も隣接する「サンプルを配布し
たため。」に関係付けられてしまうという問題点があっ
た。
【0021】また、文献3に記載された装置および方法
によれば、辞書登録の候補を提示することにより辞書の
メンテナンスの容易化を図っているものの、登録の候補
は、概念に対応付けられる表現であって、概念自体が固
定の定義となっているので、あらかじめ定義した概念の
範囲内における辞書メンテナンスのみに限定されるとい
う問題点があった。
【0022】また、文献4に記載された装置および方法
によれば、参照理由の同定に用いてされる「参照特徴−
参照理由対応表」において、参照特徴として本文の記述
表現そのものを用いているので、参照理由を表わす表現
を全て定義する必要があり、語彙、構文、時制などのバ
リエーションを考慮すると、参照特徴(定義すべき表
現)の数が組合わせ爆発を生じてしまい現実的ではない
うえ、参照特徴を抽出する手段(言語解析部)に関して
具体的な実現方法の記載がなく、実現性に乏しいという
問題点があった。
【0023】さらに、文献5に記載された装置および方
法によれば、抽出対象が評価表現(意見)のみであり、
その根拠や理由および原因などの有益な情報が文書中に
存在しても抽出することができないという問題点があっ
た。
【0024】この発明は上記のような問題点を解決する
ためになされたもので、概念やシソーラスを用いずに表
層的な表現に着目して表現抽出を行うことにより、We
bページも含めて分析対象にできるような汎用性を有す
るテキストマイニング装置および方法を得ることを目的
とする。
【0025】また、この発明は、抽出対象となる表現A
(意見、クレーム、障害報告など)に加えて、抽出した
表現Aと関係(根拠や理由、原因、例示など)を有する
表現Bを抽出して、表現A、Bを関連付けて提示するこ
とにより、有益な情報の発見や、それらの関係の分析を
支援することのできるテキストマイニング装置および方
法を得ることを目的とする。
【0026】
【課題を解決するための手段】この発明に係るテキスト
マイニング装置は、入力文書に関して、抽出意図と意図
抽出表現とを対応付けるための特徴表現抽出規則を記憶
する特徴表現抽出規則記憶部と、入力文書から、意図抽
出表現を含む第1の記述単位を抽出して特徴表現とし、
特徴表現を含む解析結果を特徴表現抽出結果として、抽
出意図とともに出力する特徴表現抽出部と、第1の記述
単位毎の関係に関し、関係名と関係を表わす関係表現と
を対応付けるための関連表現抽出規則を記憶する関連表
現抽出規則記憶部と、特徴表現抽出結果から、関係表現
を含む第2の記述単位を抽出して関連表現とし、関連表
現を含む解析結果を関連表現抽出結果として、関係名と
ともに出力する関連表現抽出部と、特徴表現と関連表現
とを第1の記述単位毎の関係に基づいて統合するための
関連表現統合知識を記憶する関連表現統合知識記憶部
と、関連表現統合知識を参照して特徴表現と関連表現と
を統合し、関連表現統合結果として出力する関連表現統
合部と、関連表現統合結果を抽出意図の内容に応じて分
類する分類部とを備えたものである。
【0027】また、この発明に係るテキストマイニング
装置の特徴表現抽出部は、入力文書を分割して文集合と
し、意図抽出表現の抽出対象となる第1の記述単位を文
とするものである。
【0028】また、この発明に係るテキストマイニング
装置の特徴表現抽出部は、入力文書における各記述の位
置情報を参照し、一定範囲の位置に存在する記述を抽出
対象とするものである。
【0029】また、この発明に係るテキストマイニング
装置の特徴表現抽出部は、文書の構造情報により入力文
書を分割してサブ文書集合とし、サブ文書集合内の各サ
ブ文書毎に特徴表現抽出結果を得るものである。
【0030】また、この発明に係るテキストマイニング
装置の特徴表現抽出部は、文書の構造情報を参照して、
サブ文書集合の中から、抽出対象とするサブ文書を選択
するものである。
【0031】また、この発明に係るテキストマイニング
装置は、分析の目的とする対象名に関する情報を記憶す
る対象名辞書と、対象名を含む第3の記述単位を抽出
し、対象名とともに出力する対象名抽出部とを備え、関
連表現統合部は、統合対象となる第1の記述単位である
特徴表現抽出結果と関連表現抽出結果との中から、対象
名が抽出された第3の記述単位に対象名を付与して出力
し、分類部は、対象名毎に分類して提示するものであ
る。
【0032】また、この発明に係るテキストマイニング
装置の関連表現統合部は、特徴表現抽出結果と関連表現
抽出結果との統合判定に際して、対象名を利用するもの
である。
【0033】また、この発明に係るテキストマイニング
装置の分類部は、関連表現統合部により得られた関連表
現統合結果を事例として、事例のクラスタリングを行
い、問題解決木を構成して出力するものである。
【0034】また、この発明に係るテキストマイニング
方法は、入力文書に関して、抽出意図と意図抽出表現と
を対応付けるための特徴表現抽出規則を記憶する特徴表
現抽出規則記憶ステップと、入力文書から、意図抽出表
現を含む第1の記述単位を抽出して特徴表現とし、特徴
表現を含む解析結果を特徴表現抽出結果として、抽出意
図とともに出力する特徴表現抽出ステップと、第1の記
述単位毎の関係に関し、関係名と関係を表わす関係表現
とを対応付けるための関連表現抽出規則を記憶する関連
表現抽出規則記憶ステップと、特徴表現抽出結果から、
関係表現を含む第2の記述単位を抽出して関連表現と
し、関連表現を含む解析結果を関連表現抽出結果とし
て、関係名とともに出力する関連表現抽出ステップと、
特徴表現と関連表現とを第1の記述単位毎の関係に基づ
いて統合するための関連表現統合知識を記憶する関連表
現統合知識記憶ステップと、関連表現統合知識を参照し
て特徴表現と関連表現とを統合し、関連表現統合結果と
して出力する関連表現統合ステップと、関連表現統合結
果を抽出意図の内容に応じて分類する分類ステップとを
備えたものである。
【0035】また、この発明に係るテキストマイニング
方法の特徴表現抽出ステップは、入力文書を分割して文
集合とし、意図抽出表現の抽出対象となる第1の記述単
位を文とするものである。
【0036】また、この発明に係るテキストマイニング
方法の特徴表現抽出ステップは、入力文書における各記
述の位置情報を参照し、一定範囲の位置に存在する記述
を抽出対象とするものである。
【0037】また、この発明に係るテキストマイニング
方法の特徴表現抽出ステップは、文書の構造情報により
入力文書を分割してサブ文書集合とし、サブ文書集合内
の各サブ文書毎に特徴表現抽出結果を得るものである。
【0038】また、この発明に係るテキストマイニング
方法の特徴表現抽出ステップは、文書の構造情報を参照
して、サブ文書集合の中から、抽出対象とするサブ文書
を選択するものである。
【0039】また、この発明に係るテキストマイニング
方法は、分析の目的とする対象名に関する情報を記憶す
る対象名辞書から、対象名を含む第3の記述単位を抽出
し、対象名とともに出力する対象名抽出ステップを備
え、関連表現統合ステップは、統合対象となる第1の記
述単位である特徴表現抽出結果と関連表現抽出結果との
中から、対象名が抽出された第3の記述単位に対象名を
付与して出力し、分類ステップは、対象名毎に分類して
提示するものである。
【0040】また、この発明に係るテキストマイニング
方法の関連表現統合ステップは、特徴表現抽出結果と関
連表現抽出結果との統合判定に際して、対象名を利用す
るものである。
【0041】また、この発明に係るテキストマイニング
方法の分類ステップは、関連表現統合ステップにより得
られた関連表現統合結果を事例として、事例のクラスタ
リングを行い、問題解決木を構成して出力するものであ
る。
【0042】
【発明の実施の形態】実施の形態1.以下、図面を参照
しながら、この発明の実施の形態1について詳細に説明
する。図1はこの発明の実施の形態1によるテキストマ
イニング装置を示すブロック構成図である。
【0043】図1において、1は特徴表現抽出規則記憶
部であり、入力文書に関して、抽出意図と意図抽出表現
とを対応付けるための特徴表現抽出規則を記憶する。2
は特徴表現抽出規則記憶部1と関連した特徴表現抽出部
であり、取り込まれた入力文書から、意図抽出表現を含
む第1の記述単位を抽出して特徴表現とし、特徴表現を
含む解析結果を特徴表現抽出結果として抽出意図ととも
に出力する。
【0044】3は関連表現抽出規則記憶部であり、第1
の記述単位毎の関係に関し、関係名と関係を表わす関係
表現とを対応付けるための関連表現抽出規則を記憶す
る。4は関連表現抽出規則記憶部3と関連した関連表現
抽出部であり、特徴表現抽出結果から関係表現を含む第
2の記述単位を抽出して関連表現とし、関連表現を含む
解析結果を関連表現抽出結果として関係名とともに出力
する。
【0045】5は関連表現統合知識記憶部であり、関連
表現抽出部4から取得される特徴表現と関連表現とを、
第1の記述単位毎の関係に基づいて統合するための関連
表現統合知識を記憶する。
【0046】6は関連表現統合知識記憶部5と関連した
関連表現統合部であり、関連表現統合知識を参照して特
徴表現と関連表現とを統合し、関連表現統合結果として
出力する。7は関連表現統合結果を内容に応じて分類す
る分類部である。
【0047】次に、図2のフローチャートおよび図3〜
図8の説明図を参照しながら、図1に示したこの発明の
実施の形態1により実行されるテキストマイニング処理
動作について説明する。
【0048】図2において、まず、特徴表現抽出部2に
入力文書が取り込まれる(ステップS201)。なお、
入力文書は、たとえば、インターネット上に存在するW
ebページや、電子メール、記憶装置や記憶媒体に記録
された文書ファイルのデータなどであり、電子化された
テキストであれば何でもよい。
【0049】続いて、特徴表現抽出部2は、入力文書か
ら記述単位Uが取得可能か否かを判定し(ステップS2
02)、記述単位Uが取得可能(すなわち、YES)と
判定されれば、後述の判定ステップS203に進み、記
述単位Uが取得不可能(すなわち、NO)と判定されれ
ば、後述のステップS206に進む。
【0050】なお、記述単位Uは、入力文書中のテキス
トの一部(または、全て)であってもよく、特徴表現抽
出部2は、たとえば、句点、疑問符、改行などの字句情
報から一文単位を切り出して記述単位Uとするか、また
は、入力文書中の単語の位置情報を参照し、一定範囲の
位置に存在する記述を切り出して記述単位Uとする。
【0051】または、特徴表現抽出部2は、HTML文
書のような構造を持った文書に対してタグ情報を参照
し、たとえばインターネットの掲示板であれば、個別の
記事毎に入力文書を分割してサブ文書とする。
【0052】さらに、特徴表現抽出部2は、タグ情報を
参照して、テキスト情報が含まれている記述を選択して
記述単位Uとする。こうして切り出された記述単位U
は、一時的なバッファTに格納される。
【0053】ステップS202において、記述単位Uが
取得可能(すなわち、YES)と判定された場合、特徴
表現抽出部2は、取得した記述単位Uに対して、特徴表
現抽出規則記憶部1に記憶された抽出意図と意図抽出表
現とを参照し、記述単位Uに意図抽出表現が含まれてい
るか否かを判定する(ステップS203)。
【0054】記述単位Uに意図抽出表現が含まれている
(すなわち、YES)と判定されれば、後述のステップ
S204に進み、記述単位Uに意図抽出表現が含まれて
いない(すなわち、NO)と判定されれば、ステップS
202に戻る。
【0055】たとえば、抽出意図が「クレーム」、「要
望」、「賞賛」の場合、特徴表現抽出規則記憶部1内の
規則は、図3のように定義される。図3において、特徴
表現抽出規則は、各抽出意図毎の意図抽出表現として対
応付けられ、記述単位U内の単語の共起パターンが、
「1.0」、「0.8」などの重み付きで表現された形
式で表される。
【0056】ステップS203において、意図抽出表現
が記述単位Uに含まれる(すなわち、YES)と判定さ
れた場合、この記述単位Uを特徴表現として抽出し、抽
出された記述単位Uに抽出意図のラベルを付与する(ス
テップS204)。また、記述単位Uを特徴表現リスト
に追加して(ステップS205)、ステップS202に
戻る。
【0057】特徴表現リストは、たとえば、図4に示す
ような情報を持つリストである。図4において、「A社
のサポート受付は対応が悪い」など特徴表現に対して、
「クレーム」などの抽出意図、および、「21−36
(文字)」などの「開始−終了」の位置が対応付けら
れ、さらに、「1.0」などの重みが付けられる。
【0058】上記特徴表現リストの作成処理(ステップ
S202〜S205)は、記述単位Uが取得できる限
り、繰り返し実行される。その後、取得すべき記述単位
Uが存在しなくなった(ステップS202でNOと判定
された)時点で、特徴表現抽出部2は、特徴表現リスト
の作成処理を終了し、特徴表現リスト(図4参照)と、
一時的なバッファTに格納されている記述単位群(たと
えば、図5参照)とを、関連表現抽出部4に出力する。
【0059】これにより、関連表現抽出部4は、上記処
理ステップS202〜S205で得られた特徴表現リス
トを読み込み(ステップS206)、各特徴表現に関し
て、以下の処理を実行する。
【0060】まず、特徴表現リストが空か否かを判定し
(ステップS207)、特徴表現リストが空である(す
なわち、YES)と判定されれば、後述のステップS2
12に進む。
【0061】また、特徴表現リストが空でない(すなわ
ち、NO)と判定されれば、関連表現抽出部4は、特徴
表現の位置情報を参照し、一時的なバッファTに格納さ
れている記述単位群の中から、特徴表現から一定範囲に
存在する記述単位Rを取得する(ステップS208)。
【0062】たとえば、図5に示すような記述単位群の
場合、番号「1」の記述単位が抽出意図「賞賛」の特徴
表現として抽出されているものとする。また、一定範囲
としては、特徴表現の終了位置から後方「80文字」の
範囲が設定されているものとする。
【0063】図5に示した記述単位群の場合、番号
「1」の記述単位に関する位置情報(開始−終了)を参
照すると「1−26」であり、一定範囲「80文字」内
に存在する記述単位Rは、番号「2」〜「4」となる。
【0064】次に、取得された記述単位Rに対して、関
連表現抽出部4は、関連情報抽出規則記憶部3に記憶さ
れた「関係名」と「関係を表わす関係表現」とを参照
し、記述単位Rに関係表現が含まれているか否かを判定
する(ステップS209)。
【0065】ステップS209において、記述単位Rに
関係表現が含まれている(すなわち、YES)と判定さ
れれば、後述のステップS210に進み、記述単位Rに
関係表現が含まれていない(すなわち、NO)と判定さ
れれば、ステップS207に戻る。
【0066】関連情報抽出規則記憶部3内の規則は、た
とえば、図6のように定義されている。図6において、
関係表現としては、言語的な意味関係を表わす接続詞や
接続助詞(たとえば、「というのは」、「だって」、
「(だ)から」)などが関係名毎に定義される。
【0067】ステップS209において、関係表現が記
述単位Rに含まれる(すなわち、YES)と判定された
場合、関連表現抽出部4は、この記述単位Rを関連表現
として抽出する。
【0068】たとえば、図5において、番号「3」の記
述単位R「すっきりした感じで、コクもあるからです」
の中には、図6に参照される関係名「理由」に対応した
関係表現「(だ)から」が存在するため、関連表現とし
て番号「3」を抽出することになる。
【0069】次に、関連表現として抽出された記述単位
Rに関係名のラベルを付与し(ステップS210)、記
述単位Rを関連表現リストに追加して(ステップS21
1)、ステップS207に戻る。
【0070】関連表現リストは、たとえば、図7に示す
ような情報を持つリストとして表現される。図7におい
て、たとえば、番号「3」の関連表現「すっきりした感
じで、コクもあるからです」に対応して、関係名「理
由」および位置「53−71」が対応付けられる。
【0071】上記関連表現リストの作成処理(ステップ
S207〜S211)は、記述単位Rが取得できる限
り、繰り返し実行される。その後、取得すべき記述単位
Rが存在しなくなった(ステップS207において、N
Oと判定された)時点で、関連表現抽出部4は、関連表
現リストの作成処理を終了し、特徴表現リスト(図4参
照)と、関連表現リスト(図7参照)とを、関連表現統
合部6に出力する。
【0072】これにより、関連表現統合部6は、関連表
現統合知識記憶部5を参照して特徴表現と関連表現とを
統合し(ステップS212)、関連表現統合結果として
分類部7に出力する。
【0073】ここで、関連表現統合知識記憶部5は、あ
る特徴表現に統合し得る関連表現を判定するための関連
表現統合知識を記憶している。たとえば、以下のような
判定基準を用い、各関連表現に対して統合可能性のスコ
アを算定する。
【0074】位置情報に関しては、関連表現の開始位置
が、特徴表現の終了位置に近いほどスコアを高く算定す
るか、または、関連表現の終了位置が、特徴表現の開始
位置に近いほどスコアを高く算定する。
【0075】同一単語に関しては、特徴表現と関連表現
とで共通の単語が存在すればスコアを加算する。また、
類義語に関しては、特徴表現と関連表現とで類義の単語
が存在すればスコアを加算する。
【0076】単語の類義性の判定方法としては、たとえ
ば、特徴表現および関連表現に出現する単語に関して、
単語の出現頻度に基づく統計的な重み付けを行って作成
した索引表を用いて、文章同士の類似度を単語ベクトル
の内積として算定する方法がある。または、類義語辞書
を使用する判定方法も可能である。
【0077】関連表現統合部6は、上記のように算定さ
れたスコアの高い関連表現を特徴表現に統合し、関連表
現統合結果を生成する。関連表現統合結果は、たとえ
ば、図8に示すように、特徴表現に対して統合された関
連表現を「木構造」の形式で構成したものとなる。
【0078】図8に示した関連表現統合結果の例では、
抽出意図が番号「1」の「賞賛」に対し、番号「3」の
関係名「理由」と、番号「4」の関係名「逆接」とが統
合されている。
【0079】図2に戻り、最後に、分類部7は、関連表
現統合部6から入力された関連表現統合結果を内容に応
じて分類し(ステップS213)、図2の処理を終了す
る。このとき、分類部7は、たとえば、関連表現統合結
果に付与されている抽出意図(図3、図4、図8参照)
に応じて分類を行う。
【0080】上記処理手順により、分析対象に依存する
概念定義やシソーラスを用いずに、表層的な表現に着目
して表現抽出を行うことができ、分析対象に依存しない
汎用性を有しつつ、一般のWebページも含めて分析す
ることができる。
【0081】また、抽出対象となる表現A(クレーム、
要望、賞賛などの抽出意図)に加えて、抽出した表現A
に対して関係(理由、例示、逆接などの関係名)を有す
る表現Bを抽出し、表現A、Bを関連付けて提示するこ
とにより、有益な情報の発見や、それらの関係の分析を
支援することができる。
【0082】実施の形態2.なお、上記実施の形態1で
は、関連表現統合知識記憶部5内の知識のみを関連表現
統合部6と関連させたが、さらに対象名辞書内の情報を
関連させてもよい。
【0083】図9はこの発明の実施の形態2によるテキ
ストマイニング装置を示すブロック構成図であり、前述
(図1参照)と同様のものについては、同一符号を付し
て詳述を省略する。
【0084】8は対象名辞書であり、分析の目的とする
対象名に関する情報を記憶する。9は対象名抽出部であ
り、対象名辞書8と関連表現統合部6との間に介在され
ており、対象名を含む第3の記述単位を抽出して、対象
名とともに出力する。
【0085】この場合、関連表現統合部6は、統合対象
となる第1の記述単位である特徴表現抽出結果(図4に
参照の特徴表現リスト)と関連表現抽出結果(図7に参
照の関連表現リスト)との中から、対象名が抽出された
第3の記述単位に対象名を付与して分類部7に出力す
る。
【0086】これにより、分類部7は、関連表現統合部
6から入力された関連表現統合結果に付与されている対
象名毎に応じて、関連表現統合結果を分類して提示す
る。
【0087】また、関連表現統合部6は、特徴表現抽出
結果と関連表現抽出結果との統合判定に際して、対象名
を利用する。さらに、分類部7は、関連表現統合部6に
より得られた関連表現統合結果を事例として、事例のク
ラスタリングを行い、問題解決木を構成して出力する。
【0088】図9において、図1と異なる点は、対象名
辞書8および対象名抽出部9を備えていることのみであ
る。対象名辞書8に記憶される対象名としては、たとえ
ば、企業名、製品名、機器名、部品名、人名などの固有
名詞である。
【0089】対象名辞書8は、上記の固有名詞をリスト
として記憶し、対象名抽出部9は、与えられた記述単位
中から対象名を抽出し、該当する記述単位の情報として
対象名を付与する。
【0090】したがって、関連表現統合部6は、ある特
徴表現に統合し得る関連表現を判定するための知識とし
て、対象名抽出部9で付与された対象名を利用すること
により、関連表現が含まれない記述単位Rに関しても、
対象名に関する記述を有する関連情報として、特徴表現
に統合することができる。
【0091】また、分類部7は、特徴表現抽出部2によ
り抽出された特徴表現と、関連表現抽出部4により抽出
された関連表現(理由や例示などの関係を有する)と、
関連表現統合部6により統合された対象名とからなる組
を事例として、事例のクラスタリングを行い、「問題解
決木」を構成して出力することができる。なお、クラス
タリング技術については、公知の方法が種々提案されて
おり、ここでは、どの方法を用いても構わない。
【0092】上記のように、図9の構成を用いて処理す
ることにより、分析の目的とした対象名に関する、競合
製品や他社の評判、関連する機器名/部品名の関連情報
を抽出することができる。
【0093】また、分類部7において、事例のクラスタ
リングを行うことにより、分析の目的とした対象名に関
する、不評、クレーム、障害発生などの問題に関して、
共通の現象(特徴表現)に関する理由や具体例などの分
析を効果的に支援することができる。
【0094】
【発明の効果】以上のように、この発明によれば、入力
文書に関して、抽出意図と意図抽出表現とを対応付ける
ための特徴表現抽出規則を記憶する特徴表現抽出規則記
憶部と、入力文書から、意図抽出表現を含む第1の記述
単位を抽出して特徴表現とし、特徴表現を含む解析結果
を特徴表現抽出結果として、抽出意図とともに出力する
特徴表現抽出部と、第1の記述単位毎の関係に関し、関
係名と関係を表わす関係表現とを対応付けるための関連
表現抽出規則を記憶する関連表現抽出規則記憶部と、特
徴表現抽出結果から、関係表現を含む第2の記述単位を
抽出して関連表現とし、関連表現を含む解析結果を関連
表現抽出結果として、関係名とともに出力する関連表現
抽出部と、特徴表現と関連表現とを第1の記述単位毎の
関係に基づいて統合するための関連表現統合知識を記憶
する関連表現統合知識記憶部と、関連表現統合知識を参
照して特徴表現と関連表現とを統合し、関連表現統合結
果として出力する関連表現統合部と、関連表現統合結果
を抽出意図の内容に応じて分類する分類部とを備え、概
念やシソーラスを用いずに表層的な表現に着目して表現
抽出を行うようにしたので、Webページも含めて分析
対象にできるような汎用性を有するテキストマイニング
装置が得られる効果がある。また、抽出対象となる表現
A(意見、クレーム、障害報告など)に加えて、抽出し
た表現Aと関係(根拠や理由、原因、例示など)を有す
る表現Bを抽出して、表現A、Bを関連付けて提示する
ようにしたので、有益な情報の発見や、それらの関係の
分析を支援することのできるテキストマイニング装置が
得られる効果がある。
【0095】また、この発明によれば、分析の目的とす
る対象名に関する情報を記憶する対象名辞書と、対象名
を含む第3の記述単位を抽出し、対象名とともに出力す
る対象名抽出部とを備え、関連表現統合部は、統合対象
となる第1の記述単位である特徴表現抽出結果と関連表
現抽出結果との中から、対象名が抽出された第3の記述
単位に対象名を付与して出力し、分類部は、対象名毎に
分類して提示するようにしたので、対象名に関する、競
合製品や他社の評判、関連する機器名/部品名の関連情
報を抽出することのできるテキストマイニング装置が得
られる効果がある。
【0096】また、この発明によれば、分類部は、関連
表現統合部により得られた関連表現統合結果を事例とし
て、事例のクラスタリングを行い、問題解決木を構成し
て出力するようにしたので、対象名に関する、不評、ク
レーム、障害発生などの問題に関して、共通の現象(特
徴表現)に関する理由や具体例などの分析を効果的に支
援することのできるテキストマイニング装置が得られる
効果がある。
【0097】また、この発明によれば、入力文書に関し
て、抽出意図と意図抽出表現とを対応付けるための特徴
表現抽出規則を記憶する特徴表現抽出規則記憶ステップ
と、入力文書から、意図抽出表現を含む第1の記述単位
を抽出して特徴表現とし、特徴表現を含む解析結果を特
徴表現抽出結果として、抽出意図とともに出力する特徴
表現抽出ステップと、第1の記述単位毎の関係に関し、
関係名と関係を表わす関係表現とを対応付けるための関
連表現抽出規則を記憶する関連表現抽出規則記憶ステッ
プと、特徴表現抽出結果から、関係表現を含む第2の記
述単位を抽出して関連表現とし、関連表現を含む解析結
果を関連表現抽出結果として、関係名とともに出力する
関連表現抽出ステップと、特徴表現と関連表現とを第1
の記述単位毎の関係に基づいて統合するための関連表現
統合知識を記憶する関連表現統合知識記憶ステップと、
関連表現統合知識を参照して特徴表現と関連表現とを統
合し、関連表現統合結果として出力する関連表現統合ス
テップと、関連表現統合結果を抽出意図の内容に応じて
分類する分類ステップとを備え、概念やシソーラスを用
いずに表層的な表現に着目して表現抽出を行うようにし
たので、Webページも含めて分析対象にできるような
汎用性を有するテキストマイニング方法が得られる効果
がある。
【0098】また、この発明によれば、分析の目的とす
る対象名に関する情報を記憶する対象名辞書から、対象
名を含む第3の記述単位を抽出し、対象名とともに出力
する対象名抽出ステップを備え、関連表現統合ステップ
は、統合対象となる第1の記述単位である特徴表現抽出
結果と関連表現抽出結果との中から、対象名が抽出され
た第3の記述単位に対象名を付与して出力し、分類ステ
ップは、対象名毎に分類して提示するようにしたので、
対象名に関する、競合製品や他社の評判、関連する機器
名/部品名の関連情報を抽出することのできるテキスト
マイニング方法が得られる効果がある。
【0099】また、この発明によれば、分類ステップ
は、関連表現統合ステップにより得られた関連表現統合
結果を事例として、事例のクラスタリングを行い、問題
解決木を構成して出力するようにしたので、対象名に関
する、不評、クレーム、障害発生などの問題に関して、
共通の現象(特徴表現)に関する理由や具体例などの分
析を効果的に支援することのできるテキストマイニング
方法が得られる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1によるテキストマイ
ニング装置を示すブロック構成図である。
【図2】 この発明の実施の形態1による処理動作を示
すフローチャートである。
【図3】 この発明の実施の形態1による特徴表現抽出
規則の例を示す説明図である。
【図4】 この発明の実施の形態1による特徴表現リス
トの例を示す説明図である。
【図5】 この発明の実施の形態1による記述単位群の
例を示す説明図である。
【図6】 この発明の実施の形態1による関連表現抽出
規則の例を示す説明図である。
【図7】 この発明の実施の形態1による関連表現リス
トの例を示す説明図である。
【図8】 この発明の実施の形態1による関連表現統合
結果の例を示す説明図である。
【図9】 この発明の実施の形態2によるテキストマイ
ニング装置を示すブロック構成図である。
【図10】 従来のテキストマイニング装置を示すブロ
ック構成図である。
【符号の説明】
1 特徴表現抽出規則記憶部、2 特徴表現抽出部、3
関連表現抽出規則記憶部、4 関連表現抽出部、5
関連表現統合知識記憶部、6 関連表現統合部、7 分
類部、8 対象名辞書、9 対象名抽出部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 克志 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5B075 ND03 NK06 PP24 UU06

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 入力文書に関して、抽出意図と意図抽出
    表現とを対応付けるための特徴表現抽出規則を記憶する
    特徴表現抽出規則記憶部と、 前記入力文書から、前記意図抽出表現を含む第1の記述
    単位を抽出して特徴表現とし、前記特徴表現を含む解析
    結果を特徴表現抽出結果として、前記抽出意図とともに
    出力する特徴表現抽出部と、 前記第1の記述単位毎の関係に関し、関係名と前記関係
    を表わす関係表現とを対応付けるための関連表現抽出規
    則を記憶する関連表現抽出規則記憶部と、 前記特徴表現抽出結果から、前記関係表現を含む第2の
    記述単位を抽出して関連表現とし、前記関連表現を含む
    解析結果を関連表現抽出結果として、前記関係名ととも
    に出力する関連表現抽出部と、 前記特徴表現と前記関連表現とを前記第1の記述単位毎
    の関係に基づいて統合するための関連表現統合知識を記
    憶する関連表現統合知識記憶部と、 前記関連表現統合知識を参照して前記特徴表現と前記関
    連表現とを統合し、関連表現統合結果として出力する関
    連表現統合部と、 関連表現統合結果を前記抽出意図の内容に応じて分類す
    る分類部と を備えたテキストマイニング装置。
  2. 【請求項2】 前記特徴表現抽出部は、前記入力文書を
    分割して文集合とし、前記意図抽出表現の抽出対象とな
    る第1の記述単位を文とすることを特徴とする請求項1
    に記載のテキストマイニング装置。
  3. 【請求項3】 前記特徴表現抽出部は、前記入力文書に
    おける各記述の位置情報を参照し、一定範囲の位置に存
    在する記述を抽出対象とすることを特徴とする請求項1
    または請求項2に記載のテキストマイニング装置。
  4. 【請求項4】 前記特徴表現抽出部は、文書の構造情報
    により前記入力文書を分割してサブ文書集合とし、前記
    サブ文書集合内の各サブ文書毎に前記特徴表現抽出結果
    を得ることを特徴とする請求項1から請求項3までのい
    ずれかに記載のテキストマイニング装置。
  5. 【請求項5】 前記特徴表現抽出部は、文書の構造情報
    を参照して、前記サブ文書集合の中から、抽出対象とす
    るサブ文書を選択することを特徴とする請求項4に記載
    のテキストマイニング装置。
  6. 【請求項6】 分析の目的とする対象名に関する情報を
    記憶する対象名辞書と、 前記対象名を含む第3の記述単位を抽出し、前記対象名
    とともに出力する対象名抽出部とを備え、 前記関連表現統合部は、統合対象となる第1の記述単位
    である前記特徴表現抽出結果と前記関連表現抽出結果と
    の中から、前記対象名が抽出された第3の記述単位に前
    記対象名を付与して出力し、 前記分類部は、前記対象名毎に分類して提示することを
    特徴とする請求項1から請求項5までのいずれかに記載
    のテキストマイニング装置。
  7. 【請求項7】 前記関連表現統合部は、前記特徴表現抽
    出結果と前記関連表現抽出結果との統合判定に際して、
    前記対象名を利用することを特徴とする請求項6に記載
    のテキストマイニング装置。
  8. 【請求項8】 前記分類部は、前記関連表現統合部によ
    り得られた前記関連表現統合結果を事例として、前記事
    例のクラスタリングを行い、問題解決木を構成して出力
    することを特徴とする請求項7に記載のテキストマイニ
    ング装置。
  9. 【請求項9】 入力文書に関して、抽出意図と意図抽出
    表現とを対応付けるための特徴表現抽出規則を記憶する
    特徴表現抽出規則記憶ステップと、 前記入力文書から、前記意図抽出表現を含む第1の記述
    単位を抽出して特徴表現とし、前記特徴表現を含む解析
    結果を特徴表現抽出結果として、前記抽出意図とともに
    出力する特徴表現抽出ステップと、前記第1の記述単位
    毎の関係に関し、関係名と前記関係を表わす関係表現と
    を対応付けるための関連表現抽出規則を記憶する関連表
    現抽出規則記憶ステップと、 前記特徴表現抽出結果から、前記関係表現を含む第2の
    記述単位を抽出して関連表現とし、前記関連表現を含む
    解析結果を関連表現抽出結果として、前記関係名ととも
    に出力する関連表現抽出ステップと、 前記特徴表現と前記関連表現とを前記第1の記述単位毎
    の関係に基づいて統合するための関連表現統合知識を記
    憶する関連表現統合知識記憶ステップと、 前記関連表現統合知識を参照して前記特徴表現と前記関
    連表現とを統合し、関連表現統合結果として出力する関
    連表現統合ステップと、 前記関連表現統合結果を前記抽出意図の内容に応じて分
    類する分類ステップとを備えたテキストマイニング方
    法。
  10. 【請求項10】 前記特徴表現抽出ステップは、前記入
    力文書を分割して文集合とし、前記意図抽出表現の抽出
    対象となる第1の記述単位を文とすることを特徴とする
    請求項9に記載のテキストマイニング方法。
  11. 【請求項11】 前記特徴表現抽出ステップは、前記入
    力文書における各記述の位置情報を参照し、一定範囲の
    位置に存在する記述を抽出対象とすることを特徴とする
    請求項9または請求項10に記載のテキストマイニング
    方法。
  12. 【請求項12】 前記特徴表現抽出ステップは、文書の
    構造情報により前記入力文書を分割してサブ文書集合と
    し、前記サブ文書集合内の各サブ文書毎に前記特徴表現
    抽出結果を得ることを特徴とする請求項9から請求項1
    1までのいずれかに記載のテキストマイニング方法。
  13. 【請求項13】 前記特徴表現抽出ステップは、文書の
    構造情報を参照して、前記サブ文書集合の中から、抽出
    対象とするサブ文書を選択することを特徴とする請求項
    12に記載のテキストマイニング方法。
  14. 【請求項14】 分析の目的とする対象名に関する情報
    を記憶する対象名辞書から、前記対象名を含む第3の記
    述単位を抽出し、前記対象名とともに出力する対象名抽
    出ステップを備え、 前記関連表現統合ステップは、統合対象となる第1の記
    述単位である前記特徴表現抽出結果と前記関連表現抽出
    結果との中から、前記対象名が抽出された第3の記述単
    位に前記対象名を付与して出力し、 前記分類ステップは、前記対象名毎に分類して提示する
    ことを特徴とする請求項9から請求項13までのいずれ
    かに記載のテキストマイニング方法。
  15. 【請求項15】 前記関連表現統合ステップは、前記特
    徴表現抽出結果と前記関連表現抽出結果との統合判定に
    際して、前記対象名を利用することを特徴とする請求項
    14に記載のテキストマイニング方法。
  16. 【請求項16】 前記分類ステップは、前記関連表現統
    合ステップにより得られた前記関連表現統合結果を事例
    として、前記事例のクラスタリングを行い、問題解決木
    を構成して出力することを特徴とする請求項15に記載
    のテキストマイニング方法。
JP2001355150A 2001-11-20 2001-11-20 テキストマイニング装置および方法 Pending JP2003157271A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001355150A JP2003157271A (ja) 2001-11-20 2001-11-20 テキストマイニング装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001355150A JP2003157271A (ja) 2001-11-20 2001-11-20 テキストマイニング装置および方法

Publications (1)

Publication Number Publication Date
JP2003157271A true JP2003157271A (ja) 2003-05-30

Family

ID=19166896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001355150A Pending JP2003157271A (ja) 2001-11-20 2001-11-20 テキストマイニング装置および方法

Country Status (1)

Country Link
JP (1) JP2003157271A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096182A1 (ja) * 2004-03-31 2005-10-13 Matsushita Electric Industrial Co., Ltd. 情報抽出システム
JP2007072522A (ja) * 2005-09-02 2007-03-22 Mazda Motor Corp 品質向上支援システムおよびその制御方法、ならびに制御プログラム
JP2007280052A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> 体験情報抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2010257155A (ja) * 2009-04-23 2010-11-11 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2011081494A (ja) * 2009-10-05 2011-04-21 Tokyo Electric Power Co Inc:The 文書データ解析装置、方法及びプログラム
WO2013121810A1 (ja) * 2012-02-16 2013-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション テキストの文書を解析する装置、プログラムおよび方法
US8606810B2 (en) 2008-01-30 2013-12-10 Nec Corporation Information analyzing device, information analyzing method, information analyzing program, and search system
JP2015088067A (ja) * 2013-10-31 2015-05-07 Kddi株式会社 マイニング分析装置、方法及びプログラム
JP2016012195A (ja) * 2014-06-27 2016-01-21 Kddi株式会社 原因推定装置、プログラムおよび原因推定方法
JP2016057989A (ja) * 2014-09-11 2016-04-21 Kddi株式会社 情報提供装置、情報を提供する方法およびプログラム
JP2016212879A (ja) * 2015-05-12 2016-12-15 株式会社リコー 情報処理方法及び情報処理装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005096182A1 (ja) * 2004-03-31 2005-10-13 Matsushita Electric Industrial Co., Ltd. 情報抽出システム
JP2007072522A (ja) * 2005-09-02 2007-03-22 Mazda Motor Corp 品質向上支援システムおよびその制御方法、ならびに制御プログラム
JP2007280052A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> 体験情報抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP4726683B2 (ja) * 2006-04-06 2011-07-20 日本電信電話株式会社 体験情報抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
US8606810B2 (en) 2008-01-30 2013-12-10 Nec Corporation Information analyzing device, information analyzing method, information analyzing program, and search system
JP2010257155A (ja) * 2009-04-23 2010-11-11 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2011081494A (ja) * 2009-10-05 2011-04-21 Tokyo Electric Power Co Inc:The 文書データ解析装置、方法及びプログラム
WO2013121810A1 (ja) * 2012-02-16 2013-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション テキストの文書を解析する装置、プログラムおよび方法
GB2511015A (en) * 2012-02-16 2014-08-20 Ibm Apparatus for analyzing text document, program, and method
US9164964B2 (en) 2012-02-16 2015-10-20 International Business Machines Corporation Context-aware text document analysis
JP2015088067A (ja) * 2013-10-31 2015-05-07 Kddi株式会社 マイニング分析装置、方法及びプログラム
JP2016012195A (ja) * 2014-06-27 2016-01-21 Kddi株式会社 原因推定装置、プログラムおよび原因推定方法
JP2016057989A (ja) * 2014-09-11 2016-04-21 Kddi株式会社 情報提供装置、情報を提供する方法およびプログラム
JP2016212879A (ja) * 2015-05-12 2016-12-15 株式会社リコー 情報処理方法及び情報処理装置

Similar Documents

Publication Publication Date Title
CN106997382B (zh) 基于大数据的创新创意标签自动标注方法及系统
Gupta et al. A survey of text question answering techniques
US7877383B2 (en) Ranking and accessing definitions of terms
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
CN101887414B (zh) 对包含图像符号的文本消息传达的评价自动打分的服务器
CN110609998A (zh) 一种电子文档信息的数据提取方法、电子设备及存储介质
CN109446313B (zh) 一种基于自然语言分析的排序系统及方法
WO2002089004A2 (en) Search data management
JP2003157271A (ja) テキストマイニング装置および方法
JP2001084250A (ja) 膨大な文書データからの知識抽出方法、その装置及び媒体
Li et al. Automatic extraction for product feature words from comments on the web
EP0822503A1 (en) Document retrieval system
Giri et al. A survey of automatic text summarization system for different regional language in India
Masadeh et al. A hybrid approach of lexicon-based and corpus-based techniques for Arabic book aspect and review polarity detection
JPH1145268A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Das et al. Sentence level emotion tagging
JP2002092004A (ja) 情報分類装置
JP2005196572A (ja) 複数文書の要約作成方法
JP2007128224A (ja) 文書インデキシング装置、文書インデキシング方法及び文書インデキシングプログラム
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
JP2007293377A (ja) 主観的ページと非主観的ページを分離する入出力装置
JP5187187B2 (ja) 体験情報検索システム
Thanadechteemapat et al. Thai word segmentation for visualization of thai web sites
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
JP2002183175A (ja) テキストマイニング方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070921

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071030