JP2006172489A - 文書の参照理由を用いて情報検索を行なう装置 - Google Patents

文書の参照理由を用いて情報検索を行なう装置 Download PDF

Info

Publication number
JP2006172489A
JP2006172489A JP2006003148A JP2006003148A JP2006172489A JP 2006172489 A JP2006172489 A JP 2006172489A JP 2006003148 A JP2006003148 A JP 2006003148A JP 2006003148 A JP2006003148 A JP 2006003148A JP 2006172489 A JP2006172489 A JP 2006172489A
Authority
JP
Japan
Prior art keywords
document
information
reason
keyword
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006003148A
Other languages
English (en)
Inventor
Koji Tsukamoto
浩司 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006003148A priority Critical patent/JP2006172489A/ja
Publication of JP2006172489A publication Critical patent/JP2006172489A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ある文書が他の文書を参照している理由を同定し、同定された参照理由を利用して効率的に文書を検索可能な装置を提供する。
【解決手段】被参照文書抽出手段11は、与えられた文書データから被参照文書に関する文書情報を抽出する。参照位置抽出手段12は、前記文書データ内で前記被参照文書を参照している位置である参照位置に関する情報を抽出する。言語解析手段は、参照位置抽出手段12により抽出された参照位置の周辺の文字列を言語解析する。判断手段13は、少なくとも前記言語解析手段による言語解析の結果に基づき、前記被参照文書が参照されている理由である参照理由を判断する。キーワード抽出手段は、前記参照位置の周辺の情報から、前記被参照文書のためのキーワード情報を抽出する。出力手段14は、被参照文書抽出手段11により抽出された情報と前記参照理由と前記キーワード情報とを含む出力情報を出力する。
【選択図】図1

Description

本発明は、文書等の情報を検索する情報検索に係り、特に、文書間に参照/被参照関係が存在する場合に、参照理由を同定し、参照理由を用いて文書を検索する装置に関する。
文書間に参照/被参照関係が存在する場合に、参照関係を検索に利用する技術がいくつか提案されている。このような技術としては、以下のような特許文献1〜8が挙げられる。
(1)特許文献1(特開昭63−228221号公報)
文献の参照関係を記憶しておき、手がかりとなる何らかの情報からファジイ論理演算を用いて検索を行う。
(2)特許文献2(特開昭63−153630号公報)
文献の被引用関係を用いて、引用文献を検索項目とすることにより、共引用関係の文書の検索を行うことができる。ここで、共引用関係の文書とは、共通の引用文献を持つことで重要な関係にあると考えられる文献を意味する。
(3)特許文献3(特開平1−191258号公報)
文献の本文と、本文中から自動的に抽出した参考文献名とを同時に提示して、編集を容易にする。
(4)特許文献4(特開平6−282534号公報)
文書が引用されたことを、引用された文書の利用者に自動的に通知する。
(5)特許文献5(特開平7−311780号公報)
引用関係に基づき、ある文献に関連する文献を検索する。検索結果は、重要度順に表示される。重要度は、引用回数に基づいて決められる。
(6)特許文献6(特開平8−272818号公報)
ある文書を指定すると、それに関連する文書が表示され、表示された文書を選択することにより、さらに検索が可能になる。
(7)特許文献7(特開平9−146968号公報)
ある文献が行っている参照と似たような参照を行っている他の文献を検索する。
(8)特許文献8(特開平10−105572号公報)
参照関係とキ−ワ−ドをもとに、文書間に関連性があるかないかを判断し、それに基づいて文書集合を作成する。
図27は、このような従来の情報検索システムを示している。このシステムは、検索装置1、全文データベース2、および参照関係データベース3を備える。そして、ある文献が入力されると、それと共引用関係にある文献や似たような参照を行っている文献を、関連文献として表示する。検索装置1の検索部5は、全文データベース2の文献を検索し、選択部6は、参照関係データベース3の参照関係を用いて関連文献を選択する。
関連文献の情報は、例えば、図28のような形式で表示される。関連文献が複数ある場合、例えば、文献の重要度の順に並べて表示される。上述の特許文献のうち、特許文献6(特開平8−272818)と特許文献8(特開平10−105572)以外においては、基本的に、参照しているかいないかのどちらかという2値的な参照関係のみが用いられている。
また、特許文献6(特開平8−272818)では、表示の際にどのような位置付けの参照関係なのかを表示するようにしているが、そのためには人間があらかじめ情報を付与しておく必要がある。また、特許文献8(特開平10−105572)では、参照関係とキ−ワ−ドを用いて、文書間の関連性があるかないかを判断している。
このように、従来の技術では、関連があるかないかのいずれか一方を表す2値情報が、文書間の関連性として用いられている。
特開昭63−228221号公報 特開昭63−153630号公報 特開平1−191258号公報 特開平6−282534号公報 特開平7−311780号公報 特開平8−272818号公報 特開平9−146968号公報 特開平10−105572号公報
しかしながら、上述した従来の情報検索システムには、次のような問題がある。
特許文献5(特開平7−311780)では、引用回数の多い文献から順に重要文献として表示しているが、利用者は装置側が一意に提示した価値基準に従って文献の重要度を逐次判断せざるを得ない。
また、他の従来技術も、文書を参照しているかいないかの2値情報で参照関係を表しており、ある文書にとって「重要であるかないか」という1つの観点から分析を行い、文書を検索するものである。このような2値情報を用いて検索を行うシステムは、次のような欠点を持っている。
(1)利用者になぜ重要であるのかを示すことができない。
(2)重要であるかないかという1つの観点に基づく分析では、文書同士の関わり合いを示すことができない。
(3)どのような類の文書が必要であるかが分かっていても、すべての関連文書が一緒に表示されてしまう。
このようなシステムで、例えば、科学分野の文献を検索した場合、新しい技術の文献や、よく用いられるソフトウェアについての文献というような、主題として直接的な関連がないものがしばしば上位に表示されることがある。実際に参考にしたい文献はこのような文献ではない場合が多いが、従来のシステムでは、この問題を避けることができない。
本発明の課題は、ある文書がどのような理由で被参照文書を参照しているのかを同定し、同定された参照理由を利用して効率的に文書を検索可能な装置を提供することである。
図1は、本発明のキーワード抽出装置の原理図である。この装置は、被参照文書抽出手段11、参照位置抽出手段12、言語解析手段(不図示)、判断手段13、キーワード抽出手段(不図示)、および出力手段14を備える。
被参照文書抽出手段11は、与えられた文書データから被参照文書に関する文書情報を抽出する。参照位置抽出手段12は、前記文書データ内で前記被参照文書を参照している位置である参照位置に関する情報を抽出する。言語解析手段は、参照位置抽出手段12により抽出された参照位置の周辺の文字列を言語解析する。判断手段13は、少なくとも前記言語解析手段による言語解析の結果に基づき、前記被参照文書が参照されている理由である参照理由を判断する。キーワード抽出手段は、前記参照位置の周辺の情報から、前記被参照文書のためのキーワード情報を抽出する。出力手段14は、被参照文書抽出手段11により抽出された情報と前記参照理由と前記キーワード情報とを含む出力情報を出力する。
このようなキーワード抽出装置によれば、文書データから被参照文書の文書情報とその参照理由とキーワード情報とが自動的に抽出され、利用者に提示される。したがって、利用者は、各被参照文書がどのような理由で参照元の文書により参照されているのかを認識することができ、参照理由から被参照文書の重要性を推定することもできる。さらに、利用者は、文献の著者自身が選択したキーワードだけでなく、その文献を参照している他の文書に基づくキーワードも与えられることになり、主観的なキーワードだけでなく、客観的に付与されたキーワードをも利用して検索することができ、検索効率が向上する。
例えば、図1の被参照文書抽出手段11は、後述する図2の文書構造解析部22と参考文献解析部25に対応し、図1の参照位置抽出手段12は、図2の文書構造解析部22と本文構造解析部24に対応し、図1の判断手段13は、図2の参照文脈解析部26に対応し、図1の出力手段14は、図2の対応判断部27と出力成形部28と出力インタフェース29に対応する。
また、例えば、図1の文書データベース手段15は、後述する図11の全文データベース2に対応し、図1の参照関係格納手段16は、図11の参照関係データベース95に対応し、図1の検索手段17は、図11の検索装置92に対応する。
また、例えば、図1の類似度判定手段18は、後述する図23の類似度判定装置152に対応する。
本発明のキーワード抽出装置によれば、文書データから被参照文書の文書情報とその参照理由とキーワード情報とが自動的に抽出され、利用者に提示される。したがって、利用者は、各被参照文書がどのような理由で参照元の文書により参照されているのかを認識することができ、参照理由から被参照文書の重要性を推定することもできる。さらに、利用者は、文献の著者自身が選択したキーワードだけでなく、その文献を参照している他の文書に基づくキーワードも与えられることになり、主観的なキーワードだけでなく、客観的に付与されたキーワードをも利用して検索することができ、検索効率が向上する。
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
一般に、システムが参照関係の特徴データを参照理由データ(関連性データ)としてあらかじめ持っていない場合、参照の有無を利用者に提示することは可能であるが、複数の参照理由を提示することは不可能か、あるいは非常に困難である。これに対して、システムが複数の参照理由データをあらかじめ持っている場合、参照の有無を利用者に提示することは簡単であり、複数の参照理由を提示することも比較的簡単である。したがって、あらかじめ参照理由データをシステムに保持しておけば、それを利用して必要な情報を効率良く発見することができる。
まず、参照理由の同定に関しては、参照している文書内における被参照文書の出現位置、引用方法、文章等を解析することで、被参照文書が参照されている理由を判断する。この解析においては、例えば、以下のような特徴付けが行われる。
(1)被参照文献は、参照している文献の知識を補うものである。例えば、被参照文献が条例であり、それを参照している文献が条例の追加である場合が、これに相当する。また、被参照文献が星の発見に関する文献であり、それを参照している文献がその星に関する新たなデータや仮説等に関する文献である場合も、これに相当する。
(2)被参照文献は、参照している文献の扱う分野をまとめたものである。このような被参照文献は、いわゆるレビュー論文のようなものに相当し、その分野の近年の進歩状況を照会するためによく引用される。
(3)参照している文献が被参照文献に対する反論を行っている。
(4)被参照文献は、参照している文献で紹介している人物の代表的な文献である。
このようにして、数多くの文書を処理することにより、参照されている文書がその分野でどのような位置付けにあるのかを知ることができる。図2は、参照理由同定装置の構成図である。図2の参照理由同定装置は、入力インタフェース21、文書構造解析部22、書誌情報解析部23、本文構造解析部24、参考文献情報解析部25、参照文脈解析部26、対応判断部27、出力成形部28、および出力インタフェース29を備える。
まず、入力インタフェース21は、文書データ30をテキストデータとして入力する。文書構造解析部22は、入力されたテキストデータを書誌情報、本文、および参考文献の3つの部分に切り分けて、それぞれ書誌情報解析部23、本文構造解析部24、および参考文献解析部25に渡す。
次に、書誌情報解析部23は、書誌情報からタイトル、著者名等の文献情報を抽出して出力し、本文構造解析部24は、本文から章構造と参考文献を引用している部分を抽出して出力し、参考文献解析部25は、参考文献の記載から人名、発行年、タイトル、誌名等の文献情報を抽出して出力する。
また、参照文脈解析部26は、本文中の参考文献を引用している部分を解析して参照理由を判断して出力し、対応判断部27は、本文中の参考文献を引用している部分と参考文献の記載から抽出された文献情報とを対応付けて出力する。
次に、出力成形部28は、書誌情報解析部23から出力された文献情報と、参照文脈解析部26から出力された参照理由と、対応判断部27から出力された対応関係と、参考文献解析部25から出力された参考文献の文献情報とをまとめて出力データ31を成形し、出力インタフェース29に渡す。
そして、出力インタフェース29は、出力データ31をディスプレイ画面等に出力する。出力データ31には、例えば、文書データ30の文献名と、参考文献および参照関係の組み合わせのリストが含まれる。
次に、図3から図9までを参照しながら、図2の参照理由同定装置の処理についてより詳細に説明する。図3は、文書構造解析部22の処理のフローチャートである。パターンデータリスト41、42、43、44は、あらかじめ決められた文字列パターンの情報を含んでおり、不図示の記憶装置上に保持される。
文書構造解析部22は、まず、文書のテキストデータを読み込み(ステップS1)、パターンデータリスト41に格納された導入部パターン(はじめにパターン)を参照しながら、マッチするパターンを含む行を探し(ステップS2)、そのような行がテキストデータにあるか否かをチェックする(ステップS3)。文書が英語または日本語で作成されている場合、導入部パターンとしては、例えば、次のような文字列がパターンデータリスト41に格納される。
1 Introduction
1.Introduction
Introduction
1 はじめに
1.はじめに
はじめに
1 背景
概要
このようなパターンにマッチする行があれば、マッチする最初の行の位置をP1として記憶する(ステップS4)。そして、パターンデータリスト42に格納されたキーワードパターンを参照しながら、その位置P1より前にキーワードパターンがあるか否かをチェックする(ステップS5)。キーワードパターンとしては、例えば、“***”を任意のキーワードリストとして、次のような文字列がパターンデータリスト42に格納される。
keyword ***
keyword:***
キーワード ***
キーワード:***
このようなパターンにマッチする行があれば、その位置を記憶する(ステップS6)。そして、パターンデータリスト43に格納されたアブストラクトパターンを参照しながら、記憶された位置より前にアブストラクトパターンがあるか否かをチェックする(ステップS7)。アブストラクトパターンとしては、例えば、次のようなパターン情報がパターンデータリスト43に格納される。
Abstract
20語以上の文章で、文書の先頭の文章ではないもの。
このようなパターンにマッチする行があれば、その位置を記憶する(ステップS8)。そして、パターンデータリスト44に格納された参考文献パターンを参照しながら、マッチするパターンを含む行を探し(ステップS9)、そのような行が位置P1より後の部分にあるか否かをチェックする(ステップS10)。参考文献パターンとしては、例えば、次のような文字列がパターンデータリスト44に格納される。
Reference
参照文献
参考文献
このようなパターンにマッチする行があれば、マッチする最後の行の位置をP2として記憶し(ステップS11)、記憶した位置P1、P2等を出力して(ステップS12)、処理を終了する。ステップS5においてキーワードパターンがない場合は、そのままステップS7以降の処理を行い、ステップS7においてアブストラクトパターンがない場合は、そのままステップS9以降の処理を行う。
また、ステップS3において導入部パターンがない場合は、文書の先頭の位置をP1として記憶し(ステップS13)、ステップS9以降の処理を行う。また、ステップS10において参考文献パターンがない場合は、文書の末尾の位置をP2として記憶し(ステップS14)、ステップS12の処理を行う。
ステップS12において出力される位置P1は書誌情報の記載と本文の記載の境界位置(切れ目)に対応し、位置P2は本文の記載と参考文献の記載の境界位置に対応する。
次に、図4は、書誌情報解析部23の処理のフローチャートである。ストップワードリスト51とパターンデータリスト52は、あらかじめ決められた文字列パターンの情報を含んでおり、記憶装置上に保持される。
書誌情報解析部23は、まず、テキストデータの先頭からP1までの部分を書誌情報として読み込み(ステップS21)、ストップワードリスト51を参照しながらテキストデータをチェックする。そして、最初にストップワードを含む文があればそれを読み飛ばし(ステップS22)、次の文をタイトルとして抽出する(ステップS23)。ストップワードとしては、タイトルではない文の先頭に現れる可能性のある文字列が用いられ、例えば、次のような文字列がストップワードリスト51に格納される。
解説
技術メモ
Technical Note
次に、パターンデータリスト52に格納された著者名パターンを参照しながら、タイトルとして記憶された文の次の文章からマッチするパターンを探し、それを抽出する(ステップS24)。著者名パターンとしては、例えば、図4に示すようなパターン情報がパターンデータリスト52に格納される。図4において、“○○”は辞書に登録された人名を表し、“−−−−−−”は辞書に登録されていない未知語を表す。これらの著者名パターンは、次のように表すこともできる。
人名+未知語
未知語+未知語
アルファベット.人名
アルファベット.未知語
アルファベット.アルファベット.人名
アルファベット.アルファベット.未知語
次に、抽出されたデータをタイトルおよび著者名として記憶装置に書き出し(ステップS25)、処理を終了する。
次に、図5は、本文構造解析部24の処理のフローチャートである。パターンデータリスト61、62は、あらかじめ決められた文字列パターンの情報を含んでおり、記憶装置上に保持される。
本文構造解析部24は、文書構造解析部22から渡された本文部分について、先頭から順に章構造を表すパターンを探していき、そのようなパターンの位置を記憶する処理を、それがなくなるまで繰り返す。次に、本文の先頭に戻って、参考文献の参照を表すパターンを探していき、そのようなパターンの位置を記憶する処理を、それがなくなるまで繰り返す。最後に、得られた章構造および参考文献の参照位置を出力する。
本文構造解析部24は、まず、テキストデータのP1からP2までの部分を本文として読み込み(ステップS31)、パターンデータリスト61を参照しながら章構造を表すパターンを探していく(ステップS32)。章構造のパターンとしては、例えば、次のようなパターン情報がパターンデータリスト61に格納され、これらのパターンにマッチする行が探索される。
数字 文字列(改行)
数字.文字列(改行)
ここで、パターンの先頭の数字は章番号を表しており、通常、本文の後にいくに従って大きくなる。また、文字の大きさや太さ等があらかじめ分かっていれば、それらの情報も参考にして章構造のパターンが探索される。
次に、見つかったパターンに含まれる数字の増え方が適切か否かをチェックする(ステップS33)。そして、例えば、その数字が前の数字に繋がっていなければ、数字の増え方が適切でないと判断し、エラー処理を行って(ステップS34)、処理を終了する。
数字の増え方が適切であれば、見つかったパターンの位置を新たな章の先頭位置として記憶し(ステップS35)、まだ文章が残っているか否かをチェックする(ステップS36)。そして、文章が残っていれば、それがなくなるまでステップS32以降の処理を繰り返す。
文章がなくなると、次に、位置P1にポインタをセットし(ステップS37)、パターンデータリスト62を参照しながら、参考文献を参照していることを表すパターンを探す(ステップS38)。参考文献の参照を表すパターンとしては、例えば、次のようなパターン情報がパターンデータリスト62に格納される。
数字)
〔数字〕
〔文字列 年号〕
文字列 年号
これらのパターンにマッチする部分が見つかれば、その位置を参照位置として記憶し、文章がまだ残っているか否かをチェックする(ステップS39)。文章が残っていれば、それがなくなるまでステップS38の処理を繰り返す。そして、文章がなくなると、得られた各章の先頭位置と参照位置を出力して(ステップS40)、処理を終了する。
次に、図6は、参考文献解析部25の処理のフローチャートである。パターンデータリスト71は、あらかじめ決められた文字列パターンの情報を含んでおり、記憶装置上に保持される。
参考文献解析部25は、文書構造解析部22から渡された参考文献部分を1文ずつ読み込み、参考文献パターンとマッチングして、マッチした人名、発行年、タイトル、誌名等の情報を順に記憶していく。このような処理を参考文献部分の行がなくなるまで繰り返す。
参考文献解析部25は、まず、テキストデータのP2から末尾までの部分を参考文献部分として読み込み(ステップS41)、文章が残っているか否かをチェックする(ステップS42)。文章が残っていれば、1文を読み込み(ステップS43)、その文とパターンデータリスト71の参考文献パターンとのマッチングを行い(ステップS44)、マッチするパターンがあるか否かをチェックする(ステップS45)。参考文献パターンとしては、例えば、次のようなパターン情報がパターンデータリスト71に格納される。
人名 and 人名 年号 “タイトル” 誌名
〔人名 年号〕 人名 年号 “タイトル” 誌名
〔参照番号〕 人名 年号 “タイトル” 誌名
読み込んだ文がこのようなパターンにマッチすれば、その文に含まれる人名、年号、タイトル、誌名等の情報を参考文献情報として記憶し(ステップS46)、ステップS42以降の処理を繰り返す。また、マッチするパターンがなければ、その文に含まれる情報を記憶せずに、ステップS42以降の処理を繰り返す。そして、ステップS42において文章がなくなると、得られた参考文献情報を出力して(ステップS47)、処理を終了する。
次に、図7は、参照文脈解析部26の処理のフローチャートである。参照文脈解析部26は、パターンデータリスト71は、あらかじめ決められた文字列パターンの情報を含んでおり、記憶装置上に保持される。
参照文脈解析部26は、言語解析部81と参照特徴−参照理由対応表82を含み、本文構造解析部24から渡された章構造および参照位置の情報を解析して、参照理由を判断する。この参照特徴−参照理由対応表82は、あらかじめ人手または学習により作成される。参照文脈解析部26は、各参照位置について、その位置を含む章の情報と、その位置の周辺の文字列を言語解析部81により解析した結果と、参考文献の引用パターンの3つの情報に基づき、参照特徴−参照理由対応表82を用いて参照理由を判断する。
参照文脈解析部26は、まず、本文と章構造を読み込み(ステップS51)、すべての参照位置について処理が完了したか否かをチェックする(ステップS52)。処理が完了していなければ、次の参照位置を読み込み(ステップS53)、章構造を参照しながらその位置が属する章の番号とその位置の周辺の文字列を抽出する(ステップS54)。
次に、言語解析部81は、抽出された文字列の形態素解析、構文解析、意味解析等を行って、参照位置周辺の特徴を抽出する(ステップS55)。例えば、形態素解析については、以下の文献〔1〕のpp.117−137のアルゴリズムが用いられ、構文解析については、この文献のpp.140−199のアルゴリズムが用いられる。また、意味解析については、この文献のpp.200−231のアルゴリズムが用いられる。

〔1〕長尾真(ながおまこと),「自然言語処理」,岩波書店,1996

次に、参照文脈解析部26は、参照特徴−参照理由対応表82を参照しながら、参照理由を判断する(ステップS56)。参照理由としては、例えば、以下のようなものが考えられる。
(1)反論(answer)
参考文献の内容と異なる意見を記述するために、参考文献を引用する。
(2)応用(application )
応用分野を紹介するために、参考文献を引用する。
(3)基礎(basic )
基礎的な研究や先人の仕事を紹介するために、参考文献を引用する。
(4)対立する意見(contraposition)
特定の内容と対立する意見や対照的な意見を紹介するために、参考文献を引用する。
(5)人物の代表的な文献(human )
特定の人物の代表的な文献を紹介するために、参考文献を引用する。
(6)関連のある仕事(related work)
特定の内容と関連のある仕事を紹介するために、参考文献を引用する。
(7)まとめ(review)
特定の分野のまとめを紹介するために、参考文献を引用する。
(8)使用ソフトウェア(software)
シミュレーション等に使用したソフトウェアを紹介するために、参考文献を引用する。
(9)使用技術(technique )
実験、シミュレーション等に使用した技術を紹介するために、参考文献を引用する。
(10)弱い関係(weak correlation)
特定の内容と弱い関係を持つような内容を紹介するために、参考文献を引用する。
(11)類似(similar )
特定の内容と類似した内容を紹介するために、参考文献を引用する。
参照特徴−参照理由対応表82には、このような参照理由のカテゴリと参照特徴との対応関係が格納されている。この参照特徴は、対応する参照理由を表現する本文の記述方法の特徴を表し、参考文献の参照位置を含む章の番号、参照位置の周辺の文字列の文脈、参考文献の引用パターン等の情報を含む。上述の参照理由の場合は、“**”を参考文献を示す文字列として、例えば、以下のような対応関係が参照特徴−参照理由対応表82に格納される。
参照位置=1章、かつ、言語解析結果=否定表現 → 反論
文脈=“...**というのが通説であるが、しかしながら、本研究では...” → 反論
文脈=“This approach is used in **...” → 応用
参照位置=1章または2章 → 基礎
文脈=“The first idea...due to **”または“In previous research...**” → 基礎
文脈=“Unlike previous...**, new...” → 対立する意見
参照位置=1章、かつ、文脈=“...が提案された**”または“...が提案されている**” → 関連のある仕事
文脈=“...is reviewd in ** ”または“** reviewd”または“see ** for an overview” → まとめ
文脈=“We use...similar to **”または“see ** for a similar...approach ”または“...is also implemented in **” → 類似
参照文脈解析部26は、ステップS54で抽出された情報やステップS55で得られた解析結果を参照特徴として参照特徴−参照理由対応表82を検索し、対応する参照理由を取得し、それを記憶する(ステップS57)。そして、ステップS52以降の処理を繰り返し、ステップS52においてすべての参照位置についての処理が完了すると、各参照位置毎に参照理由を出力して(ステップS58)、処理を終了する。
このように、参照理由は、参照を行っている文書中での被参照文書に関する表現の特徴に基づいて決められる。この参照理由を判断する方法としては、上述のような参照特徴−参照理由対応表82を保持する方法のほかに、統計的な方法を用いることもできる。このような方法は機械学習とも呼ばれる。この場合、参照特徴としては、次のようなものが用いられる。
(1)参考文献の出現回数
(2)参考文献の参照位置:文書の先頭からの距離、出現した章
(3)参照位置の周辺情報:共起している単語、よく現れるフレーズ
これらの参照特徴に対して、被参照文書がどのような理由で参照されているのかを人間があらかじめ正解として用意しておき、機械もしくは人手で抽出した参照特徴を参照理由に対応付ける。このとき、参照特徴と参照理由のセットを複数用意しておき、統計的な方法により参照特徴から参照理由への対応を得る。この統計的な方法としては、例えば、次の文献〔2〕のpp.525−652に記載された決定木、ニューラルネット、最近傍法、ベイズ推定等の方法が挙げられる。
〔2〕S. Russell and P. Norvig,「エージェントアプローチ 人工知能」,共立出版,1997

次に、具体的な文書を例に挙げて、参照理由同定装置の動作を説明する。図8は、“Fujino”の文献を参考文献として参照している“Jpn.J.Appl.Phys.”の文書を示している。
まず、この文書が入力インタフェース21を通して入力されると、入力されたデータは、文書構造解析部22により、書誌情報(●Jpn.J.Appl.Phys.〜KEYWORD;... )と本文(1 Introduction〜)と参考文献(Reference〜K.Fujino,...)の3つの部分に分割される。
ここでは、図3の分割位置P1は1章の“1 Introduction”の行の直前に設定され、分割位置P2は“Reference ”の行の直前に設定されている。したがって、“1 Introduction”の前の行までが書誌情報に対応し、1章から3章までが本文に対応し、“Reference ”の行以降が参考文献の部分に対応する。
このうち、書誌情報は書誌情報解析部23により解析され、この文書の著者がKoji Tsukamotoらであること、タイトルが“Morphology Evolution....”であること等が同定される。また、本文は本文構造解析部24により解析され、章構造が認識されるとともに、本文中で参考文献を引用している部分として、“6,8,10-13)”、“8,11,13)”のようなパターンが認識される。
このような認識結果は参照文脈解析部26に送られ、参考文献がどのような章のどのような文章の中で参照されているかに基づいて、参照理由が判断される。例えば、文献6)が1章で4回参照され、3章で2回参照されているものとすると、この文献は相対的に非常に多く参照されていることになる。このことから、文献6)は重要な文献であり、図8の文書の基礎となる文献であることが分かる。
また、文献6),8),10−13)は“Some methods have been.....However”という表現で参照されていることから、この文書とは対立する意見を述べた文献であることが分かる。また、文献8),11),13)は“Similar results were also reported..... ”という表現で参照されていることから、この文書と類似した文献であることが分かる。
また、参考文献の部分は参考文献解析部25により解析され、参考文献の文献情報が抽出される。例えば、文献6)の作者は“Fujino”であり、発行年は“1991年”であり、掲載誌は“J.Electrochem.Soc.”であること等が認定される。
次に、対応判断部27により、文献6)の参照を表している表記“6)”と文献6)の文献情報とが対応付けられる。そして、出力成形部28により、書誌情報解析部23、参照文脈解析部26、対応判断部27、および参考文献解析部25から出力された情報がまとめられて、出力インタフェース29から出力される。
このようにして同定された参照理由を用いれば、ある文書が他の文献を参照している理由を利用して文書を検索することにより、検索を効率化することができる。
例えば、参照理由を用いない場合の参照関係のデータ構造は、図9に示すようになる。ここで、各アルファベット文字は1つの文書を表し、矢印の元の文書は矢印の先の文書を参照している。これに対して、参照理由を用いた場合の参照関係のデータ構造は、図10に示すようになる。図10では、文書間の参照/被参照の情報だけでなく、参照理由毎の参照/被参照の情報が示されている。
図27に示した従来の情報検索システムにおいて、参照関係データベースに図10のような参照理由を用いた参照/被参照関係を格納した場合、システム構成は図11のようになる。
図11の情報検索システムは、入力装置91、検索装置92、表示装置93、全文データベース94、および参照関係データベース95を備え、検索装置92は、制御部101、検索部102、および選択部103を含む。参照関係データベース95には、図2の参照理由同定装置により抽出された情報が格納される。
入力装置91によりある文書が指定されると、制御部101による制御に基づいて、検索部102は、全文データベース94の文書を検索する。そして、選択部103は、参照関係データベース95の参照関係を用いて、指定された文書と共引用関係にある文献や似たような参照を行っている文献を、関連文書として選択し、表示装置93は、それらの関連文書を表示する。
図12は、このような検索結果の表示例を示している。参照関係データベース95に指定された文書の参照関係111が格納されており、文書X、W、V等が関連文書として選択されたとする。このとき、表示装置93の画面には検索結果112が表示され、各文書に該当する参照理由の欄にマーク“○”が記される。ここでは、関連文書が参照されている理由として、“answer”、“application”、“basic ”等が提示されている。
図13は、図11のシステムによる検索結果の表示処理のフローチャートである。選択部103は、まず、参照関係データベース95から指定された文書の参照関係データを読み込み(ステップS61)、そのデータに記述された参照理由を読み込む(ステップS62)。次に、指定された文書が参照している被参照文書の文献情報を読み込んで、図12のような表形式の検索結果を表示し(ステップS63)、該当する参照理由の欄にマークを付ける(ステップS64)。
次に、参照関係データが残っているか否かをチェックし、データが残っていれば、ステップS61以降の処理を繰り返す。そして、指定された文書のすべての参照関係データが処理されると、表示処理を終了する。
このような表示処理によれば、ある文書に関連する重要文書を表示する際、図28に示したような単一の基準(参照回数)に基づく順序だけでなく、その重要文書が参照されている理由も明示される。したがって、参照理由に基づいて検索結果をさらに絞り込むことも可能になり、文書検索が効率化される。
また、関連文書を単に重要度順に表示するだけでなく、図14に示すように、関連文書を参照理由毎に分類して重要度順に表示することも可能である。この場合、各文書の重要度は、上記単一の基準に基づく重要度に加え、以下のような要素を加味して決定される。
(1)それぞれの参照理由
(2)対応する参照理由により参照された回数
(3)参照元の文書の重要度
(4)出典の重要度
(5)利用者に参照された回数
表示された参照理由の中から利用者が適当なものを選択して、さらに検索を指示した場合、検索部102は、参照関係データベース95を参照しながら全文データベース94を検索する。そして、指定された参照理由で参照されている文書が関連文書として表示される。
このように、図11の情報検索システムによれば、検索結果に参照理由を付与したり、参照理由を用いて検索を行ったりすることで、利用者が情報検索の効率を改善することができる。
次に、被参照文書に関する情報を抽出して提示する情報提示装置について説明する。図15は、このような情報提示装置の構成図である。図15の情報提示装置は、図11の情報検索システムの構成要素に加えて、入力インタフェース121、検索入力インタフェース122、検索出力インタフェース123、参照理由同定装置124、および参照関係変換装置125をさらに備える。
入力インタフェース121は、ある文書を参照している複数の文書(文書群)を入力し、全文データベース94に格納するとともに、参照理由同定装置124に与える。参照理由同定装置124は、図2のような構成を持ち、与えられた文書の参照関係を求めて、参照関係変換装置125に出力する。
参照関係変換装置125は、与えられた参照関係を変換して、参照関係データベース95に格納する。例えば、図16に示すように、文書Aが文書B、C、Dをそれぞれb、c、dという参照理由で参照しているという参照関係が与えられたとする。このとき、参照関係変換装置125は、図17に示すように、文書B、C、Dが文書Aからそれぞれb、c、dという理由で参照されていることを表すデータを加えて、図18に示すような参照関係データを生成する。そして、このデータを参照関係データベ−ス95に格納する。
利用者は、検索入力インタフェース122から、キーワードや文書を指定して検索を行う。そして、検索出力インタフェース123により、検索結果の文書の情報が表示されると、その文書の参照理由を用いてさらに検索を行う。
検索入力インタフェース122および検索出力インタフェース123では、以下のような入出力が行われる。
(1)利用者が文書を指定することで、その文書の本文を表示する。
(2)興味のある参照関係をフィルタとして使用する。
(3)参照理由を明示的に表示して参照関係を表示する。
(4)GUI(graphical user interface)を用いて、参照理由を明示しながら、あるいは参照関係を表す線または矢印の種類を参照理由によって変えながら、参照関係を画像表示する。
例えば、複数の文書を発行年順に並べて、文書間の参照関係を矢印で表すと、図19のようになる。ここでは、円形のマークが1つの文書を表し、複数の文書が時間軸に沿って時系列に表示されている。また、参照元の文書と被参照文書は参照理由毎に異なる線種の矢印で結ばれる。
このようなGUIを用いれば、複雑な参照関係における各文書の位置付けを明確に認識することができ、文書検索が効率化される。さらに、この表示画面中の文書マークを利用者が指定することにより、対応する文書の内容を表示したり、その文書が参照している文書のリストを表示したりすることもできる。
図19では、矢印の線種により参照理由を区別しているが、矢印の色によりこれを区別してもよく、参照理由を文字列で表示してもよい。次に、参照関係を利用したキーワード抽出装置について説明する。図20は、このようなキーワード抽出装置の構成図である。図20のキーワード抽出装置は、図2の参照理由同定装置の構成要素に加えて、キーワード抽出部131をさらに備える。
本文構造解析部24は、解析結果をキーワード抽出部131に出力し、キーワード抽出部131は、本文中で参考文献が参照されている位置の周辺の文章からキーワードを抽出し、それを参考文献のキーワードとして出力する。この場合、出力インタフェース29から出力される出力データ132には、文書データ30の文献名に加えて、参考文献、参照関係、およびキーワードの組み合わせのリストが含まれる。
このようなキーワード抽出装置によれば、文献の著者自身が選択したキーワードだけでなく、その文献を参照している他の文書に基づくキーワードも付与されることになる。したがって、主観的なキーワードだけではなく、客観的なキーワードを付与することが可能になる。
図21は、このような参照関係を利用したキーワードの例を示している。ここでは、ある文献の著者が“Machine Learning”、“Decision Tree ”等をキーワードとして付与し、キーワード抽出装置は、その文献を参照している他の文書の文脈から“Corpus”という新たなキーワードを抽出してキーワードのデータ構造に付加している。
図22は、このようにして付与されたキーワードを用いて文書を検索する情報検索システムを示している。図22の情報検索システムは、図11に示したシステムの構成要素に加えて、文献キーワード記憶部141をさらに備える。文献キーワード記憶部141には、文献にあらかじめ付与されたキーワードが格納され、参照関係データベース95には、図20のキーワード抽出装置により抽出された情報が格納される。
検索部102は、文献キーワード記憶部141と参照関係データベース95のキーワードを参照しながら全文データベース94の文書を検索し、選択部103は、文献キーワード記憶部141と参照関係データベース95の情報を用いて関連文書を選択する。このとき、表示の優先順位は、キーワードの一致度、参照関係に基づく重要度、および文書に対するアクセス回数を加味して決められる。
このような情報検索システムによれば、あらかじめ付与されたキーワードに加えて、参照関係を用いて客観的に付与されたキーワードを利用して検索することができ、検索効率が向上する。
また、文書間の参照関係を利用して多数の文書を分類することも可能である。図23は、このような参照関係に基づく分類を行う文書分類装置の構成図である。図23の文書分類装置は、参照関係データベース95、キーワード抽出装置151、および類似度判定装置152を備える。
キーワード抽出装置151は、図20のような構成を持ち、複数の文書データ153から参考文献に関する参照関係、キーワード等の情報を抽出して、参照関係データベース95に格納する。類似度判定装置152は、入力された文書間で参照理由を含む参照関係を比較し、参照関係の類似度に基づくクラスタリングを行って、文書クラスタ154を出力する。
例えば、文書aと文書bの間で参照関係の類似度を計算する際に、次のような計算式が用いられる。
Figure 2006172489
この計算式において、sim(a,b)は、文書aと文書bの間の類似度を表す。また、na、nbは、それぞれ、文書a、文書bが参照している被参照文書の数であり、rai、rbjは、それぞれ、文書a、文書bによる参照を表すベクトルであり、被参照文書とその参照理由の属性を持つ(i=1,2,...,na,j=1,2,...,nb)。
δ(rai,rbj)は、raiとrbjの間の類似度を表す関数である。この関数は、例えば、raiとrbjが同じ被参照文書を同じ参照理由で参照している場合はδ(rai,rbj)=1となり、そうでない場合はδ(rai,rbj)=0となるように定義される。また、raiとrbjが同じ被参照文書を異なる参照理由で参照していた場合に、δ(rai,rbj)に1または0.5を割り当てるという方法もある。
被参照文書についても同じ方法で類似度計算が行われ、計算結果に基づいて文書のクラスタリングが行われる。文書のクラスタリングには、例えば、上述の文献〔1〕のpp.436−438に記載されているアルゴリズムが用いられる。これにより、参照関係が互いに類似している複数の文書が同じクラスタに分類される。また、このような類似度計算に、さらにキーワードの一致度、単語の出現頻度等を加味したクラスタリングを行うこともできる。
このように、文書間の参照関係に基づいて文書を分類することにより、利用者は、参照理由を含む参照関係の観点から分類された文書群の情報を得ることができる。また、その分類結果を利用して文書を検索すれば、検索が効率化される。
図24は、図19に示した参照関係の時系列表示において、文書の分類結果を利用した例を示している。図24において、縦軸は、分類により得られた文書の種類を表し、横軸は、時間を表す。このような表示方法によれば、同じような参照関係を持つ文書が近接して配置され、多数の文書間の参照関係をより分かりやすく表示することができる。
以上説明した実施形態においては、文書間の参照関係に関する処理を行っているが、同様にして、任意の情報間における参照関係を処理することもできる。例えば、参考文献の代わりに、他のテキストデータ、画像データ、音声データ、プログラムリスト等が参照されている場合、それらの情報の参照理由が同定され、情報検索に利用される。
ところで、図2の参照理由同定装置、図11および図22の情報検索システム、図15の情報提示装置、図20のキーワード抽出装置、および図23の文書分類装置は、図25に示すような情報処理装置(コンピュータ)を用いて構成することができる。図25の情報処理装置は、CPU(中央処理装置)161、メモリ162、入力装置163、出力装置164、外部記憶装置165、媒体駆動装置166、およびネットワーク接続装置167を備え、それらはバス168により互いに接続されている。
メモリ162は、例えば、ROM(read only memory)、RAM(random access memory)等を含み、処理に用いられるプログラムとデータを格納する。CPU161は、メモリ162を利用してプログラムを実行することにより、必要な処理を行う。
入力装置163は、例えば、キーボード、ポインティングデバイス、タッチパネル等であり、利用者からの指示や情報の入力に用いられる。出力装置164は、例えば、ディスプレイ、プリンタ、スピーカ等であり、利用者へのメッセージや処理結果の出力に用いられる。
外部記憶装置165は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク(magneto-optical disk)装置等であり、図11の全文データベース94、参照関係データベース95、および図22の文献キーワード記憶部141として用いられる。また、情報処理装置は、この外部記憶装置165に、上述のプログラムとデータを保存しておき、必要に応じて、それらをメモリ162にロードして使用することができる。
媒体駆動装置166は、可搬記録媒体169を駆動し、その記録内容にアクセスする。可搬記録媒体169としては、メモリカード、フレキシブルディスク、CD−ROM(compact disk read only memory )、光ディスク、光磁気ディスク等、任意のコンピュータ読み取り可能な記録媒体が用いられる。利用者は、この可搬記録媒体169に上述のプログラムとデータを格納しておき、必要に応じて、それらをメモリ162にロードして使用することができる。
ネットワーク接続装置167は、任意のネットワーク(回線)を介して外部の装置と通信し、通信に伴うデータ変換を行う。情報処理装置は、必要に応じて、ネットワーク接続装置167を介して上述のプログラムとデータを外部の装置から受け取り、それらをメモリ162にロードして使用することができる。
図26は、図25の情報処理装置にプログラムとデータを供給することのできるコンピュータ読み取り可能な記録媒体を示している。可搬記録媒体169や外部のデータベース170に保存されたプログラムとデータは、メモリ162にロードされる。そして、CPU161は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。
本発明の装置の原理図である。 参照理由同定装置の構成図である。 文書構造解析部の処理のフローチャートである。 書誌情報解析部の処理のフローチャートである。 本文構造解析部の処理のフローチャートである。 参考文献解析部の処理のフローチャートである。 参照文脈解析部の処理のフローチャートである。 文書の例を示す図である。 第1の参照関係を示す図である。 第2の参照関係を示す図である。 情報検索システムの構成図である。 第1の検索結果表示を示す図である。 表示処理のフローチャートである。 第2の検索結果表示を示す図である。 情報提示装置の構成図である。 第3の参照関係を示す図である。 第4の参照関係を示す図である。 第5の参照関係を示す図である。 第1の時系列表示を示す図である。 キーワード抽出装置の構成図である。 参照関係を用いたキーワードを示す図である。 キーワードを用いた検索を示す図である。 文書分類装置の構成図である。 第2の時系列表示を示す図である。 情報処理装置の構成図である。 記録媒体を示す図である。 従来の情報検索システムを示す図である。 従来の表示形式を示す図である。
符号の説明
1、92 検索装置
2、94 全文データベース
3、95 参照関係データベース
4、101 制御部
5、102 検索部
6、103 選択部
11 被参照文書抽出手段
12 参照位置抽出手段
13 判断手段
14 出力手段
15 文書データベース手段
16 参照関係格納手段
17 検索手段
18 類似度判定手段
21、121 入力インタフェース
22 文書構造解析部
23 書誌情報解析部
24 本文構造解析部
25 参考文献解析部
26 参照文脈解析部
27 対応判断部
28 出力成形部
29 出力インタフェース
30、153 文書データ
31、132 出力データ
41、42、43、44、52、61、62、71 パターンデータリスト
51 ストップワードリスト
81 言語解析部
82 参照特徴−参照理由対応表
91、163 入力装置
93 表示装置
111 参照関係
112 検索結果
122 検索入力インタフェース
123 検索出力インタフェース
124 参照理由同定装置
125 参照関係変換装置
131 キーワード抽出部
141 文献キーワード記憶部
151 キーワード抽出装置
152 類似度判定装置
154 文書クラスタ
161 CPU
162 メモリ
164 出力装置
165 外部記憶装置
166 媒体駆動装置
167 ネットワーク接続装置
168 バス
169 可搬記録媒体
170 データベース

Claims (1)

  1. 与えられた文書データから被参照文書に関する文書情報を抽出する被参照文書抽出手段と、
    前記文書データ内で前記被参照文書を参照している位置である参照位置に関する情報を抽出する参照位置抽出手段と、
    前記参照位置抽出手段により抽出された参照位置の周辺の文字列を言語解析する言語解析手段と、
    少なくとも前記言語解析手段による言語解析の結果に基づき、前記被参照文書が参照されている理由である参照理由を判断する判断手段と、
    前記参照位置の周辺の情報から、前記被参照文書のためのキーワード情報を抽出するキーワード抽出手段と、
    前記被参照文書抽出手段により抽出された情報と前記参照理由と前記キーワード情報とを含む出力情報を出力する出力手段と
    を備えることを特徴とするキーワード抽出装置。
JP2006003148A 2006-01-11 2006-01-11 文書の参照理由を用いて情報検索を行なう装置 Pending JP2006172489A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006003148A JP2006172489A (ja) 2006-01-11 2006-01-11 文書の参照理由を用いて情報検索を行なう装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006003148A JP2006172489A (ja) 2006-01-11 2006-01-11 文書の参照理由を用いて情報検索を行なう装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP16855299A Division JP3791877B2 (ja) 1999-06-15 1999-06-15 文書の参照理由を用いて情報検索を行う装置

Publications (1)

Publication Number Publication Date
JP2006172489A true JP2006172489A (ja) 2006-06-29

Family

ID=36673092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006003148A Pending JP2006172489A (ja) 2006-01-11 2006-01-11 文書の参照理由を用いて情報検索を行なう装置

Country Status (1)

Country Link
JP (1) JP2006172489A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009096244A1 (ja) 2008-01-28 2009-08-06 Nippon Steel & Sumikin Stainless Steel Corporation 耐食性と加工性に優れた高純度フェライト系ステンレス鋼およびその製造方法
KR20160032714A (ko) * 2013-02-25 2016-03-24 패트릭 순-시옹 링크 연관 분석 시스템들 및 방법들

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009096244A1 (ja) 2008-01-28 2009-08-06 Nippon Steel & Sumikin Stainless Steel Corporation 耐食性と加工性に優れた高純度フェライト系ステンレス鋼およびその製造方法
KR20160032714A (ko) * 2013-02-25 2016-03-24 패트릭 순-시옹 링크 연관 분석 시스템들 및 방법들
JP2016514304A (ja) * 2013-02-25 2016-05-19 スン−シオン,パトリック リンク接続分析システムおよび方法
US9916290B2 (en) 2013-02-25 2018-03-13 Nant Holdigns IP, LLC Link association analysis systems and methods
US10108589B2 (en) 2013-02-25 2018-10-23 Nant Holdings Ip, Llc Link association analysis systems and methods
US10430499B2 (en) 2013-02-25 2019-10-01 Nant Holdings Ip, Llc Link association analysis systems and methods
US10706216B2 (en) 2013-02-25 2020-07-07 Nant Holdings Ip, Llc Link association analysis systems and methods
KR102160844B1 (ko) 2013-02-25 2020-09-28 패트릭 순-시옹 링크 연관 분석 시스템들 및 방법들
US10872195B2 (en) 2013-02-25 2020-12-22 Nant Holdings Ip, Llc Link association analysis systems and methods

Similar Documents

Publication Publication Date Title
JP3791877B2 (ja) 文書の参照理由を用いて情報検索を行う装置
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
US20150074112A1 (en) Multimedia Question Answering System and Method
US10198557B2 (en) System and method for content-based medical macro sorting and search system
US7853595B2 (en) Method and apparatus for creating a tool for generating an index for a document
JP2005092825A (ja) 文書フィルタリング装置、文書フィルタリング方法、および文書フィルタリングプログラム
JP2009199302A (ja) ドキュメントを解析するためのプログラム,装置および方法
JP2007025939A (ja) 多言語文書検索装置および多言語文書検索方法、並びに、多言語文書を検索するプログラム
JP2006172489A (ja) 文書の参照理由を用いて情報検索を行なう装置
Sohail et al. Methodologies and techniques for text summarization: a survey
JP2008197952A (ja) テキストセグメンテーション方法,その装置,そのプログラムおよびコンピュータ読み取り可能な記録媒体
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
JP4877930B2 (ja) 文書処理装置及び文書処理方法
JP4301879B2 (ja) 抄録作成支援システム及び特許文献検索システム
JP2008021028A (ja) キーワード抽出システム及びキーワード分類システム
JP2004220226A (ja) 検索文書のための文書分類方法及び装置
KR101986784B1 (ko) 특허 검색을 위한 최적 검색식 자동 추천 시스템 및 방법
JP2008171164A (ja) 分類付与支援装置及び方法及びプログラム
JP2003271616A (ja) 文書分類装置、文書分類方法及び記録媒体
Fersini et al. Semantic storyboard of judicial debates: a novel multimedia summarization environment
JP2005189955A (ja) 文書処理方法、文書処理装置、制御プログラム及び記録媒体
Singh et al. A Qualitative Analysis for Predicting the Future of Auto Text Summarization in Natural Language Processing
JPH08329059A (ja) 汎用参照装置
JP2003223466A (ja) 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体
JP2000259637A (ja) 情報検索装置及び情報検索方法並びに情報検索処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090602