JP5381704B2 - 情報提供システム - Google Patents

情報提供システム Download PDF

Info

Publication number
JP5381704B2
JP5381704B2 JP2009509357A JP2009509357A JP5381704B2 JP 5381704 B2 JP5381704 B2 JP 5381704B2 JP 2009509357 A JP2009509357 A JP 2009509357A JP 2009509357 A JP2009509357 A JP 2009509357A JP 5381704 B2 JP5381704 B2 JP 5381704B2
Authority
JP
Japan
Prior art keywords
expression
information
related document
extracted
document data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009509357A
Other languages
English (en)
Other versions
JPWO2008126862A1 (ja
Inventor
俊夫 竹田
享 赤峯
聡 中澤
開 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009509357A priority Critical patent/JP5381704B2/ja
Publication of JPWO2008126862A1 publication Critical patent/JPWO2008126862A1/ja
Application granted granted Critical
Publication of JP5381704B2 publication Critical patent/JP5381704B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Description

[関連出願の記載]
本発明は、日本国特許出願:特願2007−102895号(2007年4月10日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、情報提供システム、情報提供方法および情報提供プログラムに関し、特に引用された情報について補足情報を表示できる情報提供システム、情報提供方法および情報提供プログラムに関する。
電子化文書(以下、単に文書とも表記する。)には、HTML文書のタグなどにより明示的に示された引用文(引用部分)や、例えば、「首相は、『景気は回復している』と発言した」という文章における『景気は回復している』の部分のように文章上の表現で示された引用部分が含まれている。引用部分は、文章の発信者によって、出典である引用元の文章から選択・編集された文章である。そのため、引用部分を読んだ読み手は、引用部分を引用元と異なる内容として理解してしまう可能性がある。例えば、引用元の文章に記述されていた引用部分が成立するための限定条件や、引用部分を補うデータが不足している場合や、引用元の前後の文章に引用部分と関係する内容が存在することにより引用部分だけから読み取れる意味が引用元の文章とは異なる意味を持つ場合がある。
以下、引用部分が成立するための限定条件、参考データ、引用部分への修飾表現が示す情報であって、引用部分を正しく理解するための情報を、引用部分の補足情報と表記する。
引用元文書に存在する補足情報を確認する方法として、一般的に、引用元文書がWeb上の文書であってリンクが張られている場合には、リンク先の情報を別のブラウザで開いて確認する方法がある。しかし、引用元が明示されている必要があり、明示されていない場合は検索サイトで引用部分を検索するなどの手段をとる必要がある。また、リンク先に実際に引用部分の文章があるかどうか、文章を読んで確認するまで判断できない。
また、引用部分はトピックとして取り上げるべき内容を含んでいると考えられるため、引用元や現在参照している文書以外の文書によっても引用されている可能性が高く、そのような文書にも補足情報が記述されている場合がある。以下、引用部分を含むある文書に対して、引用部分の引用元文書、および同じ部分について引用を行っているその他の文書を、あわせて関連文書と呼ぶことにする。また、引用部分について、引用元文書の表記と同一または類似の表記を含む文書を、関連文書に含めるものとする。関連文書の補足情報を取得するためには、例えば、多数の文書から引用部分の文字列を検索し、文字列が見つかった関連文書について内容を確認して補足情報を探す必要がある。
特許文献1には、従来の情報提供システムの一例が電子化文書の参照関係表示装置として記載されている。特許文献1には、電子化文書を用いてなされる議論について、被参照文書の引用箇所終端にボタンを配置し、ボタンが操作されたときに参照文書中の引用箇所以降の部分を被参照文書中に階層的に挿入し、表示する方法が記載されている。
特許文献1に記載された方法を、被参照文書と参照文書との関係だけではなく、引用部分と引用元および関連文書との関係に対して適用すると、ボタンの有無により参照先の有無がわかるようになる。そのため、ボタンがある場合には、引用元を検索する必要がなくなり、実際に引用箇所以降の文章があることを保証することができる。しかし、特許文献1の技術を用いて階層的に挿入された文章の中に、引用部分に関連した情報があるかどうかは、挿入された文章を読んでみないとわからない。また、挿入された文章以外に引用部分の補足情報が存在するかどうかは、さらに引用元文書をすべて読まないと判断できず、多くの労力を要する。
一方、引用部分の抽出として、HTML文書においては、Webブラウザが引用部分の見た目を設定することを目的として、引用を示すblockquote要素およびq 要素を抽出することが一般的に行われている。また、特許文献1には、メール文書に対して、引用を示す行頭の記号を利用して引用部分の抽出を行うことが記載されている。
特開2000−112980号公報
以上の特許文献1の開示事項は、本書に引用をもって繰り込み記載されているものとする。以下に本発明による関連技術の分析を与える。
文章の引用部分に対して、関連文書の引用部分以降の文章を階層的に挿入し、表示する技術には、次のような問題点がある。
第1の問題点は、引用部分に対して、引用部分あるいは引用部分に類似した表記部分の補足情報が、関連文書(引用元文書を含む)中に存在するか確実に調べるためには、関係の無い文章を読んで関連文書の内容を確認する必要があるということである。その理由は、引用部分についての補足情報が、必ずしも引用部分以降の近傍にあるとは限らないためである。また、単純に引用部分以降の文章を一定量挿入する方法では、挿入される文章がすべて引用部分に関係する補足情報とも限らないため、補足情報ではない文章、つまり引用部分と関係のない情報まで読む必要が生じる場合がある。
第2の問題点は、関連文書の表示により閲覧が妨げられるということである。その理由は、引用元の情報をすべて表示すると、現在参照中の文章の表示が妨げられ、閲覧や操作が難しくなるためである。
そこで、本発明は、関連文書に含まれる引用部分に対する補足情報のみを提示し、不要な情報を読まなくても補足情報が得られ、閲覧を妨げない適切な量の情報を提示することができる情報提供システム、情報提供方法および情報提供プログラムを提供することを目的とする。
本発明の第1の視点によれば、文書データにおける引用部分に基づいて、引用部分と同一または類似の表現を含む関連文書データを1つ以上決定する関連文書決定手段と、前記文書データにおける引用部分と、前記関連文書決定手段が決定した関連文書データとを比較し、関連文書に含まれる差分テキストを抽出し、前記差分テキストから、前記差分テキストから、予め限定表現として着目する手掛かり表現を記憶している修飾表現部分抽出ルールを参照し、前記修飾表現部分抽出ルールに記憶されている手がかり表現が前記差分テキストに存在するとき、該手がかり表現を含む節又は文の文字列を、前記引用部分と同一または類似の表現に対する、条件、訂正、追加、注釈のいずれかに該当する限定表現として抽出する限定表現抽出手段と、前記限定表現抽出手段が抽出した表現または該表現に関する情報を、表示するための情報として生成する情報生成手段と、前記情報生成手段が生成した情報を表示する表示手段とを備えた情報提供システムが提供される。
他の文書データとして、引用部分と同一または類似の表現を含む関連文書データを決定する関連文書決定手段を備え、情報生成手段は、関連文書決定手段が決定した関連文書データから、引用部分と同一または類似の表現を修飾する表現を抽出することが望ましい。そのような構成によれば、引用部分と同一または類似の表現を対象として、修飾する表現を抽出することができる。
文書データにおける引用部分を抽出する引用部分抽出手段を備えることが望ましい。そのような構成によれば、自動的に引用部分を抽出することができる。
情報生成手段は、抽出した表現を示す情報として、抽出した表現を含む補足情報、補足情報の有無を示す情報または抽出した表現の内容の一部もしくは特徴を示す代替情報を生成してもよい。そのような構成によれば、適切な情報を適切に表示することができる。
情報生成手段は、引用部分を示す表現を修飾する表現を、限定的な表現に基づいて抽出する限定表現抽出手段を含んでもよい。そのような構成によれば、適切な情報を適切に表示することができる。
情報生成手段は、引用部分を示す表現を修飾する表現を、文脈に基づいて抽出する文脈解析手段を含んでもよい。そのような構成によれば、適切な情報を適切に表示することができる。
本発明の第2の視点によれば、文書データにおける引用部分に基づいて、引用部分と同一または類似の表現を含む関連文書データを1つ以上決定する関連文書決定ステップと、前記文書データにおける引用部分と、前記関連文書決定ステップで決定した関連文書データとを比較し、関連文書に含まれる差分テキストを抽出し、前記差分テキストから、前記差分テキストから、予め限定表現として着目する手掛かり表現を記憶している修飾表現部分抽出ルールを参照し、前記修飾表現部分抽出ルールに記憶されている手がかり表現が前記差分テキストに存在するとき、該手がかり表現を含む節又は文の文字列を、前記引用部分と同一または類似の表現に対する、条件、訂正、追加、注釈のいずれかに該当する限定表現として抽出する限定表現抽出ステップと、前記限定表現抽出ステップにて抽出した表現または該表現に関する情報を、表示するための情報として生成する情報生成ステップと、前記情報生成ステップで生成した情報を表示する表示ステップとを含む情報提供方法が提供される。
他の文書データとして、引用部分と同一または類似の表現を含む関連文書データを決定する関連文書決定ステップを含み、情報生成ステップで、関連文書決定ステップで決定した関連文書データから、引用部分と同一または類似の表現を修飾する表現を抽出することが望ましい。そのような構成によれば、引用部分と同一または類似の表現を対象として、修飾する表現を抽出することができる。
文書データにおける引用部分を抽出する引用部分抽出ステップを含むことが望ましい。そのような構成によれば、自動的に引用部分を抽出することができる。
情報生成ステップで、抽出した表現を示す情報として、抽出した表現を含む補足情報、補足情報の有無を示す情報または抽出した表現の内容の一部もしくは特徴を示す代替情報を生成してもよい。そのような構成によれば、適切な情報を適切に表示することができる。
情報生成ステップで、引用部分を示す表現を修飾する表現を限定的な表現に基づいて抽出してもよい。そのような構成によれば、適切な情報を適切に表示することができる。
情報生成ステップで、引用部分を示す表現を修飾する表現を文脈に基づいて抽出してもよい。そのような構成によれば、適切な情報を適切に表示することができる。
本発明の第3の視点によれば、コンピュータに、文書データにおける引用部分に基づいて、引用部分と同一または類似の表現を含む関連文書データを1つ以上決定する関連文書決定処理と、前記文書データにおける引用部分と、前記関連文書決定処理で決定した関連文書データとを比較し、関連文書に含まれる差分テキストを抽出し、前記差分テキストから、前記差分テキストから、予め限定表現として着目する手掛かり表現を記憶している修飾表現部分抽出ルールを参照し、前記修飾表現部分抽出ルールに記憶されている手がかり表現が前記差分テキストに存在するとき、該手がかり表現を含む節又は文の文字列を、前記引用部分と同一または類似の表現に対する、条件、訂正、追加、注釈のいずれかに該当する限定表現として抽出する限定表現抽出処理と、前記限定表現抽出処理にて抽出した表現または該表現に関する情報を、表示するための情報として生成する情報生成処理と、前記情報生成処理で生成した情報を表示する表示処理とを実行させるための情報提供プログラムが提供される。


コンピュータに、他の文書データとして、引用部分と同一または類似の表現を含む関連文書データを決定する関連文書決定処理を実行させ、情報生成処理で、関連文書決定処理で決定した関連文書データから、引用部分と同一または類似の表現を修飾する表現を抽出する処理を実行させることが望ましい。そのような構成によれば、引用部分と同一または類似の表現を対象として、修飾する表現を抽出することができる。
コンピュータに、文書データにおける引用部分を抽出する引用部分抽出処理を実行させることが望ましい。そのような構成によれば、自動的に引用部分を抽出することができる。
コンピュータに、情報生成処理で、抽出した表現を示す情報として、抽出した表現を含む補足情報、補足情報の有無を示す情報または抽出した表現の内容の一部または特徴を示す代替情報を生成する処理を実行させてもよい。そのような構成によれば、適切な情報を適切に表示することができる。
コンピュータに、情報生成処理で、引用部分を示す表現を修飾する表現を限定的な表現に基づいて抽出する限定表現抽出処理を実行させてもよい。そのような構成によれば、適切な情報を適切に表示することができる。
コンピュータに、情報生成処理で、引用部分を示す表現を修飾する表現を文脈に基づいて抽出する文脈解析処理を実行させてもよい。そのような構成によれば、適切な情報を適切に表示することができる。
本発明によれば、不要な情報を読むことなく引用部分に対する補足情報を確認することができる。その理由は、補足情報生成手段が実際に修飾している表現から補足情報を生成するためである。
本発明による情報提供システムの第1の実施の形態の構成例を示すブロック図である。 第1の実施の形態における情報提供システムの動作の例を示すフローチャートである。 引用表現の例を示す説明図である。 引用元指定表現の例を示す説明図である。 本発明による情報提供システムの第2の実施の形態の構成例を示すブロック図である。 限定表現の例を示す説明図である。 第2の実施の形態における情報提供システムの動作の例を示すフローチャートである。 本発明による情報提供システムの第3の実施の形態の構成例を示すブロック図である。 第3の実施の形態における情報提供システムの動作の例を示すフローチャートである。 第1の実施例の情報提供システムの構成例を示すブロック図である。 入力文書データとして入力したWebページの例を示す説明図である。 引用元文書として決定されたWebページの例を示す説明図である。 関連文書として決定されたWebページの例を示す説明図である。 第2の実施例の情報提供システムの構成例を示すブロック図である。 第2の実施例における情報提供システムの動作の例について説明するための説明図である。 表示画面の例を示す説明図である。
1 入力装置
2 引用部分抽出装置
3 関連文書決定装置
4 補足情報生成装置
41 限定情報抽出手段
42 文脈解析手段
5 表示装置
100 ネットワーク制御装置
200 パーソナルコンピュータ
300 ディスプレイ装置
400 インターネット
600 音声収録装置
601 マイクロフォン
602 音声認識装置
603 発言データベース
[本発明の好ましい一態様]
本発明による情報提供システムの好ましい一態様は、例えば、入力文書から引用部分を抽出する引用部分抽出手段と、引用部分の関連文書を決定する関連文書決定手段と、引用部分抽出手段が抽出した引用部分と、関連文書決定手段により決定した関連文書から補足情報を生成する補足情報生成手段とを備え、引用部分に含まれない関連文書の情報で、引用部分と類似または同一の表記部分への修飾表現による情報を補足情報として提供するよう動作する。このような構成を採用し、補足情報のみを提供することにより本発明の目的を達成することができる。
つまり、引用部分抽出手段が文章から引用部分を抽出し、関連文書決定手段が引用部分が含まれている関連文書を決定し、補足情報生成手段が関連文書中の引用部分と類似または同一の表現を修飾している表現から補足情報を生成するため、無関係な文書を対象とすることなく、引用部分と同一または類似の表現を対象として、修飾する表現を抽出することもできる。また、自動的に引用部分を抽出することも可能となる。さらに、補足情報生成手段が文章全体ではなく引用部分に対する修飾表現のみからなる補足情報を生成するようにすれば、補足情報の表示により参照中の文書の閲覧が妨げられないようにすることもできる。
実施の形態1.
以下、本発明の第1の実施の形態を図面を参照して説明する。図1は、本発明による情報提供システムの第1の実施の形態の構成例を示すブロック図である。図1に示す情報提供システムは、入力装置1と、引用部分抽出装置2と、関連文書決定装置3と、補足情報生成装置4と、表示装置5とを備える。
入力装置1は、例えば、キーボードやマウス等の入力デバイスによって実現され、引用を行っている文書データを入力する。すなわち、入力装置1は、引用部分を含む文書データを入力する。
引用部分抽出装置2は、入力装置1が入力した文書データ(以下、入力文書データと表記する場合がある。)から引用部分を抽出する。例えば、引用部分抽出装置2は、HTML文書のタグ等の引用を明示的に示す記法を解析することにより、入力装置1が入力した入力文書データから引用部分を抽出する。また、引用部分抽出装置2は、例えば、文章表現上の引用を示す表現を解析することにより、引用部分を抽出する。引用部分抽出装置2は、抽出した引用部分を示す情報を、関連文書決定装置3および補足情報生成装置4に出力する。
関連文書決定装置3は、入力文書データや引用部分に基づいて、関連文書および関連文書中の引用部分と同一または類似する表記部分を決定する。また、関連文書決定装置3は、決定した関連文書および関連文書中の引用部分と類似または同一の表記部分を示す情報を、補足情報生成装置4に出力する。
すなわち、関連文書決定装置3は、入力装置1が入力した入力文書データもしくは引用部分抽出装置2が抽出した引用部分、または入力文書データおよび引用部分を元に、関連文書データを決定する。関連文書決定装置3は、例えば、入力文書データから引用部分についての記載を抽出し、抽出した記載に基づいて、検索対象の文書が関連文書であるか否かを判断する。引用部分についての記載とは、例えば、引用部分の引用元文書を示す情報等である。また、関連文書決定装置3は、関連文書における引用部分についての記載として、引用部分と類似または同一の表記部分を決定する。
補足情報抽出装置4は、引用部分と関連文書中の文章に基づいて、関連文書から、引用部分と類似または同一の表記部分を修飾する表現の部分(以下、修飾表現部分と表記する場合がある。)を抽出し、補足情報を生成する。すなわち、補足情報抽出装置4は、引用部分抽出装置2が抽出した引用部分と関連文書決定装置3が決定した関連文書データとを比較し、関連文書中の引用部分と類似または同一の表記部分を修飾する表現を補足情報として抽出する。すなわち、補足情報は、補足情報抽出装置4が抽出した表現を含む情報である。ここで、補足情報として抽出する表現には、テキスト文章や、HTMLなどのタグによって示された情報を含む。例えば、HTML文書内の引用部分が、<DEL>タグによって削除したことを示してあった場合、<DEL>タグの情報も補足情報である。
表示装置5は、例えば、液晶表示装置や有機ELディスプレイ装置等のディスプレイ装置によって実現され、補足情報を表示する。表示装置5が、例えば、ディスプレイ装置の場合は、補足情報を表す文字列や記号、画像、映像を表示すること、あるいは現在の表示内容に対して、色、書体などを変化させることで補足情報を表示する。
なお、情報提供システムは、コンピュータで実現可能であり、情報提供システムを構成する各構成要素、すなわち、引用部分抽出装置2、関連文書決定装置3および補足情報抽出装置4は、コンピュータの処理装置(CPU)に上述した機能を実現させるためのプログラムとして実現可能である。情報提供システムを構成する各構成要素がコンピュータで実現可能であること、およびプログラムとして実現可能であることは、第1の実施の形態に限らず、他の実施の形態でも同様である。
次に、図面を参照して第1の実施の形態の動作について説明する。図2は、第1の実施の形態における情報提供システムの動作の例を示すフローチャートである。
まず、引用部分抽出装置2は、入力装置1から入力文書を入力する。引用部分抽出装置2は、入力文書から、引用を示す働きを持つ引用表現で書かれた部分を抜き出すことにより、引用部分の抽出を行う(ステップS1)。図3は、引用表現の例を示す説明図である。図3に示すように、引用表現には、例えば、HTML文書のq 要素やblockquote要素、括弧で囲まれた文章や、「〜と発言した」「〜と書かれていた」等の引用を節としてとる表現などがある。例えば、引用部分抽出装置2は、図3に示す引用表現を引用部分抽出ルールとして含む設定情報をあらかじめ記憶装置に記憶している。そして、引用部分抽出装置2は、設定情報に示される引用部分抽出ルールに従って引用部分を抽出する。
次に、関連文書決定装置3は、引用部分と類似または同一の表現を含む文書を関連文書と決定するための処理を実行し(ステップS2)、関連文書があるか否かを判定する(ステップS3)。
関連文書を決定する方法として、例えば、引用部分の文字列に基づいて同一表現の検索や類似検索をすることにより、検索対象の文書が関連文書であるか調べる方法がある。その場合、入力文書中の引用部分について言及している箇所から、例えば、引用元文書の出典を示す発信者名、発信日時、文書の種類を抽出する。そして、抽出した情報を利用して検索対象の文書を検索し、検索結果を分類することにより文章を絞り込むこともできる。
また、入力文書中の引用元を示す表現である引用元指定表現を参照することによって引用元文書を決定することができる。図4は、引用元指定表現の例を示す説明図である。図4に示すように、引用元指定表現は、例えば、URL、会社名、論文名、発信者名、場所、時刻およびこれらの組み合わせを含む表現であって、例えば、「首相の3月1日の記者会見での発言」などの表現がある。また、文字列検索と引用元指定表現の両方を利用することもできる。例えば、入力文書中に「URL」等の文字列が含まれる場合には、関連文書決定装置3は、「URL」以降の文字列を抽出し、抽出した文字列に従ってWebサイトにアクセスし、引用元文書を収集する。
ここで、検索対象の文書は、例えば、インターネット上のWebページであってもよい。また、データベースに蓄積された文書であってもよい。
ステップS3において、関連文書があると判断した場合(Yes)、補足情報生成装置4は、引用部分と関連文書とを比較し、関連文書において、引用部分を修飾する表記部分があるか調べ、あればこれを抽出して、補足情報を生成する(ステップS4)。補足情報生成装置4は、補足情報があるか否かを判断し(ステップS5)、あると判断した場合(Yes)、表示装置5に、補足情報を表示させる(ステップS6)。
一方、補足情報生成装置4は、ステップS3で関連文書がないと判断した場合(No)およびステップS5で補足情報がないと判断した場合(No)、表示装置5に、補足情報をまったく表示しないか、補足情報がない旨の表示をさせる(ステップS7)。
次に、第1の実施の形態の効果について説明する。第1の実施の形態では、引用部分抽出装置2が、引用部分を抽出するように構成されているため、読み手が指定することなく文章の引用部分を取得し、その補足情報を提供することができる。
また、関連文書決定装置3が、引用部分と類似または同一の表現を含む文書を関連文書として決定するため、無関係な文書を対象とすることなく、引用部分の表現と関係する文書の情報を補足情報として提供することができる。
さらに、補足情報生成装置4が、引用部分と関連文書の情報を比較し、引用部分を修飾する表現から生成した補足情報のみを提供するように構成されているため、読み手に不要な情報を読ませることがなく、また、読み手に適切な量の情報を提供できる。さらに、補足情報のみ表示することで、関連文書全体を表示する場合と比べて表示に必要な領域は小さくなり、現在閲覧中の文書の表示を妨げずに補足情報を提供することができる。
第1の実施の形態の変形例として、引用部分抽出装置2において、入力された文書中の引用部分を自動的に抽出する代わりに、人間の読み手により明示的に引用部分を選択させる装置であってもよい。このような構成の場合、読み手の希望する引用部分についてのみ補足情報を表示することで、不要な引用部分に対する補足情報を表示することなく、適切な補足情報を提供することができる。また、文章中の引用表現でも読み手によって適切に選択されるため、関連文書をより正確に決定することができる。
引用部分抽出装置2が抽出した引用部分を読み手に提示して、読み手がさらに引用部分の修正を行うことを可能にしてもよい。この場合は、正確に引用部分を抽出できた場合は読み手が操作する必要がなく、修正が必要な場合のみ読み手が正確に引用部分を指定して、適切に関連文書を決定することができる。
ここで、関連文書決定装置3は、関連文書を複数検出する場合がある。検出した関連文書の全部が、補足情報を抽出する対象となる関連文書である場合、検出したすべての関連文書から補足情報を生成することができる。各関連文書から抽出された補足情報に対して、どの関連文書から抽出されたのかを示す情報を追加してもよい。
第1の実施の形態の変形例として、関連文書決定装置3が関連文書を複数検出する場合に、検出した関連文書から補足情報抽出の対象とする関連文書を制限してもよい。
対象関連文書の制限を行う場合、文書に重要度の重み付けを行い、その重みが基準値以上の重みを持つ文書を対象にしてもよい。文書の重要度の重み付けの方法として、例えば、作成日時の新しさ、文書が参照された数、他の文書からの引用回数、発信者の分類、現在参照中の文章との類似度によって重み付けする方法がある。この場合、より重要と考えられる関連文書のみを対象にできるため、重要であると考えられる補足情報のみを提供し、重要でないと考えられる補足情報は表示しないようにすることができる。
または、文章の重要度の重みで順位付けを行って、その上位の一定数を対象にしてもよい。この場合、補足情報抽出の対象とする関連文書の量が一定数以上にならないため、補足情報の表示までの処理の負荷が大きくなりすぎることを抑制することができる。また、表示される補足情報の量が多くなりすぎることを抑制することができる。
さらに、重要度でもっとも重要な文書1つを対象にしてもよい。この場合は、より補足情報の数が少なく、重要と思われる情報になるため、より閲覧を妨げることなく詳しい補足情報を表示することが可能になる。
また、対象関連文書を、引用部分の引用元文書に制限してもよい。ある関連文書を引用元文書であると判断するには、引用部分に引用元指定表現がある場合、引用元指定表現によって示された文書を引用元文書とする方法がある。また、関連文書の作成日時を取得して、作成日時が最も古い文書を引用元の文書であるとみなす方法がある。この構成の場合、引用元文書に含まれている補足情報を表示することで、現在参照している文書で引用した引用部分の本来の情報を読み手は正しく理解できる。
また、複数または1つ選択して対象とした関連文書と別に、引用元である関連文書(引用元文書)を対象として、両方から補足情報を生成してもよい。
実施の形態2.
次に、本発明の第2の実施の形態を図面を参照して説明する。図5は、本発明による情報提供システムの第2の実施の形態の構成例を示すブロック図である。第2の実施の形態は、補足情報生成装置4が限定表現抽出手段41を有する点で、図1に示す第1の実施の形態と異なる。
限定表現抽出手段41は、関連文書から、引用部分と類似または同一の表現に対して、条件や、訂正、追加情報などの修飾を行っている部分を引用部分に対する限定表現として抽出する。こうした限定表現は、引用部分に隣接した箇所、またはページ末尾、文書末尾、脚注箇所などの文書中の特定箇所に、限定表現であることを示す手がかり表現の存在に着目することで抽出できる。図6は、限定表現の例を示す説明図である。図6に示すように、限定表現には、例えば、「ただし〜」「〜の場合」「〜まで」等の手がかりにより文中に現れる表現や、「全製品3割引き(特価品を除く)」における「(特価品を除く)」部分のように、引用部分の文章に隣接する括弧で囲まれた部分や、「注意〜」「※〜」「訂正:〜」「追加:〜」「補足:〜」等の手がかり表現で導かれる注釈、訂正、追加情報がある。例えば、限定表現抽出手段41は、図6に示す限定表現を修飾表現部分抽出ルールとして含む設定情報をあらかじめ記憶装置に記憶している。そして、限定表現抽出手段41は、設定情報に示される修飾表現部分抽出ルールに従って修飾表現部分として限定表現を抽出する。
次に、図面を参照して第2の実施の形態の動作について説明する。図7は、第2の実施の形態における情報提供システムの動作の例を示すフローチャートである。図7に示すステップS1〜S3の引用部分抽出、関連文書抽出の動作は、第1の実施の形態と同じであるため、説明を省略する。
補足情報生成装置4は、引用部分と関連文書を比較し、関連文書のみに含まれる差分テキストを抽出する(ステップS4)。ここで、限定情報抽出手段41は、差分テキスト中に、限定表現によって引用部分を限定する部分があるか否かを調べる(ステップS11)。ステップS11において、限定情報抽出手段41は、限定表現によって引用部分を限定する部分があれば、これを抽出して、補足情報を生成する。
ステップS5〜S7の補足情報表示の動作は、第1の実施の形態と同じであるため、説明を省略する。
次に、第2の実施の形態の効果について説明する。第2の実施の形態では、関連文書中の引用部分を限定表現によって修飾している部分(補足情報)のみを表示することにより、読み手に引用部分について限定した適切な補足情報のみを提示する事ができる。また、引用部分について限定した補足情報のみ表示することにより、限定されていない情報を含む補足情報を表示する場合に比べて、表示に必要な領域が少なくなり、引用先文章の表示を妨げずに補足情報を提供することができる。
実施の形態3.
次に、本発明の第3の実施の形態を図面を参照して説明する。図8は、本発明による情報提供システムの第3の実施の形態の構成例を示すブロック図である。第3の実施の形態は、補足情報生成装置4が文脈解析手段42を有する点で、図1に示す第1の実施の形態と異なる。
文脈解析手段42は、関連文書に存在する情報のうち、引用部分と類似または同一の表現を修飾する文脈にある文章またはその一部を修飾表現部分として抽出し、補足情報を生成する。引用部分と類似または同一の表現と修飾関係にある部分は、談話解析技術や照応解析技術を用いることで判定できる。ここで、文脈情報の例として、係り受け関係や代名詞による参照関係が挙げられる。例えば、引用部分で言及されている人物が後の文章で代名詞によって参照された場合は、照応解析技術によって、その代名詞の人物が引用部分の人物であると判定することにより、後の文章で内容は引用部分を修飾する文脈にあると判断できる。具体的には、引用部分が「ゴア氏は環境問題のシンポジウムで講演を行った。」であるときに、後の文章で「彼はクリントン政権下で副大統領だった。」とあれば、後の文章の代名詞「彼」が引用部分の「ゴア氏」を指すことを判定し、後の文章が引用部分を補足する情報があると判断できる。
次に、図面を参照して第3の実施の形態の動作について説明する。図9は、第3の実施の形態における情報提供システムの動作の例を示すフローチャートである。図9に示すステップS1〜S3の引用部分抽出、関連文書抽出の動作は、第1の実施の形態と同じであるため、説明を省略する。
補足情報生成装置4は、引用部分と関連文書を比較し、関連文書のみに含まれる差分テキストを抽出する(ステップS4)。ここで、文脈解析手段42は、差分テキストの文脈解析を行うことによって、引用部分と類似または同一の表現を修飾する文脈の表現があるか否かを調べる(ステップS21)。ステップS21において、文脈解析手段42は、引用部分と類似または同一の表現を修飾する文脈の表現があれば、これを抽出して、補足情報を生成する。
ステップS5〜S7の補足情報表示の動作は、第1の実施の形態と同じであるため、説明を省略する。
次に、第3の実施の形態の効果について説明する。第3の実施の形態では、文脈解析によって、引用部分を修飾する文脈にある文章または文章の一部が補足情報として抽出されるため、より適切な補足情報のみを読み手に提示することができる。また、文脈上、引用部分と関係しない部分を表示する場合に比べて、表示に必要な面積が小さくなり、閲覧中の文章の表示を妨げずに補足情報を提供することができる。
第3の実施の形態の変形例として、文脈情報の抽出を、引用部分の前後の数文、あるいは引用部分を含む段落までに範囲を限定すると、関連文書中の引用部分から離れた箇所にある情報が補足情報として採用されなくなる。そのため、関連性の薄い情報を減少させることができる。また、文脈解析にかかる時間を減少させ、補足情報の出力を高速に行うことができる。
なお、第2の実施の形態の限定表現抽出手段41と、第3の実施の形態の文脈解析手段42とを同時に適用し、それぞれの手段で抽出された補足情報を出力してもよい。
次に、第1〜第3の実施の形態の実施例について説明する。図10は、第1の実施例の情報提供システムの構成例を示すブロック図である。図10に示す情報提供システムは、ネットワーク制御装置100と、パーソナルコンピュータ200と、ディスプレイ装置300とを備える。
まず、第1の実施の形態の実施例について説明する。ネットワーク制御装置100は、インターネット400に接続される。ネットワーク制御装置100は、図1に示す入力装置1としてインターネット400を介してWebページを入力文書データとして入力し、引用部分抽出装置2に出力する。パーソナルコンピュータ200は、図1に示す引用部分抽出装置2と、関連文書決定装置3と、補足情報生成装置4とを含む。ディスプレイ装置300は、図1に示す表示装置5として補足情報を表示する。
次に、第1の実施例における情報提供システムの動作について説明する。ネットワーク制御装置100は、インターネット400を介して、Webページを入力文書データとして入力する。図11は、入力文書データとして入力したWebページの例を示す説明図である。図11(a)には、引用部分「通話料無料」が含まれるWebページの表示例を示す。また、図11(b)には、blockquote要素による引用部分「通話料無料」が含まれるHTMLファイルの例を示す。ネットワーク制御装置100は、入力したWebページをパーソナルコンピュータ200の引用部分抽出装置2に出力する。
引用部分抽出装置2は、入力したWebページからblockquote要素を検出し、引用部分を抽出する。図11に示す例では、引用部分として「通話料無料」が抽出される。
関連文書決定装置3は、blockquote要素の直前に記述された企業名「XXX社」、発信日「11/1」および文書名「ニュースリリース」を抽出し、抽出した文字列と引用部分の文字列を検索語としてインターネット上のWebページを検索する。そして、関連文書決定装置3は、検索した結果から複数の関連文書を決定する。ここで、関連文書の中で、引用元文書のみをほかの関連文書とは別に扱ってもよい。
ここでは、企業名、発信日および文書名の各情報に基づいて、引用元文書として引用元のWebページ(以下、引用元Webページと表記する場合がある。)を決定することができたとする。図12は、引用元文書として決定されたWebページの例を示す説明図である。関連文書決定装置3は、引用元Webページにおいて、引用部分と同じ文字列を検索し、引用位置を特定する。
例えば、図11を参照すると、引用部分は「通話料無料」である。したがって、関連文書決定装置3は、文字列「通話料無料」に基づいて、図12に示す引用元文書を検索する。図12には、引用元文書に引用部分文字列「通話料無料」が含まれている場合を例示する。
補足情報生成装置4は、引用部分抽出装置2から入力Webページの引用部分文字列を受け取り、関連文書決定装置3から引用元Webページおよび引用元Webページ中の引用位置を示す情報を受け取る。そして、補足情報生成装置4は、引用部分と引用元Webページの文章に基づいて、引用元Webページから、引用部分を修飾している情報を補足情報として抽出する。
次に、第2の実施の形態の実施例について説明する。第2の実施の形態では、限定表現抽出手段41は、引用元Webページ中の引用部分を限定表現によって修飾している部分として、引用部分に制限を加える限定表現「〜では」を含む「新料金プランでは」と、限定表現「〜場合」を含む「XXX社の携帯電話にかけた場合」と、注釈の存在を示す限定表現「※1」から「21時から23時は30秒20円の通話料がかかります。」とを補足情報として抽出する(図12参照。)。
次に、第3の実施の形態の実施例について説明する。第3の実施の形態では、文脈解析手段42は、引用部分と同一の文内で係り受け関係により引用部分を修飾している部分として、「新料金プランでは、XXX社の携帯電話にかけた場合」と、引用部分と並列に「新料金プラン」の説明をしている「また、メールも無料です」とを補足情報として抽出する(図12参照。)。
引用元文書のほかに関連文書を取得できた場合にも補足情報を取得できる。図13は、関連文書として決定されたWebページの例を示す説明図である。関連文書決定装置3は、関連文書において、引用部分「通話料無料」を文字列検索により決定する。
図13を参照すると、補足情報生成装置4は、引用部分を指す参照関係「以下の様に」を含む「先日発表になったXXX社の新料金プランでは以下の様にうたって宣伝していた」を補足情報として抽出する。また、接続詞「しかし」で接続している「公正取引委員会から誇大広告であると警告を受けることになった」を補足情報として抽出する。さらに、限定表現である「追記」を含む「11/10追記:後日競合するYYY社、ZZZ社も指摘を受けることになった」を補足情報として抽出する。
ここで、関連文書決定装置3は、関連文書において引用部分の類似表現をさらに検索し、補足情報生成装置4は、検索された類似表現についての補足情報を引用部分に対する補足情報として抽出してもよい。図13に示す例では、関連文書決定装置3は、引用部分「通話料無料」に対する類似表現として「通話料が無料になる」を取得し、補足情報生成装置4は、類似表現についての補足情報である「条件はXXX社同士の通話で、指定時間内に限られると言うことらしい」を抽出する。
ディスプレイ装置300は、引用元の補足情報を取得すると、取得した補足情報を表示する。補足情報の表示において、ディスプレイ装置300は、補足情報である関連文書上の文章をそのまま表示してよい。その場合、読み手は、関連文書での実際の文章を確認することができる。
また、関連文書における補足情報部分の表現を変更して読みやすい表現に修正してもよい。例えば、代名詞を補ったり、不要な表現を削除したり、文節で抜き出した補足情報を文の形に直したり、複数文にわたる補足情報や同一内容の補足情報を要約したり、外国語で書かれた補足情報を翻訳したりすることができる。その場合、読み手にとって、補足情報の理解が容易になる。
また、表示される情報が、補足情報を表す文章そのものではなく、補足情報の有無や、抽出した表現の内容の一部または特徴を示す代替表示(代替情報)であってもよい。代替表示の内容には、例えば、補足情報の有無、限定表現、引用時や前回参照時からの更新情報の有無、内容の種別が含まれる。代替表示の表現方法は、文字列やアイコンの表示、または引用部分自体の字体の変更や色の変更でもよい。代替表示には詳細な補足情報の表示機能があってもよい。また、代替表示に関連文書の補足情報を示す該当箇所へのリンク機能があってもよい。
例えば、引用元文書や関連文書に、図12に例示する限定表現「〜の場合」がある場合には、限定表現があることを示す「限定」「限」等の文字列や、この文字列を図案化したものにより、限定表現の有無を示すことができる。また、例えば、図13に例示する限定表現「11/10追記:後日競合するYYY社、ZZZ社も指摘を受けることになった」のような更新された補足情報がある場合には、「更新」「Update」「New 」などの文字列や、この文字列を図案化したもの、さらに更新日時を示す文字列「11/10」等によって、更新された補足情報の有無を示すことができる。
このように、補足情報の有無やその種別についての情報を表示することによって、補足情報をそのまま表示するよりもさらに表示が簡潔になり、閲覧中の文書の表示を妨げない表示が可能になる。読み手が補足情報がある引用部分のみを選択して、詳細な補足情報や関連文書を確認することができる。これは閲覧中の文書中に引用部分が多い場合にさらに有用である。
補足情報の表示位置として、例えば、入力Webページ上の、引用部分の直前の位置、直後の位置、引用部分を含む行の直前の位置、直後の位置、左右の余白位置等に補足情報を挿入して表示してもよい。また、別の画面上の表示領域に表示してもよい。また、別のウィンドウ上に表示してもよい。
さらに、表示するタイミングは、入力Webページの表示と同時でもよい。この場合、読み手は、あらかじめ補足情報を含む補足されたWebページを閲覧することができる。また、読み手が引用部分を指示した時点で補足情報を表示してもよい。引用部分を指示するには、例えば、カーソルを近づけることで可能である。この場合、入力Webページの閲覧を妨げることなく、読み手が引用部分の補足情報を希望した場合にのみ補足情報を表示することができる。
次に、第2の実施の形態の実施例について説明する。図14は、第2の実施例の情報提供システムの構成例を示すブロック図である。図14に示す情報提供システムは、音声収録装置600と、パーソナルコンピュータ200と、ディスプレイ装置300とを備える。
音声収録装置600は、例えば、会議室に設置される。音声収録装置600は、マイクロフォン601と、音声認識装置602と、発言データベース603とを含み、図1に示す入力装置1として動作する。マイクロフォン601は、音声入力装置であって、会議の発言の音声を入力して電気信号に変換し、音声認識装置602に出力する。音声認識装置602は、マイクロフォン601によって出力された電気信号を音声認識処理を行うことによってテキストデータに変換し、入力文書データとして発言データベース603に記憶させる。また、発言データベース603は、例えば、過去の会議の発言についてのテキストデータを、関連文書データの検索対象となる文書データとして記憶する。
パーソナルコンピュータ200は、図1に示す引用部分抽出装置2と、関連文書決定装置3と、補足情報生成装置4とを含む。ディスプレイ装置300は、図1に示す表示装置5として補足情報を表示する。
次に、第2の実施例における情報提供システムの動作について説明する。図15は、第2の実施例における情報提供システムの動作の例について説明するための説明図である。マイクロフォン601は、発言を入力し(ステップS31)、音声認識装置602は、音声認識処理を行い(ステップS32)、テキストデータに変換する(ステップS33)。以下、音声認識装置602がテキストデータに変換した発言が「Aさんは前回の会議で『プランXにしましょう』と言いましたよ」である場合を例にして説明する。
ここで、『プランXにしましょう』が引用部分である。すなわち、引用部分抽出装置2は、発言の文章構造を解析し、引用部分『プランXにしましょう』を抽出する(ステップS34)。関連文書決定装置3は、発言者として「Aさん」を抽出し、発言日時として「前回の会議」を抽出する(ステップS35)。そして、関連文書決定装置3は、抽出した文字列と引用部分文字列とを検索語として発言データベース603を検索し(ステップS36)、例えば、類似する表現を含む発言データ「3月末が締め切りなので、プランXを進めることにしましょう。」を抽出する(ステップS37)。また、関連文書決定装置3は、引用部分に類似する表記部分として「プランXを進めることにしましょう」を決定する。
補足情報生成装置4は、発言データから、引用部分に類似する表記部分を限定表現「ので」で修飾している部分として、理由の表現「3月末が締め切りなので」を抽出し、補足情報として、「3月末が締め切り」という“理由”を示す補足情報を生成する(ステップS38)。
図16は、表示画面の例を示す説明図である。表示装置5として動作するディスプレイ装置300は、例えば、補足情報が生成された発言のテキストと、補足情報の種類として「理由」が表示されたボタンとを表示する(図16参照。)。例えば、発言に対応付けて設けられたボタンが押下されると、ディスプレイ装置300は、ボタンに対応する発言の補足情報を表示する(図16参照。)。例えば、会議参加者が、Aさんが前回の会議で『プランXにしましょう』という旨の発言をした理由を知りたい場合、例えば、ボタンを押下して補足情報の詳細を表示させることにより、「3月末が締め切り」であるからだとわかる。
ここで、入力(すなわち、引用部分を含む入力文書データ)は、映像による入力を音声認識でテキストにしたものであってもよい。また、発言データベース603に蓄積したデータが音声データであってもよく、関連文書の決定を、発言者や日時の指定等の情報によって行い、音声認識を行うのは補足情報を生成する時点に限定してもよい。この場合、現在行われている会議について引用した場合など、音声認識を行う時間がない場合に利用することが容易になる。
また、引用部分に基づいて関連文書を決定する際に、最初に同一の表現を含む関連文書を検索し、検索されなかった場合に、類似する表現を含む関連文書を検索してもよい。類似表現には、例えば、表記のゆれや、類義語の入れ替えや、文節の順序の変更等を含む。さらに見つからなければ、より広範囲の表現を類似表現の対象とするようにしてもよい。この構成の場合、引用が正確でない場合により関連文書を適切に決定できるようになる。また、同一表現が見つからなかった段階で、さらに類似表現を対象とするか利用者に問い合わせてもよい。
本発明によれば、Web上の文章に含まれる引用部分から、関連文書に含まれる補足情報を確認する等の用途に適用できる。また、新聞等の取材記事中の発言箇所から、元のインタビューの録音、録画映像中の元の発言の意図を確認して記事の信頼性を確認する等の用途にも適用可能である。
本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。

Claims (12)

  1. 文書データにおける引用部分に基づいて、引用部分と同一または類似の表現を含む関連文書データを1つ以上決定する関連文書決定手段と、
    前記文書データにおける引用部分と、前記関連文書決定手段が決定した関連文書データとを比較し、関連文書に含まれる差分テキストを抽出し、前記差分テキストから、予め限定表現として着目する手掛かり表現を記憶している修飾表現部分抽出ルールを参照し、前記修飾表現部分抽出ルールに記憶されている手がかり表現が前記差分テキストに存在するとき、該手がかり表現を含む節又は文の文字列を、前記引用部分と同一または類似の表現に対する、条件、訂正、追加、注釈のいずれかに該当する限定表現として抽出する限定表現抽出手段と、
    前記限定表現抽出手段が抽出した表現または該表現に関する情報を、表示するための情報として生成する情報生成手段と、
    前記情報生成手段が生成した情報を表示する表示手段と
    を備えたことを特徴とする情報提供システム。
  2. 前記情報生成手段は、前記限定表現抽出手段が抽出した表現の有無を示す情報または前記限定表現抽出手段が抽出した表現の内容の一部もしくは特徴を示す代替情報を生成する請求項1記載の情報提供システム。
  3. 文書データにおける引用部分に基づいて、引用部分と同一または類似の表現を含む関連文書データを1つ以上決定する関連文書決定ステップと、
    前記文書データにおける引用部分と、前記関連文書決定ステップで決定した関連文書データとを比較し、関連文書に含まれる差分テキストを抽出し、前記差分テキストから、予め限定表現として着目する手掛かり表現を記憶している修飾表現部分抽出ルールを参照し、前記修飾表現部分抽出ルールに記憶されている手がかり表現が前記差分テキストに存在するとき、該手がかり表現を含む節又は文の文字列を、前記引用部分と同一または類似の表現に対する、条件、訂正、追加、注釈のいずれかに該当する限定表現として抽出する限定表現抽出ステップと、
    前記限定表現抽出ステップにて抽出した表現または該表現に関する情報を、表示するための情報として生成する情報生成ステップと、
    前記情報生成ステップで生成した情報を表示する表示ステップと
    を含むことを特徴とする情報提供方法。
  4. 前記情報生成ステップで、前記限定表現抽出ステップで抽出した表現の有無を示す情報または前記限定表現抽出ステップで抽出した表現の内容の一部もしくは特徴を示す代替情報を生成する請求項3記載の情報提供方法。
  5. コンピュータに、
    文書データにおける引用部分に基づいて、引用部分と同一または類似の表現を含む関連文書データを1つ以上決定する関連文書決定処理と、
    前記文書データにおける引用部分と、前記関連文書決定処理で決定した関連文書データとを比較し、関連文書に含まれる差分テキストを抽出し、前記差分テキストから、予め限定表現として着目する手掛かり表現を記憶している修飾表現部分抽出ルールを参照し、前記修飾表現部分抽出ルールに記憶されている手がかり表現が前記差分テキストに存在するとき、該手がかり表現を含む節又は文の文字列を、前記引用部分と同一または類似の表現に対する、条件、訂正、追加、注釈のいずれかに該当する限定表現として抽出する限定表現抽出処理と、
    前記限定表現抽出処理にて抽出した表現または該表現に関する情報を、表示するための情報として生成する情報生成処理と、
    前記情報生成処理で生成した情報を表示する表示処理と
    を実行させるための情報提供プログラム。
  6. 前記コンピュータに、
    前記情報生成処理で、前記限定表現抽出処理で抽出した表現の有無を示す情報または前記限定表現抽出処理で抽出した表現の内容の一部もしくは特徴を示す代替情報を生成する処理を実行させる
    請求項5記載の情報提供プログラム。
  7. 前記限定表現抽出手段に代えて、
    前記文書データにおける引用部分と、前記関連文書決定手段が決定した関連文書データとを比較し、係り受け関係解析技術又は代名詞の照応解析技術を用いて、前記関連文書データの中から、前記引用部分と同一または類似の表現に対する修飾関係にある部分を抽出する文脈解析手段を備え、
    前記情報生成手段は、前記文脈解析手段が抽出した表現または該表現に関する情報を、表示するための情報として生成する請求項1記載の情報提供システム。
  8. 前記情報生成手段は、前記文脈解析手段が抽出した表現の有無を示す情報または前記文脈解析手段が抽出した表現の内容の一部もしくは特徴を示す代替情報を生成する請求項7記載の情報提供システム。
  9. 前記限定表現抽出ステップに代えて、
    前記文書データにおける引用部分と、前記関連文書決定ステップで決定した関連文書データとを比較し、係り受け関係解析技術又は代名詞の照応解析技術を用いて、前記関連文書データの中から、前記引用部分と同一または類似の表現に対する修飾関係にある部分を抽出する抽出する文脈解析ステップを含み、
    前記情報生成ステップで、前記文脈解析手段が抽出した表現または該表現に関する情報を、表示するための情報として生成する請求項3記載の情報提供方法。
  10. 前記情報生成ステップで、前記文脈解析ステップで抽出した表現の有無を示す情報または前記文脈解析ステップで抽出した表現の内容の一部もしくは特徴を示す代替情報を生成する請求項9記載の情報提供方法。
  11. 前記限定表現抽出処理に代えて、前記コンピュータに、
    前記文書データにおける引用部分と、前記関連文書決定処理で決定した関連文書データとを比較し、係り受け関係解析技術又は代名詞の照応解析技術を用いて、前記関連文書データの中から、前記引用部分と同一または類似の表現に対する修飾関係にある部分を抽出する文脈解析処理を実行させ、
    前記情報生成処理で、前記文脈解析手段が抽出した表現または該表現に関する情報を、表示するための情報として生成させる請求項5記載の情報提供プログラム。
  12. 前記情報生成処理で、前記文脈解析処理で抽出した表現の有無を示す情報または前記文脈解析処理で抽出した表現の内容の一部もしくは特徴を示す代替情報を生成する請求項11記載の情報提供プログラム。
JP2009509357A 2007-04-10 2008-04-09 情報提供システム Active JP5381704B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009509357A JP5381704B2 (ja) 2007-04-10 2008-04-09 情報提供システム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007102895 2007-04-10
JP2007102895 2007-04-10
PCT/JP2008/057010 WO2008126862A1 (ja) 2007-04-10 2008-04-09 情報提供システム
JP2009509357A JP5381704B2 (ja) 2007-04-10 2008-04-09 情報提供システム

Publications (2)

Publication Number Publication Date
JPWO2008126862A1 JPWO2008126862A1 (ja) 2010-07-22
JP5381704B2 true JP5381704B2 (ja) 2014-01-08

Family

ID=39863959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009509357A Active JP5381704B2 (ja) 2007-04-10 2008-04-09 情報提供システム

Country Status (3)

Country Link
US (1) US20100131534A1 (ja)
JP (1) JP5381704B2 (ja)
WO (1) WO2008126862A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775465B2 (en) * 2008-07-30 2014-07-08 Yahoo! Inc. Automatic updating of content included in research documents
KR101199765B1 (ko) * 2009-04-01 2012-11-09 주식회사 우듯 문서 검색 시스템 및 방법
US20110154197A1 (en) * 2009-12-18 2011-06-23 Louis Hawthorne System and method for algorithmic movie generation based on audio/video synchronization
JP5656585B2 (ja) * 2010-02-17 2015-01-21 キヤノン株式会社 文書作成支援装置、文書作成支援方法及びプログラム
JP6029641B2 (ja) * 2010-02-17 2016-11-24 キヤノン株式会社 文書作成支援装置及び文書作成支援方法
CN107077465A (zh) * 2015-02-20 2017-08-18 惠普发展公司,有限责任合伙企业 引用解释
JP6832503B2 (ja) * 2016-09-07 2021-02-24 パナソニックIpマネジメント株式会社 情報提示方法、情報提示プログラム及び情報提示システム
JP7028179B2 (ja) * 2016-09-29 2022-03-02 日本電気株式会社 情報処理装置、情報処理方法およびコンピュータ・プログラム
US11861298B1 (en) * 2017-10-20 2024-01-02 Teletracking Technologies, Inc. Systems and methods for automatically populating information in a graphical user interface using natural language processing
US20210097095A1 (en) * 2019-09-04 2021-04-01 Thomas Peavler Apparatus, system and method of using text recognition to search for cited authorities

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215645A (ja) * 2001-01-23 2002-08-02 Fuji Xerox Co Ltd 文書処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6944821B1 (en) * 1999-12-07 2005-09-13 International Business Machines Corporation Copy/paste mechanism and paste buffer that includes source information for copied data
US6976170B1 (en) * 2001-10-15 2005-12-13 Kelly Adam V Method for detecting plagiarism
US7139756B2 (en) * 2002-01-22 2006-11-21 International Business Machines Corporation System and method for detecting duplicate and similar documents
US20050108630A1 (en) * 2003-11-19 2005-05-19 Wasson Mark D. Extraction of facts from text
US20060218492A1 (en) * 2005-03-22 2006-09-28 Andrade Jose O Copy and paste with citation attributes
JP4882040B2 (ja) * 2005-06-21 2012-02-22 公立大学法人広島市立大学 情報処理装置、情報処理システム、およびプログラム
US20080071803A1 (en) * 2006-09-15 2008-03-20 Boucher Michael L Methods and systems for real-time citation generation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215645A (ja) * 2001-01-23 2002-08-02 Fuji Xerox Co Ltd 文書処理装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200401453013; 山田一郎 他2名: 'ニュース記事に出現する用語と説明文の意味関係自動獲得' 情報処理学会研究報告 Vol.2002,No.104(2002-NL-152), 20021112, 145-152頁, 社団法人情報処理学会 *
JPN6013002484; 山田一郎 他2名: 'ニュース記事に出現する用語と説明文の意味関係自動獲得' 情報処理学会研究報告 Vol.2002,No.104(2002-NL-152), 20021112, 145-152頁, 社団法人情報処理学会 *

Also Published As

Publication number Publication date
WO2008126862A1 (ja) 2008-10-23
JPWO2008126862A1 (ja) 2010-07-22
US20100131534A1 (en) 2010-05-27

Similar Documents

Publication Publication Date Title
JP5381704B2 (ja) 情報提供システム
JP3959180B2 (ja) 通信翻訳装置
US11573954B1 (en) Systems and methods for processing natural language queries for healthcare data
US11308278B2 (en) Predicting style breaches within textual content
CN101887414B (zh) 对包含图像符号的文本消息传达的评价自动打分的服务器
US20080120087A1 (en) Translation Information Segment
US8332208B2 (en) Information processing apparatus, information processing method, and program
US20050154971A1 (en) Document processing apparatus having an authoring capability for describing a document structure
JP2007287134A (ja) 情報抽出装置、及び情報抽出方法
US20090306962A1 (en) System and method to provide warnings associated with natural language searches to determine intended actions and accidental omissions
CN110462613B (zh) 自动生成文档
EP1744254A1 (en) Information management device
CN110785762B (zh) 用于编写电子消息的系统和方法
JP2005190338A (ja) 情報抽出装置および情報抽出方法
EP1318466A2 (en) Apparatus for interpreting electronic legal documents
JP2009140466A (ja) 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
JP5020352B2 (ja) 名前付き要素マーク付け装置、名前付き要素マーク付け方法及びそのコンピュータ読出可能な媒体
JP3899414B2 (ja) 教師データ作成装置およびプログラム、ならびに言語解析処理装置およびプログラム
JP5400496B2 (ja) 決算書の分析結果に基づく記事を作成するシステム
JPWO2008108061A1 (ja) 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体
JP2002207727A (ja) クライアント装置、そのプログラムを記録した記録媒体、及びそのプログラム
US20090024382A1 (en) Language information system
US10755047B2 (en) Automatic application of reviewer feedback in data files
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
JP5382965B2 (ja) 出願文書情報作成装置、出願文書情報作成方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130325

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130716

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130916

R150 Certificate of patent or registration of utility model

Ref document number: 5381704

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150