JP3937118B2 - 要約作成装置及び要約作成方法 - Google Patents

要約作成装置及び要約作成方法 Download PDF

Info

Publication number
JP3937118B2
JP3937118B2 JP05475599A JP5475599A JP3937118B2 JP 3937118 B2 JP3937118 B2 JP 3937118B2 JP 05475599 A JP05475599 A JP 05475599A JP 5475599 A JP5475599 A JP 5475599A JP 3937118 B2 JP3937118 B2 JP 3937118B2
Authority
JP
Japan
Prior art keywords
information
instruction
relation
binary
binary relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05475599A
Other languages
English (en)
Other versions
JP2000250937A5 (ja
JP2000250937A (ja
Inventor
剛弘 小山
良寛 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP05475599A priority Critical patent/JP3937118B2/ja
Publication of JP2000250937A publication Critical patent/JP2000250937A/ja
Publication of JP2000250937A5 publication Critical patent/JP2000250937A5/ja
Application granted granted Critical
Publication of JP3937118B2 publication Critical patent/JP3937118B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、テキストの内容を短時間で把握するための要約を作成する要約作成装置及び要約作成方法に関するものであり、特に情報検索において検索結果から適合文書を選択する際に用いて好適な要約作成装置及び要約作成方法に関するものである。
【0002】
【従来の技術】
文書内容を短時間で把握させる要約技術の一つとして、例えば、Cuttingほか,“Scatter/Gather: A Cluster−basedApproach to Browsing Large DocumentCollections”,SIGIR−92,1992に記載されているようなキーワードを列挙するものがある。このキーワード列挙による要約は、単にキーワードとなる単語の羅列に過ぎず、各単語間の関係が把握できないという問題がある。各単語間の関係がわからないと、実際の文書の内容を把握できない場合も多い。
【0003】
別の要約技術として、例えば特開平2−93866号公報に記載されているように、重要なキーワードに基づいて文を抽出する、重要文ピックアップによる要約の作成方法がある。この方法では、文の単位で抽出されるため、要約が比較的長くなる。そのため、作成された要約から内容を一目で把握できないという問題がある。
【0004】
さらに別の要約技術として、例えば特開平5−101120号公報に記載されているように、文中の修飾部分を削除し、文を短縮する方法がある。しかしこの方法では、1文の長さは短くなるが、文書全体としての内容を要約したものではなく、文書内容を一目で把握できないという問題がある。
【0005】
上述のような要約技術では、いずれも作成された要約から文書の内容を一目で把握できない。そこで、例えば特願平10−13961号に記載されているように、文書から抽出した重要な単語の2項関係から要約句を合成する句表現要約の技術が提案されている。
【0006】
句表現要約は、検索結果のふるい分けのために、一目で内容を把握できるように短い句で要約を構成する。短い句で要約を構成するため詳細な情報の欠落は避けられず、情報の欠落によりふるい分けの精度が低下する。これを回避するため、重要な詳細情報を要約に盛り込むことが考えられる。しかし、個人や状況によって重要な情報は異なってくるため、重要な詳細情報の絞り込みは困難である。さらに、詳細情報を要約に盛り込むと文が長くなり、一目で内容を把握するのが困難になる。また、ユーザの指示により要約に対応する原文を表示して詳細情報をチェックすることも考えられるが、原文の対応する場所を探したり、文を読むなどの負担がかかり、一目で内容を把握することはできない。
【0007】
一方、ユーザの興味を反映した要約を作成するものとして、例えば特開平5−46610号公報に記載されているように、ユーザに要約モードを提示し、選択されたモードに対応した要約ルールを用いて要約を作成する方法が提案されている。この方法では、選択されたモードに対応した要約ルールにマッチした文や句がそのまま切り出されるため、一目で内容を把握することは困難であり、ユーザが詳細化したい単語や情報の種類を直接指定できないという問題もある。
【0008】
【発明が解決しようとする課題】
本発明は、上述した事情に鑑みてなされたもので、ユーザが指示した情報を詳細化した、一目で内容を把握できる要約を作成することが可能な要約作成装置及び要約作成方法を提供することを目的とするものである。
【0009】
【課題を解決するための手段】
本発明は、入力されたテキストの要約を作成して出力する要約作成装置及び要約作成方法であって、まず関係解析手段において、入力されたテキストに対して係り受け解析を行い、単語同士の2項関係を抽出しておく。一方、指示入力手段で要約結果に対してユーザから重視する情報の種類やさらには詳細化する単語の指示を受け付け、その指示を優先すべき2項関係の条件を示す優先条件に指示解釈手段で変換する。この優先条件と、抽出しておいた2項関係から、重要な2項関係を関係選択手段で選択し、選択した重要な2項関係に基づき作成手段で要約を生成する。
【0010】
また、本発明は、要約を作成する前に予め指示入力手段でユーザから重視する情報の種類の指示を受け付け、その指示を指示解釈手段において、優先すべき2項関係の条件に変換しておく。テキストが入力されたら、関係解析手段において入力されたテキストに対して係り受け解析を行い、単語同士の2項関係を抽出する。そして、抽出した2項関係と、指示解釈手段で変換した優先条件から、重要な2項関係を関係選択手段で選択し、選択した重要な2項関係に基づき要約を生成する。
【0011】
このように本発明では、単語の2項関係から要約を生成するため、作成された要約から一目でテキストの内容を把握することができる。しかも、ユーザが詳細化したい単語や情報の種類を指示することによって、指示された情報を盛り込んで要約が作成される。そのため、個人や状況によって異なる重要性に応じた要約を作成することが可能である。
【0012】
【発明の実施の形態】
図1は、本発明の文書要約作成装置の実施の一形態を示すブロック図である。図中、1は文書入力部、2は関係解析部、3は指示入力部、4は指示解釈部、5は関係選択部、7は句合成部である。文書入力部1は、入力文書を得るとテキストを抽出し、テキスト情報を関係解析部2に伝達する。関係解析部2は、テキスト情報を得ると係り受け解析を行い、単語の2項関係を抽出して、2項関係情報として関係選択部5に伝達する。指示入力部3は、ユーザが詳細化する情報に関する指示を入力すると、その指示を指示情報として指示解釈部4に伝達する。指示解釈部4は、ユーザからの指示情報を得ると、優先すべき2項関係の条件を示す優先情報に変換して関係選択部5に伝達する。関係選択部5は、関係解析部2から単語の2項関係情報を得るとともに指示解釈部4から優先情報を得ると、優先情報とマッチする2項関係の優先度を上げて重要な2項関係を選択し、重要2項関係情報として句合成部7に伝達する。句合成部7は、重要2項関係情報を得ると句要約を合成して出力する。
【0013】
次に具体例を用いて各部の動作を説明する。図2は、本発明の文書要約作成装置の実施の一形態における第1の動作例の説明図である。この例では、入力文書として以下の文書を先に入力し、いったん要約を作成した後にユーザが詳細化したい部分を指示する場合の各部の入力及び出力を示している。入力文書の例として、「A社は十日からB社のパソコン向けのプリンタ「PX100」を値下げする。値下げ幅は二十〜三十%。パソコン本体の低価格化が進み、周辺機器に割安感が出始めていることや売れ行きが好調なため値下げに踏み切った。」という文書を入力する。
【0014】
入力部1は、入力文書を得るとテキストを抽出し、テキスト情報を関係解析部2に伝達する。ここでは入力文書が全てテキストであるので、入力文書(「A社は十日から…踏み切った。」)をテキスト情報として関係解析部2に伝達する。
【0015】
関係解析部2は、テキスト情報(「A社は十日から…踏み切った。」)を得ると、係り受け解析を行い、単語の2項関係を抽出し、2項関係情報として関係選択部5に伝達する。この例では、単語の2項関係として、(A社,は,値下げ)、(「PX100」,を,値下げ)、(B社,の,パソコン)、(パソコン,向けの,プリンタ)、(プリンタ,名,「PX100」)、…が抽出される。なお、ここでは単語の2項関係を(係り側の単語、単語間の関係、受け側の単語)で表現している。(A社,は,値下げ)は、「A社」が「値下げ」に関係「は」で係っていることを表している。単語間の関係は表層の関係「は」で表しているが、深層の関係「動作主」で表してもよい。抽出したこれらの単語の2項関係を、2項関係情報として関係選択部5に伝達する。
【0016】
関係選択部5は、関係解析部2から単語の2項関係情報を得ると、各2項関係についてスコアリングを行う。スコアリングの方法は従来技術を用いる。図3は、本発明の文書要約作成装置の実施の一形態における第1の動作例において、関係選択部によるスコアリング結果の一例の説明図である。この例では関係解析部2から単語の2項関係情報として、((A社,は,値下げ)、(「PX100」,を,値下げ)、(B社,の,パソコン)、(パソコン,向けの,プリンタ)、(プリンタ,名,「PX100」)、…)が得られる。得られた各2項関係について、例えば図3に示すようにスコアを付されたものとする。
【0017】
このようなスコアリングの後、関係選択部5は、スコアが高い2項関係を重要2項関係として選択し、重要2項関係情報を句合成部7に伝達する。この例では図3に示すように、2項関係(A社,は,値下げ)、(「PX100」,を,値下げ)のスコアがそれぞれ30,40と高いので、これらの2項関係を重要2項関係情報として句合成部7に伝達する。
【0019】
句合成部7は、重要2項関係情報を得ると、句要約を合成し、出力する。ここでは重要2項関係情報として((A社,は,値下げ)、(「PX100」,を,値下げ))が得られるので、要約αとして「A社は…「PX100」を…値下げする」を合成し、例えば表示するなどして出力する。この時、詳細情報をもつ語、例えば「「PX100」」や「値下げする」については、下線を付けたり色を変化させるなど、表示形態を変更して表示するように構成してもよい。
【0020】
ユーザは、句合成部7から出力された要約αを参照することによって、入力された文書の内容を一目で知ることができる。しかし、要約αでは詳細な情報が欠落しているため、ユーザは個人や状況に応じてさらに詳細な情報を得たい場合がある。本発明ではこのような場合に、ユーザが指示することによって要約を詳細化することができる。
【0021】
ここでは、ユーザは例えば「PX100」について詳細化したいとする。この場合、ユーザは、詳細化したい情報として「PX100」を指示する入力を指示入力部3において行う。詳細化する情報が複数ある場合は、複数指示すればよい。例えば、(「PX100」,A社)のようにカンマで区切って表現したり、詳細化したい語をマウスで順次クリックして指定することができる。もちろん、指定方法は任意である。指示入力部3は、ユーザから「PX100」を詳細化したい旨の指示を受けると、詳細化を行う指示情報として「PX100」を指示解釈部4に伝達する。
【0022】
指示解釈部4は、指示情報を得ると、スコアを上げるべき2項関係の条件を指定する優先情報を関係選択部5に伝達する。この例では指示入力部3から指示情報として「PX100」が得られるので、スコアを上げるべき2項関係の条件を指定する優先情報として、(*,*,「PX100」)を関係選択部5に伝達する。ここで、(*,*,「PX100」)は「PX100」を修飾する2項関係のスコアを上げることを示す。
【0023】
関係選択部5は、関係解析部2から受け取っている2項関係情報と、指示解釈部4から伝達される優先情報を得ると、2項関係のスコアリングを再度行い、重要な2項関係を選択する。先の処理で関係解析部2から2項関係情報として、((A社,は,値下げ)、(「PX100」,を,値下げ)、(B社,の,パソコン)、(パソコン,向けの,プリンタ)、(プリンタ,名,「PX100」)、…)が得られている。また、ユーザによる「PX100」の詳細化の指示に従って、指示解釈部4から優先情報として(*,*,「PX100」)が得られる。これらの2項関係情報と優先情報が得られると、2項関係のスコアリングを再度行う。
【0024】
図4は、本発明の文書要約作成装置の実施の一形態における第1の動作例において、関係選択部による優先情報を用いたスコアリング結果の一例の説明図である。スコアリングのため、まず、優先情報(*,*,「PX100」)により「PX100」を修飾する2項関係を抽出する。ここでは、(B社,の,パソコン)、(パソコン,向けの,プリンタ)、(プリンタ,名,「PX100」)などの2項関係が抽出される。そして、これらの抽出された2項関係について、スコアを上げる。スコアの値は、その2項関係が必ず選択されるように設定すればよい。ここでは選択された重要2項関係の最大のスコアとし、40とした。このようなスコアリング処理によって、図4に示すようなスコアリング結果が得られる。
【0025】
このようにしてスコアリング処理を行った後、スコアの高い2項関係を重要2項関係情報として抽出する。ここでは、((A社,は,値下げ)、(「PX100」,を,値下げ)、(B社,の,パソコン)、(パソコン,向けの,プリンタ)、(プリンタ,名,「PX100」))が重要2項関係情報として句合成部7に伝達される。
【0027】
句合成部7は、重要2項関係情報として((A社,は,値下げ)、(「PX100」,を,値下げ)、(B社,の,パソコン)、(パソコン,向けの,プリンタ)、(プリンタ,名,「PX100」))を得ると、要約βとして「A社は...B社のパソコン向けのプリンタ「PX100」を...値下げする」を合成して出力する。
【0028】
この要約βと先に出力した要約αを参照して分かるように、ユーザが指示した「PX100」が修飾されており、指示内容が詳細化されている。このようにして、ユーザが指示した内容を詳細化した要約を作成することができる。このとき、詳細化はユーザによる指示に従って行われるので、不必要に要約が長くなることはなく、コンパクトな要約が作成される。
【0029】
図5は、本発明の文書要約作成装置の実施の一形態における第2の動作例の説明図である。上述の第1の動作例では、ユーザが詳細化したい対象のみを指定したが、この第2の動作例では、詳細化すべき対象に加えて情報の種類を指定する場合について説明する。この例においても、上述の第1の動作例と同じ文書が入力されるものとする。
【0030】
入力部1は、入力文書を得るとテキストを抽出し、テキスト情報として「A社は十日から…踏み切った。」を関係解析部2に伝達する。関係解析部2は、テキスト情報「A社は十日から…踏み切った。」を得ると、係り受け解析を行うとともに、名詞に対して意味情報の付与を行う。この処理によって、単語の2項関係として、(A社<会社>,は,値下げ)、(「PX100」<製品>,を,値下げ)、(十日<時間>,から,値下げ)、…が抽出される。ここで、<>は意味情報を表している。このような2項関係を、2項関係情報として関係選択部5に伝達する。
【0031】
関係選択部5は、2項関係情報として((A社<会社>,は,値下げ)、(「PX100」<製品>,を,値下げ)、(十日<時間>,から,値下げ)、…)を得ると、各2項関係についてスコアリングを行う。スコアリングの方法は従来技術を用いることができる。図6は、本発明の文書要約作成装置の実施の一形態における第2の動作例において、関係選択部によるスコアリング結果の一例の説明図である。図6に示すように各2項関係についてスコアが計算されると、スコアが高い2項関係を重要2項関係として選択し、重要2項関係情報を句合成部7に伝達する。図6に示す例では、2項関係(A社,は,値下げ)、(「PX100」,を,値下げ)のスコアがそれぞれ30,40と高いので、これらの2項関係を重要2項関係情報として句合成部7に伝達する。
【0033】
句合成部7は、重要2項関係情報として2項関係(A社,は,値下げ)、(「PX100」,を,値下げ)を得ると、要約αとして「A社は…「PX100」を…値下げする。」を合成し、例えば表示するなどして出力する。この時、詳細情報をもつ語、例えば「「PX100」を」、「値下げする」の部分に対して、下線を付けたり、色を変化させるなど、表示形態を変更して表示してもよい。
【0034】
ユーザは要約αを得て、入力した文書の内容を一目で把握することができる。ここで、ユーザはさらに値下げの日時について、さらに詳細に知りたいとする。この場合、ユーザは指示入力部3に対して、「値下げ」の詳細化を指示するとともに、情報の種類として日時を指示する。情報の種類としては、日時のほか、場所や価格など、種々の指定が可能である。また、詳細化する対象および情報の種類を複数指定することも可能である。例えば(「PX100」,値下げの日時)のようにカンマで区切って表現すればよい。あるいは、詳細化したい語をマウスでクリックするとメニューが表示され、メニューから情報の種類を選択して指定するように構成してもよい。
【0035】
指示入力部3は、ユーザから値下げの日時を詳細化する指示を受け取ると、それを「値下げ[日時]」という形式の指示情報として指示解釈部4に伝達する。指示情報中の[日時]は情報の種類を示している。詳細化する情報が複数ある場合は、例えば(「PX100」,値下げ[日時][価格])のように項目はカンマで区切り、情報の種類は並べて表現することができる。もちろん、表現方法は任意である。
【0036】
指示解釈部4は、指示情報を得ると、スコアを上げるべき2項関係の条件に変換する。変換方法は色々考えられるが、ここでは詳細情報変換テーブルを用いて変換する。図7は、詳細情報変換テーブルの一例の説明図である。詳細情報変換テーブルには、図7に示すように、ユーザが指定する情報の種類と、意味情報および2項関係を示す情報との対応が格納されている。指示解釈部4は、指示情報を得ると、この詳細情報変換テーブルを参照し、優先情報を生成して関係選択部5へ伝達する。この例では、指示入力部3から指示情報として「値下げ[日時]」を得るので、図7に示す詳細情報変換テーブルから[日時]に対応付けられている「<時間>+で/に/から/まで/、」が得られる。これをもとに、指示情報を優先情報(<時間>,で/に/から/まで/、,値下げ)に変換し、関係選択部5に伝達する。(<時間>,で/に/から/まで/、,値下げ)は、係り側が<時間>、受け側が「値下げ」、関係が「で」または「に」または「から」または「まで」または「、」である2項関係を示している。この優先情報にマッチする2項関係が存在する場合に、その2項関係のスコアを上げることを関係選択部5に対して指示している。
【0037】
関係選択部5は、2項関係情報と優先情報を得ると、2項関係のスコアリングを行い重要な2項関係を選択する。上述のように関係解析部2からは、2項関係情報として、((A社<会社>,は,値下げ)、(「PX100」<製品>,を,値下げ)、(十日<時間>,から,値下げ)、…)が得られている。また、上述のように指示解釈部4から、優先情報として(<時間>,で/に/から/まで/、,値下げ)を得る。ここで、優先情報(<時間>,で/に/から/まで/、,値下げ)とマッチする2項関係として、(十日<時間>,から,値下げ)がある。この優先情報とマッチした2項関係(十日<時間>,から,値下げ)のスコアを上げる。図8は、本発明の文書要約作成装置の実施の一形態における第2の動作例において、関係選択部による優先情報を用いたスコアリング結果の一例の説明図である。ここでは、優先情報とマッチした2項関係(十日<時間>,から,値下げ)のスコアを、20から40に上げている。スコアの値はその2項関係が必ず選択されるように設定すればよく、ここでは選択された重要2項関係の最大のスコアである40とした。
【0038】
このようにしてスコアを更新した後、重要な2項関係を選択し、重要2項関係情報として句合成部7に伝達する。図8に示すようにスコアの値が更新された後では、((A社,は,値下げ)、(「PX100」,を,値下げ)、(十日,から,値下げ))が重要2項関係情報として句合成部7に伝達される。
【0040】
句合成部7は、重要2項関係情報として((A社,は,値下げ)、(「PX100」,を,値下げ)、(十日,から,値下げ))を得ると、要約βとして「A社は...十日から...「PX100」を...値下げする」という要約を合成して、例えば表示するなどして出力する。
【0041】
この要約βと先に出力した要約αを参照して分かるように、ユーザが指示した「値下げ」に対して、「十日から」という日時に関する修飾のみが行われている。このようにして、ユーザが詳細化したい内容とともに、情報の種類を指示することによって、指示した情報の種類に応じた詳細化が行われる。このようにして、ユーザは所望の内容を詳細化した要約を得ることができる。
【0042】
図9は、本発明の文書要約作成装置の実施の一形態における第3の動作例の説明図である。上述の第1、第2の動作例では、いったん出力される要約結果をユーザが見て、詳細化したい情報を指定した。しかし、要約を作成する前にユーザが重視する(詳細化したい)情報の種類を指定することも可能であり、その場合の例を第3の動作例として説明する。
【0043】
ユーザは、例えば日時情報を重視したいとすると、指示入力部3に対して日時の詳細化を指示入力する。指示可能な情報の種類としては、日時のほかにも、場所、価格など、種々の項目を指示することが可能である。また、詳細化する情報が複数ある場合は、例えば(日時、価格)のようにカンマで区切って表現したり、あるいは、詳細化したい情報の種類をマウスを用いてメニューから選択して指定するように構成してもよい。
【0044】
指示入力部3は、ユーザから日時を詳細化するように指示を受けると、指示情報として([日時])を指示解釈部4に伝達する。[日時]は情報の種類を示し、詳細化する情報が複数ある場合は、例えば([日時][価格])のように並べて表現すればよい。
【0045】
指示解釈部4は、指示情報を得ると、スコアを上げるべき2項関係の条件である優先情報に変換する。変換方法は色々考えられるが、ここでは上述の図7に示した詳細情報変換テーブルを用いて変換する。この詳細情報変換テーブルにより、指示情報([日時])は優先情報(<時間>,で/に/から/まで/、,*)に変換され、関係選択部5に伝達される。(<時間>,で/に/から/まで/、,*)は、係り側が<時間>で、関係が「で」または「に」または「から」または「まで」または「、」である2項関係を示している。この優先情報にマッチする2項関係が存在する場合に、その2項関係のスコアを上げることを関係選択部5に対して指示している。
【0046】
入力部1は、入力文書を得るとテキストを抽出し、テキスト情報を関係解析部2に伝達する。ここでは上述の第1,第2の動作例と同じ文書「A社は十日から…踏み切った。」が入力されるものとする。この文書がテキスト情報として関係解析部2に伝達される。
【0047】
関係解析部2は、テキスト情報を得ると、係り受け解析と名詞に意味情報の付与を行い、単語の2項関係を抽出して関係選択部5に伝達する。ここではテキスト情報として「A社は十日から…踏み切った。」を得る。このテキスト情報に対して、係り受け解析と名詞に意味情報の付与を行い、単語の2項関係として(A社<会社>,は,値下げ)、(「PX100」<製品>,を,値下げ)、(十日<時間>,から,値下げ)、…を抽出し、2項関係情報として関係選択部5に伝達する。ここで、<>は意味情報を表している。
【0048】
関係選択部5は、2項関係情報と優先情報を得ると、2項関係のスコアリングを行い、重要な2項関係を選択する。予め、指示解釈部4から優先情報として(<時間>,で/に/から/まで/、,*)が得られている。また、関係解析部2から、2項関係情報として((A社<会社>,は,値下げ)、(「PX100」<製品>,を,値下げ)、(十日<時間>,から,値下げ)、…)が得られる。ここで、2項関係情報として得られた各2項関係についてスコアリングを行う。このとき、優先情報(<時間>,で/に/から/まで/、,*)とマッチする2項関係については、スコアを上げるように処理する。図10は、本発明の文書要約作成装置の実施の一形態における第3の動作例において、関係選択部によるスコアリング結果の一例の説明図である。優先情報(<時間>,で/に/から/まで/、,*)とマッチする2項関係として、(十日<時間>,から,値下げ)がある。この2項関係については、通常のスコアリング処理ではスコアが20となるが、これを図10に示すように40に上げている。スコアを上げる際の値は、その2項関係が必ず選択されるように設定すればよい。ここでは、選択された重要2項関係の最大のスコアである40とした。
【0049】
スコアリングの後、スコアの値が大きい2項関係を選択し、重要2項関係情報として句合成部7に伝達する。図10に示すようにスコアが求められた場合には、重要2項関係情報として((A社,は,値下げ)、(「PX100」,を,値下げ)、(十日,から,値下げ))が句合成部7に伝達される。
【0051】
句合成部7は、重要2項関係情報として((A社,は,値下げ)、(「PX100」,を,値下げ)、(十日,から,値下げ))を得ると、要約として「A社は...十日から...「PX100」を...値下げする」を合成し、例えば表示するなどして出力する。
【0052】
ユーザによる日時の詳細化の指示入力がなければ、上述の第1,第2の動作例において作成された要約αのように、「A社は...「PX100」を...値下げする」という要約が得られる。しかし、この第3の動作例では、ユーザが事前に日時を重視するという指定を行い、その指定に従って日時を表す2項関係を優先させる。これにより、「A社は...十日から...「PX100」を...値下げする」という、日時に関する内容が詳細化された要約が得られる。
【0053】
図11は、本発明の文書要約作成装置の実施の一形態における第4の動作例の説明図である。上述の第2、第3の動作例では、ユーザの詳細化情報の指示を、優先すべき単語と単語間の関係情報に変換したが、この第4の動作例では、多様な表現に対応するため、ユーザの詳細化情報の指示を、優先すべき単語の意味情報に変換するようにした例について説明する。
【0054】
ユーザは、例えば価格情報を重視したいとすると、指示入力部3に対して価格の詳細化を指示入力する。指示可能な情報の種類としては、価格のほかにも、場所、日時、会社名、製品名、人名など、種々の情報の種類を指定することができる。また、詳細化する情報の種類が複数ある場合は、例えば(日時、価格)のようにカンマで区切って表現したり、あるいは、詳細化したい情報の種類をマウスを用いてメニューから選択して指定するように構成してもよい。
【0055】
指示入力部3は、ユーザから詳細化する情報の種類として価格が指示されると、指示情報として([価格])を指示解釈部4に伝達する。[価格]は情報の種類を示している。詳細化する情報の種類が複数ある場合は、例えば([日時][価格])のように並べて表現すればよい。
【0056】
指示解釈部4は、指示情報を得ると、スコアを上げるべき2項関係の条件である優先情報に変換する。変換方法は色々考えられるが、ここでは詳細情報変換テーブルを用いて変換する。図12は、詳細情報変換テーブルの一例の説明図である。図12に示す例では、情報の種類と、それに対応する意味情報を組にして保持している。このような詳細情報変換テーブルを用いることにより、情報の種類[価格]から、意味情報<金額>が得られる。指示解釈部4は、これをもとに指示情報([価格])を優先情報((<金額>,*,*)(*,*,<金額>))に変換し、関係選択部5に伝達する。(<金額>,*,*)は、係り側が<金額>、(*,*,<金額>)は受け側が<金額>の2項関係を示している。この優先情報にマッチする2項関係が存在する場合に、その2項関係のスコアを上げることを関係選択部5に対して指示している。
【0057】
入力部1は、入力文書を得るとテキストを抽出し、テキスト情報を関係解析部2に伝達する。ここでは、文書「A社は十日からB社のパソコン向けのプリンタ「PX100」を値下げする。価格は二十%割引の四万円。パソコン本体の低価格化が進み、周辺機器に割安感が出始めていることや売れ行きが好調なため値下げに踏み切った。」が入力されたものとする。この文書のテキストがテキスト情報として関係解析部2に伝達される。
【0058】
関係解析部2は、テキスト情報を得ると、係り受け解析と名詞に意味情報の付与を行い、単語の2項関係を抽出して関係選択部5に伝達する。ここではテキスト情報として「A社は十日から…踏み切った。」が得られるので、このテキスト情報に対して係り受け解析と名詞に意味情報の付与を行い、単語の2項関係を抽出する。例えば、2項関係(A社<会社>,は,値下げ)、(「PX100」<製品>,を,値下げ)、(十日<時間>,から,値下げ)、(価格<価格>,だ,四万円<金額>)、…などが抽出される。ここで、<>は意味情報を表す。抽出された2項関係は、2項関係情報として関係選択部5に伝達される。
【0059】
関係選択部5は、2項関係情報と優先情報を得ると、2項関係のスコアリングを行い重要な2項関係を選択する。ここでは予め指示解釈部4から優先情報として((<金額>,*,*)(*,*,<金額>))が得られている。また、関係解析部2から2項関係情報として、((A社<会社>,は,値下げ)、(「PX100」<製品>,を,値下げ)、(十日<時間>,から,値下げ)、(価格<価格>,だ,四万円<金額>)、…)が得られている。関係選択部5は、これらの2項関係に対してスコアリングを行う。このとき、優先情報((<金額>,*,*)(*,*,<金額>))とマッチする2項情報については、スコアを上げる処理を行う。図13は、本発明の文書要約作成装置の実施の一形態における第4の動作例において、関係選択部によるスコアリング結果の一例の説明図である。優先情報((<金額>,*,*)(*,*,<金額>))とマッチする2項関係として、(価格<価格>,だ,四万円<金額>)がある。この2項関係については、通常のスコアリング処理ではスコアが10となるが、これを図13に示すように40に上げている。スコアを上げる際の値は、その2項関係が必ず選択されるように設定すればよい。ここでは、選択された重要2項関係の最大のスコアである40とした。
【0060】
スコアリングの後、スコアの値が大きい2項関係を選択し、重要2項関係情報として句合成部7に伝達する。図13に示すようにスコアが求められた場合には、2項関係(A社,は,値下げ)、(「PX100」,を,値下げ)、(価格,だ,四万円)を重要2項関係として句合成部7に伝達する。
【0062】
句合成部7は、重要2項関係情報として((A社,は,値下げ)、(「PX100」,を,値下げ)、(価格,だ,四万円))を得ると、要約として「A社は...「PX100」を...値下げする、価格は四万円」を合成し、例えば表示するなどして出力する。
【0063】
ユーザによる価格の詳細化の指示入力がなければ、上述の第1,第2の動作例において作成された要約αのように、「A社は...「PX100」を...値下げする」という要約が得られる。しかし、この第4の動作例では、ユーザが事前に価格を重視するという指定を行い、価格を表す単語を優先することにより、「A社は...「PX100」を...値下げする、価格は四万円」という、価格の情報が付加された要約が得られる。また、ユーザが会社名を重視したいとすると、同様に、「A社は... B社のパソコン向けのプリンタ「PX100」を...値下げする」という要約が得られる。
【0064】
この第4の動作例では、事前に詳細化する情報を指定するようにしたが、第1,第2の動作例と同様に、要約結果を見てから指定するようにしてもよい。また、この動作例では、ユーザからの指示を優先すべき2項関係の条件として単語の意味情報に変換しているが、単語の意味情報および単語の意味と単語間の関係情報に変換するようにしてもよい。
【0065】
【発明の効果】
以上の説明から明らかなように、本発明によれば、短い句で要約を構成するため、一目で文書の内容を把握することができる。しかも、欠落した詳細な情報は、例えば要約結果に対してユーザが詳細化したい情報や情報の種類を指示したり、あるいは事前にユーザが重視する情報を指示することにより、個人や状況によって異なる重要な情報を盛り込んだコンパクトな要約を作成することができる。また、要約を再作成するために要する時間は、文章の関係抽出に比べ非常に小さいため、抽出された2項関係を再利用することによって、高速に要約を再作成することができるという効果がある。
【図面の簡単な説明】
【図1】 本発明の文書要約作成装置の実施の一形態を示すブロック図である。
【図2】 本発明の文書要約作成装置の実施の一形態における第1の動作例の説明図である。
【図3】 本発明の文書要約作成装置の実施の一形態における第1の動作例において、関係選択部によるスコアリング結果の一例の説明図である。
【図4】 本発明の文書要約作成装置の実施の一形態における第1の動作例において、関係選択部による優先情報を用いたスコアリング結果の一例の説明図である。
【図5】 本発明の文書要約作成装置の実施の一形態における第2の動作例の説明図である。
【図6】 本発明の文書要約作成装置の実施の一形態における第2の動作例において、関係選択部によるスコアリング結果の一例の説明図である。
【図7】 詳細情報変換テーブルの一例の説明図である。
【図8】 本発明の文書要約作成装置の実施の一形態における第2の動作例において、関係選択部による優先情報を用いたスコアリング結果の一例の説明図である。
【図9】 本発明の文書要約作成装置の実施の一形態における第3の動作例の説明図である。
【図10】 本発明の文書要約作成装置の実施の一形態における第3の動作例において、関係選択部によるスコアリング結果の一例の説明図である。
【図11】 本発明の文書要約作成装置の実施の一形態における第4の動作例の説明図である。
【図12】 詳細情報変換テーブルの一例の説明図である。
【図13】 本発明の文書要約作成装置の実施の一形態における第4の動作例において、関係選択部によるスコアリング結果の一例の説明図である。
【符号の説明】
1…文書入力部、2…関係解析部、3…指示入力部、4…指示解釈部、5…関係選択部、7…句合成部。

Claims (6)

  1. 入力されたテキストの要約を作成して出力する要約作成装置において、入力されたテキストに対して係り受け解析を行い単語同士の2項関係を抽出する関係解析手段と、要約結果に対してユーザから重視する情報の種類の指示を受け付ける指示入力手段と、該指示入力手段から入力されたユーザからの指示を優先すべき2項関係の条件を示す優先条件として単語の意味情報および単語の意味と単語間の関係情報に変換する指示解釈手段と、前記関係解析手段で抽出した2項関係と前記指示解釈手段で変換した優先条件から重要な2項関係を選択する関係選択手段と、該関係選択手段で選択した重要な2項関係に基づき要約を生成する作成手段を有することを特徴とする要約作成装置。
  2. 前記指示入力手段は、さらにユーザから詳細化する単語の指示を受け付けることを特徴とする請求項1に記載の要約作成装置。
  3. 入力されたテキストの要約を作成して出力する要約作成装置において、要約を作成する前にユーザから重視する情報の種類の指示を受け付ける指示入力手段と、該指示入力手段で受け付けたユーザからの指示を優先すべき2項関係の条件を示す優先条件として単語の意味情報および単語の意味と単語間の関係情報に変換する指示解釈手段と、入力されたテキストに対して係り受け解析を行い単語同士の2項関係を抽出する関係解析手段と、該関係解析手段で抽出した2項関係と前記指示解釈手段で変換した優先条件から重要な2項関係を選択する関係選択手段と、該関係選択手段で選択した重要な2項関係に基づき要約を生成する作成手段を有することを特徴とする要約作成装置。
  4. 要約作成装置が入力されたテキストの要約を作成して出力する要約作成方法において、関係解析手段が入力されたテキストに対して係り受け解析を行って単語同士の2項関係を抽出し、また、指示入力手段が要約結果に対してユーザから指示入力手段で入力された重視する情報の種類の指示を受け付けて、指示解釈手段が入力されたユーザからの指示を優先すべき2項関係の条件を示す優先条件として単語の意味情報および単語の意味と単語間の関係情報に変換し、関係選択手段が抽出した前記2項関係と変換した前記優先条件から重要な2項関係を選択し、作成手段が該選択した重要な2項関係に基づき要約を生成することを特徴とする要約作成方法。
  5. さらに前記指示入力手段がユーザから詳細化する単語の指示を受け付けることを特徴とする請求項4に記載の要約作成方法。
  6. 要約作成装置が入力されたテキストの要約を作成して出力する要約作成方法において、指示入力手段が要約を作成する前にユーザから重視する情報の種類の指示を受け付け、指示解釈手段が受け付けたユーザからの指示を優先すべき2項関係の条件を示す優先条件として単語の意味情報および単語の意味と単語間の関係情報に変換し、関係解析手段が入力されたテキストに対して係り受け解析を行って単語同士の2項関係を抽出し、関係選択手段が抽出した前記2項関係と変換した前記優先条件から重要な2項関係を選択し、作成手段が該選択した重要な2項関係に基づき要約を生成することを特徴とする要約作成方法。
JP05475599A 1999-03-02 1999-03-02 要約作成装置及び要約作成方法 Expired - Fee Related JP3937118B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05475599A JP3937118B2 (ja) 1999-03-02 1999-03-02 要約作成装置及び要約作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05475599A JP3937118B2 (ja) 1999-03-02 1999-03-02 要約作成装置及び要約作成方法

Publications (3)

Publication Number Publication Date
JP2000250937A JP2000250937A (ja) 2000-09-14
JP2000250937A5 JP2000250937A5 (ja) 2004-10-07
JP3937118B2 true JP3937118B2 (ja) 2007-06-27

Family

ID=12979603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05475599A Expired - Fee Related JP3937118B2 (ja) 1999-03-02 1999-03-02 要約作成装置及び要約作成方法

Country Status (1)

Country Link
JP (1) JP3937118B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009064187A (ja) 2007-09-05 2009-03-26 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP5810052B2 (ja) * 2012-08-27 2015-11-11 日本電信電話株式会社 要約生成装置及び方法及びプログラム

Also Published As

Publication number Publication date
JP2000250937A (ja) 2000-09-14

Similar Documents

Publication Publication Date Title
US7958128B2 (en) Query-independent entity importance in books
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
US20090055394A1 (en) Identifying key terms related to similar passages
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JPWO2007108529A1 (ja) 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム
JP4049317B2 (ja) 検索支援装置およびプログラム
JP2006252419A (ja) 文書検索システム、文書検索方法及びプログラム
JP5151368B2 (ja) 情報処理装置および情報処理プログラム
JP2006099754A (ja) キーワード抽出方法、キーワード抽出プログラム、キーワード抽出プログラムを記録したコンピュータ読み取り可能な記録媒体およびキーワード抽出装置、並びにメタデータ作成方法、メタデータ作成プログラム、メタデータ作成プログラムを記録したコンピュータ読み取り可能な記録媒体およびメタデータ作成装置
JP2004318510A (ja) 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法
JP6653169B2 (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
JPH1049543A (ja) 文書検索装置
JP2003162531A (ja) 文書検索システムおよび文書検索方法
JP3937118B2 (ja) 要約作成装置及び要約作成方法
JP2012003697A (ja) スニペット生成方法、スニペット生成装置、スニペット生成プログラムおよび記録媒体
JPH0962684A (ja) 情報検索方法及び情報検索装置と、情報案内方法及び情報案内装置
JP7038884B1 (ja) ユーザアシストシステム
JP4949012B2 (ja) 説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法
JP5289261B2 (ja) 文章変換装置、方法及びプログラム
JP2002123544A (ja) 検索前処理装置、文書検索装置、検索前処理方法及び文書検索方法
WO2010103916A1 (ja) 文書の特徴語提示装置及び特徴語の優先度付与プログラム
JP2005234772A (ja) 文書管理装置および方法
JP2004220226A (ja) 検索文書のための文書分類方法及び装置
JP2004152041A (ja) 重要語句抽出装置、プログラムおよび記録媒体
JP2009059290A (ja) 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070313

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120406

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140406

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees