JP2000250937A - 文書要約作成装置 - Google Patents

文書要約作成装置

Info

Publication number
JP2000250937A
JP2000250937A JP11054755A JP5475599A JP2000250937A JP 2000250937 A JP2000250937 A JP 2000250937A JP 11054755 A JP11054755 A JP 11054755A JP 5475599 A JP5475599 A JP 5475599A JP 2000250937 A JP2000250937 A JP 2000250937A
Authority
JP
Japan
Prior art keywords
relation
information
instruction
binary
binary relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11054755A
Other languages
English (en)
Other versions
JP3937118B2 (ja
JP2000250937A5 (ja
Inventor
Takehiro Koyama
剛弘 小山
Yoshihiro Ueda
良寛 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP05475599A priority Critical patent/JP3937118B2/ja
Publication of JP2000250937A publication Critical patent/JP2000250937A/ja
Publication of JP2000250937A5 publication Critical patent/JP2000250937A5/ja
Application granted granted Critical
Publication of JP3937118B2 publication Critical patent/JP3937118B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザが指示した情報を詳細化した、一目で
内容を把握できる要約を作成することが可能な文書要約
装置を提供する。 【解決手段】 関係解析部2は、文書入力部1で抽出し
たテキスト情報に対して係り受け解析を行い、単語の2
項関係を抽出して、関係選択部5に伝達する。指示解釈
部4は、指示入力部3でユーザが詳細化する情報を指示
すると、優先すべき2項関係の条件を示す優先情報に変
換して関係選択部5に伝達する。関係選択部5は、関係
解析部2から単語の2項関係と、指示解釈部4から優先
情報を得ると、優先情報とマッチする2項関係の優先度
を上げて重要な2項関係を選択する。この重要な2項関
係に、関係補完部6で日本語として必要な2項関係を補
完した後、句合成部7で句要約を合成して出力する。こ
のようにして、ユーザが指示した情報が詳細化されて盛
り込まれた句要約が作成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書内容を短時間
で把握するための要約を作成する文書要約作成装置に関
するものであり、特に情報検索において検索結果から適
合文書を選択する際に用いて好適な文書要約作成装置に
関するものである。
【0002】
【従来の技術】文書内容を短時間で把握させる要約技術
の一つとして、例えば、Cuttingほか,“Sca
tter/Gather: A Cluster−ba
sedApproach to Browsing L
arge DocumentCollection
s”,SIGIR−92,1992に記載されているよ
うなキーワードを列挙するものがある。このキーワード
列挙による要約は、単にキーワードとなる単語の羅列に
過ぎず、各単語間の関係が把握できないという問題があ
る。各単語間の関係がわからないと、実際の文書の内容
を把握できない場合も多い。
【0003】別の要約技術として、例えば特開平2−9
3866号公報に記載されているように、重要なキーワ
ードに基づいて文を抽出する、重要文ピックアップによ
る要約の作成方法がある。この方法では、文の単位で抽
出されるため、要約が比較的長くなる。そのため、作成
された要約から内容を一目で把握できないという問題が
ある。
【0004】さらに別の要約技術として、例えば特開平
5−101120号公報に記載されているように、文中
の修飾部分を削除し、文を短縮する方法がある。しかし
この方法では、1文の長さは短くなるが、文書全体とし
ての内容を要約したものではなく、文書内容を一目で把
握できないという問題がある。
【0005】上述のような要約技術では、いずれも作成
された要約から文書の内容を一目で把握できない。そこ
で、例えば特願平10−13961号に記載されている
ように、文書から抽出した重要な単語の2項関係から要
約句を合成する句表現要約の技術が提案されている。
【0006】句表現要約は、検索結果のふるい分けのた
めに、一目で内容を把握できるように短い句で要約を構
成する。短い句で要約を構成するため詳細な情報の欠落
は避けられず、情報の欠落によりふるい分けの精度が低
下する。これを回避するため、重要な詳細情報を要約に
盛り込むことが考えられる。しかし、個人や状況によっ
て重要な情報は異なってくるため、重要な詳細情報の絞
り込みは困難である。さらに、詳細情報を要約に盛り込
むと文が長くなり、一目で内容を把握するのが困難にな
る。また、ユーザの指示により要約に対応する原文を表
示して詳細情報をチェックすることも考えられるが、原
文の対応する場所を探したり、文を読むなどの負担がか
かり、一目で内容を把握することはできない。
【0007】一方、ユーザの興味を反映した要約を作成
するものとして、例えば特開平5−46610号公報に
記載されているように、ユーザに要約モードを提示し、
選択されたモードに対応した要約ルールを用いて要約を
作成する方法が提案されている。この方法では、選択さ
れたモードに対応した要約ルールにマッチした文や句が
そのまま切り出されるため、一目で内容を把握すること
は困難であり、ユーザが詳細化したい単語や情報の種類
を直接指定できないという問題もある。
【0008】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、ユーザが指示した情報を詳
細化した、一目で内容を把握できる要約を作成すること
が可能な文書要約装置を提供することを目的とするもの
である。
【0009】
【課題を解決するための手段】本発明は、入力された文
書の要約を作成して出力する文書要約作成装置であっ
て、まず関係解析手段において、入力された文書中のテ
キストに対して係り受け解析を行い、単語同士の2項関
係を抽出しておく。一方、指示入力手段で要約結果に対
してユーザから詳細化する単語や情報の種類の指示を受
け付け、その指示を優先すべき2項関係の条件を示す優
先条件に指示解釈手段で変換する。この優先条件と、抽
出しておいた2項関係から、重要な2項関係を関係選択
手段で選択し、選択した重要な2項関係に補完すべき2
項関係を関係補完手段で追加する。このようにして得ら
れた2項関係から、句合成手段で句要約を合成する。
【0010】また、本発明は、要約を作成する前に予め
指示入力手段でユーザから重視する情報の種類の指示を
受け付け、その指示を指示解釈手段において、優先すべ
き2項関係の条件に変換しておく。文書が入力された
ら、関係解析手段において入力された文書中のテキスト
に対して係り受け解析を行い、単語同士の2項関係を抽
出する。そして、抽出した2項関係と、指示解釈手段で
変換した優先条件から、重要な2項関係を関係選択手段
で選択し、選択した重要な2項関係に補完すべき2項関
係を関係補完手段で追加する。このようにして得られた
2項関係から、句要約を合成する。
【0011】このように本発明では、単語の2項関係か
ら句要約を合成するため、作成された要約から一目で文
書の内容を把握することができる。しかも、ユーザが詳
細化したい単語や情報の種類を指示することによって、
指示された情報を盛り込んで要約が作成される。そのた
め、個人や状況によって異なる重要性に応じた要約を作
成することが可能である。
【0012】
【発明の実施の形態】図1は、本発明の文書要約作成装
置の実施の一形態を示すブロック図である。図中、1は
文書入力部、2は関係解析部、3は指示入力部、4は指
示解釈部、5は関係選択部、6は関係補完部、7は句合
成部である。文書入力部1は、入力文書を得るとテキス
トを抽出し、テキスト情報を関係解析部2に伝達する。
関係解析部2は、テキスト情報を得ると係り受け解析を
行い、単語の2項関係を抽出して、2項関係情報として
関係選択部5に伝達する。指示入力部3は、ユーザが詳
細化する情報に関する指示を入力すると、その指示を指
示情報として指示解釈部4に伝達する。指示解釈部4
は、ユーザからの指示情報を得ると、優先すべき2項関
係の条件を示す優先情報に変換して関係選択部5に伝達
する。関係選択部5は、関係解析部2から単語の2項関
係情報を得るとともに指示解釈部4から優先情報を得る
と、優先情報とマッチする2項関係の優先度を上げて重
要な2項関係を選択し、重要2項関係情報として関係補
完部6に伝達する。関係補完部6は、重要2項関係情報
を得ると日本語として必要な2項関係を補完して、補完
2項関係情報を句合成部7に伝達する。句合成部7は、
補完2項関係情報を得ると句要約を合成して出力する。
【0013】次に具体例を用いて各部の動作を説明す
る。図2は、本発明の文書要約作成装置の実施の一形態
における第1の動作例の説明図である。この例では、入
力文書として以下の文書を先に入力し、いったん要約を
作成した後にユーザが詳細化したい部分を指示する場合
の各部の入力及び出力を示している。入力文書の例とし
て、「A社は十日からB社のパソコン向けのプリンタ
「PX100」を値下げする。値下げ幅は二十〜三十
%。パソコン本体の低価格化が進み、周辺機器に割安感
が出始めていることや売れ行きが好調なため値下げに踏
み切った。」という文書を入力する。
【0014】入力部1は、入力文書を得るとテキストを
抽出し、テキスト情報を関係解析部2に伝達する。ここ
では入力文書が全てテキストであるので、入力文書
(「A社は十日から…踏み切った。」)をテキスト情報
として関係解析部2に伝達する。
【0015】関係解析部2は、テキスト情報(「A社は
十日から…踏み切った。」)を得ると、係り受け解析を
行い、単語の2項関係を抽出し、2項関係情報として関
係選択部5に伝達する。この例では、単語の2項関係と
して、(A社,は,値下げ)、(「PX100」,を,
値下げ)、(B社,の,パソコン)、(パソコン,向け
の,プリンタ)、(プリンタ,名,「PX100」)、
…が抽出される。なお、ここでは単語の2項関係を(係
り側の単語、単語間の関係、受け側の単語)で表現して
いる。(A社,は,値下げ)は、「A社」が「値下げ」
に関係「は」で係っていることを表している。単語間の
関係は表層の関係「は」で表しているが、深層の関係
「動作主」で表してもよい。抽出したこれらの単語の2
項関係を、2項関係情報として関係選択部5に伝達す
る。
【0016】関係選択部5は、関係解析部2から単語の
2項関係情報を得ると、各2項関係についてスコアリン
グを行う。スコアリングの方法は従来技術を用いる。図
3は、本発明の文書要約作成装置の実施の一形態におけ
る第1の動作例において、関係選択部によるスコアリン
グ結果の一例の説明図である。この例では関係解析部2
から単語の2項関係情報として、((A社,は,値下
げ)、(「PX100」,を,値下げ)、(B社,の,
パソコン)、(パソコン,向けの,プリンタ)、(プリ
ンタ,名,「PX100」)、…)が得られる。得られ
た各2項関係について、例えば図3に示すようにスコア
を付されたものとする。
【0017】このようなスコアリングの後、関係選択部
5は、スコアが高い2項関係を重要2項関係として選択
し、重要2項関係情報を関係補完部6に伝達する。この
例では図3に示すように、2項関係(A社,は,値下
げ)、(「PX100」,を,値下げ)のスコアがそれ
ぞれ30,40と高いので、これらの2項関係を重要2
項関係情報として関係補完部6に伝達する。
【0018】関係補完部6は、重要2項関係情報を得る
と日本語として自然になるように必要な2項関係を補完
する。ここでは重要2項関係情報として((A社,は,
値下げ)、(「PX100」,を,値下げ))を得る
が、補完する2項関係はないので、そのまま補完2項関
係情報として句合成部7に伝達する。
【0019】句合成部7は、補完2項関係情報を得る
と、句要約を合成し、出力する。ここでは補完2項関係
情報として((A社,は,値下げ)、(「PX10
0」,を,値下げ))が得られるので、要約αとして
「A社は…「PX100」を…値下げする」を合成し、
例えば表示するなどして出力する。この時、詳細情報を
もつ語、例えば「「PX100」」や「値下げする」に
ついては、下線を付けたり色を変化させるなど、表示形
態を変更して表示するように構成してもよい。
【0020】ユーザは、句合成部7から出力された要約
αを参照することによって、入力された文書の内容を一
目で知ることができる。しかし、要約αでは詳細な情報
が欠落しているため、ユーザは個人や状況に応じてさら
に詳細な情報を得たい場合がある。本発明ではこのよう
な場合に、ユーザが指示することによって要約を詳細化
することができる。
【0021】ここでは、ユーザは例えば「PX100」
について詳細化したいとする。この場合、ユーザは、詳
細化したい情報として「PX100」を指示する入力を
指示入力部3において行う。詳細化する情報が複数ある
場合は、複数指示すればよい。例えば、(「PX10
0」,A社)のようにカンマで区切って表現したり、詳
細化したい語をマウスで順次クリックして指定すること
ができる。もちろん、指定方法は任意である。指示入力
部3は、ユーザから「PX100」を詳細化したい旨の
指示を受けると、詳細化を行う指示情報として「PX1
00」を指示解釈部4に伝達する。
【0022】指示解釈部4は、指示情報を得ると、スコ
アを上げるべき2項関係の条件を指定する優先情報を関
係選択部5に伝達する。この例では指示入力部3から指
示情報として「PX100」が得られるので、スコアを
上げるべき2項関係の条件を指定する優先情報として、
(*,*,「PX100」)を関係選択部5に伝達す
る。ここで、(*,*,「PX100」)は「PX10
0」を修飾する2項関係のスコアを上げることを示す。
【0023】関係選択部5は、関係解析部2から受け取
っている2項関係情報と、指示解釈部4から伝達される
優先情報を得ると、2項関係のスコアリングを再度行
い、重要な2項関係を選択する。先の処理で関係解析部
2から2項関係情報として、((A社,は,値下げ)、
(「PX100」,を,値下げ)、(B社,の,パソコ
ン)、(パソコン,向けの,プリンタ)、(プリンタ,
名,「PX100」)、…)が得られている。また、ユ
ーザによる「PX100」の詳細化の指示に従って、指
示解釈部4から優先情報として(*,*,「PX10
0」)が得られる。これらの2項関係情報と優先情報が
得られると、2項関係のスコアリングを再度行う。
【0024】図4は、本発明の文書要約作成装置の実施
の一形態における第1の動作例において、関係選択部に
よる優先情報を用いたスコアリング結果の一例の説明図
である。スコアリングのため、まず、優先情報(*,
*,「PX100」)により「PX100」を修飾する
2項関係を抽出する。ここでは、(B社,の,パソコ
ン)、(パソコン,向けの,プリンタ)、(プリンタ,
名,「PX100」)などの2項関係が抽出される。そ
して、これらの抽出された2項関係について、スコアを
上げる。スコアの値は、その2項関係が必ず選択される
ように設定すればよい。ここでは選択された重要2項関
係の最大のスコアとし、40とした。このようなスコア
リング処理によって、図4に示すようなスコアリング結
果が得られる。
【0025】このようにしてスコアリング処理を行った
後、スコアの高い2項関係を重要2項関係情報として抽
出する。ここでは、((A社,は,値下げ)、(「PX
100」,を,値下げ)、(B社,の,パソコン)、
(パソコン,向けの,プリンタ)、(プリンタ,名,
「PX100」))が重要2項関係情報として関係補完
部6に伝達される。
【0026】関係補完部6は、重要2項関係情報を得る
と、日本語として必要な2項関係を補完する。ここでは
重要2項関係情報として((A社,は,値下げ)、
(「PX100」,を,値下げ)、(B社,の,パソコ
ン)、(パソコン,向けの,プリンタ)、(プリンタ,
名,「PX100」))が得られるが、補完する必要が
ないので、そのまま((A社,は,値下げ)、(「PX
100」,を,値下げ)、(B社,の,パソコン)、
(パソコン,向けの,プリンタ)、(プリンタ,名,
「PX100」))が補完2項関係情報として句合成部
7に伝達される。
【0027】句合成部7は、補完2項関係情報として
((A社,は,値下げ)、(「PX100」,を,値下
げ)、(B社,の,パソコン)、(パソコン,向けの,
プリンタ)、(プリンタ,名,「PX100」))を得
ると、要約βとして「A社は...B社のパソコン向け
のプリンタ「PX100」を...値下げする」を合成
して出力する。
【0028】この要約βと先に出力した要約αを参照し
て分かるように、ユーザが指示した「PX100」が修
飾されており、指示内容が詳細化されている。このよう
にして、ユーザが指示した内容を詳細化した要約を作成
することができる。このとき、詳細化はユーザによる指
示に従って行われるので、不必要に要約が長くなること
はなく、コンパクトな要約が作成される。
【0029】図5は、本発明の文書要約作成装置の実施
の一形態における第2の動作例の説明図である。上述の
第1の動作例では、ユーザが詳細化したい対象のみを指
定したが、この第2の動作例では、詳細化すべき対象に
加えて情報の種類を指定する場合について説明する。こ
の例においても、上述の第1の動作例と同じ文書が入力
されるものとする。
【0030】入力部1は、入力文書を得るとテキストを
抽出し、テキスト情報として「A社は十日から…踏み切
った。」を関係解析部2に伝達する。関係解析部2は、
テキスト情報「A社は十日から…踏み切った。」を得る
と、係り受け解析を行うとともに、名詞に対して意味情
報の付与を行う。この処理によって、単語の2項関係と
して、(A社<会社>,は,値下げ)、(「PX10
0」<製品>,を,値下げ)、(十日<時間>,から,
値下げ)、…が抽出される。ここで、<>は意味情報を
表している。このような2項関係を、2項関係情報とし
て関係選択部5に伝達する。
【0031】関係選択部5は、2項関係情報として
((A社<会社>,は,値下げ)、(「PX100」<
製品>,を,値下げ)、(十日<時間>,から,値下
げ)、…)を得ると、各2項関係についてスコアリング
を行う。スコアリングの方法は従来技術を用いることが
できる。図6は、本発明の文書要約作成装置の実施の一
形態における第2の動作例において、関係選択部による
スコアリング結果の一例の説明図である。図6に示すよ
うに各2項関係についてスコアが計算されると、スコア
が高い2項関係を重要2項関係として選択し、重要2項
関係情報を関係補完部6に伝達する。図6に示す例で
は、2項関係(A社,は,値下げ)、(「PX10
0」,を,値下げ)のスコアがそれぞれ30,40と高
いので、これらの2項関係を重要2項関係情報として関
係補完部6に伝達する。
【0032】関係補完部6は、重要2項関係情報を得る
と、日本語として自然になるように必要な2項関係を補
完する。この例では重要2項関係情報として、2項関係
(A社,は,値下げ)、(「PX100」,を,値下
げ)を得るが、補完する2項関係はないので、そのまま
補完2項関係情報として((A社,は,値下げ)、
(「PX100」,を,値下げ))を句合成部7に伝達
する。
【0033】句合成部7は、補完2項関係情報として2
項関係(A社,は,値下げ)、(「PX100」,を,
値下げ)を得ると、要約αとして「A社は…「PX10
0」を…値下げする。」を合成し、例えば表示するなど
して出力する。この時、詳細情報をもつ語、例えば
「「PX100」を」、「値下げする」の部分に対し
て、下線を付けたり、色を変化させるなど、表示形態を
変更して表示してもよい。
【0034】ユーザは要約αを得て、入力した文書の内
容を一目で把握することができる。ここで、ユーザはさ
らに値下げの日時について、さらに詳細に知りたいとす
る。この場合、ユーザは指示入力部3に対して、「値下
げ」の詳細化を指示するとともに、情報の種類として日
時を指示する。情報の種類としては、日時のほか、場所
や価格など、種々の指定が可能である。また、詳細化す
る対象および情報の種類を複数指定することも可能であ
る。例えば(「PX100」,値下げの日時)のように
カンマで区切って表現すればよい。あるいは、詳細化し
たい語をマウスでクリックするとメニューが表示され、
メニューから情報の種類を選択して指定するように構成
してもよい。
【0035】指示入力部3は、ユーザから値下げの日時
を詳細化する指示を受け取ると、それを「値下げ[日
時]」という形式の指示情報として指示解釈部4に伝達
する。指示情報中の[日時]は情報の種類を示してい
る。詳細化する情報が複数ある場合は、例えば(「PX
100」,値下げ[日時][価格])のように項目はカ
ンマで区切り、情報の種類は並べて表現することができ
る。もちろん、表現方法は任意である。
【0036】指示解釈部4は、指示情報を得ると、スコ
アを上げるべき2項関係の条件に変換する。変換方法は
色々考えられるが、ここでは詳細情報変換テーブルを用
いて変換する。図7は、詳細情報変換テーブルの一例の
説明図である。詳細情報変換テーブルには、図7に示す
ように、ユーザが指定する情報の種類と、意味情報およ
び2項関係を示す情報との対応が格納されている。指示
解釈部4は、指示情報を得ると、この詳細情報変換テー
ブルを参照し、優先情報を生成して関係選択部5へ伝達
する。この例では、指示入力部3から指示情報として
「値下げ[日時]」を得るので、図7に示す詳細情報変
換テーブルから[日時]に対応付けられている「<時間
>+で/に/から/まで/、」が得られる。これをもと
に、指示情報を優先情報(<時間>,で/に/から/ま
で/、,値下げ)に変換し、関係選択部5に伝達する。
(<時間>,で/に/から/まで/、,値下げ)は、係
り側が<時間>、受け側が「値下げ」、関係が「で」ま
たは「に」または「から」または「まで」または「、」
である2項関係を示している。この優先情報にマッチす
る2項関係が存在する場合に、その2項関係のスコアを
上げることを関係選択部5に対して指示している。
【0037】関係選択部5は、2項関係情報と優先情報
を得ると、2項関係のスコアリングを行い重要な2項関
係を選択する。上述のように関係解析部2からは、2項
関係情報として、((A社<会社>,は,値下げ)、
(「PX100」<製品>,を,値下げ)、(十日<時
間>,から,値下げ)、…)が得られている。また、上
述のように指示解釈部4から、優先情報として(<時間
>,で/に/から/まで/、,値下げ)を得る。ここ
で、優先情報(<時間>,で/に/から/まで/、,値
下げ)とマッチする2項関係として、(十日<時間>,
から,値下げ)がある。この優先情報とマッチした2項
関係(十日<時間>,から,値下げ)のスコアを上げ
る。図8は、本発明の文書要約作成装置の実施の一形態
における第2の動作例において、関係選択部による優先
情報を用いたスコアリング結果の一例の説明図である。
ここでは、優先情報とマッチした2項関係(十日<時間
>,から,値下げ)のスコアを、20から40に上げて
いる。スコアの値はその2項関係が必ず選択されるよう
に設定すればよく、ここでは選択された重要2項関係の
最大のスコアである40とした。
【0038】このようにしてスコアを更新した後、重要
な2項関係を選択し、重要2項関係情報として関係補完
部6に伝達する。図8に示すようにスコアの値が更新さ
れた後では、((A社,は,値下げ)、(「PX10
0」,を,値下げ)、(十日,から,値下げ))が重要
2項関係情報として関係補完部6に伝達される。
【0039】関係補完部6は、重要2項関係情報を得る
と、日本語として必要な2項関係を補完する。この例で
は重要2項関係情報として((A社,は,値下げ)、
(「PX100」,を,値下げ)、(十日,から,値下
げ))を得るが、補完する必要がないので、そのまま
((A社,は,値下げ)、(「PX100」,を,値下
げ)、(十日,から,値下げ))を補完2項関係情報と
して句合成部7に伝達する。
【0040】句合成部7は、補完2項関係情報として
((A社,は,値下げ)、(「PX100」,を,値下
げ)、(十日,から,値下げ))を得ると、要約βとし
て「A社は...十日から...「PX100」
を...値下げする」という要約を合成して、例えば表
示するなどして出力する。
【0041】この要約βと先に出力した要約αを参照し
て分かるように、ユーザが指示した「値下げ」に対し
て、「十日から」という日時に関する修飾のみが行われ
ている。このようにして、ユーザが詳細化したい内容と
ともに、情報の種類を指示することによって、指示した
情報の種類に応じた詳細化が行われる。このようにし
て、ユーザは所望の内容を詳細化した要約を得ることが
できる。
【0042】図9は、本発明の文書要約作成装置の実施
の一形態における第3の動作例の説明図である。上述の
第1、第2の動作例では、いったん出力される要約結果
をユーザが見て、詳細化したい情報を指定した。しか
し、要約を作成する前にユーザが重視する(詳細化した
い)情報の種類を指定することも可能であり、その場合
の例を第3の動作例として説明する。
【0043】ユーザは、例えば日時情報を重視したいと
すると、指示入力部3に対して日時の詳細化を指示入力
する。指示可能な情報の種類としては、日時のほかに
も、場所、価格など、種々の項目を指示することが可能
である。また、詳細化する情報が複数ある場合は、例え
ば(日時、価格)のようにカンマで区切って表現した
り、あるいは、詳細化したい情報の種類をマウスを用い
てメニューから選択して指定するように構成してもよ
い。
【0044】指示入力部3は、ユーザから日時を詳細化
するように指示を受けると、指示情報として([日
時])を指示解釈部4に伝達する。[日時]は情報の種
類を示し、詳細化する情報が複数ある場合は、例えば
([日時][価格])のように並べて表現すればよい。
【0045】指示解釈部4は、指示情報を得ると、スコ
アを上げるべき2項関係の条件である優先情報に変換す
る。変換方法は色々考えられるが、ここでは上述の図7
に示した詳細情報変換テーブルを用いて変換する。この
詳細情報変換テーブルにより、指示情報([日時])は
優先情報(<時間>,で/に/から/まで/、,*)に
変換され、関係選択部5に伝達される。(<時間>,で
/に/から/まで/、,*)は、係り側が<時間>で、
関係が「で」または「に」または「から」または「ま
で」または「、」である2項関係を示している。この優
先情報にマッチする2項関係が存在する場合に、その2
項関係のスコアを上げることを関係選択部5に対して指
示している。
【0046】入力部1は、入力文書を得るとテキストを
抽出し、テキスト情報を関係解析部2に伝達する。ここ
では上述の第1,第2の動作例と同じ文書「A社は十日
から…踏み切った。」が入力されるものとする。この文
書がテキスト情報として関係解析部2に伝達される。
【0047】関係解析部2は、テキスト情報を得ると、
係り受け解析と名詞に意味情報の付与を行い、単語の2
項関係を抽出して関係選択部5に伝達する。ここではテ
キスト情報として「A社は十日から…踏み切った。」を
得る。このテキスト情報に対して、係り受け解析と名詞
に意味情報の付与を行い、単語の2項関係として(A社
<会社>,は,値下げ)、(「PX100」<製品>,
を,値下げ)、(十日<時間>,から,値下げ)、…を
抽出し、2項関係情報として関係選択部5に伝達する。
ここで、<>は意味情報を表している。
【0048】関係選択部5は、2項関係情報と優先情報
を得ると、2項関係のスコアリングを行い、重要な2項
関係を選択する。予め、指示解釈部4から優先情報とし
て(<時間>,で/に/から/まで/、,*)が得られ
ている。また、関係解析部2から、2項関係情報として
((A社<会社>,は,値下げ)、(「PX100」<
製品>,を,値下げ)、(十日<時間>,から,値下
げ)、…)が得られる。ここで、2項関係情報として得
られた各2項関係についてスコアリングを行う。このと
き、優先情報(<時間>,で/に/から/まで/、,
*)とマッチする2項関係については、スコアを上げる
ように処理する。図10は、本発明の文書要約作成装置
の実施の一形態における第3の動作例において、関係選
択部によるスコアリング結果の一例の説明図である。優
先情報(<時間>,で/に/から/まで/、,*)とマ
ッチする2項関係として、(十日<時間>,から,値下
げ)がある。この2項関係については、通常のスコアリ
ング処理ではスコアが20となるが、これを図10に示
すように40に上げている。スコアを上げる際の値は、
その2項関係が必ず選択されるように設定すればよい。
ここでは、選択された重要2項関係の最大のスコアであ
る40とした。
【0049】スコアリングの後、スコアの値が大きい2
項関係を選択し、重要2項関係情報として関係補完部6
に伝達する。図10に示すようにスコアが求められた場
合には、重要2項関係情報として((A社,は,値下
げ)、(「PX100」,を,値下げ)、(十日,か
ら,値下げ))が関係補完部6に伝達される。
【0050】関係補完部6は、重要2項関係情報を得る
と、日本語として必要な2項関係を補完する。ここでは
重要2項関係情報として((A社,は,値下げ)、
(「PX100」,を,値下げ)、(十日,から,値下
げ))が得られるが、日本語として必要な2項関係を補
完する必要がないので、そのまま((A社,は,値下
げ)、(「PX100」,を,値下げ)、(十日,か
ら,値下げ))を補完2項関係情報として句合成部7に
伝達する。
【0051】句合成部7は、補完2項関係情報として
((A社,は,値下げ)、(「PX100」,を,値下
げ)、(十日,から,値下げ))を得ると、要約として
「A社は...十日から...「PX100」を...
値下げする」を合成し、例えば表示するなどして出力す
る。
【0052】ユーザによる日時の詳細化の指示入力がな
ければ、上述の第1,第2の動作例において作成された
要約αのように、「A社は...「PX100」
を...値下げする」という要約が得られる。しかし、
この第3の動作例では、ユーザが事前に日時を重視する
という指定を行い、その指定に従って日時を表す2項関
係を優先させる。これにより、「A社は...十日か
ら...「PX100」を...値下げする」という、
日時に関する内容が詳細化された要約が得られる。
【0053】図11は、本発明の文書要約作成装置の実
施の一形態における第4の動作例の説明図である。上述
の第2、第3の動作例では、ユーザの詳細化情報の指示
を、優先すべき単語と単語間の関係情報に変換したが、
この第4の動作例では、多様な表現に対応するため、ユ
ーザの詳細化情報の指示を、優先すべき単語の意味情報
に変換するようにした例について説明する。
【0054】ユーザは、例えば価格情報を重視したいと
すると、指示入力部3に対して価格の詳細化を指示入力
する。指示可能な情報の種類としては、価格のほかに
も、場所、日時、会社名、製品名、人名など、種々の情
報の種類を指定することができる。また、詳細化する情
報の種類が複数ある場合は、例えば(日時、価格)のよ
うにカンマで区切って表現したり、あるいは、詳細化し
たい情報の種類をマウスを用いてメニューから選択して
指定するように構成してもよい。
【0055】指示入力部3は、ユーザから詳細化する情
報の種類として価格が指示されると、指示情報として
([価格])を指示解釈部4に伝達する。[価格]は情
報の種類を示している。詳細化する情報の種類が複数あ
る場合は、例えば([日時][価格])のように並べて
表現すればよい。
【0056】指示解釈部4は、指示情報を得ると、スコ
アを上げるべき2項関係の条件である優先情報に変換す
る。変換方法は色々考えられるが、ここでは詳細情報変
換テーブルを用いて変換する。図12は、詳細情報変換
テーブルの一例の説明図である。図12に示す例では、
情報の種類と、それに対応する意味情報を組にして保持
している。このような詳細情報変換テーブルを用いるこ
とにより、情報の種類[価格]から、意味情報<金額>
が得られる。指示解釈部4は、これをもとに指示情報
([価格])を優先情報((<金額>,*,*)(*,
*,<金額>))に変換し、関係選択部5に伝達する。
(<金額>,*,*)は、係り側が<金額>、(*,
*,<金額>)は受け側が<金額>の2項関係を示して
いる。この優先情報にマッチする2項関係が存在する場
合に、その2項関係のスコアを上げることを関係選択部
5に対して指示している。
【0057】入力部1は、入力文書を得るとテキストを
抽出し、テキスト情報を関係解析部2に伝達する。ここ
では、文書「A社は十日からB社のパソコン向けのプリ
ンタ「PX100」を値下げする。価格は二十%割引の
四万円。パソコン本体の低価格化が進み、周辺機器に割
安感が出始めていることや売れ行きが好調なため値下げ
に踏み切った。」が入力されたものとする。この文書の
テキストがテキスト情報として関係解析部2に伝達され
る。
【0058】関係解析部2は、テキスト情報を得ると、
係り受け解析と名詞に意味情報の付与を行い、単語の2
項関係を抽出して関係選択部5に伝達する。ここではテ
キスト情報として「A社は十日から…踏み切った。」が
得られるので、このテキスト情報に対して係り受け解析
と名詞に意味情報の付与を行い、単語の2項関係を抽出
する。例えば、2項関係(A社<会社>,は,値下
げ)、(「PX100」<製品>,を,値下げ)、(十
日<時間>,から,値下げ)、(価格<価格>,だ,四
万円<金額>)、…などが抽出される。ここで、<>は
意味情報を表す。抽出された2項関係は、2項関係情報
として関係選択部5に伝達される。
【0059】関係選択部5は、2項関係情報と優先情報
を得ると、2項関係のスコアリングを行い重要な2項関
係を選択する。ここでは予め指示解釈部4から優先情報
として((<金額>,*,*)(*,*,<金額>))
が得られている。また、関係解析部2から2項関係情報
として、((A社<会社>,は,値下げ)、(「PX1
00」<製品>,を,値下げ)、(十日<時間>,か
ら,値下げ)、(価格<価格>,だ,四万円<金額
>)、…)が得られている。関係選択部5は、これらの
2項関係に対してスコアリングを行う。このとき、優先
情報((<金額>,*,*)(*,*,<金額>))と
マッチする2項情報については、スコアを上げる処理を
行う。図13は、本発明の文書要約作成装置の実施の一
形態における第4の動作例において、関係選択部による
スコアリング結果の一例の説明図である。優先情報
((<金額>,*,*)(*,*,<金額>))とマッ
チする2項関係として、(価格<価格>,だ,四万円<
金額>)がある。この2項関係については、通常のスコ
アリング処理ではスコアが10となるが、これを図13
に示すように40に上げている。スコアを上げる際の値
は、その2項関係が必ず選択されるように設定すればよ
い。ここでは、選択された重要2項関係の最大のスコア
である40とした。
【0060】スコアリングの後、スコアの値が大きい2
項関係を選択し、重要2項関係情報として関係補完部6
に伝達する。図13に示すようにスコアが求められた場
合には、2項関係(A社,は,値下げ)、(「PX10
0」,を,値下げ)、(価格,だ,四万円)を重要2項
関係として関係補完部6に伝達する。
【0061】関係補完部6は、重要2項関係情を得る
と、日本語として必要な2項関係を補完する。この例で
は、重要2項関係情報として((A社,は,値下げ)、
(「PX100」,を,値下げ)、(価格,だ,四万
円))が得られるが、日本語として必要な2項関係を補
完する必要がないので、そのまま、((A社,は,値下
げ)、(「PX100」,を,値下げ)、(価格,だ,
四万円))を補完2項関係情報として句合成部7に伝達
する。
【0062】句合成部7は、補完2項関係情報として
((A社,は,値下げ)、(「PX100」,を,値下
げ)、(価格,だ,四万円))を得ると、要約として
「A社は...「PX100」を...値下げする、価
格は四万円」を合成し、例えば表示するなどして出力す
る。
【0063】ユーザによる価格の詳細化の指示入力がな
ければ、上述の第1,第2の動作例において作成された
要約αのように、「A社は...「PX100」
を...値下げする」という要約が得られる。しかし、
この第4の動作例では、ユーザが事前に価格を重視する
という指定を行い、価格を表す単語を優先することによ
り、「A社は...「PX100」を...値下げす
る、価格は四万円」という、価格の情報が付加された要
約が得られる。また、ユーザが会社名を重視したいとす
ると、同様に、「A社は... B社のパソコン向けの
プリンタ「PX100」を...値下げする」という要
約が得られる。
【0064】この第4の動作例では、事前に詳細化する
情報を指定するようにしたが、第1,第2の動作例と同
様に、要約結果を見てから指定するようにしてもよい。
また、この動作例では、ユーザからの指示を優先すべき
2項関係の条件として単語の意味情報に変換している
が、単語の意味情報および単語の意味と単語間の関係情
報に変換するようにしてもよい。
【0065】
【発明の効果】以上の説明から明らかなように、本発明
によれば、短い句で要約を構成するため、一目で文書の
内容を把握することができる。しかも、欠落した詳細な
情報は、例えば要約結果に対してユーザが詳細化したい
情報や情報の種類を指示したり、あるいは事前にユーザ
が重視する情報を指示することにより、個人や状況によ
って異なる重要な情報を盛り込んだコンパクトな要約を
作成することができる。また、要約を再作成するために
要する時間は、文章の関係抽出に比べ非常に小さいた
め、抽出された2項関係を再利用することによって、高
速に要約を再作成することができるという効果がある。
【図面の簡単な説明】
【図1】 本発明の文書要約作成装置の実施の一形態を
示すブロック図である。
【図2】 本発明の文書要約作成装置の実施の一形態に
おける第1の動作例の説明図である。
【図3】 本発明の文書要約作成装置の実施の一形態に
おける第1の動作例において、関係選択部によるスコア
リング結果の一例の説明図である。
【図4】 本発明の文書要約作成装置の実施の一形態に
おける第1の動作例において、関係選択部による優先情
報を用いたスコアリング結果の一例の説明図である。
【図5】 本発明の文書要約作成装置の実施の一形態に
おける第2の動作例の説明図である。
【図6】 本発明の文書要約作成装置の実施の一形態に
おける第2の動作例において、関係選択部によるスコア
リング結果の一例の説明図である。
【図7】 詳細情報変換テーブルの一例の説明図であ
る。
【図8】 本発明の文書要約作成装置の実施の一形態に
おける第2の動作例において、関係選択部による優先情
報を用いたスコアリング結果の一例の説明図である。
【図9】 本発明の文書要約作成装置の実施の一形態に
おける第3の動作例の説明図である。
【図10】 本発明の文書要約作成装置の実施の一形態
における第3の動作例において、関係選択部によるスコ
アリング結果の一例の説明図である。
【図11】 本発明の文書要約作成装置の実施の一形態
における第4の動作例の説明図である。
【図12】 詳細情報変換テーブルの一例の説明図であ
る。
【図13】 本発明の文書要約作成装置の実施の一形態
における第4の動作例において、関係選択部によるスコ
アリング結果の一例の説明図である。
【符号の説明】
1…文書入力部、2…関係解析部、3…指示入力部、4
…指示解釈部、5…関係選択部、6…関係補完部、7…
句合成部。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 ND03 NK32 NS01 PQ02 QM10 QP10 UU06 5B091 AA11 BA19 DA02 DA04 DA10 EA07

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書の要約を作成して出力す
    る文書要約作成装置において、入力された文書中のテキ
    ストに対して係り受け解析を行い単語同士の2項関係を
    抽出する関係解析手段と、要約結果に対してユーザから
    詳細化する単語の指示を受け付ける指示入力手段と、該
    指示入力手段から入力されたユーザからの指示を優先す
    べき2項関係の条件を示す優先条件に変換する指示解釈
    手段と、前記関係解析手段で抽出した2項関係と前記指
    示解釈手段で変換した優先条件から重要な2項関係を選
    択する関係選択手段と、該関係選択手段で選択した重要
    な2項関係に補完すべき2項関係を追加する関係補完手
    段と、該関係補完手段から得られた2項関係から句要約
    を合成する句合成手段を有することを特徴とする文書要
    約作成装置。
  2. 【請求項2】 前記指示入力手段は、ユーザから詳細化
    すべき単語とともに情報の種類の指示を受け付けること
    を特徴とする請求項1に記載の文書要約作成装置。
  3. 【請求項3】 入力された文書の要約を作成して出力す
    る文書要約作成装置において、要約を作成する前にユー
    ザから重視する情報の種類の指示を受け付ける指示入力
    手段と、該指示入力手段で受け付けたユーザからの指示
    を優先すべき2項関係の条件に変換する指示解釈手段
    と、入力された文書中のテキストに対して係り受け解析
    を行い単語同士の2項関係を抽出する関係解析手段と、
    該関係解析手段で抽出した2項関係と前記指示解釈手段
    で変換した優先条件から重要な2項関係を選択する関係
    選択手段と、該関係選択手段で選択した重要な2項関係
    に補完すべき2項関係を追加する関係補完手段と、該関
    係補完手段から得られた2項関係から句要約を合成する
    句合成手段を有することを特徴とする文書要約作成装
    置。
  4. 【請求項4】 前記指示解釈手段は、前記指示入力手段
    で受け付けたユーザからの指示を優先すべき2項関係の
    条件として単語の意味情報および単語の意味と単語間の
    関係情報に変換することを特徴とする請求項2または請
    求項3に記載の文書要約作成装置。
JP05475599A 1999-03-02 1999-03-02 要約作成装置及び要約作成方法 Expired - Fee Related JP3937118B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05475599A JP3937118B2 (ja) 1999-03-02 1999-03-02 要約作成装置及び要約作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05475599A JP3937118B2 (ja) 1999-03-02 1999-03-02 要約作成装置及び要約作成方法

Publications (3)

Publication Number Publication Date
JP2000250937A true JP2000250937A (ja) 2000-09-14
JP2000250937A5 JP2000250937A5 (ja) 2004-10-07
JP3937118B2 JP3937118B2 (ja) 2007-06-27

Family

ID=12979603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05475599A Expired - Fee Related JP3937118B2 (ja) 1999-03-02 1999-03-02 要約作成装置及び要約作成方法

Country Status (1)

Country Link
JP (1) JP3937118B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332208B2 (en) 2007-09-05 2012-12-11 Sony Corporation Information processing apparatus, information processing method, and program
JP2014044538A (ja) * 2012-08-27 2014-03-13 Nippon Telegr & Teleph Corp <Ntt> 要約生成装置及び方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332208B2 (en) 2007-09-05 2012-12-11 Sony Corporation Information processing apparatus, information processing method, and program
JP2014044538A (ja) * 2012-08-27 2014-03-13 Nippon Telegr & Teleph Corp <Ntt> 要約生成装置及び方法及びプログラム

Also Published As

Publication number Publication date
JP3937118B2 (ja) 2007-06-27

Similar Documents

Publication Publication Date Title
KR100745443B1 (ko) 텍스트 변환 방법, 정보 처리 시스템 및 컴퓨터 판독가능한 저장 매체
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
US8332208B2 (en) Information processing apparatus, information processing method, and program
JPH09134282A (ja) プログラム作成方法
JP2004157981A (ja) 要約表現装置
JP2001075966A (ja) データ分析システム
US7765201B2 (en) System and method of making search for document in accordance with query of natural language
US20050160086A1 (en) Information extraction apparatus and method
CN110678858B (zh) 检索用资料信息存储装置
JP4049317B2 (ja) 検索支援装置およびプログラム
JP2011513810A (ja) 用語識別方法および装置
JP2003248681A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2004318510A (ja) 対訳情報作成装置、対訳情報作成用プログラム、対訳情報作成方法、対訳情報検索装置、対訳情報検索用プログラム及び対訳情報検索方法
JP5151368B2 (ja) 情報処理装置および情報処理プログラム
JP2003162531A (ja) 文書検索システムおよび文書検索方法
JPH1145267A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3937118B2 (ja) 要約作成装置及び要約作成方法
JP4499179B1 (ja) 端末装置
JPH0962684A (ja) 情報検索方法及び情報検索装置と、情報案内方法及び情報案内装置
JP7038884B1 (ja) ユーザアシストシステム
JP2009129176A (ja) 構造化文書検索装置、方法およびプログラム
JP5289261B2 (ja) 文章変換装置、方法及びプログラム
JPH09185632A (ja) 情報検索・編集方法及び装置
JP2004213309A (ja) 情報表示制御装置及びプログラム
JP6996190B2 (ja) 複合語生成装置、プログラム及び複合語生成方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070313

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120406

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140406

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees