JP2005234635A - 文書要約装置および方法 - Google Patents

文書要約装置および方法 Download PDF

Info

Publication number
JP2005234635A
JP2005234635A JP2004039510A JP2004039510A JP2005234635A JP 2005234635 A JP2005234635 A JP 2005234635A JP 2004039510 A JP2004039510 A JP 2004039510A JP 2004039510 A JP2004039510 A JP 2004039510A JP 2005234635 A JP2005234635 A JP 2005234635A
Authority
JP
Japan
Prior art keywords
role
document
sentence
search
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004039510A
Other languages
English (en)
Inventor
Mamiko Oka
満美子 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004039510A priority Critical patent/JP2005234635A/ja
Publication of JP2005234635A publication Critical patent/JP2005234635A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ユーザの視点に応じた要約を生成する。
【解決手段】 ユーザは、文書入力部10を用いて要約したい文書を指定する。さらに、要約のための視点を、キーワード/役割指定部13を用いてキーワードとその役割で指定する。指定された文書は、役割解析部11に送られ、抽出された役割情報が役割情報記憶部12に登録される。役割の抽出が終わると、文書中の各文のスコアをスコア計算部14において計算する。そしてスコア計算部14のスコアに基づいて要約生成部15により要約を合成する。ここでは、文単位でスコアリングしてスコアの高いものを要約として抽出する重要文ピックアップの手法を用いている。生成された要約は表示部16に表示される。
【選択図】 図1

Description

この発明は、文書の要約を生成する文書要約技術に関し、とくに、ユーザの視点に応じた要約を生成できるようにしたものである。
文書から重要な文を選択して要約を作成する重要文抽出手法による要約では、文の重要度に、検索クエリ中の単語の出現頻度を加味することにより、検索の視点に応じた要約を作成する方法が非特許文献1で提案されている。
単語間の2項関係に基づいて要約文を作成する場合は、入力したキーワードを含む文から要約文を作成する方法が、特許文献1に提案されている。
しかしながら、ユーザの視点を表すには、キーワードだけでは不十分である。キーワードが何かをした(動作主体)とか、何かをされた(動作・作用の対象)とか、何かが起こった場所だとかいう、文中での役割が重要であると考えられるが、そのような視点から要約を作成する方法は提案されていない。
また、文書の概要を把握するのには、誰が、どこで、いつといったいわゆる5W1Hと言われるような情報が重要であり、こういう視点で文書を検索したり要約したりしたい場合は多いが、ここで「誰」とか「どこ」とかを表すのは固有名であることが多い。例えば、自分の注目している企業が「誰が」であるとか、自分の注目している場所が「どこで」であるような情報を知りたい、という要求は多いと思われる。しかしながら、このような「固有名+役割」を視点として要約を作成する手段は提案されていない。
本発明者は、鋭意研究の結果、固有名および役割に着目することにより、ユーザの視点に応じた要約を生成することができるという知見をえた。
特開平11−282881号公報 Tombros, A. and Sanderson, M. (1998). "Advantages of Query Biased Summaries in Information Retrieval." In Proc. of the 21st Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval, pp. 2-10.)
この発明は、以上の事情を考慮してなされたものであり、視点となるキーワードおよび役割に着目することにより、ユーザの視点に応じた要約を生成することができる文書要約技術を提供することを目的としている。
この発明の構成例においては、上述の目的を達成するために、役割解析手段により、文書中の固有名や自立語などの単語の文中での役割を解析し、単語と役割をセットで保持する。要約視点指定手段(キーワード/役割指定手段)により、ユーザが、要約の視点を表すキーワードとその役割を指定する。要約手段により、指定されたキーワードとその役割を含む文を抽出し、各文をスコアリングして、スコアの高い所定数の文を、要約として選択する。要約結果は出力手段により出力される。要約結果は、要約視点に適合したものであり、ユーザが真に欲する要約を提供できる。
さらにこの発明を説明する。
この発明の一側面によれば、上述の目的を達成するために、文書要約装置に:処理対象文書を入力する文書入力手段と;キーワードと、文におけるキーワードの役割とを指定する要約視点指定手段と;上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別する役割判別手段と;上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせる突き合わせ手段と;上記突き合わせ手段の突き合わせ結果に基づいて要約を構成すべき文を選択して要約を作成する要約作成手段とを設けるようにしている。
「処理対象文書」は、一まとまりの複数の文であり、典型的には外部から受け付けた文書、定期的に外部から回収した文書等であり、またファイル名、パス名、URL等のアドレスにより特定できるものであるが、これに限定されない。例えば、複数の文書を一まとめにしたものも「処理対象文書」であり、この場合、一まとまりの複数の文書からそれら全体の要約を作成する。また、ファイル名等により1つの文書単位として管理される文書のうちのセクション等の部分も「処理対象文書」である。この場合、指定したセクションの要約や、セクションごとの要約を作成する。
突き合わせは、例えば、上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせて、上記各文のスコアを計算するスコア計算手段であり、要約作成手段は、上記各文の上記スコアに基づいて要約を構成すべき文を選択して要約を作成する。
この構成においては、ユーザが指定した視点に合致した、真にユーザが欲する要約を提供できる。
この構成において、上記役割は、動作、状態、状態変化などの主体、対象、相手、手段、場所、時間などである。上記役割は、例えば、表層格により表される。また、上記キーワードは例えば固有表現である。固有表現(固有名ともいう)は、人名、組織名、地名、通貨、日付等、文中の重要な表現単位である。
上記スコア計算手段は、例えば、各文に含まれる自立語のスコアを加算し、さらに上記自立語が上記指定されたキーワードであり、かつ指定された役割を持つときに大きな重みを付けてもよい。
上記スコア計算手段は、例えば、各文に含まれる自立語のスコアを加算し、さらに上記自立語が上記指定されたキーワードの場合に所定の重みを付け、さらに上記自立語が上記指定されたキーワードで指定された役割を持つときにより大きな重みを付ける。
上記自立語のスコアは例えば周知のtf*IDFのスコアである(tfは、ある文書中のある語の出現頻度を表し、IDFは語がそのくらい特定性を有するかを表す)。
また、この発明の他の側面によれば、文書要約装置に:検索キーワードおよび当該検索キーワードの役割を入力する検索視点入力手段と;検索対象の各文書に含まれる各文について当該各文の所定の語句の役割を判別する文書役割判別手段と;少なくとも上記検索キーワードに基づいて文書を検索する検索手段と;上記検索手段により検索された各文書に対して、当該各文書に含まれる各文の所定の語句およびその役割を、上記検索キーワードおよびその役割に突き合わせて上記各文書に含まれる各文のスコアを計算するスコア計算手段と;上記各文書に含まれる各文の上記スコアに基づいて上記各文書の要約を構成すべき文を選択して要約を作成する要約作成手段とを設けるようにしている。スコア計算手段は、上述の突き合わせ手段でもよく、この突き合わせ結果に基づいて要約を合成しても良い。
この構成においては検索結果を所望の要約視点で鳥瞰することができる。
この構成において、上記検索視点入力手段は、例えば、検索クエリを入力する検索クエリ入力手段と、上記検索クエリからキーワードおよびその役割を抽出するキーワード役割抽出手段とを含む。
また、上記検索手段は、例えば、上記検索キーワードおよびその役割に基づいて文書を検索する。
また、この発明のさらに他の側面によれば、検索装置に:検索クエリを入力する検索クエリ入力手段と;検索クエリに含まれる語句の役割を判別する役割判別手段と;上記検索クエリに含まれる語句および上記役割判別手段により判別された役割に基づいて文書を検索する検索手段とを設けるようにしている。
この構成においては、語句と役割に応じて検索視点で検索を行なえる。
なお、検索クエリは例えば自然文であるが、これに代えて明示的にキーワードおよび役割をユーザが指定できるようにしても良い。
なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。
この発明によれば、キーワードおよびその役割により決定される要約視点で要約を生成でき、真にユーザが欲する要約を生成できる。
以下、この発明の実施例について説明する。
まず、この発明を文書要約システムに適用した実施例1について説明する。
図1は、この実施例の文書要約システムを全体として示しており、図2は、その動作例を示している。これらの図において、文書要約システムは、文書入力部10、役割解析部11、役割情報記憶部12、キーワード/役割指定部13、スコア計算部14、要約生成部15および表示部16等を含んで構成されている。文書要約システムは典型的にはコンピュータ100に実装されるが、これに限定されない。
ユーザは、文書入力部10を用いて要約したい文書を入力する。既存の文書を指定するようにしてもよい(ステップS10)。さらに、要約のための視点を、キーワード/役割指定部13を用いてキーワードとその役割で指定する(ステップS11)。キーワードは、例えば、自立語、名詞、固有名などとする。本実施例では、固有名とする。役割は、指定したキーワードが文中でどのような役割を果たしているかを表すもので、例えば動作や状態、状態変化などの、主体、対象、相手、手段、場所、時間などである。これらは通常、キーワードである名詞が、動詞など用言のどのような格を占めているかによって表される。役割の指定方法は、主体、対象といった役割の名称で指定してもいいし、「が」、「を」といった文中での表層格で指定してもよい。例えば、図4のようなメニューを用意し、ユーザはこの中から選択するようにしてもよい。ここでは、一例として、キーワードとして「A社」を指定し、役割として図4のメニューから(1)の「動作や状態の主体:「が」「は」など」を指定するものとする。
指定された文書は、役割解析部11に送られ、抽出された役割情報が役割情報記憶部12に記憶される(ステップS12、S13)。役割解析部11は、例えば図3に示すように、形態素解析部111、構文解析部112、役割情報抽出部113を含んで構成されるが、これに限定されない。例えば、図5のようなテキストが指定された場合を考える。このテキストは、役割解析部11の形態素解析部111でまず形態素解析され、品詞が付与される。形態素解析されたテキストに対して、構文解析部112によって単語間の係り受け関係が解析される。なお、指定されたキーワードを含む文のみを係り受け解析してもいい。図5の第一文は、例えば、図6のように解析される。役割解析部11の役割情報抽出部113は、係り受け解析結果から、指定されたキーワードとその役割を抽出する。
図5のテキストの第一文、第三文、第五文からは、キーワード「A社」の役割が、図7に示すように抽出される。ここでは、格関係の場合は役割を表層格で表し、格関係ではない場合は「その他」とした。「は」「が」の代わりに「主格」や「主体」としてもよい。また、「その他」をさらに分類して、役割名を付けてもよい。
この実施例では、文書が指定されてから役割を解析するようにしたが、あらかじめ文書を解析して、すべてのキーワード候補(すべての名詞、あるいはすべての固有名など)とその役割を抽出し、文や文書の情報とともに登録しておくようにしてもよい。その場合は、ユーザが文書IDなどで指定した文書の役割情報を読み出す。また係り受け関係の解析まで行ったものを登録しておき、ユーザが文書を指定したときに、指定されたキーワードとその役割を抽出するようにしてもよい。これについては実施例2を用いて説明する。
役割の抽出が終わると、文書中の各文のスコアをスコア計算部14において計算する(ステップS14)。そしてスコア計算部14のスコアに基づいて要約生成部15により要約を生成する(ステップS15)。ここでは、文単位でスコアリングしてスコアの高いものを要約として抽出する手法を用いているが、これに限定されない。キーワードおよびその役割と突き合わせて各文の適合性を判断するものであればどのようなものでもよく、キーワードおよびその役割と一致する語句を含む文を直接に要約要素としてもよい。
文のスコアは、周知のtf*IDF(tfは、ある文書中のある語の出現頻度を表し、IDFは語がそのくらい特定性を有するかを表す)に基づく自立語のスコアを加算して計算するものとするが、これに限定されない。
まず、指定したキーワード「A社」を含み、その役割がユーザの指定した役割と合う文を要約の候補として抽出する。図5からは、第一文と第三文が抽出される。次に、図8のように、抽出された文を上述の方法でスコアリングし、スコアの高いものから、あらかじめ指定した文数だけを要約として抽出する。指定した文数が1の場合、図8の例では第一文が選択される。
スコアリングの際にも、ユーザが入力したキーワードや役割を優先して、
(1)「A社」のスコアに重みづけする(矢印a)
(2)「A社」に重みづけし、役割が一致する場合、さらに重みづけする(矢印b)
などとしてもよい。重みを5とした場合、第五文の「A社」は10.4*5となる。第一文、第三文の「A社」に関しては、キーワードおよび役割の双方が一致しているので、10.4*5*5となる。
また、キーワードと役割が一致する文をあらかじめ候補として抽出せず、上述のようなキーワードや役割が一致したときに重みを重くするようなスコアリング方法ですべての文をスコアリングし、スコアの高いものを抽出するようにしてもよい。また、キーワードを含む文を抽出し、役割が一致する場合に重みづけするようにしてもよい。
上述のように、役割解析部11で解析された役割とユーザが指定する役割が1対1に対応しない場合、例えばスコア計算部14またはキーワード/役割指定部13等に対応テーブルをもたせておき、「が」→主体、「を」→「対象」等と対応づけるようにすればよい。
ここでは、表層格を役割とするようにしたが、深い解析によって深層格などを抽出するようにしてもよい。例えば、表層格が同じ「で」でも、
(1)コンピュータで解析する→「手段」
(2)有楽町で会う→「場所」
のような役割を抽出するようにしてもよい。また、「XYZの開発」のように、表層的には名詞間の修飾関係であっても、「XYZ」の役割として「対象」を抽出するようにしてもよい。
また、選択された文をそのまま要約とするのではなく、各文から不要な修飾部分などを取り除き、キーワードを含む骨格の部分を抽出して要約とするようにしてもよい。
以上のようにして生成された要約は例えば表示部16に表示され(ステップS16)、要約をポイントすることにより破線で示すように全文のデータを取得してこれを表示するようにしてもよい。
つぎにこの発明の実施例2について説明する。この実施例の文書要約システムは、あらかじめ文書を登録しておき、さらに役割情報も解析して登録しておき、ユーザが所定の1または複数の文書を指定したときにこの役割情報や登録文書を利用して要約を生成するものである。
図9は実施例2の文書要約システムを示しており、この図において図1と対応する箇所には対応する符号を付した。
図9においては、文書登録部20により文書を登録し、文書記憶部21に保持する。登録した文書に関しては役割解析部11により役割解析が行なわれ、各文書の各文の所定の語句(例えば名詞あるいは固有名)について役割情報が登録される。
他の構成は実施例1と同様であるので説明を繰り返さない。
つぎにこの発明を検索システムに適用した実施例3について説明する。この検索システムは、ユーザが入力した検索クエリ(自然文)から、検索キーワードおよびその役割を抽出し、検索および検索結果の要約の視点に用いるものである。もちろん、検索キーワードおよびその役割をユーザが明示的に指定してもよい。
図10はこの実施例の検索システムを全体として示しており、図11はその文書登録時の動作例を示しており、また図12はその検索時の動作例を示している。これらの図において、検索システムは、文書登録部20、文書記憶部21、役割解析部11、役割情報記憶部12、スコア計算部14、要約生成部15、表示部16、検索クエリ入力部30、検索クエリ役割記憶部31、検索部32、検索結果記憶部33等を含んで構成されている。図10において図1または図9に対応する箇所には対応する符号を付した。
まず、あらかじめ文書登録部20により文書を登録しておく(ステップS20〜S22)。前述のように、解析のレベルは種々のものが考えられるが、ここでは係り受け解析まで行った結果と検索用のインデックスを作成して例えば役割情報記憶部12に保持しておくものとする。
検索時には、ユーザは検索クエリ入力部30から、検索クエリを自然文で入力する。例えば「XYZを発売する」と入力する(ステップS30)。
検索部32は、入力されたクエリに基づいて文書を検索する。その方法は問わないが、例えばクエリから自立語(XYZ、発売)を抽出し、これらを含む文書を検索する(S33)。
役割解析部11(検索視点抽出手段)は、入力されたクエリから、キーワードとその役割を抽出して検索クエリ役割記憶部31に保持する(ステップS31、S32)。例えば固有名をキーワード候補とした場合、上のクエリから、
(1)キーワード:「XYZ」
(2)役割:「を」
を抽出する。
要約生成部15は、検索された文書を、前述と同様にスコア計算部14のスコアに基づいて要約する(ステップS34、S35)。すなわち、検索結果記憶部33により検索結果の文書が指示され、役割情報記憶部12から該当する文書の各文書の例えば固有名およびその役割に関する情報が取り出され、これと検索クエリ役割記憶部31からのキーワードおよびその役割に関する情報とを用いて例えば各文のtd*IDFのスコアを計算する。そして上位の所定数の文を選択して要約を合成する。構成文の数を1とすると、図5の場合、例えば第一文が要約として選択される。要約は例えば表示部16に表示される(ステップS36)。
なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。この発明の種々の側面を以下に列挙するが、この発明はこれに限定されるわけではない。
(1)役割解析において、役割を解析する語は、自立語のような広範囲ものでもいいし、固有名など品詞を限定してもよい。
(2)役割解析において、役割は、格助詞などをそのままでもよい。格助詞などの表層表現と、特定の役割を対応づけるようにしてもよい(が−動作主体/で−場所、など)。意味解析などを行って、表層からはわからない役割を特定するようにしてもよい。
(3)要約視点を選択するためにユーザが指定する役割は、役割解析の役割との対応づけが可能なら、どのようなものでもよい。
(4)一般に要約は単独で用いられることは少なく、検索結果に要約を付与するという使われ方をすることが多い。その場合、検索と要約の視点は同じであるのがふつうなので、検索のために指定したキーワードとその役割を、要約の視点として利用してもよい。その場合、実施例3で説明したように、検索部を追加し、要約視点指定手段の代わりに、検索視点指定手段を設ける。
(5)上述の(4)の場合、検索視点指定手段の代わりに検索クエリ入力手段と検索視点抽出手段を設け、検索クエリからキーワードと役割を自動抽出するようにしてもよい。
(6)固有名抽出手段を設け、対象文書または検索クエリに含まれる固有名をキーワードとするようにしてもよい。
(7)キーワードと役割の数は、ひとつのキーワードに対してひとつの役割でもいいし、複数のキーワードに共通の役割でもよい。
(8)指定したキーワードと役割を含む文から、キーワードと役割の前後に所定数の単語や文字列を付加した部分だけを抽出し、それをスコアリングして要約を選択するようにしてもよい。
(9)指定したキーワードと役割を含む文を解析した結果から、キーワードと役割を含む関係を抽出し、この関係に係る必須格等を付与したフレーズを作成して、それをスコアリングして要約を選択するようにしてもよい。
(10)指定した役割をもつキーワードに重み付けすることによって文をスコアリングし、スコアの高い文を要約として選択するようにしてもよい。
この発明の実施例1の構成を説明するブロック図である。 上述実施例1の動作例を説明するフローチャートである。 上述実施例1の役割抽出部の構成例を説明するブロック図である。 上述実施例1の要約視点(そのうちの役割)を指定する手法の一例を説明する図である。 文書の例を説明する図である。 文書の構文解析結果を説明する図である。 抽出した役割情報を説明する図である。 文のスコアの計算例を説明する図である。 この発明の実施例2の構成を説明するブロック図である。 この発明の実施例3の構成を説明するブロック図ある。 上述実施例3の動作例(文書登録時)を説明するフローチャートである。 上述実施例3の動作例(検索時)を説明するフローチャートである。
符号の説明
10 文書入力部
11 役割解析部
12 役割情報記憶部
13 役割指定部
14 スコア計算部
15 要約生成部
16 表示部
20 文書登録部
21 文書記憶部
30 検索クエリ入力部
31 検索クエリ役割記憶部
32 検索部
33 検索結果記憶部
111 形態素解析部
112 構文解析部
113 役割情報抽出部

Claims (21)

  1. 処理対象文書を入力する文書入力手段と、
    キーワードと、文におけるキーワードの役割とを指定する要約視点指定手段と、
    上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別する役割判別手段と、
    上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせる突き合わせ手段と、
    上記突き合わせ手段の突き合わせ結果に基づいて要約を構成すべき文を選択して要約を作成する要約作成手段とを有することを特徴とする文書要約装置。
  2. 処理対象文書を入力する文書入力手段と、
    キーワードと、文におけるキーワードの役割とを指定する要約視点指定手段と、
    上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別する役割判別手段と、
    上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせて、上記各文のスコアを計算するスコア計算手段と、
    上記各文の上記スコアに基づいて要約を構成すべき文を選択して要約を作成する要約作成手段とを有することを特徴とする文書要約装置。
  3. 上記役割は、動作、状態、状態変化などの主体、対象、相手、手段、場所、時間などである請求項1または2記載の文書要約装置。
  4. 上記役割は、表層格により表される請求項1、2または3記載の文書要約装置。
  5. 上記キーワードは固有表現である請求項1、2、3または4記載の文書要約装置。
  6. 上記スコア計算手段は、各文に含まれる自立語のスコアを加算し、さらに上記自立語が上記指定されたキーワードで指定された役割を持つときに大きな重みを付ける請求項1〜5のいずれかに記載の文書要約装置。
  7. 上記スコア計算手段は、各文に含まれる自立語のスコアを加算し、さらに上記自立語が上記指定されたキーワードの場合に所定の重みを付け、さらに上記自立語が上記指定されたキーワードで指定された役割を持つときにより大きな重みを付ける請求項1〜5のいずれかに記載の文書要約装置。
  8. 上記自立語のスコアはtf*IDFのスコアである請求項7記載の文書要約装置。
  9. 検索キーワードおよび当該検索キーワードの役割を入力する検索視点入力手段と、
    検索対象の各文書に含まれる各文について当該各文の所定の語句の役割を判別する文書役割判別手段と、
    少なくとも上記検索キーワードに基づいて文書を検索する検索手段と、
    上記検索手段により検索された各文書に対して、当該各文書に含まれる各文の所定の語句およびその役割を、上記検索キーワードおよびその役割に突き合わせて上記各文書に含まれる各文のスコアを計算するスコア計算手段と、
    上記各文書に含まれる各文の上記スコアに基づいて上記各文書の要約を構成すべき文を選択して要約を作成する要約作成手段とを有することを特徴とする文書要約装置。
  10. 上記検索視点入力手段は、
    検索クエリを入力する検索クエリ入力手段と、
    上記検索クエリからキーワードおよびその役割を抽出するキーワード役割抽出手段とを有する請求項9記載の文書要約装置。
  11. 上記検索手段は、上記検索キーワードおよびその役割に基づいて文書を検索する請求項9または10記載の文書要約装置。
  12. 検索クエリを入力する検索クエリ入力手段と、
    検索クエリに含まれる語句の役割を判別する役割判別手段と、
    上記検索クエリに含まれる語句および上記役割判別手段により判別された役割に基づいて文書を検索する検索手段とを有することを特徴とする検索装置。
  13. 検索キーワードおよびその役割を入力する検索視点入力手段と、
    上記検索キーワードおよびその役割に基づいて文書を検索する検索手段とを有することを特徴とする検索装置。
  14. 文書入力手段が処理対象文書を入力するステップと、
    要約視点指定手段がキーワードと、文におけるキーワードの役割とを指定するステップと、
    役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
    突き合わせ手段が上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせるステップと、
    要約作成手段が上記突き合わせ手段の突き合わせ結果に基づいて要約を構成すべき文を選択して要約を作成するステップとを有することを特徴とする文書要約方法。
  15. 文書入力手段が処理対象文書を入力するステップと、
    要約視点指定手段が、キーワードと、文におけるキーワードの役割とを指定するステップと、
    役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
    スコア計算手段が、上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせて、上記各文のスコアを計算するステップと、
    要約作成手段が、上記各文の上記スコアに基づいて要約を構成すべき文を選択して要約を作成するステップとを有することを特徴とする文書要約方法。
  16. 検索視点入力手段が検索キーワードおよび当該検索キーワードの役割を入力するステップと、
    文書役割判別手段が検索対象の各文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
    検索手段が少なくとも上記検索キーワードに基づいて文書を検索するステップと、
    スコア計算手段が、上記検索手段により検索された各文書に対して、当該各文書に含まれる各文の所定の語句およびその役割を、上記検索キーワードおよびその役割に突き合わせて上記各文書に含まれる各文のスコアを計算するステップと、
    要約合成手段が、上記各文書に含まれる各文の上記スコアに基づいて上記各文書の要約を構成すべき文を選択して要約を合成するステップとを有することを特徴とする文書要約方法。
  17. 検索視点入力手段が検索キーワードおよびその役割を入力するステップと、
    検索手段が上記検索キーワードおよびその役割に基づいて文書を検索するステップとを有することを特徴とする検索方法。
  18. 文書入力手段が処理対象文書を入力するステップと、
    要約視点指定手段がキーワードと、文におけるキーワードの役割とを指定するステップと、
    役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
    突き合わせ手段が上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせるステップと、
    要約作成手段が上記突き合わせ手段の突き合わせ結果に基づいて要約を構成すべき文を選択して要約を作成するステップとをコンピュータに実行させるために用いられることを特徴とする文書要約用コンピュータプログラム。
  19. 文書入力手段が処理対象文書を入力するステップと、
    要約視点指定手段が、キーワードと、文におけるキーワードの役割とを指定するステップと、
    役割判別手段が上記処理対象文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
    スコア計算手段が、上記要約視点指定手段により指定されたキーワードおよび役割を上記各文に含まれる所定の語句およびその役割に突き合わせて、上記各文のスコアを計算するステップと、
    要約作成手段が、上記各文の上記スコアに基づいて要約を構成すべき文を選択して要約を作成するステップとをコンピュータに実行させるために用いられることを特徴とする文書要約用コンピュータプログラム。
  20. 検索視点入力手段が検索キーワードおよび当該検索キーワードの役割を入力するステップと、
    文書役割判別手段が検索対象の各文書に含まれる各文について当該各文の所定の語句の役割を判別するステップと、
    検索手段が少なくとも上記検索キーワードに基づいて文書を検索するステップと、
    スコア計算手段が、上記検索手段により検索された各文書に対して、当該各文書に含まれる各文の所定の語句およびその役割を、上記検索キーワードおよびその役割に突き合わせて上記各文書に含まれる各文のスコアを計算するステップと、
    要約合成手段が、上記各文書に含まれる各文の上記スコアに基づいて上記各文書の要約を構成すべき文を選択して要約を作成するステップとをコンピュータに実行させるために用いられることを特徴とする文書要約用コンピュータプログラム。
  21. 検索視点入力手段が検索キーワードおよびその役割を入力するステップと、
    検索手段が上記検索キーワードおよびその役割に基づいて文書を検索するステップとを有することをコンピュータに実行させるために用いられることを特徴とする検索用コンピュータプログラム。
JP2004039510A 2004-02-17 2004-02-17 文書要約装置および方法 Pending JP2005234635A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004039510A JP2005234635A (ja) 2004-02-17 2004-02-17 文書要約装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004039510A JP2005234635A (ja) 2004-02-17 2004-02-17 文書要約装置および方法

Publications (1)

Publication Number Publication Date
JP2005234635A true JP2005234635A (ja) 2005-09-02

Family

ID=35017560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004039510A Pending JP2005234635A (ja) 2004-02-17 2004-02-17 文書要約装置および方法

Country Status (1)

Country Link
JP (1) JP2005234635A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012160201A (ja) * 2005-09-30 2012-08-23 Google Inc レビュー処理方法およびシステム
JP2014241034A (ja) * 2013-06-11 2014-12-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文を検索する装置、方法およびプログラム
US9367605B2 (en) 2009-09-23 2016-06-14 Alibaba Group Holding Limited Abstract generating search method and system

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置
JPH11184865A (ja) * 1997-12-19 1999-07-09 Matsushita Electric Ind Co Ltd 文書要約装置
JP2001184352A (ja) * 1999-12-27 2001-07-06 Dainippon Screen Mfg Co Ltd 要約文自動作成装置および記録媒体
JP2002007472A (ja) * 2000-06-20 2002-01-11 Internet Owners Kk インターネットにおける検索結果画面の表示方法及び検索条件の入力方法
JP2002049632A (ja) * 2000-08-03 2002-02-15 Nec Corp 要約システムとその要約方法、及び要約プログラムを記録した記録媒体
JP2002259412A (ja) * 2001-03-02 2002-09-13 Mitsubishi Chemicals Corp 光学的情報記録媒体の記録再生装置および光学的情報記録媒体を用いた電子化文書要約方法並びに光学的情報記録媒体を用いた要約読み取り方法および光学的情報記録媒体
JP2003281183A (ja) * 2002-03-20 2003-10-03 Fuji Xerox Co Ltd 文書情報検索装置、文書情報検索方法及び文書情報検索プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991314A (ja) * 1995-07-14 1997-04-04 Fuji Xerox Co Ltd 情報探索装置
JPH11184865A (ja) * 1997-12-19 1999-07-09 Matsushita Electric Ind Co Ltd 文書要約装置
JP2001184352A (ja) * 1999-12-27 2001-07-06 Dainippon Screen Mfg Co Ltd 要約文自動作成装置および記録媒体
JP2002007472A (ja) * 2000-06-20 2002-01-11 Internet Owners Kk インターネットにおける検索結果画面の表示方法及び検索条件の入力方法
JP2002049632A (ja) * 2000-08-03 2002-02-15 Nec Corp 要約システムとその要約方法、及び要約プログラムを記録した記録媒体
JP2002259412A (ja) * 2001-03-02 2002-09-13 Mitsubishi Chemicals Corp 光学的情報記録媒体の記録再生装置および光学的情報記録媒体を用いた電子化文書要約方法並びに光学的情報記録媒体を用いた要約読み取り方法および光学的情報記録媒体
JP2003281183A (ja) * 2002-03-20 2003-10-03 Fuji Xerox Co Ltd 文書情報検索装置、文書情報検索方法及び文書情報検索プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
奥村 明俊: "5W1H情報抽出・分類によるテキスト要約", 自然言語処理, vol. 第6巻 第6号, JPN6009041333, 10 July 1999 (1999-07-10), JP, pages 27 - 44, ISSN: 0001395105 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012160201A (ja) * 2005-09-30 2012-08-23 Google Inc レビュー処理方法およびシステム
US9367605B2 (en) 2009-09-23 2016-06-14 Alibaba Group Holding Limited Abstract generating search method and system
JP2014241034A (ja) * 2013-06-11 2014-12-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文を検索する装置、方法およびプログラム
US9767186B2 (en) 2013-06-11 2017-09-19 International Business Machines Corporation Retrieving a specific sentence from a document

Similar Documents

Publication Publication Date Title
JP4654780B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US10552467B2 (en) System and method for language sensitive contextual searching
US11379518B2 (en) Detecting musical references in natural language search input
JP2004062893A (ja) 重み付き編集距離に基づく例文の自動検索用システムおよび方法
JP2014106665A (ja) 文書検索装置、文書検索方法
KR20100071829A (ko) 인덱스 분석장치와 인덱스 검색장치 및 그 방법
JP2006099428A (ja) 文書要約作成システム、方法、及びプログラム
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
JP5204203B2 (ja) 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム
JP2006178599A (ja) 文書検索装置および方法
JP2008117351A (ja) 検索システム
JPH0844771A (ja) 情報検索装置
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JP5285491B2 (ja) 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、
JP2005234635A (ja) 文書要約装置および方法
JP5025603B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
JP2003108584A (ja) 情報検索システム及びプログラム
JP2005025418A (ja) 質問応答装置、質疑応答方法及びプログラム
JP2018028732A (ja) 施設検索装置、施設検索方法、コンピュータプログラム及びコンピュータプログラムを記録した記録媒体
JP5148583B2 (ja) 機械翻訳装置、方法及びプログラム
JP2005234772A (ja) 文書管理装置および方法
JP2009059290A (ja) 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム
JP5378109B2 (ja) タスクモデル生成装置およびタスクモデル生成方法
JPH1166084A (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100511