JP2016161967A

JP2016161967A - パラメタ学習装置、テキスト要約装置、方法、及びプログラム

Info

Publication number: JP2016161967A
Application number: JP2015037056A
Authority: JP
Inventors: 仁西川; Hitoshi Nishikawa; 俊朗牧野; Toshiaki Makino; 義博松尾; Yoshihiro Matsuo
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2015-02-26
Filing date: 2015-02-26
Publication date: 2016-09-05

Abstract

【課題】テキストを適切に要約するためのパラメタを学習する装置、テキスト要約装置、方法及びプログラムを提供する。【解決手段】要約評価部３０が、パラメタを用いてテキストを要約し、ｎ個の要約候補を取得して、要約候補の各々を複数の評価尺度で評価する。パラメタ更新部３２が、複数の評価尺度から形成されるパレート境界上の解となる要約候補を正例とみなして、パラメタを更新し、反復判定部３４が、要約評価部３０の要約及び評価と、パラメタ更新部３２の更新とを繰り返す。【選択図】図１

Description

本発明は、パラメタ学習装置、テキスト要約装置、方法、及びプログラムに係り、特に、テキストを要約するためのパラメタ学習装置、テキスト要約装置、方法、及びプログラムに関する。

近年、電子化されたテキストが大量に流通するようになった。そのため、それらのテキストに記述されている情報を迅速に把握するため、機械にテキストを要約させる技術が求められている。

現在、テキストを機械に要約させる際には、要約の対象となるテキストの内容を代表していると思われる文（以下、重要文と称する）の集合（以下、重要文集合と称する）をテキストから１つ以上選び出し、それらを適切に並び替え連結することによって要約が作られることが多い（特許文献１参照）。

また、文あるいは文の集合に対してスコアを与える際には、それぞれの文あるいは文の集合を特徴ベクトルとして表現し、特徴ベクトルと予め何らかの方法で推定した重みベクトル（以下、パラメタと称する）との内積を計算することによってスコアを求めることができる。文あるいは文の集合を表現した特徴ベクトルとの内積を求めるパラメタは、要約の対象とするテキストあるいはテキスト集合と、それらに対する要約からなるペアの集合（以下、訓練事例と称する）を利用して予め学習しておく必要がある。学習の際には、パラメタは、何らかの誤差関数を最小化するように学習することができる（特許文献２参照）。

特許第５５２３９２９号公報特許第５６３８５０３号公報特開２０１４−２２５１５８号公報

Chin-Yew Lin. "ROUGE: A Package for Automatic Evaluation of Summaries." Text Summarization Branches Out: Proceedings of the ACL-04 Workshop. pp. 74-81, 2004.

一方で、特許文献２記載の方法は、単一の評価尺度に対してパラメタを最適化しているに過ぎない。自動要約の目的を考えると、一例として、人手によって作成された正解となる要約をどれくらい模倣できたか、という要約の内容に関する評価尺度（非特許文献１参照）と共に、要約の読みやすさを評価する尺度も考慮してパラメタが最適化されるべきである。要約の内容及び要約の読みやすさのいずれも考慮した目的関数を用意して要約を行う方法もある（特許文献３参照）。しかし、特許文献３記載の方法も、あくまで２つの目的関数を線形結合しているに過ぎず、それらの重みを何らかの評価尺度に従って最適化しなければいけないという問題から逃れられるものではない。

本発明は、上記問題点を解決するために成されたものであり、テキストを適切に要約するためのパラメタを学習することができるパラメタ学習装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、第１の発明に係るパラメタ学習装置は、テキストを要約するためのパラメタを用いて、入力テキストを要約し、スコアが上位ｎ個の要約候補を取得し、前記要約候補の各々について、複数の評価尺度で評価する要約評価部と、前記要約評価部により前記要約候補の各々について評価された複数の評価尺度に基づいて、前記要約候補のうち、複数の評価尺度から形成されるパレート境界上の解となる要約候補を正例とみなして、前記パラメタを更新するパラメタ更新部と、予め定められた反復終了条件を満たすまで、前記要約評価部による要約及び評価と、前記パラメタ更新部による更新とを繰り返す反復判定部と、を含んで構成されている。

また、第１の発明に係るパラメタ学習装置において、前記複数の評価尺度は、予め定められた参照要約に基づいて要約に含まれる単語を評価する尺度、及び要約の読みやすさを評価する尺度を含むようにしてもよい。

第２の発明に係るテキスト要約装置は、上記のパラメタ学習装置により更新された前記パラメタを用いて、入力されたテキストを要約するテキスト要約部を含んで構成されている。
第３の発明に係るパラメタ学習方法は、要約評価部と、パラメタ更新部と、反復判定部とを含むパラメタ学習装置におけるパラメタ学習方法であって、前記要約評価部が、テキストを要約するためのパラメタを用いて、入力テキストを要約し、スコアが上位ｎ個の要約候補を取得し、前記要約候補の各々について、複数の評価尺度で評価するステップと、前記パラメタ更新部が、前記要約評価部により前記要約候補の各々について評価された複数の評価尺度に基づいて、前記要約候補のうち、複数の評価尺度から形成されるパレート境界上の解となる要約候補を正例とみなして、前記パラメタを更新するステップと、前記反復判定部が、予め定められた反復終了条件を満たすまで、前記要約評価部による要約及び評価と、前記パラメタ更新部による更新とを繰り返すステップと、を含んで実行することを特徴とする。
第４の発明に係るプログラムは、コンピュータを、上記のパラメタ学習装置又はテキスト要約装置の各部として機能させるためのプログラムである。

本発明のパラメタ学習装置、方法、及びプログラムによれば、テキストを要約し、ｎ個の要約候補を取得し、要約候補の各々を複数の評価尺度で評価し、複数の評価尺度から形成されるパレート境界上の解となる要約候補を正例とみなして、パラメタを更新することを繰り返すことにより、テキストを適切に要約するためのパラメタを学習することができる、という効果が得られる。

また、本発明のテキスト要約装置、及びプログラムによれば、パレート境界の解となる要約候補を正例とみなして更新されたパラメタを用いて、テキストを適切に要約することができる、という効果が得られる。

本発明の実施の形態に係るパラメタ学習装置の構成を示すブロック図である。訓練事例データベース８の一例を示す図である。パラメタデータベース４０の一例を示す図である。本発明の実施の形態に係るテキスト要約装置の構成を示すブロック図である。入力テキストの一例を示す図である。テキスト解析の一例を示す図である。本発明の実施の形態に係るパラメタ学習装置におけるパラメタ学習処理ルーチンの内容を示すフローチャートである。本発明の実施の形態に係るテキスト要約装置におけるテキスト要約処理ルーチンの内容を示すフローチャートである。

以下、図面を参照して本発明の実施の形態を詳細に説明する。

＜本発明の実施の形態に係る概要＞

まず、本発明の実施の形態における概要を説明する。上述した問題点に対処するため、本実施の形態では、複数の評価尺度によって形成されるパレート境界を考慮し、パレート境界に存在する解に向けてパラメタを最適化することを提案する。本実施の形態に係る手法を用いることによって、複数の尺度を線形結合し何らかの尺度に従ってそれぞれを重みづけることなく、複数の尺度を考慮した最適化を行うことができる。これによって、開発セットなどを利用することによってそれぞれの尺度を重みづけるといった手間を省くだけでなく、より頑健なパラメタが得られることが期待される。

＜本発明の実施の形態に係るパラメタ学習装置の構成＞

次に、本発明の実施の形態に係るパラメタ学習装置の構成について説明する。図１に示すように、本発明の実施の形態に係るパラメタ学習装置１００は、ＣＰＵと、ＲＡＭと、後述するパラメタ学習処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。このパラメタ学習装置１００は、機能的には図１に示すように入力部１０と、演算部２０と、出力部５０とを備えている。

入力部１０は、訓練事例データベース８の入力を受け付ける。訓練事例データベース８は、入力テキストとその参照要約のペアからなる１つ以上の訓練事例を格納している。参照要約とは、例えば、人手など、何らかの方法で作成された、入力テキストとの対応関係をもつ要約である。図２に訓練事例データベースの一例を示す。

演算部２０は、要約評価部３０と、パラメタ更新部３２と、反復判定部３４と、パラメタデータベース４０とを含んで構成されている。

要約評価部３０は、訓練事例の各々に対して、テキストを要約するためのパラメタを用いて、当該訓練事例における入力テキストを要約し、スコアが上位ｎ個の要約候補を取得し、要約候補の各々について、複数の評価尺度で評価する。

要約評価部３０は、具体的には、まず、受け付けた訓練事例データベース８に格納されている訓練事例を１つ取得し、予め定めたテキストを要約するためのパラメタを用いて、例えば特許文献３に記載の要約方法によって訓練事例における入力テキストの要約を行い、スコアが上位ｎ個の要約候補を取得する。ここで、パラメタはパラメタデータベース４０に格納されており、後述する反復判定部３４により処理を繰り返す度に、更新されたパラメタを読み出して用いるものとする。なお、パラメタの初期値は、事前に別の訓練事例で学習したパラメタや、値を人手あるいはランダムで設定したものなどを用いればよい。

要約評価部３０は、次に、ｎ個の要約候補について、複数の評価尺度でそれぞれ評価し、評価尺度スコアを算出する。評価尺度には、一例として、参照要約に基づいて要約に含まれる単語を評価する尺度、又は要約の読みやすさを評価する尺度などを用いればよい。要約に含まれる単語を評価する尺度は、上記非特許文献１に記載されている、参照要約とシステム要約（要約部３２により得られた要約候補）との間で共通する単語のＮグラム数に着目した評価法であるＲＯＵＧＥなどが挙げられる。ＲＯＵＧＥにおいては、共起の度合いの大きい単語を重要な単語とみなすことができる。要約の読みやすさを評価する尺度としては、特許文献４（特開２０１４−０６７０９４号公報）に記載の文書の可読性を評価する尺度などが挙げられる。なお、ＲＯＵＧＥの値を計算する際には、取得した訓練事例の参照要約を用いればよい。

パラメタ更新部３２は、訓練事例の各々に対して、要約評価部３０により要約候補の各々について評価された複数の評価尺度に基づいて、当該訓練事例における要約候補のうち、複数の評価尺度から形成されるパレート境界の解となる要約候補を正例とみなして、パラメタを更新する。

具体的には、パラメタ更新部３２は、以下に説明するように、複数の評価尺度スコアが付与されたｎ個の要約候補から、パレート境界を求める。パレート境界を求める際には一例として非特許文献２（Kevin Duh, Katsuhito Sudoh, Xianchao Wu, Hajime Tsukada, and Masaaki Nagata. "Learning to Translate with Multiple Objectives." In Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics, pages 1−10, 2012.）記載の方法を用いることができる。例えば、要約評価部３０により算出されたｎ個の要約候補に対する複数の評価尺度スコアに基づいて、各要約候補がパレート境界上の解であるか否かを識別し、パレート境界上の解となる要約候補を求めるようにすればよい。ここで、パレート境界上の解の定義を説明する。要約候補Ｈ１のスコアベクトルをＭ（Ｈ１）で表わし、要約候補Ｈ２のスコアベクトルをＭ（Ｈ２）で表す。スコアベクトルの各評価尺度の値が高いほど、よい要約であると考えられる。もしＭ（Ｈ１）の全ての評価尺度がＭ（Ｈ２）の全ての評価尺度より大きければ、要約候補Ｈ１はすべての評価尺度で、要約候補Ｈ２より良い要約であるといえる。逆に、スコアベクトルＭ（Ｈ１）のすべての評価尺度と比べてスコアベクトルＭ（Ｈ２）の全ての評価尺度が大きい場合、要約候補Ｈ１より要約候補Ｈ２の方が良い要約といえる。しかし、ある評価尺度はスコアベクトルＭ（Ｈ１）の方が高く、他の評価尺度はＭ（Ｈ２）の方が高い時、要約候補Ｈ１とＨ２はどちらが良い要約かは一概にいえない。このとき、ｎ個の要約候補において、他の要約候補の中にその要約候補よりも全ての評価尺度が高いものが存在しない場合に、その要約候補はパレート境界上の解である。なお、パレート境界の代わりに、パレート境界を構成する一部の解からなる凸包を求め、凸包をパレート境界の代わりに用いてもよい。

パラメタ更新部３２は、次に、パレート境界上の解となる少なくとも１つの要約候補を正例とみなしてパラメタデータベース４０に格納されているパラメタを更新する。パラメタの更新には、一例として、非特許文献３（Mark Hopkins and Jonathan May. "Tuning as Ranking." In Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing, pp. 1352−1362, 2011.）記載のＭＥＲＴを用いることができる。具体的には、以下に説明するように、正例と負例を学習事例として２値分類器を学習し、学習された２値分類器に基づいてパラメタを更新する。ここでは、パレート境界上の解の集合をＸ＝｛ｘ_１，ｘ_２，．．．，ｘ_ｉ，．．．，ｘ_ｍ｝とし、パレート境界上にない解の集合をＹ＝｛ｙ_１，ｙ_２，．．．，ｙ_ｊ，．．．，ｙ_ｎ｝とする。また、解の特徴ベクトルを得る関数をｆとする。例えば、解ｘ_１の特徴ベクトルはｆ（ｘ_１）である。次に、パレート境界上の解の集合とそうでない解の集合の組み合わせから学習事例を生成する。まず、正例として、パレート境界上の解の特徴ベクトルからパレート境界上にない解の特徴ベクトルを引いたものを、（ｆ（ｘ_ｉ）−ｆ（ｙ_ｊ））として作成する。このとき、ｍ個の全てのパレート境界上の解のそれぞれに対して、ｎ個のパレート境界上にない解のそれぞれとの組み合わせを考え、（ｆ（ｘ_ｉ）−ｆ（ｙ_１）），（ｆ（ｘ_ｉ）−ｆ（ｙ_２）），．．．，（ｆ（ｘ_ｉ）−ｆ（ｙ_ｎ））というように学習事例を生成してもよいし、一例として非特許文献５記載の方法などによってサンプリングを行ってもよい。同様に負例として、パレート境界上にない解の特徴ベクトルからパレート境界上の解の特徴ベクトルを引いたものを、（ｆ（ｙ_ｊ）−ｆ（ｘ_ｉ））として作成する。このとき、ｎ個の全てのパレート境界上にない解のそれぞれに対して、ｍ個のパレート境界上の解のそれぞれとの組み合わせを考え、（ｆ（ｙ_ｊ）−ｆ（ｘ_１）），（ｆ（ｙ_ｊ）−ｆ（ｘ_２）），．．．，（ｆ（ｙ_ｊ）−ｆ（ｘ_ｍ））というように学習事例を生成してもよいし、一例として上記非特許文献３記載の方法などによってサンプリングを行ってもよい。以上のようにして生成した正例と負例を学習事例として２値分類器を学習し、学習された２値分類器に基づいて、パラメタを更新する。

また、パラメタ更新部３２におけるパラメタ更新に用いる特徴量には、一例として非特許文献４（Hitoshi Nishikawa, Kazuho Arita, Katsumi Tanaka, Tsutomu Hirao, Toshiro Makino and Yoshihiro Matsuo. "Learning to Generate Coherent Summary with Discriminative Hidden Semi-Markov Model." In Proceedings of the 25th International Conference on Computational Linguistics: Technical Papers, pp.1648-1659, 2014.）記載の、単語、固有表現、及び一文の長さなどを利用することができる。ここで、特徴量を抽出するためには、例えば、要約部３０で得た要約候補の各々について、形態素解析及び係り受け解析の処理を行えばよい。形態素解析は、非特許文献５（Takeshi Fuchi and Shinichiro Takagi. "Japanese Morphological Analyzer using Word Co-occurrence - JTAG." In Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics (Volume 1), pp. 409-413, 1998.）記載の手法により行えばよい。また、係り受け解析は、非特許文献６（Kenji Imamura, Genichiro Kikui and Norihito Yasuda. "Japanese Dependency Parsing Using Sequential Labeling for Semi-spoken Language."In Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics Companion Volume Proceedings of the Demo and Poster Sessions, pp. 225-228, 2007.）記載の手法により行えばよい。

反復判定部３４は、要約評価部３０及びパラメタ更新部３２の処理を、訓練事例データベース８に格納されている全ての訓練事例について繰り返す。また、反復判定部３４は、全ての訓練事例について要約評価部３０及びパラメタ更新部３２の処理を繰り返す一連の処理を、既定の回数、あるいは、パラメタ更新の際に得られる損失関数の値（例えば、評価尺度がｃ（０≦１）である場合、損失関数は１−ｃである。）が一定以上となる訓練事例がなくなるなど、予め定められた反復終了条件を満たすまで繰り返す。

図３に、最終的に得られたパラメタを格納したパラメタデータベース４０の一例を示す図３は、「当時」「日本」「京都」などの、各単語を特徴量として用いた場合であり、パラメタ更新の結果得られた、各単語の特徴量である重みがパラメタとして格納されている。

＜本発明の実施の形態に係るテキスト要約装置の構成＞

次に、本発明の実施の形態に係るテキスト要約装置の構成について説明する。図４に示すように、本発明の実施の形態に係るテキスト要約装置２００は、ＣＰＵと、ＲＡＭと、後述するテキスト要約処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。このテキスト要約装置２００は、機能的には図４に示すようにテキスト入力部２１０と、演算部２２０と、テキスト出力部２５０とを備えている。

テキスト入力部２１０は、要約の対象となるテキストの入力を受け付ける。図５に入力されたテキストの一例を示す。

演算部２２０は、テキスト解析部２３０と、テキスト要約部２３２と、パラメタデータベース２４０とを含んで構成されている。

パラメタデータベース２４０には、パラメタ学習装置１００のパラメタ更新により最終的に得られたパラメタデータベース４０と同じものが記憶されている。

テキスト解析部２３０は、テキスト入力部２１０で受け付けたテキストに対して形態素解析および係り受け解析の処理を加える。それぞれ、形態素解析に上記非特許文献５記載の手法を、係り受け解析に上記非特許文献６記載の手法を利用することができる。図６に、テキスト解析部で解析されたテキストの一例を示す。図６では、テキスト入力部２１０で受け付けたテキストに対して解析が行われている。図６のｍから始まる行は形態素解析の結果として得られた、わかち書き及び形態素の品詞情報、ｃから始まる行は、係り受け解析の結果として得られた文節及び分節の係り受けの情報である。この例では、係り受け解析器は「康平6年（1063年）」という文節が次の「8月に」という文節にかかり、また「8月に」という文節は「8月」という形態素と「に」という形態素に分かれることが示されている。なお、形態素解析および係り受け解析の結果が予め付与されたテキストを入力として受け付けてもよい。この場合には、テキスト解析部２３０は不要である。

テキスト要約部２３２は、テキスト解析部２３０で解析されたテキストと、パラメタデータベース２４０に記憶されたパラメタとに基づいて、テキスト入力部２１０で受け付けたテキストを要約する。一例として、上記特許文献３記載の方法を用いて、テキストから一文を選択し、選択した一文を要約として出力すればよい。

テキスト出力部２５０は、テキスト要約部２３２で生成された要約文を出力する。

＜本発明の実施の形態に係るパラメタ学習装置の作用＞

次に、本発明の実施の形態に係るパラメタ学習装置１００の作用について説明する。入力部１０において訓練データベース８を受け付けると、パラメタ学習装置１００は、図７に示すパラメタ学習処理ルーチンを実行する。

まず、ステップＳ１００では、入力部１０において受け付けた訓練データベース８から訓練事例を１つ取得する。

次に、ステップＳ１０２では、ステップＳ１００で取得した訓練事例について、パラメタデータベース４０に格納されたパラメタを用いて、訓練事例における入力テキストの要約を行う。

ステップＳ１０４では、ステップＳ１０２による要約結果からスコアが上位ｎ個の要約候補を取得する。

ステップＳ１０６では、ステップＳ１０４で取得された要約候補の各々について、訓練事例における参照要約を用いて、複数の評価尺度で評価する。

ステップＳ１０８では、ステップＳ１０６において、要約候補の各々について評価された複数の評価尺度に基づいて、要約候補のうち、複数の評価尺度から形成されるパレート境界上の解となる要約候補を求める。

ステップＳ１１０では、ステップＳ１０８で求められたパレート境界上の解となる要約候補を正例とみなして、パラメタデータベース４０のパラメタを更新する。

ステップＳ１１２では、全ての訓練事例について処理を終了したかを判定し、終了していればステップＳ１１４へ移行し、終了していなければステップＳ１００へ移行して次の訓練事例を取得して処理を繰り返す。

ステップＳ１１４では、予め定められた反復終了条件を満たすかを判定し、満たしていれば処理を終了し、満たしていなければ、ステップＳ１１６へ移行する。

ステップＳ１１６では、反復回数ｋをｋ＝ｋ＋１としてステップＳ１００へ移行して、再び、全ての訓練事例に対する反復処理を繰り返す。

以上説明したように、本実施の形態に係るパラメタ学習装置によれば、パラメタを用いて訓練事例の入力文書を要約し、ｎ個の要約候補を取得し、要約候補の各々を複数の評価尺度で評価し、複数の評価尺度から形成されるパレート境界上の解となる要約候補を正例とみなして、パラメタデータベース４０のパラメタを更新することを繰り返すことにより、テキストを適切に要約するためのパラメタを学習することができる。

＜本発明の実施の形態に係るテキスト要約装置の作用＞

次に、本発明の実施の形態に係るテキスト要約装置２００の作用について説明する。テキスト入力部２１０においてテキストを受け付けると、テキスト要約装置２００は、図８に示すテキスト要約処理ルーチンを実行する。

まず、ステップＳ２００では、テキスト入力部２１０において受け付けたテキストを取得する。

そして、ステップＳ２０１では、ステップＳ２００で取得したテキストに対して形態素解析及び係り受け解析を行う。
次に、ステップＳ２０２では、パラメタデータベース２４０に格納されているパラメタと、ステップＳ２０１の解析結果とに基づいて、ステップＳ２００で取得したテキストを要約する。

そして、ステップＳ２０４では、ステップＳ２０２で得たテキストの要約をテキスト出力部２５０に出力して処理を終了する。

以上説明したように、本実施の形態に係るパラメタ学習装置によれば、パレート境界上の解となる要約候補を正例とみなして更新されたパラメタを用いて、テキストを適切に要約することができる。

なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

また、要約候補を評価する際に訓練事例の参照要約を用いる場合を例に説明したが、これに限定されるものではなく、参照要約を用いない複数の評価尺度で要約候補を評価する場合には、訓練事例に参照要約が含まれていなくてもよい。

８訓練事例データベース
１０入力部
２０、２２０演算部
３０要約評価部
３０要約部
３２パラメタ更新部
３２要約部
３４反復判定部
４０パラメタデータベース
５０出力部
１００パラメタ学習装置
２００テキスト要約装置
２１０テキスト入力部
２３０テキスト解析部
２３２テキスト要約部
２４０パラメタデータベース
２５０テキスト出力部

Claims

テキストを要約するためのパラメタを用いて、入力テキストを要約し、スコアが上位ｎ個の要約候補を取得し、前記要約候補の各々について、複数の評価尺度で評価する要約評価部と、
前記要約評価部により前記要約候補の各々について評価された複数の評価尺度に基づいて、前記要約候補のうち、複数の評価尺度から形成されるパレート境界上の解となる要約候補を正例とみなして、前記パラメタを更新するパラメタ更新部と、
予め定められた反復終了条件を満たすまで、前記要約評価部による要約及び評価と、前記パラメタ更新部による更新とを繰り返す反復判定部と、
を含むパラメタ学習装置。
前記複数の評価尺度は、予め定められた参照要約に基づいて要約に含まれる単語を評価する尺度、及び要約の読みやすさを評価する尺度を含む請求項１に記載のパラメタ学習装置。
請求項１又は２に記載のパラメタ学習装置により更新された前記パラメタを用いて、入力されたテキストを要約するテキスト要約部
を含むテキスト要約装置。
要約評価部と、パラメタ更新部と、反復判定部とを含むパラメタ学習装置におけるパラメタ学習方法であって、
前記要約評価部が、テキストを要約するためのパラメタを用いて、入力テキストを要約し、スコアが上位ｎ個の要約候補を取得し、前記要約候補の各々について、複数の評価尺度で評価するステップと、
前記パラメタ更新部が、前記要約評価部により前記要約候補の各々について評価された複数の評価尺度に基づいて、前記要約候補のうち、複数の評価尺度から形成されるパレート境界上の解となる要約候補を正例とみなして、前記パラメタを更新するステップと、
前記反復判定部が、予め定められた反復終了条件を満たすまで、前記要約評価部による要約及び評価と、前記パラメタ更新部による更新とを繰り返すステップと、
を含むパラメタ学習方法。
コンピュータを、請求項１若しくは請求項２に記載のパラメタ学習装置又は請求項３に記載のテキスト要約装置の各部として機能させるためのプログラム。