JP2003248676A

JP2003248676A - 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法

Info

Publication number: JP2003248676A
Application number: JP2002045925A
Authority: JP
Inventors: Maki Murata; 真樹村田
Original assignee: Communications Research Laboratory
Current assignee: Communications Research Laboratory
Priority date: 2002-02-22
Filing date: 2002-02-22
Publication date: 2003-09-05
Also published as: CN100419733C; US20030163790A1; CN1439979A; US7120613B2

Abstract

(57)【要約】【課題】機械学習による要約処理で用いる解データを
ユーザが自由に編集できる編集処理と前記解データを用
いてユーザに特化した要約処理とを実現する。【解決手段】評価カスタマイズ手段110 は表示した要
約にユーザ入力の評価を付与し、テキストと要約と評価
（解）とを事例として解データ記憶部120 に記憶する。
解−素性対抽出部121 は事例から解と素性の集合との組
を抽出し、機械学習部122 はどのような素性のときにど
のような解となりやすいかを学習して結果を学習結果デ
ータ記憶部123 に記憶する。要約候補生成部124 はテキ
スト2 から要約候補を生成し、素性抽出部125 はテキス
トと要約候補から素性の集合を抽出し、要約候補−推定
解対生成部126 は学習結果データを参照して素性の集合
から推定して要約候補−推定解対を生成し、要約選択部
128 はその対の要約候補を要約とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、機械学習法により
文章を自動要約する処理で用いる解データを編集する解
データ編集処理および、編集可能な解データを用いた機
械学習法を用いた自動要約処理に関する。

【０００２】

【従来の技術】近年、情報技術の発展に伴ってコンピュ
ータを用いた文章の自動要約処理が盛んになってきてい
る。しかし、個人的な嗜好や要約結果の用途などによ
り、所望する要約結果の傾向に相違があると考えられ
る。

【０００３】例えば、以下の参考文献１では、複数の者
がそれぞれ重要文抽出による要約を行なった結果に対す
る相互評価の尺度として再現率と適合率とを求めて表４
に示している。参考文献１の表４から明らかなように、
２０文を抽出する処理の場合に、人−人（評価者相互）
の評価（再現率および適合率）は、各評価者Ａ、Ｂ、Ｃ
の一致度は５０〜７０％であってあまり高い値とはいえ
ず、要約結果に対する評価に個人差が存在することが推
定できる。［参考文献１：伊藤山彦他、講演文を対象にした重要
文抽出、言語処理学会第７回年次大会発表論文集、200
1、pp.305-308］また、以下の参考文献２では、サポート・ベクトル・マ
シン（Support VectorMachine）による重要文抽出処理
において、処理セットＡ、Ｂ、Ｃについて交差検定の精
度が最もよいことを表４により示している。参考文献２
の表４に示された交差検定は、同一評価者による処理と
同一視でき、セットＡ、Ｂ、Ｃを作成した者が同一かど
うかは不明であるが、少なくとも同一時期もしくは同一
人物により学習データを作成したほうが精度が良いとい
うことがわかる。［参考文献２：平尾勉他、Support Vector Machineに
よる重要文抽出、情報学会基礎論文63-16 、2001、pp.1
21-127］

【０００４】

【発明が解決しようとする課題】このように、要約結果
に対する評価に個人差や用途差が存在すると考えること
ができることから、機械学習法を用いた自動要約処理に
おいても、同じ評価にもとづいた要約を行なうのではな
く、ユーザに特化した要約ができる必要がある。そのた
めに、教師となる解データをユーザが自由に編集できる
必要がある。

【０００５】本発明の目的は、機械学習法で用いる解デ
ータとなる要約結果または要約結果に対する評価をユー
ザが任意に編集できる解データ編集処理装置と、その処
理方法とを実現することである。

【０００６】また、本発明の目的は、前記解データ編集
処理により編集が可能な解データを用いた機械学習法を
用いて、ユーザごとに特化した要約を行える自動要約処
理装置と、その処理方法とを実現することである。

【０００７】

【課題を解決するための手段】上記の目的を達成するた
め、本発明は、予め備えた解データを用いた機械学習処
理に対してユーザがどのような要約結果を高く評価した
かの情報をフィードバックするために、ユーザが要約結
果やその評価を編集できるようにする。

【０００８】また、本発明は、ユーザが編集した解デー
タのフィードバックにより、機械学習処理においてユー
ザごとの特性を学習し、ユーザに特化した要約を行なう
ことができるようにする。

【０００９】本発明は、機械学習法によりテキストを自
動要約する処理で用いる解データを編集する解データ編
集処理装置であって、テキストの要約結果を表示装置に
表示する要約表示処理手段と、前記要約結果に対する評
価の入力を受け付けて前記要約結果の評価とする評価付
与処理手段と、前記テキストおよび前記要約結果を問題
とし前記評価を解とする解データを出力する解データ出
力処理手段とを備える。

【００１０】また、本発明の解データ編集処理装置は、
テキストを表示装置に表示するテキスト表示処理手段
と、前記テキストからユーザ指定部分の入力を受け付
け、前記指定部分を前記要約結果とする要約編集処理手
段と、前記テキストおよび前記要約結果を問題とし所定
の解を付与した前記解データを出力する解データ出力処
理手段とを備える。

【００１１】また、本発明の解データ編集処理装置は、
テキストの要約結果を表示装置に表示する要約表示処理
手段と、前記要約結果に対する評価の性質ごとに、評価
の入力を受け付けて、前記入力評価を前記性質評価とす
る評価付与処理手段と、評価の性質ごとに、前記テキス
トおよび前記要約結果を問題とし前記性質評価を解とす
る解データを出力する解データ出力処理手段とを備え
る。

【００１２】また、本発明は、解データ編集処理方法で
あって、テキストの要約結果を表示装置に表示する要約
表示処理過程と、前記要約結果に対する評価の入力を受
け付けて前記要約結果の評価とする評価付与処理過程
と、前記テキストおよび前記要約結果を問題とし前記評
価を解とする解データを出力する解データ出力処理過程
とを備える。

【００１３】また、本発明の解データ編集処理方法は、
テキストを表示装置に表示するテキスト表示処理過程
と、前記テキストからユーザ指定部分の入力を受け付
け、前記指定部分を前記要約結果とする要約編集処理過
程と、前記テキストおよび前記要約結果を問題とし所定
の解を付与した前記解データを出力する解データ出力処
理過程とを備える。

【００１４】また、本発明の解データ編集処理方法は、
テキストの要約結果を表示装置に表示する要約表示処理
過程と、前記要約結果に対する評価の性質ごとに、評価
の入力を受け付けて、前記入力評価を前記性質評価とす
る評価付与処理過程と、評価の性質ごとに、前記テキス
トおよび前記要約結果を問題とし前記性質評価を解とす
る解データを出力する解データ出力処理過程とを備え
る。

【００１５】また、本発明は、テキストおよび前記テキ
ストの要約結果を問題とし前記要約結果の評価を解とす
る解データを用いた機械学習法によりテキストを自動要
約する自動要約処理装置であって、前記解データに対す
るユーザ入力を受け付け、前記入力をもとに変更した解
データを記憶する解データ記憶手段と、前記解データか
ら前記問題の素性の集合と前記解との組を抽出し、当該
組から、どのような素性のときにどのような解となりや
すいかを学習し、学習結果を学習結果データ記憶手段に
記憶する機械学習処理手段と、入力テキストから要約候
補を生成する要約候補生成処理手段と、前記入力テキス
トおよび前記要約候補から素性の集合を抽出し、当該素
性の集合からどのような解となりやすいかを前記学習結
果データをもとに推定して、要約候補と推定解との対を
生成する要約候補−推定解対生成処理手段と、前記要約
候補−推定解対から前記推定解の確信度が最高の対を選
択し、当該対の要約候補を要約とする要約選択処理手段
とを備える。

【００１６】また、本発明の自動要約処理装置は、前記
解データに対するユーザ入力を受け付け、前記入力をも
とに変更した解データを記憶する解データ記憶手段と、
前記解データから、解もしくは解候補と前記問題の素性
の集合との組を抽出し、抽出した前記組を教師信号とし
て、どのような解もしくは解候補と素性の集合のとき
に、正例である確率または負例である確率となるかを学
習し、学習結果データ記憶手段に記憶する機械学習処理
手段と、入力テキストから要約候補を生成する要約候補
生成処理手段と、前記入力テキストおよび前記要約候補
から、素性の集合と解の候補との組を抽出し、当該素性
の集合と解の候補の組の場合に、正例もしくは負例であ
る確率をを前記学習結果データをもとに推定して、要約
候補と推定解との対を生成する要約候補−推定解対生成
処理手段と、前記要約候補−推定解対から前記推定解の
正例の確率が確信度が最高の対を選択し、当該対の要約
候補を要約とする要約選択処理手段とを備える。

【００１７】また、本発明は、テキストを問題とし前記
テキストの要約結果を解とする解データを用いた機械学
習法によりテキストを自動要約する自動要約処理装置で
あって、前記解データに対するユーザ入力を受け付け、
前記入力をもとに変更した解データを記憶する解データ
記憶手段と、前記解データから前記問題の素性の集合と
前記解との組を抽出し、当該組から、どのような素性の
ときにどのような解となりやすいかを学習し、学習結果
を学習結果データ記憶手段に記憶する機械学習処理手段
と、入力テキストから素性の集合を抽出し、当該素性の
集合からどのような解となりやすいかを前記学習結果デ
ータをもとに推定する解推定処理手段とを備える。

【００１８】また、本発明は、テキストおよび前記テキ
ストの要約結果を問題とし前記要約結果の評価を解とす
る解データを用いた機械学習法によりテキストを自動要
約する自動要約処理方法であって、前記解データに対す
るユーザ入力を受け付け、前記入力をもとに変更した解
データを記憶する解データ記憶手段にアクセスする解デ
ータアクセス処理過程と、前記解データから前記問題の
素性の集合と前記解との組を抽出し、当該組から、どの
ような素性のときにどのような解となりやすいかを学習
し、学習結果を学習結果データ記憶手段に記憶する機械
学習処理過程と、入力テキストから要約候補を生成する
要約候補生成処理過程と、前記入力テキストおよび前記
要約候補から素性の集合を抽出し、当該素性の集合から
どのような解となりやすいかを前記学習結果データをも
とに推定して、要約候補と推定解との対を生成する要約
候補−推定解対生成処理過程と、前記要約候補−推定解
対から前記推定解の確信度が最高の対を選択し、当該対
の要約候補を要約とする要約選択処理過程とを備える。

【００１９】また、本発明の自動要約処理方法は、前記
解データに対するユーザ入力を受け付け、前記入力をも
とに変更した解データを記憶する解データ記憶手段にア
クセスする解データアクセス処理過程と、前記解データ
から、解もしくは解候補と前記問題の素性の集合との組
を抽出し、抽出した前記組を教師信号として、どのよう
な解もしくは解候補と素性の集合のときに、正例である
確率または負例である確率となるかを学習し、学習結果
データ記憶手段に記憶する機械学習処理過程と、入力テ
キストから要約候補を生成する要約候補生成処理過程
と、前記入力テキストおよび前記要約候補から、素性の
集合と解の候補との組を抽出し、当該素性の集合と解の
候補の組の場合に、正例もしくは負例である確率をを前
記学習結果データをもとに推定して、要約候補と推定解
との対を生成する要約候補−推定解対生成処理過程と、
前記要約候補−推定解対から前記推定解の正例の確率が
確信度が最高の対を選択し、当該対の要約候補を要約と
する要約選択処理過程とを備える。

【００２０】また、本発明は、テキストを問題とし前記
テキストの要約結果を解とする解データを用いた機械学
習法によりテキストを自動要約する自動要約処理方法で
あって、前記解データに対するユーザ入力を受け付け、
前記入力をもとに変更した解データを記憶する解データ
記憶手段にアクセスする解データアクセス処理過程と、
前記解データから前記問題の素性の集合と前記解との組
を抽出し、当該組から、どのような素性のときにどのよ
うな解となりやすいかを学習し、学習結果を学習結果デ
ータ記憶手段に記憶する機械学習処理過程と、入力テキ
ストから素性の集合を抽出し、当該素性の集合からどの
ような解となりやすいかを前記学習結果データをもとに
推定する解推定処理過程とを備える。

【００２１】本発明にかかる処理装置の各手段または機
能または要素は、コンピュータが実行可能な処理プログ
ラムによっても実現できる。この処理プログラムは、コ
ンピュータが読み取り可能な、可搬媒体メモリ、半導体
メモリ、ハードディスクなどの適当な記録媒体に格納す
ることができ、これらの記録媒体に記録して提供され、
または、通信インタフェースを介して種々の通信網を利
用した送受信により提供されるものである。

【００２２】

【発明の実施の形態】〔第１の実施の形態〕図１に、第
１の実施の形態における本発明の処理装置の構成例を示
す。

【００２３】自動要約処理装置１０は、評価カスタマイ
ズ手段１１０と、解データ記憶部１２０と、解−素性対
抽出部１２１と、機械学習部１２２と、学習結果データ
記憶部１２３と、要約候補生成部１２４と、素性抽出部
１２５と、要約候補−推定解対生成部１２６と、要約選
択部１２８とを備える。

【００２４】評価カスタマイズ手段１１０は、特許請求
の範囲に示す解データ編集処理装置を実現する処理手段
である。また、解データ記憶部１２０と、解−素性対抽
出部１２１と、機械学習部１２２と、学習結果データ記
憶部１２３とは、特許請求の範囲に示す自動要約処理装
置の機械学習処理手段を実現する処理手段である。

【００２５】評価カスタマイズ手段１１０は、要約結果
やその評価をユーザごとにカスタマイズする手段であっ
て、要約表示部１１１と、評価付与部１１２とを備え
る。

【００２６】要約表示部１１１は、予め用意されたテキ
スト・要約４の要約結果を表示装置（図１に図示しな
い）に表示する手段である。

【００２７】テキスト・要約４は、テキストとその要約
結果からなる。テキストは、一または複数の記事などか
らなる文書データである。要約結果は、テキストを要約
した文書データである。要約結果としては、人手で生成
したもの、自動要約処理装置１０が入力したテキスト２
に対して出力した要約３もしくは要約候補生成部１２４
が生成し解データ記憶部１２０に記憶した要約候補であ
ってもよい。

【００２８】評価付与部１１２は、要約表示部１１１が
表示した要約結果に対してユーザが入力した評価を付与
し、または、要約結果に予め与えられている評価をユー
ザが入力した評価に変更する手段である。

【００２９】解データ記憶部１２０は、機械学習部１２
２が機械学習法を実行する際に教師とする解データを記
憶する手段である。解データ記憶部１２０には、解デー
タとして、テキストおよびその要約結果とからなる問題
と要約結果に対する評価である解との組である事例が記
憶される。

【００３０】解−素性対抽出部１２１は、解データ記憶
部１２０に記憶されている事例ごとに解と素性の集合と
の組を抽出する手段である。

【００３１】素性とは、解析に用いる情報の細かい１単
位を意味し、ここでは、１）文のなめらかさを示す情
報、２）内容をよく表しているかどうかを示す情報、お
よび、３）自動要約処理で用いられる特徴的な情報など
である。

【００３２】機械学習部１２２は、解−素性対抽出部１
２１により抽出された解と素性の集合との組から、どの
ような素性の集合のときにどのような解になりやすいか
を機械学習法により学習し、学習結果を学習結果データ
記憶部１２３に保存する手段である。機械学習部１２２
は、解データを用いた機械学習法であればどのような手
法で処理を行ってもよい。手法としては、例えば、決定
木法、サポートベクトル法、パラメータチューニング
法、シンプルベイズ法、最大エントロピー法、決定リス
ト法などがある。

【００３３】学習結果データ記憶部１２３は、機械学習
部１２２の学習結果データを記憶する手段である。

【００３４】要約候補生成部１２４は、入力されたテキ
スト２から、所定の方法にもとづいて要約候補を生成す
る手段である。要約候補生成部１２４は、重要文選択モ
デル、重要箇所選択モデル、変形規則を利用したモデ
ル、ランダムジェネレーションを利用したモデルなどの
種々のなモデルを用いて要約候補を生成する。

【００３５】素性抽出部１２５は、テキスト２および要
約候補生成部１２４で生成された要約候補について素性
の集合を抽出して要約候補−推定解対生成部１２６へ渡
す手段である。

【００３６】要約候補−推定解対生成部１２６は、学習
結果データ記憶部１２３の学習結果データを参照して、
素性抽出部１２５から渡された素性の集合の場合に、ど
のような解になりやすいかを推定して、要約候補と推定
解との対（要約候補−推定解対）１２７を生成する手段
である。要約候補−推定解対生成部１２６は、さらに、
各要約候補−推定解対１２７に、その推定解である確信
度（確率）を求めて付与しておく。

【００３７】要約選択部１２８は、要約候補−推定解対
１２７を受け取り、確信度の値が最も高い要約候補−推
定解対１２７を選択し、その要約候補を要約３とする手
段である。

【００３８】第１の実施の形態における評価カスタマイ
ズ処理を説明するため、３人のユーザＡ、Ｂ、Ｃが要約
結果をカスタマイズする場合を考える。

【００３９】ユーザＡは要約結果に精度に関する記載が
含まれていることを重視して評価すると仮定する。ユー
ザＢは要約結果に手法に関する記載が含まれていること
を重視し、ユーザＣは、要約結果に手法と精度の両方に
関する記載が含まれていることを重視して評価すると仮
定する。また、要約結果の評価を３段階に分けて、評価
１＝よい、評価２＝どちらでもない、評価３＝悪い、の
いずれかの分類先（評価）を与えるとする。

【００４０】図２に、第１の実施の形態における評価カ
スタマイズ処理の流れを示す。

【００４１】まず、テキスト・要約４が用意されている
とする。図３にテキスト・要約４のテキストの例を示
し、図４に要約結果の例を示す。図４（Ａ）〜（Ｃ）の
それぞれに、３つの要約結果ｒ１、ｒ２、ｒ３を示す。

【００４２】要約表示部１１１は、テキスト・要約４か
ら取り出した要約結果を表示画面に表示する（ステップ
Ｓ１）。そして、評価付与部１１２は、ユーザが入力し
た評価を受け付け、その入力された評価を表示された要
約結果の解（評価）とする（ステップＳ２）。

【００４３】ここで、ユーザＡが自動要約処理装置１０
を使用する場合を想定する。ユーザＡは、図４（Ａ）の
要約結果ｒ１に対して、精度に関係することが要約結果
として抽出されているため、評価１をつける。すると、
評価付与部１１２は、ユーザの入力（評価１）を受け付
けて、事例ｃ１の解として評価１を設定する。

【００４４】次に、要約表示部１１１が図４（Ｂ）に示
す事例ｃ２の要約結果ｒ２を表示した場合には、要約結
果ｒ２は精度に関係することが抽出されていないため、
ユーザＡは、要約結果ｒ２に対して評価３をつけ、評価
付与部１１２は、事例ｃ２の解として評価３を設定す
る。

【００４５】さらに、要約表示部１１１が図４（Ｃ）に
示す事例ｃ３の要約結果ｒ３を表示した場合には、要約
結果ｒ３は精度に関係するところが抽出されているが若
干冗長であるため、ユーザＡは評価２をつけ、評価付与
部１１２は事例ｃ３の解として評価２を設定する。

【００４６】同様に、ユーザＢの場合を想定する。ユー
ザＢは、図４（Ａ）に示す要約結果ｒ１に対して手法に
関係するところが抽出されていないために評価３をつ
け、図４（Ｂ）に示す要約結果ｒ２に対して手法に関係
するところが抽出されていることから評価１をつけ、図
４（Ｃ）に示す要約結果ｒ３に対して手法に関係すると
ころが抽出されているが若干冗長であるため評価２をつ
ける。

【００４７】また、同様に、ユーザＣの場合を想定す
る。ユーザＣは、図４（Ａ）に示す要約結果ｒ１に対し
て精度に関係するところが抽出されているが手法に関係
するところが抽出されれていないため評価２をつけ、図
４（Ｂ）に示す要約結果ｒ２に対して手法に関係すると
ころが抽出されているが精度に関係するところが抽出さ
れれていないため評価２をつけ、図４（Ｃ）に示す要約
結果ｒ３について手法および精度のいずれにも関係する
ところが抽出されているが若干冗長であるため評価１を
つける。

【００４８】評価付与部１１２は、ユーザＢおよびユー
ザＣごとに要約結果ｒ１〜ｒ３に対する入力評価を、そ
れぞれの事例ｃ１〜ｃ３の解（評価）として設定する。

【００４９】そして、評価カスタマイズ手段１１０は、
テキスト・要約４で与えられたテキストとその要約結果
と解とを事例として解データ記憶部１２０に記憶する
（ステップＳ３）。

【００５０】図５に、機械学習処理および自動要約処理
の流れを示す。

【００５１】解−素性対抽出部１２１は、解データ記憶
部１２０から、事例ごとに解と素性の集合との組を抽出
する（ステップＳ１１）。

【００５２】解−素性対抽出部１２１は、例えば、１）
文のなめらかさを示す情報として、ｋ−ｇｒａm 形態素
列のコーパスでの存在、かかりうけ文節間の意味的整合
度などを、また、２）内容をよく表しているかどうかを
示す情報として、要約前のテキストにあったキーフレー
ズの包含率などを、また、３）自動要約で用いられる情
報として、その文の位置やリード文かどうか、ＴＦ／Ｉ
ＤＦ（ＴＦは文書中でのその語の出現回数もしくは頻度
を示す値、ＩＤＦはあらかじめ持っている多数の文書群
のうち、その語が出現する文書数の逆数をいう。）、文
の長さ、固有表現・接続詞・機能語などの手がかり表現
の存在などを、素性として抽出する。

【００５３】次に、機械学習部１２２は、解と素性の集
合との組から、どのような素性の集合のときにどのよう
な解になりやすいかを機械学習法により学習し、学習結
果を学習結果データ記憶部１２３に記憶する（ステップ
Ｓ１２）。

【００５４】ここでユーザＡの処理の場合に、解データ
記憶部１２０に記憶される解データの「事例：問題→
解」は、事例ｃ１：テキスト−要約結果ｒ１→評価１、事例ｃ２：テキスト−要約結果ｒ２→評価３、事例ｃ３：テキスト−要約結果ｒ３→評価２となり、機械学習部１２２は、これらの解データをもと
に、どのような場合に評価１〜評価３になるかを機械学
習で学習する。例えば、事例Ｃ１→評価１や事例ｃ３→
評価２から、機械学習部１２２は、精度の表現、例えば
「数字＋［％］」の表現が出現すると評価が高くなるな
どを学習する。ここで、「数字＋［％］」の表現は、学
習に用いる素性の例である。

【００５５】また、ユーザＢの処理の場合に、「事例：
問題→解」は、事例ｃ１：テキスト−要約結果ｒ１→評価３、事例ｃ２：テキスト−要約結果ｒ２→評価１、事例ｃ３：テキスト−要約結果ｒ３→評価２となり、機械学習部１２２は、「手がかり表現」や「用
例」などの手法に相当する専門用語が出現すると評価が
高くなるように学習する。

【００５６】また、ユーザＣの処理の場合に、「事例：
問題→解」は、「事例ｃ１：テキスト−要約結果ｒ１→評価２、事例ｃ２：テキスト−要約結果ｒ２→評価２、事例ｃ３：テキスト−要約結果ｒ３→評価１」となり、機械学習部１２２は、精度の表現または手法に
相当する表現の両方が出現すると評価が高くなるように
学習する。

【００５７】また、要約結果として出力される文章は短
いほどよいので、それぞれの処理の場合において、文章
の長さが短いほど評価が高くなるように学習する。

【００５８】機械学習の手法としては、例えば、シンプ
ルベイズ法、決定リスト法、最大エントロピー法、サポ
ートベクトルマシン法などを用いる。

【００５９】シンプルベイズ法は、ベイズの定理にもと
づいて各分類になる確率を推定し、その確率値が最も大
きい分類を求める分類とする方法である。

【００６０】決定リスト法は、素性と分類先の組とを規
則とし、それらをあらかじめ定めた優先順序でリストに
蓄えおき、検出する対象となる入力が与えられたとき
に、リストで優先順位の高いところから入力のデータと
規則の素性とを比較し、素性が一致した規則の分類先を
その入力の分類先とする方法である。

【００６１】最大エントロピー法は、あらかじめ設定し
ておいた素性ｆ_j（１≦ｊ≦ｋ）の集合をＦとすると
き、所定の条件式を満足しながらエントロピーを意味す
る式を最大にするときの確率分布を求め、その確率分布
にしたがって求まる各分類の確率のうち、もっとも大き
い確率値を持つ分類を求める分類とする方法である。

【００６２】サポートベクトルマシン法は、空間を超平
面で分割することにより、２つの分類からなるデータを
分類する手法である。

【００６３】決定リスト法および最大エントロピー法に
ついては、以下の参考文献３に、サポートベクトルマシ
ン法については、以下の参考文献４および参考文献５に
説明されている。［参考文献３：村田真樹、内山将夫、内元清貴、馬青、
井佐原均、種々の機械学習法を用いた多義解消実験、電
子情報通信学会言語理解とコミュニケーション研究会，
NCL2001-2, (2001) ] ［参考文献４：Nello Cristianini and John Shawe-Tay
lor, An Introduction to Support Vector Machines an
d Other Kernel-based Learning Methods,(Cambridge U
niversity Press,2000) ］［参考文献５：Taku Kudoh, Tinysvm:Support Vector m
achines,(http://cl.aist-nara.ac.jp/taku-ku//softwa
re/TinySVM/index.html,2000) ］その後、要約を求めたいテキスト２が入力されると（ス
テップＳ１３）、要約候補生成部１２４は、例えば以下
に示すような処理モデルを用いて、テキスト２から要約
候補を作成する（ステップＳ１４）。

【００６４】１）重要文選択モデル重要文選択モデルとは、文を単位に要約し、重要と思わ
れる文のみを選択して残すことにより要約を実現するモ
デルである。このモデルの場合には、あらゆる文選択の
状態をすべて解の候補とするとよい。また、すべてを解
の候補とすると計算速度に支障が生じる場合には、予め
備えておいた選択規則を用いて、この選択規則を満足す
る文の選択状態のみを解の候補とする。すなわち、所定
の選択規則により候補数を減少させて処理の負荷を軽減
する。なお、選択規則は、人手による規則であってもよ
い。

【００６５】２）重要箇所選択モデル重要箇所選択モデルとは、文よりも小さいものを要約の
単位として、不要なものを削除することにより要約を実
現するモデルである。単位を文より小さいものとするこ
と以外については、上記１）重要文選択モデルと同様で
ある。文よりも小さいものとして、例えば文節を用い
る。すなわち、文節を単位として不要な文節を消してい
くことにより要約を実現する。この重要箇所選択モデル
の場合は、あらゆる文節の選択の状態をすべて解の候補
とする。また、すべてを解の候補とすると計算速度に支
障が生じる場合には、上記１）重要文選択モデルと同様
に、予め選択規則を用意しておき、この選択規則を満足
する文の選択状態のみを解の候補とする。

【００６６】３）変形規則を利用したモデル変形規則を利用したモデルとは、予め用意した変形規則
を利用して要約結果を生成するモデルである。変形規則
は、自動処理により獲得するか、または人手で作成して
おいたものを利用する。例えば、「Ｘして、Ｙした。」
を「Ｘした。」もしくは「Ｙした。」に書き換えるよう
な変形規則を作っておき、この変形規則に従って入力
「Ａして、Ｂした。」が与えられたときに「Ａした。」
や「Ｂした。」という要約候補を生成する。

【００６７】４）ランダムジェネレーションを利用した
モデルランダムジェネレーションを利用したモデルは、例え
ば、入力「・・・Ｘ・・・」があったときに「・・・Ｙ
・・・」を要約候補とするようなモデルである。このと
き、置き換えられるＸはランダムに選ばれてもよいし、
予め用意しておいた置換規則によって指定してもよい。
置換規則は、人手によって生成されたものや、自動獲得
したものなどを用いる。また、置き換えた先の表現Ｙ
は、ある辞書の単語もしくは文字列の集合からランダム
に選ばれてもよいし、予め用意しておいた変換規則によ
って指定してもよい。変換規則は、置換規則と同様、人
手によって生成されたものや、自動獲得したものなどを
用いる。このとき、ＸやＹをランダムに選ばずに、変換
規則にもとづいて選ぶとすると、変形規則を利用したモ
デルと同じようなものになる。

【００６８】素性抽出部１２５は、解−素性対抽出部１
２１とほぼ同様の処理によって、入力したテキスト２お
よび要約候補から素性の集合を抽出し、要約候補−推定
解対生成部１２６へ渡す（ステップＳ１５）。

【００６９】そして、要約候補−推定解対生成部１２６
は、受け取った素性の集合の場合にどのような解になり
やすいかを、学習結果データをもとに推定し、すなわ
ち、複数の要約候補のそれぞれの解（評価）とその確信
度を学習結果データにもとづき算出し、要約候補と推定
解との対（要約候補−推定解対）１２７を生成する（ス
テップＳ１６）。

【００７０】そして、要約選択部１２８は、生成された
要約候補−推定解対１２７から、推定解の確信度の値が
最もよい要約候補−推定解対１２７を選択し、その要約
候補を要約３とする（ステップＳ１７）。

【００７１】図６に、第１の実施の形態における本発明
の処理装置の別の構成例を示す。

【００７２】本形態では、解（分類先）として多数の候
補が考えられるが、分類先の種類数が多くなり過ぎて、
一般の機械学習法で処理ができない場合が生じうる。こ
のような場合に、図６に示す自動要約処理装置２０で
は、機械学習部１３２は、実際の機械学習処理において
正例と負例の二種類の解（分類先）のみを考える機械学
習手法を用いることにより処理が可能となる。

【００７３】また、図６に示す自動要約処理装置２０で
は、機械学習部１３２の学習の素性に評価という情報を
用いることもできる。

【００７４】自動要約処理装置２０は、評価カスタマイ
ズ手段１１０と、解データ記憶部１３０と、素性−解対
・素性−解候補対抽出部１３１と、機械学習部１３２
と、学習結果データ記憶部１３３と、要約候補生成部１
３４と、素性−解候補抽出部１３５と、要約候補−推定
解対生成部１３６と、要約選択部１３８とを備える。

【００７５】解データ記憶部１３０と、素性−解対・素
性−解候補対抽出部１３１と、機械学習部１３２と、学
習結果データ記憶部１３３とは、特許請求の範囲に示す
自動要約処理装置の機械学習処理手段を実現する処理手
段である。また、要約候補生成部１３４と、素性−解候
補抽出部１３５と、要約候補−推定解対生成部１３６と
は、特許請求の範囲に示す要約候補生成手段を実現する
処理手段である。

【００７６】評価カスタマイズ手段１１０および要約候
補生成部１３４は、図１に示す自動要約処理装置１０の
評価カスタマイズ手段１１０および要約候補生成部１２
４と同様の処理を行う。

【００７７】素性−解対・素性−解候補対抽出部１３１
は、解データ記憶部１１０に記憶されている事例ごと
に、解もしくは解候補と素性の集合との組を抽出する手
段である。ここでは、解の候補は解以外の解の候補を意
味し、ユーザが設定した評価を解とする。また、解と素
性の集合の組を正例とし、解の候補と素性の集合との組
を負例とする。

【００７８】機械学習部１３２は、解もしくは解の候補
と素性の集合との組から、どのような解もしくは解の候
補と素性の集合のときに正例である確率や負例である確
率を学習し、その学習結果を学習結果データ記憶部１３
３に記憶する手段である。

【００７９】素性−解候補抽出部１３５は、素性−解対
・素性−解候補対抽出部１３１と同様の処理により、入
力されたテキストおよび要約候補について、解の候補と
素性の集合との組を抽出する手段である。

【００８０】要約候補−推定解対生成部１３６は、渡さ
れた解の候補と素性の集合との組の場合に正例である確
率や負例である確率を求め、正例である確率が最も大き
い解を推定解として、その場合の要約候補と推定解との
対（要約候補−推定解対）１３７を生成する手段であ
る。

【００８１】要約選択部１３８は、要約候補−推定解対
１３７の要約候補を要約３とする手段である。

【００８２】図７に、自動要約処理装置２０の機械学習
処理および自動要約処理の流れを示す。

【００８３】素性−解対・素性−解候補対抽出部１３１
は、解データ記憶部１３０から、各事例ごとに解もしく
は解の候補と素性の集合との組を抽出する（ステップＳ
２１）。そして、機械学習部１３２は、解もしくは解の
候補と素性の集合との組から、どのような解もしくは解
の候補と素性の集合のときに、正例である確率や負例で
ある確率を機械学習法により学習し、学習結果を学習結
果データ記憶部１３３に記憶する（ステップＳ２２）。

【００８４】その後、要約を求めたいテキスト２が入力
されると（ステップＳ２３）、要約候補生成部１３４
は、所定の方法でテキスト２から要約候補を生成する
（ステップＳ２４）。そして、素性−解候補抽出部１３
５は、入力したテキスト２および要約候補から素性の集
合と解の候補との組を抽出し、要約候補−推定解対生成
部１３６へ渡す（ステップＳ２５）。

【００８５】要約候補−推定解対生成部１３６は、受け
取った解の候補と素性の集合との組の場合に正例や負例
である確率を学習結果データをもとに推定し、正例であ
る確率が最も大きい解の候補を推定解として、要約候補
−推定解対１３７を生成し（ステップＳ２６）、要約選
択部１３８は、要約候補−推定解対１３７の要約候補を
要約３とする（ステップＳ２７）。

【００８６】第１の実施の形態では、ユーザは必要なと
きに自動要約処理装置１を使用しながら、その使用の際
に出力された要約結果に対して評価１〜３をつければよ
い。したがって、ユーザは、操作負担を感じることなく
要約結果の評価をカスタマイズすることが可能となる。

【００８７】〔第２の実施の形態〕図８に、第２の実施
の形態における本発明の処理装置の構成例を示す。図８
に示す自動要約処理装置３０は、図１に示す自動要約処
理装置１０の評価カスタマイズ手段１１０の代わりに評
価カスタマイズ手段１４０を備え、また自動要約処理装
置１０を構成する評価カスタマイズ手段１１０以外の処
理手段を備える。

【００８８】評価カスタマイズ手段１４０は、テキスト
表示部１４１と、要約編集部１４２とを備える。

【００８９】テキスト表示部１４１は、予め用意したテ
キスト５を表示装置（図８に図示しない）に表示する手
段である。

【００９０】要約編集部１４２は、テキスト表示部１４
１が表示したテキスト５からユーザが要約として指定し
た部分を抽出して、または、ユーザが指定した部分内の
表現を変更して要約を編集する手段である。

【００９１】図９に、第２の実施の形態における評価カ
スタマイズ処理の流れを示す。

【００９２】テキスト表示部１４１は、予め用意したテ
キスト５を取り込み、表示装置に表示する（ステップＳ
３１）。表示したテキスト５上でユーザに要約結果とし
て良いと思われる部分を指定させ、ユーザが指定した範
囲を受け付けて抽出する（ステップＳ３２）。また、指
定した範囲の部分が編集されたら、その編集内容を受け
付け、編集後の指定範囲部分を要約結果とする（ステッ
プＳ３３）。

【００９３】ユーザは、表示されたテキスト上をマウス
などのポインティング・デバイスによるドラッグや、カ
ーソルキー移動による開始位置および終了位置の指定な
どにより要約とする範囲を指定する。テキスト表示部１
４１は、指定された範囲を、反転もしくはマーキングな
どの表示により、指定されなかった範囲と区別して表示
する。

【００９４】図１０に、表示されるテキストの例および
ユーザＡが指定した範囲の例を示す。ユーザＡは、破線
で囲む部分「小説を対象にして実験を行なったところ、
テストサンプルで再現率８４％、適合率８２％の精度で
解析できた。」を要約としてよい部分であると指定す
る。要約編集部１４２は、図１０のテキストの破線の矩
形で示された部分を要約結果とする。

【００９５】また、ユーザＢは、図１１に示すように、
テキストの破線で囲む部分「自然言語では、動詞を省略
するということがある。この省略された動詞を復元する
ことは、対話システムや高品質の機械翻訳システムの実
現には不可欠なことである。そこで本研究では、この省
略された動詞を表層の表現（手がかり語) と用例から補
完することを行なう。」を要約として良いと指定する。
また、ユーザＣの場合には、図１２に示すように、２つ
の破線の矩形で囲まれた部分「自然言語では、動詞を省
略するということがある。この省略された動詞を復元す
ることは、対話システムや高品質の機械翻訳システムの
実現には不可欠なことである。そこで本研究では、この
省略された動詞を表層の表現（手がかり語) と用例から
補完することを行なう。」と部分「小説を対象にして実
験を行なったところ、テストサンプルで再現率84％、適
合率82％の精度で解析できた。」とを要約としてよいと
指定する。要約編集部１４２は、図１１および図１２に
示すテキストの破線の矩形で示された部分をそれぞれ要
約結果とする。

【００９６】なお、ユーザが指定した範囲をテキストと
別に表示し、指定範囲内の表現について、ユーザが任意
の箇所を削除したり、または表現を変更したりして、そ
の内容を編集できるようにしてもよい。図１３に示すよ
うに、テキスト上で指定した範囲をテキストと別に表示
して、指定範囲内の語句などを削除し、追加し、訂正す
ることができるようにする。要約編集部１４２は、要約
決定ボタンがクリック等の操作で選択されると、その選
択を受け付けて、指定範囲の内容を要約結果とする。な
お、キャンセルボタンが選択された場合には、指定範囲
の内容をクリアする。

【００９７】そして、要約編集部１４２は、テキスト５
と要約結果とを、所定の解（良い評価）とともに解デー
タ記憶部１３０に記憶する（ステップＳ３４）。さら
に、評価カスタマイズ手段１４０は、第１の実施の形態
において、自動要約処理装置２０が生成した要約、自動
要約処理装置２０の要約候補生成部１２４が生成した要
約候補、人手でランダムに生成した要約などのユーザが
指定した要約以外の要約に対して所定の解（悪い評価）
を付与した解データも解データ記憶部１３０へ記憶す
る。

【００９８】以降、機械学習処理および自動要約処理の
流れは、図５に示す処理の流れと同様である。ここで、
機械学習部１２２は、それぞれのユーザごとに、図３に
示すテキストと、図１０〜図１２に示す要約結果のいず
れか（すなわち、ユーザ指定範囲）と、解とする事例に
ついて学習する。

【００９９】図１４に、第２の実施の形態における本発
明の処理装置の別の構成例を示す。本形態においても、
解（分類先）の種類数が多くなり過ぎて、一般の機械学
習法で処理ができない場合が生じうる。

【０１００】このため、図１４に示す自動要約処理装置
４０では、機械学習部１３２は、実際の機械学習処理に
おいて正例と負例の二種類の解（分類先）のみを考える
機械学習手法を用いることにより処理を可能としてい
る。

【０１０１】自動要約処理装置４０は、図６に示す自動
要約処理装置２０を構成する処理手段と同様の処理手段
を備え、かつ、評価カスタマイズ手段１１０の代わりに
評価カスタマイズ手段１４０を備えるものである。

【０１０２】本形態では、ユーザに要約としてよい範囲
をテキスト上で指定させるため、第１の実施の形態に比
べてユーザの負担は大きい。しかし、ユーザが求める要
約結果により近いものを解データ（教師）とすることが
できるため、ユーザが所望する要約結果をより早く出力
できるように学習することができる。

【０１０３】〔第３の実施の形態〕図１５に、第３の実
施の形態における本発明の処理装置の構成例を示す。図
１５に示す自動要約処理装置５０は、図１に示す自動要
約処理装置１０の評価カスタマイズ手段１１０の代わり
に評価カスタマイズ手段１５０を備え、また他の処理手
段として、自動要約処理装置１０を構成する処理手段と
同様の処理手段を備える。

【０１０４】評価カスタマイズ手段１５０は、要約表示
部１５１と、性質情報設定部１５２とを備える。

【０１０５】要約表示部１５１は、予め用意しておいた
テキスト・要約４の要約結果を表示装置（図１５に図示
しない）に表示する手段である。

【０１０６】性質情報設定部１５２は、要約結果の評価
にかかわる複数の性質情報を生成し、性質情報ごとの評
価を設定する手段である。

【０１０７】性質情報とは、要約結果の評価を構成する
種々の性質に関する情報であり、例えば、短い文を重視
しているかどうかという情報（短文重視）、要約結果に
数量についての表現が含まれていることを重視している
かどうかという情報（数量表現重視）、要約結果に手法
についての表現が含まれていることを重視しているかど
うかという情報（手法重視）、要約結果の文体を重視し
ているかどうかという情報（文体重視）、要約結果の読
みやすさを重視しているかどうかという情報（読みやす
さ重視）などである。

【０１０８】評価カスタマイズ手段１５０は、機械学習
部１２２において要約結果の評価にかかわる複数の性質
をそれぞれ学習することができるように、ユーザが随時
必要となった評価にかかわる複数の性質情報を任意に設
定できるようにして、要約結果に対するユーザの評価を
複数の性質情報を用いて定義する。

【０１０９】本形態では、性質情報設定部１５２で設定
された性質情報の数に対応して解データ記憶部１２０を
用意し、各性質情報ごとに機械学習を行なう。したがっ
て、解−素性対抽出部１２１、機械学習部１２２、学習
結果データ記憶部１２３、要約候補−推定解対生成部１
２６の各処理手段は、性質情報の数に対応して備えられ
る。

【０１１０】図１６に、評価カスタマイズ処理の流れを
示す。

【０１１１】要約表示部１５１は、テキスト・要約４か
ら取り出した要約結果を表示する（ステップＳ４１）。
性質情報設定部１５２は、表示した要約結果に対して複
数の性質情報の項目を表示し、ユーザに各項目の値や、
新規項目の設定などを促し、ユーザの入力を受け付ける
（ステップＳ４２）。

【０１１２】図１７および図１８に、性質情報設定画面
の例を示す。性質情報設定画面では、複数の位置情報の
それぞれに対応してスライドバーが設けられている。ユ
ーザはそれぞれの性質情報のスライドバー上でスライド
ボタンを右側や左側など任意の位置を定めて性質情報ご
との評価を指定できる。例えば、ユーザは、表示された
要約結果に対して「短い文重視、数量表現重視、手法重
視、文体重視、読みやすさ重視」などの性質情報の項目
ごとに、それぞれどのくらいの評価になるかを、スライ
ドバー上でスライドボタンを移動させて設定する。図１
７および図１８では、スライドバーの左端から右端に向
かって評価が高くなるように設定されているとする。ま
た、ユーザはスライドバーの横に任意の性質情報を入力
することにより、スライドバーが何を意味するかについ
て自由に定義できる。

【０１１３】要約表示部１５１が図４（Ａ）に示す要約
結果ｒ１を表示した場合に、図１７に示すように、ユー
ザＡは、要約結果ｒ１が短い文なので「短い文重視」の
スライドボタンを右側へ、また数量に関する表現がある
ので「数量表現重視」のスライドボタンを右側へ、また
手法にふれていないので「手法重視」のスライドボタン
を左側へ、文体と読みやすさとはそれほど悪くないの
で、「文体重視」および「読みやすさ重視」のスライド
ボタンを右側へ位置させる。

【０１１４】また、要約表示部１５１が図４（Ｂ）に示
す要約結果ｒ２を表示した場合に、ユーザＡは、図１８
に示すように、要約結果ｒ２がそれほど短くないので、
「短い文重視」のスライドボタンを左側へ、その他の性
質情報は、まあまあよいので、その他の性質情報のスラ
イドボタンを右側へ移動させる。

【０１１５】そして、性質情報設定部１５２は、入力さ
れた性質情報ごとの値をそれぞれ解とし、その解とテキ
ストと要約結果とを事例として性質情報ごとの解データ
記憶部１２０に記憶する（ステップＳ４３）。

【０１１６】以降、機械学習処理および自動要約処理の
流れは、図５に示す処理の流れとほぼ同様である。ここ
で、性質情報ごとに備えられた機械学習部１２２は、対
応する性質情報の解データ記憶部１２０に記憶された事
例を解データ（教師データ）として使用する。機械学習
部１２２は、それぞれの性質情報ごとに学習を行なう。
例えば、性質情報「短い文重視」については、各事例の
解は、事例ｃ１（要約結果ｒ１）では「解＝最右側」、
事例ｃ２（要約結果ｒ２）では、「解＝左側」という解
ができる。機械学習部１２２は、これらの解データを教
師データとして利用して、どういうときに短い文重視で
評価されるのかを学習していく。また、その他の性質情
報についても同様の学習を行なう。

【０１１７】本形態では、機械学習処理後、要約候補生
成部１２４は、入力されたテキスト２から所定の方法で
要約候補を生成し、素性抽出部１２５は、入力テキスト
２および要約候補から素性の集合を抽出する。

【０１１８】そして、各性質情報に対応する要約候補−
推定解対生成部１２６は、受け取った素性の集合の場合
にどのような解になりやすいかを学習結果データをもと
に推定し、要約候補と推定解との対（要約候補−推定解
対）１２７を生成する。例えば、要約候補−推定解対生
成部１２６は、複数の要約候補のそれぞれの推定解とそ
の確信度を学習結果データにもとづき算出して、それぞ
れの性質情報ごとの要約候補−推定解対１２７を生成す
る。

【０１１９】要約選択部１２８は、要約結果に対する評
価の性質情報をどの程度重視するかを設定したユーザ評
価設定情報７を受け付けて、要約候補−推定解対１２７
で各性質情報の評価の値を、ユーザ評価設定情報７と比
較して、最も似た要約候補−推定解対、もしくはユーザ
評価設定情報７に最も適した要約候補−推定解対を選択
し、その要約候補−推定解対１２７の要約候補を要約３
とする。

【０１２０】要約選択部１２８は、図１７に示すような
性質情報設定画面を表示して、ユーザが現在必要な要約
結果の性質であるユーザ評価設定情報７を、性質情報の
各項目のスライドバー上のスライドボタンの位置を変更
して設定するように促してもよい。

【０１２１】例えば、「短い文重視」、「数量表現重
視」、「手法重視」のスライドボタンを最右側に移動さ
せ、「文体重視」、「読みやすさ重視」のスライドボタ
ンを最左側へ移動させる場合には、ユーザは、なるべく
短く、また、数量表現および手法は欠かさず、しかし、
文体や読みやすさは軽視するというような性質の評価に
適合する要約３を要求していることを意味するユーザ評
価設定情報７となる。

【０１２２】また、要約選択部１２８は、要約候補−推
定解対１２７の簡単な選択方法として、例えば以下の式
を利用して、すべての解の組合せの値Total ＿Score を
求めてもよい。

【０１２３】 Total ＿Score ＝ａ（短い文重視）×ｓｃｏｒｅ（短い文重視）＋ａ（数量表現重視）×ｓｃｏｒｅ（数量表現重視) ＋ａ（手法重視) ×ｓｃｏｒｅ（手法重視) ＋ａ（文体重視) ×ｓｃｏｒｅ（文体重視) ＋ａ（読みやすさ重視) ×ｓｃｏｒｅ（読みやすさ重視) ただし、ａ（Ｘ）はユーザが指定した性質情報Ｘのスラ
イドバーのスライドボタン位置から求まる値である。ス
ライドボタンがスライドバーの右側に位置するほど大き
な値を持つとしている。ｓｃｏｒｅ（Ｘ）は学習結果デ
ータにもとづいて算出された性質情報Ｘの評価の値であ
る。要約選択部１２８は、この組合せ値Total＿Score
が最も大きい要約候補−推定解対１２７を選択し、その
要約候補を要約３として出力する。

【０１２４】本形態では、機械学習部１２２で用いる要
約結果を表示させてユーザに評価させるという、第１の
実施の形態における処理に近い処理方法を採用した。し
かし、本形態では、第２の実施の形態における機械学習
の手法のように、ユーザにテキストから要約結果として
よいと思われる範囲を指定させた上で、さらに、ユーザ
に評価にかかわる複数の性質をスライドバーなどを用い
て評価させて、教師信号である解データを収集するよう
にしてもよい。かかる処理の場合には、同一ユーザであ
っても処理を行なう度に所望する要約のタイプが異なる
ような状況にも対処することが可能となる。また、同時
に複数の性質情報を学習することが可能であるため、ユ
ーザが評価（解）を与える際の処理負担も全体として軽
減することが可能となる。

【０１２５】本形態では、図１９に示すような処理手段
の構成を持つ自動要約処理装置６０としてもよい。図１
９の自動要約処理装置６０は、図６に示す自動要約処理
装置２０を構成する処理手段と同様の処理手段を備え、
かつ評価カスタマイズ手段１１０の代わりに評価カスタ
マイズ手段１５０を備えるものである。

【０１２６】自動要約処理装置６０は、実際の機械学習
処理において、正例と負例の二種類の解（分類先）のみ
を考える機械学習手法を用いることにより、機械学習で
の過重な処理負担を回避することができる。

【０１２７】以上、本発明をその実施の態様により説明
したが、本発明はその主旨の範囲において種々の変形が
可能である。例えば、第１の実施の形態ないし第３の実
施の形態のいずれの形態をも組み合わせて実施すること
も可能である。

【０１２８】〔第４の実施の形態〕図２０に、第４の実
施の形態における本発明の処理の構成例を示す。図２０
に示す自動要約処理装置７０は、評価カスタマイズ手段
１１０と、解データ記憶部１２０と、解−素性対抽出部
１２１と、機械学習部１２２と、学習結果データ記憶部
１２３と、素性抽出部１２５と、解推定部１６０と、評
価カスタマイズ手段１４０とを備える。

【０１２９】自動要約処理装置７０の評価カスタマイズ
手段１４０、解データ記憶部１２０、解−素性対抽出部
１２１、機械学習部１２２、学習結果データ記憶部１２
３、素性抽出部１２５および評価カスタマイズ手段１４
０とは、図８に示す同一番号が付与された処理手段とほ
ぼ同様の処理を行う手段である。

【０１３０】解推定部１６０は、学習結果データ記憶部
１２３の学習結果データを参照して、素性抽出部１２５
から渡された素性の集合の場合に、どのような解になり
易いかを推定し、その推定解１６１を要約３とする手段
である。

【０１３１】本形態では、解データ記憶部１２０は、テ
キストを問題としテキストの要約結果を解とする解デー
タを記憶し、機械学習部１２２は、かかる解データから
抽出された解−素性対を用いて機械学習を行う。また、
素性抽出部１２５は、入力されたテキスト２の素性を抽
出して、解推定部１６０に渡す。

【０１３２】図２１に、第４の実施の形態における機械
学習処理および自動要約処理の流れを示す。

【０１３３】解−素性対抽出部１２１は、解データ記憶
部１２０から、事例ごとに解と素性の集合との組を抽出
し（ステップＳ５１）、次に、機械学習部１２２は、解
と素性の集合との組から、どのような素性の集合のとき
にどのような解になりやすいかを機械学習法により学習
し、学習結果を学習結果データ記憶部１２３に記憶する
（ステップＳ５２）。なお、ステップＳ５１、Ｓ５２の
処理は、図５に示すステップＳ１１、Ｓ１２の処理と同
様である。

【０１３４】その後、要約を求めたいテキスト２が入力
されると（ステップＳ５３）、素性抽出部１２５は、解
−素性対抽出部１２１とほぼ同様の処理によって、入力
したテキスト２から素性の集合を抽出し、解推定部１６
０へ渡す（ステップＳ５４）。そして、解推定部１６０
は、受け取った素性の集合の場合にどのような解になり
やすいかを、学習結果データをもとに推定し、その推定
解１６１を要約３とする（ステップＳ５５）。

【０１３５】本形態では、テキストの要約結果を解とす
る解データを用いて機械学習を行い、その学習結果を参
照した解推定処理において要約とするべき推定解を直接
求めるようにする。

【０１３６】

【発明の効果】以上説明したように、本発明によれば、
ユーザは、機械学習の解データとされる要約結果に対す
る評価を任意に設定することができる。これにより、コ
ンピュータを用いた自動要約処理においても、一つの類
型で要約するのではなく、ユーザに特化した要約を行な
えることが可能となる。

【０１３７】また、同一人物であっても要約の評価が変
化することが考えられるが、本発明によれば、同一人物
であっても随時要約結果に対する評価を設定でき、新た
な解データを用いて機械学習し直すことにより、新しい
評価態度に合わせた要約を行なうことが可能となる。

【図面の簡単な説明】

【図１】第１の実施の形態における本発明の処理装置の
構成例を示す図である。

【図２】第１の実施の形態における評価カスタマイズ処
理の流れを示す図である。

【図３】対象となるテキストの例を示す図である。

【図４】要約結果の例を示す図である。

【図５】図１に示す処理装置における機械学習処理およ
び自動要約処理の流れを示す図である。

【図６】第１の実施の形態における本発明の処理装置の
別の構成例を示す図である。

【図７】図６に示す処理装置における機械学習処理およ
び自動要約処理の流れを示す図である。

【図８】第２の実施の形態における本発明の処理装置の
構成例を示す図である。

【図９】第２の実施の形態における評価カスタマイズ処
理の流れを示す図である。

【図１０】表示されるテキストの例およびユーザＡの指
定範囲の例を示す図である。

【図１１】表示されるテキストの例およびユーザＢの指
定範囲の例を示す図である。

【図１２】表示されるテキストの例およびユーザＣの指
定範囲の例を示す図である。

【図１３】ユーザが指定した範囲の表示の例を示す図で
ある。

【図１４】第２の実施の形態における本発明の処理装置
の別の構成例を示す図である。

【図１５】第３の実施の形態における本発明の処理装置
の構成例を示す図である。

【図１６】第３の実施の形態における評価カスタマイズ
処理の流れを示す図である。

【図１７】性質情報設定画面の例を示す図である。

【図１８】性質情報設定画面の例を示す図である。

【図１９】第３の実施の形態における本発明の処理装置
の別の構成例を示す図である。

【図２０】第４の実施の形態における本発明の処理装置
の構成例を示す図である。

【図２１】図２０に示す処理装置における機械学習処理
および自動要約処理の流れを示す図である。

【符号の説明】

１０自動要約処理装置１１０評価カスタマイズ手段１１１要約表示部１１２評価付与部１２０解データ記憶部１２１解−素性対抽出部１２２機械学習部１２３学習結果データ記憶部１２４要約候補生成部１２５素性抽出部１２６要約候補−推定解対生成部１２７要約候補−推定解対１２８要約選択部１３０解データ記憶部１３１素性−解対・素性−解候補対抽出部１３２機械学習部１３３学習結果データ記憶部１３４要約候補生成部１３５素性−解候補抽出部１３６要約候補−推定解対生成部１３７要約候補−推定解対１３８要約選択部１４０評価カスタマイズ手段１４１テキスト表示部１４２要約編集部１５０評価カスタマイズ手段１５１要約表示部１５２性質情報設定部１６０解推定部１６１推定解２テキスト３要約４テキスト・要約５テキスト７ユーザ評価設定情報

Claims

【特許請求の範囲】

【請求項１】機械学習法によりテキストを自動要約す
る処理で用いる解データを編集する解データ編集処理装
置であって、テキストの要約結果を表示装置に表示する要約表示処理
手段と、前記要約結果に対する評価の入力を受け付けて前記要約
結果の評価とする評価付与処理手段と、前記テキストおよび前記要約結果を問題とし前記評価を
解とする解データを出力する解データ出力処理手段とを
備えることを特徴とする解データ編集処理装置。
【請求項２】機械学習法によりテキストを自動要約す
る処理で用いる解データを編集する解データ編集処理装
置であって、テキストを表示装置に表示するテキスト表示処理手段
と、前記テキストからユーザ指定部分の入力を受け付け、前
記指定部分を前記要約結果とする要約編集処理手段と、前記テキストおよび前記要約結果を問題とし所定の解を
付与した前記解データを出力する解データ出力処理手段
とを備えることを特徴とする解データ編集処理装置。
【請求項３】機械学習法によりテキストを自動要約す
る処理で用いる解データを編集する解データ編集処理装
置であって、テキストを表示装置に表示するテキスト表示処理手段
と、前記テキストからユーザ指定部分の入力を受け付け、前
記指定部分を前記要約結果とする要約編集処理手段と、前記テキストを問題とし前記要約結果を含む所定の解を
付与した前記解データを出力する解データ出力処理手段
とを備えることを特徴とする解データ編集処理装置。
【請求項４】請求項２または請求項３のいずれかに記
載の解データ編集処理装置において、前記要約編集処理手段は、さらに、前記指定部分の語句
の変更の入力を受け付け、変更後の前記指定部分を前記
要約結果とすることを特徴とする解データ編集処理装
置。
【請求項５】機械学習法によりテキストを自動要約す
る処理で用いる解データを編集する解データ編集処理装
置であって、テキストの要約結果を表示装置に表示する要約表示処理
手段と、前記要約結果に対する評価の性質ごとに、評価の入力を
受け付けて、前記入力評価を前記性質評価とする評価付
与処理手段と、評価の性質ごとに、前記テキストおよび前記要約結果を
問題とし前記性質評価を解とする解データを出力する解
データ出力処理手段とを備える、ことを特徴とする解データ編集処理装置。
【請求項６】機械学習法によりテキストを自動要約す
る処理で用いる解データを編集する解データ編集処理方
法であって、テキストの要約結果を表示装置に表示する要約表示処理
過程と、前記要約結果に対する評価の入力を受け付けて前記要約
結果の評価とする評価付与処理過程と、前記テキストおよび前記要約結果を問題とし前記評価を
解とする解データを出力する解データ出力処理過程とを
備えることを特徴とする解データ編集処理方法。
【請求項７】機械学習法によりテキストを自動要約す
る処理で用いる解データを編集する解データ編集処理方
法であって、テキストを表示装置に表示するテキスト表示処理過程
と、前記テキストからユーザ指定部分の入力を受け付け、前
記指定部分を前記要約結果とする要約編集処理過程と、前記テキストおよび前記要約結果を問題とし所定の解を
付与した前記解データを出力する解データ出力処理過程
とを備えることを特徴とする解データ編集処理方法。
【請求項８】機械学習法によりテキストを自動要約す
る処理で用いる解データを編集する解データ編集処理方
法であって、テキストを表示装置に表示するテキスト表示処理過程
と、前記テキストからユーザ指定部分の入力を受け付け、前
記指定部分を前記要約結果とする要約編集処理過程と、前記テキストを問題とし前記要約結果を含む所定の解を
付与した前記解データを出力する解データ出力処理過程
とを備えることを特徴とする解データ編集処理方法。
【請求項９】請求項７または請求項８に記載の解デー
タ編集処理方法において、前記要約編集処理過程は、さらに、前記指定部分の語句
の変更の入力を受け付け、変更後の前記指定部分を前記
要約結果とする処理を含むことを特徴とする解データ編
集処理方法。
【請求項１０】機械学習法によりテキストを自動要約
する処理で用いる解データを編集する解データ編集処理
方法であって、テキストの要約結果を表示装置に表示する要約表示処理
過程と、前記要約結果に対する評価の性質ごとに、評価の入力を
受け付けて、前記入力評価を前記性質評価とする評価付
与処理過程と、評価の性質ごとに、前記テキストおよび前記要約結果を
問題とし前記性質評価を解とする解データを出力する解
データ出力処理過程とを備えることを特徴とする解デー
タ編集処理方法。
【請求項１１】テキストおよび前記テキストの要約結
果を問題とし前記要約結果の評価を解とする解データを
用いた機械学習法によりテキストを自動要約する自動要
約処理装置であって、前記解データに対するユーザ入力を受け付け、前記入力
をもとに変更した解データを記憶する解データ記憶手段
と、前記解データから前記問題の素性の集合と前記解との組
を抽出し、当該組から、どのような素性のときにどのよ
うな解となりやすいかを学習し、学習結果を学習結果デ
ータ記憶手段に記憶する機械学習処理手段と、入力テキストから要約候補を生成する要約候補生成処理
手段と、前記入力テキストおよび前記要約候補から素性の集合を
抽出し、当該素性の集合からどのような解となりやすい
かを前記学習結果データをもとに推定して、要約候補と
推定解との対を生成する要約候補−推定解対生成処理手
段と、前記要約候補−推定解対から前記推定解の確信度が最高
の対を選択し、当該対の要約候補を要約とする要約選択
処理手段とを備えることを特徴とする自動要約処理装
置。
【請求項１２】テキストおよび前記テキストの要約結
果を問題とし前記要約結果の評価を解とする解データを
用いた機械学習法によりテキストを自動要約する自動要
約処理装置であって、前記解データに対するユーザ入力を受け付け、前記入力
をもとに変更した解データを記憶する解データ記憶手段
と、前記解データから、解もしくは解候補と前記問題の素性
の集合との組を抽出し、抽出した前記組を教師信号とし
て、どのような解もしくは解候補と素性の集合のとき
に、正例である確率または負例である確率となるかを学
習し、学習結果データ記憶手段に記憶する機械学習処理
手段と、入力テキストから要約候補を生成する要約候補生成処理
手段と、前記入力テキストおよび前記要約候補から、素性の集合
と解の候補との組を抽出し、当該素性の集合と解の候補
の組の場合に、正例もしくは負例である確率をを前記学
習結果データをもとに推定して、要約候補と推定解との
対を生成する要約候補−推定解対生成処理手段と、前記要約候補−推定解対から前記推定解の正例の確率が
確信度が最高の対を選択し、当該対の要約候補を要約と
する要約選択処理手段とを備えることを特徴とする自動
要約処理装置。
【請求項１３】請求項１１または請求項１２のいずれ
かに記載の自動要約処理装置において、前記解データ記憶手段は、前記解データの解が前記要約
結果に対する性質ごとの評価である解データを記憶する
ものであり、前記要約選択処理手段は、前記品質ごとの評価の組合せ
情報の入力を受け付け、前記組合せ情報に最も類似する
推定解を持つ前記要約候補−推定解対を選択し、当該対
の要約候補を要約とすることを特徴とする自動要約処理
装置。
【請求項１４】テキストを問題とし前記テキストの要
約結果を解とする解データを用いた機械学習法によりテ
キストを自動要約する自動要約処理装置であって、前記解データに対するユーザ入力を受け付け、前記入力
をもとに変更した解データを記憶する解データ記憶手段
と、前記解データから前記問題の素性の集合と前記解との組
を抽出し、当該組から、どのような素性のときにどのよ
うな解となりやすいかを学習し、学習結果を学習結果デ
ータ記憶手段に記憶する機械学習処理手段と、入力テキストから素性の集合を抽出し、当該素性の集合
からどのような解となりやすいかを前記学習結果データ
をもとに推定する解推定処理手段とを備えることを特徴
とする自動要約処理装置。
【請求項１５】テキストおよび前記テキストの要約結
果を問題とし前記要約結果の評価を解とする解データを
用いた機械学習法によりテキストを自動要約する自動要
約処理方法であって、前記解データに対するユーザ入力を受け付け、前記入力
をもとに変更した解データを記憶する解データ記憶手段
にアクセスする解データアクセス処理過程と、前記解データから前記問題の素性の集合と前記解との組
を抽出し、当該組から、どのような素性のときにどのよ
うな解となりやすいかを学習し、学習結果を学習結果デ
ータ記憶手段に記憶する機械学習処理過程と、入力テキストから要約候補を生成する要約候補生成処理
過程と、前記入力テキストおよび前記要約候補から素性の集合を
抽出し、当該素性の集合からどのような解となりやすい
かを前記学習結果データをもとに推定して、要約候補と
推定解との対を生成する要約候補−推定解対生成処理過
程と、前記要約候補−推定解対から前記推定解の確信度が最高
の対を選択し、当該対の要約候補を要約とする要約選択
処理過程とを備えることを特徴とする自動要約処理方
法。
【請求項１６】テキストおよび前記テキストの要約結
果を問題とし前記要約結果の評価を解とする解データを
用いた機械学習法によりテキストを自動要約する自動要
約処理方法であって、前記解データに対するユーザ入力を受け付け、前記入力
をもとに変更した解データを記憶する解データ記憶手段
にアクセスする解データアクセス処理過程と、前記解データから、解もしくは解候補と前記問題の素性
の集合との組を抽出し、抽出した前記組を教師信号とし
て、どのような解もしくは解候補と素性の集合のとき
に、正例である確率または負例である確率となるかを学
習し、学習結果データ記憶手段に記憶する機械学習処理
過程と、入力テキストから要約候補を生成する要約候補生成処理
過程と、前記入力テキストおよび前記要約候補から、素性の集合
と解の候補との組を抽出し、当該素性の集合と解の候補
の組の場合に、正例もしくは負例である確率をを前記学
習結果データをもとに推定して、要約候補と推定解との
対を生成する要約候補−推定解対生成処理過程と、前記要約候補−推定解対から前記推定解の正例の確率が
確信度が最高の対を選択し、当該対の要約候補を要約と
する要約選択処理過程とを備えることを特徴とする自動
要約処理方法。
【請求項１７】請求項１５または請求項１６のいずれ
かに記載の自動要約処理方法において、前記解データアクセス処理過程でアクセスする解データ
記憶手段は、前記解データの解が前記要約結果に対する
性質ごとの評価である解データを記憶するものであり、前記要約選択処理過程は、前記品質ごとの評価の組合せ
情報の入力を受け付け、前記組合せ情報に最も類似する
推定解を持つ前記要約候補−推定解対を選択し、当該対
の要約候補を要約とすることを特徴とする自動要約処理
方法。
【請求項１８】テキストを問題とし前記テキストの要
約結果を解とする解データを用いた機械学習法によりテ
キストを自動要約する自動要約処理方法であって、前記解データに対するユーザ入力を受け付け、前記入力
をもとに変更した解データを記憶する解データ記憶手段
にアクセスする解データアクセス処理過程と、前記解データから前記問題の素性の集合と前記解との組
を抽出し、当該組から、どのような素性のときにどのよ
うな解となりやすいかを学習し、学習結果を学習結果デ
ータ記憶手段に記憶する機械学習処理過程と、入力テキストから素性の集合を抽出し、当該素性の集合
からどのような解となりやすいかを前記学習結果データ
をもとに推定する解推定処理過程とを備えることを特徴
とする自動要約処理方法。