JP2003248676A - 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法 - Google Patents

解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法

Info

Publication number
JP2003248676A
JP2003248676A JP2002045925A JP2002045925A JP2003248676A JP 2003248676 A JP2003248676 A JP 2003248676A JP 2002045925 A JP2002045925 A JP 2002045925A JP 2002045925 A JP2002045925 A JP 2002045925A JP 2003248676 A JP2003248676 A JP 2003248676A
Authority
JP
Japan
Prior art keywords
solution
text
result
candidate
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002045925A
Other languages
English (en)
Inventor
Maki Murata
真樹 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communications Research Laboratory
Original Assignee
Communications Research Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communications Research Laboratory filed Critical Communications Research Laboratory
Priority to JP2002045925A priority Critical patent/JP2003248676A/ja
Priority to US10/369,588 priority patent/US7120613B2/en
Priority to CNB031054609A priority patent/CN100419733C/zh
Publication of JP2003248676A publication Critical patent/JP2003248676A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 機械学習による要約処理で用いる解データを
ユーザが自由に編集できる編集処理と前記解データを用
いてユーザに特化した要約処理とを実現する。 【解決手段】 評価カスタマイズ手段110 は表示した要
約にユーザ入力の評価を付与し、テキストと要約と評価
(解)とを事例として解データ記憶部120 に記憶する。
解−素性対抽出部121 は事例から解と素性の集合との組
を抽出し、機械学習部122 はどのような素性のときにど
のような解となりやすいかを学習して結果を学習結果デ
ータ記憶部123 に記憶する。要約候補生成部124 はテキ
スト2 から要約候補を生成し、素性抽出部125 はテキス
トと要約候補から素性の集合を抽出し、要約候補−推定
解対生成部126 は学習結果データを参照して素性の集合
から推定して要約候補−推定解対を生成し、要約選択部
128 はその対の要約候補を要約とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、機械学習法により
文章を自動要約する処理で用いる解データを編集する解
データ編集処理および、編集可能な解データを用いた機
械学習法を用いた自動要約処理に関する。
【0002】
【従来の技術】近年、情報技術の発展に伴ってコンピュ
ータを用いた文章の自動要約処理が盛んになってきてい
る。しかし、個人的な嗜好や要約結果の用途などによ
り、所望する要約結果の傾向に相違があると考えられ
る。
【0003】例えば、以下の参考文献1では、複数の者
がそれぞれ重要文抽出による要約を行なった結果に対す
る相互評価の尺度として再現率と適合率とを求めて表4
に示している。参考文献1の表4から明らかなように、
20文を抽出する処理の場合に、人−人(評価者相互)
の評価(再現率および適合率)は、各評価者A、B、C
の一致度は50〜70%であってあまり高い値とはいえ
ず、要約結果に対する評価に個人差が存在することが推
定できる。 [参考文献1:伊藤山彦 他、講演文を対象にした重要
文抽出、言語処理学会第7回年次大会発表論文集、200
1、pp.305-308] また、以下の参考文献2では、サポート・ベクトル・マ
シン(Support VectorMachine)による重要文抽出処理
において、処理セットA、B、Cについて交差検定の精
度が最もよいことを表4により示している。参考文献2
の表4に示された交差検定は、同一評価者による処理と
同一視でき、セットA、B、Cを作成した者が同一かど
うかは不明であるが、少なくとも同一時期もしくは同一
人物により学習データを作成したほうが精度が良いとい
うことがわかる。 [参考文献2:平尾勉 他、Support Vector Machineに
よる重要文抽出、情報学会基礎論文63-16 、2001、pp.1
21-127]
【0004】
【発明が解決しようとする課題】このように、要約結果
に対する評価に個人差や用途差が存在すると考えること
ができることから、機械学習法を用いた自動要約処理に
おいても、同じ評価にもとづいた要約を行なうのではな
く、ユーザに特化した要約ができる必要がある。そのた
めに、教師となる解データをユーザが自由に編集できる
必要がある。
【0005】本発明の目的は、機械学習法で用いる解デ
ータとなる要約結果または要約結果に対する評価をユー
ザが任意に編集できる解データ編集処理装置と、その処
理方法とを実現することである。
【0006】また、本発明の目的は、前記解データ編集
処理により編集が可能な解データを用いた機械学習法を
用いて、ユーザごとに特化した要約を行える自動要約処
理装置と、その処理方法とを実現することである。
【0007】
【課題を解決するための手段】上記の目的を達成するた
め、本発明は、予め備えた解データを用いた機械学習処
理に対してユーザがどのような要約結果を高く評価した
かの情報をフィードバックするために、ユーザが要約結
果やその評価を編集できるようにする。
【0008】また、本発明は、ユーザが編集した解デー
タのフィードバックにより、機械学習処理においてユー
ザごとの特性を学習し、ユーザに特化した要約を行なう
ことができるようにする。
【0009】本発明は、機械学習法によりテキストを自
動要約する処理で用いる解データを編集する解データ編
集処理装置であって、テキストの要約結果を表示装置に
表示する要約表示処理手段と、前記要約結果に対する評
価の入力を受け付けて前記要約結果の評価とする評価付
与処理手段と、前記テキストおよび前記要約結果を問題
とし前記評価を解とする解データを出力する解データ出
力処理手段とを備える。
【0010】また、本発明の解データ編集処理装置は、
テキストを表示装置に表示するテキスト表示処理手段
と、前記テキストからユーザ指定部分の入力を受け付
け、前記指定部分を前記要約結果とする要約編集処理手
段と、前記テキストおよび前記要約結果を問題とし所定
の解を付与した前記解データを出力する解データ出力処
理手段とを備える。
【0011】また、本発明の解データ編集処理装置は、
テキストの要約結果を表示装置に表示する要約表示処理
手段と、前記要約結果に対する評価の性質ごとに、評価
の入力を受け付けて、前記入力評価を前記性質評価とす
る評価付与処理手段と、評価の性質ごとに、前記テキス
トおよび前記要約結果を問題とし前記性質評価を解とす
る解データを出力する解データ出力処理手段とを備え
る。
【0012】また、本発明は、解データ編集処理方法で
あって、テキストの要約結果を表示装置に表示する要約
表示処理過程と、前記要約結果に対する評価の入力を受
け付けて前記要約結果の評価とする評価付与処理過程
と、前記テキストおよび前記要約結果を問題とし前記評
価を解とする解データを出力する解データ出力処理過程
とを備える。
【0013】また、本発明の解データ編集処理方法は、
テキストを表示装置に表示するテキスト表示処理過程
と、前記テキストからユーザ指定部分の入力を受け付
け、前記指定部分を前記要約結果とする要約編集処理過
程と、前記テキストおよび前記要約結果を問題とし所定
の解を付与した前記解データを出力する解データ出力処
理過程とを備える。
【0014】また、本発明の解データ編集処理方法は、
テキストの要約結果を表示装置に表示する要約表示処理
過程と、前記要約結果に対する評価の性質ごとに、評価
の入力を受け付けて、前記入力評価を前記性質評価とす
る評価付与処理過程と、評価の性質ごとに、前記テキス
トおよび前記要約結果を問題とし前記性質評価を解とす
る解データを出力する解データ出力処理過程とを備え
る。
【0015】また、本発明は、テキストおよび前記テキ
ストの要約結果を問題とし前記要約結果の評価を解とす
る解データを用いた機械学習法によりテキストを自動要
約する自動要約処理装置であって、前記解データに対す
るユーザ入力を受け付け、前記入力をもとに変更した解
データを記憶する解データ記憶手段と、前記解データか
ら前記問題の素性の集合と前記解との組を抽出し、当該
組から、どのような素性のときにどのような解となりや
すいかを学習し、学習結果を学習結果データ記憶手段に
記憶する機械学習処理手段と、入力テキストから要約候
補を生成する要約候補生成処理手段と、前記入力テキス
トおよび前記要約候補から素性の集合を抽出し、当該素
性の集合からどのような解となりやすいかを前記学習結
果データをもとに推定して、要約候補と推定解との対を
生成する要約候補−推定解対生成処理手段と、前記要約
候補−推定解対から前記推定解の確信度が最高の対を選
択し、当該対の要約候補を要約とする要約選択処理手段
とを備える。
【0016】また、本発明の自動要約処理装置は、前記
解データに対するユーザ入力を受け付け、前記入力をも
とに変更した解データを記憶する解データ記憶手段と、
前記解データから、解もしくは解候補と前記問題の素性
の集合との組を抽出し、抽出した前記組を教師信号とし
て、どのような解もしくは解候補と素性の集合のとき
に、正例である確率または負例である確率となるかを学
習し、学習結果データ記憶手段に記憶する機械学習処理
手段と、入力テキストから要約候補を生成する要約候補
生成処理手段と、前記入力テキストおよび前記要約候補
から、素性の集合と解の候補との組を抽出し、当該素性
の集合と解の候補の組の場合に、正例もしくは負例であ
る確率をを前記学習結果データをもとに推定して、要約
候補と推定解との対を生成する要約候補−推定解対生成
処理手段と、前記要約候補−推定解対から前記推定解の
正例の確率が確信度が最高の対を選択し、当該対の要約
候補を要約とする要約選択処理手段とを備える。
【0017】また、本発明は、テキストを問題とし前記
テキストの要約結果を解とする解データを用いた機械学
習法によりテキストを自動要約する自動要約処理装置で
あって、前記解データに対するユーザ入力を受け付け、
前記入力をもとに変更した解データを記憶する解データ
記憶手段と、前記解データから前記問題の素性の集合と
前記解との組を抽出し、当該組から、どのような素性の
ときにどのような解となりやすいかを学習し、学習結果
を学習結果データ記憶手段に記憶する機械学習処理手段
と、入力テキストから素性の集合を抽出し、当該素性の
集合からどのような解となりやすいかを前記学習結果デ
ータをもとに推定する解推定処理手段とを備える。
【0018】また、本発明は、テキストおよび前記テキ
ストの要約結果を問題とし前記要約結果の評価を解とす
る解データを用いた機械学習法によりテキストを自動要
約する自動要約処理方法であって、前記解データに対す
るユーザ入力を受け付け、前記入力をもとに変更した解
データを記憶する解データ記憶手段にアクセスする解デ
ータアクセス処理過程と、前記解データから前記問題の
素性の集合と前記解との組を抽出し、当該組から、どの
ような素性のときにどのような解となりやすいかを学習
し、学習結果を学習結果データ記憶手段に記憶する機械
学習処理過程と、入力テキストから要約候補を生成する
要約候補生成処理過程と、前記入力テキストおよび前記
要約候補から素性の集合を抽出し、当該素性の集合から
どのような解となりやすいかを前記学習結果データをも
とに推定して、要約候補と推定解との対を生成する要約
候補−推定解対生成処理過程と、前記要約候補−推定解
対から前記推定解の確信度が最高の対を選択し、当該対
の要約候補を要約とする要約選択処理過程とを備える。
【0019】また、本発明の自動要約処理方法は、前記
解データに対するユーザ入力を受け付け、前記入力をも
とに変更した解データを記憶する解データ記憶手段にア
クセスする解データアクセス処理過程と、前記解データ
から、解もしくは解候補と前記問題の素性の集合との組
を抽出し、抽出した前記組を教師信号として、どのよう
な解もしくは解候補と素性の集合のときに、正例である
確率または負例である確率となるかを学習し、学習結果
データ記憶手段に記憶する機械学習処理過程と、入力テ
キストから要約候補を生成する要約候補生成処理過程
と、前記入力テキストおよび前記要約候補から、素性の
集合と解の候補との組を抽出し、当該素性の集合と解の
候補の組の場合に、正例もしくは負例である確率をを前
記学習結果データをもとに推定して、要約候補と推定解
との対を生成する要約候補−推定解対生成処理過程と、
前記要約候補−推定解対から前記推定解の正例の確率が
確信度が最高の対を選択し、当該対の要約候補を要約と
する要約選択処理過程とを備える。
【0020】また、本発明は、テキストを問題とし前記
テキストの要約結果を解とする解データを用いた機械学
習法によりテキストを自動要約する自動要約処理方法で
あって、前記解データに対するユーザ入力を受け付け、
前記入力をもとに変更した解データを記憶する解データ
記憶手段にアクセスする解データアクセス処理過程と、
前記解データから前記問題の素性の集合と前記解との組
を抽出し、当該組から、どのような素性のときにどのよ
うな解となりやすいかを学習し、学習結果を学習結果デ
ータ記憶手段に記憶する機械学習処理過程と、入力テキ
ストから素性の集合を抽出し、当該素性の集合からどの
ような解となりやすいかを前記学習結果データをもとに
推定する解推定処理過程とを備える。
【0021】本発明にかかる処理装置の各手段または機
能または要素は、コンピュータが実行可能な処理プログ
ラムによっても実現できる。この処理プログラムは、コ
ンピュータが読み取り可能な、可搬媒体メモリ、半導体
メモリ、ハードディスクなどの適当な記録媒体に格納す
ることができ、これらの記録媒体に記録して提供され、
または、通信インタフェースを介して種々の通信網を利
用した送受信により提供されるものである。
【0022】
【発明の実施の形態】〔第1の実施の形態〕図1に、第
1の実施の形態における本発明の処理装置の構成例を示
す。
【0023】自動要約処理装置10は、評価カスタマイ
ズ手段110と、解データ記憶部120と、解−素性対
抽出部121と、機械学習部122と、学習結果データ
記憶部123と、要約候補生成部124と、素性抽出部
125と、要約候補−推定解対生成部126と、要約選
択部128とを備える。
【0024】評価カスタマイズ手段110は、特許請求
の範囲に示す解データ編集処理装置を実現する処理手段
である。また、解データ記憶部120と、解−素性対抽
出部121と、機械学習部122と、学習結果データ記
憶部123とは、特許請求の範囲に示す自動要約処理装
置の機械学習処理手段を実現する処理手段である。
【0025】評価カスタマイズ手段110は、要約結果
やその評価をユーザごとにカスタマイズする手段であっ
て、要約表示部111と、評価付与部112とを備え
る。
【0026】要約表示部111は、予め用意されたテキ
スト・要約4の要約結果を表示装置(図1に図示しな
い)に表示する手段である。
【0027】テキスト・要約4は、テキストとその要約
結果からなる。テキストは、一または複数の記事などか
らなる文書データである。要約結果は、テキストを要約
した文書データである。要約結果としては、人手で生成
したもの、自動要約処理装置10が入力したテキスト2
に対して出力した要約3もしくは要約候補生成部124
が生成し解データ記憶部120に記憶した要約候補であ
ってもよい。
【0028】評価付与部112は、要約表示部111が
表示した要約結果に対してユーザが入力した評価を付与
し、または、要約結果に予め与えられている評価をユー
ザが入力した評価に変更する手段である。
【0029】解データ記憶部120は、機械学習部12
2が機械学習法を実行する際に教師とする解データを記
憶する手段である。解データ記憶部120には、解デー
タとして、テキストおよびその要約結果とからなる問題
と要約結果に対する評価である解との組である事例が記
憶される。
【0030】解−素性対抽出部121は、解データ記憶
部120に記憶されている事例ごとに解と素性の集合と
の組を抽出する手段である。
【0031】素性とは、解析に用いる情報の細かい1単
位を意味し、ここでは、1)文のなめらかさを示す情
報、2)内容をよく表しているかどうかを示す情報、お
よび、3)自動要約処理で用いられる特徴的な情報など
である。
【0032】機械学習部122は、解−素性対抽出部1
21により抽出された解と素性の集合との組から、どの
ような素性の集合のときにどのような解になりやすいか
を機械学習法により学習し、学習結果を学習結果データ
記憶部123に保存する手段である。機械学習部122
は、解データを用いた機械学習法であればどのような手
法で処理を行ってもよい。手法としては、例えば、決定
木法、サポートベクトル法、パラメータチューニング
法、シンプルベイズ法、最大エントロピー法、決定リス
ト法などがある。
【0033】学習結果データ記憶部123は、機械学習
部122の学習結果データを記憶する手段である。
【0034】要約候補生成部124は、入力されたテキ
スト2から、所定の方法にもとづいて要約候補を生成す
る手段である。要約候補生成部124は、重要文選択モ
デル、重要箇所選択モデル、変形規則を利用したモデ
ル、ランダムジェネレーションを利用したモデルなどの
種々のなモデルを用いて要約候補を生成する。
【0035】素性抽出部125は、テキスト2および要
約候補生成部124で生成された要約候補について素性
の集合を抽出して要約候補−推定解対生成部126へ渡
す手段である。
【0036】要約候補−推定解対生成部126は、学習
結果データ記憶部123の学習結果データを参照して、
素性抽出部125から渡された素性の集合の場合に、ど
のような解になりやすいかを推定して、要約候補と推定
解との対(要約候補−推定解対)127を生成する手段
である。要約候補−推定解対生成部126は、さらに、
各要約候補−推定解対127に、その推定解である確信
度(確率)を求めて付与しておく。
【0037】要約選択部128は、要約候補−推定解対
127を受け取り、確信度の値が最も高い要約候補−推
定解対127を選択し、その要約候補を要約3とする手
段である。
【0038】第1の実施の形態における評価カスタマイ
ズ処理を説明するため、3人のユーザA、B、Cが要約
結果をカスタマイズする場合を考える。
【0039】ユーザAは要約結果に精度に関する記載が
含まれていることを重視して評価すると仮定する。ユー
ザBは要約結果に手法に関する記載が含まれていること
を重視し、ユーザCは、要約結果に手法と精度の両方に
関する記載が含まれていることを重視して評価すると仮
定する。また、要約結果の評価を3段階に分けて、評価
1=よい、評価2=どちらでもない、評価3=悪い、の
いずれかの分類先(評価)を与えるとする。
【0040】図2に、第1の実施の形態における評価カ
スタマイズ処理の流れを示す。
【0041】まず、テキスト・要約4が用意されている
とする。図3にテキスト・要約4のテキストの例を示
し、図4に要約結果の例を示す。図4(A)〜(C)の
それぞれに、3つの要約結果r1、r2、r3を示す。
【0042】要約表示部111は、テキスト・要約4か
ら取り出した要約結果を表示画面に表示する(ステップ
S1)。そして、評価付与部112は、ユーザが入力し
た評価を受け付け、その入力された評価を表示された要
約結果の解(評価)とする(ステップS2)。
【0043】ここで、ユーザAが自動要約処理装置10
を使用する場合を想定する。ユーザAは、図4(A)の
要約結果r1に対して、精度に関係することが要約結果
として抽出されているため、評価1をつける。すると、
評価付与部112は、ユーザの入力(評価1)を受け付
けて、事例c1の解として評価1を設定する。
【0044】次に、要約表示部111が図4(B)に示
す事例c2の要約結果r2を表示した場合には、要約結
果r2は精度に関係することが抽出されていないため、
ユーザAは、要約結果r2に対して評価3をつけ、評価
付与部112は、事例c2の解として評価3を設定す
る。
【0045】さらに、要約表示部111が図4(C)に
示す事例c3の要約結果r3を表示した場合には、要約
結果r3は精度に関係するところが抽出されているが若
干冗長であるため、ユーザAは評価2をつけ、評価付与
部112は事例c3の解として評価2を設定する。
【0046】同様に、ユーザBの場合を想定する。ユー
ザBは、図4(A)に示す要約結果r1に対して手法に
関係するところが抽出されていないために評価3をつ
け、図4(B)に示す要約結果r2に対して手法に関係
するところが抽出されていることから評価1をつけ、図
4(C)に示す要約結果r3に対して手法に関係すると
ころが抽出されているが若干冗長であるため評価2をつ
ける。
【0047】また、同様に、ユーザCの場合を想定す
る。ユーザCは、図4(A)に示す要約結果r1に対し
て精度に関係するところが抽出されているが手法に関係
するところが抽出されれていないため評価2をつけ、図
4(B)に示す要約結果r2に対して手法に関係すると
ころが抽出されているが精度に関係するところが抽出さ
れれていないため評価2をつけ、図4(C)に示す要約
結果r3について手法および精度のいずれにも関係する
ところが抽出されているが若干冗長であるため評価1を
つける。
【0048】評価付与部112は、ユーザBおよびユー
ザCごとに要約結果r1〜r3に対する入力評価を、そ
れぞれの事例c1〜c3の解(評価)として設定する。
【0049】そして、評価カスタマイズ手段110は、
テキスト・要約4で与えられたテキストとその要約結果
と解とを事例として解データ記憶部120に記憶する
(ステップS3)。
【0050】図5に、機械学習処理および自動要約処理
の流れを示す。
【0051】解−素性対抽出部121は、解データ記憶
部120から、事例ごとに解と素性の集合との組を抽出
する(ステップS11)。
【0052】解−素性対抽出部121は、例えば、1)
文のなめらかさを示す情報として、k−gram 形態素
列のコーパスでの存在、かかりうけ文節間の意味的整合
度などを、また、2)内容をよく表しているかどうかを
示す情報として、要約前のテキストにあったキーフレー
ズの包含率などを、また、3)自動要約で用いられる情
報として、その文の位置やリード文かどうか、TF/I
DF(TFは文書中でのその語の出現回数もしくは頻度
を示す値、IDFはあらかじめ持っている多数の文書群
のうち、その語が出現する文書数の逆数をいう。)、文
の長さ、固有表現・接続詞・機能語などの手がかり表現
の存在などを、素性として抽出する。
【0053】次に、機械学習部122は、解と素性の集
合との組から、どのような素性の集合のときにどのよう
な解になりやすいかを機械学習法により学習し、学習結
果を学習結果データ記憶部123に記憶する(ステップ
S12)。
【0054】ここでユーザAの処理の場合に、解データ
記憶部120に記憶される解データの「事例:問題→
解」は、 事例c1:テキスト−要約結果r1→評価1、 事例c2:テキスト−要約結果r2→評価3、 事例c3:テキスト−要約結果r3→評価2 となり、機械学習部122は、これらの解データをもと
に、どのような場合に評価1〜評価3になるかを機械学
習で学習する。例えば、事例C1→評価1や事例c3→
評価2から、機械学習部122は、精度の表現、例えば
「数字+[%]」の表現が出現すると評価が高くなるな
どを学習する。ここで、「数字+[%]」の表現は、学
習に用いる素性の例である。
【0055】また、ユーザBの処理の場合に、「事例:
問題→解」は、 事例c1:テキスト−要約結果r1→評価3、 事例c2:テキスト−要約結果r2→評価1、 事例c3:テキスト−要約結果r3→評価2 となり、機械学習部122は、「手がかり表現」や「用
例」などの手法に相当する専門用語が出現すると評価が
高くなるように学習する。
【0056】また、ユーザCの処理の場合に、「事例:
問題→解」は、 「事例c1:テキスト−要約結果r1→評価2、 事例c2:テキスト−要約結果r2→評価2、 事例c3:テキスト−要約結果r3→評価1」 となり、機械学習部122は、精度の表現または手法に
相当する表現の両方が出現すると評価が高くなるように
学習する。
【0057】また、要約結果として出力される文章は短
いほどよいので、それぞれの処理の場合において、文章
の長さが短いほど評価が高くなるように学習する。
【0058】機械学習の手法としては、例えば、シンプ
ルベイズ法、決定リスト法、最大エントロピー法、サポ
ートベクトルマシン法などを用いる。
【0059】シンプルベイズ法は、ベイズの定理にもと
づいて各分類になる確率を推定し、その確率値が最も大
きい分類を求める分類とする方法である。
【0060】決定リスト法は、素性と分類先の組とを規
則とし、それらをあらかじめ定めた優先順序でリストに
蓄えおき、検出する対象となる入力が与えられたとき
に、リストで優先順位の高いところから入力のデータと
規則の素性とを比較し、素性が一致した規則の分類先を
その入力の分類先とする方法である。
【0061】最大エントロピー法は、あらかじめ設定し
ておいた素性fj (1≦j≦k)の集合をFとすると
き、所定の条件式を満足しながらエントロピーを意味す
る式を最大にするときの確率分布を求め、その確率分布
にしたがって求まる各分類の確率のうち、もっとも大き
い確率値を持つ分類を求める分類とする方法である。
【0062】サポートベクトルマシン法は、空間を超平
面で分割することにより、2つの分類からなるデータを
分類する手法である。
【0063】決定リスト法および最大エントロピー法に
ついては、以下の参考文献3に、サポートベクトルマシ
ン法については、以下の参考文献4および参考文献5に
説明されている。 [参考文献3:村田真樹、内山将夫、内元清貴、馬青、
井佐原均、種々の機械学習法を用いた多義解消実験、電
子情報通信学会言語理解とコミュニケーション研究会,
NCL2001-2, (2001) ] [参考文献4:Nello Cristianini and John Shawe-Tay
lor, An Introduction to Support Vector Machines an
d Other Kernel-based Learning Methods,(Cambridge U
niversity Press,2000) ] [参考文献5:Taku Kudoh, Tinysvm:Support Vector m
achines,(http://cl.aist-nara.ac.jp/taku-ku//softwa
re/TinySVM/index.html,2000) ] その後、要約を求めたいテキスト2が入力されると(ス
テップS13)、要約候補生成部124は、例えば以下
に示すような処理モデルを用いて、テキスト2から要約
候補を作成する(ステップS14)。
【0064】1)重要文選択モデル 重要文選択モデルとは、文を単位に要約し、重要と思わ
れる文のみを選択して残すことにより要約を実現するモ
デルである。このモデルの場合には、あらゆる文選択の
状態をすべて解の候補とするとよい。また、すべてを解
の候補とすると計算速度に支障が生じる場合には、予め
備えておいた選択規則を用いて、この選択規則を満足す
る文の選択状態のみを解の候補とする。すなわち、所定
の選択規則により候補数を減少させて処理の負荷を軽減
する。なお、選択規則は、人手による規則であってもよ
い。
【0065】2)重要箇所選択モデル 重要箇所選択モデルとは、文よりも小さいものを要約の
単位として、不要なものを削除することにより要約を実
現するモデルである。単位を文より小さいものとするこ
と以外については、上記1)重要文選択モデルと同様で
ある。文よりも小さいものとして、例えば文節を用い
る。すなわち、文節を単位として不要な文節を消してい
くことにより要約を実現する。この重要箇所選択モデル
の場合は、あらゆる文節の選択の状態をすべて解の候補
とする。また、すべてを解の候補とすると計算速度に支
障が生じる場合には、上記1)重要文選択モデルと同様
に、予め選択規則を用意しておき、この選択規則を満足
する文の選択状態のみを解の候補とする。
【0066】3)変形規則を利用したモデル 変形規則を利用したモデルとは、予め用意した変形規則
を利用して要約結果を生成するモデルである。変形規則
は、自動処理により獲得するか、または人手で作成して
おいたものを利用する。例えば、「Xして、Yした。」
を「Xした。」もしくは「Yした。」に書き換えるよう
な変形規則を作っておき、この変形規則に従って入力
「Aして、Bした。」が与えられたときに「Aした。」
や「Bした。」という要約候補を生成する。
【0067】4)ランダムジェネレーションを利用した
モデル ランダムジェネレーションを利用したモデルは、例え
ば、入力「・・・X・・・」があったときに「・・・Y
・・・」を要約候補とするようなモデルである。このと
き、置き換えられるXはランダムに選ばれてもよいし、
予め用意しておいた置換規則によって指定してもよい。
置換規則は、人手によって生成されたものや、自動獲得
したものなどを用いる。また、置き換えた先の表現Y
は、ある辞書の単語もしくは文字列の集合からランダム
に選ばれてもよいし、予め用意しておいた変換規則によ
って指定してもよい。変換規則は、置換規則と同様、人
手によって生成されたものや、自動獲得したものなどを
用いる。このとき、XやYをランダムに選ばずに、変換
規則にもとづいて選ぶとすると、変形規則を利用したモ
デルと同じようなものになる。
【0068】素性抽出部125は、解−素性対抽出部1
21とほぼ同様の処理によって、入力したテキスト2お
よび要約候補から素性の集合を抽出し、要約候補−推定
解対生成部126へ渡す(ステップS15)。
【0069】そして、要約候補−推定解対生成部126
は、受け取った素性の集合の場合にどのような解になり
やすいかを、学習結果データをもとに推定し、すなわ
ち、複数の要約候補のそれぞれの解(評価)とその確信
度を学習結果データにもとづき算出し、要約候補と推定
解との対(要約候補−推定解対)127を生成する(ス
テップS16)。
【0070】そして、要約選択部128は、生成された
要約候補−推定解対127から、推定解の確信度の値が
最もよい要約候補−推定解対127を選択し、その要約
候補を要約3とする(ステップS17)。
【0071】図6に、第1の実施の形態における本発明
の処理装置の別の構成例を示す。
【0072】本形態では、解(分類先)として多数の候
補が考えられるが、分類先の種類数が多くなり過ぎて、
一般の機械学習法で処理ができない場合が生じうる。こ
のような場合に、図6に示す自動要約処理装置20で
は、機械学習部132は、実際の機械学習処理において
正例と負例の二種類の解(分類先)のみを考える機械学
習手法を用いることにより処理が可能となる。
【0073】また、図6に示す自動要約処理装置20で
は、機械学習部132の学習の素性に評価という情報を
用いることもできる。
【0074】自動要約処理装置20は、評価カスタマイ
ズ手段110と、解データ記憶部130と、素性−解対
・素性−解候補対抽出部131と、機械学習部132
と、学習結果データ記憶部133と、要約候補生成部1
34と、素性−解候補抽出部135と、要約候補−推定
解対生成部136と、要約選択部138とを備える。
【0075】解データ記憶部130と、素性−解対・素
性−解候補対抽出部131と、機械学習部132と、学
習結果データ記憶部133とは、特許請求の範囲に示す
自動要約処理装置の機械学習処理手段を実現する処理手
段である。また、要約候補生成部134と、素性−解候
補抽出部135と、要約候補−推定解対生成部136と
は、特許請求の範囲に示す要約候補生成手段を実現する
処理手段である。
【0076】評価カスタマイズ手段110および要約候
補生成部134は、図1に示す自動要約処理装置10の
評価カスタマイズ手段110および要約候補生成部12
4と同様の処理を行う。
【0077】素性−解対・素性−解候補対抽出部131
は、解データ記憶部110に記憶されている事例ごと
に、解もしくは解候補と素性の集合との組を抽出する手
段である。ここでは、解の候補は解以外の解の候補を意
味し、ユーザが設定した評価を解とする。また、解と素
性の集合の組を正例とし、解の候補と素性の集合との組
を負例とする。
【0078】機械学習部132は、解もしくは解の候補
と素性の集合との組から、どのような解もしくは解の候
補と素性の集合のときに正例である確率や負例である確
率を学習し、その学習結果を学習結果データ記憶部13
3に記憶する手段である。
【0079】素性−解候補抽出部135は、素性−解対
・素性−解候補対抽出部131と同様の処理により、入
力されたテキストおよび要約候補について、解の候補と
素性の集合との組を抽出する手段である。
【0080】要約候補−推定解対生成部136は、渡さ
れた解の候補と素性の集合との組の場合に正例である確
率や負例である確率を求め、正例である確率が最も大き
い解を推定解として、その場合の要約候補と推定解との
対(要約候補−推定解対)137を生成する手段であ
る。
【0081】要約選択部138は、要約候補−推定解対
137の要約候補を要約3とする手段である。
【0082】図7に、自動要約処理装置20の機械学習
処理および自動要約処理の流れを示す。
【0083】素性−解対・素性−解候補対抽出部131
は、解データ記憶部130から、各事例ごとに解もしく
は解の候補と素性の集合との組を抽出する(ステップS
21)。そして、機械学習部132は、解もしくは解の
候補と素性の集合との組から、どのような解もしくは解
の候補と素性の集合のときに、正例である確率や負例で
ある確率を機械学習法により学習し、学習結果を学習結
果データ記憶部133に記憶する(ステップS22)。
【0084】その後、要約を求めたいテキスト2が入力
されると(ステップS23)、要約候補生成部134
は、所定の方法でテキスト2から要約候補を生成する
(ステップS24)。そして、素性−解候補抽出部13
5は、入力したテキスト2および要約候補から素性の集
合と解の候補との組を抽出し、要約候補−推定解対生成
部136へ渡す(ステップS25)。
【0085】要約候補−推定解対生成部136は、受け
取った解の候補と素性の集合との組の場合に正例や負例
である確率を学習結果データをもとに推定し、正例であ
る確率が最も大きい解の候補を推定解として、要約候補
−推定解対137を生成し(ステップS26)、要約選
択部138は、要約候補−推定解対137の要約候補を
要約3とする(ステップS27)。
【0086】第1の実施の形態では、ユーザは必要なと
きに自動要約処理装置1を使用しながら、その使用の際
に出力された要約結果に対して評価1〜3をつければよ
い。したがって、ユーザは、操作負担を感じることなく
要約結果の評価をカスタマイズすることが可能となる。
【0087】〔第2の実施の形態〕図8に、第2の実施
の形態における本発明の処理装置の構成例を示す。図8
に示す自動要約処理装置30は、図1に示す自動要約処
理装置10の評価カスタマイズ手段110の代わりに評
価カスタマイズ手段140を備え、また自動要約処理装
置10を構成する評価カスタマイズ手段110以外の処
理手段を備える。
【0088】評価カスタマイズ手段140は、テキスト
表示部141と、要約編集部142とを備える。
【0089】テキスト表示部141は、予め用意したテ
キスト5を表示装置(図8に図示しない)に表示する手
段である。
【0090】要約編集部142は、テキスト表示部14
1が表示したテキスト5からユーザが要約として指定し
た部分を抽出して、または、ユーザが指定した部分内の
表現を変更して要約を編集する手段である。
【0091】図9に、第2の実施の形態における評価カ
スタマイズ処理の流れを示す。
【0092】テキスト表示部141は、予め用意したテ
キスト5を取り込み、表示装置に表示する(ステップS
31)。表示したテキスト5上でユーザに要約結果とし
て良いと思われる部分を指定させ、ユーザが指定した範
囲を受け付けて抽出する(ステップS32)。また、指
定した範囲の部分が編集されたら、その編集内容を受け
付け、編集後の指定範囲部分を要約結果とする(ステッ
プS33)。
【0093】ユーザは、表示されたテキスト上をマウス
などのポインティング・デバイスによるドラッグや、カ
ーソルキー移動による開始位置および終了位置の指定な
どにより要約とする範囲を指定する。テキスト表示部1
41は、指定された範囲を、反転もしくはマーキングな
どの表示により、指定されなかった範囲と区別して表示
する。
【0094】図10に、表示されるテキストの例および
ユーザAが指定した範囲の例を示す。ユーザAは、破線
で囲む部分「小説を対象にして実験を行なったところ、
テストサンプルで再現率84%、適合率82%の精度で
解析できた。」を要約としてよい部分であると指定す
る。要約編集部142は、図10のテキストの破線の矩
形で示された部分を要約結果とする。
【0095】また、ユーザBは、図11に示すように、
テキストの破線で囲む部分「自然言語では、動詞を省略
するということがある。この省略された動詞を復元する
ことは、対話システムや高品質の機械翻訳システムの実
現には不可欠なことである。そこで本研究では、この省
略された動詞を表層の表現(手がかり語) と用例から補
完することを行なう。」を要約として良いと指定する。
また、ユーザCの場合には、図12に示すように、2つ
の破線の矩形で囲まれた部分「自然言語では、動詞を省
略するということがある。この省略された動詞を復元す
ることは、対話システムや高品質の機械翻訳システムの
実現には不可欠なことである。そこで本研究では、この
省略された動詞を表層の表現(手がかり語) と用例から
補完することを行なう。」と部分「小説を対象にして実
験を行なったところ、テストサンプルで再現率84%、適
合率82%の精度で解析できた。」とを要約としてよいと
指定する。要約編集部142は、図11および図12に
示すテキストの破線の矩形で示された部分をそれぞれ要
約結果とする。
【0096】なお、ユーザが指定した範囲をテキストと
別に表示し、指定範囲内の表現について、ユーザが任意
の箇所を削除したり、または表現を変更したりして、そ
の内容を編集できるようにしてもよい。図13に示すよ
うに、テキスト上で指定した範囲をテキストと別に表示
して、指定範囲内の語句などを削除し、追加し、訂正す
ることができるようにする。要約編集部142は、要約
決定ボタンがクリック等の操作で選択されると、その選
択を受け付けて、指定範囲の内容を要約結果とする。な
お、キャンセルボタンが選択された場合には、指定範囲
の内容をクリアする。
【0097】そして、要約編集部142は、テキスト5
と要約結果とを、所定の解(良い評価)とともに解デー
タ記憶部130に記憶する(ステップS34)。さら
に、評価カスタマイズ手段140は、第1の実施の形態
において、自動要約処理装置20が生成した要約、自動
要約処理装置20の要約候補生成部124が生成した要
約候補、人手でランダムに生成した要約などのユーザが
指定した要約以外の要約に対して所定の解(悪い評価)
を付与した解データも解データ記憶部130へ記憶す
る。
【0098】以降、機械学習処理および自動要約処理の
流れは、図5に示す処理の流れと同様である。ここで、
機械学習部122は、それぞれのユーザごとに、図3に
示すテキストと、図10〜図12に示す要約結果のいず
れか(すなわち、ユーザ指定範囲)と、解とする事例に
ついて学習する。
【0099】図14に、第2の実施の形態における本発
明の処理装置の別の構成例を示す。本形態においても、
解(分類先)の種類数が多くなり過ぎて、一般の機械学
習法で処理ができない場合が生じうる。
【0100】このため、図14に示す自動要約処理装置
40では、機械学習部132は、実際の機械学習処理に
おいて正例と負例の二種類の解(分類先)のみを考える
機械学習手法を用いることにより処理を可能としてい
る。
【0101】自動要約処理装置40は、図6に示す自動
要約処理装置20を構成する処理手段と同様の処理手段
を備え、かつ、評価カスタマイズ手段110の代わりに
評価カスタマイズ手段140を備えるものである。
【0102】本形態では、ユーザに要約としてよい範囲
をテキスト上で指定させるため、第1の実施の形態に比
べてユーザの負担は大きい。しかし、ユーザが求める要
約結果により近いものを解データ(教師)とすることが
できるため、ユーザが所望する要約結果をより早く出力
できるように学習することができる。
【0103】〔第3の実施の形態〕図15に、第3の実
施の形態における本発明の処理装置の構成例を示す。図
15に示す自動要約処理装置50は、図1に示す自動要
約処理装置10の評価カスタマイズ手段110の代わり
に評価カスタマイズ手段150を備え、また他の処理手
段として、自動要約処理装置10を構成する処理手段と
同様の処理手段を備える。
【0104】評価カスタマイズ手段150は、要約表示
部151と、性質情報設定部152とを備える。
【0105】要約表示部151は、予め用意しておいた
テキスト・要約4の要約結果を表示装置(図15に図示
しない)に表示する手段である。
【0106】性質情報設定部152は、要約結果の評価
にかかわる複数の性質情報を生成し、性質情報ごとの評
価を設定する手段である。
【0107】性質情報とは、要約結果の評価を構成する
種々の性質に関する情報であり、例えば、短い文を重視
しているかどうかという情報(短文重視)、要約結果に
数量についての表現が含まれていることを重視している
かどうかという情報(数量表現重視)、要約結果に手法
についての表現が含まれていることを重視しているかど
うかという情報(手法重視)、要約結果の文体を重視し
ているかどうかという情報(文体重視)、要約結果の読
みやすさを重視しているかどうかという情報(読みやす
さ重視)などである。
【0108】評価カスタマイズ手段150は、機械学習
部122において要約結果の評価にかかわる複数の性質
をそれぞれ学習することができるように、ユーザが随時
必要となった評価にかかわる複数の性質情報を任意に設
定できるようにして、要約結果に対するユーザの評価を
複数の性質情報を用いて定義する。
【0109】本形態では、性質情報設定部152で設定
された性質情報の数に対応して解データ記憶部120を
用意し、各性質情報ごとに機械学習を行なう。したがっ
て、解−素性対抽出部121、機械学習部122、学習
結果データ記憶部123、要約候補−推定解対生成部1
26の各処理手段は、性質情報の数に対応して備えられ
る。
【0110】図16に、評価カスタマイズ処理の流れを
示す。
【0111】要約表示部151は、テキスト・要約4か
ら取り出した要約結果を表示する(ステップS41)。
性質情報設定部152は、表示した要約結果に対して複
数の性質情報の項目を表示し、ユーザに各項目の値や、
新規項目の設定などを促し、ユーザの入力を受け付ける
(ステップS42)。
【0112】図17および図18に、性質情報設定画面
の例を示す。性質情報設定画面では、複数の位置情報の
それぞれに対応してスライドバーが設けられている。ユ
ーザはそれぞれの性質情報のスライドバー上でスライド
ボタンを右側や左側など任意の位置を定めて性質情報ご
との評価を指定できる。例えば、ユーザは、表示された
要約結果に対して「短い文重視、数量表現重視、手法重
視、文体重視、読みやすさ重視」などの性質情報の項目
ごとに、それぞれどのくらいの評価になるかを、スライ
ドバー上でスライドボタンを移動させて設定する。図1
7および図18では、スライドバーの左端から右端に向
かって評価が高くなるように設定されているとする。ま
た、ユーザはスライドバーの横に任意の性質情報を入力
することにより、スライドバーが何を意味するかについ
て自由に定義できる。
【0113】要約表示部151が図4(A)に示す要約
結果r1を表示した場合に、図17に示すように、ユー
ザAは、要約結果r1が短い文なので「短い文重視」の
スライドボタンを右側へ、また数量に関する表現がある
ので「数量表現重視」のスライドボタンを右側へ、また
手法にふれていないので「手法重視」のスライドボタン
を左側へ、文体と読みやすさとはそれほど悪くないの
で、「文体重視」および「読みやすさ重視」のスライド
ボタンを右側へ位置させる。
【0114】また、要約表示部151が図4(B)に示
す要約結果r2を表示した場合に、ユーザAは、図18
に示すように、要約結果r2がそれほど短くないので、
「短い文重視」のスライドボタンを左側へ、その他の性
質情報は、まあまあよいので、その他の性質情報のスラ
イドボタンを右側へ移動させる。
【0115】そして、性質情報設定部152は、入力さ
れた性質情報ごとの値をそれぞれ解とし、その解とテキ
ストと要約結果とを事例として性質情報ごとの解データ
記憶部120に記憶する(ステップS43)。
【0116】以降、機械学習処理および自動要約処理の
流れは、図5に示す処理の流れとほぼ同様である。ここ
で、性質情報ごとに備えられた機械学習部122は、対
応する性質情報の解データ記憶部120に記憶された事
例を解データ(教師データ)として使用する。機械学習
部122は、それぞれの性質情報ごとに学習を行なう。
例えば、性質情報「短い文重視」については、各事例の
解は、事例c1(要約結果r1)では「解=最右側」、
事例c2(要約結果r2)では、「解=左側」という解
ができる。機械学習部122は、これらの解データを教
師データとして利用して、どういうときに短い文重視で
評価されるのかを学習していく。また、その他の性質情
報についても同様の学習を行なう。
【0117】本形態では、機械学習処理後、要約候補生
成部124は、入力されたテキスト2から所定の方法で
要約候補を生成し、素性抽出部125は、入力テキスト
2および要約候補から素性の集合を抽出する。
【0118】そして、各性質情報に対応する要約候補−
推定解対生成部126は、受け取った素性の集合の場合
にどのような解になりやすいかを学習結果データをもと
に推定し、要約候補と推定解との対(要約候補−推定解
対)127を生成する。例えば、要約候補−推定解対生
成部126は、複数の要約候補のそれぞれの推定解とそ
の確信度を学習結果データにもとづき算出して、それぞ
れの性質情報ごとの要約候補−推定解対127を生成す
る。
【0119】要約選択部128は、要約結果に対する評
価の性質情報をどの程度重視するかを設定したユーザ評
価設定情報7を受け付けて、要約候補−推定解対127
で各性質情報の評価の値を、ユーザ評価設定情報7と比
較して、最も似た要約候補−推定解対、もしくはユーザ
評価設定情報7に最も適した要約候補−推定解対を選択
し、その要約候補−推定解対127の要約候補を要約3
とする。
【0120】要約選択部128は、図17に示すような
性質情報設定画面を表示して、ユーザが現在必要な要約
結果の性質であるユーザ評価設定情報7を、性質情報の
各項目のスライドバー上のスライドボタンの位置を変更
して設定するように促してもよい。
【0121】例えば、「短い文重視」、「数量表現重
視」、「手法重視」のスライドボタンを最右側に移動さ
せ、「文体重視」、「読みやすさ重視」のスライドボタ
ンを最左側へ移動させる場合には、ユーザは、なるべく
短く、また、数量表現および手法は欠かさず、しかし、
文体や読みやすさは軽視するというような性質の評価に
適合する要約3を要求していることを意味するユーザ評
価設定情報7となる。
【0122】また、要約選択部128は、要約候補−推
定解対127の簡単な選択方法として、例えば以下の式
を利用して、すべての解の組合せの値Total _Score を
求めてもよい。
【0123】 Total _Score =a(短い文重視)×score(短い文重視) +a(数量表現重視)×score(数量表現重視) +a(手法重視) ×score(手法重視) +a(文体重視) ×score(文体重視) +a(読みやすさ重視) ×score(読みやすさ重視) ただし、a(X)はユーザが指定した性質情報Xのスラ
イドバーのスライドボタン位置から求まる値である。ス
ライドボタンがスライドバーの右側に位置するほど大き
な値を持つとしている。score(X)は学習結果デ
ータにもとづいて算出された性質情報Xの評価の値であ
る。要約選択部128は、この組合せ値Total_Score
が最も大きい要約候補−推定解対127を選択し、その
要約候補を要約3として出力する。
【0124】本形態では、機械学習部122で用いる要
約結果を表示させてユーザに評価させるという、第1の
実施の形態における処理に近い処理方法を採用した。し
かし、本形態では、第2の実施の形態における機械学習
の手法のように、ユーザにテキストから要約結果として
よいと思われる範囲を指定させた上で、さらに、ユーザ
に評価にかかわる複数の性質をスライドバーなどを用い
て評価させて、教師信号である解データを収集するよう
にしてもよい。かかる処理の場合には、同一ユーザであ
っても処理を行なう度に所望する要約のタイプが異なる
ような状況にも対処することが可能となる。また、同時
に複数の性質情報を学習することが可能であるため、ユ
ーザが評価(解)を与える際の処理負担も全体として軽
減することが可能となる。
【0125】本形態では、図19に示すような処理手段
の構成を持つ自動要約処理装置60としてもよい。図1
9の自動要約処理装置60は、図6に示す自動要約処理
装置20を構成する処理手段と同様の処理手段を備え、
かつ評価カスタマイズ手段110の代わりに評価カスタ
マイズ手段150を備えるものである。
【0126】自動要約処理装置60は、実際の機械学習
処理において、正例と負例の二種類の解(分類先)のみ
を考える機械学習手法を用いることにより、機械学習で
の過重な処理負担を回避することができる。
【0127】以上、本発明をその実施の態様により説明
したが、本発明はその主旨の範囲において種々の変形が
可能である。例えば、第1の実施の形態ないし第3の実
施の形態のいずれの形態をも組み合わせて実施すること
も可能である。
【0128】〔第4の実施の形態〕図20に、第4の実
施の形態における本発明の処理の構成例を示す。図20
に示す自動要約処理装置70は、評価カスタマイズ手段
110と、解データ記憶部120と、解−素性対抽出部
121と、機械学習部122と、学習結果データ記憶部
123と、素性抽出部125と、解推定部160と、評
価カスタマイズ手段140とを備える。
【0129】自動要約処理装置70の評価カスタマイズ
手段140、解データ記憶部120、解−素性対抽出部
121、機械学習部122、学習結果データ記憶部12
3、素性抽出部125および評価カスタマイズ手段14
0とは、図8に示す同一番号が付与された処理手段とほ
ぼ同様の処理を行う手段である。
【0130】解推定部160は、学習結果データ記憶部
123の学習結果データを参照して、素性抽出部125
から渡された素性の集合の場合に、どのような解になり
易いかを推定し、その推定解161を要約3とする手段
である。
【0131】本形態では、解データ記憶部120は、テ
キストを問題としテキストの要約結果を解とする解デー
タを記憶し、機械学習部122は、かかる解データから
抽出された解−素性対を用いて機械学習を行う。また、
素性抽出部125は、入力されたテキスト2の素性を抽
出して、解推定部160に渡す。
【0132】図21に、第4の実施の形態における機械
学習処理および自動要約処理の流れを示す。
【0133】解−素性対抽出部121は、解データ記憶
部120から、事例ごとに解と素性の集合との組を抽出
し(ステップS51)、次に、機械学習部122は、解
と素性の集合との組から、どのような素性の集合のとき
にどのような解になりやすいかを機械学習法により学習
し、学習結果を学習結果データ記憶部123に記憶する
(ステップS52)。なお、ステップS51、S52の
処理は、図5に示すステップS11、S12の処理と同
様である。
【0134】その後、要約を求めたいテキスト2が入力
されると(ステップS53)、素性抽出部125は、解
−素性対抽出部121とほぼ同様の処理によって、入力
したテキスト2から素性の集合を抽出し、解推定部16
0へ渡す(ステップS54)。そして、解推定部160
は、受け取った素性の集合の場合にどのような解になり
やすいかを、学習結果データをもとに推定し、その推定
解161を要約3とする(ステップS55)。
【0135】本形態では、テキストの要約結果を解とす
る解データを用いて機械学習を行い、その学習結果を参
照した解推定処理において要約とするべき推定解を直接
求めるようにする。
【0136】
【発明の効果】以上説明したように、本発明によれば、
ユーザは、機械学習の解データとされる要約結果に対す
る評価を任意に設定することができる。これにより、コ
ンピュータを用いた自動要約処理においても、一つの類
型で要約するのではなく、ユーザに特化した要約を行な
えることが可能となる。
【0137】また、同一人物であっても要約の評価が変
化することが考えられるが、本発明によれば、同一人物
であっても随時要約結果に対する評価を設定でき、新た
な解データを用いて機械学習し直すことにより、新しい
評価態度に合わせた要約を行なうことが可能となる。
【図面の簡単な説明】
【図1】第1の実施の形態における本発明の処理装置の
構成例を示す図である。
【図2】第1の実施の形態における評価カスタマイズ処
理の流れを示す図である。
【図3】対象となるテキストの例を示す図である。
【図4】要約結果の例を示す図である。
【図5】図1に示す処理装置における機械学習処理およ
び自動要約処理の流れを示す図である。
【図6】第1の実施の形態における本発明の処理装置の
別の構成例を示す図である。
【図7】図6に示す処理装置における機械学習処理およ
び自動要約処理の流れを示す図である。
【図8】第2の実施の形態における本発明の処理装置の
構成例を示す図である。
【図9】第2の実施の形態における評価カスタマイズ処
理の流れを示す図である。
【図10】表示されるテキストの例およびユーザAの指
定範囲の例を示す図である。
【図11】表示されるテキストの例およびユーザBの指
定範囲の例を示す図である。
【図12】表示されるテキストの例およびユーザCの指
定範囲の例を示す図である。
【図13】ユーザが指定した範囲の表示の例を示す図で
ある。
【図14】第2の実施の形態における本発明の処理装置
の別の構成例を示す図である。
【図15】第3の実施の形態における本発明の処理装置
の構成例を示す図である。
【図16】第3の実施の形態における評価カスタマイズ
処理の流れを示す図である。
【図17】性質情報設定画面の例を示す図である。
【図18】性質情報設定画面の例を示す図である。
【図19】第3の実施の形態における本発明の処理装置
の別の構成例を示す図である。
【図20】第4の実施の形態における本発明の処理装置
の構成例を示す図である。
【図21】図20に示す処理装置における機械学習処理
および自動要約処理の流れを示す図である。
【符号の説明】
10 自動要約処理装置 110 評価カスタマイズ手段 111 要約表示部 112 評価付与部 120 解データ記憶部 121 解−素性対抽出部 122 機械学習部 123 学習結果データ記憶部 124 要約候補生成部 125 素性抽出部 126 要約候補−推定解対生成部 127 要約候補−推定解対 128 要約選択部 130 解データ記憶部 131 素性−解対・素性−解候補対抽出部 132 機械学習部 133 学習結果データ記憶部 134 要約候補生成部 135 素性−解候補抽出部 136 要約候補−推定解対生成部 137 要約候補−推定解対 138 要約選択部 140 評価カスタマイズ手段 141 テキスト表示部 142 要約編集部 150 評価カスタマイズ手段 151 要約表示部 152 性質情報設定部 160 解推定部 161 推定解 2 テキスト 3 要約 4 テキスト・要約 5 テキスト 7 ユーザ評価設定情報

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 機械学習法によりテキストを自動要約す
    る処理で用いる解データを編集する解データ編集処理装
    置であって、 テキストの要約結果を表示装置に表示する要約表示処理
    手段と、 前記要約結果に対する評価の入力を受け付けて前記要約
    結果の評価とする評価付与処理手段と、 前記テキストおよび前記要約結果を問題とし前記評価を
    解とする解データを出力する解データ出力処理手段とを
    備えることを特徴とする解データ編集処理装置。
  2. 【請求項2】 機械学習法によりテキストを自動要約す
    る処理で用いる解データを編集する解データ編集処理装
    置であって、 テキストを表示装置に表示するテキスト表示処理手段
    と、 前記テキストからユーザ指定部分の入力を受け付け、前
    記指定部分を前記要約結果とする要約編集処理手段と、 前記テキストおよび前記要約結果を問題とし所定の解を
    付与した前記解データを出力する解データ出力処理手段
    とを備えることを特徴とする解データ編集処理装置。
  3. 【請求項3】 機械学習法によりテキストを自動要約す
    る処理で用いる解データを編集する解データ編集処理装
    置であって、 テキストを表示装置に表示するテキスト表示処理手段
    と、 前記テキストからユーザ指定部分の入力を受け付け、前
    記指定部分を前記要約結果とする要約編集処理手段と、 前記テキストを問題とし前記要約結果を含む所定の解を
    付与した前記解データを出力する解データ出力処理手段
    とを備えることを特徴とする解データ編集処理装置。
  4. 【請求項4】 請求項2または請求項3のいずれかに記
    載の解データ編集処理装置において、 前記要約編集処理手段は、さらに、前記指定部分の語句
    の変更の入力を受け付け、変更後の前記指定部分を前記
    要約結果とすることを特徴とする解データ編集処理装
    置。
  5. 【請求項5】 機械学習法によりテキストを自動要約す
    る処理で用いる解データを編集する解データ編集処理装
    置であって、 テキストの要約結果を表示装置に表示する要約表示処理
    手段と、 前記要約結果に対する評価の性質ごとに、評価の入力を
    受け付けて、前記入力評価を前記性質評価とする評価付
    与処理手段と、 評価の性質ごとに、前記テキストおよび前記要約結果を
    問題とし前記性質評価を解とする解データを出力する解
    データ出力処理手段とを備える、 ことを特徴とする解データ編集処理装置。
  6. 【請求項6】 機械学習法によりテキストを自動要約す
    る処理で用いる解データを編集する解データ編集処理方
    法であって、 テキストの要約結果を表示装置に表示する要約表示処理
    過程と、 前記要約結果に対する評価の入力を受け付けて前記要約
    結果の評価とする評価付与処理過程と、 前記テキストおよび前記要約結果を問題とし前記評価を
    解とする解データを出力する解データ出力処理過程とを
    備えることを特徴とする解データ編集処理方法。
  7. 【請求項7】 機械学習法によりテキストを自動要約す
    る処理で用いる解データを編集する解データ編集処理方
    法であって、 テキストを表示装置に表示するテキスト表示処理過程
    と、 前記テキストからユーザ指定部分の入力を受け付け、前
    記指定部分を前記要約結果とする要約編集処理過程と、 前記テキストおよび前記要約結果を問題とし所定の解を
    付与した前記解データを出力する解データ出力処理過程
    とを備えることを特徴とする解データ編集処理方法。
  8. 【請求項8】 機械学習法によりテキストを自動要約す
    る処理で用いる解データを編集する解データ編集処理方
    法であって、 テキストを表示装置に表示するテキスト表示処理過程
    と、 前記テキストからユーザ指定部分の入力を受け付け、前
    記指定部分を前記要約結果とする要約編集処理過程と、 前記テキストを問題とし前記要約結果を含む所定の解を
    付与した前記解データを出力する解データ出力処理過程
    とを備えることを特徴とする解データ編集処理方法。
  9. 【請求項9】 請求項7または請求項8に記載の解デー
    タ編集処理方法において、 前記要約編集処理過程は、さらに、前記指定部分の語句
    の変更の入力を受け付け、変更後の前記指定部分を前記
    要約結果とする処理を含むことを特徴とする解データ編
    集処理方法。
  10. 【請求項10】 機械学習法によりテキストを自動要約
    する処理で用いる解データを編集する解データ編集処理
    方法であって、 テキストの要約結果を表示装置に表示する要約表示処理
    過程と、 前記要約結果に対する評価の性質ごとに、評価の入力を
    受け付けて、前記入力評価を前記性質評価とする評価付
    与処理過程と、 評価の性質ごとに、前記テキストおよび前記要約結果を
    問題とし前記性質評価を解とする解データを出力する解
    データ出力処理過程とを備えることを特徴とする解デー
    タ編集処理方法。
  11. 【請求項11】 テキストおよび前記テキストの要約結
    果を問題とし前記要約結果の評価を解とする解データを
    用いた機械学習法によりテキストを自動要約する自動要
    約処理装置であって、 前記解データに対するユーザ入力を受け付け、前記入力
    をもとに変更した解データを記憶する解データ記憶手段
    と、 前記解データから前記問題の素性の集合と前記解との組
    を抽出し、当該組から、どのような素性のときにどのよ
    うな解となりやすいかを学習し、学習結果を学習結果デ
    ータ記憶手段に記憶する機械学習処理手段と、 入力テキストから要約候補を生成する要約候補生成処理
    手段と、 前記入力テキストおよび前記要約候補から素性の集合を
    抽出し、当該素性の集合からどのような解となりやすい
    かを前記学習結果データをもとに推定して、要約候補と
    推定解との対を生成する要約候補−推定解対生成処理手
    段と、 前記要約候補−推定解対から前記推定解の確信度が最高
    の対を選択し、当該対の要約候補を要約とする要約選択
    処理手段とを備えることを特徴とする自動要約処理装
    置。
  12. 【請求項12】 テキストおよび前記テキストの要約結
    果を問題とし前記要約結果の評価を解とする解データを
    用いた機械学習法によりテキストを自動要約する自動要
    約処理装置であって、 前記解データに対するユーザ入力を受け付け、前記入力
    をもとに変更した解データを記憶する解データ記憶手段
    と、 前記解データから、解もしくは解候補と前記問題の素性
    の集合との組を抽出し、抽出した前記組を教師信号とし
    て、どのような解もしくは解候補と素性の集合のとき
    に、正例である確率または負例である確率となるかを学
    習し、学習結果データ記憶手段に記憶する機械学習処理
    手段と、 入力テキストから要約候補を生成する要約候補生成処理
    手段と、 前記入力テキストおよび前記要約候補から、素性の集合
    と解の候補との組を抽出し、当該素性の集合と解の候補
    の組の場合に、正例もしくは負例である確率をを前記学
    習結果データをもとに推定して、要約候補と推定解との
    対を生成する要約候補−推定解対生成処理手段と、 前記要約候補−推定解対から前記推定解の正例の確率が
    確信度が最高の対を選択し、当該対の要約候補を要約と
    する要約選択処理手段とを備えることを特徴とする自動
    要約処理装置。
  13. 【請求項13】 請求項11または請求項12のいずれ
    かに記載の自動要約処理装置において、 前記解データ記憶手段は、前記解データの解が前記要約
    結果に対する性質ごとの評価である解データを記憶する
    ものであり、 前記要約選択処理手段は、前記品質ごとの評価の組合せ
    情報の入力を受け付け、前記組合せ情報に最も類似する
    推定解を持つ前記要約候補−推定解対を選択し、当該対
    の要約候補を要約とすることを特徴とする自動要約処理
    装置。
  14. 【請求項14】 テキストを問題とし前記テキストの要
    約結果を解とする解データを用いた機械学習法によりテ
    キストを自動要約する自動要約処理装置であって、 前記解データに対するユーザ入力を受け付け、前記入力
    をもとに変更した解データを記憶する解データ記憶手段
    と、 前記解データから前記問題の素性の集合と前記解との組
    を抽出し、当該組から、どのような素性のときにどのよ
    うな解となりやすいかを学習し、学習結果を学習結果デ
    ータ記憶手段に記憶する機械学習処理手段と、 入力テキストから素性の集合を抽出し、当該素性の集合
    からどのような解となりやすいかを前記学習結果データ
    をもとに推定する解推定処理手段とを備えることを特徴
    とする自動要約処理装置。
  15. 【請求項15】 テキストおよび前記テキストの要約結
    果を問題とし前記要約結果の評価を解とする解データを
    用いた機械学習法によりテキストを自動要約する自動要
    約処理方法であって、 前記解データに対するユーザ入力を受け付け、前記入力
    をもとに変更した解データを記憶する解データ記憶手段
    にアクセスする解データアクセス処理過程と、 前記解データから前記問題の素性の集合と前記解との組
    を抽出し、当該組から、どのような素性のときにどのよ
    うな解となりやすいかを学習し、学習結果を学習結果デ
    ータ記憶手段に記憶する機械学習処理過程と、 入力テキストから要約候補を生成する要約候補生成処理
    過程と、 前記入力テキストおよび前記要約候補から素性の集合を
    抽出し、当該素性の集合からどのような解となりやすい
    かを前記学習結果データをもとに推定して、要約候補と
    推定解との対を生成する要約候補−推定解対生成処理過
    程と、 前記要約候補−推定解対から前記推定解の確信度が最高
    の対を選択し、当該対の要約候補を要約とする要約選択
    処理過程とを備えることを特徴とする自動要約処理方
    法。
  16. 【請求項16】 テキストおよび前記テキストの要約結
    果を問題とし前記要約結果の評価を解とする解データを
    用いた機械学習法によりテキストを自動要約する自動要
    約処理方法であって、 前記解データに対するユーザ入力を受け付け、前記入力
    をもとに変更した解データを記憶する解データ記憶手段
    にアクセスする解データアクセス処理過程と、 前記解データから、解もしくは解候補と前記問題の素性
    の集合との組を抽出し、抽出した前記組を教師信号とし
    て、どのような解もしくは解候補と素性の集合のとき
    に、正例である確率または負例である確率となるかを学
    習し、学習結果データ記憶手段に記憶する機械学習処理
    過程と、 入力テキストから要約候補を生成する要約候補生成処理
    過程と、 前記入力テキストおよび前記要約候補から、素性の集合
    と解の候補との組を抽出し、当該素性の集合と解の候補
    の組の場合に、正例もしくは負例である確率をを前記学
    習結果データをもとに推定して、要約候補と推定解との
    対を生成する要約候補−推定解対生成処理過程と、 前記要約候補−推定解対から前記推定解の正例の確率が
    確信度が最高の対を選択し、当該対の要約候補を要約と
    する要約選択処理過程とを備えることを特徴とする自動
    要約処理方法。
  17. 【請求項17】 請求項15または請求項16のいずれ
    かに記載の自動要約処理方法において、 前記解データアクセス処理過程でアクセスする解データ
    記憶手段は、前記解データの解が前記要約結果に対する
    性質ごとの評価である解データを記憶するものであり、 前記要約選択処理過程は、前記品質ごとの評価の組合せ
    情報の入力を受け付け、前記組合せ情報に最も類似する
    推定解を持つ前記要約候補−推定解対を選択し、当該対
    の要約候補を要約とすることを特徴とする自動要約処理
    方法。
  18. 【請求項18】 テキストを問題とし前記テキストの要
    約結果を解とする解データを用いた機械学習法によりテ
    キストを自動要約する自動要約処理方法であって、 前記解データに対するユーザ入力を受け付け、前記入力
    をもとに変更した解データを記憶する解データ記憶手段
    にアクセスする解データアクセス処理過程と、 前記解データから前記問題の素性の集合と前記解との組
    を抽出し、当該組から、どのような素性のときにどのよ
    うな解となりやすいかを学習し、学習結果を学習結果デ
    ータ記憶手段に記憶する機械学習処理過程と、 入力テキストから素性の集合を抽出し、当該素性の集合
    からどのような解となりやすいかを前記学習結果データ
    をもとに推定する解推定処理過程とを備えることを特徴
    とする自動要約処理方法。
JP2002045925A 2002-02-22 2002-02-22 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法 Pending JP2003248676A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002045925A JP2003248676A (ja) 2002-02-22 2002-02-22 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
US10/369,588 US7120613B2 (en) 2002-02-22 2003-02-21 Solution data edit processing apparatus and method, and automatic summarization processing apparatus and method
CNB031054609A CN100419733C (zh) 2002-02-22 2003-02-21 解决方案数据编辑处理及自动概括处理装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002045925A JP2003248676A (ja) 2002-02-22 2002-02-22 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004168944A Division JP4187213B2 (ja) 2004-06-07 2004-06-07 自動要約処理装置および自動要約処理方法

Publications (1)

Publication Number Publication Date
JP2003248676A true JP2003248676A (ja) 2003-09-05

Family

ID=27750608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002045925A Pending JP2003248676A (ja) 2002-02-22 2002-02-22 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法

Country Status (3)

Country Link
US (1) US7120613B2 (ja)
JP (1) JP2003248676A (ja)
CN (1) CN100419733C (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332208B2 (en) 2007-09-05 2012-12-11 Sony Corporation Information processing apparatus, information processing method, and program
JP2013097723A (ja) * 2011-11-04 2013-05-20 Nippon Telegr & Teleph Corp <Ntt> テキスト要約装置、方法及びプログラム
JP2016062181A (ja) * 2014-09-16 2016-04-25 日本電信電話株式会社 重みベクトル学習装置、要約生成装置、方法、及びプログラム
JP2018156473A (ja) * 2017-03-17 2018-10-04 ヤフー株式会社 解析装置、解析方法、およびプログラム
JP2019053558A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 学習装置、学習方法、学習プログラム、第1のモデルおよび第2のモデル
JP2021047817A (ja) * 2019-09-20 2021-03-25 富士ゼロックス株式会社 出力装置、及び出力プログラム
JP7476578B2 (ja) 2020-03-06 2024-05-01 富士フイルムビジネスイノベーション株式会社 学習装置及びプログラム

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7475334B1 (en) * 2000-01-19 2009-01-06 Alcatel-Lucent Usa Inc. Method and system for abstracting electronic documents
JP3682529B2 (ja) * 2002-01-31 2005-08-10 独立行政法人情報通信研究機構 要約自動評価処理装置、要約自動評価処理プログラム、および要約自動評価処理方法
US8428934B2 (en) * 2010-01-25 2013-04-23 Holovisions LLC Prose style morphing
US7363214B2 (en) * 2003-08-08 2008-04-22 Cnet Networks, Inc. System and method for determining quality of written product reviews in an automated manner
WO2005115559A2 (en) * 2004-05-17 2005-12-08 Aurilab, Llc. Interactive language learning system and method
US20050261889A1 (en) * 2004-05-20 2005-11-24 Fujitsu Limited Method and apparatus for extracting information, and computer product
US7698339B2 (en) * 2004-08-13 2010-04-13 Microsoft Corporation Method and system for summarizing a document
US7827029B2 (en) * 2004-11-30 2010-11-02 Palo Alto Research Center Incorporated Systems and methods for user-interest sensitive note-taking
US7801723B2 (en) * 2004-11-30 2010-09-21 Palo Alto Research Center Incorporated Systems and methods for user-interest sensitive condensation
EP1672483A1 (de) * 2004-12-20 2006-06-21 Siemens Aktiengesellschaft Erfassung von Daten in einem Datenverarbeitungssystem
US7401077B2 (en) * 2004-12-21 2008-07-15 Palo Alto Research Center Incorporated Systems and methods for using and constructing user-interest sensitive indicators of search results
US7574349B2 (en) * 2006-03-29 2009-08-11 Xerox Corporation Statistical language-model based system for detection of missing attachments
WO2007146100A2 (en) * 2006-06-07 2007-12-21 Cnet Networks, Inc. Evaluative information system and method
US7725442B2 (en) * 2007-02-06 2010-05-25 Microsoft Corporation Automatic evaluation of summaries
US7925496B1 (en) 2007-04-23 2011-04-12 The United States Of America As Represented By The Secretary Of The Navy Method for summarizing natural language text
US8600990B2 (en) * 2008-03-31 2013-12-03 Oracle International Corporation Interacting methods of data extraction
US20110093263A1 (en) * 2009-10-20 2011-04-21 Mowzoon Shahin M Automated Video Captioning
US8620591B2 (en) * 2010-01-14 2013-12-31 Venture Gain LLC Multivariate residual-based health index for human health monitoring
US20130014008A1 (en) * 2010-03-22 2013-01-10 Niranjan Damera-Venkata Adjusting an Automatic Template Layout by Providing a Constraint
CN102385861B (zh) * 2010-08-31 2013-07-31 国际商业机器公司 一种用于从语音内容生成文本内容提要的系统和方法
US9317595B2 (en) * 2010-12-06 2016-04-19 Yahoo! Inc. Fast title/summary extraction from long descriptions
US8600961B2 (en) * 2012-02-16 2013-12-03 Oracle International Corporation Data summarization integration
US8839033B2 (en) 2012-02-29 2014-09-16 Oracle International Corporation Data summarization recovery
US20150205786A1 (en) * 2012-07-31 2015-07-23 Nec Corporation Problem situation detection device, problem situation detection method and problem situation detection-use program
US10778618B2 (en) * 2014-01-09 2020-09-15 Oath Inc. Method and system for classifying man vs. machine generated e-mail
US9904916B2 (en) * 2015-07-01 2018-02-27 Klarna Ab Incremental login and authentication to user portal without username/password
US10387882B2 (en) 2015-07-01 2019-08-20 Klarna Ab Method for using supervised model with physical store
CN106326435A (zh) * 2016-06-02 2017-01-11 北京赛思信安技术股份有限公司 一种对大数据可视化自动解析和装配的系统及方法
WO2018101694A1 (en) 2016-11-29 2018-06-07 Samsung Electronics Co., Ltd. Electronic apparatus and method for summarizing content
US10127323B1 (en) * 2017-07-26 2018-11-13 International Business Machines Corporation Extractive query-focused multi-document summarization
CN110188886B (zh) * 2018-08-17 2021-08-20 第四范式(北京)技术有限公司 对机器学习过程的数据处理步骤进行可视化的方法和系统
US11256867B2 (en) * 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN114154461A (zh) * 2020-09-08 2022-03-08 第四范式(北京)技术有限公司 一种文本数据的处理方法、装置及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256054A (ja) * 1988-08-19 1990-02-26 Matsushita Electric Ind Co Ltd 文書作成装置
JPH02297134A (ja) * 1989-02-28 1990-12-07 Toshiba Corp 文書要約支援装置
JPH07244663A (ja) * 1994-03-04 1995-09-19 Nippon Telegr & Teleph Corp <Ntt> 文書情報要旨部分の抽出方法とその装置
JPH10207891A (ja) * 1997-01-17 1998-08-07 Fujitsu Ltd 文書要約装置およびその方法
JP2001344260A (ja) * 2000-06-05 2001-12-14 Open Door:Kk Hpコメント評価システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2783558B2 (ja) * 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
US5638543A (en) * 1993-06-03 1997-06-10 Xerox Corporation Method and apparatus for automatic document summarization
US5778397A (en) * 1995-06-28 1998-07-07 Xerox Corporation Automatic method of generating feature probabilities for automatic extracting summarization
JP3001047B2 (ja) * 1997-04-17 2000-01-17 日本電気株式会社 文書要約装置
JP3614648B2 (ja) * 1998-03-13 2005-01-26 富士通株式会社 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
US6317708B1 (en) * 1999-01-07 2001-11-13 Justsystem Corporation Method for producing summaries of text document

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256054A (ja) * 1988-08-19 1990-02-26 Matsushita Electric Ind Co Ltd 文書作成装置
JPH02297134A (ja) * 1989-02-28 1990-12-07 Toshiba Corp 文書要約支援装置
JPH07244663A (ja) * 1994-03-04 1995-09-19 Nippon Telegr & Teleph Corp <Ntt> 文書情報要旨部分の抽出方法とその装置
JPH10207891A (ja) * 1997-01-17 1998-08-07 Fujitsu Ltd 文書要約装置およびその方法
JP2001344260A (ja) * 2000-06-05 2001-12-14 Open Door:Kk Hpコメント評価システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
村田真樹: "機械学習手法を用いた日本語格解析−教師信号借用型と非借用型、さらには併用型−", 電子情報通信学会技術研究報告, vol. 101, no. 190, CSNG200301515003, 17 July 2001 (2001-07-17), pages 15 - 22, ISSN: 0000731505 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332208B2 (en) 2007-09-05 2012-12-11 Sony Corporation Information processing apparatus, information processing method, and program
JP2013097723A (ja) * 2011-11-04 2013-05-20 Nippon Telegr & Teleph Corp <Ntt> テキスト要約装置、方法及びプログラム
JP2016062181A (ja) * 2014-09-16 2016-04-25 日本電信電話株式会社 重みベクトル学習装置、要約生成装置、方法、及びプログラム
JP2018156473A (ja) * 2017-03-17 2018-10-04 ヤフー株式会社 解析装置、解析方法、およびプログラム
JP2019053558A (ja) * 2017-09-15 2019-04-04 ヤフー株式会社 学習装置、学習方法、学習プログラム、第1のモデルおよび第2のモデル
JP2021047817A (ja) * 2019-09-20 2021-03-25 富士ゼロックス株式会社 出力装置、及び出力プログラム
JP7476578B2 (ja) 2020-03-06 2024-05-01 富士フイルムビジネスイノベーション株式会社 学習装置及びプログラム

Also Published As

Publication number Publication date
CN100419733C (zh) 2008-09-17
US20030163790A1 (en) 2003-08-28
CN1439979A (zh) 2003-09-03
US7120613B2 (en) 2006-10-10

Similar Documents

Publication Publication Date Title
JP2003248676A (ja) 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
KR102577514B1 (ko) 텍스트 창작 방법, 텍스트 창작 장치, 전자 기기 및 저장 매체
Luiz et al. A feature-oriented sentiment rating for mobile app reviews
Moussa et al. A survey on opinion summarization techniques for social media
JP4622589B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US8428934B2 (en) Prose style morphing
CN105426360B (zh) 一种关键词抽取方法及装置
US20130275120A1 (en) Process for a Signified Correct Contextual Meaning Sometimes Interspersed with Complementary Related Trivia
JP2005157524A (ja) 質問応答システムおよび質問応答処理方法
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
CN111324771B (zh) 视频标签的确定方法、装置、电子设备及存储介质
CN101526938B (zh) 文档处理装置
Şahin To augment or not to augment? A comparative study on text augmentation techniques for low-resource NLP
Arumugam et al. Hands-On Natural Language Processing with Python: A practical guide to applying deep learning architectures to your NLP applications
Zhang et al. Macsum: Controllable summarization with mixed attributes
JP4106470B2 (ja) 解データ編集処理装置および処理方法
JP4187213B2 (ja) 自動要約処理装置および自動要約処理方法
Sazzed Stylometric and semantic analysis of demographically diverse non-native english review data
JP2007140639A (ja) データ表示装置、データ表示方法およびデータ表示プログラム
JP7443667B2 (ja) 検索装置、辞書検索プログラム、辞書検索方法
Zulkhazhav et al. Kazakh text summarization using fuzzy logic
JP6451151B2 (ja) 質問応答装置、質問応答方法、プログラム
JP7439429B2 (ja) 検索装置、検索方法、検索プログラム
Arnold Impacts of Predictive Text on Writing Content
Castillo et al. Author profiling using a graph enrichment approach

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060718