JP5604465B2 - テキスト要約装置、方法、及びプログラム - Google Patents

テキスト要約装置、方法、及びプログラム Download PDF

Info

Publication number
JP5604465B2
JP5604465B2 JP2012033244A JP2012033244A JP5604465B2 JP 5604465 B2 JP5604465 B2 JP 5604465B2 JP 2012033244 A JP2012033244 A JP 2012033244A JP 2012033244 A JP2012033244 A JP 2012033244A JP 5604465 B2 JP5604465 B2 JP 5604465B2
Authority
JP
Japan
Prior art keywords
text
sentences
content
score
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012033244A
Other languages
English (en)
Other versions
JP2013171330A (ja
Inventor
仁 西川
努 平尾
俊朗 牧野
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012033244A priority Critical patent/JP5604465B2/ja
Publication of JP2013171330A publication Critical patent/JP2013171330A/ja
Application granted granted Critical
Publication of JP5604465B2 publication Critical patent/JP5604465B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はテキスト要約装置、方法、及びプログラムに関する。
近年、電子化されたテキストが大量に流通するようになってきたことを背景として、それらのテキストに記述されている情報を迅速に把握するために、コンピュータ等の機械によってテキストを要約させる(要約を生成させる)技術に対するニーズが高まっている。
現在、機械によって一つ以上のテキストを要約させる技術では、一般に、要約の対象となるテキストから、その内容を代表していると思われる文(重要文)、或いは、そのような文の集合(重要文集合)を一つ以上選び出し、それらを連結することで要約が生成されることが多い。
要約の対象となるテキストから重要文集合を選び出す際には、まず、入力されたテキストを文に分解し、それぞれの文にスコアを与える。そして、与えられた要約サイズを満たし、要約を構成する文のスコアの和が最大となるように文を選ぶ手法が提案されている(例えば、非特許文献1参照)。要約を構成する文のスコアの和を最大化する際には、動的計画法を用いることで、スコアを最大化する文の組み合わせを効率的に探索することができる。
平尾努、鈴木潤、磯崎秀樹、「最適化問題としての文書要約」、人工知能学会論文誌、Vol.24、No.2、pp.223−231、2009.
しかし、二つ以上のテキストから一つの要約を作成しようとする場合、個別の文にスコアを与え、それらの和を最大化するように要約を生成すると、冗長な要約が生成される場合がある。これは入力された二つのテキストに類似した文が含まれていた場合、それらは同じようなスコアを得る可能性が高く、結果としていずれも要約に含まれる可能性が高いからである。類似した文が含まれる要約、すなわち冗長な要約は、冗長な情報が要約中に含まれることによって、他の情報が要約から脱落する場合がある、という問題がある。
また、冗長な情報が要約に含まれることを防ぐためには、一例として、要約に同じユニグラムやバイグラムが2回以上含まれてはいけないといった、冗長性を削減する制約を加えることが考えられる。しかし、そのような制約を加えた場合、動的計画法で問題を解くことができなくなる。そのため、最適解を得るためには、整数計画問題として定式化を行い、汎用的なソルバーで問題を解くといったことをしなければならず、求解に多大な時間を要することになる。
本発明は上記事実を考慮して成されたもので、冗長性が削減された要約を高速に得ることができるテキスト要約装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明のテキスト要約装置は、複数の文を含むテキストを受け付ける受付手段と、前記受付手段で受け付けたテキストに含まれる複数の文から要約を構成する文として選択される文の部分集合に対するスコア、及び前記要約に含まれる内容語毎の数及び重みを示すスコアを用いた目的関数であって、前記要約に含まれる内容語の数に関する制約に対するペナルティを、前記要約に含まれる内容語毎の数及び重みを示すスコアに対して、ラグランジュ乗数として加えた目的関数を、動的計画法により最大化させるように、前記複数の文を含むテキストから前記文の部分集合を選択することにより、前記テキストの要約を生成する生成手段と、を含んで構成されている。
本発明のテキスト要約装置によれば、受付手段が、複数の文を含むテキストを受け付ける。そして、生成手段が、受付手段で受け付けたテキストに含まれる複数の文から要約を構成する文として選択される文の部分集合に対するスコア、及び要約に含まれる内容語毎の数及び重みを示すスコアを用いた目的関数であって、前記要約に含まれる内容語の数に関する制約に対するペナルティを、前記要約に含まれる内容語毎の数及び重みを示すスコアに対して、ラグランジュ乗数として加えた目的関数を、動的計画法により最大化させるように、複数の文を含むテキストから文の部分集合を選択することにより、テキストの要約を生成する。
このように、要約を構成する文の部分集合を選択するための目的関数に、内容語の数に関する制約に対するペナルティをラグランジュ乗数として加えることで、要約に含まれる内容語の数を制限しつつ、動的計画法を用いることが可能となるため、冗長性が削減された要約を高速に得ることができる。
また、前記生成手段は、選択された前記文の部分集合に含まれる内容語の数が予め定めた上限値を超える場合には、前記ペナルティを付与する方向に前記ラグランジュ乗数を更新し、前記内容語の数が前記上限値以下の場合には、前記ペナルティを減少させる方向に前記ラグランジュ乗数を更新しながら、前記目的関数を最大化する処理を繰り返すことができる。
また、本発明のテキスト要約方法は、受付手段と、生成手段とを含むテキスト要約装置におけるテキスト要約方法であって、前記受付手段は、複数の文を含むテキストを受け付け、前記生成手段は、前記受付手段で受け付けたテキストに含まれる複数の文から要約を構成する文として選択される文の部分集合に対して与えられるスコア、及び前記要約に含まれる内容語毎の数及び重みを示すスコアの少なくとも一方を用いた目的関数であって、前記要約に含まれる内容語の数に関する制約に対するペナルティをラグランジュ乗数として加えた目的関数を、動的計画法により最大化させるように、前記複数の文を含むテキストから前記文の部分集合を選択することにより、前記テキストの要約を生成する方法である。
また、本発明のテキスト要約プログラムは、コンピュータを、上記のテキスト要約装置を構成する各手段として機能させるためのプログラムである。
本発明のテキスト要約装置、方法、及びプログラムによれば、要約を構成する文の部分集合を選択するための目的関数に、内容語の数に関する制約に対するペナルティをラグランジュ乗数として加えることで、要約に含まれる内容語の数を制限しつつ、動的計画法を用いることが可能となるため、冗長性が削減された要約を高速に得ることができる、という効果を有する。
本実施の形態のテキスト要約装置の機能的構成を示すブロック図である。 入力されるテキストの一例を示す図である。 パラメタデータベースの一例を示す図である。 本実施の形態のテキスト要約装置におけるテキスト要約処理ルーチンの内容を示すフローチャートである。 要約生成処理ルーチンの内容を示すフローチャートである。 ラグランジュ乗数λ更新処理ルーチンの内容を示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
本実施の形態に係るテキスト要約装置10は、CPUと、RAMと、後述するテキスト要約処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。
このコンピュータは、機能的には、図1に示すように、要約の対象となるテキストを受け付けるテキスト受付部11と、受け付けたテキストの各文及び各内容語に関するスコアを与えるためのパラメタを格納したパラメタデータベース12と、テキスト受付部11で受け付けた要約対象のテキストとパラメタデータベース12に格納されたパラメタとを入力として、要約を生成する要約生成部13と、生成された要約を出力する要約出力部14とを含んだ構成で表すことができる。
テキスト受付部11は、要約の対象となるテキストを受け付ける。入力されるテキストの形式の一例を図2に示す。図2の例は、文に分割され、更に形態素解析されたテキストが入力として与えられた場合である。図2の表の各行がそれぞれ一形態素に対応しており、各形態素は、表記、品詞、読み、及び標準形の情報を有する。なお、この形態素解析結果は一例であり、他の情報を含んでもよい。
パラメタデータベース12には、要約対象の各文の重要度を計算するためのパラメタが格納される。パラメタデータベース12の一例を図3に示す。一例として、パラメタデータベース12には、後述するベクトルv及びベクトルwの値が格納される。ベクトルvの各要素は、例えば、要約対象のテキストを構成する文集合のそれぞれの文の重要度を示し、重要度としては、対応する文の言語尤度などを用いることができる。ベクトルwの各要素は、例えば、要約対象のテキストを構成する文集合に含まれる各内容語及びその重みからなる。例えば、内容語「道路」を含んでいるという特徴の重みは−0.03であるということを示している。
なお、図3の例のように、それぞれの文や内容語に対して直接スコアを定義するのではなく、それぞれの文や内容語に対して素性関数を定義し、その素性関数と機械学習等で予め求めたパラメタとの内積を計算することで、文や内容語の重みを求めることもできる。また、ベクトルwの各要素に対応するものとして、内容語だけでなく、入力文書に含まれるユニグラムやバイグラムなどを用いることもできる。
パラメタデータベース12は、ROMまたはHDDの所定の記憶領域に記憶される。
要約生成部13は、テキスト受付部11で受け付けた要約対象のテキスト、及びパラメタデータベース12に格納されたパラメタを入力として、受け付けたテキストの要約を生成する。具体的には、要約対象のテキストが、文分割済のn文の文集合からなり、また、m個の異なる内容語を含んでいるとする。なお、上述したように内容語を用いることは一例であって、他に内容語のバイグラムや、全ての語彙のユニグラムやバイグラムなどを用いてもよい。
上記のような要約対象のテキストに対して、一例として、下記(1)式〜(5)式に示す要約モデルを考える。

(1)式は目的関数であり、この目的関数を最大化するように、要約対象のテキストを構成する文集合から文の部分集合を選び出すことによって、要約を生成する。(1)式第1項はベクトルvとベクトルxとの内積であり、要約を構成する文の部分集合に対して与えられるスコアである。n次元のベクトルvの各要素は、要約対象のテキストを構成する各文のスコアを格納する。文のスコアとしては、例えば言語尤度などを利用することができ、パラメタデータベース12から取得される。
(1)式第2項は、ベクトルwとベクトルzとの内積であり、要約を構成する内容語の集合に対して与えられるスコアである。m次元のベクトルwの各要素は、要約対象のテキストに含まれる各内容語のスコアを格納する。内容語のスコアは、パラメタデータベース12から取得される。
(2)式の制約が示すように、ベクトルxはn次元のバイナリベクトルであり、要約に文iが含まれるときx=1となり、含まれないときはx=0となるn個の決定変数からなる。従って、ベクトルvとベクトルxとの内積により、要約を構成する文の部分集合のスコアが与えられる。また、(3)式の制約が示すように、ベクトルzはm次元のベクトルであり、0から最大rまでの自然数Nを要素とするベクトルである。要約に内容語jが1つ含まれるときz=1となり、1つも含まれないときはz=0となる。従って、ベクトルwとベクトルzとの内積により、要約を構成する内容語の集合のスコアが与えられる。それぞれの内容語が要約にr個までしか含まれないようにするこの制約によって、要約の冗長性を削減することができる。なお、全ての内容語に一律にr個以内という制約をかけるのではなく、内容語jについてはr個以内までというように、内容語毎に個別に要約に含まれてよい数を制約として与えることもできる。
また、(4)式の制約は、要約長の制限を示している。ベクトルlはn次元のベクトルであり、それぞれの文の長さを格納している。ベクトルlとベクトルxとの内積によって要約の長さを得ることができ、要約の長さがKを越えてはならないことを制約(4)式は示している。また、(5)式の制約は、文と文が含む内容語との包含関係を示す制約である。m×n行列Aの各要素ajiは、文iに含まれる内容語jの個数を示す。例えば、文iが内容語jを2つ含んでいる場合には、aji=2となり、内容語jを1つも含んでいない場合には、aji=0となる。この制約(5)によって、要約を構成する文と、それらの文が含む内容語の個数との整合性が保たれる。
なお、要約生成部13の入力に、文短縮などの処理を行った文の集合を加えてもよく、文短縮の方法の一例としては、非特許文献2(平尾努、鈴木潤、磯崎秀樹、「構文情報に依存しない文短縮手法」、情報処理学会論文誌データベース(TOD)、Vol.2、No.1、pp.1−−9、2009.)記載の方法を用いることができる。この場合、文のスコアvとして文短縮器が出力するスコアを用いることもできる。
また、(1)式の第1項を加味せず、単に要約が含む内容語の集合だけに対するスコアのみを目的関数として要約を生成することもできる。逆に、(1)式の第2項を加味せず、第1項のみで要約を生成することもできる。
ここで、上記(1)式〜(5)式で表される要約モデルは、制約(3)が障害となって動的計画法で解くことができない。そこで、本実施の形態では、制約(3)を緩和し目的関数に組み込んだ下記(6)式〜(10)式の要約モデルを考える。

(6)式に含まれるラグランジュ乗数λは、m次元のベクトルであり、制約(8)が破られている際にペナルティを与える。例えば、内容語zが制約(8)で定められたrより多く要約に含まれている場合、λに正の値を与え、wからλを引くことによって、内容語zに対してペナルティを与える。これにより、内容語zが要約に含まれづらくなり、結果として制約(8)が満たされる可能性が高まる。
要約出力部14は、要約生成部13で生成された要約を出力する。
次に、本実施の形態のテキスト要約装置10に作用について説明する。要約対象のテキストがテキスト要約装置10に入力されると、CPUがROMに記憶されたテキスト要約処理ルーチンを実行するためのプログラムを実行する。以下に、図4を参照して、テキスト要約処理ルーチンについて説明する。
ステップ100で、要約の対象となるテキストを受け付ける。次に、ステップ200で、後述する要約生成処理を実行して、上記ステップ100で受け付けたテキストの要約を構成する文の部分集合を示すベクトルxを出力する。次に、ステップ300で、上記ステップ200で出力されたベクトルxが示す文の部分集合で構成される要約を出力して、処理を終了する。
ここで、図5を参照して、上記ステップ200で実行される要約生成処理ルーチンについて説明する。要約生成処理ルーチンでは、上記(6)式の目的関数を最大化するような文の部分集合を選択することにより、要約を生成する。
まず、ステップ202で、予め定めた文と内容語との包含関係を表す行列A、及び要約長Kを取得する。また、上記ステップ100で取得したテキストから、各文の長さを格納したベクトルl、内容語の数m、及び文の数nを取得する。また、パラメタデータベース12から、文のスコアを格納したベクトルv、及び内容語のスコアを格納したベクトルwを取得する。
次に、ステップ204で、予め定めたラグランジュ乗数λを更新する際の更新幅を指定するパラメタα、及び各内容語が要約に含まれても良い個数の上限を指定したベクトルrを取得する。
次に、ステップ206で、ラグランジュ乗数を格納するベクトルλ、各文のスコアvと各内容語のスコアwとの両方を加味した各文のスコアを格納するベクトルs、要約に含まれる文を示すベクトルx、要約に含まれる内容語及びその数を示すベクトルzを初期化(λ=0、s=0、x=0、z=0)する。
次に、ステップ208で、上記ステップ202で取得した文と内容語との包含関係を表す行列A、内容語の数m、文の数n、文のスコアを格納したベクトルv、及び内容語のスコアを格納したベクトルwを用いて、各文のスコアvと各内容語のスコアwとの両方を加味した各文のスコアを格納するベクトルsを求める。
次に、ステップ210で、動的計画法を用いて、所定の要約長K以内での最適解xを得る。このアルゴリズムとしては、例えば、非特許文献1記載のアルゴリズムを利用することができる。
次に、ステップ212で、上記ステップ210で得た最適解xによって得られる要約に含まれる内容語及びその数を格納したベクトルzを得る。
次に、ステップ214で、後述するラグランジュ乗数λ更新処理を実行する。
次に、ステップ216で、最適解を取得するための繰り返し処理を終了するか否かを判定する。この判定は、最適解が得られたときに終了と判定してもよいし、所定回数繰り返しても最適解が得られない場合を想定して、予め何回まで処理を繰り返すか指定しておき、その回数を上回った際に繰り返し処理を終了すると判定してもよい。終了しない場合には、ステップ208へ戻って処理を繰り返す。終了する場合には、ステップ218へ移行し、上記ステップ210で取得した最適解xを、要約を構成する文の部分集合を示すベクトルxとして出力し、図4の処理へリターンする。
次に、図6を参照して、上記ステップ214で実行されるラグランジュ乗数λ更新処理について説明する。
ステップ2142で、上記ステップ202で取得した内容語の数m、上記ステップ204で取得したラグランジュ乗数λの更新幅を指定するパラメタα、及び各内容語が要約に含まれても良い個数の上限を指定したベクトルr、現時点でのラグランジュ乗数を格納するベクトルλ、並びに上記ステップ212で取得された内容語及びその数を格納したベクトルzを入力として受け取る。
次に、ステップ2144で、変数jに1をセットする。次に、ステップ2146で、内容語jの個数zがrを上回るか否かを判定する。z>rの場合には、(8)式の制約を満たしていないため、ステップ2148へ移行して、パラメタαに従ってペナルティを与えるようにλを更新する(λ←λ+α)。一方、z≦rの場合には、ステップ2150へ移行して、パラメタαに従ってペナルティを減少させるようにλを更新する(λ←λ−α)。
次に、ステップ2152で、変数jがmとなったか否かを判定することにより、全ての内容語について、すなわちベクトルzの全ての要素について上記処理を終了したか否かを判定する。j≠mの場合には、ステップ2154へ移行して、変数jを1インクリメントして、ステップ2146へ戻る。j=mとなった場合には、ステップ2156へ移行する。
ステップ2156では、各要素が更新されたラグランジュ乗数λを出力して、リターンする。
なお、ここで述べた方法とは別の、ラグランジュ緩和問題を解くアルゴリズムを用いて要約を生成することもできる。
以上説明したように、本実施の形態のテキスト要約装置によれば、冗長性を削減する制約をラグランジュ緩和した問題を動的計画法によって繰り返し解き、ラグランジュ乗数を劣勾配法によって求めることによって、冗長性が削減された要約を高速に生成することができる。
また、本実施の形態では、パラメタデータベース12が、テキスト要約装置を構成するコンピュータに設けられたROMまたはHDDの所定の記憶領域に記憶されている態様を説明したが、本発明はこれに限定されるものではない。パラメタデータベース12は、通信回線を介してコンピュータと接続された別のコンピュータに設けられた記憶部に記憶されていてもよい。この場合、通信回線を介して前記別のコンピュータからパラメタデータベース12を受信するようにするとよい。
また、本実施の形態では、CPUがテキスト要約プログラムを実行することで、コンピュータがテキスト要約装置10として機能する態様を説明したが、本発明はこれに限定されるものではなく、図1に示した各機能ブロックは、それぞれハードウェアで構成することも可能である。
また、本実施の形態では、テキスト要約プログラムがROMに予め記憶(インストール)されている態様を説明したが、本発明に係るテキスト要約プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。
10 テキスト要約装置
11 テキスト受付部
12 パラメタデータベース
13 要約生成部
14 要約出力部

Claims (5)

  1. 複数の文を含むテキストを受け付ける受付手段と、
    前記受付手段で受け付けたテキストに含まれる複数の文から要約を構成する文として選択される文の部分集合に対するスコア、及び前記要約に含まれる内容語毎の数及び重みを示すスコアを用いた目的関数であって、前記要約に含まれる内容語の数に関する制約に対するペナルティを、前記要約に含まれる内容語毎の数及び重みを示すスコアに対して、ラグランジュ乗数として加えた目的関数を、動的計画法により最大化させるように、前記複数の文を含むテキストから前記文の部分集合を選択することにより、前記テキストの要約を生成する生成手段と、
    を含むテキスト要約装置。
  2. 前記生成手段は、選択された前記文の部分集合に含まれる内容語の数が予め定めた上限値を超える場合には、前記ペナルティを付与する方向に前記ラグランジュ乗数を更新し、前記内容語の数が前記上限値以下の場合には、前記ペナルティを減少させる方向に前記ラグランジュ乗数を更新しながら、前記目的関数を最大化する処理を繰り返す請求項1記載のテキスト要約装置。
  3. 受付手段と、生成手段とを含むテキスト要約装置におけるテキスト要約方法であって、
    前記受付手段は、複数の文を含むテキストを受け付け、
    前記生成手段は、前記受付手段で受け付けたテキストに含まれる複数の文から要約を構成する文として選択される文の部分集合に対するスコア、及び前記要約に含まれる内容語毎の数及び重みを示すスコアを用いた目的関数であって、前記要約に含まれる内容語の数に関する制約に対するペナルティを、前記要約に含まれる内容語毎の数及び重みを示すスコアに対して、ラグランジュ乗数として加えた目的関数を、動的計画法により最大化させるように、前記複数の文を含むテキストから前記文の部分集合を選択することにより、前記テキストの要約を生成する
    テキスト要約方法。
  4. 前記生成手段は、選択された前記文の部分集合に含まれる内容語の数が予め定めた上限値を超える場合には、前記ペナルティを付与する方向に前記ラグランジュ乗数を更新し、前記内容語の数が前記上限値以下の場合には、前記ペナルティを減少させる方向に前記ラグランジュ乗数を更新しながら、前記目的関数を最大化する処理を繰り返す請求項3記載のテキスト要約方法。
  5. コンピュータを、請求項1または請求項2記載のテキスト要約装置を構成する各手段として機能させるためのテキスト要約プログラム。
JP2012033244A 2012-02-17 2012-02-17 テキスト要約装置、方法、及びプログラム Expired - Fee Related JP5604465B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012033244A JP5604465B2 (ja) 2012-02-17 2012-02-17 テキスト要約装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012033244A JP5604465B2 (ja) 2012-02-17 2012-02-17 テキスト要約装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013171330A JP2013171330A (ja) 2013-09-02
JP5604465B2 true JP5604465B2 (ja) 2014-10-08

Family

ID=49265240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012033244A Expired - Fee Related JP5604465B2 (ja) 2012-02-17 2012-02-17 テキスト要約装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5604465B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7035893B2 (ja) * 2018-08-06 2022-03-15 日本電信電話株式会社 要約文算出装置、要約文算出方法、及びプログラム
CN109508371B (zh) * 2018-11-07 2022-03-15 中山大学 一种结合集束搜索间隔最大化约束的文本摘要生成方法
CN115795025A (zh) * 2022-11-29 2023-03-14 华为技术有限公司 一种摘要生成方法及其相关设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3310632B2 (ja) * 1999-06-24 2002-08-05 建生 河村 非線形計画法による最適潮流計算システム
JP2008242612A (ja) * 2007-03-26 2008-10-09 Kyushu Institute Of Technology 文書要約装置、その方法及びプログラム
JP5523929B2 (ja) * 2010-05-21 2014-06-18 日本電信電話株式会社 テキスト要約装置、テキスト要約方法及びテキスト要約プログラム

Also Published As

Publication number Publication date
JP2013171330A (ja) 2013-09-02

Similar Documents

Publication Publication Date Title
JP7155758B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP5235918B2 (ja) テキスト要約装置、テキスト要約方法及びテキスト要約プログラム
Babii et al. Modeling vocabulary for big code machine learning
JP6312467B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2017076281A (ja) 単語埋込学習装置、テキスト評価装置、方法、及びプログラム
CN103608805B (zh) 辞典产生装置及方法
JP2019082931A (ja) 検索装置、類似度算出方法、およびプログラム
Tomašic et al. Implementation of a slogan generator
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
JP5604465B2 (ja) テキスト要約装置、方法、及びプログラム
JP5441937B2 (ja) 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム
Zhang et al. Hash subgraph pairwise kernel for protein-protein interaction extraction
JP2020030753A (ja) 単語符号化装置、解析装置、言語モデル学習装置、方法、及びプログラム
JP2016133956A (ja) 形態素解析モデル生成装置、形態素解析モデル生成方法、及び、プログラム
JP5462819B2 (ja) 基本木獲得装置、構文解析装置、方法、及びプログラム
JP2015084047A (ja) 文集合作成装置、文集合作成方法および文集合作成プログラム
JP2015153261A (ja) 対話文生成装置、対話文生成方法およびプログラム
JP5523929B2 (ja) テキスト要約装置、テキスト要約方法及びテキスト要約プログラム
JP4405542B2 (ja) 音素モデルをクラスタリングする装置、方法およびプログラム
JP2014225158A (ja) 文書要約装置、方法、及びプログラム
JP4745417B2 (ja) 情報検索装置およびプログラム
JP5990124B2 (ja) 略語生成装置、略語生成方法、及びプログラム
JP4478042B2 (ja) 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置
Zeng et al. Lexicon expansion for latent variable grammars
JP5575075B2 (ja) 代表的文書選択装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140825

R150 Certificate of patent or registration of utility model

Ref document number: 5604465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees