JP5235918B2 - テキスト要約装置、テキスト要約方法及びテキスト要約プログラム - Google Patents
テキスト要約装置、テキスト要約方法及びテキスト要約プログラム Download PDFInfo
- Publication number
- JP5235918B2 JP5235918B2 JP2010010906A JP2010010906A JP5235918B2 JP 5235918 B2 JP5235918 B2 JP 5235918B2 JP 2010010906 A JP2010010906 A JP 2010010906A JP 2010010906 A JP2010010906 A JP 2010010906A JP 5235918 B2 JP5235918 B2 JP 5235918B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- score
- text
- feature
- text summarization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
テキスト要約装置100は、入力された1つ以上の文から構成される1つ以上のテキストから少なくとも1つ以上の文を選択して、入力テキストに対応する要約を生成する。図1及び2を用いて実施例1に係るテキスト要約装置100を説明する。テキスト要約装置100は、記憶部103、素性要素抽出部113、内容性スコア計算部115、連接スコア計算部117、重要文順列探索部119を有する。テキスト入力部131、要約長決定部133やテキスト出力部135を備えてもよい。
<記憶部103>
記憶部103は、2つの素性要素の順序を考慮した組合せである素性に対する重みパラメタと、文を構成する文要素に対する文要素スコアを予め記憶しておく。各データの生成方法については、後述する。さらに、記憶部103は入出力される各データや演算過程の各データを、逐一、格納・読み出しする。それにより各演算処理が進められる。但し、必ずしも記憶部103に記憶しなければならないわけではなく、各部間で直接データを受け渡してもよい。
<素性要素抽出部113>
例えば、テキスト入力部131(例えば、記録媒体の入力インターフェースやLANアダプタ等)からデータが入力され、素性要素抽出部113は、入力されたテキストデータから素性要素を抽出する(s113)。例えば、素性要素として、内容語(名詞、動詞、形容詞)を用いる場合には、形態素分析部113aにおいて形態素解析を行い、テキストデータを形態素単位に分割し、内容語抽出部113bにおいて内容語を抽出する。図3は、形態素データの一例であり、各行がそれぞれ一形態素に対応し、形態素の表記、品詞、読み、標準形等の情報を有する。なお、<EOS>は文境界を示す。
<内容性スコア計算部115>
内容性スコア計算部115は、各文に含まれる文要素に対する文要素スコアを用いて、各文の内容性スコアを求める(s115)。例えば、文要素として、素性要素を用いる場合には(本実施例では素性要素は内容語)、素性要素抽出部113の出力を、入力とし、内容性スコア計算部115は、入力される内容語に基づき、記憶部103からその内容語に対する文要素スコアを取得し、文に含まれる全ての内容語に対する文要素スコアの和を求める。この和を内容性スコアとし、以下の式で表すことができる。但し、Content(s)は文sの内容性スコアを、Weight(p)は文sが含む内容語pの文要素スコアを表す。
各内容語の文要素スコアは、予め記憶部103に記憶しておく。テキスト要約装置100は、例えば、図示しない文要素スコア計算部を有し、文要素スコアを求める。文要素スコアとして、例えば要約の対象とするテキスト中において該単語が出現する回数などを用いることができる。
<連接スコア計算部117>
連接スコア計算部117は、素性要素抽出部で抽出した素性要素と重みパラメタwを用いて、2つの文の連接スコアを求める(s117)。2つの文の連接スコアは、その2つの文の繋がりの良さを示す値である。
ここで、wは上述した重みパラメタであり、φ(si,sj)は文siと文sjの繋がりを表すバイナリベクトル(以下「素性ベクトル」という)であり、Tは転置を表す。wTφ(si,sj)はwTとφ(si,sj)の内積である。重みパラメタwは、一例として後述する方法によって事前に計算され、記憶部103に格納され、要約を行う際には記憶部103から呼び出される。
(素性ベクトル生成部117a)
素性ベクトル生成部117aは、2つの文si、sjが含む素性要素の直積集合の各要素を該2つの文の素性とし、求めた素性に対応する次元を1とし、他の次元を0とする素性ベクトルφ(si,sj)を生成する。
(計算部117b)
計算部117bは、重みパラメタwと素性ベクトルφ(si,sj)の内積を、2つの文の連接スコアConnect(sj|si)として求める。つまり、重みパラメタと素性ベクトルを用いて、式(2)の計算を行う。
(3つ以上の文の連接スコアの算出部)
連接スコア計算部117は、2つの文の連接スコアConnect(sj|si)を用いて、3つ以上の文の並びの連接スコアwTΦ(x,y)を求める(s117)。この場合、連接スコアとは、3つ以上の文の集合の全体的な繋がりの良さを表す。xは与えられた文の集合を表し、yは文の並びを現す。
[重みパラメタの算出方法]
重みパラメタwの算出方法について説明する。ここで、人間によって書かれたテキストの文の並びを正解として、その文の並びを再現することができる重みパラメタwがよいパラメタであるという仮定を置く。つまり、文の集合が与えられたとき、それらを読みやすく並べることができるパラメタwは、人手で書かれたあるテキストに含まれる文の集合が与えられたとき、それを元の並びに復元できる、あるいは元の並びに近い並びに並べることができるという仮定を置く。この仮定の下、人手によって書かれたテキスト集合から、パラメタwを推定する。重みパラメタwは、一例としてテキスト集合から図5及び図6に示すアルゴリズムで計算することができる(参考文献1参照)。
[参考文献1]Michael Collins, “Discriminative Training Methods for Hidden Markov Models: Theory and Experiments with Perceptron Algorithms”, In Proceedings of the 2002 Conference on Empirical Methods on Natural Language Processing (EMNLP), Association for Computational Linguistics, 2002, Volume 10, pp.1 - 8
テキスト要約装置100は、例えば図示しない重みパラメタ算出部を有し、重みパラメタを求める。重みパラメタ算出部は、Q個のxq(文の集合)と各文の集合に対する正しい文の並びyqの組からなる訓練データτを入力され、図5に示すアルゴリズムは重みパラメタwを学習する。但し、q=1,2,…,Qである。具体的には、Q個の訓練事例を一つずつ取り上げ、現在のwを用いてxq内の文を並べる(図5の4行目)。現在の重みパラメタwを用いて得られる、可能な文の並びのうち連接スコアwTΦ(x,y)が最大の文の並びy’を求める(図5の4行目のargmax操作)。argmax操作の詳細については後述する。yq≠y’の場合(つまり、連接スコアwTΦ(x,y)が最大の文の並びと正しい文の並びが異なる場合)、現在の重みパラメタwでは、正しい並びを再現することができなかったことになる。その時は重みパラメタwを更新し、正しく文を並び替えることができるようにする(図5の5行目)。現在のパラメタwで正しい並びを再現することができたのならば、重みパラメタは更新しない(図5の6行目)。
(argmax操作)
argmax操作は、文の集合xqに含まれる文を用いて可能な文の並びのうち連接スコアが最大となる文の並びy’を求める。これはいわゆる巡回セールスマン問題であり、厳密解を短時間で求めることが難しい。例えば、Q!通りの文の並びから最も連接スコアの高い文の並びを求める必要があり、Qの値が大きくなるに従い、指数的に計算量も増大する。
[参考文献2]Michael Held and Richard M. Karp, “A dynamic programming approach to sequencing problems”, In Journal of the Society for Industrial and Applied Mathematics (SIAM), 1962, Vol.10, No.1, pp.196-210
Sは並び替えの対象とする文の集合であり、うちs0を文書の頭を示すもの、s(Q+1)を文書の末尾を示すものとする。すなわち、s0から出発し、s1からsQまでの文を必ず一度通過し、s(Q+1)に到着する全ての経路のうち最もスコアが高い経路を探索する問題となる。MはSに含まれる全ての文の間の連接スコアを格納した行列である。例えばMk,jは文skとsjの連接スコアを示し、即ちwTφ(sk,sj)に相当する。Hi(C,sk)は、既にC⊆Sを通過し、i時点で文skを追加した仮説および該仮説のスコアである。H*は最も文の並びの連接スコアの高い経路である。
<重要文順列探索部119>
重要文順列探索部119は、内容性スコアと連接スコアの和が、最大値となる、または、最大値の近似値となる文の並びを探索する(s119)。
<効果>
本実施例のテキスト要約装置100によれば、内容性スコアが高く、かつ読みやすい重要文の並びを見つけ出すことができ、要約として十分な情報を保持することができ、単に重要文を選択しその後にそれらの文を並び替えた要約よりも読みやすい要約を作成することができる。
<変形例>
テキスト入力部は、キーボードや通信回線を介してテキストデータを入力されてもよい。
<シミュレーション結果>
本シミュレーションでは、テキスト要約装置100を用いて作成した要約を内容性と可読性の観点から評価する。シミュレーションのため、ある個人が特定の飲食店を利用した感想が記述された1つ以上のテキスト(以下、評価文書という)に対してテキスト要約装置100を用いて要約を行う。文要素として、評価情報を用いて、内容性スコアを以下のように定義する。
[参考文献3]今村賢治. 「系列ラベリングによる準話し言葉の日本語係り受け解析」, 言語処理学会第13 回年次大会発表論文集, 2006, pp.548-551
評価表現は、「おいしい」「美しい」などの評価の核となる表現である。評価表現は、参考文献4記載の評価表現辞書を用いて特定する。
[参考文献4]浅野久子,平野徹,小林のぞみ,松尾義博, 「Web上の口コミを分析する評判情報インデクシング技術」, NTT技術ジャーナル,2008, Vol.20, No.6, pp.12-15
評価表現を含む文節が特定されたら、その文節にガ格やハ格、モ格で係る文節、連体修飾の場合はその文節が係る文節を評価属性として抽出する。評価極性は評価表現毎に評価表現辞書に登録されているため、評価属性と評価極性の組が得られる。
(内容性の評価結果)
内容性の評価にはROUGEを用いる(参考文献5参照)。
[参考文献5]Chin-Yew Lin, "ROUGE: A Package for Automatic Evaluation of Summaries", In Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics (ACL) Workshop: Text Summarization Branches Out, 2004, pp. 74-81
本シミュレーションではROUGE-2、ROUGE-SU4、ROUGE-SU9を利用した。評価に際しては評価文書を4名の作業者に要約させ、各店舗に4つの参照要約を付与した。システム要約のROUGEスコアは4つの参照要約とのROUGEスコアの平均を取ったものである。ROUGEに用いるNグラムは、ROUGE-2、ROUGE-SU4、ROUGE-SU9何れも全ての単語を用いてNグラムを計算した。また、Nグラムを計算する際には、参照要約、システム要約共に文に分割した後にNグラムを計算するのではなく、それぞれを1つの長い文と見なしてNグラムを計算した。これによって、ROUGE-SU4やROUGE-SU9といった2つの単語の長距離の並びを考慮する尺度を用いて文間の単語の並びを考慮することができるようになる。本シミュレーションでは以下の4種類の手法を評価する。
(1)表層
文のスコアとして内容語のスコアの和を用いる。内容語のスコアは、要約の対象とする文書セット中の単語頻度とした。重要文を選ぶ際にはMMRを用いて冗長性を排除しつつ貪欲に文を選択する(参考文献6参照)。
[参考文献6]Jaime Carbonell and Jade Goldstein, "The use of MMR, diversity-based reranking for reordering documents and producing summaries", In Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (SIGIR), 1998, pp. 335-356
MMRの類似度にはコサインを用い、新しく選ぶ文の重要度と、既に選んだ文との類似度のトレードオフを制御するパラメタは0.5とした。これをBaselineとする。
(2)表層+組合せ最適化(連接性スコアなし)
Baselineと同様に内容語のスコアを用いる。重要文を選ぶ際にはMMRによる貪欲法ではなく組合せ最適化を用い、スタック・デコーダを用いて探索を行った(参考文献7参照)。
[参考文献7]Wen-tau Yih, Joshua Goodman, Lucy Vanderwende and Hisami Suzuki, "Multi-Document Summarization by Maximizing Informative Content-Words", In Proceeding of the 20th International Joint Conference on Artificial Intelligence (ICJAI), 2007, pp. 1776-1782
冗長性の削減のため、各内容語は1度しか要約のスコアに加算されないようにした。これをMethod1とする。スタックのサイズは10とした。
(3)評価情報+組合せ最適化(連接性スコアなし)
式(4)においてλ=0とした。探索にはMethod1同様スタック・デコーダを利用した。これをMethod2とする。
(4)評価情報+組合せ最適化(連接性スコアあり)
本実施例を用いた手法である。連接性スコアの重みパラメタwは以下のようにして学習する。まず100店舗を20店舗にランダムに分割する。要約を生成する店舗が含まれていない80店舗に紐付く文書と、100店舗とは別の、150店舗に紐付く評価文書を収集し、合計230店舗分の文書からwを学習する。λは開発セットで調整し、6000とし、ビーム幅bは100とした。これをMethod3とする。
結果を以下に示す。
全ての尺度において、Baseline、Method1、Method2、Method3の順にスコアが向上するが、Humanには及ばない。ウィルコクソンの符号順位検定によれば、Baselineに対し他の全ての手法は有意にROUGEスコアが向上している。
(可読性の評価結果)
可読性は被験者実験にて評価した。前述の100店舗に紐付く評価文書に対し3種類の方法で要約を生成し、計300のシステム要約を用意した。10名の被験者を用意し、1人の被験者に30のシステム要約を評価させた。評価方法は提示されたシステム要約に対し5段階の評価(1点から5点)を与えるものである。被験者には、実験前に要約の品質の評価基準を提示し、評価基準に従って要約を評価するように指示した。また、被験者には要約を生成した手法は通知されない。比較の対象とするシステム要約は以下の3種類である。
(1)文を選んだ後、文番号順に並び替え
内容性評価におけるMethod2を用いて文を選んだ後、文が抽出された文書の投稿日時が新しく、かつ文書において先頭に出現する文が前になるように並べ替える。これをMethod2とする。
(2)文を選んだ後、連接性スコアを用いて並び替え
内容性評価におけるMethod2を用いて文を選んだ後、前述した連接性スコアを用いて文を並び替える。これをMethod2+とする。
(3)順列を探索
本実施例記載の提案手法である。文を選んだ後にそれらを並び替えるのではなく、最初から順列を探索する。これをMethod3とする。評価の結果を表3に示す。
Method2、Method2+、Method3の順に可読性が向上した。ウィルコクソンの符号順位検定にて検定を行ったところ、Method2とMethod2+に有意差は見られず、Method2とMethod3はp<0.10で有意であった。このことから、まず文を選んだ後に文を並び替えるという方法では必ずしも可読性は向上せず、最初から文の並びを考慮した場合には可読性が向上すると考えられる。
<ハードウェア構成>
図11は、本実施例におけるテキスト要約装置100のハードウェア構成を例示したブロック図である。図11に例示するように、この例のテキスト要約装置100は、それぞれCPU(Central Processing Unit)11、入力部12、出力部13、補助記憶装置14、ROM(Read Only Memory)15、RAM(Random Access Memory)16及びバス17を有している。
<プログラム構成>
上述のように、補助記憶装置14には、本実施例のテキスト要約装置100の各処理を実行するための各プログラムが格納される。テキスト要約プログラムを構成する各プログラムは、単一のプログラム列として記載されていてもよく、また、少なくとも一部のプログラムが別個のモジュールとしてライブラリに格納されていてもよい。
<ハードウェアとプログラムとの協働>
CPU11は、読み込まれたOSプログラムに従い、補助記憶装置14に格納されている上述のプログラムや各種データをRAM16に展開する。そして、このプログラムやデータが書き込まれたRAM16上のアドレスがCPU11のレジスタ11cに格納される。CPU11の制御部11aは、レジスタ11cに格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM16上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部11bに順次実行させ、その演算結果をレジスタ11cに格納していく。
図1及び図12を用いて実施例2に係るテキスト要約装置200を説明する。テキスト要約装置100とは、連接スコア計算部217の構成及び記憶部203の記憶するデータが異なる。
<連接スコア計算部217>
連接スコア計算部217は、素性ベクトル生成部117aを有さず、計算部217bのみを備え、連接スコアを非特許文献3記載の方法を用いても計算する。その場合、一例として、連接スコアは以下のように定義できる。
103,203 記憶部
113 素性要素抽出部
115 内容性スコア計算部
117,217 連接スコア計算部
119 重要文順列探索部
Claims (10)
- 入力されるテキストを要約するテキスト要約装置であって、
2つの素性要素の順序を考慮した組合せである素性に対する重みパラメタと、文を構成する文要素に対する文要素スコアを記憶する記憶部と、
入力されるテキストから素性要素を抽出する素性要素抽出部と、
各文に含まれる文要素に対する文要素スコアを用いて、各文の内容性スコアを求める内容性スコア計算部と、
前記素性要素抽出部で抽出した素性要素と前記重みパラメタを用いて、文の連接スコアを求める連接スコア計算部と、
前記内容性スコアと前記連接スコアの和が、最大値となる、または、最大値の近似値となる文の並びを探索する重要文順列探索部とを有すること、
を特徴とするテキスト要約装置。 - 請求項1記載のテキスト要約装置であって、
前記重要文順列探索部は、文の並びを探索する際に、文の並びの仮説に対し、前記入力されるテキストに含まれまだ前記仮説に追加されていない一つの文を前記仮説に追加することで前記仮説を一つ以上展開し、文の並びの仮説に最後に追加した文が同じであって、かつ、順序は関係なく前記仮説に含まれる文が同じである仮説が複数存在する場合、前記内容性スコアと前記連接スコアの和が最も高い仮説を除く全ての仮説を破棄すること、
を特徴とするテキスト要約装置。 - 請求項1または2記載のテキスト要約装置であって、
前記重要文順列探索部は、文の並びを探索する際に、文の並びの仮説に対し、前記入力されるテキストに含まれまだ前記仮説に追加されていない一つの文を前記仮説に追加することで前記仮説を一つ以上展開し、仮説のうち、前記内容性スコアと前記連接スコアの和が高い所定数の仮説のみを展開すること、
を特徴とするテキスト要約装置。 - 請求項1から3の何れかに記載のテキスト要約装置であって、
前記連接スコア計算部は、2つの文が含む素性要素の直積集合の各要素を該2つの文の素性とし、求めた素性に対応する次元を1とし、他の次元を0とする素性ベクトルを生成する素性ベクトル生成部と、
前記重みパラメタと前記素性ベクトルの内積を、2つの文の連接スコアとして求める計算部を備えること、
を特徴とするテキスト要約装置。 - 請求項4記載のテキスト要約装置であって、
前記重みパラメタは、文の集合xqとその文の集合の正しい並びyqの組からなる学習用データτを用いて、算出され、
文の集合xqに対し、その時点の重みパラメタを用いて連接スコアの和が最大値、または、最大値の近似値となる文の並びy’を求め、yqとy’が異なる場合には、yqとy’を用いて重みパラメタを更新すること、
を特徴とするテキスト要約装置。 - 請求項5記載のテキスト要約装置であって、
連接スコアの和が最大値、または、最大値の近似値となる文の並びy’を求める際に、文の並びの仮説に対し、前記集合x q に含まれまだ前記仮説に追加されていない一つの文を追加することで前記仮説を一つ以上展開し、仮説のうち、前記連接スコアの和が高い所定数の仮説のみを展開し、さらに、文の並びの仮説に最後に追加した文が同じであって、かつ、順序は関係なく前記仮説に含まれる文が同じである仮説が複数存在する場合、前記連接スコアの和が最も高い仮説を除く全ての仮説を破棄すること、
を特徴とするテキスト要約装置。 - 請求項1から3の何れかに記載のテキスト要約装置であって、
前記重みパラメタは、学習用データτを用いて算出され、文sjのm番目の素性要素fjmが、文siのk番目の素性要素fikが与えられた状態で出現する条件付き確率p(fjm|fik)であり、
前記連接スコア計算部は、2つの文の素性要素fjm、fikの直積集合(si,sj)の、各条件付き確率p(fjm|fik)の総積を、直積集合の濃度で正規化し、連接スコアを求めること、
を特徴とするテキスト要約装置。 - 請求項1から7の何れかに記載のテキスト要約装置であって、
文要素スコアは、文要素スコア学習用のテキスト集合に含まれる文要素を用いて予め求められ、
学習用テキスト集合内に、多い文要素ほど重要である場合には、その数cntが大きいほど文要素スコアが大きくなるように文要素スコアを算出し、学習用テキスト集合内に、多い文要素ほど重要でない場合には、その数cntが大きいほど文要素スコアが小さくなるように文要素スコアを算出すること、
を特徴とするテキスト要約装置。 - テキスト要約装置を用いて、入力されるテキストを要約するテキスト要約方法であって、
前記テキスト要約装置に、2つの素性要素の順序を考慮した組合せである素性に対する重みパラメタと、文を構成する文要素に対する文要素スコアを予め記憶しておき、
前記テキスト要約装置が、入力されるテキストから素性要素を抽出する素性要素抽出ステップと、
前記テキスト要約装置が、各文に含まれる文要素に対する文要素スコアを用いて、各文の内容性スコアを求める内容性スコア計算ステップと、
前記テキスト要約装置が、前記素性要素抽出ステップで抽出した素性要素と前記重みパラメタを用いて、文の連接スコアを求める連接スコア計算ステップと、
前記テキスト要約装置が、前記内容性スコアと前記連接スコアの和が、最大値となる、または、最大値の近似値となる文の並びを探索する重要文順列探索ステップとを有すること、
を特徴とするテキスト要約方法。 - 請求項1から8の何れかに記載のテキスト要約装置として、コンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010010906A JP5235918B2 (ja) | 2010-01-21 | 2010-01-21 | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010010906A JP5235918B2 (ja) | 2010-01-21 | 2010-01-21 | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011150515A JP2011150515A (ja) | 2011-08-04 |
JP5235918B2 true JP5235918B2 (ja) | 2013-07-10 |
Family
ID=44537433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010010906A Active JP5235918B2 (ja) | 2010-01-21 | 2010-01-21 | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5235918B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2851772C (en) * | 2011-10-14 | 2017-03-28 | Yahoo! Inc. | Method and apparatus for automatically summarizing the contents of electronic documents |
JP5638503B2 (ja) * | 2011-11-04 | 2014-12-10 | 日本電信電話株式会社 | テキスト要約装置、方法及びプログラム |
JP5623369B2 (ja) * | 2011-11-04 | 2014-11-12 | 日本電信電話株式会社 | テキスト要約装置、方法及びプログラム |
JP5702744B2 (ja) * | 2012-02-08 | 2015-04-15 | 日本電信電話株式会社 | 文書要約装置及び方法及びプログラム |
CN104216934B (zh) * | 2013-09-29 | 2018-02-13 | 北大方正集团有限公司 | 一种知识抽取方法及系统 |
JP6565262B2 (ja) * | 2015-03-27 | 2019-08-28 | 富士通株式会社 | 短縮文生成装置、方法、及びプログラム |
CN111507090A (zh) * | 2020-02-27 | 2020-08-07 | 平安科技(深圳)有限公司 | 摘要提取方法、装置、设备及计算机可读存储介质 |
CN111930931B (zh) * | 2020-07-20 | 2024-05-24 | 桂林电子科技大学 | 一种摘要评价方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000112967A (ja) * | 1998-10-02 | 2000-04-21 | Nippon Telegr & Teleph Corp <Ntt> | 記事要約装置および記事要約処理方法および当該方法を記述したプログラムを記録した記録媒体 |
-
2010
- 2010-01-21 JP JP2010010906A patent/JP5235918B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011150515A (ja) | 2011-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5235918B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
KR102371167B1 (ko) | 데이터 아이템을 성긴 분포 표현으로 매핑하는 방법 및 시스템 | |
Allahyari et al. | Automatic topic labeling using ontology-based topic models | |
KR20160026892A (ko) | 논팩토이드형 질의 응답 시스템 및 방법 | |
KR20130056207A (ko) | 관계 정보 확장 장치, 관계 정보 확장 방법, 및 프로그램 | |
US20190317986A1 (en) | Annotated text data expanding method, annotated text data expanding computer-readable storage medium, annotated text data expanding device, and text classification model training method | |
Jafariakinabad et al. | Style-aware neural model with application in authorship attribution | |
CN110020005B (zh) | 一种病历中主诉和现病史中症状匹配方法 | |
JP2019121139A (ja) | 要約装置、要約方法、及び要約プログラム | |
CN111259664B (zh) | 医学文本信息的确定方法、装置、设备及存储介质 | |
Chatterjee et al. | Studying the effect of syntactic simplification on text summarization | |
US10963501B1 (en) | Systems and methods for generating a topic tree for digital information | |
JP7283718B2 (ja) | 音響信号検索装置、音響信号検索方法、データ検索装置、データ検索方法、プログラム | |
JP2014010634A (ja) | 対訳表現抽出装置、対訳表現抽出方法及び対訳表現抽出のためのコンピュータプログラム | |
JP2020187738A (ja) | 著者名の曖昧性解消のための情報処理装置、方法及び記憶媒体 | |
KR102400689B1 (ko) | 의미 관계 학습 장치, 의미 관계 학습 방법, 및 의미 관계 학습 프로그램 | |
Sanyal et al. | Natural language processing technique for generation of SQL queries dynamically | |
JP5523929B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
CN110609997B (zh) | 生成文本的摘要的方法和装置 | |
JP6145562B2 (ja) | 情報構造化システム及び情報構造化方法 | |
JP5604465B2 (ja) | テキスト要約装置、方法、及びプログラム | |
CN112949287B (zh) | 热词挖掘方法、系统、计算机设备和存储介质 | |
JP2010128598A (ja) | 文書検索装置及び方法及びプログラム及びプログラムを記録した記録媒体 | |
JP4567025B2 (ja) | テキスト分類装置、テキスト分類方法及びテキスト分類プログラム並びにそのプログラムを記録した記録媒体 | |
Praveena et al. | Chunking based malayalam paraphrase identification using unfolding recursive autoencoders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110624 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5235918 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |