JP4942727B2 - テキスト要約装置、その方法およびプログラム - Google Patents

テキスト要約装置、その方法およびプログラム Download PDF

Info

Publication number
JP4942727B2
JP4942727B2 JP2008301058A JP2008301058A JP4942727B2 JP 4942727 B2 JP4942727 B2 JP 4942727B2 JP 2008301058 A JP2008301058 A JP 2008301058A JP 2008301058 A JP2008301058 A JP 2008301058A JP 4942727 B2 JP4942727 B2 JP 4942727B2
Authority
JP
Japan
Prior art keywords
word
search
document
input document
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008301058A
Other languages
English (en)
Other versions
JP2010128677A (ja
Inventor
隆明 長谷川
仁 西川
賢治 今村
玄一郎 菊井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008301058A priority Critical patent/JP4942727B2/ja
Publication of JP2010128677A publication Critical patent/JP2010128677A/ja
Application granted granted Critical
Publication of JP4942727B2 publication Critical patent/JP4942727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザが検索することにより得られたテキスト(文書)等について、その内容を当該ユーザの関心に沿って要約する技術に関する。
要約の利用目的を考えた場合、要約方法は大きく2つに分けることができる。1つはどんな目的やどんなユーザにも使える汎用的な要約(genericな要約)を作成する方法であるのに対し、もう1つはユーザの特定の興味・関心に適応する要約(query−biasedな要約)を作成する方法である。query−biasedな要約方法としては、重要文抽出の際にスタイルの情報や単語の汎用的な重要度等に基づく要約に加えてユーザからのクエリに重みを加える方法(非特許文献1参照)や、ユーザからのクエリによって検索された文書の集合をクラスタリングする際に情報利得比という、あるクラスタをさらにクラスタリングするときに貢献する度合いの高い用語に重みを加える方法が提案されている(非特許文献2参照)。
Anastasios Tombros et al., "Advantage of Query Biased Summaries in Information Retrieval", Research and Development in Information Retrieval, 1998, pp.2-10 森 辰則、「検索結果表示向け文書要約における情報利得比に基づく語の重要度計算」、自然言語処理、Vol.9、No.4、2002、pp.3−32
しかしながら、前述した従来の方法は主に新聞記事を対象としており、近年、爆発的に増加しているブログなどのCGM(Consumer Generated Media)に適用する場合にはいくつか課題が存在する。
即ち、CGMでは様々なユーザが情報を発信しており、汎用的な目的のためのgenericな要約方法で想定している新聞記事のような統一的なスタイルは存在しない。このため、統一的なスタイルのときに有効である文の位置などの情報を利用して重要文を抽出することは難しかった。
また、例えば検索エンジンにおいて検索された文書がユーザの関心に関連するかどうかを判断するための要約方法では、出力できる制限文字数が少なくなることから、既にユーザには既知であるクエリに含まれる検索語に高い重みを付けることは、ユーザにとって未知の情報を出力できなくなる可能性が高くなるという問題があった。また、検索エンジンにより検索される文書では、ユーザによる検索語を含む文が複数存在することが考えられるため、限られた制限文字数の制約の中では、ユーザからの検索語を含む文の中でどの文を選択するかは重要な課題となっていた。
また、情報利得比を得るためのクラスタリングは文書数が増えれば処理負荷が大きくなり、高速なレスポンスが期待される検索エンジンとの親和性が比較的低いという問題があった。さらにまた、CGMでは1つの文書に複数のトピックを含む可能性が大きいため、うまくクラスタリングできず、望ましい用語が獲得できない場合も存在すると考えられる。
本発明の目的は、CGM文書等に対し、ユーザより入力された検索語に適合するquery−biasedな要約を生成することにある。
前記目的を達成するため、本発明では、コーパスにおける任意の単語の文書頻度および2個以上の任意の単語の共起頻度を格納する単語頻度テーブルと、ユーザより入力された検索語を受け付ける検索語入力部と、複数の文で構成される入力文書を受け付ける文書入力部と、前記単語頻度テーブルから、前記検索語に対応する文書頻度、前記入力文書に含まれる単語に対応する文書頻度、並びに前記検索語および入力文書に含まれる単語に対応する共起頻度を取得し、これらに基づいて前記検索語と入力文書に含まれる単語との関連度を計算する関連度計算部と、前記入力文書を構成する全ての文に対し、前記関連度計算部で計算される当該文に含まれる各単語と前記検索語との関連度に基づいて文重要度を計算する重要文選択部と、前述した各部を制御し、予め指定された制限文字数または要約率の範囲内で前記入力文書を構成する文を前記文重要度の高い順に選択し、前記入力文書での出現順に出力する制御部とを備え、さらに前記関連度計算部は、前記検索語が複数であり、前記複数の検索語の文書頻度が所定の閾値よりも小さい場合、または前記複数の検索語と前記入力文書に含まれる単語との共起頻度が所定の閾値よりも小さい場合には、前記複数の検索語の各検索語ごとに、当該検索語と前記入力文書に含まれる単語との関連度を求め、前記各検索語ごとに求めた関連度の平均値を、前記複数の検索語と前記入力文書に含まれる単語との関連度とする機能を有することを特徴とする。
本発明によれば、入力文書からユーザの検索要求である検索語に関連する単語を含む文を抽出するので、ユーザの検索要求に適合した要約を生成する効果を有する。特にユーザからの検索要求で検索された入力文書、即ち検索語を含む文が複数存在する入力文書を対象とする場合に、汎用的な重要度と検索語に対する重要度の付加を用いた従来の重要文抽出方法よりも、ユーザからの検索語に関連する単語を含む文を選択するという方法により、よりユーザの検索要求に適合した要約を生成することが可能である。さらに、検索語自体が存在しない文でも検索語に関連のある単語を多く含む文を選択することも可能である。また、スタイルの情報を用いないため、多様なスタイルの文書に対しても有効である。
次に、本発明の実施の形態について図面を参照して説明する。
図1は本発明のテキスト要約装置の実施の形態の一例を示すもので、本実施の形態のテキスト要約装置は、単語頻度テーブル1と、検索語入力部2と、文書入力部3と、関連度計算部4と、重要文選択部5と、制御部6とからなる。
単語頻度テーブル1は、所定のコーパス(文書の集合)における任意の単語の文書頻度および2個以上の任意の単語の共起頻度を格納している。ここで、所定のコーパスにおける任意の単語の文書頻度とは、所定のコーパスに対して当該任意の単語をキーワードとする検索を行い、その結果、得られる文書の数(所定のコーパス内の文書のうち当該任意の単語が出現する文書の数)を意味し、また、所定のコーパスにおける2個以上の任意の単語の共起頻度とは、所定のコーパスに対して当該2個以上の任意の単語をキーワードとする検索(AND検索)を行い、その結果、得られる文書の数(所定のコーパス内の文書のうち当該2個以上の任意の単語が同時に出現する文書の数)を意味している。
なお、インターネット上の検索エンジンを利用して任意の単語あるいは2個以上の任意の単語をキーワードとして検索し、ヒットした文書数を前述した文書頻度あるいは共起頻度とすることもできる(この場合の「所定のコーパス」とは検索エンジンを介してアクセス可能なインターネット上の全ての文書ということになる。)。
図2は単語頻度テーブル1の一例を示すもので、ここでは1〜n個の任意の単語(キーワード)に対応する文書頻度(共起頻度)を格納している。例えば、後述する検索語が「土用 丑の日」(文字間のスペースは単語の区切を表す。)である場合、キーワード1が「土用」、キーワード2が「丑の日」である文書頻度「944」が得られる。また、後述する入力文書内に出現した単語が「鰻」である場合、キーワード1が「鰻」である文書頻度「4170」が得られる。また、検索語「土用 丑の日」と単語「鰻」との共起頻度は、キーワード1が「土用」、キーワード2が「丑の日」、キーワード3が「鰻」である文書頻度「260」が得られる。これらにより、単語「鰻」と検索語「土用 丑の日」との関連度を後述するように求めることができる。
検索語入力部2は、ユーザより、図示しないキーボード等から直接入力され又は記憶媒体から読み出されて入力され又は通信媒体を介して他の装置等から入力された検索語を受け付ける。
文書入力部3は、図示しない記憶手段から読み出されて入力され又は通信媒体を介して他の装置等から入力された、要約の対象となる入力文書を受け付ける。ここで、入力文書は複数の文で構成され、各文は形態素解析済みであるとする。形態素解析前の入力文書の一例を図3に、また、図3の入力文書(形態素解析後)中の一文を図4に示す。
関連度計算部4は、単語頻度テーブル1から、検索語入力部2で受け付けた検索語に対応する文書頻度、文書入力部3で受け付けた入力文書に含まれる(詳細には入力文書を構成する文に含まれる)単語に対応する文書頻度、並びに前記検索語および入力文書に含まれる単語に対応する共起頻度を取得し、これらに基づいて前記検索語と入力文書に含まれる単語(あるいは単語列)との関連度を計算する。
関連度の一例として相互情報量(PMI)を挙げる。なお、入力文書に含まれる単語のうち、文書頻度を取得する単語は名詞に限定するなど、品詞による制限を設けても良い。また、取得した文書頻度の低い単語は関連度計算の対象から除外しても良い。
検索語qと入力文書に含まれる単語wとの相互情報量(PMI)の計算式は下記の通りである。
Figure 0004942727
但し、C(q)は検索語qの文書頻度、C(w)は入力文書に含まれる単語wの文書頻度、C(q,w)は検索語qおよび入力文書に含まれる単語wの共起頻度、Nはコーパスに格納されている文書数とする。なお、検索語が複数の用語からなる場合、当該複数の用語の文書頻度や複数の用語と文を構成する単語との共起頻度が小さいこともある。これらが事前に設けた文書頻度や共起頻度の閾値を下回る場合には、例えば、複数の用語について各々の用語の文書頻度と、各々の用語と文を構成する単語との共起頻度を取得することで、各々の用語と文を構成する単語との関連度を計算し、これらの関連度の平均値を、複数の用語と文を構成する単語の関連度としても良い。
また、関連度計算部4では、入力文書に含まれる単語について検索語に依存しない一般的な重要度も考慮するために、当該単語の入力文書内での出現頻度(TF)や、所定のコーパス内の文書のうち当該単語が出現する文書の数の逆数(IDF)を計算し、相互情報量(PMI)との積を求めても良い。また、検索語と入力文書に含まれる単語との関連度として、対数尤度比などの単語共起に基づく他の尺度を用いることもできる。
重要文選択部5は、文書入力部3で受け付けた入力文書を構成する全ての文について、関連度計算部4により計算される当該文に含まれる各単語と前記検索語との関連度に基づいて文重要度を計算し、当該文重要度の高い文を選択する。ここで、文の重要度としては、文に含まれる各単語と検索語との関連度の総和を用いても良いし、関連度の平均を用いても良いし、関連度の最大値を用いても良いし、または関連度の対数や平方根による平均などを用いても良い。
図3に示した5つの文からなる入力文書の場合を例に挙げて重要文選択部5の動作について説明する。
この入力文書(形態素解析後)を入力とし、関連度計算の対象を名詞の類に限定すると、図5に示すような名詞のIDFとPMI(相互情報量)が得られる。入力文書中の5つの文のうち重要な2つの文を選択する場合において、文の重要度を各単語のIDFの総和とした時の選択結果を図6に、また、文の重要度を各単語のPMIの総和とした時の選択結果を図7に示す。IDFを用いた場合は、「長野」や「岡谷」といった地名が高いIDF値を持っているため、5番目の文が最も重要として出力される。一方、PMIを用いた場合は、相対的に「夏」「栄養」「習慣」のPMI値が高く、「人口」や「寒」のPMI値が低いので、2番目の文が重要な2文に含まれる。このため、PMIを用いる要約の方が、検索語により関連の深い単語を含む要約となる。
また、重要文選択部5では、MMR(Maximal Marginal Relevance)という公知の技術を用いて、文重要度が高くかつ文同士の類似度が小さいほど高くなるスコアを求め、重要な文の中から既に選択した文との内容の重複を避けて、新規性の高い文を選択することもできる。
MMRは次式により計算することができる。
Figure 0004942727
ここで、Qは検索語、Rは入力文書に含まれる全ての文、SはRのサブセットで既に重要文として選択されているもの、R\SはRのサブセットでまだ重要文として選択されていないもの、Sim1(Pi,Q)は検索語Qと文Piとの適合度を算出する関数、Sim2(Pi,Pj)はSに含まれる文Pjと抽出侯補の文Piとの類似度である。
ここでは、Sim1(Pi,Q)の代わりに文の重要度を採用し、既に選択した文との類似度の尺度にコサイン類似度を採用してMMRのスコアを計算する。但し、両者のダイナミックレンジを揃えるために、各文の重要度は最も大きな重要度を有する文の値で正規化する。正規化する場合、各文の重要度の対数をとってから、対数の最大値で正規化しても良い。以下、具体的な例を示す。
例えば、図3の入力文書において2番目の文が始めに選択されたと仮定すると、1番目の文の正規化された重要度が1、コサイン類似度が0に対して、5番目の文の正規化された重要度が0.717、コサイン類似度は0.659となる。λを0.5とすると、MMRのスコアは、それぞれ0.5と0.029となり、MMRのスコアにより大きな差が開く。また、入力文書にタイトルが存在する場合、タイトルを既に選択した文とみなすことでMMRの値を計算することによりタイトルとの冗長性を避けることができる。
制御部6は、前述した各部を制御し、予め指定された制限文字数または要約率の範囲内で前記入力文書を構成する文を前記文重要度またはスコアの高い順に選択し、出現順に並べ替えて出力する。
図8に前述した文重要度および文同士の類似度に基づくスコアを求める場合の重要文選択部5および制御部6における処理の流れを示す。
重要文選択部5は、入力文書中に処理すべき文が存在すれば(s1)、当該文を選択し、その文に含まれる各単語と検索語との関連度を計算し(s2)、該計算した関連度に基づいて文重要度を計算する(s3)。そして、既に選択済みの文の全てについて(s4)、前記選択した1文との類似度を計算する(s5)。さらに、各文の類似度を計算した結果、類似度が最大となる文の類似度を記憶し(s6)、各文の重要度と当該記憶した類似度とに基づくスコアを計算する(s7)。以上を処理する文がなくなるまで繰り返す(s1)。
そして、制御部6は、MMRに基づくスコアの高い順に入力文書を構成する文を選択していき(s8)、制限文字数または要約率を越えるときに文の選択を中止し(s9)、選択した文を出現順に並べ替えて出力する(s10)。
このように、検索語に関連する単語に基づく文の重要度と既に選択した文との類似度を考慮しながら文を選択することにより、ユーザの検索要求に適合し、冗長性の少ない要約を生成することができる。
なお、本発明は、周知のコンピュータに媒体もしくは通信回線を介して、図1の構成図に示された機能を実現するプログラムあるいは図8のフローチャートに示された手順を備えるプログラムをインストールすることによっても実現可能である。
本発明のテキスト要約装置の実施の形態の一例を示す構成図 単語頻度テーブルの一例を示す説明図 形態素解析前の入力文書の一例を示す説明図 図3の入力文書(形態素解析後)中の一文を示す説明図 図3の入力文書中の名詞のIDFとPMIを示す説明図 IDFによる重要文の選択結果の一例を示す説明図 PMIによる重要文の選択結果の一例を示す説明図 重要文選択部および制御部における処理の流れ図
符号の説明
1:単語頻度テーブル、2:検索語入力部、3:文書入力部、4:関連度計算部、5:重要文選択部、6:制御部。

Claims (5)

  1. ーパスにおける任意の単語の文書頻度および2個以上の任意の単語の共起頻度を格納する単語頻度テーブルと、
    ユーザより入力された検索語を受け付ける検索語入力部と、
    複数の文で構成される入力文書を受け付ける文書入力部と、
    前記単語頻度テーブルから、前記検索語に対応する文書頻度、前記入力文書に含まれる単語に対応する文書頻度、並びに前記検索語および入力文書に含まれる単語に対応する共起頻度を取得し、これらに基づいて前記検索語と入力文書に含まれる単語との関連度を計算する関連度計算部と、
    前記入力文書を構成する全ての文に対し、前記関連度計算部で計算される当該文に含まれる各単語と前記検索語との関連度に基づいて文重要度を計算する重要文選択部と、
    前述した各部を制御し、予め指定された制限文字数または要約率の範囲内で前記入力文書を構成する文を前記文重要度の高い順に選択し、前記入力文書での出現順に出力する制御部とを備え
    さらに前記関連度計算部は、
    前記検索語が複数であり、前記複数の検索語の文書頻度が所定の閾値よりも小さい場合、または前記複数の検索語と前記入力文書に含まれる単語との共起頻度が所定の閾値よりも小さい場合には、
    前記複数の検索語の各検索語ごとに、当該検索語と前記入力文書に含まれる単語との関連度を求め、
    前記各検索語ごとに求めた関連度の平均値を、前記複数の検索語と前記入力文書に含まれる単語との関連度とする機能を有する
    ことを特徴とするテキスト要約装置。
  2. 前記入力文書に含まれる全ての文に対し、前記関連度計算部で計算される当該文に含まれる各単語と前記検索語との関連度に基づいて文重要度を計算するとともに、文同士の類似度を計算し、当該文重要度が高くかつ文同士の類似度が小さいほど高くなるスコアを求める重要文選択部と、
    前述した各部を制御し、予め指定された制限文字数または要約率の範囲内で前記入力文書を構成する文を前記スコアの高い順に選択し、前記入力文書での出現順に出力する制御部とを備えた
    ことを特徴とする請求項1に記載のテキスト要約装置。
  3. 索語入力部が、ユーザより入力された検索語を受け付けるステップと、
    文書入力部が、複数の文で構成される入力文書を受け付けるステップと、
    関連度計算部が、コーパスにおける任意の単語の文書頻度および2個以上の任意の単語の共起頻度を格納する単語頻度テーブルから、前記検索語に対応する文書頻度、前記入力文書に含まれる単語に対応する文書頻度、並びに前記検索語および入力文書に含まれる単語に対応する共起頻度を取得し、これらに基づいて前記検索語と入力文書に含まれる単語との関連度を計算するステップと、
    重要文選択部が、前記入力文書を構成する全ての文に対し、前記関連度計算ステップで計算される当該文に含まれる各単語と前記検索語との関連度に基づいて文重要度を計算するステップと、
    制御部が、予め指定された制限文字数または要約率の範囲内で前記入力文書を構成する文を前記文重要度の高い順に選択し、前記入力文書での出現順に出力するステップとを含み、
    さらに前記関連度計算ステップは、
    前記検索語が複数であり、前記複数の検索語の文書頻度が所定の閾値よりも小さい場合、または前記複数の検索語と前記入力文書に含まれる単語との共起頻度が所定の閾値よりも小さい場合には、
    前記複数の検索語の各検索語ごとに、当該検索語と前記入力文書に含まれる単語との関連度を求め、
    前記各検索語ごとに求めた関連度の平均値を、前記複数の検索語と前記入力文書に含まれる単語との関連度とする工程を有する
    ことを特徴とするテキスト要約方法。
  4. 重要文選択部が、前記入力文書に含まれる全ての文に対し、前記関連度計算ステップで計算される当該文に含まれる各単語と前記検索語との関連度に基づいて文重要度を計算するとともに、文同士の類似度を計算し、当該文重要度が高くかつ文同士の類似度が小さいほど高くなるスコアを求めるステップと、
    制御部が、予め指定された制限文字数または要約率の範囲内で前記入力文書を構成する文を前記スコアの高い順に選択し、前記入力文書での出現順に出力するステップとを含む
    ことを特徴とする請求項3に記載のテキスト要約方法。
  5. コンピュータを、請求項1または2に記載のテキスト要約装置の各手段として機能させるためのプログラム。
JP2008301058A 2008-11-26 2008-11-26 テキスト要約装置、その方法およびプログラム Active JP4942727B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008301058A JP4942727B2 (ja) 2008-11-26 2008-11-26 テキスト要約装置、その方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008301058A JP4942727B2 (ja) 2008-11-26 2008-11-26 テキスト要約装置、その方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010128677A JP2010128677A (ja) 2010-06-10
JP4942727B2 true JP4942727B2 (ja) 2012-05-30

Family

ID=42329039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008301058A Active JP4942727B2 (ja) 2008-11-26 2008-11-26 テキスト要約装置、その方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4942727B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025216A (zh) * 2015-09-09 2017-08-08 Uberple有限公司 句子提取方法及系统

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5530393B2 (ja) * 2011-04-11 2014-06-25 日本電信電話株式会社 文書要約装置、文書要約方法、及びプログラム
JP5670939B2 (ja) * 2012-03-07 2015-02-18 日本電信電話株式会社 文書要約装置及び方法及びプログラム
JP6230190B2 (ja) * 2014-01-09 2017-11-15 日本放送協会 重要語抽出装置、及びプログラム
WO2016043609A1 (en) 2014-09-18 2016-03-24 Empire Technology Development Llc Three-dimensional latent semantic analysis
US9767193B2 (en) 2015-03-27 2017-09-19 Fujitsu Limited Generation apparatus and method
JP6524008B2 (ja) * 2016-03-23 2019-06-05 株式会社東芝 情報処理装置、情報処理方法およびプログラム
KR102034302B1 (ko) * 2018-03-20 2019-10-18 주식회사 딥서치 문장 추출 방법 및 시스템
JP6621514B1 (ja) * 2018-10-26 2019-12-18 楽天株式会社 要約作成装置、要約作成方法、及びプログラム
WO2021009885A1 (ja) * 2019-07-17 2021-01-21 日本電信電話株式会社 教師データ生成装置、教師データ生成方法および教師データ生成プログラム
JP7152437B2 (ja) * 2020-02-20 2022-10-12 ソフトバンク株式会社 要約生成プログラム、要約生成装置および要約生成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11184865A (ja) * 1997-12-19 1999-07-09 Matsushita Electric Ind Co Ltd 文書要約装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107025216A (zh) * 2015-09-09 2017-08-08 Uberple有限公司 句子提取方法及系统

Also Published As

Publication number Publication date
JP2010128677A (ja) 2010-06-10

Similar Documents

Publication Publication Date Title
JP4942727B2 (ja) テキスト要約装置、その方法およびプログラム
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
US7895205B2 (en) Using core words to extract key phrases from documents
Culpepper et al. Dynamic cutoff prediction in multi-stage retrieval systems
CN110287309B (zh) 快速提取文本摘要的方法
US20120278341A1 (en) Document analysis and association system and method
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
JP2009525520A (ja) 検索結果リストにおける電子文書を関連性に基づきランク付けおよびソートする評価方法、およびデータベース検索エンジン
Song et al. A novel term weighting scheme based on discrimination power obtained from past retrieval results
Luk et al. A comparison of Chinese document indexing strategies and retrieval models
Kim et al. Does selective search benefit from WAND optimization?
JP5565568B2 (ja) 情報推薦装置、情報推薦方法およびプログラム
JP6340351B2 (ja) 情報検索装置、辞書作成装置、方法、及びプログラム
JP5251099B2 (ja) 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム
Yusuf et al. Arabic text stemming using query expansion method
Bae et al. Efficient question classification and retrieval using category information and word embedding on cQA services
JP2009086903A (ja) 検索サービス装置
JP2004192546A (ja) 情報検索方法、装置、プログラム、および記録媒体
JP2013222418A (ja) パッセージ分割方法、装置、及びプログラム
Lavrenko et al. Real-time query expansion in relevance models
KR102519955B1 (ko) 토픽 키워드의 추출 장치 및 방법
Albathan et al. Enhanced n-gram extraction using relevance feature discovery
JP4452527B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2004525442A (ja) 有損失インデックス圧縮装置
Ojokoh et al. Online question answering system

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110530

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110613

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110614

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110615

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110616

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120228

R150 Certificate of patent or registration of utility model

Ref document number: 4942727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350