JP5086799B2 - 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体 - Google Patents
質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP5086799B2 JP5086799B2 JP2007337336A JP2007337336A JP5086799B2 JP 5086799 B2 JP5086799 B2 JP 5086799B2 JP 2007337336 A JP2007337336 A JP 2007337336A JP 2007337336 A JP2007337336 A JP 2007337336A JP 5086799 B2 JP5086799 B2 JP 5086799B2
- Authority
- JP
- Japan
- Prior art keywords
- question
- cause
- cause expression
- answer
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Roxana Girju, "Automatic detection of causal relations for Question Answering", Proc. ACL 2003 workshop on Multilingual summarization and question answering, p.76-83, 2003 諸岡心、福本淳一、"Why型質問応答のための回答選択手法"、電子情報通信学会技術研究報告Vol.105、No.594、言語理解とコミュニケーション、電子情報通信学会、p.7-12、2006 Radu Soricut and Eric Brill, "Automatic question answering using the web: Beyond the Factoid", Journal Information Retrieval, vol.9, no.2, p.191-206, 2006
文書群11は、多くの文書を集めたものであり、例えば、数年分の複数の新聞記事から構成された新聞記事集合である。
コーパス12は、分類用のラベルが予め付与されている単語で構成された複数の文を含むもので、予め作成されたものである。コーパス12は、例えば、EDR(japaneseElectronic Dictionary Research institute:日本電子化辞書研究所)電子化辞書(登録商標)の日本語コーパス(EDRコーパス)から構成される。したがって、コーパス12中の文は、その文に原因が含まれる場合、該当箇所に原因ラベル“cause”が付与されている(詳細は後記)。
因果単語辞書13は、因果(原因と結果)の表現対(ペア)を集めたもので、予め作成されたものである(詳細は後記)。
原因表現パタン辞書14は、所定数の原因表現を集めたもので、予め作成されたものである(詳細は後記)。
類義語辞書15は、類義語のペアまたはグループを集めたもので、予め作成されたものである(詳細は後記)。
質問解答セット群16は、質問文とその解答文とからなる予め定められた複数の学習用データであり、重みテーブル17を作成するために利用されるものである。
重みテーブル17は、解答候補ランキング部8が解答抽出部7から出力する399個(757個)の特徴量に付与する所定の重み(重み付け)を記憶したものである。この重みテーブル17の詳細は後記するが、質問解答セット群16とランキングSVM(Ranking Support Vector Machine)とを用いて予め構築される。
原因表現特徴量抽出部21は、原因表現パタン辞書14を参照して、解答候補ごとに、原因を表す表現が含まれている度合いを表す原因表現特徴量を算出するものである(詳細は図9で後記)。
因果関係表現特徴量抽出部22は、原因と結果のペアを集めた因果単語辞書13を参照して、解答候補ごとに、質問文との因果関係の度合い表す因果関係表現特徴量を算出する(詳細は図10で後記)。
質問応答関連度特徴量抽出部23は、解答候補ごとに、質問文との間の内容の関連度を表す質問応答関連度特徴量を算出するものである。本実施形態では、質問応答関連度特徴量抽出部23は、解答候補ごとに、質問文とのコサイン距離、文書抽出部6が付与する質問文との関連度に関する順位の逆数、および、類義語辞書15に基づく質問文との間の類義語同士の存在の有無、の3つの特徴量を算出する(詳細は図11で後記)。
「/1:お盆/2:の/3:帰省/4:客/5:を/6:運/7:ぶ/8:航空便/9:で/10:混雑/11:する/12:真夏/13:の/14:空/15:で/16:、/17:ヒヤリと/18:する/19:出来事/20:が/21:起き/22:た/23:。/I#1://3:帰省/4:客//」
さらに、ここで得られた表現に対して、形態素解析を行うことで、より抽象度の高い表現に変換する。現在の実装では、機能語(助詞、助動詞、非自立の名詞・動詞・形容詞、動詞−接尾)以外を、一つ以上の機能語の何にでもマッチすることが可能なアスタリスク記号(*)で置き換える。
対象となる文を構文・依存構造解析器CaboChaにより解析する。依存構造は木として表現される。木のノードは単語である。
[処理2]
機能語(助詞、助動詞)以外の単語については、それぞれの品詞情報で置き換える。品詞情報のノードを品詞ノードと呼ぶ。
対象となる文をmorphとJTAGにより解析する。morphは、日英翻訳システムALT J/E に付属する言語解析器であり、文に含まれるそれぞれの単語に意味属性を付与することができる。また、JTAGも同様に、文に含まれるそれぞれの単語について用言意味カテゴリ、固有名詞カテゴリを付与することができる。この解析で得られた情報を使い、品詞ノードに対応する意味属性・用言意味カテゴリ・固有名詞カテゴリを子ノードとして追加する。もし、品詞ノードに対応する意味属性・用言意味カテゴリ・固有名詞カテゴリが存在しない場合、品詞ノードにおける品詞情報を単語情報に戻す(処理1の直後の状態にする)。
このようにして、原因表現特徴量抽出部21は、原因表現パタン辞書14に集められた原因表現による394個または752個のバイナリ特徴量と、手動で作成した原因表現に対応する1つのバイナリ特徴量を出力する。
文類似度算出部231は、質問文と解答候補の類似度として、文の類似度でよく用いられるコサイン距離を求める。質問文と解答候補のコサイン距離を求める場合、まず、質問文と解答候補に含まれている内容語をすべて抜き出し、質問文と解答候補において各内容語がいくつ含まれているかという頻度ベクトルを作成する。
文書類似度算出部232は、文書抽出部6により付与される解答候補の順位の逆数を特徴量とする。
前記したコサイン距離は、単語の重複を元に類似度として算出されるため、単語が重複していないと高い数値とはならない。しかし、単語が重複していなくても、関連度は高い場合がある。例えば、質問文と解答候補の話題が近い場合、質問文と解答候補は関連が高いと考えられる。そこで、本実施形態では、解答候補が文書抽出部6によって何番目に出力されたかという順位の逆数を関連度として使うこととした。
また、単語が重複していなくても関連度が高い場合として、異なる表現で類似した内容が表されている場合が考えられる。そこで、類義語存在判定部233は、類義語辞書15を参照し、質問文と解答候補に類義語がそれぞれ含まれているか否かに応じて特徴量を得るものとする。具体的には、質問文中の単語と解答候補の単語の任意の組み合わせについて、類義語の関係にあるものが1つでもあれば「1」、そうでなければ「0」という特徴量を得る。ここでは、類義語辞書15は、EDR単語辞書と同じ概念を持つ単語を対とすることで作成した。
なお、この重み付けの決定にはランキング最適化の手法であるランキングSVMを用いることが可能であり、本システムではJoachimによる実装であるSVM-1ightを用いる(Thorsten Joachims, “Optimizing Search Engines using Clickthrough Data” ,Proc. KDD pp.133-142,2002.参照)。
ステップS2の後、質問応答装置1は、原因表現特徴量抽出部21による原因表現特徴量算出処理(ステップS3:詳細は図9で後記)、因果関係表現特徴量抽出部22による因果関係表現特徴量算出処理(ステップS4:詳細は図10で後記)、質問応答関連度特徴量抽出部23による質問応答関連度特徴量算出処理(ステップS5:詳細は図11で後記)を並行して行う。
なお、ステップS3〜ステップS5の処理は、このように並行して行うほか、任意の順序で行ってよい。
図9は、原因表現特徴量算出処理を示すフローチャートである。質問応答装置1は、原因表現特徴量抽出部21によって、各解答候補について、次の処理を行う。まず、形態素解析によりパタン化を行う(ステップS91)。そして、原因表現パタン辞書14の各原因表現ごとに、解答候補パタン中にその原因表現があれば「1」を、その原因表現がなければ「0」を取得する(ステップS92)。ここで、図12は、特徴量の取得の様子を模式的に示す図である。図12に示すように、原因表現特徴量抽出部21は、原因表現パタン辞書14を用いて(N+1(手動パタン))個の原因表現特徴量を取得する。
図10は、因果関係表現特徴量算出処理を示すフローチャートである。質問応答装置1は、因果関係表現特徴量抽出部22によって、まず、質問文を形態素解析して単語を抽出し(ステップS101)、その後、各解答候補について、次の処理を行う。まず、形態素解析により単語を抽出する(ステップS102)。そして、質問文の単語と解答候補の単語の任意の組み合わせが、因果単語辞書13のいずれかの表現対と合致すれば「1」を、合致しなければ「0」を取得する(ステップS103)。図12に示すように、因果関係表現特徴量抽出部22は、因果単語辞書13を用いて1個の因果関係表現特徴量を取得する。
図11は、質問応答関連度特徴量算出処理を示すフローチャートである。質問応答装置1は、質問応答関連度特徴量抽出部23によって、各解答候補について、次の処理を行う。まず、文類似度算出部231は、質問文とのコサイン距離を算出する(ステップS111)。続いて、文書類似度算出部232は、文書抽出部6によるDIDFに基づく質問文との関連度の順位の逆数を算出する(ステップS112)。その後、類義語存在判定部233は、質問文の単語と解答候補の単語の任意の組み合わせが、類義語辞書15のいずれかの表現対と合致すれば「1」を、合致しなければ「0」を取得する(ステップS113)。図12に示すように、質問応答関連度特徴量抽出部23は、類義語辞書15等を用いて3個の質問応答関連度特徴量を取得する。
また、機械学習の手法を導入することで、手書きのルールが不必要となり、システム構築コストの削減が期待できる。
次に、図13および図14を参照しながら、本実施形態の質問応答装置1の手法による実験結果について説明する。図13は、本実施形態の質問応答装置1の手法による実験結果(「NAZEQA」と表記)と従来の手法による実験結果(「ベースライン」と表記)を示す比較表である。「NAZEQA」のうち、「ATS(abstracted text span:抽象化された原因表現の意)」は前記した1つ目の作成方法による原因表現パタン辞書14を使用した場合の実験結果であり、「BACT」は前記した2つ目の作成方法による原因表現パタン辞書14を使用した場合の実験結果である。また、「ベースライン」のうち、「COS」は質問文と解答候補のコサイン距離のみを用いた場合の実験結果であり、「FK」は非特許文献2による手動の原因表現を用いた場合の実験結果である。
図13から分かるように、「ATS」の場合、MRRとcoverageの両方において、総じて、従来の手法よりも優れていることが確認できた。
例えば、原因表現特徴量、因果関係表現特徴量、質問応答関連度特徴量の各個数は、本実施形態で示された個数に限定されるものではない。
さらに、定義型質問応答システムのモジュールや、手続きを問う質問に答えることのできる質問応答システムのモジュールを備えるようにしてもよい。
さらに、本実施形態では、コーパス12を日本語コーパスとしたが、言語はこれに限定されるものではなく、例えば、英語コーパス等で構成してもよい。
さらに、質問応答関連度特徴量を算出する際、質問文とのコサイン距離、および、文書抽出部6が付与する質問文と解答候補の関連度に関する順位の逆数を使わずに、類義語辞書15に基づく質問文との間の類義語同士の存在の有無に基づく特徴量だけを使用してもよい。
その他、ハードウェア、ソフトウェアの具体的な構成について、本発明の主旨を逸脱しない範囲で適宜変更が可能である。
4 記憶部
5 質問タイプ判定部
6 文書抽出部
7 解答抽出部
8 解答候補ランキング部
9 タイプ別モジュール群
11 文書群
12 コーパス
13 因果単語辞書
14 原因表現パタン辞書
15 類義語辞書
21 原因表現特徴量抽出部
22 因果関係表現特徴量抽出部
23 質問応答関連度特徴量抽出部
Claims (13)
- 質問応答装置による質問応答方法であって、
文書抽出部が、入力された質問文に関連する1以上の文書を、予め定められた文書群から抽出して解答候補とするステップを実行し、
原因表現特徴量抽出部が、複数の原因表現のパタンを集めた原因表現パタン辞書を参照して、前記解答候補ごとに、前記原因表現パタン辞書中の全ての原因表現について、各原因表現ごとに、当該原因表現が存在するか否かを表す原因表現特徴量を算出するステップ、
因果関係表現特徴量抽出部が、原因と結果のペアを集めた因果単語辞書を参照して、前記解答候補ごとに、前記質問文との因果関係の度合いを表す因果関係表現特徴量を算出するステップ、
質問応答関連度特徴量抽出部が、意味が同一または類似である単語のペアまたはグループを集めた類義語辞書を参照して、前記解答候補ごとに、前記質問文との間の内容の関連度を表す質問応答関連度特徴量を算出するステップ、
のうちの少なくとも前記原因表現特徴量を算出するステップを実行し、
解答候補ランキング部が、前記解答候補ごとに、前記原因表現パタン辞書中の全ての原因表現の各原因表現ごとに当該原因表現が存在するか否かを表した前記原因表現特徴量、前記因果関係表現特徴量、前記質問応答関連度特徴量のうち算出された特徴量を重み付け加算して統合スコアを算出し、前記解答候補のうち前記統合スコアの上位の所定数の解答候補を、前記質問文に対する解答として出力するステップを実行する
ことを特徴とする質問応答方法。 - 前記原因表現パタン辞書は、分類用のラベルが予め付与されている単語で構成された複数の文を含むコーパスから、文内に含まれる構成要素間の関係を表す意味情報に基づいて抽出された原因を表す表現のパタンを複数格納した情報である
ことを特徴とする請求項1に記載の質問応答方法。 - 前記原因表現パタン辞書は、分類用のラベルが予め付与されている単語で構成された複数の文を含むコーパスに含まれている文のうち、原因表現の存在しない文よりも原因表現の存在する文に統計的に多く現れる表現のパタンを複数格納した情報である
ことを特徴とする請求項1に記載の質問応答方法。 - 前記因果単語辞書は、単語間の関係が予め付与されている辞書から、因果関係を有する単語のペアを抽出して格納した情報であり、
前記因果関係表現特徴量を算出するステップにおいて、前記因果関係表現特徴量抽出部は、前記解答候補ごとに、前記質問文中の単語と前記解答候補中の単語の任意のペアのいずれかが前記因果単語辞書に格納された単語のペアのいずれかと合致するか否かによって、前記因果関係表現特徴量を算出する
ことを特徴とする請求項1に記載の質問応答方法。 - 前記類義語辞書は、語義のラベルが予め付与されている辞書から、意味が同一または類似である単語のペアを抽出して格納した情報であり、
前記質問応答関連度特徴量を算出するステップにおいて、前記質問応答関連度特徴量抽出部は、前記解答候補ごとに、前記質問文中の単語と前記解答候補中の単語の任意のペアのいずれかが前記類義語辞書に格納された単語のペアのいずれかと合致するか否かによって、前記質問応答関連度特徴量を算出する
ことを特徴とする請求項1に記載の質問応答方法。 - 質問応答装置であって、
入力された質問文に関連する1以上の文書を、予め定められた文書群から抽出して解答候補とする文書抽出部と、
複数の原因表現のパタンを集めた原因表現パタン辞書を参照して、前記解答候補ごとに、前記原因表現パタン辞書中の全ての原因表現について、各原因表現ごとに、当該原因表現が存在するか否かを表す原因表現特徴量を算出する原因表現特徴量抽出部と、
前記解答候補ごとに、前記原因表現パタン辞書中の全ての原因表現の各原因表現ごとに当該原因表現が存在するか否かを表した前記原因表現特徴量を含む複数の特徴量を重み付け加算して統合スコアを算出し、前記解答候補のうち前記統合スコアの上位の所定数の解答候補を、前記質問文に対する解答として出力する解答候補ランキング部と、
を備えることを特徴とする質問応答装置。 - 質問応答装置であって、
入力された質問文に関連する1以上の文書を、予め定められた文書群から抽出して解答候補とする文書抽出部と、
複数の原因表現のパタンを集めた原因表現パタン辞書を参照して、前記解答候補ごとに、前記原因表現パタン辞書中の全ての原因表現について、各原因表現ごとに、当該原因表現が存在するか否かを表す原因表現特徴量を算出する原因表現特徴量抽出部と、
原因と結果のペアを集めた因果単語辞書を参照して、前記解答候補ごとに、前記質問文との因果関係の度合いを表す因果関係表現特徴量を算出する因果関係表現特徴量抽出部と、
意味が同一または類似である単語のペアまたはグループを集めた類義語辞書を参照して、前記解答候補ごとに、前記質問文との間の内容の関連度を表す質問応答関連度特徴量を算出する質問応答関連度特徴量抽出部と、
前記解答候補ごとに、前記原因表現パタン辞書中の全ての原因表現の各原因表現ごとに当該原因表現が存在するか否かを表した前記原因表現特徴量、因果関係表現特徴量および質問応答関連度特徴量を重み付け加算して統合スコアを算出し、前記解答候補のうち前記統合スコアの上位の所定数の解答候補を、前記質問文に対する解答として出力する解答候補ランキング部と、
を備えることを特徴とする質問応答装置。 - 前記原因表現パタン辞書は、分類用のラベルが予め付与されている単語で構成された複数の文を含むコーパスから、文内に含まれる構成要素間の関係を表す意味情報に基づいて抽出された原因を表す表現のパタンを複数格納した情報である
ことを特徴とする請求項6または請求項7に記載の質問応答装置。 - 前記原因表現パタン辞書は、分類用のラベルが予め付与されている単語で構成された複数の文を含むコーパスに含まれている文のうち、原因表現の存在しない文よりも原因表現の存在する文に統計的に多く現れる表現のパタンを複数格納した情報である
ことを特徴とする請求項6または請求項7に記載の質問応答装置。 - 前記因果単語辞書は、単語間の関係が予め付与されている辞書から、因果関係を有する単語のペアを抽出して格納した情報であり、
前記因果関係表現特徴量抽出部は、前記解答候補ごとに、前記質問文中の単語と前記解答候補中の単語の任意のペアのいずれかが前記因果単語辞書に格納された単語のペアのいずれかと合致するか否かによって、前記因果関係表現特徴量を算出する
ことを特徴とする請求項7に記載の質問応答装置。 - 前記類義語辞書は、語義のラベルが予め付与されている辞書から、意味が同一または類似である単語のペアを抽出して格納した情報であり、
前記質問応答関連度特徴量抽出部は、前記解答候補ごとに、前記質問文中の単語と前記解答候補中の単語の任意のペアのいずれかが前記類義語辞書に格納された単語のペアのいずれかと合致するか否かによって、前記質問応答関連度特徴量を算出する
ことを特徴とする請求項7に記載の質問応答装置。 - コンピュータを、請求項6ないし請求項11のいずれか一項に記載の質問応答装置が備える各手段として機能させる質問応答プログラム。
- 請求項12に記載の質問応答プログラムを記録したことを特徴とするコンピュータに読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007337336A JP5086799B2 (ja) | 2007-12-27 | 2007-12-27 | 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007337336A JP5086799B2 (ja) | 2007-12-27 | 2007-12-27 | 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009157791A JP2009157791A (ja) | 2009-07-16 |
JP5086799B2 true JP5086799B2 (ja) | 2012-11-28 |
Family
ID=40961720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007337336A Active JP5086799B2 (ja) | 2007-12-27 | 2007-12-27 | 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5086799B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5825676B2 (ja) * | 2012-02-23 | 2015-12-02 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
WO2013129195A1 (ja) * | 2012-02-28 | 2013-09-06 | 日本電気株式会社 | ファセット提示装置、ファセット提示方法およびコンピュータ読み取り可能な記録媒体 |
JP5791568B2 (ja) * | 2012-05-30 | 2015-10-07 | 日本電信電話株式会社 | コンテンツ要約支援装置、順位付け関数学習装置、方法、及びプログラム |
KR101357804B1 (ko) | 2012-10-24 | 2014-02-03 | 이동균 | 질의 답변 시스템 및 방법 |
JP6150282B2 (ja) * | 2013-06-27 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
JP6058563B2 (ja) * | 2014-01-09 | 2017-01-11 | 日本電信電話株式会社 | モデル学習装置、フィルタ装置、方法、及びプログラム |
US9946763B2 (en) | 2014-11-05 | 2018-04-17 | International Business Machines Corporation | Evaluating passages in a question answering computer system |
JP6721179B2 (ja) * | 2016-10-05 | 2020-07-08 | 国立研究開発法人情報通信研究機構 | 因果関係認識装置及びそのためのコンピュータプログラム |
JP6929539B2 (ja) * | 2016-10-07 | 2021-09-01 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム |
WO2018066489A1 (ja) * | 2016-10-07 | 2018-04-12 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム |
JP6550628B1 (ja) * | 2018-02-19 | 2019-07-31 | Arithmer株式会社 | 対話管理サーバ、対話管理方法、及びプログラム |
JP7084617B2 (ja) * | 2018-06-27 | 2022-06-15 | 国立研究開発法人情報通信研究機構 | 質問応答装置及びコンピュータプログラム |
CN109948143B (zh) * | 2019-01-25 | 2023-04-07 | 网经科技(苏州)有限公司 | 社区问答系统的答案抽取方法 |
CN110188190B (zh) * | 2019-04-03 | 2023-07-14 | 创新先进技术有限公司 | 对话解析方法、装置、服务器及可读存储介质 |
WO2024004320A1 (ja) * | 2022-06-30 | 2024-01-04 | 有限会社Bond | 教育装置、教育方法及び記録媒体 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219947A (ja) * | 2006-02-17 | 2007-08-30 | Nippon Hoso Kyokai <Nhk> | 因果関係知識抽出装置及びプログラム |
JP4778474B2 (ja) * | 2007-05-14 | 2011-09-21 | 日本電信電話株式会社 | 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 |
-
2007
- 2007-12-27 JP JP2007337336A patent/JP5086799B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009157791A (ja) | 2009-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5086799B2 (ja) | 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体 | |
US20180341871A1 (en) | Utilizing deep learning with an information retrieval mechanism to provide question answering in restricted domains | |
US8346795B2 (en) | System and method for guiding entity-based searching | |
JP4778474B2 (ja) | 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 | |
Ray et al. | A review and future perspectives of Arabic question answering systems | |
US20140067370A1 (en) | Learning opinion-related patterns for contextual and domain-dependent opinion detection | |
Stone et al. | Comparing methods for single paragraph similarity analysis | |
Smith et al. | Evaluating visual representations for topic understanding and their effects on manually generated topic labels | |
Santos et al. | Measuring the impact of readability features in fake news detection | |
JP4347226B2 (ja) | 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法 | |
Yalcin et al. | An external plagiarism detection system based on part-of-speech (POS) tag n-grams and word embedding | |
Hussein | Arabic document similarity analysis using n-grams and singular value decomposition | |
Sharoff | Genre annotation for the web: text-external and text-internal perspectives | |
Sardinha | An assessment of metaphor retrieval methods | |
Massung et al. | Non-native text analysis: A survey | |
Curtotti et al. | Machine learning for readability of legislative sentences | |
Breja et al. | A survey on non-factoid question answering systems | |
Sakai et al. | ASKMi: A Japanese Question Answering System based on Semantic Role Analysis. | |
Cook et al. | Automatic identification of words with novel but infrequent senses | |
Bakari et al. | Literature review of Arabic question-answering: modeling, generation, experimentation and performance analysis | |
Kahloula et al. | Plagiarism Detection in Arabic Documents: Approaches, Architecture and Systems. | |
Montalvo et al. | Multilingual news clustering: Feature translation vs. identification of cognate named entities | |
Saggion | Automatic summarization: an overview | |
Han et al. | Japanese sentence pattern learning with the use of illustrative examples extracted from the web | |
Thelwall | Text characteristics of English language university web sites |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100114 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120907 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5086799 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |