JP5860861B2 - 焦点推定装置、モデル学習装置、方法、及びプログラム - Google Patents
焦点推定装置、モデル学習装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5860861B2 JP5860861B2 JP2013213885A JP2013213885A JP5860861B2 JP 5860861 B2 JP5860861 B2 JP 5860861B2 JP 2013213885 A JP2013213885 A JP 2013213885A JP 2013213885 A JP2013213885 A JP 2013213885A JP 5860861 B2 JP5860861 B2 JP 5860861B2
- Authority
- JP
- Japan
- Prior art keywords
- focus
- utterance
- candidate
- user
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本実施の形態においては、発話から適切な順番で焦点となる単語を抽出するために機械学習の手法を用いる。具体的には、多くの文の集合を用意し、それぞれの中から名詞句を抽出する。そして、その名詞句について焦点としてふさわしいかという度合いを人手によって付与したデータを作成する。
次に、本発明の第1の実施の形態に係る焦点推定装置の構成について説明する。図1に示すように、本発明の第1の実施の形態に係る焦点推定装置100は、CPUとRAMと後述する焦点更新処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この焦点推定装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部50とを備えている。
(2)焦点候補が文末にあるか否かを表す二値素性
(3)焦点候補の品詞に固有名詞もしくは未知語が含まれるか否かを表す二値素性
(4)焦点候補の品詞に動作性名詞(いわゆるサ変接続の名詞)が含まれるか否かを表す二値素性
(5)焦点候補の品詞に形容動詞が含まれるか否かを表す二値素性
(6)焦点候補の文字数の数値の素性
(7)焦点候補の文字種がすべてひらがなの場合、何文字のひらがなかを表す数値の素性
(8)焦点候補の文字種がすべてカタカナの場合、何文字のカタカナかを表す数値の素性
(9)焦点候補の文字種がすべて漢字の場合、何文字の漢字かを表す数値の素性
(10)焦点候補の直前の単語のN-gramについて、単語のN-gramのそれぞれの存在有無を表す二値素性
(11)焦点候補の直前の品詞のN-gramについて、品詞のN-gramのそれぞれの存在有無を表す二値素性
(12)焦点候補の直後の単語のN-gramについて、単語のN-gramのそれぞれの存在有無を表す二値素性
(13)焦点候補の直後の品詞のN-gramについて、品詞のN-gramのそれぞれの存在有無を表す二値素性
・焦点候補リスト(cands)が空、かつ、ゼロ代名詞が指す名詞句のリスト(zeros)が空の場合、更新前の焦点リスト(centers)を返す(焦点リストを更新しない)。
・焦点候補リスト(cands)が空でない、または、ゼロ代名詞が指す名詞句のリスト(zeros)が空でない場合、ゼロ代名詞が指す名詞句のリスト(zeros)と、焦点候補リスト(cands)とを結合し、結合したリストで、焦点リスト記憶部42に記憶されている焦点リストを更新する。なお、結合するゼロ代名詞が指す名詞句のリスト(zeros)と、焦点候補リスト(cands)とに重複した要素がある場合、リストの先頭の方のみを残すように結合する。例えば、ゼロ代名詞が指す名詞句のリスト(zeros)が(A,B)であり、焦点候補リスト(cands)が(B,A,C)である場合、結合した結果は、(A,B,C)というリストとなる。
・焦点候補リスト(cands)が空の場合、更新前の焦点リスト(centers)を返す(焦点リストを更新しない)。
・焦点候補リスト(cands)が空でない場合、焦点候補リスト(cands)を新しい焦点リストとして、焦点リスト記憶部42に記憶されている焦点リストを更新する。
次に、本発明の第1の実施の形態に係る焦点推定モデル学習装置の構成について説明する。図4に示すように、本発明の第1の実施の形態に係る焦点推定モデル学習装置200は、CPUとRAMと後述する焦点推定モデル学習処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この焦点推定モデル学習装置200は、機能的には図4に示すように入力部210と、演算部220と、出力部250とを備えている。なお、焦点推定モデル学習装置がモデル学習装置の一例である。
次に、本発明の第1の実施の形態に係る焦点推定モデル学習装置200の作用について説明する。入力部10により学習データを受け付け、学習データ記憶部222に記憶されると、焦点推定モデル学習装置200は、図6に示す焦点推定モデル学習処理ルーチンを実行する。
次に、本発明の第1の実施の形態に係る焦点推定装置100の作用について説明する。事前に、焦点推定モデル学習装置200において学習された焦点推定モデルが焦点推定モデル記憶部28に記憶されている。そして、入力部10によりユーザ発話を受け付ける毎に、焦点推定装置100は、図7に示す焦点推定処理ルーチンを繰り返し実行する。
焦点リスト記憶部42に記憶されている焦点リストに「イタリア、パスタ」が格納されている場合において、「イタリアはパスタですよね」というシステム発話の後に、入力部10においてユーザ発話「美味しい」を受け付けた場合、照応解析部38により「パスタ」が省略されていると判定され、「パスタ」が焦点となる。システムが応答した後、入力部10においてユーザ発話「パスタはアルデンテだよね」を受け付けると、「パスタ」及び「アルデンテ」の焦点としてのふさわしさを学習した焦点推定モデルを用いて、「パスタ」及び「アルデンテ」についてスコアを算出し、当該スコアを比較した結果「アルデンテ」のスコアの方が高いため、焦点リストを「アルデンテ、パスタ」と更新し、図8に示すように「アルデンテ」を用いたユーザ発話を生成している。
次に、第2の実施の形態に係る焦点推定装置300の構成について説明する。
・焦点候補リスト(cands)が空、かつ、ゼロ代名詞が指す名詞句のリスト(zeros)が空の場合、更新前の焦点リスト(centers)を返す(焦点リストを更新しない)。
・焦点候補リスト(cands)が空でない、または、ゼロ代名詞が指す名詞句のリスト(zeros)が空でない場合、ゼロ代名詞が指す名詞句のリスト(zeros)と、焦点候補リスト(cands)と、更新前の焦点リスト(centers)とを結合し、結合したリストで、焦点リスト記憶部42に記憶されている焦点リストを更新する。なお、結合した結果に重複した要素がある場合、リストの先頭の方のみを残すように結合する。
・焦点候補リスト(cands)が空の場合、更新前の焦点リスト(centers)を返す(焦点リストを更新しない)。
・焦点候補リスト(cands)が空でない場合、焦点候補リスト(cands)と更新前の焦点リスト(centers)とを結合し、結合したリストで、焦点リスト記憶部42に記憶されている焦点リストを更新する。
次に、第3の実施の形態に係る焦点推定装置400の構成について説明する。
20、220、320、420 演算部
22 ユーザ発話解析部
24 焦点候補抽出部
26 特徴量抽出部
28 焦点推定モデル記憶部
30 スコア算出部
32 焦点候補選択部
34 テキストコーパス記憶部
36 必須格定義記憶部
38、424 照応解析部
40、340 焦点更新部
42、342 焦点リスト記憶部
50 出力部
100、300、400 焦点推定装置
200 焦点推定モデル学習装置
222 学習データ記憶部
224 特徴量抽出部
226 モデル学習部
228 焦点推定モデル記憶部
250 出力部
422 発話履歴記憶部
Claims (18)
- ユーザと対話を行う対話システムが、前記ユーザの発話の次に発話するときの発話の話題として使うための、前記ユーザの発話の話題を表す焦点を推定する焦点推定装置において、
入力された前記ユーザの発話に対する形態素解析処理の結果及び固有表現抽出処理の結果の少なくとも一方に基づいて、前記ユーザの発話から少なくとも1つの単語からなる名詞句及び固有表現の少なくとも一方を前記発話の焦点候補として抽出する焦点候補抽出部と、
前記焦点候補抽出部により抽出された焦点候補の各々について、前記ユーザの発話に対する形態素解析処理の結果に基づいて、前記焦点候補の特徴量を抽出する特徴量抽出部と、
前記焦点候補の各々について、前記特徴量抽出部により抽出された前記焦点候補の特徴量と、焦点らしさを表すスコアを推定するための予め学習された焦点推定モデルとに基づいて、前記焦点候補の焦点らしさを表すスコアを算出するスコア算出部と、
前記スコア算出部により算出された前記焦点候補の各々の前記スコアと、予め定められた閾値とに基づいて、前記焦点候補の各々から、前記ユーザの発話の焦点を選択する焦点候補選択部と、
前記焦点候補選択部により選択された前記ユーザの発話の焦点を用いて、前記ユーザの発話の焦点が格納される焦点リストを更新する焦点更新部と、
を含む焦点推定装置。 - ユーザと対話を行う対話システムが、前記ユーザの発話の次に発話するときの発話の話題として使うための、前記ユーザの発話の話題を表す焦点を推定する焦点推定装置において、
入力された前記ユーザの発話に対する係り受け解析処理の結果と、前記ユーザの発話より前における前記発話が格納されている発話履歴、及び前記ユーザの発話より前における前記発話の焦点が格納された焦点リストの少なくとも一方とに基づいて、前記発話履歴に格納されている前記発話に含まれる名詞句、及び前記焦点リストに格納されている焦点の少なくとも一方から、前記ユーザの発話に含まれる参照表現が参照している、又は前記ユーザの発話において省略されている名詞句及び焦点の少なくとも一方を推定する照応解析部と、
前記入力された前記ユーザの発話に対する形態素解析処理の結果及び固有表現抽出処理の結果の少なくとも一方に基づいて、前記ユーザの発話から少なくとも1つの単語からなる名詞句及び固有表現の少なくとも一方を前記発話の焦点候補として抽出する焦点候補抽出部と、
前記焦点候補抽出部により抽出された焦点候補の各々について、前記ユーザの発話に対する形態素解析処理の結果に基づいて、前記焦点候補の特徴量を抽出する特徴量抽出部と、
前記焦点候補の各々について、前記特徴量抽出部により抽出された前記焦点候補の特徴量と、焦点らしさを表すスコアを推定するための予め学習された焦点推定モデルとに基づいて、前記焦点候補の焦点らしさを表すスコアを算出するスコア算出部と、
前記スコア算出部により算出された前記焦点候補の各々の前記スコアと、予め定められた閾値とに基づいて、前記焦点候補の各々から、前記ユーザの発話の焦点を選択する焦点候補選択部と、
前記焦点候補選択部により選択された前記ユーザの発話の焦点と、前記照応解析部により推定された名詞句及び焦点の少なくとも一方とを用いて、前記焦点リストを更新する焦点更新部と、
を含む焦点推定装置。 - 前記焦点更新部は、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定された場合に、前記焦点候補選択部により選択された前記ユーザの発話の焦点と、前記照応解析部により推定された名詞句及び焦点の少なくとも一方とを用いて、前記焦点リストを更新し、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定されなかった場合に、前記焦点候補選択部により選択された前記ユーザの発話の焦点を用いて、前記焦点リストを更新する請求項2記載の焦点推定装置。 - 前記焦点候補選択部は、更に前記選択した前記ユーザの発話の焦点を、前記発話の焦点候補を前記スコア順に並べて格納した焦点候補リストに追加し、
前記照応解析部は、更に前記推定した前記ユーザの発話に含まれる参照表現が参照している、又は前記ユーザの発話において省略されている名詞句及び焦点の少なくとも一方をゼロ代名詞リストに格納し、
前記焦点更新部は、
前記焦点候補リストが空であり、かつ、前記ゼロ代名詞リストが空である場合、前記焦点リストを更新せず、
前記焦点候補リストが空でない場合、又は、前記ゼロ代名詞リストが空でない場合、前記ゼロ代名詞リストの末尾に、前記焦点候補リストに含まれる要素であって、かつ、前記ゼロ代名詞リストに含まれない要素を、前記焦点候補リストに含まれる順番で結合したリストを、前記焦点リストとして更新し、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定されず、かつ、前記焦点候補リストが空である場合、前記焦点リストを更新せず、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定されず、かつ、前記焦点候補リストが空でない場合、前記焦点候補リストを前記焦点リストとして更新する請求項3記載の焦点推定装置。 - 前記照応解析部は、
前記発話履歴に格納されている前記発話に含まれる名詞句、及び前記焦点リストに格納されている焦点の少なくとも一方の各々について、
前記名詞句及び焦点の少なくとも一方が、テキストコーパスに含まれる述語の各々のゼロ代名詞を伴う格の格要素となる確率を算出することにより、前記推定した前記ユーザの発話に含まれる参照表現が参照している、又は前記ユーザの発話において省略されている名詞句及び焦点の少なくとも一方を推定し、更に、前記推定された名詞句及び焦点の少なくとも一方を、予め定められた格の順位に従って並べ替える請求項3又は4記載の焦点推定装置。 - 前記焦点候補抽出部は、前記ユーザの発話に対する形態素解析処理の結果及び固有表現抽出処理の結果に基づいて、前記ユーザの発話から少なくとも1つの単語からなる名詞句及び固有表現を前記発話の焦点候補として抽出する請求項1〜5の何れか1項記載の焦点推定装置。
- ユーザと対話を行う対話システムが、前記ユーザの発話の次に発話するときの発話の話題として使うための、前記ユーザの発話の話題を表す焦点を推定するための焦点推定モデルを学習するモデル学習装置において、
複数の文と、前記複数の文に含まれる少なくとも1つの単語からなる名詞句及び固有表現の少なくとも一方である焦点候補の各々に対して付与された、前記焦点候補の焦点らしさを表すスコアとを受け付ける入力部と、
前記入力部において受け付けた前記スコアが付与された前記焦点候補の各々について、前記焦点候補を含む文に対する形態素解析処理の結果に基づいて、前記焦点候補が文頭にあるか否か、前記焦点候補が文末にあるか否か、前記焦点候補の品詞に固有名詞又は未知語が含まれるか否か、前記焦点候補の品詞に動作性名詞が含まれるか否か、前記焦点候補の品詞に形容動詞が含まれるか否か、前記焦点候補の文字数、前記焦点候補の文字種が全てひらがなである場合におけるひらがなの文字数、前記焦点候補の文字種が全てカタカナである場合におけるカタカナの文字数、前記焦点候補の文字種が全て漢字である場合における漢字の文字数、前記焦点候補の直前の単語のN−gram、前記焦点候補の直前の品詞のN−gram、前記焦点候補の直後の単語のN−gram、及び前記焦点候補の直後の品詞のN−gramの少なくとも1つを表す素性からなる特徴量を抽出する特徴量抽出部と、
前記特徴量抽出部において抽出された前記焦点候補の各々の特徴量と、前記焦点候補の各々に付与された前記スコアとに基づいて、焦点らしさを表すスコアを推定するための焦点推定モデルを学習するモデル学習部と、
を含むモデル学習装置。 - 前記入力部は、前記複数の文と、前記複数の文に含まれる少なくとも1つの単語からなる名詞句及び固有表現である前記焦点候補の各々に対して付与された、前記焦点候補の焦点らしさを表すスコアとを受け付け、
前記特徴量抽出部は、前記入力部において受け付けた前記スコアが付与された前記焦点候補の各々について、前記焦点候補を含む文に対する形態素解析処理の結果及び固有表現抽出処理の結果に基づいて、前記焦点候補が文頭にあるか否か、前記焦点候補が文末にあるか否か、前記焦点候補の品詞に固有名詞又は未知語が含まれるか否か、前記焦点候補の品詞に動作性名詞が含まれるか否か、前記焦点候補の品詞に形容動詞が含まれるか否か、前記焦点候補の文字数、前記焦点候補の文字種が全てひらがなである場合におけるひらがなの文字数、前記焦点候補の文字種が全てカタカナである場合におけるカタカナの文字数、前記焦点候補の文字種が全て漢字である場合における漢字の文字数、前記焦点候補の直前の単語のN−gram、前記焦点候補の直前の品詞のN−gram、前記焦点候補の直後の単語のN−gram、及び前記焦点候補の直後の品詞のN−gramの少なくとも1つを表す素性からなる特徴量を抽出する請求項7記載のモデル学習装置。 - 焦点候補抽出部と、特徴量抽出部と、スコア算出部と、焦点候補選択部と、焦点更新部と、を含む、ユーザと対話を行う対話システムが、前記ユーザの発話の次に発話するときの発話の話題として使うための、前記ユーザの発話の話題を表す焦点を推定する焦点推定装置における焦点推定方法であって、
前記焦点候補抽出部は、入力された前記ユーザの発話に対する形態素解析処理の結果及び固有表現抽出処理の結果の少なくとも一方に基づいて、前記ユーザの発話から少なくとも1つの単語からなる名詞句及び固有表現の少なくとも一方を前記発話の焦点候補として抽出し、
前記特徴量抽出部は、前記焦点候補抽出部により抽出された焦点候補の各々について、前記ユーザの発話に対する形態素解析処理の結果に基づいて、前記焦点候補の特徴量を抽出し、
前記スコア算出部は、前記焦点候補の各々について、前記特徴量抽出部により抽出された前記焦点候補の特徴量と、焦点らしさを表すスコアを推定するための予め学習された焦点推定モデルとに基づいて、前記焦点候補の焦点らしさを表すスコアを算出し、
前記焦点候補選択部は、前記スコア算出部により算出された前記焦点候補の各々の前記スコアと、予め定められた閾値とに基づいて、前記焦点候補の各々から、前記ユーザの発話の焦点を選択し、
前記焦点更新部は、前記焦点候補選択部により選択された前記ユーザの発話の焦点を用いて、前記ユーザの発話の焦点が格納される焦点リストを更新する、
焦点推定方法。 - 照応解析部と、焦点候補抽出部と、特徴量抽出部と、スコア算出部と、焦点候補選択部と、焦点更新部と、を含む、ユーザと対話を行う対話システムが、前記ユーザの発話の次に発話するときの発話の話題として使うための、前記ユーザの発話の話題を表す焦点を推定する焦点推定装置における焦点推定方法であって、
前記照応解析部は、入力された前記ユーザの発話に対する係り受け解析処理の結果と、前記ユーザの発話より前における前記発話が格納されている発話履歴、及び前記ユーザの発話より前における前記発話の焦点が格納された焦点リストの少なくとも一方とに基づいて、前記発話履歴に格納されている前記発話に含まれる名詞句、及び前記焦点リストに格納されている焦点の少なくとも一方から、前記ユーザの発話に含まれる参照表現が参照している、又は前記ユーザの発話において省略されている名詞句及び焦点の少なくとも一方を推定し、
前記焦点候補抽出部は、前記入力された前記ユーザの発話に対する形態素解析処理の結果及び固有表現抽出処理の結果の少なくとも一方に基づいて、前記ユーザの発話から少なくとも1つの単語からなる名詞句及び固有表現の少なくとも一方を前記発話の焦点候補として抽出し、
前記特徴量抽出部は、前記焦点候補抽出部により抽出された焦点候補の各々について、前記ユーザの発話に対する形態素解析処理の結果に基づいて、前記焦点候補の特徴量を抽出し、
前記スコア算出部は、前記焦点候補の各々について、前記特徴量抽出部により抽出された前記焦点候補の特徴量と、焦点らしさを表すスコアを推定するための予め学習された焦点推定モデルとに基づいて、前記焦点候補の焦点らしさを表すスコアを算出し、
前記焦点候補選択部は、前記スコア算出部により算出された前記焦点候補の各々の前記スコアと、予め定められた閾値とに基づいて、前記焦点候補の各々から、前記ユーザの発話の焦点を選択し、
前記焦点更新部は、前記焦点候補選択部により選択された前記ユーザの発話の焦点と、前記照応解析部により推定された名詞句及び焦点の少なくとも一方とを用いて、前記焦点リストを更新する、
焦点推定方法。 - 前記焦点更新部により前記焦点リストを更新することは、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定された場合に、前記焦点候補選択部により選択された前記ユーザの発話の焦点と、前記照応解析部により推定された名詞句及び焦点の少なくとも一方とを用いて、前記焦点リストを更新し、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定されなかった場合に、前記焦点候補選択部により選択された前記ユーザの発話の焦点を用いて、前記焦点リストを更新する請求項10記載の焦点推定方法。 - 前記焦点候補選択部は、更に前記選択した前記ユーザの発話の焦点を、前記発話の焦点候補を前記スコア順に並べて格納した焦点候補リストに追加し、
前記照応解析部は、更に前記推定した前記ユーザの発話に含まれる参照表現が参照している、又は前記ユーザの発話において省略されている名詞句及び焦点の少なくとも一方をゼロ代名詞リストに格納し、
前記焦点更新部により前記焦点リストを更新することは、
前記焦点候補リストが空であり、かつ、前記ゼロ代名詞リストが空である場合、前記焦点リストを更新せず、
前記焦点候補リストが空でない場合、又は、前記ゼロ代名詞リストが空でない場合、前記ゼロ代名詞リストの末尾に、前記焦点候補リストに含まれる要素であって、かつ、前記ゼロ代名詞リストに含まれない要素を、前記焦点候補リストに含まれる順番で結合したリストを、前記焦点リストとして更新し、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定されず、かつ、前記焦点候補リストが空である場合、前記焦点リストを更新せず、
前記照応解析部により前記名詞句及び焦点の少なくとも一方が推定されず、かつ、前記焦点候補リストが空でない場合、前記焦点候補リストを前記焦点リストとして更新する請求項11記載の焦点推定方法。 - 前記照応解析部により名詞句及び焦点の少なくとも一方を推定することは、
前記発話履歴に格納されている前記発話に含まれる名詞句、及び前記焦点リストに格納されている焦点の少なくとも一方の各々について、前記名詞句及び焦点の少なくとも一方が、テキストコーパスに含まれる述語の各々のゼロ代名詞を伴う格の格要素となる確率を算出することにより、前記推定した前記ユーザの発話に含まれる参照表現が参照している、又は前記ユーザの発話において省略されている名詞句及び焦点の少なくとも一方を推定し、
更に、前記推定された名詞句及び焦点の少なくとも一方を、予め定められた格の順位に従って並べ替える請求項11又は12記載の焦点推定方法。 - 前記焦点候補抽出部により前記発話の焦点候補として抽出することは、前記ユーザの発話に対する形態素解析処理の結果及び固有表現抽出処理の結果に基づいて、前記ユーザの発話から少なくとも1つの単語からなる名詞句及び固有表現を前記発話の焦点候補として抽出する請求項9〜13の何れか1項記載の焦点推定方法。
- 入力部と、特徴量抽出部と、モデル学習部と、を含む、ユーザと対話を行う対話システムが、前記ユーザの発話の次に発話するときの発話の話題として使うための、前記ユーザの発話の話題を表す焦点を推定するための焦点推定モデルを学習するモデル学習装置におけるモデル学習方法であって、
前記入力部は、複数の文と、前記複数の文に含まれる少なくとも1つの単語からなる名詞句及び固有表現の少なくとも一方である焦点候補の各々に対して付与された、前記焦点候補の焦点らしさを表すスコアとを受け付け、
前記特徴量抽出部は、前記入力部において受け付けた前記スコアが付与された前記焦点候補の各々について、前記焦点候補を含む文に対する形態素解析処理の結果に基づいて、前記焦点候補が文頭にあるか否か、前記焦点候補が文末にあるか否か、前記焦点候補の品詞に固有名詞又は未知語が含まれるか否か、前記焦点候補の品詞に動作性名詞が含まれるか否か、前記焦点候補の品詞に形容動詞が含まれるか否か、前記焦点候補の文字数、前記焦点候補の文字種が全てひらがなである場合におけるひらがなの文字数、前記焦点候補の文字種が全てカタカナである場合におけるカタカナの文字数、前記焦点候補の文字種が全て漢字である場合における漢字の文字数、前記焦点候補の直前の単語のN−gram、前記焦点候補の直前の品詞のN−gram、前記焦点候補の直後の単語のN−gram、及び前記焦点候補の直後の品詞のN−gramの少なくとも1つを表す素性からなる特徴量を抽出し、
前記モデル学習部は、前記特徴量抽出部において抽出された前記焦点候補の各々の特徴量と、前記焦点候補の各々に付与された前記スコアとに基づいて、焦点らしさを表すスコアを推定するための焦点推定モデルを学習する、
モデル学習方法。 - 前記特徴量抽出部により特徴量を抽出することは、前記入力部において受け付けた前記スコアが付与された前記焦点候補の各々について、前記焦点候補を含む文に対する形態素解析処理の結果及び固有表現抽出処理の結果に基づいて、前記焦点候補が文頭にあるか否か、前記焦点候補が文末にあるか否か、前記焦点候補の品詞に固有名詞又は未知語が含まれるか否か、前記焦点候補の品詞に動作性名詞が含まれるか否か、前記焦点候補の品詞に形容動詞が含まれるか否か、前記焦点候補の文字数、前記焦点候補の文字種が全てひらがなである場合におけるひらがなの文字数、前記焦点候補の文字種が全てカタカナである場合におけるカタカナの文字数、前記焦点候補の文字種が全て漢字である場合における漢字の文字数、前記焦点候補の直前の単語のN−gram、前記焦点候補の直前の品詞のN−gram、前記焦点候補の直後の単語のN−gram、及び前記焦点候補の直後の品詞のN−gramの少なくとも1つを表す素性からなる特徴量を抽出する請求項15記載のモデル学習方法。
- コンピュータを、請求項1〜6の何れか1項記載の焦点推定装置を構成する各部として機能させるためのプログラム。
- コンピュータを、請求項7又は8記載のモデル学習装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013213885A JP5860861B2 (ja) | 2013-10-11 | 2013-10-11 | 焦点推定装置、モデル学習装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013213885A JP5860861B2 (ja) | 2013-10-11 | 2013-10-11 | 焦点推定装置、モデル学習装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015076054A JP2015076054A (ja) | 2015-04-20 |
JP5860861B2 true JP5860861B2 (ja) | 2016-02-16 |
Family
ID=53000825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013213885A Active JP5860861B2 (ja) | 2013-10-11 | 2013-10-11 | 焦点推定装置、モデル学習装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5860861B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11354601B2 (en) | 2018-03-16 | 2022-06-07 | Ricoh Company, Ltd. | Learning classification device and learning classification method |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000200273A (ja) * | 1998-11-04 | 2000-07-18 | Atr Interpreting Telecommunications Res Lab | 発話意図認識装置 |
JP5190415B2 (ja) * | 2009-06-04 | 2013-04-24 | パナソニック株式会社 | 半導体装置 |
JP5653709B2 (ja) * | 2010-10-19 | 2015-01-14 | 国立大学法人京都大学 | 質問応答システム |
-
2013
- 2013-10-11 JP JP2013213885A patent/JP5860861B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015076054A (ja) | 2015-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10496928B2 (en) | Non-factoid question-answering system and method | |
Ramisch et al. | mwetoolkit: A framework for multiword expression identification. | |
Oudah et al. | NERA 2.0: Improving coverage and performance of rule-based named entity recognition for Arabic | |
US9600469B2 (en) | Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon | |
KR101508070B1 (ko) | 어휘지도를 이용한 용언의 다의어 의미 분석 방법 | |
Atia et al. | Increasing the accuracy of opinion mining in Arabic | |
US20160275074A1 (en) | Anaphora resolution based on linguistic technologies | |
Castro et al. | Authorship verification, average similarity analysis | |
Huang et al. | An approach on Chinese microblog entity linking combining baidu encyclopaedia and word2vec | |
JP2014219872A (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
Gholami-Dastgerdi et al. | Part of speech tagging using part of speech sequence graph | |
Sunitha | A hybrid parts of speech tagger for Malayalam language | |
JP6126965B2 (ja) | 発話生成装置、方法、及びプログラム | |
JP5860861B2 (ja) | 焦点推定装置、モデル学習装置、方法、及びプログラム | |
US20110106849A1 (en) | New case generation device, new case generation method, and new case generation program | |
Akhundova | Named entity recognition for the Azerbaijani language | |
JP5698306B2 (ja) | 焦点推定装置、方法、及びプログラム | |
Ismail et al. | Developing an automated Bangla parts of speech tagged dictionary | |
JP6058563B2 (ja) | モデル学習装置、フィルタ装置、方法、及びプログラム | |
Deka et al. | A study of t’nt and crf based approach for pos tagging in assamese language | |
Malandrakis et al. | Affective language model adaptation via corpus selection | |
JP5744150B2 (ja) | 発話生成装置、方法、及びプログラム | |
Nahar et al. | SAP: standard Arabic profiling toolset for textual analysis | |
JP2005025659A (ja) | ゼロ代名詞解消方法、解消装置、解消プログラムおよびプログラムを記録した記録媒体 | |
Argaw et al. | Dictionary-based Amharic-French information retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150407 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5860861 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |