JP2018077780A - 項推定モデル学習装置、項推定装置、方法、及びプログラム - Google Patents

項推定モデル学習装置、項推定装置、方法、及びプログラム Download PDF

Info

Publication number
JP2018077780A
JP2018077780A JP2016220756A JP2016220756A JP2018077780A JP 2018077780 A JP2018077780 A JP 2018077780A JP 2016220756 A JP2016220756 A JP 2016220756A JP 2016220756 A JP2016220756 A JP 2016220756A JP 2018077780 A JP2018077780 A JP 2018077780A
Authority
JP
Japan
Prior art keywords
term
predicate
person
selection
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016220756A
Other languages
English (en)
Inventor
いつみ 斉藤
Itsumi Saito
いつみ 斉藤
久子 浅野
Hisako Asano
久子 浅野
齋藤 邦子
Kuniko Saito
邦子 齋藤
松尾 義博
Yoshihiro Matsuo
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016220756A priority Critical patent/JP2018077780A/ja
Publication of JP2018077780A publication Critical patent/JP2018077780A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】述語と組み合わせとなる、一人称又は二人称である項を精度よく推定することができる。【解決手段】置換部28が、テキストに対して述語項解析を行って得られた述語と項とのペアの各々について、指定代名詞リストに基づいて、項を、疑似一人称又は疑似二人称に置き換えたデータを作成し、選択選好モデル学習部30が、述語と項とのペアの各々と、ペアの各々について作成されたデータとに基づいて、選択選好モデルを学習する。素性抽出部36が、述語と項候補とのペアの各々について、選択選好モデルを用いて推定されるスコアを含む素性を抽出し、項選択モデル学習部38が、述語と前記項候補とのペアの各々について抽出された素性と、項候補に予め付与された正解とに基づいて、項選択モデルを学習する。【選択図】図1

Description

本発明は、項推定モデル学習装置、項推定装置、方法、及びプログラムに関する。
従来より、非特許文献1では、外界照応と項推定を同時に行う分類モデルとして定義している。まず述部抽出を行い、その後、観測名詞句+特殊名詞句のランキング問題として格推定を行う(図9参照)。
また、係り受け言語モデルでは、大規模平文コーパスに対し、既存解析器で述語項構造解析したデータから、項と述語の組み合わせの確率を計算する。これにより、述語に対する名詞句のかかりやすさを計算することができる(図10参照)。
ニューラルネットワークを用いた選択選好モデルが知られており、選択選好モデルは、SVOの三つ組みなど、述語と項の組み合わせに関して、組み合わせの尤もらしさを評価することができるモデルである(図11)。選択選好モデルは、入力単語をベクトル化するので未知の語にも頑健に動作する。
今村賢治,東中竜一郎,泉朋子,"ゼロ代名詞照応付き述語項構造解析の対話への適応", The Association for Natural Language Processing, 2014. Tim Van de Cruys, " A Neural Network Approach to Selectional Preference Acquisition", Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), pages 26-35, October 25-29, 2014.
上記の従来技術では、項の選択においては述語に対する項のかかりやすさを評価するためのモデルを用いることが重要となるため、係り受け言語モデルや選択選好モデルなどが利用されてきた。
しかし、I、YOUなどの一人称・二人称の外界照応は大規模な平文コーパスには明示的に出現しないため、大量のテキストから述語に対するI、Youのかかりやすさを直接求めることができない。
本発明は、上記問題点を解決するために成されたものであり、述語と組み合わせとなる、一人称又は二人称である項を精度よく推定することができる項推定モデル学習装置、項推定装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る項推定モデル学習装置は、テキストに対して述語項解析を行って得られた述語と項とのペアの各々について、各項について一人称又は二人称を対応付けた指定代名詞リストに基づいて、前記項を、疑似一人称又は疑似二人称に置き換えたデータを作成する置換部と、前記述語と項とのペアの各々と、前記ペアの各々について作成されたデータとに基づいて、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習する選択選好モデル学習部と、述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、前記選択選好モデルを用いて推定されるスコアを含む素性を抽出する素性抽出部と、述語と前記項候補とのペアの各々について抽出された素性と、正解となる前記項候補に予め付与された正解とに基づいて、前記項候補から述語と組み合わせとなる項を選択する項選択モデルを学習する項選択モデル学習部と、を含んで構成されている。
本発明に係る項推定モデル学習方法は、置換部が、テキストに対して述語項解析を行って得られた述語と項とのペアの各々について、各項について一人称又は二人称を対応付けた指定代名詞リストに基づいて、前記項を、疑似一人称又は疑似二人称に置き換えたデータを作成し、選択選好モデル学習部が、前記述語と項とのペアの各々と、前記ペアの各々について作成されたデータとに基づいて、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習し、素性抽出部が、述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、前記選択選好モデルを用いて推定されるスコアを含む素性を抽出し、項選択モデル学習部が、述語と前記項候補とのペアの各々について抽出された素性と、正解となる前記項候補に予め付与された正解とに基づいて、前記項候補から述語と組み合わせとなる項を選択する項選択モデルを学習する。
本発明に係る項推定装置は、入力テキストから述語を抽出する述語抽出部と、前記抽出された述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための予め学習された選択選好モデルを用いて推定されるスコアを含む素性を抽出する素性抽出部と、前記抽出された述語と前記項候補とのペアの各々について抽出された素性と、前記項候補から述語と組み合わせとなる項を選択するための予め学習された項選択モデルとに基づいて、前記項候補から、前記抽出された述語と組み合わせとなる項を選択する項推定部と、を含んで構成されている。
本発明に係る項推定方法は、述語抽出部が、入力テキストから述語を抽出し、素性抽出部が、前記抽出された述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための予め学習された選択選好モデルを用いて推定されるスコアを含む素性を抽出し、項推定部が、前記抽出された述語と前記項候補とのペアの各々について抽出された素性と、前記項候補から述語と組み合わせとなる項を選択するための予め学習された項選択モデルとに基づいて、前記項候補から、前記抽出された述語と組み合わせとなる項を選択する。
本発明に係るプログラムは、コンピュータを、上記発明に係る項推定モデル学習装置又は上記発明に係る項推定装置の各部として機能させるためのプログラムである。
本発明の項推定モデル学習装置、方法、及びプログラムによれば、述語と項とのペアの各々について、指定代名詞リストに基づいて、前記項を、疑似一人称又は疑似二人称に置き換えたデータを作成して、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習し、述語と項候補とのペアの各々について、選択選好モデルを用いて推定されるスコアを含む素性を抽出し、項候補から述語と組み合わせとなる項を選択する項選択モデルを学習することにより、述語と組み合わせとなる、一人称又は二人称である項を精度よく推定することができるモデルを学習することができる、という効果が得られる。
また、本発明の項推定装置、方法、及びプログラムによれば、入力テキストから述語を抽出し、抽出された述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、選択選好モデルを用いて推定されるスコアを含む素性を抽出し、項選択モデルに基づいて、項候補から、抽出された述語と組み合わせとなる項を選択することにより、述語と組み合わせとなる、一人称又は二人称である項を精度よく推定することができる、という効果が得られる。
本発明の実施の形態に係る項推定モデル学習装置の構成を示すブロック図である。 指定代名詞リストの一例を示す図である。 述語項構造解析結果の一例及び置換した結果の一例を示す図である。 選択選好モデルの一例を示す図である。 項選択モデルを学習する方法を説明するための図である。 本発明の実施の形態に係る項推定装置の構成を示すブロック図である。 本発明の実施の形態に係る項推定モデル学習装置における項推定モデル学習処理ルーチンを示すフローチャートである。 本発明の実施の形態に係る項推定装置における項推定処理ルーチンを示すフローチャートである。 従来技術を説明するための説明図である。 従来技術を説明するための説明図である。 従来技術を説明するための説明図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態の概要>
本発明の実施の形態は、対話データに対する述語項構造解析において自分を表す一人称(I),相手を表す二人称(You)の特殊な外界照応を精度よく求めるための技術である。
例えば、テキスト「いつまでに郵送すればよいですか?」に対して、述語項構造「I[ガ] 郵送する」を求める。また、テキスト「この住所に送ってください」に対して、述語項構造「YOU[ガ]送る」を求める。
なお、本実施の形態では、述語項構造解析とは、入力文に対し、述語と対応する項(格)を推定する技術のことをいい、主な格としてはガ、ヲ、二格の3つが存在する。例えば、入力文「私はカレーを食べた」に対して、述語項構造「私[ガ] カレー[ヲ] 食べる」を推定する。
また、日本語の述語項構造解析では、項の省略が頻繁に発生する。この、省略された項が何であるかを推定することをゼロ照応解析と呼ぶ。例えば、テキスト「先週ハワイに行った。とても暑かった。」に対して、ゼロ照応解析結果「ハワイ[ニ] 行く, ハワイ[ガ] 暑い」を求める。
また、述語項構造解析における外界照応とは、先行詞が記事内に現れないゼロ照応を指す。対話においては、一人称・二人称代名詞が省略されることも多く、非特許文献1などでは、対話用の外界照応として一人称(I)、二人称(You)を分けて推定している。
本発明の実施の形態では、I、Youなどに成りえる代名詞をあらかじめ設定し、その集合に対して代名詞をI、Youで置き換えたデータを作成し、ニューラルネットワークに基づく選択選好モデルを推定する。これにより、I、Youにかかりやすい述語、さらにはI・YOUのどちらにかかりやすいかのモデルを学習することができる。また、ニューラルネットワークのモデルを用いることで入力をベクトル化するため、学習データに存在しなかった語にも頑健に動作する。
<本発明の実施の形態に係る項推定モデル学習装置の構成>
次に、本発明の実施の形態に係る項推定モデル学習装置の構成について説明する。図1に示すように、本発明の実施の形態に係る項推定モデル学習装置100は、CPUと、RAMと、後述する項推定モデル学習処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この項推定モデル学習装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部42とを備えている。
入力部10は、各代名詞について一人称又は二人称を対応付けた指定代名詞リストを受け付ける。指定代名詞リストは、例えば、図2に示すような、一人称・二人称に対応する代名詞(名詞)のリストである。
演算部20は、指定代名詞リスト記憶部22と、大規模コーパス24と、述語項構造解析部26と、置換部28と、選択選好モデル学習部30と、選択選好モデル記憶部32と、項選択モデル学習データ記憶部34と、素性抽出部36と、項選択モデル学習部38と、項選択モデル記憶部40とを備えている。
指定代名詞リスト記憶部22は、入力部10により受け付けた指定代名詞リストを記憶している。
述語項構造解析部26は、大規模コーパス24に対して既存の解析器を用いて述語項構造解析する。例えば、図3に示すように、大規模コーパス24に含まれる入力文の各々に対して、述語項構造解析を行って、述語と項とのペアを得る。
置換部28は、述語項構造解析部26により得られた述語と項とのペアの各々に対して、指定代名詞リストに基づいて、当該項を、疑似一人称又は疑似二人称に置き換えたデータを作成する。具体的には、述語項構造解析部26により得られた述語と項とのペアの項の表層が、指定代名詞リストの代名詞、名詞に一致する場合、その項をそれぞれ疑似一人称(I)、疑似二人称(You)に置き換えたデータを作成する(図3参照)。
選択選好モデル学習部30は、述語項構造解析部26により得られた述語と項とのペアの各々と、置換部28によりペアの各々について作成されたデータとを統合し、述語、名詞句、格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習する。例えば、図4に示すような、述語、名詞句、及び格の各々をベクトル化し、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するニューラルネットワークを、選択選好モデルとして学習する。
選択選好モデル記憶部32は、選択選好モデル学習部30により学習された選択選好モデルを記憶している。
項選択モデル学習データ記憶部34は、述語と疑似一人称及び疑似二人称を含む項候補とのペアを、項選択モデル学習データとして複数記憶している。述語毎に、何れかの項候補に、当該述語と組み合わせとなる項の正解であることが人手で付与されている。なお、項候補には、疑似一人称及び疑似二人称以外に、テキスト中の名詞句、NULLが更に含まれている。
素性抽出部36は、項選択モデル学習データ記憶部34に記憶されている項選択モデル学習データの各々について、当該項選択モデル学習データの述語と項候補とのペアに対し、選択選好モデルを用いてスコアを推定すると共に、それ以外の素性を抽出し、当該項選択モデル学習データの素性とする。
項選択モデル学習部38は、項選択モデル学習データの各々について抽出された素性と、項選択モデル学習データに付与された正解とに基づいて、項候補から述語と組み合わせとなる項を選択する項選択モデルを学習する。
例えば、図5に示すように、述語とそれぞれの項候補のペアに対して、選択選好モデルを用いて推定されるスコアを一つの素性として、正解の項候補が最も上位にくるようにランキング学習を行う。
なお、項選択モデルとしては、素性を入力として述語と項候補の組み合わせを評価するスコアを出力するものであれば、どんなモデルであってもよい。
項選択モデル記憶部40は、項選択モデル学習部38によって学習された項選択モデルを記憶している。
出力部42は、選択選好モデル記憶部32に記憶されている選択選好モデル、及び項選択モデル記憶部40に記憶されている項選択モデルを出力する。
<本発明の実施の形態に係る項推定装置の構成>
次に、本発明の実施の形態に係る項推定装置の構成について説明する。図6に示すように、本発明の実施の形態に係る項推定装置200は、CPUと、RAMと、後述する項推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この項推定装置200は、機能的には図6に示すように入力部50と、演算部60と、出力部90とを備えている。
入力部50は、解析対象である入力テキストを受け付ける。
演算部60は、述語抽出部62と、選択選好モデル記憶部64と、素性抽出部66と、項選択モデル記憶部68と、項推定部70とを備える。
述語抽出部62は、入力部50により受け付けた入力テキストから、述語を抽出する。
選択選好モデル記憶部64は、項推定モデル学習装置100によって学習された選択選好モデルを記憶している。
素性抽出部66は、述語抽出部62によって抽出された述語と、疑似一人称及び疑似二人称を含む項候補とのペアの各々に対し、選択選好モデルを用いてスコアを推定すると共に、それ以外の素性を抽出し、当該ペアの素性とする。なお、項候補には、従来既知の項候補抽出手法によって入力テキスト中から抽出された名詞句、exog、NULLが更に含まれている。
項選択モデル記憶部68は、項推定モデル学習装置100によって学習された項選択モデルを記憶している。
項推定部70は、素性抽出部66によって述語と項候補とのペアの各々について抽出された素性と、項選択モデルとに基づいて、項候補から、抽出された述語と組み合わせとなる項を選択し、抽出された述語と選択された項とのペアを、述語項構造として、出力部90により出力する。
<本発明の実施の形態に係る項推定モデル学習装置の作用>
次に、本発明の実施の形態に係る項推定モデル学習装置100の作用について説明する。入力部10において指定代名詞リストを受け付けると、指定代名詞リストが指定代名詞リスト記憶部22に格納される。そして、項推定モデル学習装置100は、図7に示す項推定モデル学習処理ルーチンを実行する。
まず、ステップS100で、大規模コーパス24に対して既存の解析器を用いて述語項構造解析を行って、述語と項とのペアを得る。
ステップS102で、上記ステップS100で得られた述語と項とのペアの各々に対して、指定代名詞リストに基づいて、当該項を、疑似一人称及び疑似二人称の各々に置き換えたデータを作成する。
ステップS104では、上記ステップS100で得られた述語と項とのペアの各々と、上記ステップS102で作成されたデータとを統合し、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習して、選択選好モデル記憶部32に格納する。
ステップS106では、項選択モデル学習データ記憶部34に記憶されている項選択モデル学習データの各々について、当該項選択モデル学習データの述語と項候補とのペアに対し、上記ステップS104で学習された選択選好モデルを用いてスコアを推定すると共に、それ以外の素性を抽出し、当該項選択モデル学習データの素性とする。
ステップS108では、上記ステップS106で項選択モデル学習データの各々について抽出された素性と、項選択モデル学習データに付された正解とに基づいて、項候補から述語と組み合わせとなる項を選択する項選択モデルを学習し、項選択モデル記憶部40に格納して、項推定モデル学習処理ルーチンを終了する。
<本発明の実施の形態に係る項推定装置の作用>
次に、本発明の実施の形態に係る項推定装置200の作用について説明する。項推定モデル学習装置100によって予め学習された、選択選好モデル及び項選択モデルが項推定装置200に入力されると、項推定装置200は、選択選好モデルを、選択選好モデル記憶部64へ格納し、項選択モデルを、項選択モデル記憶部68に格納する。そして、入力部10が入力テキストを受け付けると、項推定装置200は、図8に示す項推定処理ルーチンを実行する。
ステップS110で、入力部50により受け付けた入力テキストから、述語を抽出する。
ステップS112では、上記ステップS110で抽出された述語と、疑似一人称及び疑似二人称を含む項候補とのペアの各々に対し、選択選好モデルを用いてスコアを推定すると共に、それ以外の素性を抽出し、当該ペアの素性とする。
ステップS114では、上記ステップS112で述語と項候補とのペアの各々について抽出された素性と、項選択モデルとに基づいて、項候補から、抽出された述語と組み合わせとなる項を選択する。
ステップS116では、上記ステップS110で抽出された述語と上記ステップS114で選択された項とのペアを、述語項構造として、出力部90により出力して、項推定処理ルーチンを終了する。
以上説明したように、本発明の実施の形態に係る項推定モデル学習装置によれば、述語と項とのペアの各々について、指定代名詞リストに基づいて、項を、疑似一人称又は疑似二人称に置き換えたデータを作成して、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習し、述語と項候補とのペアの各々について、選択選好モデルを用いて推定されるスコアを含む素性を抽出し、項候補から述語と組み合わせとなる項を選択する項選択モデルを学習することにより、述語と組み合わせとなる、一人称又は二人称である項を精度よく推定することができるモデルを学習することができる。
また、従来技術で素性として大規模データをうまく活用できていなかった一人称・二人称の外界照応に関して、あらかじめ設定した代名詞をI,YOUに置き換えたデータを自動生成し、ニューラルネットワークに基づく選択選好モデルを学習する。この選択選好モデルを、述語項構造解析の素性として導入することによって、I,Youの外界照応の識別性能が向上する。
また、本発明の実施の形態に係る項推定装置によれば、入力テキストから述語を抽出し、抽出された述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、選択選好モデルを用いて推定されるスコアを含む素性を抽出し、項選択モデルに基づいて、項候補から、抽出された述語と組み合わせとなる項を選択することにより、述語と組み合わせとなる、一人称又は二人称である項を精度よく推定することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述した実施の形態では、上述の項推定装置200は、選択選好モデル記憶部64、及び項選択モデル記憶部68を備えている場合について説明したが、例えば選択選好モデル記憶部64、及び項選択モデル記憶部68の少なくとも1つが項推定装置200の外部装置に設けられ、項推定装置200は、外部装置と通信手段を用いて通信することにより、選択選好モデル記憶部64、及び項選択モデル記憶部68を参照するようにしてもよい。
また、上述の項推定モデル学習装置100についても、外部装置に設けられた、指定代名詞リスト記憶部22、大規模コーパス24、及び項選択モデル学習データ記憶部34の少なくとも1つと通信手段を用いて通信することにより、指定代名詞リスト記憶部22、大規模コーパス24、及び項選択モデル学習データ記憶部34を参照するようにしてもよい。
また、上記実施の形態では、項推定装置200と項推定モデル学習装置100とを別々の装置として構成する場合を例に説明したが、項推定装置200と項推定モデル学習装置100とを1つの装置として構成してもよい。
上述の項推定モデル学習装置及び項推定装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
10、50 入力部
20、60 演算部
22 指定代名詞リスト記憶部
24 大規模コーパス
26 述語項構造解析部
28 置換部
30 選択選好モデル学習部
32、64 選択選好モデル記憶部
34 項選択モデル学習データ記憶部
36、66 素性抽出部
38 項選択モデル学習部
40、68 項選択モデル記憶部
42、90 出力部
62 述語抽出部
70 項推定部
100 項推定モデル学習装置
200 項推定装置

Claims (7)

  1. テキストに対して述語項解析を行って得られた述語と項とのペアの各々について、各項について一人称又は二人称を対応付けた指定代名詞リストに基づいて、前記項を、疑似一人称又は疑似二人称に置き換えたデータを作成する置換部と、
    前記述語と項とのペアの各々と、前記ペアの各々について作成されたデータとに基づいて、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習する選択選好モデル学習部と、
    述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、前記選択選好モデルを用いて推定されるスコアを含む素性を抽出する素性抽出部と、
    述語と前記項候補とのペアの各々について抽出された素性と、正解となる前記項候補に予め付与された正解とに基づいて、前記項候補から述語と組み合わせとなる項を選択する項選択モデルを学習する項選択モデル学習部と、
    を含む項推定モデル学習装置。
  2. 前記選択選好モデルを、述語、名詞句、及び格の各々をベクトル化し、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するニューラルネットワークとした請求項1記載の項推定モデル学習装置。
  3. 入力テキストから述語を抽出する述語抽出部と、
    前記抽出された述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための予め学習された選択選好モデルを用いて推定されるスコアを含む素性を抽出する素性抽出部と、
    前記抽出された述語と前記項候補とのペアの各々について抽出された素性と、前記項候補から述語と組み合わせとなる項を選択するための予め学習された項選択モデルとに基づいて、前記項候補から、前記抽出された述語と組み合わせとなる項を選択する項推定部と、
    を含む項推定装置。
  4. 前記選択選好モデルを、述語、名詞句、及び格の各々をベクトル化し、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するニューラルネットワークとした請求項3記載の項推定装置。
  5. 置換部が、テキストに対して述語項解析を行って得られた述語と項とのペアの各々について、各項について一人称又は二人称を対応付けた指定代名詞リストに基づいて、前記項を、疑似一人称又は疑似二人称に置き換えたデータを作成し、
    選択選好モデル学習部が、前記述語と項とのペアの各々と、前記ペアの各々について作成されたデータとに基づいて、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための選択選好モデルを学習し、
    素性抽出部が、述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、前記選択選好モデルを用いて推定されるスコアを含む素性を抽出し、
    項選択モデル学習部が、述語と前記項候補とのペアの各々について抽出された素性と、正解となる前記項候補に予め付与された正解とに基づいて、前記項候補から述語と組み合わせとなる項を選択する項選択モデルを学習する
    項推定モデル学習方法。
  6. 述語抽出部が、入力テキストから述語を抽出し、
    素性抽出部が、前記抽出された述語と疑似一人称又は疑似二人称を含む項候補とのペアの各々について、述語、名詞句、及び格の組み合わせの尤もらしさを表すスコアを推定するための予め学習された選択選好モデルを用いて推定されるスコアを含む素性を抽出し、
    項推定部が、前記抽出された述語と前記項候補とのペアの各々について抽出された素性と、前記項候補から述語と組み合わせとなる項を選択するための予め学習された項選択モデルとに基づいて、前記項候補から、前記抽出された述語と組み合わせとなる項を選択する
    項推定方法。
  7. コンピュータを、請求項1若しくは2に記載の項推定モデル学習装置の各部、又は請求項3若しくは4に記載の項推定装置の各部として機能させるためのプログラム。
JP2016220756A 2016-11-11 2016-11-11 項推定モデル学習装置、項推定装置、方法、及びプログラム Pending JP2018077780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016220756A JP2018077780A (ja) 2016-11-11 2016-11-11 項推定モデル学習装置、項推定装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016220756A JP2018077780A (ja) 2016-11-11 2016-11-11 項推定モデル学習装置、項推定装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2018077780A true JP2018077780A (ja) 2018-05-17

Family

ID=62149387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016220756A Pending JP2018077780A (ja) 2016-11-11 2016-11-11 項推定モデル学習装置、項推定装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2018077780A (ja)

Similar Documents

Publication Publication Date Title
JP7031101B2 (ja) 方法、システムおよび有形コンピュータ可読デバイス
CN108427707B (zh) 人机问答方法、装置、计算机设备和存储介质
CN110895559B (zh) 模型训练、文本处理方法、装置以及设备
US11295092B2 (en) Automatic post-editing model for neural machine translation
US10789431B2 (en) Method and system of translating a source sentence in a first language into a target sentence in a second language
US20190188257A1 (en) Context analysis apparatus and computer program therefor
CN108595629B (zh) 用于答案选择系统的数据处理方法及应用
KR101224660B1 (ko) 유사 문장 검색 장치, 검색 방법, 저장 매체, 자동 대화서비스 시스템 및 서비스 방법
CN110543643A (zh) 文本翻译模型的训练方法及装置
US20170243116A1 (en) Apparatus and method to determine keywords enabling reliable search for an answer to question information
CN112883193A (zh) 一种文本分类模型的训练方法、装置、设备以及可读介质
Boudchiche et al. A hybrid approach for Arabic lemmatization
CN112560510B (zh) 翻译模型训练方法、装置、设备及存储介质
JP6306376B2 (ja) 翻訳装置及び翻訳方法
JP2018206263A (ja) 述語項構造モデル生成装置、述語項構造解析装置、方法、及びプログラム
JP2018097468A (ja) 文分類学習装置、文分類装置、文分類学習方法、及び文分類学習プログラム
CN110991193B (zh) 一种基于OpenKiWi的翻译矩阵模型选择系统
WO2020199590A1 (zh) 情绪检测分析方法及相关装置
JP5954836B2 (ja) 不理解文判定モデル学習方法、不理解文判定方法、装置、及びプログラム
CN113705198B (zh) 场景图生成方法、装置、电子设备及存储介质
CN112735465B (zh) 无效信息确定方法、装置、计算机设备及存储介质
JP2018077780A (ja) 項推定モデル学習装置、項推定装置、方法、及びプログラム
JP2017538226A (ja) スケーラブルなウェブデータの抽出
US9940319B2 (en) Information analysis system, information analysis method, and information analysis program
JP5911931B2 (ja) 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体