JP6381136B2 - 空範疇推定装置、空範疇推定モデル学習装置、方法、及びプログラム - Google Patents
空範疇推定装置、空範疇推定モデル学習装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6381136B2 JP6381136B2 JP2015103963A JP2015103963A JP6381136B2 JP 6381136 B2 JP6381136 B2 JP 6381136B2 JP 2015103963 A JP2015103963 A JP 2015103963A JP 2015103963 A JP2015103963 A JP 2015103963A JP 6381136 B2 JP6381136 B2 JP 6381136B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- empty category
- empty
- label
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Description
本実施の形態は、同時文脈ラベル埋込法(joint context-label embedding)を用いた空範疇(EC:empty category)検出の品質を向上させることを目的とする。空範疇は、テキスト中に明示的には現れていない名詞的単語(nominal word)である。通例、省略または移動により生じる。本実施の形態では、空範疇の位置の特徴として、単語の分散表現を、空範疇の存在およびラベルを決定するために用いる。
<EC位置の記述>
非特許文献1に示された方法に引き続き、我々は、ECの位置の候補の全てを、テキスト中の単語の依存関係を表わす依存構造木を用いて収集する。ECの位置の候補の各々は、単語対、すなわち「<主辞単語,後続単語>」を用いて表現可能である。後続単語(following word)とは、文中の記述位置に続く単語のことである。主辞単語(head word)は、依存構造木においてその位置にECがあると仮定する際にECが修飾する(attach)単語のことである。図1Aは中国語の文「吃了」に対する依存構造木においてECの位置を表現する例である。先頭が「吃」であり、「了」が後続するため、ECの位置の候補Position-1は「<吃,了>」として表現され、ECの位置の候補Position-2は、「<吃,。>」として表現される。
そして、我々は、上述のように定義された各ECの位置の候補の特徴を抽出する。特徴ベクトルは、EC検出に役立つものと期待される、テキスト中の単語の分散表現を連結することにより構成される。本実施の形態では、あるECに対する特徴ベクトルが、(1)主辞単語(ダミーのルートノードを除く)の分散表現、(2)テキスト中の後続単語の分散表現、(3)「甥(nephews)」すなわち後続単語の子の分散表現、(4)依存構造木の経路上の各単語の分散表現を含んで構成される。これらを特徴テンプレートと呼ぶ。
本実施の形態におけるEC検出方法は、2つの写像MAPA、MAPBから成る。MAPAは、ECの位置の候補に対するn次元の特徴ベクトルXから、低次元(k次元)のベクトル空間への写像fA(X)を表す。
fA(X) → WAX (1)
fB(Labeli) → Wi B (2)
次に、本発明の実施の形態に係る空範疇推定モデル学習装置の構成について説明する。図2に示すように、本発明の実施の形態に係る空範疇推定モデル学習装置100は、CPUと、RAMと、後述する空範疇推定モデル学習処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この空範疇推定モデル学習装置100は、機能的には図2に示すように入力部10と、演算部20と、出力部90とを備えている。
次に、本発明の実施の形態に係る空範疇推定装置の構成について説明する。図3に示すように、本発明の実施の形態に係る空範疇推定装置200は、CPUと、RAMと、後述する空範疇推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この空範疇推定装置200は、機能的には図3に示すように入力部210と、演算部220と、出力部290とを備えている。
次に、本発明の実施の形態に係る空範疇推定モデル学習装置100の作用について説明する。入力部10において、ECの位置及びECラベルの正解データが予め付与された、学習用のテキストを表す依存構造木を複数受け付けると、複数の依存構造木を依存構造木22に記憶すると共に、正解データを、ECラベル正解データ38に記憶し、空範疇推定モデル学習装置100は、図4に示す空範疇推定モデル学習処理ルーチンを実行する。
次に、本発明の実施の形態に係る空範疇推定装置200の作用について説明する。入力部210において推定対象のテキストを表す依存構造木、及び特徴テンプレートを受け付けると、受け付けた依存構造木を依存構造木222に記憶すると共に、特徴テンプレートを、特徴テンプレート226に記憶し、空範疇推定装置200は、図5に示す空範疇推定処理ルーチンを実行する。
<実験データ>
本実施の形態で説明した方法は、アノテーションされたコーパスが利用可能な様々な種類の言語に適用可能である。我々の実験では、中国語ツリーバンクV7.0(Chinese Penn Treebank V7.0)の一部を用いた。データセットを、トレーニングデータ、開発データおよびテストデータの3つの部分に分ける。従来の研究に引き続き、我々は、ファイル1〜40および901〜931をテストデータとし、ファイル41〜80を開発データとしている。トレーニングデータには、ファイル{81〜325,400〜454,500〜554,590〜596,6000〜885,900}が含まれている。図6に、テストデータにおけるECラベルの分布を示す。この実験における本実施形態では、2つのECが同じ主辞単語と後続単語を持つ場合を扱わなかったので、テストデータにおけるECの合計は非特許文献1より若干少ない(なお、本実施形態において、ECラベルを依存関係タイプを考慮するように拡張すれば、このような場合も扱うことができる)。開発データは、パラメータを調整するために用いられ、その最終結果はテストデータについて報告される。CTBツリーは、ECが保たれた特徴抽出用の依存構造木に変換して用いた。
実験において、パラメータを、学習率(learning rate)=10-1、単語ベクトル次元=80、および隠れ層(hidden layer)次元=500に設定した。
図7に、実験結果として、正解数(correct)と適合率(p)と再現率(r)とF1値(F1)とを示す。ここでは空範疇ラベルとして、Chinese Penn Treebankで定義されているものをそのまま用いた。PRO (big PRO)はコントロール構文などに出現する義務的な照応、pro (small pro)は省略された代名詞、Tは関係節や主題化などの移動における痕跡、OPは空の関係代名詞、RNRは右節点繰り上げ、*は受動構文や繰り上げ構文により生じた痕跡を表す。本実施の形態の手法の結果と、従来の最先端技術による方法(非特許文献1のXue)とを比較する。ここに提供した方法は、CTBについて我々が知る限り最新の最先端技術による性能をもたらすものである。本実施の形態の手法は、従来の最先端技術による方法より、高精度にECラベルを推定できることが分かった。
また、中国語のテキストに対して、空範疇を推定する場合を例に説明したが、これに限定されるものではなく、中国語以外の言語、例えば、日本語のテキストに対して、空範疇を推定するようにしてもよい。
20、220 演算部
24 特徴テンプレート作成部
30、230 特徴抽出部
40 学習部
46 ラベル予測部
48 収束判定部
50 モデル更新部
90、290 出力部
100 空範疇推定モデル学習装置
200 空範疇推定装置
238 推定部
Claims (9)
- 入力テキストから、省略又は移動により生じた名詞的語句である空範疇を推定するための空範疇推定装置であって、
前記入力テキストの依存構造木に基づいて、空範疇の位置の候補の各々に対し、前記空範疇の位置の候補の特徴として、単語の分散表現を抽出する特徴抽出部と、
予め学習された、前記特徴から低次元空間への写像、及び空範疇ラベルの各々から前記低次元空間への写像を含むモデルと、前記特徴抽出部によって抽出された前記空範疇の位置の候補の各々の前記特徴とに基づいて、前記空範疇の位置及び前記空範疇ラベルを推定する推定部と、
を含む空範疇推定装置。 - 前記特徴抽出部は、前記空範疇の位置の候補の特徴として、前記空範疇の位置の候補の主辞単語の分散表現、前記空範疇の位置の候補に後続する後続単語の分散表現、前記依存構造木における、前記後続単語に対応するノードの子ノードが表す単語の分散表現、及び前記依存構造木における、ルートノードから前記空範疇の位置の候補までの経路上の各単語の分散表現の少なくとも1つを抽出する請求項1記載の空範疇推定装置。
- 前記推定部は、前記特徴抽出部によって抽出された前記空範疇の位置の候補の前記特徴、前記特徴から低次元空間への写像、及び前記空範疇ラベルから前記低次元空間への写像に基づいて算出されるスコアが最大となる、前記空範疇の位置の候補及び前記空範疇ラベルの組み合わせを、前記空範疇の位置及び前記空範疇ラベルの推定結果とする請求項1又は2記載の空範疇推定装置。
- 省略又は移動により生じた名詞的語句である空範疇の位置及び空範疇ラベルが付与された複数のテキストの各々について、前記テキストの依存構造木に基づいて、空範疇の位置の候補の各々に対し、前記空範疇の位置の候補の特徴として、単語の分散表現を抽出する特徴抽出部と、
前記特徴抽出部によって前記複数のテキストの各々について抽出された前記空範疇の位置の候補の各々の前記特徴と、前記複数のテキストの各々に付与された前記空範疇の位置及び空範疇ラベルとに基づいて、前記特徴から低次元空間への写像、及び空範疇ラベルの各々から前記低次元空間への写像を含むモデルを学習する学習部と、
を含む空範疇推定モデル学習装置。 - 前記特徴抽出部は、前記空範疇の位置の候補の特徴として、前記空範疇の位置の候補の主辞単語の分散表現、前記空範疇の位置の候補に後続する後続単語の分散表現、前記依存構造木における、前記後続単語に対応するノードの子ノードが表す単語の分散表現、及び前記依存構造木における、ルートノードから前記空範疇の位置の候補までの経路上の各単語の分散表現の少なくとも1つを抽出する請求項4記載の空範疇推定モデル学習装置。
- 特徴抽出部及び推定部を含み、入力テキストから、省略又は移動により生じた名詞的語句である空範疇を推定するための空範疇推定装置における空範疇推定方法であって、
前記特徴抽出部が、前記入力テキストの依存構造木に基づいて、空範疇の位置の候補の各々に対し、前記空範疇の位置の候補の特徴として、単語の分散表現を抽出し、
前記推定部が、予め学習された、前記特徴から低次元空間への写像、及び空範疇ラベルの各々から前記低次元空間への写像を含むモデルと、前記特徴抽出部によって抽出された前記空範疇の位置の候補の各々の前記特徴とに基づいて、前記空範疇の位置及び前記空範疇ラベルを推定する
空範疇推定方法。 - 特徴抽出部及び学習部を含む空範疇推定モデル学習装置における空範疇推定モデル学習方法であって、
前記特徴抽出部が、省略又は移動により生じた名詞的語句である空範疇の位置及び空範疇ラベルが付与された複数のテキストの各々について、前記テキストの依存構造木に基づいて、空範疇の位置の候補の各々に対し、前記空範疇の位置の候補の特徴として、単語の分散表現を抽出し、
前記学習部が、前記特徴抽出部によって前記複数のテキストの各々について抽出された前記空範疇の位置の候補の各々の前記特徴と、前記複数のテキストの各々に付与された前記空範疇の位置及び空範疇ラベルとに基づいて、前記特徴から低次元空間への写像、及び空範疇ラベルの各々から前記低次元空間への写像を含むモデルを学習する
空範疇推定モデル学習方法。 - コンピュータを、請求項1〜請求項3の何れか1項記載の空範疇推定装置の各部として機能させるためのプログラム。
- コンピュータを、請求項4又は5記載の空範疇推定モデル学習装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015103963A JP6381136B2 (ja) | 2015-05-21 | 2015-05-21 | 空範疇推定装置、空範疇推定モデル学習装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015103963A JP6381136B2 (ja) | 2015-05-21 | 2015-05-21 | 空範疇推定装置、空範疇推定モデル学習装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016218806A JP2016218806A (ja) | 2016-12-22 |
JP6381136B2 true JP6381136B2 (ja) | 2018-08-29 |
Family
ID=57581098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015103963A Active JP6381136B2 (ja) | 2015-05-21 | 2015-05-21 | 空範疇推定装置、空範疇推定モデル学習装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6381136B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6543169B2 (ja) * | 2015-11-09 | 2019-07-10 | 日本電信電話株式会社 | 空範疇検出装置、空範疇検出モデル学習装置、方法、及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1185749A (ja) * | 1997-09-10 | 1999-03-30 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 日本語省略要素補完装置 |
JP2005025659A (ja) * | 2003-07-01 | 2005-01-27 | Nippon Telegr & Teleph Corp <Ntt> | ゼロ代名詞解消方法、解消装置、解消プログラムおよびプログラムを記録した記録媒体 |
US8903707B2 (en) * | 2012-01-12 | 2014-12-02 | International Business Machines Corporation | Predicting pronouns of dropped pronoun style languages for natural language translation |
JP2014010778A (ja) * | 2012-07-02 | 2014-01-20 | Nippon Telegr & Teleph Corp <Ntt> | 認識モデル学習装置、認識装置、方法、及びプログラム |
-
2015
- 2015-05-21 JP JP2015103963A patent/JP6381136B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016218806A (ja) | 2016-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182295B (zh) | 一种企业知识图谱属性抽取方法及系统 | |
CN111914568B (zh) | 文本修辞句的生成方法、装置、设备及可读存储介质 | |
CN103853710B (zh) | 一种基于协同训练的双语命名实体识别方法 | |
CN110490081B (zh) | 一种基于聚焦权重矩阵与变尺度语义分割神经网络的遥感对象解译方法 | |
CN110851641B (zh) | 跨模态检索方法、装置和可读存储介质 | |
US11568132B2 (en) | Phrase generation relationship estimation model learning device, phrase generation device, method, and program | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
CN106202030B (zh) | 一种基于异构标注数据的快速序列标注方法及装置 | |
CN111401084A (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
CN109783812B (zh) | 基于自注意力机制的中文命名实体识别方法、系统、装置 | |
JP6738769B2 (ja) | 文ペア分類装置、文ペア分類学習装置、方法、及びプログラム | |
CN110472062B (zh) | 识别命名实体的方法及装置 | |
CN113128203A (zh) | 基于注意力机制的关系抽取方法、系统、设备及存储介质 | |
JP6558863B2 (ja) | モデル作成装置、推定装置、方法、及びプログラム | |
JP6145059B2 (ja) | モデル学習装置、形態素解析装置、及び方法 | |
JP5441937B2 (ja) | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム | |
JP6291440B2 (ja) | パラメータ学習方法、装置、及びプログラム | |
JP6467893B2 (ja) | 情報処理システム、情報処理方法、及び、プログラム | |
JP6381136B2 (ja) | 空範疇推定装置、空範疇推定モデル学習装置、方法、及びプログラム | |
JP6062829B2 (ja) | 係り受け関係解析パラメータ学習装置、係り受け関係解析装置、方法、及びプログラム | |
CN113761151A (zh) | 同义词挖掘、问答方法、装置、计算机设备和存储介质 | |
CN113312918A (zh) | 融合部首向量的分词和胶囊网络法律命名实体识别方法 | |
JP5694893B2 (ja) | 最適翻訳文選択装置、翻訳文選択モデル学習装置、方法、及びプログラム | |
CN116629211A (zh) | 基于人工智能的写作方法及系统 | |
JP2017078919A (ja) | 単語拡張装置、分類装置、機械学習装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180501 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180522 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180724 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180730 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6381136 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |