JP6550677B2 - 符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム - Google Patents

符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム Download PDF

Info

Publication number
JP6550677B2
JP6550677B2 JP2016065764A JP2016065764A JP6550677B2 JP 6550677 B2 JP6550677 B2 JP 6550677B2 JP 2016065764 A JP2016065764 A JP 2016065764A JP 2016065764 A JP2016065764 A JP 2016065764A JP 6550677 B2 JP6550677 B2 JP 6550677B2
Authority
JP
Japan
Prior art keywords
node
edge
unit
label
acyclic graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016065764A
Other languages
English (en)
Other versions
JP2017182277A (ja
Inventor
鈴木 潤
潤 鈴木
直観 岡崎
直観 岡崎
翔 高瀬
翔 高瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Original Assignee
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, Nippon Telegraph and Telephone Corp filed Critical Tohoku University NUC
Priority to JP2016065764A priority Critical patent/JP6550677B2/ja
Publication of JP2017182277A publication Critical patent/JP2017182277A/ja
Application granted granted Critical
Publication of JP6550677B2 publication Critical patent/JP6550677B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Description

本発明は、符号化装置、復号化装置、離散系列変換装置、方法、及びプログラムに係り、特に、入力されたシンボルの離散系列に対して符号化又は復号化を行うための符号化装置、復号化装置、離散系列変換装置、方法、及びプログラムに関する。
自然言語処理分野の問題を題材として背景技術を説明する。計算機により自然言語を処理する技術は、文章に現れる表層的な文字や単語といった離散シンボルの集合を処理する技術と言える。例えば、ある言語の文を入力し、別の言語の文を出力する自動翻訳システムを考える。このシステムでは、入力および出力の文を単語列(文字列)とみなして処理が行われる。よって、システム内の計算機により、離散系列(シンボル列)から別の離散系列へ変換する処理を行っているとみなすことができる。また、文書要約システム、対話システム、文書構成システムなどの言語を入出力とするシステムは、前述の翻訳システム同様、離散系列から別の離散系列へ変換する処理によってシステムが構成されると言える。このように、前述の自然言語処理システム以外の自然言語処理システムでも、自然言語を扱うシステムでは、扱う対象が単語、文、文書といった離散系列であるため、入力から出力へどのような変換を行うかという定義の違いはあるにせよ、処理のフレームワークは同じであり、離散系列から離散系列の変換問題に帰着できる。図1に自然言語処理における変換問題の各種の例を示す。
前述したように、離散系列-離散系列変換問題は、自然言語処理分野において数多くの方法が開発され、様々な方法論が確立されている。古典的には、人間が系列から系列への変換ルールや規則などを記述して変換方法を構築してきた。近年では、正解データを利用したり、最適化法を用いるなど、機械学習技術を活用する方法が主流となっている。最近では、機械学習法の中でもリカレントニューラルネットの枠組みを使い、離散系列を実数値ベクトルへ符号化し、その実数値ベクトルから離散系列を復号するという方法論で離散系列-離散系列変換問題を解く方法が提案されている(非特許文献1)。この方法は、人手による事前知識を全く使わず、可変長の系列構造から系列構造への変換を固定長の実数値ベクトルへの符号化と復号化のみで実現していることが大きな特徴である。図7に符号器による符号化と、復号器による復号化の例を示す。
この「リカレントニューラルネットに基づく離散系列から離散系列への変換器」を、ここでは単純に「離散系列−離散系列変換器」と呼ぶことにする。また、離散系列-離散系列変換器は、離散系列符号器と離散系列復号器の二つの組み合わせにて構築されている。また、符号/復号器のパラメタである固定長の実数値ベクトルは、学習用データから自動的に獲得する。パラメタ学習は、それぞれの変換器の理想的な入力と出力のペアの集合を学習用データとして準備し、その学習用データの入力が正しく出力できるようにパラメタ調整を行うことで学習が進む。
Ilya Sutskever, Oriol Vinyals, and Quoc V Le, Sequence to Sequence Learning with Neural Networks. Advances in Neural Information Processing Systems 27, 2014. Laura Banarescu, Claire Bonial, Shu Cai, Madalina Georgescu, Kira Griffitt, UlfHermjakob, Kevin Knight,Philipp Koehn, Martha Palmer, and Nathan Schneider, Abstract Meaning Representation for Sembanking.Proceedings of the 7th Linguistic Annotation Workshop and Interoperability with Discourse, 2013. Kai Sheng Tai, Richard Socher and Christopher D. Manning. Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks. Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing,2015.
自然言語処理では、文章を文法や意味的に解析する技術が盛んに研究開発されてきた。こういった、文章の文法や意味的な情報は、主に木構造や有向非循環グラフなどの離散グラフ構造によって記述する場合が多い。図2に系列構造、木構造、及びグラフ構造の一例を示す。
一方、前述したように、離散系列-離散系列変換器は、入力を文字列または単語列であることを想定している。よって、離散グラフ構造によって記述された文章の文法、または、意味的な情報を前述の離散系列-離散系列変換器により扱うことはできない。文法や意味的な情報は、自然言語処理システムにおいて非常に有益な情報源となりえる。つまり、前記、離散系列-離散系列変換器では、こういった有益な情報を扱うのは困難で、単語といった表層の情報しかうまく扱えないという課題がある。
本発明は、上記問題点を解決するために成されたものであり、シンボルの離散系列を表す有向非循環グラフを考慮した符号化を行うことができる符号化装置、離散系列変換装置、方法、及びプログラムを提供することを目的とする。
また、シンボルの離散系列を表す有向非循環グラフを考慮して符号化された符号を復号することができる復号化装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、入力されたシンボルの離散系列を、前記シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフに変換する変換部と、前記変換部により変換された前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付ける整列部と、前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築する符号器構築部と、前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力する符号器計算部と、を含んで構成されている。
また、第2の発明に係る復号化装置は、第1の発明に係る符号化装置から出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力する復号器計算部を含んで構成されている。
また、第3の発明に係る離散系列変換装置は、入力されたシンボルの離散系列を、前記シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフに変換する変換部と、前記変換部により変換された前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付ける整列部と、前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築する符号器構築部と、前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力する符号器計算部と、前記符号器計算部から出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力する復号器計算部と、を含んで構成されている。
第4の発明に係る符号化方法は、変換部が、入力されたシンボルの離散系列を、前記シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフに変換するステップと、整列部が、前記変換部により変換された前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付けるステップと、符号器構築部が、前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築するステップと、符号器計算部が、前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力するステップと、を含んで実行することを特徴とする。
また、第5の発明に係る復号化方法は、復号器計算部が、第4の発明に係る符号化方法において出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力するステップを含んで実行することを特徴とする。
また、第6の発明に係る離散系列変換方法は、変換部が、入力されたシンボルの離散系列を、前記シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフに変換するステップと、整列部が、前記変換部により変換された前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付けるステップと、符号器構築部が、前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築するステップと、符号器計算部が、前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力するステップと、復号器計算部が、前記符号器計算部から出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力するステップと、を含んで実行することを特徴とする。
また、第7の発明に係るプログラムは、コンピュータを、第1の発明に係る符号化装置、第2の発明に係る復号化装置、又は第3の発明に係る離散系列変換装置の各部として機能させるためのプログラムである。
本発明の符号化装置、離散系列変換装置、方法、及びプログラムによれば、シンボルの離散系列を有向非循環グラフに変換し、有向非循環グラフの各エッジの向きに基づいて、有向非循環グラフの各ノードを順序付け、各ノードの順序付けと、有向非循環グラフの各エッジとに沿って、ノード用の符号化ユニットと、エッジ用の符号化ユニットとを接続した符号器を構築し、各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、構築された符号器の、対応する符号化ユニットに入力して順次計算して、有向非循環グラフの符号を出力することにより、シンボルの離散系列を表す有向非循環グラフを考慮した符号化を行うことができる、という効果が得られる。
また、復号化装置、方法、及びプログラムによれば、シンボルの離散系列を表す有向非循環グラフを考慮して符号化された符号を復号することができる、という効果が得られる。
自然言語処理における変換問題の各種の例を示す図である。 系列構造、木構造、及びグラフ構造の一例を示す図である。 有向非循環グラフの一例を示す図である。 本発明の実施の形態に係る離散系列変換装置の構成を示すブロック図である。 ノード・エッジラベル付き有向非循環グラフとその符号器の関係の例を示す図である。 本発明の実施の形態に係る離散系列変換装置における離散系列変換処理ルーチンを示すフローチャートである。 従来技術における符号器による符号化と、復号器による復号化の例を示す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る概要>
まず、本発明の実施の形態における概要を説明する。
前述の通り有益な文法・意味的な情報は有向非循環グラフなどの離散グラフ構造によって記述される場合が多いことから、有向非循環グラフの符号器があれば、これらの情報を効率的に扱うことができるということになる。本発明の実施の形態における符号器は、特に、エッジとノードの両方にラベルが付与されている、ノード・エッジラベル付き有向非循環グラフに対する符号器として構築する。
有向非循環グラフは一般に木構造や系列構造を含むグラフのクラスである。つまり、本発明を用いれば、入力が木構造や系列構造であっても扱うことができる。逆に、従来の系列構造-系列構造変換器の場合は、通常エッジにラベルがついている状況を仮定していない。仮に系列構造であったとしても、エッジにラベルを付与して扱いたい場合は、本発明を用いることで利用可能となる。また、本発明はノードとエッジの両方にラベルが付与されていることを想定して記載されているが、ノードまたはエッジにラベルが存在しなくても、単一のラベルが全てのノードまたはエッジに付与されているとみなせば、本発明の枠組みで問題なく扱うことができる。このように、本発明を用いることで、様々な離散グラフ構造を扱うことできる。
<処理概要>
次に本発明の実施の形態に係る処理の概要について説明する。
文の意味表現として、abstract meaning representations (AMR)と呼ばれる表現方法がある(非特許文献2)。この意味表現では、文の主要な単語に対して意味的な関係を有向非循環グラフ(DAG)により記述する。また、単語に対して様々な属性を付与して文内の意味的な役割を記述する。図3に有向非循環グラフの一例を示す。
ここでは、AMRによるDAGの意味表現から、文を生成する例を使って本発明の最良執行形式を述べる。
まず、問題の定義を述べる。ここで述べる、ノード・エッジラベル付き有向非循環グラフでは、ノードラベルおよびエッジラベルは有限個のラベル集合とする。ノードラベルの集合を
、エッジラベルの集合をεで表す。また、ノードラベルの種類数を
、エッジラベルの種類数を|ε|で表す。次に、各ノードラベルにそれぞれ一つのD次元ベクトルを割り当てる。同様に、エッジラベルにもそれぞれ一つのD次元ベクトルを割り当てる。例えば、ノードラベル
に対するD次元ベクトルをラベル付きのベクトルx、エッジラベル
に対するD次元ベクトルをラベル付きのベクトルxと表す。
離散系列変換の処理の手順は以下のようになる。
(入力)
シンボルの離散系列である文を受理する。
(前処理)
既存のAMR解析器を用いて入力文をAMRに変換する。
(処理1)
変換されたAMRについて、有向非循環グラフの性質に則ってトポロジカルソートによるノードの順序付けを行う。
(処理2)
処理1で決定したノードの順序に従ってノード・エッジラベル付き有向非循環グラフ符号器を構成する。
(処理3)
入力文AMRを構築したノード・エッジラベル付き有向非循環グラフ符号器に代入し符号器を計算する。
(処理4)
処理3で得た符号を系列復号器へ入力し、系列復号器から文を生成する。
(出力)
系列復号器により生成された文を出力する。
<各符号化ユニットおよび復号化ユニットのパラメタ学習>
符号化ユニットと復号化ユニット内のパラメタは、従来技術として述べた通り、学習用データを使って決定する。学習後、パラメタは固定される。このパラメタが符号化の精度を決定する。
パラメタ学習法は、従来の系列構造−系列構造変換器と基本的に同じである現在のパラメタで、入力と符号とからなる学習用データの入力部分を符号化し、符号を復号器に入力して出力を得る。その際に、仮に正解データと同じ出力が得られれば、現在のパラメタはうまく調節ができていると言える。一方、正解データと同じでない場合は、正解が出るような方向にパラメタを調整する、といった処理を行うことで、最終的に、学習用データすべて正解ができるような方向にパラメタ探索することでパラメタを調整する。
<本発明の実施の形態に係る離散系列変換装置の構成>
次に、本発明の実施の形態に係る離散系列変換装置の構成について説明する。図4に示すように、本発明の実施の形態に係る離散系列変換装置100は、CPUと、RAMと、後述する離散系列変換処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この離散系列変換装置100は、機能的には図4に示すように入力部10と、演算部20と、出力部50とを備えている。
入力部10は、文をシンボルの離散系列として受け付ける。
演算部20は、変換部30と、整列部32と、符号器構築部34と、符号器計算部36と、復号器計算部38とを含んで構成されている。
変換部30は、入力部10で受け付けたシンボルの離散系列を、シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフに変換する。変換には既存のARM解析器を用いればよい。
整列部32は、変換部30により変換された有向非循環グラフの各エッジの向きに基づいて、有向非循環グラフの各ノードを順序付ける。
ここで、有向非循環グラフの各ノードの順序付けについて説明する。有向非循環グラフの場合は、ノードを有向エッジに従ってトポロジカルソートにより半順序で整列させることができる。本発明の実施の形態では、半順序関係によるノード順序未定義の関係に対しては、どのような順番で並べても処理結果には影響を与えないものとする。よって、順序関係が未定義の関係にあるノードの順番は適当(ランダム)に選択すれば良い。
本発明の実施の形態では、整列部32は、シンボルの離散系列について、トポロジカルソートの逆順でノードを整列する。ノード集合をVとする。また、エッジ集合をEで表す。ノード集合V内の任意の2つのノードをv,vとする。このとき、ノードvからノードvに向かって有向エッジが存在する場合、有向エッジをej,kと表記する。ここでは、有向エッジej,kが存在する場合に、この二つのノード間の大小関係をv>vと定義する。よって、ランダムに任意のノードvを選択し、そのノードから有向エッジで辿れるノードをvとすると、v>vの関係が成り立つ。よって、ノードを半順序で昇順に整列させる場合は、vから幅優先探索で出現したノードと逆順に並べることで、昇順に整列できる。ただし、重複して探索しないように一度探索したノードは探索空間から削除しながら探索を行う。辿れなかったノード集合に対して、また起点となるノードをランダムに選択し、同様の操作を繰り返すことで、ノードを半順序の昇順に整列できる。
符号器構築部34は、整列部32による各ノードの順序付けと、有向非循環グラフの各エッジとに沿って、各ノードに対応する、ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器を構築する。また、符号器は、ノード用の符号化ユニットは、前段の少なくとも一つのエッジ用の符号化ユニットの出力と当該ノードのラベルとを入力とし、エッジ用の符号化ユニットは、前段のノード用の符号化ユニットの出力と当該エッジのラベルとを入力とする。
ここで、符号器の構築の原理を説明する。符号器は、従来の系列構造符号器と同様に、符号化ユニットを連結することで符号器全体を構成する。符号化ユニット内部は様々な構成が考えられるが、ここでは例として、非特許文献3に記載の手法に従って、リカレントニューラルネット(RNN)により構成する場合と、長短期記憶メモリ(LSTM)により構築する場合の例をあげる。ただし、σ(・)とσ(・)を、ベクトルを入力で受け取り、同じ次元数のベクトルを返す関数とする。また、σ(・)は、入力されたラベル付きのベクトルxの各要素に対してシグモイド関数
を計算し、入力ベクトルと同じ要素番号の出力ベクトルに代入する処理を行う。同様に、σ(・)は、入力されたラベル付きのベクトルxの各要素に対してtanh関数
を計算し、入力ベクトルと同じ要素番号の出力ベクトルに代入する処理を行う。
以下に符号化ユニットをRNNにより構築する場合と、LSTMにより構築する場合の計算式を下記(1)式、(2)式に示す。本実施の形態では(1)式のRNNによる構築を行うものとする。
ここで、
は、各符号化ユニットに接続する別の符号化ユニットの集合を表すとする。つまり、各符号化ユニットに入力される情報は、通常の入力ラベル付きのベクトルxと、接続する別の符号化ユニットの中間(符号)状態zとなる。ここで一つ注意点として、従来の系列構造で使う場合は、各符号化ユニットの入力は一つ、つまり、
に必ずなる。よって、上記(1)式、(2)式中のkで総和を計算する部分は、系列構造符号化の際には、基本的に単一のベクトルの演算となる。
次に、RNNによる構成とLSTMによる符号化ユニットの構成の違いを述べる。単純に、LSTMの場合は、メモリセル状態cと呼ぶ情報も中間状態として接続する符号化ユニットへ受け渡す。LSTMにおけるメモリセル状態cは、長期の中間状態を保持するメモリの役割を果たす状態記憶場所となっている。なお、これら以外にも様々な符号化ユニットの亜種が考えられる。符号化ユニットの入力がラベル付きのベクトルxと中間状態zinであり、出力がzoutの形式で書ける符号化ユニットであれば、基本的に何を用いてもよい。
具体的には、符号器構築部34では、ノード・エッジラベル付き有向非循環グラフを符号化するために、各ノードに付与されたノードラベルの情報を上記(1)式に従って符号化するノード用の符号化ユニットと、各エッジに付与されたエッジラベルの情報を上記(1)式に従って符号化するエッジ用の符号化ユニットの二種類の符号化ユニットを定義する。このとき、ノード用とエッジ用の符号化ユニットは、符号化ユニット内のパラメタは共有せず、ノード用またエッジ用で別々であるとする。例えば、前述の通り、ノードラベルに割り当てられたベクトルがD次元、エッジラベルに割り当てられたベクトルがD次元、中間状態zのベクトルがD次元だとすると、ノード用の符号化ユニット内のパラメタWは、D×D行列であり、エッジ用の符号化ユニット内のパラメタWは、D×D行列となる。また、符号化ユニット内のパラメタWは、学習データにより予め学習されているものとする。
そして、符号器構築部34は、整列部32で整列したノードとノード間のエッジの構造に従って、ノード用とエッジ用の符号化ユニットを配置するように、それぞれのユニットを接続する。よって、本実施の形態での符号器の中身は、基本的に二層の作りになっており、一つはノード用の符号化ユニットの層、もう一つは、エッジ用の符号化ユニットの層である。また、ノード用の符号化ユニットとエッジ用の符号化ユニットは必ず交互に接続される形になる。
図5にノード・エッジラベル付き有向非循環グラフとその符号器の関係の例を示す。
符号器計算部36は、整列部32による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、符号器構築部34によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、有向非循環グラフの符号を出力する。
ここで、符号器計算部36における処理は、符号器構築部34で構築した符号器を使って、ノード・エッジラベル付き有向非循環グラフを固定長ベクトルへ符号化する処理に相当する。従来法である系列構造符号器と同様に、整列部32で順序付けたノード昇順に各符号化ユニットを計算し最終的な符号を得る。符号器構築部34で示したように、本実施の形態では、ノード用の符号化ユニットとエッジ用の符号化ユニットとが交互に接続されるような形式となっている。
ノードvに付与されたノードラベルをmとし、ノードラベルmをベクトル化したものを、ベクトルxとする。また、ノードvから出る有向エッジの集合をε(v)とする。このとき、ノードvのノードラベルmを符号化するノード用の符号化ユニットの処理上の入力は、
であり、ノードラベルをベクトル化したベクトルと、前段に出力された、エッジ用の符号化ユニットの出力である中間状態とが入力されることになる。ただし、
とする。出力は、
である。
有向エッジej,kに付与されたエッジラベルを
とし、エッジラベル
のベクトルを
とする。このとき、有向エッジej,kのエッジラベルを符号化するエッジ用の符号化ユニットの処理上の入力は、
である。ただし、v番目のノードのノードラベルをノード用の符号化用ユニットに入力した際に得られた中間(符号化)状態を
とする。エッジ用の符号化ユニットの入力は本実施の形態の構成上、必ず一つのノード用の符号化ユニットの出力と接続する。
出力は、
である。
最終的に全ての符号化ユニットを接続される順に計算して得られた中間状態が、ノード・エッジラベル付き有向非循環グラフの最終的な符号となる。
復号器計算部38は、符号器計算部36で出力された有向非循環グラフの符号を、シンボルに復号する復号化ユニットの系列である系列復号器に入力して、順次計算して、シンボルの離散系列を出力する。また、系列復号器は、復号化ユニットは、前段の復号化ユニットの出力であるシンボルをベクトル化したもの及び中間状態を入力とする。
復号器計算部38では、本実施の形態では、得られた符号を受け取り、系列復号器を用いて文を生成する。この系列復号器における処理は基本的に従来法と同じである。以下に、非特許文献1で利用されている復号化ユニットにおける計算例を挙げる。
上記(3)式では、符号化ユニットで上記(1)式を用いている場合、上記(1)式と同じ式に従って中間状態zoutが計算される。一方、符号化ユニットで上記(2)式を用いている場合、上記(2)式と同じ式に従って中間状態zoutが計算される。復号器の構成は、上記図7に記載の復号器である。一つ前の復号化ユニットの中間状態zoutを次の復号化ユニットの入力zinとし、現在の復号化ユニットの出力youtを得る。
出力復号ユニットが一つずつ出力するyoutから得られるシンボルを出力順に並べたものが最終的な出力となる。
<本発明の実施の形態に係る離散系列変換装置の作用>
次に、本発明の実施の形態に係る離散系列変換装置100の作用について説明する。入力部10において文をシンボルの離散系列として受け付けると、離散系列変換装置100は、図6に示す符号化処理ルーチンを実行する。
まず、ステップS100では、入力部10において受け付けたシンボルの離散系列を、シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフに変換する。
次に、ステップS102では、ステップS100により変換された有向非循環グラフの各エッジの向きに基づいて、有向非循環グラフの各ノードを順序付ける。
ステップS104では、ステップS102により得られた各ノードの順序付けと、有向非循環グラフの各エッジとに沿って、各ノードに対応する、ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器を構築する。
ステップS106では、ステップS102で得られた各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、ステップS106で構築された符号器の、対応する符号化ユニットに入力して順次計算して、有向非循環グラフの符号を出力する。
次のステップS108では、ステップS106で出力された有向非循環グラフの符号を復号化ユニットの系列である系列復号器に入力して、順次計算して、シンボルの離散系列を出力する。
以上説明したように、本発明の実施の形態に係る離散系列変換装置によれば、シンボルの離散系列を有向非循環グラフに変換し、有向非循環グラフの各エッジの向きに基づいて、有向非循環グラフの各ノードを順序付け、各ノードの順序付けと、有向非循環グラフの各エッジとに沿って、ノード用の符号化ユニットと、エッジ用の符号化ユニットとを接続した符号器を構築し、各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、構築された符号器の、対応する符号化ユニットに入力して順次計算して、有向非循環グラフの符号を出力し、系列復号器に入力して、順次計算することにより、シンボルの離散系列を表す有向非循環グラフを考慮して符号化された符号を復号することができる。
また、本発明実施の形態に係る手法を用いることにより、自然言語処理の分野でよく用いられる、構文木、意味役割構造、中間意味表現、談話構造といった、文章を文法・意味的な解析を行った結果の構造を直接用いて、離散構造から離散構造への変換が可能となる。その結果、系列構造-系列構造変換器よりも、潤沢な情報が扱えることになるので、復号精度を向上させることが可能となる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述した実施の形態では、離散系列変換装置に本発明を適用する場合を例に説明したが、これに限定されるものではなく、符号化装置と、復号化装置とに分けて構成してもよい。その場合には、符号化装置は、上述した、変換部30と、整列部32と、符号器構築部34と、符号器計算部36とを含んで構成すればよく、復号化装置は、復号器計算部38を含んで構成すればよい。
10 入力部
20 演算部
30 変換部
32 整列部
34 符号器構築部
36 符号器計算部
38 復号器計算部
50 出力部
100 離散系列変換装置

Claims (8)

  1. ンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフを入力として、前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付ける整列部と、
    前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築する符号器構築部と、
    前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力する符号器計算部と、
    を含む符号化装置。
  2. 請求項1記載の符号化装置から出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力する復号器計算部
    を含む復号化装置。
  3. ンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフを入力として、前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付ける整列部と、
    前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築する符号器構築部と、
    前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力する符号器計算部と、
    前記符号器計算部から出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力する復号器計算部と、
    を含む離散系列変換装置。
  4. 整列部が、シンボルの離散系列を、前記シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフを入力として、前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付けるステップと、
    符号器構築部が、前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築するステップと、
    符号器計算部が、前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力するステップと、
    を含む符号化方法。
  5. 復号器計算部が、請求項4記載の符号化方法において出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力するステップ
    を含む復号化方法。
  6. 整列部が、シンボルの離散系列を、前記シンボルの離散系列の意味構造を表し、かつ、各ノード及び各エッジにラベルが付与された有向非循環グラフを入力として、前記有向非循環グラフの各エッジの向きに基づいて、前記有向非循環グラフの各ノードを順序付けるステップと、
    符号器構築部が、前記整列部による各ノードの順序付けと、前記有向非循環グラフの各エッジとに沿って、各ノードに対応する、前記ノードのラベルを符号化するノード用の符号化ユニットと、各エッジに対応する、前記エッジのラベルを符号化するエッジ用の符号化ユニットとを接続した符号器であって、かつ、前記ノード用の符号化ユニットは、前段の少なくとも一つの前記エッジ用の符号化ユニットの出力と前記ノードのラベルとを入力とし、前記エッジ用の符号化ユニットは、前段の前記ノード用の符号化ユニットの出力と前記エッジのラベルとを入力とする前記符号器を構築するステップと、
    符号器計算部が、前記整列部による各ノードの順序付けに沿って、各ノードのラベル及び各エッジのラベルを、前記符号器構築部によって構築された符号器の、対応する符号化ユニットに入力して順次計算して、前記有向非循環グラフの符号を出力するステップと、
    復号器計算部が、前記符号器計算部から出力された前記有向非循環グラフの符号を、前記シンボルに復号する復号化ユニットの系列である系列復号器であって、かつ、前記復号化ユニットは、前段の前記復号化ユニットの出力を入力とする前記系列復号器に入力して、順次計算して、前記シンボルの離散系列を出力するステップと、
    を含む離散系列変換方法。
  7. コンピュータを、請求項1に記載の符号化装置の各部として機能させるためのプログラム。
  8. コンピュータを、請求項2に記載の復号化装置の各部として機能させるためのプログラム。
JP2016065764A 2016-03-29 2016-03-29 符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム Active JP6550677B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016065764A JP6550677B2 (ja) 2016-03-29 2016-03-29 符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016065764A JP6550677B2 (ja) 2016-03-29 2016-03-29 符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017182277A JP2017182277A (ja) 2017-10-05
JP6550677B2 true JP6550677B2 (ja) 2019-07-31

Family

ID=60006078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016065764A Active JP6550677B2 (ja) 2016-03-29 2016-03-29 符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6550677B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7072178B2 (ja) * 2018-02-28 2022-05-20 日本電信電話株式会社 自然言語処理のための装置、方法及びプログラム
WO2019176108A1 (ja) * 2018-03-16 2019-09-19 日本電気株式会社 推移閉包情報生成装置、推移閉包情報生成方法および記録媒体

Also Published As

Publication number Publication date
JP2017182277A (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
JP6635307B2 (ja) 要約生成装置、テキスト変換装置、方法、及びプログラム
CN109858030B (zh) 双向的意图槽值交叉相关的任务型对话理解系统及方法
CN109492113B (zh) 一种面向软件缺陷知识的实体、关系联合抽取方法
CN109661664B (zh) 一种信息处理的方法及相关装置
CN112989796B (zh) 一种基于句法指导的文本命名实体信息识别方法
CN111858932A (zh) 基于Transformer的多重特征中英文情感分类方法及系统
US11417415B2 (en) Molecular representation
CN110807335B (zh) 基于机器学习的翻译方法、装置、设备及存储介质
Kong et al. Transforming dependencies into phrase structures
CN114489669A (zh) 一种基于图学习的Python语言代码片段生成方法
Kurniawan et al. Toward a standardized and more accurate Indonesian part-of-speech tagging
CN115455197A (zh) 一种融合位置感知细化的对话关系抽取方法
JP6550677B2 (ja) 符号化装置、復号化装置、離散系列変換装置、方法、及びプログラム
CN116955644A (zh) 基于知识图谱的知识融合方法、系统及存储介质
CN118228733A (zh) 一种基于图神经网络的微博评论对话情感分析方法及系统
WO2020040255A1 (ja) 単語符号化装置、解析装置、言語モデル学習装置、方法、及びプログラム
CN116861021A (zh) 基于去噪和动量蒸馏的跨模态检索模型构建方法
CN114757181B (zh) 基于先验知识端到端的事件抽取模型的训练、事件抽取方法及装置
JP6633999B2 (ja) 符号器学習装置、変換装置、方法、及びプログラム
CN114611529B (zh) 意图识别方法和装置、电子设备及存储介质
CN113986251A (zh) 基于卷积和循环神经网络的gui原型图转代码方法
CN114239548A (zh) 一种融合依存句法和指针生成网络的三元组抽取方法
WO2019160097A1 (ja) フレーズベクトル学習装置、方法、及びプログラム
CN111178041B (zh) 一种智能的文本复述系统和方法
CN118172829B (zh) 一种基于动作感知的视频描述方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20171218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190614

R150 Certificate of patent or registration of utility model

Ref document number: 6550677

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250