JP2017041208A - グラフ変換装置、方法、及びプログラム - Google Patents

グラフ変換装置、方法、及びプログラム Download PDF

Info

Publication number
JP2017041208A
JP2017041208A JP2015164220A JP2015164220A JP2017041208A JP 2017041208 A JP2017041208 A JP 2017041208A JP 2015164220 A JP2015164220 A JP 2015164220A JP 2015164220 A JP2015164220 A JP 2015164220A JP 2017041208 A JP2017041208 A JP 2017041208A
Authority
JP
Japan
Prior art keywords
graph
nodes
super
dag
hypergraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015164220A
Other languages
English (en)
Other versions
JP6517630B2 (ja
Inventor
克彦 林
Katsuhiko Hayashi
克彦 林
昌明 永田
Masaaki Nagata
昌明 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015164220A priority Critical patent/JP6517630B2/ja
Publication of JP2017041208A publication Critical patent/JP2017041208A/ja
Application granted granted Critical
Publication of JP6517630B2 publication Critical patent/JP6517630B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をする。
【解決手段】意味構造を表すDAGグラフを、前記意味構造を表す超グラフに変換するグラフ変換装置において、変換部22により、1つの超辺と1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換する。
【選択図】図2

Description

本発明は、入力された閉路無し有向超グラフをより一般的な有向超グラフへと変換するためのグラフ変換装置、方法、及びプログラムに関するものである。
従来、木構造から木構造への変換を行う木トランスデューサ(非特許文献1)、閉路無し有向超グラフ(DAG:Directed acyclic graph)から木構造への変換を行うDAGトランスデューサ(非特許文献2)、及び木構造からより一般的な有向超グラフ(以下、Graphとも称する)への変換を行う木‐tо‐Graphトランスデューサ(非特許文献3)が知られている。なお、図13左に、自然言語構文木(DAGの一種)、図13中央に、自然言語文の簡単化された意味構造(DAG)、及び図13右に、自然言語文の完全な意味構造(Graph)の各々の例を示す。
Andreas Maletti. Survey: Tree transducers in machine translation. In NCMA, pages 11−32. Citeseer, 2010. Tsutomu Kamimura and Giora Slutzki. Parallel and two-way automata on directed ordered acyclic graphs. Information and Control, 49(1):10−51, 1981. Joost Engelfriet and Heiko Vogler. The translation power of top-down tree-to-graph transducers. Journal of Computer and System Sciences, 49(2):258−305, 1994.
しかし、上述した従来の方法では、DAGからGraphへの変換が行えるより一般化されたトランスデューサが存在しない(従来の3つの独立した方法を統一する枠組みがない)という問題がある。
また、DAGトランスデューサは自然言語処理などの実課題に対して、表現力が乏しい(モデル化できない言語現象などがある)という問題がある。
本発明では、上記問題点を解決するために成されたものであり、木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができるグラフ変換装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係るグラフ変換装置は、ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、1つの超辺と前記1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する変換部、を含んで構成されている。
第2の発明に係るグラフ変換方法は、変換部を含む、ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、前記変換部は、1つの超辺と前記1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する。
第1及び第2の発明によれば、変換部により、1つの超辺と1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換する。
このように、1つの超辺と1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。
第3の発明に係るグラフ変換装置は、ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、1つのDAGグラフと前記1つのDAGグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記DAGグラフを置換する処理を繰り返すことにより、前記超グラフに変換する変換部、を含んで構成されている。
第4の発明に係るグラフ変換方法は、変換部を含む、ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、前記変換部は、1つのDAGグラフと前記1つのDAGグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記DAGグラフを置換する処理を繰り返すことにより、前記超グラフに変換する。
第3及び第4の発明によれば、変換部により、1つのDAGグラフと1つのDAGグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれるDAGグラフを置換する処理を繰り返すことにより、超グラフに変換する。
このように、1つのDAGグラフと1つのDAGグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれるDAGグラフを置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。
また、本発明のプログラムは、コンピュータを、上記のグラフ変換装置を構成する各部として機能させるためのプログラムである。
以上説明したように、本発明のグラフ変換装置、方法、及びプログラムによれば、1つの超辺と1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。
また、1つのDAGグラフと1つのDAGグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれるDAGグラフを置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。
超辺置換操作の一例を示す図である。 本発明の第1の実施形態に係るグラフ変換装置の機能的構成を示すブロック図である。 本発明の第1の実施形態に係るグラフ変換装置におけるグラフ変換処理ルーチンのフローチャート図である。 英語の簡単化された意味構造から日本語の構文木への非構成的変換の一例を示す図である。 アルゴリズムの一例を示す図である。 アルゴリズムの一例を示す図である。 本発明の第2の実施形態に係るグラフ変換装置の機能的構成を示すブロック図である。 モデルMの一例を示す図である。 構文木から完全な意味構造への重み付き変換の過程の一例を示す図である。 モデルMの一例を示す図である。 簡単化された意味構造から構文木への重み付き変換の過程の一例を示す図である。 本発明の第2の実施形態に係るグラフ変換装置におけるグラフ変換処理ルーチンのフローチャート図である。 DAG、及びGraphの一例を示す図である。
以下、図面を参照して本発明の実施形態を詳細に説明する。
<本発明の実施形態の概要>
まず、本発明の実施形態の原理について説明する。後述する本実施形態に係るグラフ変換装置は、入力となる閉路無し有向超グラフ(DAG)をより一般的な有向超グラフ(超グラフ)へと変換するための形式的な装置である。
DAGの構造は自然言語処理の構文木(根付き木)や簡単化された意味構造などを表現できる。また、超グラフはDAG構造を包含し、より一般的で複雑な構造(自然言語文の完全な意味構造など)も表現できる。
後述する、グラフ変換装置では、構文木から構文木への変換による構文構造に基づく機械翻訳、簡単化された意味構造から構文木への変換による意味構造に基づく機械翻訳、及び構文木から完全な意味構造への変換による意味構造解析等をモデル化し、解くことができる。また、自然言語処理以外のDAG構造から超グラフ構造への変換問題に対しても応用可能である。
<定義>
本実施形態においては、系列、未定義シンボル、及び変数を定義する。以下説明する。
集合Vに対して、VはV上の要素*個から成る系列の集合であり、空列
を含む。ある系列
は全ての
に対して、v∈Vである。なお、系列を表す記号は、bоldフォントで表現する。
系列
の長さは
と表し、全ての
に対して、そのi番目の要素を
と表現する。ある2つの系列
に対して、その結合
は、<v11,...,v1n,v21,...,v2m>となる。
nilは集合の要素や系列を表す記号が未定義の場合に用いる特殊なシンボルである。X={x,x,....}を変数の無限集合と定義し、
に対して、X={x,...,x}はその有限集合とする。
また、本実施形態においては、2重階層化アルファベットを定義する。2重階層化アルファベットは組
であり、有限集合
と関数
から成る。
は自然数を表す。2重階層化アルファベットを表示するときは省略して、その
のみを表示する。関数drkは、
の要素に2重ランクを割り当てる関数である。全ての
に対して、
は、その各要素
が、
となるような
の補集合である。その要素
は、
と表現する。
また、本実施形態においては、超グラフ(Graph)を定義する。2重階層化アルファベット
上において、超グラフhは組h=(V,E,s,t,l,begin,end)から成る。なお、それぞれの要素を以下に説明する。
・Vはノードの有限集合を表す。
・Eは超辺の有限集合を表す。
・s:E→Vはソースノード関数を表す。
・t:E→Vはターゲットノード関数を表す。
・l:E→Δはラベル付け関数で、全ての超辺e∈Eに対して、drk(l(e))=(|s(e)|,|t(e)|)となる2重階層化されたシンボルl(e)をラベル付けする関数を表す。
・begin∈Vはhの始点となるノード系列を表す。
・end∈Vはhの終点となるノード系列を返す関数を表す。
上で定義される全ての超グラフの集合(クラス)を
として表現する。ある
に対して、その要素をV、E、s、t、l、begin(h)、end(h)と表現する。各v∈Vに対して、indeg(v)はvに入る超辺の数、оutdeg(v)はvから出る超辺の数を表現する。
|begin(h)|=m、かつ、|end(h)|=nのとき、hは(m,n)‐hypergraphと表現し、超グラフhのランクをdrk(h)=(m,n)と表現する。同様に、各超辺e∈Eがdrk(l(e))=(m,n)のとき、eを(m,n)‐hyperedgeと表現する。Δで定義される全ての(m,n)‐hypergraphのクラスを(m,n)‐HGR(Δ)として表現する。
また、本実施形態においては、無閉路を定義する。ある超グラフhにおいて、そのノードvからノードuへの経路とは、3つ組の有限系列<(k,e,j),...,(k,e,j)>で表される。ここで、
は自然数で、全てのe∈Eはs(e)(k)=v、かつ、t(e)(j)=uとなり、全ての
に対して、t(e)(j)=s(ei+1)(ji+1)となる。超グラフhが無閉路とは、各ノードに対して、そのノード自身への空列でない経路が存在しない場合をいう。
また、本実施形態においては、アトムを定義する。
となる2重階層化シンボル
に対して、
とはランク(m,n)の超グラフgであり、ノード集合
となるeを持つ超辺集合E={e}、begin(g)=s(e)=<a,...,a>、end(e)=t(e)=<b,...,b>、から構成される。
また、本実施形態においては、超辺置換操作を定義する。図1に、図1左の超グラフが持つxでラベル付けされた超辺を図1中央にある超グラフで置換したとき、図1右の超グラフが作成される。hを超グラフ、R⊆V×Vをhのノード間の関係とする。あるノードa∈Vに対して、[a]はそれと等価なノードを表す。あるノード補集合V⊆Vに対して、V/R={[a]|a∈V}と表現する。ノード系列
に対して、
と表現する。更に、超グラフh/Rをh/R=(V/R,E,s,t,l,[begin(h)],[end(h)])として表現し、ここでは全てのe∈Eに対して、s(e)=[s(e)]、かつ、t(e)=[t(e)]を満たす。
gを超グラフ、eをE中の(m,n)‐hyperedge、hを(m,n)‐hypergraphとしたとき、gからeを取り除き、hを加えると、g´=(V∪V,(E−{e})∪E,s,t,l,begin(g),end(g))が取得できる。
ここで、e∈(E−{e})に対して、s(e)=s(e)、e∈Eに対して、s(e)=s(e)であり、tとlも同様である。このとき、g中の超辺eに対するhの置換とは、g[e/h]で表現され、超グラフg´/Rとなる。ここで、
となる。
AとBとを2重階層化アルファベット、φ:A→HGR(B)を置換関数と呼び、全ての
に対して、
となる。φを拡張し、関数
を、下記の様に定義する。
に対して、
となる。
に対して、
となり、ここで、Eg={e,...,e}となる。この拡張された関数
はg中で
となる全ての超辺eを
で置き換える関数である。
また、本実施形態においては、木、及びDAGを定義する。2重階層化アルファベット
上で定義されたDAG d=(V,E,s,t,l,begin,end)は、dは無閉路であり、各ノードv∈Vに対して、
、各ノードv∈Vに対して、
、及び全てのe∈Eに対して、|s(e)|>0の条件を満たす超グラフである。
あるDAG dに対して、各要素をV、E、s、t、l、begin(d)、end(d)と表現する。
上で定義される全てのDAGのクラスを
と表現する。|begin(d)|=m、かつ|end(d)|=nのとき、当該DAGを(m,n)‐dagと表現する。全ての(m,n)‐dagから成るクラスを
と表現する。
クラス
に属するDAGを根付きDAGと表現し、そのクラスに、全てのe∈Eに対して、|s(e)|=1を加えたクラスに属するDAGを木と表現する。
DAGや木は、あるノードから出る超辺が1つ以下という制約がある。そのため、あるノードv∈Vに対して、оut‐e(v)をそのノードから超辺を返す関数とする。もし、出る超辺が無い場合には、nilを返す。
また、本実施形態においては、重み付きDAG−tо−Graphトランスデューサを定義する。これを(重み付き)DAG−tо−Graphトランスデューサと表現する。
重み付きDAGトランスデューサMは5つ組
から成る。
なお、Qは状態集合であり、状態は2重階層化アルファベットの要素をとり、Σは入力シンボルの2重階層化アルファベットであり、
は出力シンボルの2重階層化アルファベットをとり、I⊆Q(1,0)1は初期状態系列の集合であり、初期状態系列は状態集合Qの補集合Q(1,0)から1つだけ要素をとり、Rは組(R´,π)から成り、R´は規則の有限集合で、各規則rは
で定義される。
ここで、
は状態系列、eは(m,n)超辺、
は、n個の変数から成る系列、
はm個の超グラフから成る系列であり、各超グラフは全ての
に対して、
が成り立つ。
は各規則に重みを割り当てる関数である。重み付きの規則は、
として定義される。
<第1の実施形態の原理>
次に、第1の実施形態に係るグラフ変換装置における、DAGから超グラフへの変換を行う過程を説明する。当該過程は、規則を入力DAGは1つずつ提供することで進んでいく。
状態系列
とし、
となるような規則r∈Rを考え、drk(l(e))=(m,n)、かつ、
、かつ、
とする。ここで、d∈(1,0)‐DAG(Σ)を入力DAGとし、
を2つの超グラフとすると、導出の1ステップは
として表現でき、下記条件を満たすm個の超辺
と超辺e∈Eとが存在する場合に動作する。
条件1:l(e)=l(e)
条件2:s(e)=<v,...,v
条件3:全ての
に対して、
条件4:
が成り立つ。ここで、
は、
となる関数で、超辺置換関数
と拡張したものである。超辺置換関数φは、全ての
に対して、
が成り立つような関数である。
をある自然数、全ての
に対して、
を超グラフとする。ここで、
となるような系列
をMにおける
の導出と表現する。
導出
の重み
は、各規則の重みの積
で定義される。
全ての
に対して、重み付きDAG‐tо‐Graph変換とは、写像
であり、
のように定義される。ここで、r,...,r∈R´は規則である。
Mの意味τとは、全ての
に対して、重み付きDAG‐tо‐Graph変換
であり、
として定義される。
<本発明の第1の実施形態に係るグラフ変換装置の構成>
次に、本発明の第1の実施形態に係るグラフ変換装置の構成について説明する。図2に示すように、本発明の本実施形態に係るグラフ変換装置100は、CPUと、RAMと、後述するグラフ変換処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このグラフ変換装置100は、機能的には図2に示すように入力部10と、演算部20と、出力部90とを含んで構成されている。なお、第1の実施形態においては、上述した第1の実施形態の原理に基づいて、入力されたDAGを変換する。
入力部10は、変換対象のDAGを受け付ける。なお、変換対象のDAGの各ノードには状態qが付加されているものとする。
演算部20は、変換部22と、ルール記憶部24とを含んで構成されている。
変換部22は、入力部10において受け付けたDAGに含まれる超辺と状態系列との組み合わせに対応する規則を、ルール記憶部24から取得し、当該規則を当該DAGに適用することにより、変換対象となる超辺を超グラフに置換する処理を繰り返すことにより、取得したDAGを超グラフに変換する。また、変換部22は、取得した超グラフを出力部90から出力する。
ルール記憶部24には、1つの超辺を、当該超辺と当該超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則が記憶されている。
<本発明の第1の実施形態に係るグラフ変換装置の作用>
次に、本発明の第1の実施形態に係るグラフ変換装置100の作用について説明する。グラフ変換装置100は、入力部10によって、DAGを受け付けると、グラフ変換装置100によって、図3に示すグラフ変換処理ルーチンが実行される。
まず、図3に示すグラフ変換処理ルーチンのステップS100で、ルール記憶部24に記憶されている規則を読み込む。
次に、ステップS102で、ステップS100において取得した規則と、入力部10において取得したDAGとに基づいて、取得したDAGに含まれる超辺を1つずつ置換し、規則が適用できなくなるまで処理を繰り返し、当該DAGを超グラフに変換する。
次に、ステップS104で、ステップS102において取得した超グラフを出力部90から出力して、グラフ変換処理ルーチンを終了する。
以上説明したように、本発明の本実施形態に係るグラフ変換装置によれば、1つの超辺と1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。
また、従来の木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みを提供することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
次に、第2の実施形態に係るグラフ変換装置について説明する。第2の実施形態においては、DAG‐tо‐Graphトランスデューサの規則の左辺に、任意のDAGを取れるようにトランスデューサを拡張した点が第1の実施形態と異なる。なお、第1の実施形態に係るグラフ変換装置と同様の構成及び作用については、同一の符号を付して、説明を省略する。
<第2の実施形態の原理>
図4左に示すような英語の簡単化された意味構造を、図4右に示すような日本語の構文木へ非構成的変換を行う場合、英語側において、girl´はwоrk´の下にあり、日本語側ではsheとwоrkとが同列となることから、上述した第1の実施形態に係るDAG‐tо‐Graphトランスデューサに基づいて行うことはできない。
これは、第1の実施形態に係るDAG‐tо‐Graphトランスデューサにおいては、規則の左辺に超辺を1つしかとることができず、入力されたDAGの超辺を1つずつしか処理できないため、英語側のgirl´を日本語側のsheに変換することができないからである。
そこで、第2の実施形態においては、図4に示した場合についても変換を行えるようにするため、DAG‐tо‐Graphトランスデューサの規則の左辺に、任意のDAGを取れるように拡張する。このような拡張は、非特許文献2のDAGトランスデューサでは記載されていない新しい拡張である。
重み付き拡張型DAG‐tо‐Graphトランスデューサは、組
で表現される。上述した第1の実施形態に係るDAG‐tо‐Graphとの違いは、規則の左辺に超辺ではなく、DAGを取れる点である。
Rは組(R´,π)であり、R´は規則の有限集合で、各規則rは、
と表現される。ここで、
は状態系列、dは(m,n)‐dag、
はn個の変数から成る系列、
は全ての
に対して、
となるn個の超グラフから成る系列である。
は規則の重み関数で、重み付き規則は
という形式をとる。
<定義>
また、第2の実施形態においては、DAGマッチングアルゴリズムを定義する。重み付き拡張型DAG‐tо‐Graphトランスデューサでは、規則の左辺に(m,n)‐dagをとることができるため、導出を定義するためには、入力されたDAGの任意のm個のノードから始まる部分DAGに、規則の左辺のDAGが一致するか否かを調べる必要がある。
調べることが行うためのアルゴリズムを図5に示す。gを(m,n)−dag、hをDAGとする。また、
をhの任意のm個のノードから成る系列とすると、
は、hのノード系列
を始点とする部分DAGにgがマッチするかを判定する。もし、gがhのノード系列
を始点とする部分DAGh´にマッチすると、このアルゴリズムはh´の終点からなる系列を返す。
このようなh´を探すため、図5に示すアルゴリズムは、ペアR=(R,R)が存在するかを検査する。当該要素R:V→Vh´とR:E→Eh´は、どちらも全単射の関係集合であり、全ての超辺e∈Eに対して、
、かつ、
、かつ、
が成り立つ。そのようなペアがgとh´の間で存在するとき、gはh´にマッチし、そうでない場合、gはh´にマッチしない。図5に示すアルゴリズムでは、ノードに対する関数集合Rは直接構築するが、超辺に対する関係集合Rは構築しない。代わりに、Rに含まれる全てのノードペアに対し、それらのノードから出る超辺e∈Eとe´∈Eh´の間で
、かつ、
、かつ、
が成り立つかを、図6に示すアルゴリズムに基づいて検査する。
次に、第2の実施形態における導出を定義する。
を入力となるDAG、
を2つの超グラフ、
を状態系列、r∈Rを
という形式の規則とし、ここでdrk(d)=(m,n)、かつ、
、かつ、
とする。
導出の1ステップは、
として表現し、次の条件を満たすようなm個の超辺
が存在するならば動作する。
条件1:全ての
に対して、
条件2:
条件3:
であり、ここで、
は関数
で、置換関数
を拡張したものである。
この置換関数は全ての
に対して、
を満たす
である。
<本発明の第2の実施形態にグラフ変換装置の構成>
次に、本発明の第2の実施形態に係るグラフ変換装置の構成について説明する。図7に示すように、第2の実施形態に係るグラフ変換装置200は、CPUと、RAMと、後述するグラフ変換処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このグラフ変換装置200は、機能的には図7に示すように入力部10と、演算部220と、出力部90とを含んで構成されている。
演算部220は、変換部222と、ルール記憶部224とを含んで構成されている。
変換部222は、入力部10において受け付けたDAGに含まれる部分DAGと状態系列との組み合わせに対応する規則を、ルール記憶部224から取得し、当該規則を当該DAGに適用することにより、変換対象となる部分DAGを超グラフに置換する処理を繰り返すことにより、取得したDAGを超グラフに変換する。また、変換部222は、取得した超グラフを出力部90から出力する。
図8に、入力部10において自然言語文の構文木から完全な意味構造への重み付き変換をモデル化する例を示す。図8に示すモデルMはその規則集合Rにrとrとの2つの規則を持つ。なお、当該規則集合Rは、ルール記憶部224に記憶されている規則である。具体的には、例えば、入力部10において、図1左に示した構文木を受け付けた場合、変換部222は、当該構文木に対応する規則rをルール記憶部224から取得し、当該規則に対応するラベルが付加されている図9左の左側の超辺を、規則rの変換規則に従って、超グラフに置換する。これにより、図9左から図9中央へと遷移する。
次に、図9中央のDAGに対応する規則rを、ルール記憶部224から取得し、当該規則に対応するラベルが付加されている部分DAGを、規則rの変換規則に従って、超グラフに置換する。これにより、図9中央から図9右へと遷移する。このように、規則を繰り返し適用することにより、入力された自然言語文の構文木を、完全な意味構造へと変換させることができる。
また、図10に、入力部10において自然言語文の簡単化された意味構造から自然言語構文木への重み付き変換をモデル化する例を示す。図10に示すモデルMはその規則集合Rにrとrとの2つの規則を持つ。なお、当該規則集合Rは、ルール記憶部224に記憶されている規則である。具体的には、例えば、入力部10において、図1中央に示した意味構造を受け付けた場合、変換部222は、当該意味構造に対応する規則rをルール記憶部224から取得し、当該規則に対応するラベルが付加されている図11左の左側の超辺を、規則rの変換規則に従って、超グラフに置換する。これにより、図11左から図11中央へと遷移する。
次に、図11中央のDAGに対応する規則rを、ルール記憶部224から取得し、当該規則に対応するラベルが付加されている部分DAGを、規則rの変換規則に従って、超グラフに置換する。これにより、図11中央から図11右へと遷移する。このように、規則を繰り返し適用することにより、入力された簡単化された意味構造から構文木へと変換させることができる。なお、図11右に示す構文木は、図1左に示した英語構文木に対応する日本語の構文木の例である。
ルール記憶部224には、1つのDAGを、当該DAGと当該DAGの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則が記憶されている。
<本発明の第2の実施形態に係るグラフ変換装置の作用>
次に、第2の本実施形態に係るグラフ変換装置200の作用について説明する。グラフ変換装置200は、入力部10によって、DAGを受け付けると、グラフ変換装置200によって、図12に示すグラフ変換処理ルーチンが実行される。なお、第1の実施形態に係るグラフ変換装置100と同様の作用については、同一の符号を付して説明を省略する。
まず、図12に示すグラフ変換処理ルーチンのステップS200で、ステップS100において取得した規則と、入力部10において取得したDAGとに基づいて、取得したDAGに含まれる部分DAGを置換し、規則が適用できなくなるまで処理を繰り返し、当該DAGを超グラフに変換する。
以上説明したように、本発明の本実施形態に係るグラフ変換装置によれば、1つのDAGと1つのDAGの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたDAGグラフに含まれるDAGを置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、DAGトランスデューサ、及び木‐tо‐Graphトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。
また、規格拡張化による変換表現力を向上させることができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10 入力部
20,220 演算部
22,222 変換部
24,224 ルール記憶部
90 出力部
100,200 グラフ変換装置

Claims (5)

  1. ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、
    1つの超辺と前記1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する変換部
    を含む、グラフ変換装置。
  2. ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、
    1つのDAGグラフと前記1つのDAGグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記DAGグラフを置換する処理を繰り返すことにより、前記超グラフに変換する変換部
    を有する、グラフ変換装置。
  3. 変換部を含む、ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、
    前記変換部は、1つの超辺と前記1つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する
    グラフ変換方法。
  4. 変換部を含む、ノード、及び0以上のノードと0以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が1以下であり、前記ノードの各々から出力される超辺の数が1以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が0よりも多い有向グラフである、意味構造を表すDAGグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が0以上であり、前記ノードの各々から出力される超辺の数が0以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、
    前記変換部は、1つのDAGグラフと前記1つのDAGグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記DAGグラフに含まれる前記DAGグラフを置換する処理を繰り返すことにより、前記超グラフに変換する
    グラフ変換方法。
  5. コンピュータを、請求項1又は2記載のグラフ変換装置の各部として機能させるためのプログラム。
JP2015164220A 2015-08-21 2015-08-21 グラフ変換装置、方法、及びプログラム Active JP6517630B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015164220A JP6517630B2 (ja) 2015-08-21 2015-08-21 グラフ変換装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015164220A JP6517630B2 (ja) 2015-08-21 2015-08-21 グラフ変換装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017041208A true JP2017041208A (ja) 2017-02-23
JP6517630B2 JP6517630B2 (ja) 2019-05-22

Family

ID=58208822

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015164220A Active JP6517630B2 (ja) 2015-08-21 2015-08-21 グラフ変換装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6517630B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004272352A (ja) * 2003-03-05 2004-09-30 Nippon Telegr & Teleph Corp <Ntt> 類似度計算方法、装置、プログラムおよび該プログラムを格納した記録媒体
JP2006518502A (ja) * 2003-01-30 2006-08-10 インターナショナル・ビジネス・マシーンズ・コーポレーション テキスト分析のためのシステムと方法
CN102915304A (zh) * 2011-08-01 2013-02-06 日电(中国)有限公司 文档检索设备和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190244A1 (en) * 2003-01-20 2006-08-24 Christian Mauceri System and method for text analysis
JP2006518502A (ja) * 2003-01-30 2006-08-10 インターナショナル・ビジネス・マシーンズ・コーポレーション テキスト分析のためのシステムと方法
JP2004272352A (ja) * 2003-03-05 2004-09-30 Nippon Telegr & Teleph Corp <Ntt> 類似度計算方法、装置、プログラムおよび該プログラムを格納した記録媒体
CN102915304A (zh) * 2011-08-01 2013-02-06 日电(中国)有限公司 文档检索设备和方法
JP2013033452A (ja) * 2011-08-01 2013-02-14 Nec (China) Co Ltd 文書検索装置および方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
塩谷 勇、中村 克彦: "論理超グラフ文法と文脈自由超グラフ文法", 電子情報通信学会論文誌 (J73−D−I), vol. 第J73-D-I巻第4号, JPN6018030671, 25 April 1990 (1990-04-25), JP, pages 385 - 394, ISSN: 0003854548 *
東原 真希、伊藤 貴之: "長方形の空間充填による無閉路有向グラフの可視化", 第3回データ工学と情報マネジメントに関するフォーラム 論文集 [ONLINE], JPN6018030672, 27 July 2011 (2011-07-27), JP, pages 1 - 4, ISSN: 0003854549 *

Also Published As

Publication number Publication date
JP6517630B2 (ja) 2019-05-22

Similar Documents

Publication Publication Date Title
Virtanen et al. SciPy 1.0: fundamental algorithms for scientific computing in Python
WO2018131259A1 (ja) 文章評価装置、及び文章評価方法
US10936950B1 (en) Processing sequential interaction data
Karban et al. Creating system engineering products with executable models in a model-based engineering environment
Sen et al. Topological information content and expressiveness of function models in mechanical design
JP5468615B2 (ja) 事前条件生成装置およびその方法、ならびにプログラム
WO2009098739A1 (ja) プログラム最適化装置およびプログラム最適化方法
Hong et al. Smart: A situation model for algebra story problems via attributed grammar
Sheriyev et al. Intelligence system for supporting human-computer interaction engineering processes
Yamasathien et al. An approach to construct formal model of business process model from BPMN workflow patterns
Perdicoúlis Application manual for the ‘Systems Thinking’book
US7328200B2 (en) Apparatus, method, and computer program product for converting decision flowcharts into decision probabilistic graphs
Biermann et al. Parallel independence of amalgamated graph transformations applied to model transformation
Singh et al. SPT: storyboard programming tool
KR102206742B1 (ko) 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치
JP2017041208A (ja) グラフ変換装置、方法、及びプログラム
JP6558856B2 (ja) 形態素解析装置、モデル学習装置、及びプログラム
JP6788249B2 (ja) 生成装置、生成方法及びプログラム
Krukaset et al. Thai sentence generation machine employing fixed patterns
Abdelzad et al. Adding a textual syntax to an existing graphical modeling language: Experience report with GRL
Juayong et al. Relating computations in non-cooperative transition P systems and evolution-communication P systems with energy
JP2015225412A (ja) 文書要約装置、方法、及びプログラム
Suri et al. Framework to represent the software design elements in markup text–Design Markup Language (DGML)
Petrenko et al. Conformance testing and inference of embedded components
Noyrit et al. Computer assisted integration of domain-specific modeling languages using text analysis techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190418

R150 Certificate of patent or registration of utility model

Ref document number: 6517630

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150