JP2017041208A

JP2017041208A - グラフ変換装置、方法、及びプログラム

Info

Publication number: JP2017041208A
Application number: JP2015164220A
Authority: JP
Inventors: 克彦林; Katsuhiko Hayashi; 昌明永田; Masaaki Nagata
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2015-08-21
Filing date: 2015-08-21
Publication date: 2017-02-23
Anticipated expiration: 2035-08-21
Also published as: JP6517630B2

Abstract

【課題】木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をする。
【解決手段】意味構造を表すＤＡＧグラフを、前記意味構造を表す超グラフに変換するグラフ変換装置において、変換部２２により、１つの超辺と１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換する。
【選択図】図２

Description

本発明は、入力された閉路無し有向超グラフをより一般的な有向超グラフへと変換するためのグラフ変換装置、方法、及びプログラムに関するものである。

従来、木構造から木構造への変換を行う木トランスデューサ（非特許文献１）、閉路無し有向超グラフ（ＤＡＧ：Ｄｉｒｅｃｔｅｄａｃｙｃｌｉｃｇｒａｐｈ）から木構造への変換を行うＤＡＧトランスデューサ（非特許文献２）、及び木構造からより一般的な有向超グラフ（以下、Ｇｒａｐｈとも称する）への変換を行う木‐ｔо‐Ｇｒａｐｈトランスデューサ（非特許文献３）が知られている。なお、図１３左に、自然言語構文木（ＤＡＧの一種）、図１３中央に、自然言語文の簡単化された意味構造（ＤＡＧ）、及び図１３右に、自然言語文の完全な意味構造（Ｇｒａｐｈ）の各々の例を示す。

Andreas Maletti. Survey: Tree transducers in machine translation. In NCMA, pages 11−32. Citeseer, 2010. Tsutomu Kamimura and Giora Slutzki. Parallel and two-way automata on directed ordered acyclic graphs. Information and Control, 49(1):10−51, 1981. Joost Engelfriet and Heiko Vogler. The translation power of top-down tree-to-graph transducers. Journal of Computer and System Sciences, 49(2):258−305, 1994.

しかし、上述した従来の方法では、ＤＡＧからＧｒａｐｈへの変換が行えるより一般化されたトランスデューサが存在しない（従来の３つの独立した方法を統一する枠組みがない）という問題がある。

また、ＤＡＧトランスデューサは自然言語処理などの実課題に対して、表現力が乏しい（モデル化できない言語現象などがある）という問題がある。

本発明では、上記問題点を解決するために成されたものであり、木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができるグラフ変換装置、方法、及びプログラムを提供することを目的とする。

上記目的を達成するために、第１の発明に係るグラフ変換装置は、ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、１つの超辺と前記１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する変換部、を含んで構成されている。

第２の発明に係るグラフ変換方法は、変換部を含む、ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、前記変換部は、１つの超辺と前記１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する。

第１及び第２の発明によれば、変換部により、１つの超辺と１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換する。

このように、１つの超辺と１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。

第３の発明に係るグラフ変換装置は、ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、１つのＤＡＧグラフと前記１つのＤＡＧグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記ＤＡＧグラフを置換する処理を繰り返すことにより、前記超グラフに変換する変換部、を含んで構成されている。

第４の発明に係るグラフ変換方法は、変換部を含む、ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、前記変換部は、１つのＤＡＧグラフと前記１つのＤＡＧグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記ＤＡＧグラフを置換する処理を繰り返すことにより、前記超グラフに変換する。

第３及び第４の発明によれば、変換部により、１つのＤＡＧグラフと１つのＤＡＧグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれるＤＡＧグラフを置換する処理を繰り返すことにより、超グラフに変換する。

このように、１つのＤＡＧグラフと１つのＤＡＧグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれるＤＡＧグラフを置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。

また、本発明のプログラムは、コンピュータを、上記のグラフ変換装置を構成する各部として機能させるためのプログラムである。

以上説明したように、本発明のグラフ変換装置、方法、及びプログラムによれば、１つの超辺と１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。

また、１つのＤＡＧグラフと１つのＤＡＧグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれるＤＡＧグラフを置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。

超辺置換操作の一例を示す図である。本発明の第１の実施形態に係るグラフ変換装置の機能的構成を示すブロック図である。本発明の第１の実施形態に係るグラフ変換装置におけるグラフ変換処理ルーチンのフローチャート図である。英語の簡単化された意味構造から日本語の構文木への非構成的変換の一例を示す図である。アルゴリズムの一例を示す図である。アルゴリズムの一例を示す図である。本発明の第２の実施形態に係るグラフ変換装置の機能的構成を示すブロック図である。モデルＭ_１の一例を示す図である。構文木から完全な意味構造への重み付き変換の過程の一例を示す図である。モデルＭ_２の一例を示す図である。簡単化された意味構造から構文木への重み付き変換の過程の一例を示す図である。本発明の第２の実施形態に係るグラフ変換装置におけるグラフ変換処理ルーチンのフローチャート図である。ＤＡＧ、及びＧｒａｐｈの一例を示す図である。

以下、図面を参照して本発明の実施形態を詳細に説明する。

＜本発明の実施形態の概要＞
まず、本発明の実施形態の原理について説明する。後述する本実施形態に係るグラフ変換装置は、入力となる閉路無し有向超グラフ（ＤＡＧ）をより一般的な有向超グラフ（超グラフ）へと変換するための形式的な装置である。

ＤＡＧの構造は自然言語処理の構文木（根付き木）や簡単化された意味構造などを表現できる。また、超グラフはＤＡＧ構造を包含し、より一般的で複雑な構造（自然言語文の完全な意味構造など）も表現できる。

後述する、グラフ変換装置では、構文木から構文木への変換による構文構造に基づく機械翻訳、簡単化された意味構造から構文木への変換による意味構造に基づく機械翻訳、及び構文木から完全な意味構造への変換による意味構造解析等をモデル化し、解くことができる。また、自然言語処理以外のＤＡＧ構造から超グラフ構造への変換問題に対しても応用可能である。

＜定義＞
本実施形態においては、系列、未定義シンボル、及び変数を定義する。以下説明する。

集合Ｖに対して、Ｖ^＊はＶ上の要素＊個から成る系列の集合であり、空列

を含む。ある系列

は全ての

に対して、ｖ_ｉ∈Ｖである。なお、系列を表す記号は、ｂоｌｄフォントで表現する。

系列

の長さは

と表し、全ての

に対して、そのｉ番目の要素を

と表現する。ある２つの系列

に対して、その結合

は、＜ｖ_１１,...,ｖ_１ｎ,ｖ_２１,...,ｖ_２ｍ＞となる。

ｎｉｌは集合の要素や系列を表す記号が未定義の場合に用いる特殊なシンボルである。Ｘ＝｛ｘ_１,ｘ_２,....｝を変数の無限集合と定義し、

に対して、Ｘ_ｋ＝｛ｘ_１,...,ｘ_ｋ｝はその有限集合とする。

また、本実施形態においては、２重階層化アルファベットを定義する。２重階層化アルファベットは組

であり、有限集合

と関数

から成る。

は自然数を表す。２重階層化アルファベットを表示するときは省略して、その

のみを表示する。関数ｄｒｋは、

の要素に２重ランクを割り当てる関数である。全ての

に対して、

は、その各要素

が、

となるような

の補集合である。その要素

は、

と表現する。

また、本実施形態においては、超グラフ（Ｇｒａｐｈ）を定義する。２重階層化アルファベット

上において、超グラフｈは組ｈ＝（Ｖ,Ｅ,ｓ,ｔ,ｌ,ｂｅｇｉｎ,ｅｎｄ）から成る。なお、それぞれの要素を以下に説明する。

・Ｖはノードの有限集合を表す。
・Ｅは超辺の有限集合を表す。
・ｓ：Ｅ→Ｖ^＊はソースノード関数を表す。
・ｔ：Ｅ→Ｖ^＊はターゲットノード関数を表す。
・ｌ：Ｅ→Δはラベル付け関数で、全ての超辺ｅ∈Ｅに対して、ｄｒｋ（ｌ（ｅ））＝（｜ｓ（ｅ）｜,｜ｔ（ｅ）｜）となる２重階層化されたシンボルｌ（ｅ）をラベル付けする関数を表す。
・ｂｅｇｉｎ∈Ｖ^＊はｈの始点となるノード系列を表す。
・ｅｎｄ∈Ｖ^＊はｈの終点となるノード系列を返す関数を表す。

上で定義される全ての超グラフの集合（クラス）を

として表現する。ある

に対して、その要素をＶ_ｈ、Ｅ_ｈ、ｓ_ｈ、ｔ_ｈ、ｌ_ｈ、ｂｅｇｉｎ（ｈ）、ｅｎｄ（ｈ）と表現する。各ｖ∈Ｖ_ｈに対して、ｉｎｄｅｇ（ｖ）はｖに入る超辺の数、оｕｔｄｅｇ（ｖ）はｖから出る超辺の数を表現する。

｜ｂｅｇｉｎ（ｈ）｜＝ｍ、かつ、｜ｅｎｄ（ｈ）｜＝ｎのとき、ｈは（ｍ,ｎ）‐ｈｙｐｅｒｇｒａｐｈと表現し、超グラフｈのランクをｄｒｋ（ｈ）＝（ｍ,ｎ）と表現する。同様に、各超辺ｅ∈Ｅ_ｈがｄｒｋ（ｌ（ｅ））＝（ｍ,ｎ）のとき、ｅを（ｍ,ｎ）‐ｈｙｐｅｒｅｄｇｅと表現する。Δで定義される全ての（ｍ,ｎ）‐ｈｙｐｅｒｇｒａｐｈのクラスを（ｍ,ｎ）‐ＨＧＲ（Δ）として表現する。

また、本実施形態においては、無閉路を定義する。ある超グラフｈにおいて、そのノードｖからノードｕへの経路とは、３つ組の有限系列＜（ｋ_１,ｅ_１,ｊ_１）,...,（ｋ_ｎ,ｅ_ｎ,ｊ_ｎ）＞で表される。ここで、

は自然数で、全てのｅ_ｉ∈Ｅ_ｈはｓ（ｅ_１）（ｋ_１）＝ｖ、かつ、ｔ（ｅ_ｎ）（ｊ_ｎ）＝ｕとなり、全ての

に対して、ｔ（ｅ_ｉ）（ｊ_ｉ）＝ｓ（ｅ_ｉ＋１）（ｊ_ｉ＋１）となる。超グラフｈが無閉路とは、各ノードに対して、そのノード自身への空列でない経路が存在しない場合をいう。

また、本実施形態においては、アトムを定義する。

となる２重階層化シンボル

に対して、

とはランク（ｍ,ｎ）の超グラフｇであり、ノード集合

となるｅを持つ超辺集合Ｅ_ｇ＝｛ｅ｝、ｂｅｇｉｎ（ｇ）＝ｓ（ｅ）＝＜ａ_１,...,ａ_ｍ＞、ｅｎｄ（ｅ）＝ｔ（ｅ）＝＜ｂ_１,...,ｂ_ｎ＞、から構成される。

また、本実施形態においては、超辺置換操作を定義する。図１に、図１左の超グラフが持つｘでラベル付けされた超辺を図１中央にある超グラフで置換したとき、図１右の超グラフが作成される。ｈを超グラフ、Ｒ⊆Ｖ_ｈ×Ｖ_ｈをｈのノード間の関係とする。あるノードａ∈Ｖ_ｈに対して、［ａ］_Ｒはそれと等価なノードを表す。あるノード補集合Ｖ⊆Ｖ_ｈに対して、Ｖ／Ｒ＝｛［ａ］_Ｒ｜ａ∈Ｖ｝と表現する。ノード系列

に対して、

と表現する。更に、超グラフｈ／Ｒをｈ／Ｒ＝（Ｖ_ｈ／Ｒ,Ｅ_ｈ,ｓ,ｔ,ｌ_ｈ,［ｂｅｇｉｎ（ｈ）］_Ｒ,［ｅｎｄ（ｈ）］_Ｒ）として表現し、ここでは全てのｅ∈Ｅ_ｈに対して、ｓ（ｅ）＝［ｓ_ｈ（ｅ）］_Ｒ、かつ、ｔ（ｅ）＝［ｔ_ｈ（ｅ）］_Ｒを満たす。

ｇを超グラフ、ｅをＥ_ｇ中の（ｍ,ｎ）‐ｈｙｐｅｒｅｄｇｅ、ｈを（ｍ,ｎ）‐ｈｙｐｅｒｇｒａｐｈとしたとき、ｇからｅを取り除き、ｈを加えると、ｇ´＝（Ｖ_ｇ∪Ｖ_ｈ,（Ｅ_ｇ−｛ｅ｝）∪Ｅ_ｈ,ｓ,ｔ,ｌ,ｂｅｇｉｎ（ｇ）,ｅｎｄ（ｇ））が取得できる。

ここで、ｅ∈（Ｅ_ｇ−｛ｅ｝）に対して、ｓ（ｅ）＝ｓ_ｇ（ｅ）、ｅ∈Ｅ_ｈに対して、ｓ（ｅ）＝ｓ_ｈ（ｅ）であり、ｔとｌも同様である。このとき、ｇ中の超辺ｅに対するｈの置換とは、ｇ［ｅ／ｈ］で表現され、超グラフｇ´／Ｒとなる。ここで、

となる。

ＡとＢとを２重階層化アルファベット、φ：Ａ→ＨＧＲ（Ｂ）を置換関数と呼び、全ての

に対して、

となる。φを拡張し、関数

を、下記の様に定義する。

・

に対して、

となる。

・

と

に対して、

となり、ここで、Ｅｇ＝｛ｅ_１,...,ｅ_ｋ｝となる。この拡張された関数

はｇ中で

となる全ての超辺ｅを

で置き換える関数である。

また、本実施形態においては、木、及びＤＡＧを定義する。２重階層化アルファベット

上で定義されたＤＡＧｄ＝（Ｖ,Ｅ,ｓ,ｔ,ｌ,ｂｅｇｉｎ,ｅｎｄ）は、ｄは無閉路であり、各ノードｖ∈Ｖに対して、

、各ノードｖ∈Ｖに対して、

、及び全てのｅ∈Ｅ_ｊに対して、｜ｓ（ｅ）｜＞０の条件を満たす超グラフである。

あるＤＡＧｄに対して、各要素をＶ_ｄ、Ｅ_ｄ、ｓ_ｄ、ｔ_ｄ、ｌ_ｄ、ｂｅｇｉｎ（ｄ）、ｅｎｄ（ｄ）と表現する。

上で定義される全てのＤＡＧのクラスを

と表現する。｜ｂｅｇｉｎ（ｄ）｜＝ｍ、かつ｜ｅｎｄ（ｄ）｜＝ｎのとき、当該ＤＡＧを（ｍ,ｎ）‐ｄａｇと表現する。全ての（ｍ,ｎ）‐ｄａｇから成るクラスを

と表現する。

クラス

に属するＤＡＧを根付きＤＡＧと表現し、そのクラスに、全てのｅ∈Ｅ_ｄに対して、｜ｓ（ｅ）｜＝１を加えたクラスに属するＤＡＧを木と表現する。

ＤＡＧや木は、あるノードから出る超辺が１つ以下という制約がある。そのため、あるノードｖ∈Ｖ_ｄに対して、оｕｔ‐ｅ（ｖ）をそのノードから超辺を返す関数とする。もし、出る超辺が無い場合には、ｎｉｌを返す。

また、本実施形態においては、重み付きＤＡＧ−ｔо−Ｇｒａｐｈトランスデューサを定義する。これを（重み付き）ＤＡＧ−ｔо−Ｇｒａｐｈトランスデューサと表現する。

重み付きＤＡＧトランスデューサＭは５つ組

から成る。

なお、Ｑは状態集合であり、状態は２重階層化アルファベットの要素をとり、Σは入力シンボルの２重階層化アルファベットであり、

は出力シンボルの２重階層化アルファベットをとり、Ｉ⊆Ｑ^{（１,０）１}は初期状態系列の集合であり、初期状態系列は状態集合Ｑの補集合Ｑ^{（１,０）}から１つだけ要素をとり、Ｒは組（Ｒ´,π）から成り、Ｒ´は規則の有限集合で、各規則ｒは

で定義される。

ここで、

は状態系列、ｅは（ｍ,ｎ）超辺、

は、ｎ個の変数から成る系列、

はｍ個の超グラフから成る系列であり、各超グラフは全ての

に対して、

が成り立つ。

は各規則に重みを割り当てる関数である。重み付きの規則は、

として定義される。

＜第１の実施形態の原理＞
次に、第１の実施形態に係るグラフ変換装置における、ＤＡＧから超グラフへの変換を行う過程を説明する。当該過程は、規則を入力ＤＡＧは１つずつ提供することで進んでいく。

状態系列

とし、

となるような規則ｒ∈Ｒを考え、ｄｒｋ（ｌ（ｅ））＝（ｍ,ｎ）、かつ、

、かつ、

とする。ここで、ｄ∈（１,０）‐ＤＡＧ（Σ）を入力ＤＡＧとし、

を２つの超グラフとすると、導出の１ステップは

として表現でき、下記条件を満たすｍ個の超辺

と超辺ｅ_ｄ∈Ｅ_ｄとが存在する場合に動作する。

条件１：ｌ（ｅ_ｄ）＝ｌ（ｅ）
条件２：ｓ（ｅ_ｄ）＝＜ｖ_１,...,ｖ_ｍ＞
条件３：全ての

に対して、

条件４：

が成り立つ。ここで、

は、

となる関数で、超辺置換関数

と拡張したものである。超辺置換関数φは、全ての

に対して、

が成り立つような関数である。

をある自然数、全ての

に対して、

を超グラフとする。ここで、

となるような系列

をＭにおける

の導出と表現する。

導出

の重み

は、各規則の重みの積

で定義される。

全ての

に対して、重み付きＤＡＧ‐ｔо‐Ｇｒａｐｈ変換とは、写像

であり、

のように定義される。ここで、ｒ_１,...,ｒ_ｌ∈Ｒ´は規則である。

Ｍの意味τ_Ｍとは、全ての

と

に対して、重み付きＤＡＧ‐ｔо‐Ｇｒａｐｈ変換

であり、

として定義される。

＜本発明の第１の実施形態に係るグラフ変換装置の構成＞
次に、本発明の第１の実施形態に係るグラフ変換装置の構成について説明する。図２に示すように、本発明の本実施形態に係るグラフ変換装置１００は、ＣＰＵと、ＲＡＭと、後述するグラフ変換処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。このグラフ変換装置１００は、機能的には図２に示すように入力部１０と、演算部２０と、出力部９０とを含んで構成されている。なお、第１の実施形態においては、上述した第１の実施形態の原理に基づいて、入力されたＤＡＧを変換する。

入力部１０は、変換対象のＤＡＧを受け付ける。なお、変換対象のＤＡＧの各ノードには状態ｑが付加されているものとする。

演算部２０は、変換部２２と、ルール記憶部２４とを含んで構成されている。

変換部２２は、入力部１０において受け付けたＤＡＧに含まれる超辺と状態系列との組み合わせに対応する規則を、ルール記憶部２４から取得し、当該規則を当該ＤＡＧに適用することにより、変換対象となる超辺を超グラフに置換する処理を繰り返すことにより、取得したＤＡＧを超グラフに変換する。また、変換部２２は、取得した超グラフを出力部９０から出力する。

ルール記憶部２４には、１つの超辺を、当該超辺と当該超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則が記憶されている。

＜本発明の第１の実施形態に係るグラフ変換装置の作用＞
次に、本発明の第１の実施形態に係るグラフ変換装置１００の作用について説明する。グラフ変換装置１００は、入力部１０によって、ＤＡＧを受け付けると、グラフ変換装置１００によって、図３に示すグラフ変換処理ルーチンが実行される。

まず、図３に示すグラフ変換処理ルーチンのステップＳ１００で、ルール記憶部２４に記憶されている規則を読み込む。

次に、ステップＳ１０２で、ステップＳ１００において取得した規則と、入力部１０において取得したＤＡＧとに基づいて、取得したＤＡＧに含まれる超辺を１つずつ置換し、規則が適用できなくなるまで処理を繰り返し、当該ＤＡＧを超グラフに変換する。

次に、ステップＳ１０４で、ステップＳ１０２において取得した超グラフを出力部９０から出力して、グラフ変換処理ルーチンを終了する。

以上説明したように、本発明の本実施形態に係るグラフ変換装置によれば、１つの超辺と１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれる超辺を置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。

また、従来の木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みを提供することができる。

なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

次に、第２の実施形態に係るグラフ変換装置について説明する。第２の実施形態においては、ＤＡＧ‐ｔо‐Ｇｒａｐｈトランスデューサの規則の左辺に、任意のＤＡＧを取れるようにトランスデューサを拡張した点が第１の実施形態と異なる。なお、第１の実施形態に係るグラフ変換装置と同様の構成及び作用については、同一の符号を付して、説明を省略する。

＜第２の実施形態の原理＞
図４左に示すような英語の簡単化された意味構造を、図４右に示すような日本語の構文木へ非構成的変換を行う場合、英語側において、ｇｉｒｌ´はｗоｒｋ´の下にあり、日本語側ではｓｈｅ_ｊとｗоｒｋ_ｊとが同列となることから、上述した第１の実施形態に係るＤＡＧ‐ｔо‐Ｇｒａｐｈトランスデューサに基づいて行うことはできない。

これは、第１の実施形態に係るＤＡＧ‐ｔо‐Ｇｒａｐｈトランスデューサにおいては、規則の左辺に超辺を１つしかとることができず、入力されたＤＡＧの超辺を１つずつしか処理できないため、英語側のｇｉｒｌ´を日本語側のｓｈｅ_ｊに変換することができないからである。

そこで、第２の実施形態においては、図４に示した場合についても変換を行えるようにするため、ＤＡＧ‐ｔо‐Ｇｒａｐｈトランスデューサの規則の左辺に、任意のＤＡＧを取れるように拡張する。このような拡張は、非特許文献２のＤＡＧトランスデューサでは記載されていない新しい拡張である。

重み付き拡張型ＤＡＧ‐ｔо‐Ｇｒａｐｈトランスデューサは、組

で表現される。上述した第１の実施形態に係るＤＡＧ‐ｔо‐Ｇｒａｐｈとの違いは、規則の左辺に超辺ではなく、ＤＡＧを取れる点である。

Ｒは組（Ｒ´,π）であり、Ｒ´は規則の有限集合で、各規則ｒは、

と表現される。ここで、

は状態系列、ｄは（ｍ,ｎ）‐ｄａｇ、

はｎ個の変数から成る系列、

は全ての

に対して、

となるｎ個の超グラフから成る系列である。

は規則の重み関数で、重み付き規則は

という形式をとる。

＜定義＞
また、第２の実施形態においては、ＤＡＧマッチングアルゴリズムを定義する。重み付き拡張型ＤＡＧ‐ｔо‐Ｇｒａｐｈトランスデューサでは、規則の左辺に（ｍ,ｎ）‐ｄａｇをとることができるため、導出を定義するためには、入力されたＤＡＧの任意のｍ個のノードから始まる部分ＤＡＧに、規則の左辺のＤＡＧが一致するか否かを調べる必要がある。

調べることが行うためのアルゴリズムを図５に示す。ｇを（ｍ,ｎ）−ｄａｇ、ｈをＤＡＧとする。また、

をｈの任意のｍ個のノードから成る系列とすると、

は、ｈのノード系列

を始点とする部分ＤＡＧにｇがマッチするかを判定する。もし、ｇがｈのノード系列

を始点とする部分ＤＡＧｈ´にマッチすると、このアルゴリズムはｈ´の終点からなる系列を返す。

このようなｈ´を探すため、図５に示すアルゴリズムは、ペアＲ＝（Ｒ_Ｖ,Ｒ_Ｅ）が存在するかを検査する。当該要素Ｒ_Ｖ：Ｖ_ｇ→Ｖ_ｈ´とＲ_Ｅ：Ｅ_ｇ→Ｅ_ｈ´は、どちらも全単射の関係集合であり、全ての超辺ｅ∈Ｅ_ｇに対して、

、かつ、

が成り立つ。そのようなペアがｇとｈ´の間で存在するとき、ｇはｈ´にマッチし、そうでない場合、ｇはｈ´にマッチしない。図５に示すアルゴリズムでは、ノードに対する関数集合Ｒ_Ｖは直接構築するが、超辺に対する関係集合Ｒ_Ｅは構築しない。代わりに、Ｒ_Ｖに含まれる全てのノードペアに対し、それらのノードから出る超辺ｅ∈Ｅ_ｇとｅ´∈Ｅ_ｈ´の間で

、かつ、

が成り立つかを、図６に示すアルゴリズムに基づいて検査する。

次に、第２の実施形態における導出を定義する。

を入力となるＤＡＧ、

を２つの超グラフ、

を状態系列、ｒ∈Ｒを

という形式の規則とし、ここでｄｒｋ（ｄ）＝（ｍ,ｎ）、かつ、

、かつ、

とする。

導出の１ステップは、

として表現し、次の条件を満たすようなｍ個の超辺

が存在するならば動作する。

条件１：全ての

に対して、

条件２：

条件３：

であり、ここで、

は関数

で、置換関数

を拡張したものである。

この置換関数は全ての

に対して、

を満たす

である。

＜本発明の第２の実施形態にグラフ変換装置の構成＞
次に、本発明の第２の実施形態に係るグラフ変換装置の構成について説明する。図７に示すように、第２の実施形態に係るグラフ変換装置２００は、ＣＰＵと、ＲＡＭと、後述するグラフ変換処理ルーチンを実行するためのプログラムや各種データを記憶したＲＯＭと、を含むコンピュータで構成することが出来る。このグラフ変換装置２００は、機能的には図７に示すように入力部１０と、演算部２２０と、出力部９０とを含んで構成されている。

演算部２２０は、変換部２２２と、ルール記憶部２２４とを含んで構成されている。

変換部２２２は、入力部１０において受け付けたＤＡＧに含まれる部分ＤＡＧと状態系列との組み合わせに対応する規則を、ルール記憶部２２４から取得し、当該規則を当該ＤＡＧに適用することにより、変換対象となる部分ＤＡＧを超グラフに置換する処理を繰り返すことにより、取得したＤＡＧを超グラフに変換する。また、変換部２２２は、取得した超グラフを出力部９０から出力する。

図８に、入力部１０において自然言語文の構文木から完全な意味構造への重み付き変換をモデル化する例を示す。図８に示すモデルＭ_１はその規則集合Ｒにｒ_１とｒ_２との２つの規則を持つ。なお、当該規則集合Ｒは、ルール記憶部２２４に記憶されている規則である。具体的には、例えば、入力部１０において、図１左に示した構文木を受け付けた場合、変換部２２２は、当該構文木に対応する規則ｒ_１をルール記憶部２２４から取得し、当該規則に対応するラベルが付加されている図９左の左側の超辺を、規則ｒ_１の変換規則に従って、超グラフに置換する。これにより、図９左から図９中央へと遷移する。

次に、図９中央のＤＡＧに対応する規則ｒ_２を、ルール記憶部２２４から取得し、当該規則に対応するラベルが付加されている部分ＤＡＧを、規則ｒ_２の変換規則に従って、超グラフに置換する。これにより、図９中央から図９右へと遷移する。このように、規則を繰り返し適用することにより、入力された自然言語文の構文木を、完全な意味構造へと変換させることができる。

また、図１０に、入力部１０において自然言語文の簡単化された意味構造から自然言語構文木への重み付き変換をモデル化する例を示す。図１０に示すモデルＭ_２はその規則集合Ｒにｒ_１とｒ_２との２つの規則を持つ。なお、当該規則集合Ｒは、ルール記憶部２２４に記憶されている規則である。具体的には、例えば、入力部１０において、図１中央に示した意味構造を受け付けた場合、変換部２２２は、当該意味構造に対応する規則ｒ_１をルール記憶部２２４から取得し、当該規則に対応するラベルが付加されている図１１左の左側の超辺を、規則ｒ_１の変換規則に従って、超グラフに置換する。これにより、図１１左から図１１中央へと遷移する。

次に、図１１中央のＤＡＧに対応する規則ｒ_２を、ルール記憶部２２４から取得し、当該規則に対応するラベルが付加されている部分ＤＡＧを、規則ｒ_２の変換規則に従って、超グラフに置換する。これにより、図１１中央から図１１右へと遷移する。このように、規則を繰り返し適用することにより、入力された簡単化された意味構造から構文木へと変換させることができる。なお、図１１右に示す構文木は、図１左に示した英語構文木に対応する日本語の構文木の例である。

ルール記憶部２２４には、１つのＤＡＧを、当該ＤＡＧと当該ＤＡＧの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則が記憶されている。

＜本発明の第２の実施形態に係るグラフ変換装置の作用＞
次に、第２の本実施形態に係るグラフ変換装置２００の作用について説明する。グラフ変換装置２００は、入力部１０によって、ＤＡＧを受け付けると、グラフ変換装置２００によって、図１２に示すグラフ変換処理ルーチンが実行される。なお、第１の実施形態に係るグラフ変換装置１００と同様の作用については、同一の符号を付して説明を省略する。

まず、図１２に示すグラフ変換処理ルーチンのステップＳ２００で、ステップＳ１００において取得した規則と、入力部１０において取得したＤＡＧとに基づいて、取得したＤＡＧに含まれる部分ＤＡＧを置換し、規則が適用できなくなるまで処理を繰り返し、当該ＤＡＧを超グラフに変換する。

以上説明したように、本発明の本実施形態に係るグラフ変換装置によれば、１つのＤＡＧと１つのＤＡＧの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力されたＤＡＧグラフに含まれるＤＡＧを置換する処理を繰り返すことにより、超グラフに変換することにより、木トランスデューサ、ＤＡＧトランスデューサ、及び木‐ｔо‐Ｇｒａｐｈトランスデューサでモデル化することができる問題を全て解くことができる統一的な枠組みの提供をすることができる。

また、規格拡張化による変換表現力を向上させることができる。

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。

１０入力部
２０,２２０演算部
２２,２２２変換部
２４,２２４ルール記憶部
９０出力部
１００,２００グラフ変換装置

Claims

ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、
１つの超辺と前記１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する変換部
を含む、グラフ変換装置。
ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置において、
１つのＤＡＧグラフと前記１つのＤＡＧグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記ＤＡＧグラフを置換する処理を繰り返すことにより、前記超グラフに変換する変換部
を有する、グラフ変換装置。
変換部を含む、ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、
前記変換部は、１つの超辺と前記１つの超辺の始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記超辺を置換する処理を繰り返すことにより、前記超グラフに変換する
グラフ変換方法。
変換部を含む、ノード、及び０以上のノードと０以上のノードとを結ぶ超辺からなる有向グラフであって、前記有向グラフは無閉路であって、前記ノードの各々に入力される超辺の数が１以下であり、前記ノードの各々から出力される超辺の数が１以下であり、かつ、全ての前記ノードの各々について、前記ノードの始点となるノードの数が０よりも多い有向グラフである、意味構造を表すＤＡＧグラフを、ノード及び超辺からなる有向グラフであって、前記ノードの各々に入力される超辺の数が０以上であり、前記ノードの各々から出力される超辺の数が０以上である有向グラフである、前記意味構造を表す超グラフに変換するグラフ変換装置における、グラフ変換方法であって、
前記変換部は、１つのＤＡＧグラフと前記１つのＤＡＧグラフの始点となるノード系列に対応する状態系列との組み合わせに対応した超グラフに置換するための予め定義された規則に基づいて、入力された前記ＤＡＧグラフに含まれる前記ＤＡＧグラフを置換する処理を繰り返すことにより、前記超グラフに変換する
グラフ変換方法。
コンピュータを、請求項１又は２記載のグラフ変換装置の各部として機能させるためのプログラム。