WO2004084156A1

WO2004084156A1 - テンプレート−テンプレート構造に基づく対話式学習システム

Info

Publication number: WO2004084156A1
Application number: PCT/JP2004/003838
Authority: WO
Inventors: Naoyuki Tokuda; Liang Chen
Original assignee: Sunflare Co., Ltd.
Priority date: 2003-03-22
Filing date: 2004-03-22
Publication date: 2004-09-30
Also published as: EP1607925A1; EP1607925A4; JPWO2004084156A1; US20060154218A1; US7509296B2

Abstract

本発明の学習システムにはテンプレート・オートマトンの概念が導入されており、「正しい」回答と「誤った」回答からなる多くの「多様な学習者の予想される例」を収集し、効率的なエラー診断エンジンとしてHCS(最重共通文字列)またはLCS(最長共通文字列)アルゴリズム等の代表的なNLP技術を言語学習システムに用い、テンプレート内に埋め込まれたこれらの例を学習者の回答の診断解析のために用いる。この診断は、テンプレートデータベースの膨大な数の候補パスの中から学習者の入力文に最も近似度の高いパスを選択することによって行われる。言語指向インテリジェント学習システムに使用される時間の掛かるオーサリング・タスクの自動化と簡素化が実現される。

Description

明細書テンプレート一テンプレート構造に基づく対話式学習システム技術分野

本発明は、抽出ルール ·ベースのテンプレート—テンプレート構造およびバギー'ルールの拡張性に富む機能を利用した新しい対話式学習システムに関する。背景技術

言語指向インテリジェント学習システムに使用される時間の掛かるォーサリング'タスクの自動化と簡素化が切望されていることが発明の動機となっている。想定される模範回答数は合理的に制限するとしても、理想的な学習システムを開発しようとする場合、学習者が実際に犯す可能性のあるエラーは理論的には無限個に近い数にのぼる場合がしばしばあるからである。本発明者らが判断する限り、少なくとも予見できる将来においては、最先端の自然言語処理技術をもってしても、完全な自由形式でしかもエラーの多い文章の自動訂正を即座に提供出来るレベルには達していない。多くの有能な人間教師のようにシステムがこのような対処ができるには、いわゆる常識と呼ばれる世界の知識ベースをこのシステムに導入することができる場合にのみ可能であろう

発明の開示

本発明の学習システム（Azalea)にはテンプレート 'オートマトンの概念が導入されており、「正しい」回答と「誤った」回答からなる多くの「多様な学習者の予想される例」を収集する。言語学習システムで使われる効率的なエラー診断エンジンとして HCS (最重共通文字列）または LCS (最長共通文字列）アルゴリズムという代表的な NLP技術が決定的な役割を担っており、テンプレート内に埋め込まれたこれらの例は学習者の回答の診断解析のために使用される。この診断は、テンプレート 'データベースの膨大な数の候捕パスの中から学習者の入力文に最も近似度の高いパスを選択することによって行われる。適格なモデル翻訳文と不適格な誤った文章から構成されるテンプレ一コ一パスを構築するォーサリング.タスクは、多くの時間を費やし、人手を浪費させる。本発明の新しいシステムには、通常であれば時間の掛かるテンプレート生成のォ一サリング'タスクを簡素化、すなわち低減することにおいてのみならず（徳田尚之、陳亮、笹井紘幸らによる特開 2002-49617号等を参照のこと）、システム性能の向上においても有効である。導入されたテンプレート一テンプレート ·アーキテクチャがシステムの簡素化と性能の向上をもたらす第 1の理由は、このアーキテクチャが、単一のテンプレート一テンプレートの遷移ノードのいくつかに割り当てられた抽出ルールを適用することによって、単一のテンプレート一テンプレートに多くの異なるテンプレートを統合したり、また逆にいうとそこから多くの異なるテンプレートを同様に抽出することが可能になることであり、第 2の理由は、導入されたバギー'ルールが学習者の誤った回答を自動的に識別'分類し、したがってそこからバグを生成する機能を有することである。 NLP (自然言語処理）技術がこのシステム開発で主要な役割を担う理由は、学習者の自由形式回答の構文構造を調べるためにはパーサが使用されるており、その意味論的構造は、学習者からの回答を準備されたテンプレート 'データベースの意味論的に等価のパスとの文字列照合により調べることから明らかであろう。

新しい抽出ルール'ベースの、またバギー'ノレール'ベースのテンプレート一テンプレート構造は、文字入力おょぴ会話方式による学習システム、音声利用技術によるコーノレ.センターまたは音声ポータル.システム、 -あるいはシステムと人間との間でより自然な人間とコンピュータの対話を実施するより強化されたヒューマン 'コンピュータ 'インターフヱースに焦点を合わせたシステムならばどのシステムをも含めて多くのアプリケーシヨンで重要な役割を担うことが期待される。この発明では以下のような機能が与えられる。

1. ある制約条件の下で選択したテンプレ一トーテンプレート遷移図のノードに抽出ルールを埋め込むと、単一テンプレート一テンプレートは様々な異なるタイプの既存のテンプレートを表現することができる。

2. 導入されたバギー.ルールの拡張力に富む機能を利用することによって、多くの誤り表現および zまたは多くの誤った構文構造は、バグ分類学を記述するその自動機能によって、新しいテンプレート一テンプレートを「よりフアットな」テンプレート一テンプレート形式に展開できるように整合性を保って自動的に記述することができる。語学教師は、テンプレート一テンプレートを制作する際に誤った翻訳文の分類に費やす必要はなぐしたがってエラー分類学の負担を低減し、学習者らの特定のエラーの特徴を評価しクラスタ化する。

3. HCSマッチング'アルゴリズムは、入力文をより簡素なテンプレート一テンプレートに直接照合し、したがって実際にテンプレート一テンプレートを展開せずにすベての抽出されたテンプレートのすべての予想されるパスから最適なパスを探索する際の照合処理の空間および時間計算量を低減するように開発することができる。発明を実施するための最良の形態

テンプレート一テンプレート構造

まず「テンプレート一テンプレート」という用語を以下の様に定義する。テンプレート一テンプレートは、ノードのいくつかが抽出ルールに関違付けられたシンポルでマーク付けされており、そのテンプレート一テンプレートが多くのテンプレート、または一組の非連結型テンプレートが 1つのテンプレートとみなされる場合はいわゆる大きいテンプレートに展開することができる場合の特別なテンプレートと定義される。このような一組の切断されたテンプレートによって、単一の L1文章の様々な予想される翻訳文は、一群の翻訳された L2文章から構成される大きな単一のテンプレート一テンプレートを形成することが可能になる。展開テンプレートであるので、テンプレート一テンプレート'スキームによってテンプレート一テンプレートはいわば 1つまたは複数のテンプレートを抽出することが可能になる。通常、抽出ルールは常に一組のシンボル、例えば {_{S l}, s₂, s Jに関連付けられており、そのシンボルのそれぞれにはテンプレートの 1つまたは複数のノードが割り当てられている。それらの関連付けられたシンボルには 1つまたは複数の値が割り当てられており、その機能は、テンプレート一テンプレートから抽出された 1つ以上のテンプレートに現れるノードのスタイルを表現することである。本発明ではこれらのシンボルを「ラベル 'シンボル」と呼ぶ。単一ルールに関係付けられたシンボルは「関係シンボル」と呼ばれる。関係シンボルはある種の制約を有するべきである。一般的な制約としては、所与の srlに際して， s_k はしばしば 2に制約されるか、あるいは 1以外のいくつかの正の整数に制約される必要がある。の値が一組の他のシンボルに割り当てられた値に依存する場合、の値の選択は他のシンボルの必須選択肢と呼ばれる。語学教師が容易に理解できるように抽出ルールのいくつかの例を以下に示す。タイプ Aルール AP (出現)- NAP (非出現)ルール

ノードによって AP/でマーク付けされているノードと、 Λ 尸/でマーク付けされているノードがあると想定する (/は任意の整数で別のタイプの A ルールを示す)。タイプ Aルールの AP- NAPルールは、展開された時に新たに展開されたテンプレートは Ap/でマーク付けされたノードかまたは Λ 尸 ,でマーク付けされたノードを含むことができる力 S、これらの両方を同時に含むことはできないという条件を.課す。本発明においては、 ΛΡ₁ でマーク付けされたノードがテンプレートに現れないという場合を示すために ΑΡ尸 0を使用する。この時、 NAP!は、 NAP でマーク付けされたノードがそのテンプレートに現れるであろうことを意味する 7である必要がある。したがって本発明では ΝΑΡ,=1 は ^尸尸の必須選択肢であると言うことができる。同様の理由から、 NAP尸 0の場合、 NAPfO APrlの必須選択肢となるように、 APj は 1の値を有する必要がある。タイプ Bルール PPR (人称代名詞） - PPRP (人称代名詞所有格)ルール

タイプ Aルールと同様に、テンプレート一テンプレート 'ルールは、一組のテンプレートに現れる尸/⁷/?/でマーク付けされたノードと尸³ ?尸/でマーク付けされた他のノード (/は任意の整数)は、それぞれに代名詞の自然言語文法が必要とする人称代名詞のフォームと代名詞の人称代名詞所有格のフォームでなければならないという条件を課す。 PPRP, (または PP の場合、 PPR, (または尸）に要求される値は代名詞の自然言語文法によって定義される必要がある。タイプ Cルール AN (任意数)ルールタイプ Cルールは、 AI^でマーク付けされたノードには任意のポジティブな実数を割り当てることができるという条件を課す。「I have 5 books on ZenJが真ならば、 5以外の数はどの数も誤りなので、このルール AN; はエラー'ノード 5に割り当てることができる。タイプ Dルール CHO (択一）ルール

タイプ Dルールは、 CHOi , CHO , CHOi_kでマーク付けされたテンプレート―テンプレートのすべてのノードの中で、テンプレート一テンプレートから抽出されたどのテンプレートにもただ一組だけのノードしか現れることができないという条件を課す。ここで異なる iは異なるタイプ Dルールを表している。したがって、 CHOifOは CHOijでマーク付けされたノードは現れないことを意味し、 CHOij=l はその指定されたノードが現在現れていることを意味している。明らかに、 1が 1つの CHOんに割り当てられている場合、 0は他のすべての C C .に割り当てられるべきである。テンプレート一テンプレートを拡張するためのバギー'ノレール

ここでいうバギー.ルールは、正確な構文規則からの予想される逸脱によって特徴付けられる一般的な構文上の誤り表現のプロダクション 'ノレールと定義される。具体的に、バギー.ルールの以下のフォームを想定する。

ここでは任意のテンプレート一テンプレートの構文上正確なパスを追跡する一組のノードまたは正確な表現の基本的な構成要素またはセグメントを表す一組の文法的な品詞タグを表す。 R ^ ..R_M は、正確なフォームがである典型的誤り表現を表すノードのセットである。エラーがテンプレート一テンプレートの正確なパスからのずれによって識別されることが即座に理解される。一例を示す。

EX VBP EX VBZ

(ここで EXは「there isj (〜がある）というような存在を表すものであり、 VB Pは 1人称および 2人称の現在形の動詞であり、 VBZは 3人称単数現在形の動詞である)。この例は、構文上正確な表現である「 /wre are 5 books」が、主語と動詞の属性一致を誤つて理解している生徒によって誤用されており、この例では誤り表現である「 ^e e 5 booksjが生じたことを意味している。 . 図面の間単な説明

図 1は本発明のテンプレート一テンプレートの構造を示す図である。

図 2は展開ルールにより展開されたテンプレート一テンプレート構造を示す図である。図 3は「Japan is dotted with beautiful parks nationwidejという意味の文章の例で展開されたテンプレート 1を示す図である。

図 4は「Japan is dotted with beautiful parks nationwidejという意味の文章の例で展開されたテンプレートを示す図である。

【号の説明】

エラー ·メッセージ：

AS: 名詞の量に仮定が行われている、

AT: 冠詞は必要ない、

CM: コンマが必要である、

CT: 短縮形が不正確である、

MN: 意味が不正確である、

NP: 名詞は複数形でなければならない、

VS: 主語が単数形なので動詞は単数形でなければならない、

PR: 前置詞が不正確である、

PP: 句は複数形である必要がある、

一般的な品詞タグ：

DT: 限定詞 EX: 存在を表す

IN: 前置詞/従属接続詞 JJ: 形容詞

NN: 名詞、単数または集合 NNS: 名詞、複数

NNP: 固有名詞、単数 RB: 畐 ij詞

VBN: 動詞、過去分詞 VBP: 動詞、非 3人称単数、現在形

VBZ: 動詞、 3人称単数、現在形以下本発明を図面に示す具体例によって説明する。図 1はオリジナルなテンプレ一トーテンプレートの構成を示す図であり、図 2は上記の展開ルールにより展開されたテンプレート一テンプレートを示す図、図 3はテンプレー卜 1を示す図であり、図 4はテンプレート 2を示す図である。テンプレ一トーテンプレート、抽出ルールによるテンプレート拡張、およびバギー'ルーノレの例

本発明の実施例においては、まず「Japan is dotted with beautiful gardens nationwide.」という意味の日本語の文章の英語への翻訳文に関するテンプレート一テンプレートを構築する。図 1等に示される番号は、文中における各単語の相対的重要性を強調する各単語の重みを示している。テンプレートの単語のデフォルトの重みは 1 にセットされており、これらはこの分野の専門家によって判断されるその単語の重要性に関連付けて割り当てられる必要がある。徳田尚之、陳亮、笹井紘幸による特開 2002-49617号を詳細な説明のために参照する。「[」と「]」の間のシンボルは品詞タグである。図中左端に示すノードは開始ノードである。前記バギー'ノレールを単純に適用することによって、それを図 2のテンプレートーテンプレートに展開することができる。

これは、前記のバギー'ノレ一ルがバグの分類法を生成することができ、それによつてそれらの誤り表現をテンプレート一テンプレートに構築することを自動的に可能にするので、語学教師がテンプレート—テンプレートを構築する際に多くの一般的なエラーを分類することの詳細に配慮する必要はないということを示している。次に、前記タイプ Aルールを適用すると、でマーク付けされたノードがそのテンプレートに現れることを可能にし、したがって図 2の NA Λでマーク付けされたノードを削除することによって図 2のテンプレート一テンプレートから図 3のテンプレート 1を抽出し、ならびに図 2の 1 でマーク付けされたノードを削除し、したがって NAP 1でマーク付けされたノードがそのテンプレートに現れるようにすることによって図 4のテンプレート 2を抽出することができることが容易に分かる。

語学教師がより簡素なラベル'シンボルに関してテンプレートの 1つの大きな組み合わせを完成させてテンプレート一テンプレートを構築することができることが理解される

テンプレート一テンプレートおよび入力文に対する最重共通文字列マッチング 'ァルゴリズム

前記の詳細な説明から明らかなように、単一テンプレート一テンプレートから多くのテンプレートを抽出することができる。テンプレート一テンプレートが遷移図上のあるノードに関連付けられるべきラベル'シンボル s^, s_n を有すると仮定すると、テンプレート一テンプレートから抽出された異なるテンプレートはそれらのシンボルをノードに割り当てることによって獲得することができる。本発明ではテンプレートから抽出された各テンプレートを/?クフンシ {s„_Pl, s₂,p₂ AJで示すことができる。ここで、 A.はシンポルに対する適切な割り当てである。上記のセクションで既に議論した通り、 A.は使用される抽出ルールに従って数字または単語のどちらかであってもよい。

2つの文章の最重共通文字列はの次に、その次に... 、その次にという順番で両方の文章に現れる順番付けされた単語の最重共通文字列 _ai, a₂，...，a_mであると定義される。共通文字列の定義は、 A. V. Ahoおよび J. D . Ullman 著（Computer science Press, 1992, pp . 321—327)の教禾斗書『 ¾ί ηο¾ / /?·5· of Computer Science fw 薪^学の基^/』に記載されている。

テンプレート内の各単語または各語句には重みが割り当てられているので、テンプレート内のパスと入力文の最重共通文字列は、その合計の重みが最大であるすベての予想可能な共通文字列内の最重共通文字列と定義される。

次に、テンプレートのすべての予想可能な有効パスから入力文の単語おょぴ Zまたは語句の最重共通文字列を検索する。

テンプレートおよび入力文の最重共通文字列は、それぞれがテンプレートと入力文 1つのパスから獲得される最重共通文字列中で最も重い合計重量を有する単語の最重共通文字列と定義される。

言語翻訳学習システムに関係するアプリケーションでテンプレート一テンプレートが獲得されると、次のステップは、入力文をすベての予想可能なテンプレートのそれぞれと照合し、次いで最も近いパスを選択することである。文章に対するテンプレートの DP (ダイナミックプログラミング）ベースの照合手順の詳細な説明は、徳田尚之、陳亮、笹井紘幸らによる特開 2002-49617号等に記載されている。本発明の方法では、テンプレート一テンプレートからすべてのテンプレートを物理的に抽出せずに、抽出ルールによって（しかしバギー'ノレールにはよらずに）直接的に抽出することができるテンプレートのすべての有効なパスの中から最も近いパスを探索する。そのような照合を行う前にテンプレート一テンプレートにはいかなるバギー'ノレールをも含めないように、まずバギー 'ノレールが埋め込まれたテンプレート一テンプレートを展開する必要がある。これはすでに述べた図 2のステップに従って実行することができる。アルゴリズムで必要とされる第 1のステップは、適用可能な空ノードごとに口というラベルの弧に重みを加算してテンプレートの各ノードをグラフの 1つまたは複数の弧として単純に表現することによって、テンプレート一テンプレートを非循環的な重み付けされた有限有向グラフ（有向グラフ）の 2重数値に変換することである。有向グラフはテンプレート一テンプレートから変換されるので、その関数がそのシンボルに割り当てられた値に決定的'に依存するラベル ·シンボルに関連付けられた多くの弧を含む。したがってそのような 1つの有向グラフがあると仮定すると、異なる一組のラベル 'シンボルが弧に割り当てられている場合は完全に異なるテンプレートを抽出することができる。すなわち、そのような有向グラフがあると仮定すると、テンプレート一テンプレートから抽出することができるテンプレートにそれぞれが対応する多くの有向グラフを獲得することができる。テンプレート一テンプレートから抽出された有向グラフを、以後、テンプレート有向グラフと呼ぶ。本発明者らは、次にすべての有向グラフのパスと入力文の共通文字列から最重共通文字列を探索する手順を以下で定義する。

有向グラフの任意の特定のノード Nで終了するパスと入力文の最重共通文字列は、有向グラフ / で終了する 1つのパスと入力文からそれぞれが獲得されるすべての最重共通文字列中最も重い合計重量を有する単語のシーケンスと定義される。

さらに、テンプレート有向グラフから抽出され、しカしノードで終了するすべての有向グラフのパスを N/ , …, ^^ e表現する。ここでシンポノレは値 _Pi

-ん , ...，/?に割り当てられる。 nタプル , ^ , をノード Λのラベルと呼ぶ。ここでを、 ¾を ^に、 s_n を p„にセットするときにルールの矛盾がないものと仮定すべきである。このようなラベノレ {s _Pl, s₂,p₂, ... , s_n,pjを矛盾なしラベルと呼ぶ。

N_i{s _Pl, s₂,p₂, .·., s_n, ラベされたノードと入力文の最重共通文字列は、矛盾なしラベル , ^ , A?マーク付けされたノードを有する有向グラフ'テンプレ一トから抽出された 1つの有向グラフの最重共通文字列としてそれぞれが獲得されるすベての最重共通文字列中で最も重い合計の重みを有する単語の最重共通文字列と定義される。ノードによっては、 1つの有向グラフの AP2でラベルされたノードと NAP2でラベルされたノードのように有向グラフ'テンプレートから抽出された 1つの有向グラフで同時に現れない場合があることに留意されたい。その結果、 Ni(... , ΑΡ2, 1 ,…， ΝΑΡ2, 1...)のようにルール違反のラベルは、有向グラフ'テンプレートのノードと入力文の共通文字列のどの計算計画にも入ることを許可されるべきではない。以下のアルゴリズムはテンプレート一テンプレートと入力文の最重共通文字列を計算するための手順を記述する。以下の計算では、ラベル'シンボルの非常に特別の値として「λ」が使用され、それによってその値は計算の特定の段階に達するまで未指定のままである。

1. テンプレート一テンプレートを、その有向エッジ（遷移）がテンプレートの対応する単語によってラベルされるテンプレート有向グラフに変換する。

2. 有向グラフのすべてのノードを、ノード ^および .の対ごとにゾ' 'の場合に Nj から Λ^.への遷移がないように N₂, N_t のノードにトポロジカリーに分類する。 3. 空のノード N₀を有向グラフに追加し、 N₀力の弧をテンプレート一テンプレートのすベての開始ノードに加える。

4. CM(N。，Mo)=0 セッ Yする。

5. i=0からの場合、以下のステップを実行する。

6. 1つのシンボルに関連付けられたに対して少なくとも 1つの弧があり、ノード N,以降に sの関係ラベルがまったく存在しない場合、すべての iに関して j=0から m の場合は以下を実行する。

s関係ラベルが, , .··, に現れておらず少なくとも 1つの

{s₁,p₁,s₂,p₂,...,s_n,p_B, SXj,px_lr sx₂,px₂, ■■·,

任思のフベノレ ,^ ".リに関してすべての CM (N Mj)をチェックする。ここで

s₂,p₂, s_n,p_n, sx₁,px₁, sx₂,px₂, sx_h,px_hj, が定されるように、は S 関係ラベルである。

C (Ni{s₁,p₁,s₂,p₂,...,s_n,p_n}, Μ を最大の CM(Ni ,/? …， xj,pxj, pxj, Mj)と定義し、すでに定義されているすべての

C (Wi{s₁,p₁₎s_2!p₂,...,s_n,p_n, sxj, xj, sx₂,px₂, ··., sx_h,px_h}, Mj)を定義角除する。

7. j=0から mの場合、以下のステップを実行する。

8. からの弧があるノード N_kのそれぞれに対しては以下を実行する。

(1) 弧 NiN_K力 Sラベルを有しない場合、すでに定義されている CM(N .J, Mj)、 CM(N ,(...), Mj , CM(N_k{...}, Mj)、 CM(N_k(...), M をすベてチェックし、 CM(M{s_1}pj, s₂,p₂, s_n,pj, Μ、 ₂,p₂,...,s„,pj, M_j+1)、 CM(Nk{si,pい s₂,p₂"..,s_n,pj, Mj)、

s₂,p₂, s_n,p , M_J+1)D 1つが既に定義されている場合は CM V ;^ / Μ を以下のデータの最大と定義する。

。既に定義されている場合は

SwPn}, Mj)である。

。 CWN;.^ ^ Mj)が既に定義されており、弧 NiN_k , W_k と一致する場合は

s₂ …, s_n,_PJ, Mj)+W(N,N_k)である。

• 既に定義されている場合は。！^ ぃ ^ … M_J Jである。 • 既に定義されている場合は CM(Nk{_Sl , s₂'p₂,...,s_n,p_n}, Mj)である。

既に定義されている場合は CM(Nk{s pい s₂,p₂ ..,s_n,pj, Mj である。

(2) 弧 A^_Aがシンボル sに関連付けられている場合、既に定義されている

CM (Ν ...), Mj), CA4(Nj{...l M_J+1)、 CM(N_k(...), Μβ、 CM(N_k{..J, M」Jをチエツクする。

ゾ→ 'ラベ, , s₂，p₂'… _Pn,s, λノが矛盾なしラベルであり、以下の少なくとも 1つが既に定義されている場合：

@ CM(N,{s₁,p₁,s₂,p₂,...,s_n,p , Mj)、 CM(Nj{ s₁,pj,s₂,p₂,...,s_n,p„ }, M_J+1)

• CM(N_k{sj,Pj, s₂,p₂, s„,pj, Mj)ゝ CM(N_k{ s_l,p₁,s₂,p₂,...,s_n,p_n }, M_J+1)

•

S₂, p₂,..., s„, p„, s, λ}, Mj)ゝ CM(N_i{s_llp₁, s₂,p₂, s_n,p_n, s, X}, .

•

s₂,p₂, s_n,p_n! , s, λ}, M_J+1J

■CM(N_k{s_1)Pl,s₂,p₂,...,s_n,p_ni s, U を上記で定義されたデータの最大のデータと定義する。

(ii)ラベル , ^ ¾/ ¾^sあると仮定して、ラベル Ά,¾, "··' 'Α>'& ノが矛盾なしラベルであり、以下の少なくとも 1つが真である場合：

• CM(Ni{s_l!Pl, s₂,p₂, s_N,_PJ, Mj)がすでに定義されており、 s力 pまでのャッ亍ング 1 Sい _Pl,s₂,p₂,.",s_n,_Pn}の必須選択陂であるか、 P がに割り当てられた後で Ν ^力 S M_J+1 と一致する場合

• CM(Ni{s_llPl, s₂,p₂, s_NLPJ, がすでに定義されており、 sから pまでのセッティングが ,；^ ,/^…, PJ( 必須選択肢の場合

• CM(Nk{_Sl,_Pl,s₂,p₂,...,s_n,_PJ, Mj)がすでに定義されており、 ⁵から Pまでのセッティングが ,/^ ¾ … の必須選択肢である場合

- CM(Nk{_Sl,p s₂,p₂, s_n!p_n, s,pj, M_JWリが既に定義されている場合。 CM(Ni{s_llPl, s₂,p₂, ...,s_n,_Pn, s,p,}, Mが既に定義されている場合

。 CM(Ni{s_llPl) s₂,p₂, s_n)Pn! , s, ρ}, M_J )が既に定義されている場合。 ( ^ ，… ,^, )， Mj)が既に定義されている場合

• CM(Nk{s _Pl, s₂,p₂, ..._!Sn, _Pn,,s_>P}, M_J )が既に定義されている場合 • CM(N_k{s_l!Pl,s₂,p₂, ..., s_n, p_n, s,p}, Mj を上記で定義されたデータと以下のデータの最大データと定義する。

。 CM(Ni{sい _PL，s₂,_P2"." s_n,_PJ, Mj)が定義されており、がにセットされた後で Λ^Λ. M_j+i に一致する場合、 CM(Ni{sい pい s₂,_P2, .."s_n'_P MJ)+W(MJ である。

• CM(Ni{s_1)Pl, s₂,p₂, s_n,p_n, s,p }, Mが定慮されており、 p s に割り当てられた後でが M_J+1 と一致する場合、

s CM(Ni{_Sl,_Pl, s₂,p₂, s_n,p_n, s,p}, Mj)+W(M_J+1)である。

また、 sとして割り当てられた pに従い、これらのみを λ から値の必須選択肤まで変更する。

Ν_χ を最終的な頂点であると既に定義しているすべての CM(N_X， M_ra) の中で最大の C (N_X) M_ra)はテンプレート—テンプレートおよびパスの最重共通文字列の重みになる上記のアルゴリズムでは、いくつかの候補からいつ CM(N. (..), Λ .を選択したとしても選択したその 1つに対して一種のバック'リンクをセットすることに留意されたい。テンプレート一テンプレートとパスの最長共通文字列の重みを探索したように、このパック'リンクを追跡することによって、最重共通文字列を有する抽出されたテンプレートのパスを入力文と共に即座に獲得することができることに留意されたい。産業上の利用可能性

本発明を明細書中では代表的な応用例である自然言語翻訳の技術分野に関して記載したが、本発明の用途は自然言語学習システムに限定されるものではなぐ本発明は音声利用技術、プログラミング言語学習システム、または例えば人間とコンビユータの対話を可能にするより自然な拡張型インターフェースを必要とするシステムであればどのようなシステムのためにも利用することができる。

Claims

請求の範囲

1. 抽出ルール'ベースのテンプレート一テンプレート構造およびバギー'ノレールの拡張性を用いた対話式学習システムにおいて、テンプレート一テンプレート構造内のノードのいくつかが、多くのテンプレートまたはいわゆる大きいテンプレートに抽出することができる抽出ルールに関連付けられたシンボルでマーク付けされるテンプレート一テンプレート構造を用いた対話式学習システム。

2. 展開テンプレートのノードのいくつかに抽出ルールに関連付けられた特別なシンポルが割り当てられており、これによつてテンプレートの 1つまたは複数を抽出することができるようになされたテンプレート一テンプレート 'スキームを用いる請求項 1記載の対話式学習システム。

3. 単一テンプレート一テンプレートから複数のテンプレートを抽出するためにテンプレート一テンプレート内のノードをマーク付けするために使用される抽出ルール基く請求項 1記載の対話式学習システム。

4. スリムなテンプレート一テンプレートをより大きなテンプレート一テンプレートまたはよりフアットなテンプレート一テンプレートに展開するために用いられるバギー'ルール基く請求項 1記載の対話式学習システム。

5. 前記抽出ルールが常に一組のシンポル、すなわち {_Sl, s₂, .·. , sjに関連付けられ、このシンボルのそれぞれはテンプレートの 1つまたは複数のノードに割り当てられ、これらの関連付けられたシンポルには 1つまたは複数の値が割り当てられてなる抽出ルール基く請求項 1記載の対話式学習システム。

6. 入力文を抽出ルールが埋め込まれたテンプレートーテンプレートと照合するための HCSマッチング 'アルゴリズムを用いる請求項 1記載の対話式学習システム。