JPH1078959A

JPH1078959A - エッジデータ構造を統一する方法

Info

Publication number: JPH1078959A
Application number: JP9164369A
Authority: JP
Inventors: John T Maxwell Iii; ティー．マックスウェル，ザサードジョン; Ronald M Kaplan; エム．カプランロナルド
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1996-06-21
Filing date: 1997-06-20
Publication date: 1998-03-24
Anticipated expiration: 2017-06-20
Also published as: JP4413286B2; EP0814418A1; US6064953A; EP0814418B1; US5819210A; DE69712411D1; DE69712411T2

Abstract

(57)【要約】【課題】特徴構造の単一化にかかる全体的な時間を減
少して、自然言語処理を行う。【解決手段】コンテキストレジーコピーリンクとプロ
セッサを用いて２つのエッジデータ構造を単一化する方
法では、第１エッジデータ構造に関連するコンテキスト
レジーコピーリンクが単一化中に作動されるときにはい
つも、コンテキストレジーコピーリンクが拡大される。
まずプロセッサは、作動されたコンテキストレジーコピ
ーリンクのターゲット属性値ペアを識別する。プロセッ
サは次に、ターゲット属性値ペアの属性を第１エッジデ
ータ構造にコピーする。最後に、プロセッサは第１エッ
ジデータ構造にコピーされた属性からのコンテキストレ
ジーコピーリンクをターゲット属性値ペアの値に追加す
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はコンピュータを用い
る自然言語処理に関する。より詳細には、本発明は、マ
シンの使用する特徴データ構造を単一化して、指数関数
的な時間をかけずに自然言語の部分を表現する方法に関
する。

【０００２】

【従来の技術及び発明が解決しようとする課題】情報の
急激な増加により、まだ実現されていない自然言語文書
の自動処理に対する要求が生まれた。このようなことが
できれば、自然言語インタフェースにより、データベー
ス、自然言語テキストの抜粋及び要約の自動作成、並び
に自然言語の自動翻訳及び解釈を行うことができる。こ
れらの技術の開発は、現代文法の形式の処理に必要な時
間により妨げられている。

【０００３】多くの現代文法の形式は、回帰的な特徴構
造を使用して自然言語表現の文法構造を述べる。特徴構
造は、プロログ等の統一ベースのプログラミング言語が
あれば、理解及び実行が容易であるという利点を有す
る。しかし特徴構造は、結局は文法上の形式により理論
的にも実際的にも有効に解析されることが困難であり、
不利である。実際、形式によって指数関数的な時間がか
かる現象の整列はまれであるが、一般に単一化ベースの
パーサーが不調和であれば、適度に複雑な文を分解する
のに数分かかる。

【０００４】レジー（lazy）コピーリンクは、単一化に
関する処理時間を減少する別の方法である。レジーコピ
ーリンクは、単一化ベースのチャートパーサーにより必
要なコピーの量を減少することにより処理時間を減少す
る。

【０００５】文脈単一化は、単一化に必要な処理時間を
減少する別の方法である。文脈単一化は、由来する選言
肢を示す命題変数を用いて種々の選言肢を注釈すること
により選択的特徴構造を統合する方法である。

【０００６】単一化に必要な処理時間を減少する全ての
これらの異なるアプローチにもかかわらず、まだ特徴構
造の単一化にかかる全体的な時間を減少する必要があ
る。

【０００７】

【課題を解決するための手段】コンテキストレジーコピ
ーリンクとプロセッサを用いて２つのエッジデータ構造
を単一化する方法を詳細に述べる。第１エッジデータ構
造に関連するコンテキストレジーコピーリンクが単一化
中に作動されるときにはいつも、コンテキストレジーコ
ピーリンクが拡張される。まずプロセッサは、作動され
たコンテキストレジーコピーリンクのターゲット属性値
ペアを識別する。プロセッサは次に、ターゲット属性値
ペアの属性を第１エッジデータ構造にコピーする。最後
に、プロセッサは第１エッジデータ構造にコピーされた
属性からのコンテキストレジーコピーリンクをターゲッ
ト属性値ペアの値に追加する。

【０００８】本発明の一態様は、プロセッサを用いてエ
ッジデータ構造を統一する方法であって、該プロセッサ
がメモリ中に格納された命令を実行することによりこの
方法を実行し、前記エッジデータ構造を統一する方法
が、ａ）第１エッジデータ構造を作成するステップを含
み、第１エッジデータ構造が複数の関連するサブツリー
を有し、第１エッジデータ構造が第１グラフデータ構造
を含み、第１グラフデータ構造が空であると共に複数の
コンテキストレジーコピーリンクを有し、各コンテキス
トレジーコピーリンクがサブツリーグラフデータ構造を
ポイントし、各サブツリーグラフデータ構造が複数の関
連するサブツリーのうちの１つと関連し、ｂ）第１エッ
ジデータ構造を第２エッジデータ構造と統一するステッ
プを含み、ｃ）第１エッジデータ構造と第２エッジデー
タ構造との統一中に第１グラフデータ構造と関連するコ
ンテキストレジーコピーリンクのうちの１つが作動され
ると、第２特徴構造に関連するコンテキストレジーコピ
ーリンクを拡大することにより、第１グラフデータ構造
を拡大するステップを含み、この第１グラフデータ構造
を拡大するステップが、１）第１グラフデータ構造に関
連するコンテキストレジーコピーリンクの中から選択コ
ンテキストレジーコピーリンクを選択するステップを含
み、２）選択コンテキストレジーコピーリンクによりポ
イントされるサブツリー特徴構造から選択属性を選択す
るステップを含み、選択された属性が選択属性値を有
し、３）選択属性のコピーを作成し、第１グラフデータ
構造において選択属性のコピーを第１属性として格納す
るステップを含み、４）第１属性からのコンテキストレ
ジーコピーリンクを選択属性値に追加するステップを含
む、ことを特徴とする。

【０００９】

【発明の実施の形態】本発明を詳細に説明する前に、コ
ンピュータシステム３０について考える。図１を参照す
ると、コンピュータシステム３０は、コンピュータのユ
ーザに情報を視覚的にディスプレイするためのモニタ３
２を含む。コンピュータシステム３０はまた、プリンタ
３３を介してコンピュータユーザに情報を出力する。コ
ンピュータシステム３０は、データを入力するための複
数の方法をユーザに提供する。キーボード３４はマウス
３５と同様に、コンピュータユーザがデータをマニュア
ル入力することを可能にする。コンピュータユーザはま
た、ペン３８を用いて電子タブレット３６に書き込むこ
とにより情報を入力することもできる。あるいは、コン
ピュータユーザは、ディスクをフロッピーディスクドラ
イブ４２に挿入することにより、フロッピーディスク等
の機械可読形式の媒体に格納されたデータを入力するこ
とができる。光学文字認識ユニット（ＯＣＲユニット）
４４により、ユーザはハードコピー自然言語文書４６を
入力することができ、自然言語文書４６はコード化され
た電子表現に変換され、この電子表現は情報交換用米国
標準コード（ASCII ）であるのが典型的である。

【００１０】プロセッサ４８は、コンピュータシステム
３０のオペレーションを制御、調整して、コンピュータ
ユーザのコマンドを実行する。プロセッサ４８は、メモ
リ５０又はディスクドライブ４２内のフロッピーディス
ク４０のいずれかのメモリ内に電子的に格納された命令
を実行することにより、各コマンドに応答して適切な動
作を決定し、実行する。典型的には、プロセッサ４８の
動作命令は、ソリッドステートメモリ中に格納されてお
り、命令に頻繁且つ迅速にアクセスする。メモリ５０は
また、節及び制限解を格納するためのキャッシュメモリ
を含む。メモリ５０を実行するために使用されることの
できる半導体メモリデバイスは、読取り専用メモリ（Ｒ
ＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、ダイナミ
ックランダムアクセスメモリ（ＤＲＡＭ）、プログラマ
ブル読取り専用メモリ（ＰＲＯＭ）、消去可能なプログ
ラマブル読取り専用メモリ（ＥＰＲＯＭ）、電子的に消
去可能なプログラマブル読取り専用メモリ（ＥＥＰＲＯ
Ｍ）（フラッシュメモリ等）を含む。

【００１１】本発明のコンテキストレジーコピー方法
は、単一化ベースで文法を解析する標準的なアプローチ
では、モデル化される言語現象が文脈自由となる力を有
する場合でさえ、指数関数的な時間がかかるという観察
結果を利用する。即ち、単純なフレーズ構造の規則を用
いて言語現象を表現することができることにより、フレ
ーズ構造のパーサーが文を解析するのにせいぜいＯ（ｎ
³）時間（ここでＯ（ｆ（ｎ））又はＯｆ（ｎ）は語数
ｎの関数ｆ（ｎ）に比例した時間を表す）しかかからな
いのに、標準的な単一化ベースの特徴構造パーサーが同
じ文をモデル化するにはＯ（２ⁿ）時間が必要である。
特徴構造を追加することにより、なぜ解析時間があまり
にも過激に増大するのかを理解することには、チャート
を用いて文脈自由文法を語数の３乗に比例した時間で如
何に解析できるかということと、標準的なアプローチを
使用した場合に特徴構造の追加により結果としてシステ
ムがなぜ指数関数的になるのかということを理解するこ
とが必要である。

【００１２】単純にはチャートは、パーサーによりすで
に構成された要素を格納するためのデータ構造である。
チャートを有する主な利点は、パーサーが種々の方法で
文を解析しようとする時に既存の要素を再使用できるこ
とである。文法が文脈自由であれば、パーサーは要素が
どのように構成されるかを知る必要もなく、要素を構成
することができる。例えば、パーサーは５番目のワード
から１０番目のワードにいたるＮＰが存在するかどうか
を知る必要はあるが、ＮＰがその中にＰＰを有するかど
うかを知る必要はない。このため、長さｎの文に対して
は、構成され得るＯ（Ｃｎ²）個の異なる要素があるの
みである（ここで、Ｃは文法により可能となる異なるカ
テゴリーの数である）。ｎ²は、全ての可能なワードの
位置のクロスプロダクトに由来する。概念上、チャート
はまさに、左位置から始まって右位置で終わるカテゴリ
ータイプの要素があるかどうかを示す（カテゴリー、左
位置、右位置の）３次元アレイである。文の始まりで始
まり、文の終わりで終了するＳカテゴリーがある場合に
は、文はフレーズを有する。チャートを充填する１つの
方法は、全ての１つの単語の要素から始めて、２つの単
語の要素の全てを構築し、次いで３つの単語、というよ
うに前のレベルの結果の上に各レベルでの構築を行うこ
とである。これは、ＣＫＹアルゴリズムと呼ばれる。ア
ルゴリズムがＯｎ²ではなくＯｎ³である理由は、各要
素が複数の方法で構築されることができるからである。
最悪のケースでは、大きさがＯｎである要素は、Ｏｎ個
の異なる方法で構築されるおそれがある。Ｏｎ²の要素
をＯｎの方法で構築するには、Ｏｎ³の時間が必要であ
る。ＣＫＹアルゴリズムは、小さいものから大きいもの
へと特定の順序で要素が構築されることを必要とする。
チャートを構成する、よりフレキシブルな方法は、処理
された要素のアジェンダを維持することである。要素は
一度に一つずつアジェンダから得られ、以下のように処
理される。各要素は、結合できる要素に対して左と右を
見る。結合される要素を見出せば、チャートをチェック
して、得られた要素がチャート中に存在しているかどう
かを調べる。結合される要素が見出されなければ、要素
はチャートに追加され、アジェンダに置かれる。次いで
プロセスは、アジェンダが空になるまで継続する。要素
が任意の順序でアジェンダから得られることができるの
で、アジェンダにより物事がよりフレキシブルになる。
このパーサーの種類は、「アクティブチャートパーサ
ー」と呼ばれる。

【００１３】上記アルゴリズムは、文章が解析可能か否
かを決定するだけであり、妥当な解析ツリー（解析木）
が何であるかを決定することはしない。しかし、この情
報はこれらのアルゴリズムに単純に追加することにより
得られることができる。要素がサブ要素から構成される
時にはいつも、構成は、構成された要素におけるローカ
ルサブツリーとして記録される。このようなサブツリー
により注釈されるチャートは、「解析フォレスト」と呼
ばれる。パーサーが実行されると、全体の文章にスパン
するＳ要素から開始し、１つのサブツリーをランダムに
取り出すことにより特定の解析ツリーが読み出される。
次いで、各子要素に対して、１つのサブツリーがランダ
ムに取得される。このプロセスは、ツリーが完全に特定
されるまで続けられる。一般に、このように完全に特定
されるツリーは指数関数的に多く存在するおそれがある
が、それらはコンパクトな表現で格納されるので、それ
らに対する解析フォレストは語数の３乗に比例した時間
で生成されることができる。

【００１４】多くの文法の規則は、文脈自由フレーズ構
造の規則のバックボーンに特徴構造を追加する。文法に
依存して、文脈自由規則は明示的であり得る。

【００１５】文脈自由のルールが明示的であるか暗示的
であるかにかかわらず、特徴構造を解析する標準的なア
プローチは、まず文脈自由フレーズ構造チャートを構築
し、次いでチャートデータ構造において第２のパスをな
し、特徴構造のボトム−アップを構築することである。
まず、与えられた特徴に従って語彙の項から特徴構造が
例示される。次いで、子要素に属する特徴構造のクロス
プロダクトを得ることにより、親要素の特徴構造が構成
される。一貫し得ない任意の組合せを取り除くために、
クロスプロダクトが得られる。得られるのは、このポイ
ントに対して一貫した特徴構造の集合である。子要素か
ら親要素を構成する方法が１つより多く存在すれば、全
ての解析から生成された特徴構造の集合が単一化され
る。このプロセスは、全ての要素の特徴構造が構成され
るまで、ボトム−アップを継続する。

【００１６】このプロセスは、各レベルにおいてクロス
プロダクトが発生するために最悪のケースでは指数関数
的である。例えば、各語彙のアイテムが２つの曖昧な方
法である場合に、フレーズ構造の文法が曖昧でなくて
も、トップの要素に対してＯ（２ⁿ）の異なる特徴構造
が存在し得る。有限の値の特徴のみが使用される場合に
は、パーサーは、語数の３乗に比例した時間で実行する
ように作成されることができる。なぜなら、有限数の特
徴構造のみが可能であり、各レベルにおいて、得られた
方法の全てを列挙することなくどれが可能であるかを追
跡するだけでよいからである。可能な特徴構造の数の上
限まで到達すると、各レベルにおける特徴構造の数は成
長を停止する。特徴値の全てがバイナリであれば、トッ
プレベルの要素は、せいぜいＯ（２^k）個の異なる特徴
構造を有することができる（ｋは異なる特徴の数であ
る）。故に、有限特徴グラフのみを用いることにより、
文章の長さにおける指数関数を指数関数的な文法の定数
に変えることができる。不具合なことに、無限の特徴構
造を解析するのに必要な時間は、同じ方法では減少され
ることができない。

【００１７】ここで述べる方法は、コンテキストレジー
コピーリンクを導入することにより、解析及び生成中に
特徴構造を単一化するのに必要な時間を減少する。この
新たなタイプのレジーコピーリンクでは、複数の選択値
が複数のコンテキストレジーコピーリンクにより表現さ
れることができ、複数のコンテキストレジーコピーリン
クの各々は、それが妥当であるコンテキストにより注釈
されたものである。これらのコンテキストレジーコピー
リンクにより表現されるデータは、関連を持つようにな
り次第に拡張されて必要分のみの情報がコピーされるこ
とを保証されるまで、グラフデータ構造にコピーされな
い。コンテキスト単一化及び不透明なコンテキストと共
に使用されると、コンテキストレジーコピーリンクは、
特徴構造を単一化するのにかかる時間を減少する。従っ
て、語数の３乗に比例した時間で文脈自由特徴構造を単
一化する方法の一部として、図８及び図９を参照してこ
の方法を詳細に述べる。

【００１８】図２は、言語記号列を解析又は生成する間
の特徴構造のレジーコンテキスト単一化に対する命令６
０を概略的に示している。命令６０は、ソリッドステー
トメモリ５０又はフロッピーディスクドライブ４０内に
置かれるフロッピーディスク４２中で機械可読形式で格
納され得る。命令６０は、任意のコンピュータ言語で行
われ得る。

【００１９】命令６０は、サブルーチン１００、１０
２、１０４、１０６、１０８、１１０、１１２、１１４
及び１１６の階級的なセットとして組織化される。

【００２０】命令６０は、チャートデータ構造、グラフ
データ構造、節データ構造及び解データ構造の４つのク
ラスのデータ構造を使用する。チャートデータ構造は、
エッジデータ構造とサブツリーデータ構造を含む。各エ
ッジデータ構造は、エッジを表すと共に、以下の情報を
含む。

【００２１】Edge（エッジ）［ id：このエッジを独特に識別する整数 right ：エッジの最も右のワードを識別する整数 left：エッジの最も左のワードを識別する整数 category（カテゴリー）：エッジの文法上のカテゴリー
を示す；例えばＮＰ、Ｓ、ＶＰ等 subtrees（サブツリー）：このエッジを作成する種々の
方法のリスト graph （グラフ）：このエッジのグラフデータ構造に対
するポインタ］

【００２２】各サブツリーデータ構造は、チョムスキー
標準形でのサブツリーを示し、以下の情報を含む。

【００２３】Subtree （サブツリー）［ partial （部分的）：ルールの左の子をポイントし、pa
rtial は、エッジの最も左のワードで始まり中央のどこ
かで終了する complete（完全）：ルールの右の子をポイントし、comp
leteは、エッジの中央のどこかで始まりエッジの最も右
のワードで終了する constraint（制約）：サブツリーを生成するためにpart
ial とcopmplete を如何に組み合わせるべきかを定義す
る graph （グラフ）：このサブツリーのグラフデータ構造
に対するポインタ］

【００２４】なお、各サブツリーデータ構造は、概念的
に文脈自由規則がサブツリー１つ当り任意の数の子を有
することができるとしても、２つのみの子、partial 及
びcompleteを含む。標準的な変換を文法に適用すること
により、全ての規則がバイナリである新たな文法が生成
される。例えば、ルールＳ→ＮＰＶＰＡＤＶにこの
変換を適用することにより、Ｓ→Ｓ１ＡＤＶとＳ１→
ＮＰＶＰという２つの規則が生成される。

【００２５】グラフデータ構造のクラスは、Graph 、AV
Pair及びCVPairという３つのタイプを含む。各グラフデ
ータ構造は特徴構造及び関連情報を示し、以下の情報を
含む。

【００２６】Graph （グラフ）［ attrs ：このグラフデータ構造に関連するAVPairへのポ
インタのリスト context （コンテキスト）：このグラフが存在するコン
テキストを示し、同一のエッジに関連する他の妥当なサ
ブツリーとそれを見分けるためにサブツリーに割り当て
られた変数を対応させる nogood：この特徴データ構造が良くないかどうかを示す
ブール演算値 nogoods ：nogoodであり、このグラフに関連する節のリ
スト edge（エッジ）：このグラフに関連するエッジに対する
ポインタ disjunctive （論理和）：グラフがＯＲグラフ、即ち多
くの選択的なグラフを示す単一のグラフであるか否かを
示すブール演算値 clauses （節）：このグラフに割り当てられた節のリス
ト disjunctions（論理和）：局所的に例示された論理和の
リスト solutions （解）：限定セットとそれらの解に対するポ
インタのリスト］

【００２７】各AVPairデータ構造は属性コンテキスト値
のペアを示し、以下の情報を含む。

【００２８】AVPair［ attr：属性のタイプの名前 attrs ：このAVPairが示す特徴構造に含まれる属性に対
するポインタのリスト equals：この属性に対する値を格納するCVPairデータ構
造に対するポインタのリスト；例えば、attrがＮＵＭで
あれば、このフィールド内の値は値コンテキスト内のＳ
Ｇと別のコンテキスト内のＰＬにより格納され得る copies（コピー）：このAVPairにコピーされた、又はこ
のAVPairからコピーされた値に対するコピーリンクを格
納するCVPairデータ構造に対するポインタのリスト contexts（コンテキスト）：このAVPairが既に制約を有
するコンテキスト prefix（接頭辞）：このAVPairを含むAVPairに対するポ
インタである。例えば、ＬＦＧ項（↑SUBJ NUM）では、
NUM AVPairは、その接頭辞として（↑SUBJ）AVPairを有
する graph （グラフ）：このAVPairが属する特徴データ構造
へのポインタ expanded：このAVPairに関連するコンテキストレジーリ
ンクが拡張されたかどうかを示すブール演算値］

【００２９】各CVPairデータ構造はコンテキスト値ペア
を示し、以下の情報を含む。

【００３０】CVPair［ contexts（コンテキスト）：規則的なコピーリンクに対
してこの値に関連するコンテキスト又は節が真であれ
ば、任意の他の値はコンテキスト値を示す value （値）：このCVPairに対するポインタがAVPairの
等しいフィールド又はコピーに格納されているかどうか
に依存して、別のAVPairデータ構造へのポインタ又は値
を含む。 lazy（レジー）：value フィールドが配付先の正方向を
ポイントする正方向コピーリンクであるのか、又はソー
スの逆方向をポイントするレジーコピーリンクであるの
かを示すブール演算変数］

【００３１】節及び論理和の２つのタイプの節データ構
造がある。各節データ構造は節を示し、キャッシュアイ
テムのリストである、その独自の節キャッシュを有す
る。節データ構造は、以下の情報を含む。

【００３２】 Clause（節）：［ type（タイプ）：節のタイプ−AND 、OR、CHOICE、OPAQUE、nogood、TRUE body（ボデー）：以下のAND 、OR、NOT 、CHOICE、OPAQUEを合併したものである AND ｛--このタイプの節は、コンテキストの論理積である-- first ：論理積の第１節へのポインタ rest：結合された節の残りに対するポインタ｝ OR｛--このタイプの節は、コンテキストの論理和である-- first ：論理和の第１節へのポインタ rest：分解された節の残りに対するポインタ｝ NOT ｛--このタイプの節は、コンテキストの否定である-- negated ：否定された節｝ CHOICE（選択）｛--論理和の一次選択である論理和：CHOICEを含む論理和データ構造に対するポインタ｝ OPAQUE｛--コンテキストを移入する imported：包まれている移入節 graph （グラフ）：節の移入元のグラフデータ構造に対するポインタ｝ graph （グラフ）：この節が関連するグラフデータ構造に対するポインタ cache （キャッシュ）：この節に関連する節キャッシュの領域に対するポインタ。節キャッシュのこの領域は、この節を用いて以前に実行されたオペレーションの結果を格納する exported：この節が別のグラフデータ構造に移入されたかどうかを示すブール演算変数である nogood：この節がnogoodであることを決定されたかどうかを示すブール演算変数である］

【００３３】各論理和データ構造は論理和を示し、以下
の情報を含む。

【００３４】disjunction 論理和［ count ：この論理和における選言肢の数を示す整数 context （コンテキスト）：この論理和が関連するコン
テキスト arm1−第１選択コンテキスト（１つのみの場合） disj1 −第１選択論理和（１つより多い場合） arm2−第２選択コンテキスト（１つのみの場合） disj2 −第２選択論理和（１つより多い場合）］

【００３５】限定セットデータ構造、限定解データ構造
及び内部解データ構造の３つのタイプの論理和データ構
造が存在する。各グラフは、グラフの３つの解データ構
造を格納するメモリ５０内の解キャッシュを有する。

【００３６】各限定セットデータ構造は、解が探索され
る節の集合を示し、以下の情報を含む。

【００３７】Restriction Set （限定セット）［ restriction set （限定セット）：解に対するエッジの
解の獲得に与えられた節のリスト solutions （解）：限定セットに対する限定された解の
データ構造に対するポインタのリスト］

【００３８】各限定解データ構造は、限定セットに対す
る解を示し、以下の情報を含む。

【００３９】Restricted Solution （限定解）［ clauses （節）：解を構成する節のグループである。例
えば、限定セットがａ：１，ｂ：０及び（ａ：０＆ｂ：
０）である場合には、解はｂ：０及び（ａ：０＆ｂ：
０）であり得る。これは限定セットのサブセットである
べきである。このフィールドにない限定セットに節があ
る場合には、その値は擬であると仮定される。 map （マップ）：節フィールドにおいて解に対する数値
を求める内部解データ構造に対するポインタのリストで
ある。特定の限定セットに対しては、内部解の全てが正
確に１つの限定解のマップのメンバーでなければならな
い。各内部解は、各限定セット中に一度表れる。］

【００４０】各内部解データ構造は、Restricted Setに
対する内部解を示し、以下の情報を含む。

【００４１】Internal Solution （内部解）［ graph （グラフ）−この内部解が得られたグラフに対す
るポインタ choices （選択）−局所論理和の局所選択のリスト partial （部分的）−部分的なエッジ、すなわち左の子
に対する解 complete（完全）−完全なエッジに対する解］

【００４２】図３はメインの命令１００をフローチャー
ト形式で示す。

【００４３】機械可読形式の自然言語記号列を受け取る
と、プロセッサ４８はステップ１２０で命令１００を実
行する。プロセッサ４８は、自然言語記号列に対して文
脈自由解析フォレスト、チャートを構築する。当業者に
知られている標準的な技術を用いて、チャートが構築さ
れる。チャートが構築されると、プロセッサ４８はステ
ップ１２０を出る。

【００４４】プロセッサ４８はステップ１２２におい
て、全体の自然言語記号列をスパンする記号列Ｓをチャ
ートが規定するかどうかを決定する。チャートが規定し
なければ、チャートは解を有さず、プロセッサ４８はス
テップ１２４に分岐する。一方、全体の自然言語記号列
をスパンするＳをチャートが規定すれば、チャートは解
を有し得る。それに応じてプロセッサ４８はステップ１
２６に進む。プロセッサ４８は、使用されている文法に
関連する語彙及び文法上の制約をチャートに追加する。
チャートを装飾する標準的な方法が使用される。その
後、プロセッサ４８はステップ１２８に進む。

【００４５】プロセッサ４８は、回帰的にエッジ制約の
処理１０２により、及びチャートに対するグラフデータ
構造を構築することにより、チャートのルートスパンエ
ッジに対する解を見出す。これらの回帰的な呼出しによ
り、プロセッサ４８は、リーフに到達するまでチャート
を下り、そのポイントでプロセッサ４８はグラフデータ
構造を構築し、チャートを逆進し始める。チャートに対
するグラフデータ構造が生成されると、プロセッサ４８
はステップ１３０に進み、チャートに対する解を見出す
プロセスを開始する。プロセッサ４８はエッジの解の獲
得１０４によりそれを実行する。プロセッサ４８はチャ
ートを下り、対象とする不透明な（曖昧な）コンテキス
ト（opaque context）を通過することにより、葉に到達
するまでルートスパンエッジに対する解を見出す。その
ポイントで、プロセッサ４８は、移入された不透明なコ
ンテキストに対する局所的な解を決定し、それらの解を
もってチャートを逆進し始める。これは、チャートのル
ートスパンエッジに対する解が見出されるまで継続す
る。

【００４６】命令１０４によるエッジ解の処理は、文法
の文脈自由部分に対して語数の３乗に比例した時間で発
生する。文脈自由により、局所的なnogoods がよく因子
分解される。故に、解計算時間が不透明な変数の数Ｋに
おいて指数関数的であっても、経験により、実際に生成
される解の数は小さい傾向があることが示された。命令
１０４を実行した後、プロセッサ４８はステップ１２４
に進み、自然言語記号列の完全な処理を行う。

【００４７】図４、図５及び図６（これらの３つの図で
本実施形態のエッジ制約処理の全容を示す）で示される
ように、エッジ制約処理１０２は、プロセッサ４８が、
関連のあるエッジに対するポインタを与えられたエッジ
のグラフデータ構造を生成することを可能にする。

【００４８】図４を参照すると、選択されたエッジに対
するポインタの受領に応答して、プロセッサ４８はステ
ップ１４０で命令１０２を実行し始める。プロセッサ４
８は、今受け取ったポインタを調査することによりグラ
フデータ構造を構成する必要があるかどうかを決定す
る。ヌルポインタは、選択されたエッジが存在しないこ
とを示すが、それはおそらく、ヌルポインタが部分的な
エッジを有さないサブツリーに由来するからである。ヌ
ルエッジポインタに応答して、プロセッサ４８はステッ
プ１４２に分岐する。プロセッサ４８は、選択されたエ
ッジが真（TRUE）であることを示す；即ち、選択された
エッジデータ構造のグラフフィールド中に格納されたポ
インタをヌルの値にセットすることにより、任意の他の
エッジと結合されることができる。その後、プロセッサ
４８は呼出しルーチンに戻る。

【００４９】エッジポインタがヌルでなければ、プロセ
ッサ４８はステップ１５０に進む。プロセッサ４８は、
選択されたエッジのグラフデータ構造を構築することに
注目する。そうするために、プロセッサ４８はまず、選
択されたエッジに関連する各サブツリーのグラフデータ
構造を生成する。故に、プロセッサ４８はグラフデータ
構造が生成されるべきサブツリーがあるかどうかを決定
する。かかるサブツリーが存在すれば、プロセッサ４８
はステップ１５２に進む。

【００５０】プロセッサ４８は、ステップ１５２におい
て選択されるサブツリーとして、残りのサブツリーの１
つを選択し、ステップ１５４に進む。プロセッサ４８
は、まず左の子と右の子の両方に対するグラフデータ構
造を作成することにより、選択されたサブツリーに対す
るグラフデータ構造を生成する。故にプロセッサ４８
は、エッジ制約処理１０２に対する回帰的な呼出しと、
選択されたエッジとして左の子を示すことにより、選択
されたサブツリーの左の子に対するグラフデータ構造を
作成する。選択されたサブツリーの左の子に対するグラ
フデータ構造が生成されると、プロセッサ４８はステッ
プ１５６に進む。

【００５１】プロセッサ４８は、左の子に対するグラフ
データ構造のnogoodフィールドを調査することにより、
又はグラフに対するポインタがNOGOOD値１であるかどう
かを調査することにより、左の子に対するグラフがnogo
odであるかどうかを決定する。グラフがnogoodである場
合には、選択されたサブツリーのグラフはnogoodであ
る。この場合には、プロセッサ４８はステップ１６０に
進み、選択されたサブツリーに対するnogoodグラフデー
タ構造を生成する。それを実行すると、プロセッサ４８
はステップ１５０に戻る。一方、左の子に対するグラフ
がnogoodでなければ、プロセッサ４８は図５のステップ
１６２に進む。

【００５２】図５を参照すると、プロセッサ４８は、ス
テップ１６２において、選択されたサブツリーの右の子
に対するグラフデータ構造を生成することに注目する。
プロセッサ４８はエッジ制約処理１０２を呼び出し、左
の子が選択されたエッジであることを示すことにより、
この作業を実行する。その後プロセッサ４８は、ステッ
プ１６４においてグラフデータ構造がnogoodであるか否
かを決定する。nogoodであれば、プロセッサ４８は図４
のステップ１６０に戻る。そうでなれば、プロセッサ４
８はステップ１６６に進行する。

【００５３】選択されたサブツリーの左の子と右の子の
両方に対してグラフデータ構造が生成されると、プロセ
ッサ４８は、ステップ１６６において選択されたサブツ
リーに対するグラフデータ構造を構成するプロセスを開
始する。この試みでは、第１の作業は、選択されたサブ
ツリーに関連する文法法上の制約をグラフデータ構造に
変換することである。次にステップ１６８において、プ
ロセッサ４８は、選択されたサブツリーのサブツリーデ
ータ構造のグラフフィールドに、今生成されたグラフデ
ータ構造に対するポインタを格納する。プロセッサ４８
はステップ１８０に進行する。

【００５４】プロセッサ４８は、その左の子により移入
される制約を、選択されたサブツリーに導入し始める。
プロセッサ４８は、一度に１つのAVPairをコピーする
（後ほど詳細に説明する）AVPairコピー１０６を呼び出
すことによりそれを実行する。その後ステップ１８２に
おいて、プロセッサ４８は、選択されたサブツリーのグ
ラフデータ構造がこれによりnogoodとなるかどうかを決
定する。nogoodであれば、プロセッサ４８は図４のステ
ップ１６０に戻る。そうでない場合には、プロセッサ４
８はステップ１８４に進行する。

【００５５】プロセッサ４８は、右の子により移入され
た制約を、選択されたサブツリーに導入する。プロセッ
サ４８は、AVPairコピー１０６を再び呼び出すことによ
りそれを実行する。次いでプロセッサ４８はステップ１
８６において、これらの制約により、選択されたサブツ
リーのグラフがnogoodとなるかどうかを決定する。nogo
odである場合には、プロセッサ４８は図４のステップ１
６０に戻る。グラフがnogoodでない場合には、プロセッ
サ４８はステップ１８６から図４のステップ１５０に戻
る。

【００５６】プロセッサ４８は、選択されたエッジに関
連するサブツリーに対して生成されたグラフデータ構造
が存在する限りは、ステップ１５０〜１８６をループす
る。すべてのサブツリーグラフデータ構造が生成される
と、プロセッサ４８は図４のステップ１５０を出て図６
のステップ１８８に渡り、そのnogoodでないサブツリー
の各々を示す選択されたエッジに対する単一のグラフデ
ータ構造を作成するプロセスを開始する。プロセッサ４
８はまず、ステップ１８８においてnogoodでないグラフ
を有する選択エッジに関連するサブツリーの数をカウン
トする。次いで、ステップ１９０において、プロセッサ
４８は、nogoodでないグラフを有するサブツリーの数が
２つ以上であるかどうかを決定する。その数が２つ未満
であれば、プロセッサ４８は、ステップ１９２において
nogoodでないグラフを有する少なくとも１つのサブツリ
ーが存在するかどうかを決定する。nogoodグラフを有す
るサブツリーが１つ存在する場合には、プロセッサ４８
はステップ１９３に進み、選択されたエッジのエッジデ
ータ構造のグラフフィールド中に、良好な（nogoodでな
い）サブツリーに対するグラフデータ構造に対するポイ
ンタを格納する。一方、良好なグラフを有するサブツリ
ーが一つも存在しなければ、プロセッサ４８はステップ
１９２を出てステップ１９４に進む。プロセッサ４８は
選択されたエッジデータ構造のグラフフィールドを使用
して、ポインタ値１を格納することによりエッジがnogo
odであることを示す。ステップ１９４又は１９３におい
て選択されたエッジのグラフデータ構造の制約が完了す
ると、プロセッサ４８はステップ１４４に進行する。

【００５７】プロセッサ４８は、nogoodでないグラフを
有するサブツリーの数が２つ以上であれば、ステップ１
９６に進行する。この場合には、選択されたエッジのグ
ラフデータ構造は、複数の選択的なサブツリーを表すの
で、ＯＲタイプである。故に、ステップ１９６において
プロセッサ４８は、選択されたエッジデータ構造の論理
和フィールドを適切にセットすることにより、グラフを
ＯＲタイプとしてマークする。これを実行すると、プロ
セッサ４８はステップ１９６を出てステップ１９８に進
行する。

【００５８】ステップ１９８において、プロセッサ４８
はステップ１９６で生成されたＯＲ節に対する論理和デ
ータ構造を構築する。プロセッサ４８は論理和データ構
造のカウントフィールドを、ステップ１８８においてカ
ウントされた良好なグラフの数にセットする。プロセッ
サ４８が論理和データ構造の構成を完了すると、選択さ
れたエッジに関連する良好なサブツリーの各々を表すコ
ンテキスト変数が生成される。その後、プロセッサ４８
はステップ２００に進行する。

【００５９】プロセッサ４８は、サブツリーからの情報
を選択されたエッジのグラフデータ構造に導入し始め
る。プロセッサ４８は、全ての良好なサブツリーからの
情報が選択エッジデータ構造に導入されるまで、ステッ
プ２００、２１０及び２１２をループする。ステップ２
１２では、プロセッサ４８は、nogoodでないグラフを有
するサブツリーのうちの１つを選択し、論理和データ構
造によりサブツリーと関連するコンテキストを見出す。
プロセッサ４８は、AVPairコピー１０６を呼び出し、選
択された節を示すことにより、選択されたサブツリーか
らのデータ構造情報を選択エッジにコピーする。その
後、プロセッサ４８はステップ２００に戻る。選択され
たエッジに対するグラフデータ構造に良好なグラフを有
するサブツリーの全てからの情報がコピーされた後、プ
ロセッサ４８はステップ１４４に戻る。

【００６０】図７で示されるAVPairコピー１０６によ
り、プロセッサ４８はソースAVPiarデータ構造からの情
報を配付先AVPairデータ構造にコピーすることができ
る。命令１０６を使用して、子からの情報が親にコピー
されるばかりでなく、サブツリーからの情報が関連のあ
るエッジにコピーされる。

【００６１】プロセッサ４８は、配付先AVPair、ソース
AVPairに対するポインタ、及び選択された節に応答して
命令１０６を実行し始める。ステップ２３０において、
プロセッサ４８は、選択された節に対する２つのAVPair
の間にコンテキストコピーリンクがすでに存在している
かどうかを決定する。プロセッサ４８は、ソースAVPair
及び配付先AVPairの両方のコピーフィールドを調査する
ことにより、この決定を行う。選択された節を有するコ
ピーリンクがソースか配付先かのいずれかに見出されれ
ば、さらなる実行の必要もなく、プロセッサ４８はステ
ップ２４４に分岐することにより応答する。他方、選択
された節を有するコンテキストコピーリンクがソースAV
Pairと配付先AVPairの間に存在しない場合には、プロセ
ッサ４８はステップ２３２に分岐する。

【００６２】ステップ２３２においてプロセッサ４８
は、コンテキストレジーコピーリンクを介して配付先AV
PairにおいてソースAVPairを表すことができるかどうか
を決定する努力を始める。これは部分的に、配付先の他
のレジーコピーリンクがすでに拡張されたかに依存す
る。プロセッサ４８は、配付先AVPairの拡張されたビッ
トを調査することにより、そうであるかどうか決定す
る。そのレジーコピーリンクが拡張されなかったことを
ビットが示す場合には、プロセッサ４８は、オーバーラ
ップしたコンテキストにおいてそのリンクが配付先AVPa
irだけのレジーコピーリンクであれば、コンテキストレ
ジーコピーリンクを用いてソースAVPairを表現すること
ができる。プロセッサ４８はステップ２３４において、
AVPairコピーフィールド中に存在するレジーコピーリン
クを列挙して、各レジーコピーリンクに対して、そのコ
ンテキストを選択されたコンテキストと結合することに
より、AVPairコピーに対する引数として与えられたコン
テキスト内の他のコンテキストレジーコピーリンクを配
付先のAVPairがすでに含んでいるかどうかを決定する。
論理積の全てがnogoodである場合には、プロセッサ４８
はステップ２３６に進行する。他方、結合されたコンテ
キストのいずれかがnogoodでない場合には、プロセッサ
４８は、ステップ２３８に進行する。

【００６３】プロセッサ４８は、配付先のAVPairに関連
する全てのレジーコピーリンクが拡張される必要がある
場合には、ステップ２３４からステップ２３８に進む。
プロセッサ４８は、レジーリンクの拡張１０８を呼び出
すことにより、ステップ２３８において、それらレジー
コピーリンクを拡張する。その後、プロセッサ４８はス
テップ２４０に進行する。

【００６４】プロセッサ４８は、ソースAVPairがレジー
コピーリンクにより配付先のAVPairで表されることがで
きない場合に、ステップ２４０に進む。配付先にコピー
されたことをソースAVPairにおいて示すために、プロセ
ッサ４８は配付先をポイントする正方向コピーリンクを
ソースAVpairのコピーフィールドに追加する。次いでプ
ロセッサ４８は、ファクトコピー１１０を呼び出すこと
により、配付先のAVpairにソースAVpairの制約をコピー
する。それを実行すると、プロセッサ４８はステップ２
４４に進行する。

【００６５】図８で示されるレジーリンクの拡張１０８
により、プロセッサ４８はコンテキストレジーコピーリ
ンクを、より詳細な１つのレベルと、そして必要であれ
ば、他のコンテキストレジーコピーリンクと取り替える
ことができる。ソース中の正方向コピーリンクを追加し
てレジーコピーリンクの拡張を記録した後、プロセッサ
４８はファクトコピー１１０を呼び出すことにより関連
情報をコピーする。

【００６６】プロセッサ４８は、拡張されるべきレジー
コピーリンクを有する、選択されたAVPairへのポインタ
の受領に応答して、ステップ２６０で命令１０８を実行
し始める。ステップ２６０において、プロセッサ４８
は、拡張ビットを調査することにより、選択されたAVPa
irのコンテキストレジーコピーリンクがすでに拡張され
たかどうかを決定する。選択されたAVPairに関連するコ
ンテキストレジーコピーリンクがすでに拡張されたこと
をそのビットが示せば、プロセッサ４８はステップ２７
６に進む。他方、コンテキストレジーコピーリンクが拡
張されていない場合には、プロセッサ４８はステップ２
６２に分岐する。

【００６７】プロセッサ４８は、拡張されたフィールド
の値の拡張を示すようにセットすることにより、選択さ
れたAVPairのコンテキストレジーコピーリンクを拡張し
始める。その後、プロセッサ４８はステップ２６４に進
行して、一度に一つずつコンテキストレジーコピーリン
クを拡張し始める。拡張されるべきコンテキストレジー
コピーリンクが残っている限りは、プロセッサ４８はス
テップ２６６に進行する。プロセッサは、コピーフィー
ルド内の残りのコンテキストレジーコピーリンクを拡張
するものとして選択する。次にプロセッサ４８はステッ
プ２７０に進行する。

【００６８】しばしば、選択されたコンテキストレジー
コピーリンクによりポイントされるターゲットAVPair
も、拡張される必要があるとしてレジーコピーリンクに
より表される。かかる状況を見越して、ステップ２７０
においてプロセッサ４８はレジーリンク拡張１０８を呼
び出して、選択されたコンテキストレジーコピーリンク
によりポイントされるレジーコピーリンクを拡張する。
ステップ２７２では、プロセッサ４８は、選択されたAV
PairをポイントするターゲットAVPairからの正方向コピ
ーリンクを追加する。次にプロセッサ４８はステップ２
７４に進行する。

【００６９】ターゲットAVpairが拡張されると、プロセ
ッサ４８はターゲットAVPairからの情報の１つのレベル
を選択されたAVPairにコピーすることにより、選択され
たレジーコピーリンクを拡張することができる。プロセ
ッサ４８は、ファクトコピー１１０を呼び出すことによ
り、これを実行する。それを実行すると、プロセッサ４
８はステップ２６４に戻り、選択されたAVPairに関連す
る全てのコンテキストレジーコピーリンクが拡張される
まで、ステップ２６６、２７０、２７２、２７４及び２
６４をループする。

【００７０】図９は、ファクトコピー１１０の命令をフ
ローチャートで示す。

【００７１】プロセッサ４８は、ソースAVPairと配付先
AVPairに対するポインタと、配付先に関連する選択され
た節の受領に応答して、ステップ２９０において命令１
１０を実行し始める。プロセッサ４８は、任意のファク
トがコピーされる必要があるかどうかを決定することに
より、ステップ２９０で開始する。nogoodである節に関
連すれば、ファクトはコピーされる必要がない。プロセ
ッサ４８は、節のnogoodフィールドを調査し、選択され
た節がnogoodである場合にはステップ２９２に進行す
る。

【００７２】プロセッサ４８は、ソースAVPairに関連す
る属性を配付先AVPairにコピーする努力を始める。ステ
ップ２９２においてコピーされるべき属性が残っていれ
ば、プロセッサ４８はステップ２９４で残りの属性の中
の１つを選択する。次に、プロセッサ４８はステップ２
９６で、選択された節を、選択された属性に関連する節
と結合する。プロセッサ４８は、節の結合１１２を呼び
出すことにより結合を実行し、得られた節を戻す。得ら
れた節がnogoodでなければ、プロセッサ４８はステップ
３００に分岐する。

【００７３】ステップ３００において、配付先のAVPair
データ構造がもう存在しなければ、プロセッサ４８は配
付先のAVPairへと逆にポイントするものを作成し、配付
先のAVPairのAttrs フィールドに、この新たなAVPairに
対するポインタを追加する。情報がコピーされることの
できるデータ構造が作成されると、プロセッサ４８はス
テップ３０２に進行してAVPairコピーを呼び出す。AVPa
irコピーは、コンテキストレジーコピーリンク同士の間
に相互作用があるかどうかに依存して、ソースAVPairか
らの情報をコピーしたりしなかったりする。その後、プ
ロセッサ４８はステップ２９２に戻る。

【００７４】プロセッサ４８は、AVPairコピーがソース
AVPairの関連のある属性全てに対して呼び出されるま
で、ステップ２９２〜３０２をループする。全てに対し
て呼び出されると、プロセッサ４８はステップ３０４に
進行して、属性のコピーと略同じ形態でソースAVPairの
値を配付先のAVPairにコピーし始める。ソースAVPairに
関連する全てのコンテキスト値をコピーした後、プロセ
ッサ４８はステップ３２０に進む。プロセッサ４８は、
配付先のAVPairに課された新たな制約を調査し、可能で
あれば、新たなローカルnogoods を推論する。これを実
行すると、プロセッサ４８はステップ３２２にリターン
する。

【００７５】命令６０は２つの節を結合して新たな節を
生成し、メモリ５０の節キャッシュに格納する。

【００７６】命令６０が節を結合する方法と標準的なア
プローチとの間には２つの違いがある。まず、２つの節
を結合し始める前に、プロセッサ４８は同じ２つの節を
含むエントリに対する節キャッシュを探索する。プロセ
ッサ４８は、より高いｉｄを有する節データ構造のキャ
ッシュフィールドを調査することにより、このような探
索を開始して、所望のオペレーション及びオペランドを
探索する。かかるエントリが見出されると、結合を行う
ことなく、以前に格納された結果を使用することがで
き、処理時間が削減される。

【００７７】節を結合することに対する標準的なアプロ
ーチとの第２の違いは、不透明な（曖昧な）節（opaque
clause ）の使用である。図１０のフローチャートは、
不透明な節を処理して単一化処理時間を減少する節の結
合１１２の部分を示している。２つの不透明な節が同一
グラフから移入されると、２つの不透明な節は解かれ
て、新たな節を生成するように結合され、この新たな節
が包まれて、新たな不透明節が生成され、そしてこれが
移入される。

【００７８】プロセッサ４８はステップ３６０で命令１
１２を実行し始める。プロセッサ４８は、２つの不透明
な節が同一のグラフデータ構造に関連する場合にグラフ
同士の間に移入される命題変数の数を減少することがで
きる。プロセッサ４８は、結合されるべき２つの節デー
タ構造である節１及び節２のグラフフィールドを調査す
ることにより、ステップ３６０においてこの可能性をチ
ェックする。両方の節が同一のグラフに関連する場合に
は、プロセッサ４８はステップ３６０を出て、ステップ
３６２に分岐する。

【００７９】２つの不透明な節の結合によって、真（TR
UE）又はnogoodのようなより単純な節を生じ得ることが
できるので、プロセッサ４８はステップ３６２において
節１及び節２の両方を「解く」。プロセッサ４８は、各
不透明な節の移入フィールドを検索することにより、不
透明な節を解く。その後、プロセッサ４８はステップ３
６４において、節の結合１１２を呼び出すことにより、
２つの解かれた節を結合する。プロセッサ４８は、ステ
ップ３６６において得られた節を調査して、それがnogo
odであるかどうかを決定する。nogoodである場合には、
プロセッサ４８はステップ３６８に進行して、得られた
節がnogoodであることを示すポインタを戻す。一方、得
られた節がnogoodでない場合には、プロセッサ４８はス
テップ３７０に分岐する。

【００８０】プロセッサ４８は得られた節を「包み」、
ステップ３７０において節の移入１１６を呼び出すこと
により新たな不透明な節を移入する。次いでプロセッサ
４８はステップ３７２に進む。

【００８１】節１及び節２を再び結合するさらなる処理
時間を使用しないようにするために、ステップ３７２に
おいて、プロセッサ４８は節１及び節２を結合したもの
をメモリ５０の節キャッシュに格納する。好ましくは、
節キャッシュ内の節は、ｉｄの高さに従ってインデック
スされ、格納される情報は、オペレータ、オペランド及
び得られた節のトリプルである。このケースでは、トリ
プルは、結合、節２、得られた節である。その後プロセ
ッサ４８は、より高いｉｄを有する節に対して、節デー
タ構造のキャッシュフィールドにおける節キャッシュ
に、このエントリに対するポインタを格納する。プロセ
ッサ４８は、２つの節が結合されたり分離されたりする
場合にはいつも、それらが不透明であるか否かにはかか
わらず、ステップ３７２を実行する。節に関する全ての
オペレーションの結果を格納することにより、グラフデ
ータ構造を単一化する処理時間が減少される。

【００８２】図１１は、節をグラフに移入する命令１１
６をフローチャートで示す。これを実行する際に、プロ
セッサ４８は新たな不透明節データ構造を作成して、移
入された節を「包む」。これにより、ルートスパンエッ
ジに対して生成されたグラフが、文脈自由に等しくなる
ことが保証され、これは複数の命題変数を単一の命題変
数と取り替えることにより可能となる。

【００８３】プロセッサ４８は、選択された節、即ち移
入される節が選択されたグラフに既に移入されたかどう
かをステップ４００で決定することにより、命令１１６
を実行し始める。プロセッサ４８は、得られた節が選択
された節に等しいエントリに対して節キャッシュを探索
することにより、それを実行する。プロセッサ４８がか
かるエントリを見出せば、選択された節は選択されたグ
ラフにすでに移出されており、これを実行する必要がな
くなる。これに応答して、プロセッサ４８はステップ４
０２に分岐して、移入節をリターンする。一方、選択さ
れた節が移出されたことを節キャッシュが示さない場合
には、プロセッサ４８はステップ４０４に分岐する。

【００８４】ステップ４０４において、プロセッサ４８
は新たな不透明節データ構造を作成して、移入フィール
ドに選択された節を格納する。その後ステップ４０６に
おいて、プロセッサ４８は不透明変数が移入フィールド
に移出されたことを記録し、グラフフィールドにおいて
選択グラフに対するポインタを格納することにより、ど
のグラフに移出されたのかを示す。最後に、ステップ４
０８においてプロセッサ４８は、選択された節、不透明
節、新たな不透明節のトリプルを格納することにより、
メモリ５０の節キャッシュにこのオペレーションの結果
を格納する。新たな不透明節が移入されると、プロセッ
サ１１はステップ４０２に戻る。

【００８５】図１２、図１３及び図１４（これら３つの
図で本実施形態の解の獲得命令の全容を示す）は、選択
されたエッジに関連する全ての節に対して解が探索され
ていない可能性があるために、限定セットと呼ばれる解
が探索される節を与えられた選択エッジに対する解の獲
得命令１０４をフローチャートで示している。限定セッ
トが関連する選択エッジに対するポインタも、命令１０
４に渡される。

【００８６】命令１０４の実行はステップ４５０で始ま
る。ステップ４５０においてプロセッサ４８は、選択エ
ッジに対する明白な解を探索し始める。３つのプロセス
がある。まず、プロセッサ４８は選択エッジに対するポ
インタを調査する。ポインタがヌルであれば、選択エッ
ジが他の任意のエッジとうまく結合されることができる
ことを意味する。このような発見に応答して、プロセッ
サ４８はステップ４５２に進み、選択されたエッジに対
する解が真（TRUE）であることを示す。プロセッサ４８
はステップ４５４に戻る。一方、選択されたエッジに対
するポインタがヌルでなければ、プロセッサ４８はステ
ップ４６０に分岐して、選択されたエッジに対する別の
明白な解を調査する。ステップ４６０において、プロセ
ッサ４８は選択されたエッジデータ構造のグラフのnogo
odフィールドを調査して、選択されたエッジがnogoodで
あるかどうかを決定する。そうであれば、ステップ４６
２においてプロセッサ４８は選択されたエッジに対する
解をヌルにセットし、ステップ４５４に戻る。選択され
たエッジがnogoodのカテゴリーに分類されなければ、プ
ロセッサ４８はステップ４６０を出て、最後の明白な解
を検索する。ステップ４６４において、プロセッサ４８
は、この限定セットがすでに解決されたかどうかを調べ
るために、グラフの解キャッシュを探索する。解決の場
合には、プロセッサ４８はステップ４６６において、も
しあれば解に対するポインタをリターンする。

【００８７】明白で簡単な解を見出す試みが失敗すれ
ば、プロセッサ４８はステップ４６８に進む。プロセッ
サ４８は、解キャッシュにおける選択された節に対する
限定解データ構造を作成して、全てのフィールドをヌル
にセットする。これを実行すると、プロセッサ４８はス
テップ４７０に進み、選択された限定セットに対する解
を求めて一度に１つのサブツリーずつ探索し始める。ス
テップ４７２において、プロセッサ４８は、解を必要と
するサブツリーの１つを選択する。次にプロセッサ４８
は、選択されたサブツリーのグラフデータ構造のnogood
フィールドを調査することにより、選択されたサブツリ
ーがnogoodであるかどうかを決定する。選択されたサブ
ツリーがnogoodである場合には、プロセッサ４８はステ
ップ４７０に戻ることにより、他のサブツリーに注意を
向ける。一方、選択されたサブツリーのグラフがnogood
でなければ、プロセッサ４８はステップ４７６に進行す
る。

【００８８】選択されたサブツリーの解を見出すことに
は、選択されたサブツリーの左と右の子に対する解をま
ず見出すことが必要である。これは図１２のステップ４
７６から図１３のステップ４８６において発生する。ま
ずプロセッサ４８は、選択されたサブツリーの左の子か
らどのサブツリーグラフの節が移入されるかを決定し、
新たな限定セットを定義する。プロセッサ４８はステッ
プ４７８でこの情報を用いて、エッジの解の獲得１０４
を呼び出すことにより、左の子に対する解を見出す。左
の子に対する解がない場合には、選択されたサブツリー
に対する解は存在できない。プロセッサ４８は、ステッ
プ４７０に分岐することによりこの状況に対応し、別の
サブツリーに注目する。他方、左の子が解を有する場合
には、選択されたサブツリーは解を有し得る。それに応
答して、プロセッサ４８はステップ４８２に分岐して、
選択されたサブツリーの右の子に対する解を識別する。
プロセッサ４８は、サブツリーグラフのどの節が右の子
から移入されたかを識別することにより、開始する。こ
れにより新たな限定セットが定義され、プロセッサ４８
は、ステップ４８４においてエッジ解の獲得１０４を呼
び出す時にこの限定セットを用いる。プロセッサ４８
は、ステップ４７０に戻ることにより右の子が解を有さ
ないという見解に応答する。一方、右の子が解を有する
と、プロセッサ４８はステップ４９０に分岐する。

【００８９】選択されたエッジの左及び右の子に対する
解が得られると、ステップ４９０でプロセッサ４８は選
択されたエッジに対する解を識別しようとし始める。こ
れらの解は、限定解データ構造により表される。ステッ
プ４９０において、プロセッサ４８は、局所的な制約が
例示された時に導入された論理和に基づいて、局所的な
解を作成する。プロセッサ４８は、局所的な解と左及び
右の子に対する解のクロスプロダクトをとって、選択さ
れたエッジに対する幾らかの候補内部解を生成する。プ
ロセッサ４８は、その後のステップにおいて一度に一つ
ずつこれら候補内部解を調査する。

【００９０】図１４を参照すると、プロセッサ４８は、
ステップ５０２において評価のために候補の内部解の１
つを選択し、ステップ５０４において局所的なnogood節
を用いてそれを評価し、選択された候補内部解節の妥当
性を決定する。プロセッサ４８がステップ５０６におい
て選択された候補の内部解が妥当でないと決定すれば、
プロセッサ４８は図１３のステップ５００に戻って、別
の候補の内部解を評価し始める。一方、選択された候補
の解が妥当であれば、プロセッサ４８はステップ５０８
に進む。このステップにおいて、選択された候補の内部
解における節の各々は真であると仮定され、選択された
限定セットの節が調査されて、それらのどれが真である
かを決定される。プロセッサ４８は、ステップ５１０に
おいて真であると評価された限定セットの節に注目し、
選択された限定セットに関連する限定された論理和デー
タ構造の節フィールド中にリストされるものとそれらを
比較する。限定セットに対する解に含まれていない場合
には、ステップ５１４においてプロセッサ４８は注目し
た節を用いて新たな限定解を作成し、限定セットに対す
る解にそれを追加する。最後にステップ５１６におい
て、プロセッサ４８は選択された候補の内部解に対する
データ構造に対するポインタを、限定解データ構造のマ
ップフィールドに追加する。

【００９１】１つの候補の解の評価が完了すると、プロ
セッサ４８は図１３のステップ５００に戻って、ステッ
プ５０２〜５１６を参照して説明されたように候補の内
部解の調査を継続して行う。選択されたサブツリーに対
する候補の内部解を調査した後、プロセッサ４８はステ
ップ５００から図１２のステップ４７０に分岐する。選
択されたエッジに関連するサブツリーの全てを処理した
後、プロセッサ４８はステップ４５４に戻り、任意の解
を限定セットに戻す。

【図面の簡単な説明】

【図１】本発明の方法を用いるコンピュータシステムを
示す。

【図２】本発明の方法を実行するソフトウェアルーチン
の図である。

【図３】メインルーチンのフローチャートである。

【図４】エッジ制約処理ルーチンの一部を示すフローチ
ャートである。

【図５】エッジ制約処理ルーチンの一部を示すフローチ
ャートである。

【図６】エッジ制約処理ルーチンの一部を示すフローチ
ャートである。

【図７】AVPairコピールーチンのフローチャートであ
る。

【図８】レジーリンクの拡張ルーチンのフローチャート
である。

【図９】ファクトのコピールーチンのフローチャートで
ある。

【図１０】節の結合ルーチンのフローチャートである。

【図１１】節の移入ルーチンのフローチャートである。

【図１２】エッジの解の獲得ルーチンの一部を示すフロ
ーチャートである。

【図１３】エッジの解の獲得ルーチンの一部を示すフロ
ーチャートである。

【図１４】エッジの解の獲得ルーチンの一部を示すフロ
ーチャートである。

【符号の説明】３０コンピュータシステム４４光学文字認識ユニット４８プロセッサ

───────────────────────────────────────────────────── フロントページの続き (72)発明者ロナルドエム．カプランアメリカ合衆国 94306 カリフォルニア州パロアルトオームストリート 4015

Claims

【特許請求の範囲】

【請求項１】プロセッサを用いてエッジデータ構造を
統一する方法であって、該プロセッサがメモリ中に格納
された命令を実行することによりこの方法を実行し、前
記エッジデータ構造を統一する方法が、ａ）第１エッジデータ構造を作成するステップを含み、
第１エッジデータ構造が複数の関連するサブツリーを有
し、第１エッジデータ構造が第１グラフデータ構造を含
み、第１グラフデータ構造が空であると共に複数のコン
テキストレジーコピーリンクを有し、各コンテキストレ
ジーコピーリンクがサブツリーグラフデータ構造を指
し、各サブツリーグラフデータ構造が複数の関連するサ
ブツリーのうちの１つと関連し、ｂ）第１エッジデータ構造を第２エッジデータ構造と統
一するステップを含み、ｃ）第１エッジデータ構造と第２エッジデータ構造との
統一中に第１グラフデータ構造と関連するコンテキスト
レジーコピーリンクのうちの１つが作動されると、第２
特徴構造に関連するコンテキストレジーコピーリンクを
拡大することにより、第１グラフデータ構造を拡大する
ステップを含み、この第１グラフデータ構造を拡大する
ステップが、１）第１グラフデータ構造に関連するコンテキストレジ
ーコピーリンクの中から選択コンテキストレジーコピー
リンクを選択するステップを含み、２）選択コンテキストレジーコピーリンクにより指し示
されるサブツリー特徴構造から選択属性を選択するステ
ップを含み、選択された属性が選択属性値を有し、３）選択属性のコピーを作成し、第１グラフデータ構造
において選択属性のコピーを第１属性として格納するス
テップを含み、４）第１属性からのコンテキストレジーコピーリンクを
選択属性値に追加するステップを含む、ことを特徴とす
るエッジデータ構造を統一する方法。