JP2001523019A

JP2001523019A - テキストの本文の談話構造の自動認識

Info

Publication number: JP2001523019A
Application number: JP2000517355A
Authority: JP
Inventors: コーストン，サイモン; デ・カンポス，ミゲル・カルドソ
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 1997-10-20
Filing date: 1998-10-15
Publication date: 2001-11-20
Anticipated expiration: 2018-10-15
Also published as: JP4625178B2; EP1023676A1; WO1999021105A1; CN1281564A; CA2305875A1; WO1999021105A9; US6112168A; CN1127030C

Abstract

(57)【要約】本発明は、テキストの本文の談話構造を認識することに関する。好ましい実施形態において、談話構造認識機能は、テキストの本文と関連づけられた統語的情報を利用して、テキストの本文の談話構造を特徴づける談話構造ツリーを生成する。該機能は、まず、テキストの本文における多数の節を識別する。該機能は、次に、節の異なるペアごとに、節のペアに対するテキストの本文の統語的構造および意味に基づいて、可能な多数の談話関係のうちいずれが節のペア同士で仮説化されるべきであるかを決定する。次に該機能は、仮説化された関係を節に適用して、テキストの本文の談話構造を特徴づける談話構造ツリーを作成する。所定の実施形態において、さらに該機能は、作成された談話構造ツリーから、その著者が目指す主要な目的を反映したテキストの本文のシノプシスを生成する。

Description

【発明の詳細な説明】

【０００１】（技術分野）本発明は、数理言語学の分野一般に関し、より詳細には、談話処理の分野に関
する。

【０００２】（発明の背景）談話理論は、自然言語文書の文脈および意義ならびに自然言語の他の単位を理
解するアプローチである。談話理論によれば、各自然言語文書には、文書を著す
際の文書の著者の意図を反映する「談話構造」がある。自然言語文書の談話構造
を見極めることは、一般に文書を理解する重要な成分とみなされる。

【０００３】文書の談話構造は、MannとThompsonの「談話における関係命題(Relational Pr
opositions in Discourse), Discourse Processes 9:57-90 (1986)により提案さ
れた「修辞的構造理論ツリー(rhetorical structure theory trees)」（「ＲＳＴツリー」）等の階層的な「談話構造ツリー」、あるいは単に「ツリー」を使用
することでモデル化されることが多い。かかる談話構造ツリーは、「命題(propo
sition)」と称する文書の構成セグメントの相対的意義を特徴づける。これらの命題は、一般に節または句である。談話構造ツリーは、文書中の命題同士の間に
存在する関係、すなわち「談話関係」を識別する。

【０００４】談話構造ツリーは、通常、言語学者として訓練された専門家により莫大な費用
をかけて手作業で生成される。談話構造ツリーの手作業での生成は高額であるた
め、それらの大部分は、一般に談話を研究するために使用される理論ツールとし
て存続している。しかしながら、自然言語文書の談話構造を著す談話構造ツリー
を廉価で生成する自動化されたアプローチであれば、談話理論を任意の文書の分
析に応用することが可能である。

【０００５】（発明の概要）本発明は、テキストの本文の談話構造または他の自然言語表現を自動的に認識
することに関する。テキストの本文により表される談話構造は、多言語テキスト
要素の編成または「構造」、またはテキストの本文を構成する「命題」である。
テキストの本文の談話構造を認識することは、テキストの本文を著述する際の著
者の目的を容易に発見する助けとなり、このため、ある意味ではテキストの本文
の中心的な意味を見分ける助けとなる。

【０００６】入力テキストの談話構造を認識するために、本機能は、１つ以上の談話構造ツ
リーを生成する。本明細書中で記載するように、談話構造ツリーは、入力テキス
トの談話構造を表すデータ構造である。入力テキストは、一般に一連の節になる
と考案される。入力テキストについて該機能により生成される談話構造ツリーは
、厳密に言えば、これらの節の論理的表現である命題間の談話構造を特徴づける
一方、該機能は、正確な意味で命題となり得る節のいずれの的確な論理的表現を
基にするのではなく、節のコンテントに基づいて談話構造を生成する。したがっ
て、該機能による談話構造ツリーの生成は、入力テキストの節からの的確な論理
的命題の生成に依存しない。

【０００７】本発明によれば、該機能は、入力テキストとともに、入力テキストの的確な統
語的解析を実行することで作成されるデータを受け取る。このデータは、入力テ
キストの統語的構造を表す１つ以上の統語的解析グラフと、この意味論的情報を
含む統語的構造の正規化された観点を提供する、対応する論理形式と、を含むこ
とが好ましい。該機能は、入力テキストを節に分割するために論理形式を使用す
る。これらの節は、最終的には、入力テキストの談話構造を示す特定の構造にお
いて談話関係により互いに連結された談話構造ツリーに構成される。

【０００８】入力テキストにおいて節を識別した後、該機能は、これらの節をペアで考察す
る。単に隣接する節同士だけでなく各ペアの節同士の談話関係を仮説化するよう
試みることに留意することが重要である。節のペアごとに、該機能は、１組のキ
ューを使用して、ペアの節に適当に関連づけ得る談話関係を識別する。これらの
識別された関係を、ペアの節同士で「仮説化される」という。使用されるキュー
は、ペア同士で特定の関係が仮説化されるように、ペアの節により、またはペア
の節に対する論理形式または統語解析のコンテントにより満足されるべき条件の
レベルを１つ以上特定する。さらにキューは、キューの条件が満たされる場合に
ペア同士で仮説化された関係が正しいということの相対的尤度を示す数量的得点
をそれぞれ特定する。同一関係のいくつかのキューが同一の節のペアで満たされ
ると、これらのキューにより特定された得点が加点され、仮説化された関係の得
点が得られる。

【０００９】本機能は、各ペアの節同士での関係を仮説化した後、仮説化された関係を、そ
れぞれが所与の節のペア同士の仮説化された関係をすべて含む「袋」にグループ
分けする。仮説化された関係は、その得点が少なくなる順に各袋において整列さ
れる。袋自体は、最初に仮説化された関係の得点、すなわち袋において単一の最
高得点から少なくなる順に順次整列される。次に該機能は、節に対応する終端ノ
ードから、まず各袋における最初に仮説化された関係を通して、次に各袋におけ
る後続する仮説化された関係を通して反復するように、仮説化された関係を終端
ノードに適用しようとすることにより、ボトムアップ方式で１つ以上の談話構造
ツリーを構成していく。構成アルゴリズムは、適格にならないツリーのグループ
を考察から外すために、袋のトラバーサル(traversal)においてバックトラック法を利用する。仮説化された関係が実際に２つのノードを組み合わせる度に、得
られた組み合わせは、ツリーに非終端ノードとして追加される。新たなノードは
、仮説化された関係の得点に、組み合わされたノードの得点（もしあれば）を加
算したものと等しい得点を有する。したがって、このように構成されるどのツリ
ーも、ツリーが入力テキストにとって正しいということの相対的尤度を反映する
、そのルートノードと関連づけられた得点を有する。

【００１０】このように構成された各ツリーは、２分岐ツリーであり、各非終端ノードには
ちょうど２つの子を有する。いくつかの点では、ｎ分岐談話構造ツリーが二分岐
談話構造ツリーより便利であると考えられるため、該機能は、構成された２分岐
ツリーを「平坦に(flatten)」してｎ分岐ツリーを形成することが好ましい。

【００１１】さらに該機能は、このように構成されたツリーのいずれからでも、著者が目指
す主要な目的を反映した入力テキストのシノプシスを生成してもよい。このため
、該機能は、ツリーの幅優先の(breadth-first)トラバーサルをその主要部から指定された深さまで行い、立ち寄ったノードがそれぞれ表す節のテキストをサマ
リーに連鎖する。

【００１２】次に、本発明の機能は、節のテキストを基にして、入力テキストの手作業で生
成された命題表現に依存することなく、節のテキストの統語的および意味論的特
徴をテストするロバストなキューを使用することで節間の談話関係を仮説化し、
仮説化された談話関係を応用して袋への分離(segregation)に基づく順序で、かつバックトラック法を利用して談話関係ツリーを生成し、２分岐談話構造ツリー
をｎ分岐談話構造ツリーになるよう平坦にし、さらに生成された談話構造ツリー
から入力テキストのシノプシスを生成することが好ましい。

【００１３】（発明の詳細な説明）本発明は、テキストの本文の談話構造または他の自然言語表現を自動的に認識
することに関する。テキストの本文により表される談話構造は、多言語テキスト
要素の編成または「構造」、またはテキストの本文を構成する「命題」である。
テキストの本文の談話構造を認識することは、テキストの本文を著述する際の著
者の目的を容易に発見する助けとなり、このため、ある意味ではテキストの本文
の中心的な意味を識別する助けとなる。

【００１４】テキストの本文（「入力テキスト」）の談話構造を認識するために、本機能は
、１つ以上の談話構造ツリーを生成する。本明細書中で記載するように、談話構
造ツリーは、入力テキストの談話構造を表すデータ構造である。入力テキストは
、一般に一連の節になると考案される。入力テキストについて該機能により生成
される談話構造ツリーは、厳密に言えば、これらの節の論理的表現である命題間
の談話構造を特徴づける一方、該機能は、正確な意味での命題となり得る節のい
ずれの的確な論理的表現を基にするのではなく、節のコンテントに基づいて談話
構造を生成する。したがって、該機能による談話構造ツリーの生成は、入力テキ
ストの節からの的確な論理的命題の生成に依存しない。

【００１５】さらに詳細を後述するサンプル談話構造ツリーを図１８に示す。談話構造ツリ
ーは、１本のツリーに構成された多数のノードを含む。各ノードは、連続的なセ
ット、すなわち節の「スパン」を表す、すなわち「カバーする」。各ノードは、
カバーする節の中から「突起(projection)」と称される最も重要なノードをさら
に識別する。談話構造ツリーの葉、すなわち「終端ノード」は、それぞれ単一節
に相当する。一方、談話構造ツリーの非終端ノードは、１つ以上の談話関係によ
り組み合わされる、すなわち「関連づけられる」多数節に相当する。「ルートノ
ード」と呼ばれる１つの非終端ノードは、節をすべてカバーし、その子孫の中の
終端ノードをすべて有する。

【００１６】多数の異なるタイプの談話関係は、節同士で（または、節のグループ間で）発
生し得る関係の種類を表すために使用される。これらの談話関係タイプは、非対
称的談話関係タイプと対称的談話関係タイプの２つのカテゴリに分けられる。非
対称的談話関係は、節を、入力テキストにおいて異なるレベルの重要性を有する
と著者がみなしていることを実証するように節を関連づける。このため、非対称
的談話関係により関連づけられる節は、（１）より重要な「核」節と、より重要
でない「衛星」節と、を含み、（２）突起のリストとしてその核である子の突起
のみを有する。一例として、以下の節ＡおよびＢは、節Ａを表すノードが核であ
り、節Ｂを表すノードが衛星である、衛星が核を詳述している２つの節を説明す
る「詳述（ＥＬＡＢＯＲＡＴＩＯＮ）」関係により関連づけられる。Ａ．双眼鏡により、遠くの風景を見ることが可能である。Ｂ．それらはたとえば、対象の鳥を動揺させないために野鳥観察者により使用
される。図１８は、ノード１８０４を核とし、ノード１８０５を衛星とするノード１８１
２で表される非対称的対比（ＡＳＹＭＭＥＴＲＩＣＣＯＮＴＲＡＳＴ）関係と
、ノード１８０３を核とし、ノード１８１２を衛星とするノード１８１４で表さ
れる詳述（ＥＬＡＢＯＲＡＴＩＯＮ）関係と、ノード１８０１を核とし、ノード
１８１１を衛星とするノード１８１５で表される詳述（ＥＬＡＢＯＲＡＴＩＯＮ
）関係と、の３つの非対称的関係の表現を示す。

【００１７】一方、対称的談話関係は、節を、入力テキストの中で同様の重要性を有すると
著者がみなしていることを実証するように節を関連づける。このように、対称的
談話関係を表すノードは、（１）子として核のみを有し、（２）突起のリストと
してその子の突起の結合体(union)を有する。一例として、以下の節ＣおよびＤは、節ＣおよびＤを表すノードがともに核である子である、節の整列した連続体
を説明する「連続（ＳＥＱＵＥＮＣＥ）」関係により関連づけられる。Ｃ．まず、卵白を攪拌しなさい。Ｄ．次に、砂糖を加えなさい。図１８は、ノード１８０２と１８１４を核とするノード１８１１により表され
る対比（ＣＯＮＴＲＡＳＴ）関係という１つの対称的関係の表現を示す。形式的
には、有効、すなわち「適格」な談話構造ツリーは、（１）談話構造ツリーが入
力テキスト全体をカバーする「完全性(completeness)」、（２）談話構造ツリー
が入力テキストの節ごとに終端ノードを含む「連結性(connectedness)」、（３）談話構造ツリーの各ノードが単一の親を有する「特異性(uniqueness)」、そし
て（４）隣接するスパンのみを一緒にグループ化することでより大きなスパンを
形成することができる−すなわち、談話構造ツリーの非終端ノードが連続的なス
パンのみをカバーしなければならない「隣接性(adjacency)」の４つの特性を表す。

【００１８】本発明によれば、本機能は、入力テキストとともに、入力テキストの的確な統
語的解析を実行することにより作成されるデータを入力として受け取る。このデ
ータは、入力テキストの統語的構造を表す１つ以上の統語的解析グラフと、この
意味論的情報を含む統語的構造の正規化された観点を提供する、対応する論理形
式と、を含むことが好ましい。該機能は、入力テキストを節に分割するために論
理形式を使用する。これらの節は、最終的には、入力テキストの談話構造を示す
特定の構造において談話関係により互いに連結された談話構造ツリーに構成され
る。

【００１９】入力テキストにおいて節を識別した後、該機能は、これらの節をペアで考察す
る。単に隣接する節同士だけでなく各ペアの節同士の談話関係を仮説化しようと
試みることに留意することが重要である。節のペアごとに、該機能は、１組のキ
ューを使用して、ペアの節に適当に関連づけ得る談話関係を識別する。これらの
識別された関係を、ペアの節同士で「仮説化される」という。使用されるキュー
は、ペア同士で特定の関係が仮説化されるように、ペアの節により、またはペア
の節に対する論理形式または統語解析のコンテントにより満足されるべき条件の
レベルを１つ以上特定する。さらにキューは、キューの条件が満たされる場合に
ペア同士で仮説化された関係が正しいということの相対的尤度を示す数量的得点
をそれぞれ特定する。同一関係のいくつかのキューが同一の節のペアについて満
たされると、これらのキューにより特定された得点が加点され、仮説化された関
係の得点が得られる。

【００２０】本機能は、各ペアの節同士で関係を仮説化した後、仮説化された関係を、それ
ぞれが所与の節のペア同士の仮説化された関係をすべて含む「袋」にグループ分
けする。仮説化された関係は、得点が少なくなる順に各袋において整列される。
袋自体は、最初に仮説化された関係の得点、すなわち袋において単一の最高得点
から少なくなる順に順次整列される。次に該機能は、節に対応する終端ノードか
ら、まず各袋において最初に仮説化された関係を通して、次に各袋における後続
する仮説化された関係を通して反復するように、仮説化された関係を終端ノード
に適用しようとすることにより、ボトムアップ方式で１つ以上の談話構造ツリー
を構成していく。構成アルゴリズムは、適格にならないツリーのグループを考察
から外すために、袋のトラバーサル(traversal)においてバックトラック法を利用する。仮説化された関係が実際に２つのノードを組み合わせるごとに、得られ
た組み合わせは、ツリーに非終端ノードとして追加される。新たなノードは、仮
説化された関係の得点に組み合わされるノードの得点（もしあれば）を加算した
ものと等しい得点を有する。したがって、このように構成されるどのツリーも、
ツリーが入力テキストにとって正しいものであるということの相対的尤度を反映
する、ヘッドノードと関連づけられた得点を有する。

【００２１】このように構成された各ツリーは、２分岐ツリーであり、各非終端ノードには
ちょうど２つの子を有する。いくつかの点では、ｎ分岐談話構造ツリーが２分岐
談話構造ツリーより便利であると考えられるため、該機能は、構成された２分岐
ツリーを「平坦に(flatten)」してｎ分岐ツリーを形成することが好ましい。

【００２２】さらに該機能は、このように構成されたツリーのいずれから、著者が目指す主
要な目的を反映した入力テキストのシノプシスを生成してもよい。このため、該
機能は、ツリーの幅優先のトラバーサルをその主要部から指定された深さまで行
い、立ち寄ったノードがそれぞれ表す節のテキストをサマリーに連鎖する。

【００２３】図１は、本機能が実行することが好ましい汎用コンピュータシステムのハイレ
ベルブロック図である。コンピュータシステム１００は、中央処理装置（ＣＰＵ
）１１０と、入出力装置１２０と、コンピュータメモリ（メモリ）１３０と、を
含む。入出力装置の中には、ハードディスクドライブ等の記憶装置１２１と、Ｃ
Ｄ−ＲＯＭ等のコンピュータ読み取り可能媒体に設けられた、本機能を含むソフ
トウェア製品をインストールするために使用され得るコンピュータ読み取り可能
媒体ドライブ１２２と、がある。メモリ１３０は、好ましくは、談話構造認識機
能（「機能」）１３１と、入力テキストが表現される自然言語に関する語彙的お
よび意味論的情報を含む語彙知識ベース１３２と、論理形式を含み、これに内在
する形態論的、統語的および意味論的情報を入力テキストから導出する解析装置
１３３と、入力テキスト内の節のペアを関連づけ得る談話関係を仮説化するため
に使用される談話関係仮説化データ構造１３４と、入力テキストの節同士で仮説
化された談話関係の集合を表し、かつ入力テキストの談話構造を表す談話構造ツ
リーを構成するために本機能により使用される仮説化された談話関係データ構造
１３５と、を含む。解析装置１３３および機能１３１は、ともに入力テキストの
形態論、統語論、意味論および談話構造を識別し得ることから、解析装置および
該機能は、包括的に、自然言語入力テキストの形態論、統語論、意味論および談
話構造を識別する自然言語処理システムとして知られる。該機能は、上述のよう
に構成されるコンピュータシステム上で実施されることが好ましいが、当業者で
あれば、異なる構成を有するコンピュータシステム上でも実施し得ることが理解
されよう。

【００２４】図２は、入力テキストについて談話構造ツリーを１つ以上生成し、かつ入力テ
キストのシノプシスを生成するために該機能により実行されるステップの概略を
示すハイレベルフロー図である。ステップ２０１において、該機能は、入力テキ
ストを解析し、解析ツリーおよび論理形式を作成する。自然言語入力テキストの
解析の詳細な説明については、「統計的処理を規則ベースの自然言語解析装置に
ブートストラップする方法およびシステム(METHOD AND SYSTEM FOR BOOTSTRAPPI
NG STATISTICAL PROCESSING INTO A RULE-BASED NATURAL LANGUAGE PARSER)」と
題する米国特許出願第０８／２６５，８４５号を参照されたい。論理形式を自然
言語入力テキストから生成する詳細な説明については、「意味論論理形式を統語
ツリーから演算する方法およびシステム(METHOD AND SYSTEM FOR COMPUTING SEM
ANTIC LOGICAL FORMS FROM SYNTAX TREES)」と題する米国特許出願第０８／６７
４，６１０号を参照されたい。これらの２つの出願は、その全体を参照として本
明細書に組み込まれる。

【００２５】ステップ２０２において、本機能は、ステップ２０１において生成された論理
形式を使用して、入力テキスト内の節を識別する。ステップ２０３において、本
機能は、１組のキューを使用して、ステップ２０２において識別された節のペア
同士の可能な談話関係を仮説化する。ステップ２０４において、本機能は、ステ
ップ２０３において仮説化された関係を応用して、入力テキストについて１つ以
上の談話構造ツリーを構成する。談話構造ツリーごとに、その談話構造ツリーが
入力テキストの談話構造を正確にモデル化したということの相対的尤度を示す得
点が生成される。ステップ２０５において、本機能は、ステップ２０４において
構成された２分岐談話構造ツリーを「平坦」にして、これらをより一般的なｎ分
岐ツリーに変換する。ステップ２０６において、本機能は、最も重み付けされた
談話構造ツリーから、入力テキストの最重要の節を含むサンプル入力テキストの
シノプシスを生成する。ステップ２０６の後、これらのステップは終了する。

【００２６】本機能をより完全に説明するために、その動作を、単純な例を参照して以下詳
細に説明する。本例のサンプル入力テキストをテキストブロック１に示す。

【００２７】

【表１】

【００２８】ステップ２０１によれば、本機能は、まずサンプル入力テキストの各文を解析
し、文ごとに解析ツリーと論理形式の両方を生成する。図３〜図１０は、サンプ
ル入力テキストの４文の解析ツリーと論理形式を示す。

【００２９】図３は、サンプル入力テキストの第１文について作成された解析ツリーを示す
解析ツリー図である。解析ツリー３００は、全体として文の統語的構造を特徴づ
ける。ヘッドノード３０１に付随される解析ツリーの分岐は、文の異なる成分を
説明する。名詞句分岐３１０は、名詞句「the aardwof」を説明する。助動詞句分岐３２０は、動詞「is」を説明する。動詞分岐３３０は、動詞「classified」
を説明する。前置詞句分岐３４０は、前置詞句「as Proteles cristatus」を説明する。最後に、句読点分岐３５０は、文を終了するピリオドを説明する。

【００３０】図４は、サンプル入力テキストの第１文について生成された論理形式グラフを
示す論理形式図である。論理形式４００は、解析ツリーより抽象的に文の統語的
編成を説明する。論理形式は、比較的少数の統語論―意味論関係に基づき、これ
を介して動詞が文中の他の語により修飾され得る。これらの関係を識別するため
に使用されるラベルのいくつかを図１に示す。さらなるこのようなラベルは、米
国特許出願第０８／６７４，６１０号に記載されている。

【００３１】

【表２】入力テキストを解析することにより生成される論理形式は、本機能により使用さ
れ、（１）入力テキストをどのように節に分けるかを決定し、（２）節同士の談
話関係を仮説化する際のキューの条件をテストする。

【００３２】図３と同様に、図５、図７および図９は、サンプル入力テキストのそれぞれ第
２、第３および第４文について生成される解析ツリーを示す解析ツリー図である
。同様に、図６、図８および図１０は、サンプル入力テキストのそれぞれ第２、第
３および第４文について本機能により生成された論理形式グラフを示す論理形式
図である。

【００３３】ステップ２０１にしたがって入力テキストの文を本機能が解析した後、本機能
は、ステップ２０２にしたがって、入力テキストにおいて発生する節を識別して
いく。本機能が節を識別するために使用する基準を表２に示す。当業者であれば
、以下の表２および表４に使用される言語学的術語に精通していよう。かかる術
語についてのさらなる説明については、Finegan, Edward,「言語：その構造と使
用(Language: Its Structure and Use)」Harcourt Brace Jovanovich, San Dieg
o, 1989およびFromkin, VictoriaとRobert Rodman,「言語入門(An Introduction
to Language)」Holt, Rinehart, and Winston, New York, 1988に読み進むとよ
い。

【００３４】

【表３】本機能は、生成された論理形式のノードを徹底的にトラバースし、表２に示す基
準を各論理形式ノードに適用する。基準をすべて満たす論理形式ノードごとに、
本機能は、別個の節を識別する。

【００３５】本例のサンプル入力テキストを処理中に、本機能は、表２に示す基準を図４、
図６、図８、および図１０に示す論理形式に適用し、サンプル入力テキストを表
３に示す節に分ける。

【００３６】

【表４】それぞれサンプル入力テキストの第１、第２、第３文について図４、図６および
図８に示す論理形式において、ヘッドノードのみが表２に示す節識別基準をすべ
て満たす。このため、最初の３文は、それぞれ単一節のみで構成されると識別さ
れる。図１０に示すサンプル入力テキストの第４文についての論理形式の場合、
節識別基準は、ヘッドノード「have1」と内部ノードである「have2」ノードの両
方により満たされる。したがって、本機能は、第４文を節４と節５の２つの節に
分ける。

【００３７】本機能は、ステップ２０２にしたがって、入力テキストにおいて発生する節を
識別した後、ステップ２０３にしたがって、識別された節同士の談話関係を仮説
化していく。図１１は、入力テキストにおいて識別される節同士の談話関係を仮
説化するために本機能が実行することが好ましいステップを示すフロー図である
。ハイレベルにおいて、節同士の談話関係を仮説化するために、これらのステッ
プは、節のペアごとに各キューと対応づけられる条件を評価して、その節のペア
のキューと対応づけられる関係を仮説化するか否かを決定する。談話関係は方向
性であるため、所与の節のペアについて、本機能は、キューの条件を適用して、
一旦前方向に関係の仮説化を考察し、再び後方向に関係の仮説化を考察する。こ
れは、単に整列されていない節のペアのみを通したループではなく、整列された
節のペアすべてを通したループとしてフロー図に示される。

【００３８】ステップ１１０１〜１１０７において、本機能は、識別された節の整列された
各ペアを通してループを形成する。識別された節の整列されたペアごとに、ステ
ップ１１０２〜１１１０において、本機能は、異なる談話関係タイプのそれぞれ
を通してループを形成する。それぞれ異なる談話関係タイプごとに、ステップ１
１０３〜１１０９において、本機能は、現行の談話関係タイプに与えられた談話
関係キューを通してループを形成する。表４は、本機能により使用されることが
好ましい談話関係キューの一覧である。各キューは、整列されたペアの節同士の
特定の談話関係を陳述する個別のベースである。キューには、キューが節のペア
に首尾よく適用され得る場合に仮説化される関係を識別する関係名称がある。さ
らに各キューには、キューを参照するために使用されるキュー番号がある。さら
に各キューには、キューに基づいて識別された関係を仮説化するために、それぞ
れが「節₁」および「節₂」と識別される節により満たされるべき整列された条件
の集合がある。第１の条件がテストされ、第２の条件をテストする前に満たされ
なければならないという点で、条件が整列される。同様に、キューの追加条件ご
とに、その順でこれに先行する条件は、次の条件が評価される前に評価されて満
たされなければならない。最後に、各キューは、識別された関係が、整列された
条件の集合を満たすとしたときに整列されたペアの２つの節を正しく関連づける
相対的尤度を示す得点を有する。

【００３９】

【表５】ここで挙げたキューのセットは、本機能が以下のタイプ、すなわち、非対称的対
比、原因、状況、譲歩、条件、対比、詳述、連結、列挙、目的および結果、の談
話関係を識別できるようにすることが、表４からわかる。なお、本機能の動作は
、この一覧にキューを追加または削除することにより簡単に適応され得ることに
留意すべきである。追加関係タイプを仮説化するためにこのように追加されたキ
ューは、本機能が入力テキスト内で仮説化および識別が可能な関係タイプのセッ
トを拡張するよう作用し得る。

【００４０】現行の関係を仮説化する各キューにおいて、ステップ１１０４において、本機
能は、現行のキューと対応づけられた条件の整列されたセットを順次評価する。
ステップ１１０５において、その条件のセットが満たされれば、本機能はステッ
プ１１０６に続行するか、そうでなればステップ１１０９に続行する。ステップ
１１０６において、現行の関係がすでに仮説化されている、すなわち、関係が仮
説化された関係の一覧上にあれば、本機能はステップ１１０８に続行し、そうで
なればステップ１１０７に続行する。ステップ１１０７において、本機能は該関
係を仮説化された関係の一覧に追加する。ステップ１１０７の後、本機能はステ
ップ１１０８に続行する。ステップ１１０８において、本機能は現行のキューの
得点を現行の関係の合計得点に加点する。ステップ１１０８の後、本機能はステ
ップ１１０９に続行する。ステップ１１０９において、本機能はステップ１１０
３にループバックして現行の関係について次のキューを処理する。すべてのキュ
ーを処理した後、本機能はステップ１１１０に続行する。ステップ１１１０にお
いて、本機能はステップ１１０２にループバックして現行の節の整列されたペア
について次の関係タイプを処理する。すべての関係タイプを処理した後、本機能
はステップ１１１１に続行する。ステップ１１１１において、本機能はステップ
１１０１にループバックして次の節の整列されたペアを処理する。すべての節の
整列されたペアを処理した後、これらのステップは終了する。

【００４１】図１１に示すステップを表３に示す例の節に適用する際、本機能は、表５に示
す談話関係を仮説化する。各仮説化された関係ごとに、表５は、仮説化された関
係の関係タイプ、関係が仮説化される節の整列されたペア、その条件セットが満
たされたキュー、およびその条件セットが満たされたキューの得点を合計するこ
とによって得られる各仮説化された関係の合計得点を示す。

【００４２】

【表６】

【００４３】本機能が、ステップ２０３にしたがって、識別された節同士の関係を仮説化し
た後、本機能は、ステップ２０４にしたがって、仮説化された関係を適用してサ
ンプル入力テキストの１つ以上の談話構造ツリーを構築していく。図１２は、サ
ンプル入力テキストについて談話構造ツリーを生成するために本機能により実行
されることが好ましいステップを示すフロー図である。ステップ１２０１〜１２
０５において、本機能は、仮説化された関係を「袋」に分離してこれらを適用の
ために編成する。分離後、各袋は、片側方向においてある特定の節のペアを関連
づける仮説化された関係をすべて含む。このため、袋は、１つ以上の仮説化され
た関係により関連づけられた節の「整列されない」ペアごとに作成される。さら
に、各袋の仮説化された関係は、その得点の少なくなる順に並べ替えられ、袋自
体は、その最高得点から少なくなる順に並べ替えられる。この分離プロセスは、
いくつかの点で、仮説化された関係の適用を効率化する。第一に、ある特定の命
題のペアに関する仮説化された関係を単一の袋に分離することで、本機能は簡単
に、仮説化された関係を適用して形成される各談話構造ツリーが、任意の命題の
ペアを関連づけるノードを１つだけ含むように確実にできる。第二に、袋および
袋の中の仮説化された関係をその得点にしたがって並べ替え、仮説化された関係
をその順序で適用することで、本機能は、正確性の尤度が少なくなる順に談話構
造ツリーを作成することが可能である。このように、本機能は、最も正しいと思
われるツリーを素早く生成することが可能である。

【００４４】ステップ１２０１〜１２０５において、本機能は、仮説化された各関係を通し
てループを形成する。仮説化された各関係について、ステップ１２０２において
、関係が仮説化される節の整列されていないペアの袋が存在する場合、本機能は
、ステップ１２０４に続き、そうでなければ、本機能はステップ１２０３に続行
する。ステップ１２０３において、本機能は、関係が仮説化される節の整列され
ていないペアの袋を作成する。ステップ１２０３の後、本機能は、ステップ１２
０４に続行する。ステップ１２０４において、本機能は、関係が仮説化される節
の整列されないペアの袋に現行の仮説化された関係を追加する。ステップ１２０
５において、本機能は、ステップ１２０１にループバックして次の仮説化された
関係を処理する。仮説化された関係がすべて処理された後、本機能は、ステップ
１２０６に続行する。ステップ１２０６において、本機能は、各袋の仮説化され
た関係をその得点が少なくなる順に並べ替える。ステップ１２０７において、本
機能は、各袋の最初に仮説化された関係の得点が少なくなる順、すなわち、各袋
の仮説化された関係の中で最も高い得点から少なくなる順に袋を並べ替える。本
例の並べ替えられた袋を表６に示す。たとえば、仮説化された関係２および３を
含む袋５は、節１および３のものである。袋５の仮説化された関係は、仮説化さ
れた関係２の得点２５から仮説化された関係３の得点２０に減ずることがわかる
。さらに、袋の最大得点は、袋１の仮説化された関係４の得点３５から袋５の仮
説化された関係２の得点２５に減ずることがわかる。

【００４５】

【表７】

【００４６】ステップ１２０８において、本機能は、空の談話構造ツリーを作成する。ステ
ップ１２０９において、本機能は、この空のツリーに入力テキストの各節の終端
ノードを追加する。これらの終端ノードは、入力テキスト用に生成された各ツリ
ーごとにベースを形成する。

【００４７】図１３は、終端ノードのツリーへの追加を示す談話構造ツリー図である。この
ような追加の後、ツリー１３００は終端ノード１３０１〜１３０５を含む。各ノ
ードの第１のテキストラインは、ノードによりカバーされる節のセットを識別す
る。定義による終端ノードはそれぞれ、単一の節のみをカバーする。たとえば、
終端ノード１３０１は、節１のみをカバーする。さらに各ノードは、そのカバー
された節の中から、カバーされた節「から突出した」すなわちその中で最も重要
な節を示している。ここでも各終端ノードは、１つだけの節を突起させる。たと
えば、終端ノード１３０１は、その唯一カバーされる節である節１を突出させる
。

【００４８】ステップ１２１０において、本機能は、入力テキストにとって所望の数の談話
構造ツリーを構築するように、構築ツリー（ＣｏｎｓｔｒｕｃｔＴｒｅｅ）とい
う名称の再帰的サブルーチンを呼び出す。本機能が再帰的呼出から戻ってくると
、所望の数のツリーが構築されており、このステップは終了する。構築ツリー再
帰的サブルーチンの擬似コード定義をコードブロック１に示す。ハイレベルにお
いて、完了まで走行することが認められれば、構築ツリーは、仮説化された談話
関係と互換性のある可能で的確な談話構造ツリーをすべて作成する。しかしなが
ら、実際に実施されるように、研究者は、通常１０または２０である所望の数の
ツリーを特定する。構築ツリーは次に、規定された数のツリーまたはすべての可
能なツリーのいずれかで数の小さい方を作成する。本アルゴリズムはよりよいツ
リーを最初に生成するため、通常、談話分析者が妥当と考える分析がなされる前
に多数のツリーを作成する必要はない。

【００４９】構築ツリーの再帰的バックトラックの性質は、多数の不適格なツリーの構築を
防ぐ。たとえば、Ｒ₂をＲ₁の後に適用した結果、無効なツリーが得られた場合の
５つの仮説Ｒ₁…Ｒ₅の虚集合を考察する。これらの５つの仮説の置換をすべてテ
ストし、次いでツリーのみを検証して｛Ｒ₁Ｒ₂Ｒ₃Ｒ₄Ｒ₅｝または｛Ｒ₁Ｒ₂Ｒ₃Ｒ ₅ Ｒ₄｝を適用する等により、形成されたそのツリーが無効であったことを発見す
ることで仮説を立てようとするのではなく、構築ツリーは、Ｒ₁、次いでＲ₂を適
用する。不適格なサブツリーが結果生じたことがすぐにわかるため、これら最初
の２つのステップの後に続くいずれのツリーも構成しなくてすむ。したがって、
合計６つのツリーを作成しなくてもよいため、効率の面で相当の利得がもたらさ
れる結果となる。

【００５０】構築ツリーにより作成されたツリーは、一覧に保存される。各ツリーのルート
ノードのＶａｌｕｅ属性を用いてツリーを評価し得る−これは、ツリーを構築す
るために使用される関係の発見的得点を加点することによってＶａｌｕｅ属性が
求められるため、関係を高得点の発見的得点とともに使用して構築されるツリー
は、関係を低得点の発見的得点とともに使用して構築されるツリーより値が大き
くなる。理想的には、構築ツリーは、低ランクのツリーに先だって作成される高
ランクのツリーを作成すべきである。残念ながら、構築ツリーは、時には順序か
らはずれてツリーを生成することがある。この変則的な状況を修正するためには
、構築ツリーにより作成されたツリーのリストを各ツリーのルートノードにＶａ
ｌｕｅ属性にしたがって並べ替えることで、談話分析者によりテキストに好まし
い分析であると判断されたツリーが最上位ランクツリーとして生じるとともに、
並べ替えられたリストの最上位付近に、正しいと思われる代替的な分析が生じる
ことも確実にする。

【００５１】

【表８】

【００５２】仮説化された関係を適用してツリーを生成する際、本機能は、袋１で開始し、
最初に仮説化された関係である関係４を適用しようとする。この関係は、節２と
３の間の「対比」関係を特定する。本機能は、ツリーの現行のノードであるＴＲ
ＥＥＮＯＤＥＳから、突起が節２を含むノードと突起が節３を含むノードを探索
する。本機能は、これらの２つのノードを見つける。本機能は、該ノードをＴＲ
ＥＥＮＯＤＥＳから削除し、これらを組み合わせて節２と３をカバーする新たな
ノードを形成し、この新たなノードを再びＴＲＥＥＮＯＤＥＳに追加する。この
時点で、ＴＲＥＥＮＯＤＥＳは、図１４に示す要素を含む。

【００５３】本機能は次に、他の袋、すなわち、袋２，３，４，５を置換する。第１の置換
において、最初の袋は袋２である。本機能は、節３を核とし節４を衛星とする「
詳述」関係を特定する、袋２における最初に仮説化された関係である仮説５を適
用しようとする。本機能は、ＴＲＥＥＮＯＤＥＳの中から、その突起が節３を含
むノードとその突起が節４を含むノードを探索する。これらの突起を有するノー
ドはＴＲＥＥＮＯＤＥＳにおいて見出される。突起が節３を含むノード、すなわ
ち袋１において第１の仮説の適用から得られる「対比」ノードも突起に節２を含
む。本機能は、仮説化された関係の元のリスト「ＯＲＩＧＩＮＡＬＨＹＰＯＴＨ
Ｓ」が、節２を核とし節４を衛星とする「詳述」関係を含む場合にのみ、このノ
ードの衛星として節４を付随し得る。かかる関係は一切仮説化されなかったため
、ＯＲＩＧＩＮＡＬＨＹＰＯＴＨＳにおいて生じない。したがって、本機能は、
このノードの衛星として節４を付随させることができない。

【００５４】袋２が仮説化された関係をさらに多く含んでいれば、本機能は、この段階でこ
れらを考察する方向に動く。袋２は単一の関係を含んでいるにすぎないため、本
機能は、現行の袋の処理を完了した後、袋３に移る。

【００５５】袋３において最初に仮説化された関係である関係６は、節４を核とし節５を衛
星とする「非対称的対比」関係を特定する。本機能は、その突起がこれら２つの
節を含むノードを見つけ、図１５に示すように、節４および５をカバーする新た
なノードを作成する。

【００５６】本機能は次に、他の袋、すなわち、袋２、４、５を置換する。第１の置換にお
いて、最初の袋は袋２である。上述したように、袋２は、適用され得ない単一の
仮説化された関係を、その関係により特定される突起の存在にもかかわらず含む
。したがって、本機能は、袋４に進み、関係１を適用する。関係１は、節１を核
とし節２を衛星とする「詳述」関係を特定する。不可欠な突起を有するノードが
見つけられる。節２は、他の突起を有するノード、すなわち節３において生じる
。ＯＲＩＧＩＮＡＬＨＹＰＯＴＨＳは、節１を核とし節３を衛星とする「詳述」
関係を含むため、本機能は、図１６に示すように、節１乃至３をカバーする新た
なノードを構築する。

【００５７】本機能は、次に、他の袋、すなわち、袋２および５を置換する。第１の置換に
おいて、最初の袋は袋２である。ＴＲＥＥＮＯＤＥＳにおいて、本機能は、袋２
における仮説化された関係が特に節３および４をカバーする２つの突起を見つけ
ることができない。したがって、本機能は、袋２をさらなる考察から除くことに
よって、以下の探索空間におけるすべてのノードを現行の置換から外す。この特
定の例において、袋２は、単一の仮説を含み、袋２を除いたことで袋が１つだけ
、すなわち袋５が残った。しかしながら、このように探索空間を外すことは、効
率面で実質的な利得をもたらされることが多い。本機能の実行を測定すると、探
索空間を外したことで、ある袋から次のものに移るループの通過がほぼ三分の一
減少したことが示される。

【００５８】本機能は、次に袋５を考察することに移る。袋２と同様に、本機能は、袋５に
おける仮説化された関係により特定される両方の突起を見つけることができない
。したがって、本機能は、袋５をさらなる考察から除く。袋はもう残っていない
ため、本機能は、図１５のツリーの状態に戻り、処理を続行する。最終的に、Ｔ
ＲＥＥＮＯＤＥＳは、図１７に示す２つのノードを含む。

【００５９】本機能は、仮説化された関係１を袋４から適用しようとする。この関係は、節
１を主要とし節２を衛星とする「詳述」関係を特定する。節１および節２は、と
もにＴＲＥＥＮＯＤＥＳにおけるノードの突起において利用可能である。節２は
、その突起が節３も含むノードの突起として生じる。ＯＲＩＧＩＮＡＬＨＹＰＯ
ＴＨＳも節１を核とし節３を衛星とする「詳述」関係を含むことから、本機能は
、節１と、節２乃至５をカバーする「対比」ノードを連結する。ここで、ＴＲＥ
ＥＮＯＤＥは、図１８に示すように、節１乃至５をカバーする単一ノードを含む
。このノードは、サンプル入力テキストを著す談話構造ツリーの主要部である。

【００６０】本機能によりステップ２０４において構築ツリーサブルーチンを用いて生成さ
れる談話構造ツリーは、各非終端ノードが２つの子を有する２分岐ツリーである
。対称的関係を表す非終端ノードにおいて、これら２つの子は、いずれも核であ
る。一方、非対称的関係を表す非終端ノードの場合、２つの子の一方はより重要
な核であるが、他方はより重要でない衛星である。

【００６１】これらの２分岐談話構造ツリーは、これらが生成される入力テキストの談話構
造の完全表現を構成するが、談話構造ツリーの使用者の中には、談話構造ツリー
をｎ分岐ツリーとして呈される方を好むものもいる。ｎ分岐談話構造ツリーにお
いて、非終端ノードは、子の数が制限されなくてもよい。対称的関係を表す非終
端ノードは、任意の数の核の子を有しても良い。同様に、非対称的関係を表す非
終端ノードは、１つの核の子を有し、衛星の子は任意の数でよい。

【００６２】図１９は、２分岐談話構造ツリーをｎ分岐談話構造ツリーに変換するために本
機能により実行されることが好ましいステップを示すフロー図である。ステップ
１９０１〜１９０７において、本機能は、２分岐談話構造ツリーにおける各終端
ノードを通して、談話構造ツリーのボトムアップトラバーサルでループを形成す
る。非終端ノードそれぞれについて、非終端ノードが親を有する場合、本機能は
、ステップ１９０３において続行され、そうでなければ本機能は、ステップ１９
０７に続行する。ステップ１９０３において、非終端ノードが対称的関係を表す
場合、本機能はステップ１９０４に続き、そうでなければ非終端ノードは非対称
的関係を表し、本機能はステップ１９０５に続行する。現行の非終端ノードが対
称的関係を表すステップ１９０４において、現行の非終端ノードの親が現行の非
終端ノードと同一の関係タイプを表す場合、本機能はステップ１９０６に続いて
現行の非終端ノードをその親ノードと合併し、そうでなければ、本機能はステッ
プ１９０７に続行する。現行の非終端ノードが非対称的関係を表すステップ１９
０５において、親ノードがいずれかの非対称的関係を表す場合、本機能はステッ
プ１９０６に続き、現行の非終端ノードをその親ノードと合併し、そうでなけれ
ば、本機能はステップ１９０７に続行する。ステップ１９０６において非終端ノ
ードを親に合併した後、本機能は、ステップ１９０７に続行する。ステップ１９
０７において、本機能は、ステップ１９０１にループバックして談話構造ツリー
の次の非終端ノードを処理する。談話構造ツリーの非終端ノードをすべて処理し
た後、２分岐ツリーがｎ分岐ツリーに変換された後、これらのステップは終了す
る。

【００６３】図２０および図２１は、２分岐談話構造ツリーのｎ分岐談話構造ツリーへの変
換とを示す。図２０は、サンプル２分岐談話構造ツリーを示す談話構造ツリー図
である。２分岐談話構造ツリー２０００は、終端ノード２００１〜２００７を含
む。非終端ノード２０１１は、ノード２００３をその核としノード２００４を衛
星とする「結果」関係を表す。非終端ノード２０１２は、ノード２０１１をその
核としノード２００５を衛星とする「手段」関係を表す。非終端ノード２０１３
は、ノード２０１２をその核としノード２００２を衛星とする「詳述」関係を表
す。非終端ノード２０１４は、ノード２０１３をその核としノード２００１を衛
星とする「状況」関係を表す。ノード２０１５は、ノード２０１４および２００
６を核として有する「連続」関係を表す。最後に、非終端ノード２０１６は、ノ
ード２０１５および２００７を核として有する「連続」関係を表す。非終端ノー
ドがそれぞれちょうど２つの子を有するため、この談話構造ツリーが２分岐談話
構造ツリーであることが、図２０からわかる。

【００６４】図２１は、図１９に示すステップを使用して、図２０に示す２分岐談話構造ツ
リーから、本機能により構成されるｎ分岐談話構造ツリーを示す談話構造ツリー
図である。談話構造ツリー２１００では、図２０に示す非終端ノード２０１１〜
２０１３がノード２０１４に結合されてノード２１１４を形成していることが、
図２１において明らかである。したがって、非終端ノード２０１４は、ノード２
１０３を核としノード２１０４を衛星とする「結果」関係を表し、ノード２１０
３をその核としノード２１０５を衛星とする「手段」関係を表し、ノード２１０
３をその核としノード２１０２を衛星とする「詳述」関係を表し、ノード２１０
３をその核としノード２１０１を衛星とする「状況」関係を表す。さらに、図２
０に示す非終端ノード２０１５は、ノード２０１６に結合されて非終端ノード２
０１６を形成する。このように、非終端ノード２１１６は、ノード２１１４、２
１０６および２１０７を核として有する「連続」関係を表す。したがって、本機
能は、いずれの２分岐談話構造ツリーも同等のｎ分岐談話構造ツリーに変換する
ことが可能である。

【００６５】本機能が、ステップ２０５にしたがって２分岐談話構造ツリーを同等のｎ分岐
談話構造ツリーに変換した後、本機能は、ステップ２０６にしたがって最高得点
の談話構造ツリーからシノプシスを生成していく。図２２は、本機能により生成
される最高得点の談話構造ツリーに基づき入力テキストのシノプシスを生成する
ために、本機能により実行されることが好ましいステップを示すフロー図である
。これらのステップは、「カットオフ深さ」と呼ばれる整数値を用いて、シノプ
シスに含まれる詳細のレベルを決定する。カットオフ深さが浅いほど、シノプシ
スに含まれる詳細情報が少ない。ステップ２２０１〜２２０５において、本機能
は、深さ優先の(depth-first)トラバーサルの順に最高得点の談話構造ツリーにおける各ノードを通してループを形成する。各ノードについて、ノードが、カッ
トオフ深さが少なくとも談話構造ツリーの浅さ程度であれば、本機能は、ステッ
プ２２０３に続き、そうでなければ、本機能はステップ２２０５に続行する。各
ノードの深さは、そのノードを談話構造ツリーの主要部から切り離した衛星弧の
数と定義される。ステップ２２０３において、現行のノードが談話構造ツリーに
おける終端ノードであれば、本機能は、ステップ２２０４に続き、そうでなけれ
ば本機能はステップ２２０３に続行する。ステップ２２０４において、本機能は
、現行のノードにより表される節のテキストをシノプシスに連鎖する。ステップ
２２０５において、本機能は、ステップ２２０１にループバックして深さ優先の
トラバーサルで次のノードを処理する。すべてのノードを処理した後、シノプシ
スは完了し、これらのステップは終了する。

【００６６】上述したように、生成されたシノプシスに含まれる詳細のレベルは、ユーザに
より構成可能であることが好ましいカットオフ深さの選択により制御される。表
７は、可能なカットオフ深さそれぞれについてサンプル入力テキスト用に生成さ
れるシノプシスを示す。カットオフ深さが浅い状態で生成されたシノプシスほど
入力テキストをより簡潔に要約する一方、カットオフ深さが深い状態のシノプシ
スほど入力テキストについての詳細のさらなるレベルを含むことが、表７からわ
かる。

【００６７】

【表９】

【００６８】例示の実施形態を参照して本発明を図示して説明してきたが、発明の範囲から
逸脱することなく、形態または詳細の面で各種の変更または変形をし得ることが
、当業者により理解されよう。たとえば、本機能を使用することで、終端ノード
のテキストが本明細書中で記載した節より大きいかまたは小さい場合に、サンプ
ル入力テキスト内で談話構造を決定し得る。また、本機能を使用することで、発
話および視覚的身振り等のテキスト以外の自然言語表現、または指示のリスト等
の非テキスト形式において語彙知識ベースに表現された「書記」自然言語の形式
において談話構造も決定し得る。さらに、本機能を直接適応することで、予めコ
ンパイルされた語彙知識ベースから得られた統語的および意味論的情報等、解析
装置以外の情報源から得られた入力テキストについての統語的および意味論的情
報を使用し得る。

【図面の簡単な説明】

【図１】本機能が実行することが好ましい汎用コンピュータシステムのハイレベルブロ
ック図である。

【図２】入力テキストについて談話構造ツリーを１つ以上生成し、かつ入力テキストの
シノプシスを生成するために本機能により実行されるステップの概略を示すハイ
レベルフロー図である。

【図３】サンプル入力テキストの第１文について作成された解析ツリーを示す解析ツリ
ー図である。

【図４】サンプル入力テキストの第１文について生成された論理形式グラフを示す論理
形式図である。

【図５】サンプル入力テキストの第２文について生成された解析ツリーを示す解析ツリ
ー図である。

【図６】サンプル入力テキストの第２文について本機能により生成された論理形式グラ
フを示す論理形式図である。

【図７】サンプル入力テキストの第３文について生成された解析ツリーを示す解析ツリ
ー図である。

【図８】サンプル入力テキストの第３文について本機能により生成された論理形式グラ
フを示す論理形式図である。

【図９】サンプル入力テキストの第４文について生成された解析ツリーを示す解析ツリ
ー図である。

【図１０】サンプル入力テキストの第４文について本機能により生成された論理形式グラ
フを示す論理形式図である。

【図１１】入力テキストにおいて識別される節同士の談話関係を仮説化するために本機能
が実行することが好ましいステップを示すフロー図である。

【図１２】入力テキストについて談話構造ツリーを生成するために本機能が実行すること
が好ましいステップを示すフロー図である。

【図１３】終端ノードのツリーへの追加を示す談話構造ツリー図である。

【図１４】節２乃至節３をカバーする新たなノードの追加を示す談話構造ツリー図である
。

【図１５】節４および節５をカバーする新たなノードの追加を示す談話構造ツリー図であ
る。

【図１６】節１乃至節３をカバーする新たなノードの追加を示す談話構造ツリー図である
。

【図１７】図１６に示すツリーから図１５に示すツリーまで本機能がバックトラックする
、さらに節３乃至節５をカバーする新たなノードの追加を示す談話構造ツリー図
である。

【図１８】本機能により生成される第１の完全談話構造ツリーを示す談話構造ツリー図で
ある。

【図１９】２分岐談話構造ツリーをｎ分岐談話構造ツリーに変換するために本機能が実行
することが好ましいステップを示すフロー図である。

【図２０】サンプル２分岐談話構造ツリーを示す談話構造ツリー図である。

【図２１】図２０に示すステップを使用して、図２１に示す２分岐談話構造ツリーから、
本機能により構成されるｎ分岐談話構造ツリーを示す談話構造ツリー図である。

【図２２】本機能により生成される最高得点の談話構造ツリーに基づき入力テキストのシ
ノプシスを生成するために、本機能が実行することが好ましいステップを示すフ
ロー図である。

【手続補正書】

【提出日】平成１２年４月２１日（２０００．４．２１）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正内容】

【特許請求の範囲】

【請求項２３】入力テキストにおいて生じる複数の節の少なくとも１つの
ペアについてそれぞれ仮説化される談話関係のセットを表す仮説化された談話関
係データ構造を含むコンピュータメモリであって、前記データ構造が、前記入力
テキストについて談話構造ツリーを１つ以上生成し、かつ異なるペアの節同士で仮説化される談話関係のリストをそれぞれ含む複数の袋
であって、前記リストは、各談話関係が、これが仮説化されるペアの節を正確に
関連づける相対的尤度にしたがって整列され、前記袋は、前記袋が含むリストに
おいて前記談話関係の最大尤度が少なくなる順に整列することで、前記仮説化さ
れた談話関係を前記袋のリストのトラバーサルにしたがって適用することによっ
て、前記入力テキストの談話構造を特徴づける談話構造ツリーが生成され得る、
複数の袋、を備える、コンピュータメモリ。

【手続補正書】

【提出日】平成１３年１月１０日（２００１．１．１０）

【手続補正１】

【補正対象書類名】図面

【補正対象項目名】図１

【補正方法】変更

【補正内容】

【図１】

【手続補正２】

【補正対象書類名】図面

【補正対象項目名】図２

【補正方法】変更

【補正内容】

【図２】

【手続補正３】

【補正対象書類名】図面

【補正対象項目名】図１１

【補正方法】変更

【補正内容】

【図１１】

【手続補正４】

【補正対象書類名】図面

【補正対象項目名】図１２

【補正方法】変更

【補正内容】

【図１２】

【手続補正５】

【補正対象書類名】図面

【補正対象項目名】図１９

【補正方法】変更

【補正内容】

【図１９】

【手続補正６】

【補正対象書類名】図面

【補正対象項目名】図２２

【補正方法】変更

【補正内容】

【図２２】

───────────────────────────────────────────────────── フロントページの続き (72)発明者デ・カンポス，ミゲル・カルドソアメリカ合衆国ワシントン州98144，シアトル，サーティース・アベニュー・サウス 531，ナンバー２Ｆターム(参考） 5B091 AA15 CA02 CA05 CA12 CA14 【要約の続き】

Claims

【特許請求の範囲】

【請求項１】コンピュータシステムにおいて、談話構造ツリーが節からな
るテキストの本文の談話構造を正確に特徴づける尤度を反映する談話構造ツリー
の数量的得点を決定する方法であって、前記談話構造ツリーは、終端ノードと非
終端ノードとをともに含む、節を表すノードを備え、前記非終端ノードが、その
ちょうど１つがいずれのノードの子でもないルートノードである、２つ以上の子
ノードの間の談話関係をそれぞれ識別し、非終端ノードそれぞれについて、前記談話関係が、現行のノードの子ノードにより表される節同士で正確に認
識されている尤度を反映する、現行のノードにより表される談話関係の数量的得
点を求めるステップと、任意の非終端の子ノードの得点を、現行のノードにより表される談話関係の
得点と結合するステップと、該結合した得点を前記現行ノードの属性とし、かつ前記ルートノードの得点
を前記談話構造ツリーの属性とするステップと、を含む、方法。
【請求項２】前記結合ステップは、任意の非終端の子ノードの得点を、現
行のノードで表される談話関係の得点と合計するステップを含む、請求項１記載
の方法。
【請求項３】テキストの本文の談話構造を特徴づける複数の談話構造ツリ
ーのそれぞれについて上記ステップを繰り返して、得点を、前記複数の談話構造
ツリーのそれぞれの属性とするステップと、最高得点を属性とする談話構造ツリーを好ましい談話構造ツリーとして選択す
るステップと、をさらに含む、請求項１記載の方法。
【請求項４】コンピュータシステムに、自然言語表現の談話構造を特徴づ
ける自然言語表現の談話構造ツリーを、該自然言語表現と対応づけられる統語的
情報を利用して生成させ、これを、複数の節を前記自然言語表現から選択するステップと、節のペアそれぞれについて、複数の可能な談話関係のうち、前記節のペアに対
する前記自然言語表現の統語的構造に基づいて前記節のペア同士でどれを仮説化
するかを決定するステップと、前記仮説化された関係を前記節に適用して、前記自然言語表現の談話構造を特
徴づける談話構造ツリーを作成するステップと、を実行することにより行わせるコンテンツをもつ、コンピュータ読み取り可能媒
体。
【請求項５】さらに前記コンピュータ読み取り可能媒体のコンテンツによ
り、前記コンピュータシステムに、前記自然言語表現をテキストの本文として受
け取るステップを実行させる、請求項４記載のコンピュータ読み取り可能媒体。
【請求項６】さらに前記コンピュータ読み取り可能媒体のコンテンツによ
り、前記コンピュータシステムに、前記自然言語表現を発話の本文として受け取
るステップを実行させる、請求項４記載のコンピュータ読み取り可能媒体。
【請求項７】さらに前記コンピュータ読み取り可能媒体のコンテンツによ
り、前記コンピュータシステムに、前記自然言語表現を視覚的身振りの本文とし
て受け取るステップを実行させる、請求項４記載のコンピュータ読み取り可能媒
体。
【請求項８】前記決定ステップは、選択されたペアの節同士の談話関係を
、前記選択されたペアの節において生じる語に対する語彙的知識ベースから作成
される情報に基づいて仮説化するよう決定する、請求項４記載のコンピュータ読
み取り可能媒体。
【請求項９】さらに前記コンピュータ読み取り可能媒体のコンテンツによ
り、前記コンピュータシステムに、前記方法により利用される統語的情報を含む
統語的解析結果を前記自然言語表現から生成するステップを実行させる、請求項
４記載のコンピュータ読み取り可能媒体。
【請求項１０】さらに前記コンピュータ読み取り可能媒体のコンテンツに
より、前記コンピュータシステムに、前記方法により利用される統語的情報の少
なくとも一部を含む論理形式を前記自然言語表現から生成するステップを実行さ
せる、請求項４記載のコンピュータ読み取り可能媒体。
【請求項１１】前記自然言語表現と対応づけられる意味論的情報をさらに
利用し、かつ前記決定ステップは、区別されたペアの節同士の談話関係を、前記
選択されたペアの節に対する前記意味論的情報に基づいて仮説化するよう決定す
る、請求項４記載のコンピュータ読み取り可能媒体。
【請求項１２】前記作成されたツリーは、前記自然言語表現において識別
される節を表す節ノードと、前記節に適用される関係を表す関係ノードとを含む
、該ツリーの深さをそれぞれ有するノードからなり、かつ、さらに前記コンピュ
ータ読み取り可能媒体のコンテンツにより、前記コンピュータシステムに、その
節ノードが所定のカットオフ深さよりも深いツリーの深さを有する節を前記自然
言語表現から削除することによって、前記自然言語表現のサマリーを生成するス
テップを実行させる、請求項４記載のコンピュータ読み取り可能媒体。
【請求項１３】ペアの節同士の談話関係を仮説化する際に使用される談話
関係仮説化データ構造を含むコンピュータメモリであって、前記データ構造は、
複数の関係それぞれについて、１つ以上の項目のリストを備え、該項目の各々が
、前記ペアの節に関する言語学的情報に適用する表示された順を有する条件リス
トと、前記関係が前記条件リストが満たされたときに前記ペアの節を正確に関連づけ
る相対的尤度を反映する数量的得点であって、前記ペアの節について、前記関係
の１つ以上について、前記項目のそれぞれについて、前記条件リストを前記ペア
の節に関する言語学的情報に適用できるように、かつ前記条件リストが満たされ
た場合、前記数量的得点を、前記関係が前記ペアの節を正確に関連づける相対的
尤度の全数量的得点に結合できるようにする、数量的得点と、を含む、コンピュータメモリ。
【請求項１４】前記談話関係仮説化データ構造の前記条件リストは、前記
ペアの節に関する統語的情報にそれぞれ適用する、請求項１３記載のコンピュー
タメモリ。
【請求項１５】前記談話関係仮説化データ構造の前記条件リストは、前記
ペアの節に関する意味論的情報にそれぞれ適用する、請求項１３記載のコンピュ
ータメモリ。
【請求項１６】前記談話関係の前記条件リストは、前記ペアの節に関する
統語的および意味論的情報にそれぞれ適用する、請求項１３記載のコンピュータ
メモリ。
【請求項１７】前記談話関係仮説化データ構造の前記条件リストは、前記
ペアの節の中の語に関する語彙的知識ベースから利用可能な情報にそれぞれ適用
する、請求項１３記載のコンピュータメモリ。
【請求項１８】自然言語テキストの本文において生じる２つの節同士の起
こり得る談話関係を１つ以上認識する装置であって、複数の可能な関係のそれぞ
れについて、複数の可能な関係のそれぞれについて、前記２つの節に対するテキストの本文
の統語的構造にそれぞれ関する１つ以上の条件のセットを保存するメモリと、複数の可能な関係のそれぞれについて、前記可能な関係を、前記条件のセット
の少なくとも１つのうちの各条件が、前記ペアの節に対するテキストの本文の統
語的構造により満たされるとき、前記２つの節同士の起こりうる関係として認識
する起こり得る関係の認識サブシステムと、を備える、装置。
【請求項１９】前記メモリは、前記２つの節に対するテキストの本文の統
語的または意味論的構造に関する条件を保存する、請求項１８記載の装置。
【請求項２０】前記メモリは、満足されるように決定される条件の整列し
たセットのそれぞれについて、現行の可能な談話関係が、前記満足された条件の
整列したセットを満たしたことに基づいて前記節同士で正確に認識されている尤
度を表す前記満足された条件の整列したセットと対応づけられる数量的得点をさ
らに保存し、前記装置は、満足されるように決定される条件の整列したセットの
それぞれについて、得られた数量的得点を現行の可能な談話関係の合計得点に加
算することで、前記装置の動作後に、起こり得る関係として認識される各関係が
、前記関係を満足させる条件のあらゆるセットの観点で、前記節同士で前記関係
が正確に認識されていた相対尤度を表す合計得点を有するようにする得点サブシ
ステムを含む、請求項１８記載の装置。