JP2001523019A - テキストの本文の談話構造の自動認識 - Google Patents

テキストの本文の談話構造の自動認識

Info

Publication number
JP2001523019A
JP2001523019A JP2000517355A JP2000517355A JP2001523019A JP 2001523019 A JP2001523019 A JP 2001523019A JP 2000517355 A JP2000517355 A JP 2000517355A JP 2000517355 A JP2000517355 A JP 2000517355A JP 2001523019 A JP2001523019 A JP 2001523019A
Authority
JP
Japan
Prior art keywords
discourse
clauses
node
tree
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000517355A
Other languages
English (en)
Other versions
JP4625178B2 (ja
Inventor
コーストン,サイモン
デ・カンポス,ミゲル・カルドソ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2001523019A publication Critical patent/JP2001523019A/ja
Application granted granted Critical
Publication of JP4625178B2 publication Critical patent/JP4625178B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Abstract

(57)【要約】 本発明は、テキストの本文の談話構造を認識することに関する。好ましい実施形態において、談話構造認識機能は、テキストの本文と関連づけられた統語的情報を利用して、テキストの本文の談話構造を特徴づける談話構造ツリーを生成する。該機能は、まず、テキストの本文における多数の節を識別する。該機能は、次に、節の異なるペアごとに、節のペアに対するテキストの本文の統語的構造および意味に基づいて、可能な多数の談話関係のうちいずれが節のペア同士で仮説化されるべきであるかを決定する。次に該機能は、仮説化された関係を節に適用して、テキストの本文の談話構造を特徴づける談話構造ツリーを作成する。所定の実施形態において、さらに該機能は、作成された談話構造ツリーから、その著者が目指す主要な目的を反映したテキストの本文のシノプシスを生成する。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本発明は、数理言語学の分野一般に関し、より詳細には、談話処理の分野に関
する。
【0002】 (発明の背景) 談話理論は、自然言語文書の文脈および意義ならびに自然言語の他の単位を理
解するアプローチである。談話理論によれば、各自然言語文書には、文書を著す
際の文書の著者の意図を反映する「談話構造」がある。自然言語文書の談話構造
を見極めることは、一般に文書を理解する重要な成分とみなされる。
【0003】 文書の談話構造は、MannとThompsonの「談話における関係命題(Relational Pr
opositions in Discourse), Discourse Processes 9:57-90 (1986)により提案さ
れた「修辞的構造理論ツリー(rhetorical structure theory trees)」(「RS Tツリー」)等の階層的な「談話構造ツリー」、あるいは単に「ツリー」を使用
することでモデル化されることが多い。かかる談話構造ツリーは、「命題(propo
sition)」と称する文書の構成セグメントの相対的意義を特徴づける。これらの 命題は、一般に節または句である。談話構造ツリーは、文書中の命題同士の間に
存在する関係、すなわち「談話関係」を識別する。
【0004】 談話構造ツリーは、通常、言語学者として訓練された専門家により莫大な費用
をかけて手作業で生成される。談話構造ツリーの手作業での生成は高額であるた
め、それらの大部分は、一般に談話を研究するために使用される理論ツールとし
て存続している。しかしながら、自然言語文書の談話構造を著す談話構造ツリー
を廉価で生成する自動化されたアプローチであれば、談話理論を任意の文書の分
析に応用することが可能である。
【0005】 (発明の概要) 本発明は、テキストの本文の談話構造または他の自然言語表現を自動的に認識
することに関する。テキストの本文により表される談話構造は、多言語テキスト
要素の編成または「構造」、またはテキストの本文を構成する「命題」である。
テキストの本文の談話構造を認識することは、テキストの本文を著述する際の著
者の目的を容易に発見する助けとなり、このため、ある意味ではテキストの本文
の中心的な意味を見分ける助けとなる。
【0006】 入力テキストの談話構造を認識するために、本機能は、1つ以上の談話構造ツ
リーを生成する。本明細書中で記載するように、談話構造ツリーは、入力テキス
トの談話構造を表すデータ構造である。入力テキストは、一般に一連の節になる
と考案される。入力テキストについて該機能により生成される談話構造ツリーは
、厳密に言えば、これらの節の論理的表現である命題間の談話構造を特徴づける
一方、該機能は、正確な意味で命題となり得る節のいずれの的確な論理的表現を
基にするのではなく、節のコンテントに基づいて談話構造を生成する。したがっ
て、該機能による談話構造ツリーの生成は、入力テキストの節からの的確な論理
的命題の生成に依存しない。
【0007】 本発明によれば、該機能は、入力テキストとともに、入力テキストの的確な統
語的解析を実行することで作成されるデータを受け取る。このデータは、入力テ
キストの統語的構造を表す1つ以上の統語的解析グラフと、この意味論的情報を
含む統語的構造の正規化された観点を提供する、対応する論理形式と、を含むこ
とが好ましい。該機能は、入力テキストを節に分割するために論理形式を使用す
る。これらの節は、最終的には、入力テキストの談話構造を示す特定の構造にお
いて談話関係により互いに連結された談話構造ツリーに構成される。
【0008】 入力テキストにおいて節を識別した後、該機能は、これらの節をペアで考察す
る。単に隣接する節同士だけでなく各ペアの節同士の談話関係を仮説化するよう
試みることに留意することが重要である。節のペアごとに、該機能は、1組のキ
ューを使用して、ペアの節に適当に関連づけ得る談話関係を識別する。これらの
識別された関係を、ペアの節同士で「仮説化される」という。使用されるキュー
は、ペア同士で特定の関係が仮説化されるように、ペアの節により、またはペア
の節に対する論理形式または統語解析のコンテントにより満足されるべき条件の
レベルを1つ以上特定する。さらにキューは、キューの条件が満たされる場合に
ペア同士で仮説化された関係が正しいということの相対的尤度を示す数量的得点
をそれぞれ特定する。同一関係のいくつかのキューが同一の節のペアで満たされ
ると、これらのキューにより特定された得点が加点され、仮説化された関係の得
点が得られる。
【0009】 本機能は、各ペアの節同士での関係を仮説化した後、仮説化された関係を、そ
れぞれが所与の節のペア同士の仮説化された関係をすべて含む「袋」にグループ
分けする。仮説化された関係は、その得点が少なくなる順に各袋において整列さ
れる。袋自体は、最初に仮説化された関係の得点、すなわち袋において単一の最
高得点から少なくなる順に順次整列される。次に該機能は、節に対応する終端ノ
ードから、まず各袋における最初に仮説化された関係を通して、次に各袋におけ
る後続する仮説化された関係を通して反復するように、仮説化された関係を終端
ノードに適用しようとすることにより、ボトムアップ方式で1つ以上の談話構造
ツリーを構成していく。構成アルゴリズムは、適格にならないツリーのグループ
を考察から外すために、袋のトラバーサル(traversal)においてバックトラック 法を利用する。仮説化された関係が実際に2つのノードを組み合わせる度に、得
られた組み合わせは、ツリーに非終端ノードとして追加される。新たなノードは
、仮説化された関係の得点に、組み合わされたノードの得点(もしあれば)を加
算したものと等しい得点を有する。したがって、このように構成されるどのツリ
ーも、ツリーが入力テキストにとって正しいということの相対的尤度を反映する
、そのルートノードと関連づけられた得点を有する。
【0010】 このように構成された各ツリーは、2分岐ツリーであり、各非終端ノードには
ちょうど2つの子を有する。いくつかの点では、n分岐談話構造ツリーが二分岐
談話構造ツリーより便利であると考えられるため、該機能は、構成された2分岐
ツリーを「平坦に(flatten)」してn分岐ツリーを形成することが好ましい。
【0011】 さらに該機能は、このように構成されたツリーのいずれからでも、著者が目指
す主要な目的を反映した入力テキストのシノプシスを生成してもよい。このため
、該機能は、ツリーの幅優先の(breadth-first)トラバーサルをその主要部から 指定された深さまで行い、立ち寄ったノードがそれぞれ表す節のテキストをサマ
リーに連鎖する。
【0012】 次に、本発明の機能は、節のテキストを基にして、入力テキストの手作業で生
成された命題表現に依存することなく、節のテキストの統語的および意味論的特
徴をテストするロバストなキューを使用することで節間の談話関係を仮説化し、
仮説化された談話関係を応用して袋への分離(segregation)に基づく順序で、か つバックトラック法を利用して談話関係ツリーを生成し、2分岐談話構造ツリー
をn分岐談話構造ツリーになるよう平坦にし、さらに生成された談話構造ツリー
から入力テキストのシノプシスを生成することが好ましい。
【0013】 (発明の詳細な説明) 本発明は、テキストの本文の談話構造または他の自然言語表現を自動的に認識
することに関する。テキストの本文により表される談話構造は、多言語テキスト
要素の編成または「構造」、またはテキストの本文を構成する「命題」である。
テキストの本文の談話構造を認識することは、テキストの本文を著述する際の著
者の目的を容易に発見する助けとなり、このため、ある意味ではテキストの本文
の中心的な意味を識別する助けとなる。
【0014】 テキストの本文(「入力テキスト」)の談話構造を認識するために、本機能は
、1つ以上の談話構造ツリーを生成する。本明細書中で記載するように、談話構
造ツリーは、入力テキストの談話構造を表すデータ構造である。入力テキストは
、一般に一連の節になると考案される。入力テキストについて該機能により生成
される談話構造ツリーは、厳密に言えば、これらの節の論理的表現である命題間
の談話構造を特徴づける一方、該機能は、正確な意味での命題となり得る節のい
ずれの的確な論理的表現を基にするのではなく、節のコンテントに基づいて談話
構造を生成する。したがって、該機能による談話構造ツリーの生成は、入力テキ
ストの節からの的確な論理的命題の生成に依存しない。
【0015】 さらに詳細を後述するサンプル談話構造ツリーを図18に示す。談話構造ツリ
ーは、1本のツリーに構成された多数のノードを含む。各ノードは、連続的なセ
ット、すなわち節の「スパン」を表す、すなわち「カバーする」。各ノードは、
カバーする節の中から「突起(projection)」と称される最も重要なノードをさら
に識別する。談話構造ツリーの葉、すなわち「終端ノード」は、それぞれ単一節
に相当する。一方、談話構造ツリーの非終端ノードは、1つ以上の談話関係によ
り組み合わされる、すなわち「関連づけられる」多数節に相当する。「ルートノ
ード」と呼ばれる1つの非終端ノードは、節をすべてカバーし、その子孫の中の
終端ノードをすべて有する。
【0016】 多数の異なるタイプの談話関係は、節同士で(または、節のグループ間で)発
生し得る関係の種類を表すために使用される。これらの談話関係タイプは、非対
称的談話関係タイプと対称的談話関係タイプの2つのカテゴリに分けられる。非
対称的談話関係は、節を、入力テキストにおいて異なるレベルの重要性を有する
と著者がみなしていることを実証するように節を関連づける。このため、非対称
的談話関係により関連づけられる節は、(1)より重要な「核」節と、より重要
でない「衛星」節と、を含み、(2)突起のリストとしてその核である子の突起
のみを有する。一例として、以下の節AおよびBは、節Aを表すノードが核であ
り、節Bを表すノードが衛星である、衛星が核を詳述している2つの節を説明す
る「詳述(ELABORATION)」関係により関連づけられる。 A.双眼鏡により、遠くの風景を見ることが可能である。 B.それらはたとえば、対象の鳥を動揺させないために野鳥観察者により使用
される。 図18は、ノード1804を核とし、ノード1805を衛星とするノード181
2で表される非対称的対比(ASYMMETRIC CONTRAST)関係と
、ノード1803を核とし、ノード1812を衛星とするノード1814で表さ
れる詳述(ELABORATION)関係と、ノード1801を核とし、ノード
1811を衛星とするノード1815で表される詳述(ELABORATION
)関係と、の3つの非対称的関係の表現を示す。
【0017】 一方、対称的談話関係は、節を、入力テキストの中で同様の重要性を有すると
著者がみなしていることを実証するように節を関連づける。このように、対称的
談話関係を表すノードは、(1)子として核のみを有し、(2)突起のリストと
してその子の突起の結合体(union)を有する。一例として、以下の節CおよびD は、節CおよびDを表すノードがともに核である子である、節の整列した連続体
を説明する「連続(SEQUENCE)」関係により関連づけられる。 C.まず、卵白を攪拌しなさい。 D.次に、砂糖を加えなさい。 図18は、ノード1802と1814を核とするノード1811により表され
る対比(CONTRAST)関係という1つの対称的関係の表現を示す。形式的
には、有効、すなわち「適格」な談話構造ツリーは、(1)談話構造ツリーが入
力テキスト全体をカバーする「完全性(completeness)」、(2)談話構造ツリー
が入力テキストの節ごとに終端ノードを含む「連結性(connectedness)」、(3 )談話構造ツリーの各ノードが単一の親を有する「特異性(uniqueness)」、そし
て(4)隣接するスパンのみを一緒にグループ化することでより大きなスパンを
形成することができる−すなわち、談話構造ツリーの非終端ノードが連続的なス
パンのみをカバーしなければならない「隣接性(adjacency)」の4つの特性を表 す。
【0018】 本発明によれば、本機能は、入力テキストとともに、入力テキストの的確な統
語的解析を実行することにより作成されるデータを入力として受け取る。このデ
ータは、入力テキストの統語的構造を表す1つ以上の統語的解析グラフと、この
意味論的情報を含む統語的構造の正規化された観点を提供する、対応する論理形
式と、を含むことが好ましい。該機能は、入力テキストを節に分割するために論
理形式を使用する。これらの節は、最終的には、入力テキストの談話構造を示す
特定の構造において談話関係により互いに連結された談話構造ツリーに構成され
る。
【0019】 入力テキストにおいて節を識別した後、該機能は、これらの節をペアで考察す
る。単に隣接する節同士だけでなく各ペアの節同士の談話関係を仮説化しようと
試みることに留意することが重要である。節のペアごとに、該機能は、1組のキ
ューを使用して、ペアの節に適当に関連づけ得る談話関係を識別する。これらの
識別された関係を、ペアの節同士で「仮説化される」という。使用されるキュー
は、ペア同士で特定の関係が仮説化されるように、ペアの節により、またはペア
の節に対する論理形式または統語解析のコンテントにより満足されるべき条件の
レベルを1つ以上特定する。さらにキューは、キューの条件が満たされる場合に
ペア同士で仮説化された関係が正しいということの相対的尤度を示す数量的得点
をそれぞれ特定する。同一関係のいくつかのキューが同一の節のペアについて満
たされると、これらのキューにより特定された得点が加点され、仮説化された関
係の得点が得られる。
【0020】 本機能は、各ペアの節同士で関係を仮説化した後、仮説化された関係を、それ
ぞれが所与の節のペア同士の仮説化された関係をすべて含む「袋」にグループ分
けする。仮説化された関係は、得点が少なくなる順に各袋において整列される。
袋自体は、最初に仮説化された関係の得点、すなわち袋において単一の最高得点
から少なくなる順に順次整列される。次に該機能は、節に対応する終端ノードか
ら、まず各袋において最初に仮説化された関係を通して、次に各袋における後続
する仮説化された関係を通して反復するように、仮説化された関係を終端ノード
に適用しようとすることにより、ボトムアップ方式で1つ以上の談話構造ツリー
を構成していく。構成アルゴリズムは、適格にならないツリーのグループを考察
から外すために、袋のトラバーサル(traversal)においてバックトラック法を利 用する。仮説化された関係が実際に2つのノードを組み合わせるごとに、得られ
た組み合わせは、ツリーに非終端ノードとして追加される。新たなノードは、仮
説化された関係の得点に組み合わされるノードの得点(もしあれば)を加算した
ものと等しい得点を有する。したがって、このように構成されるどのツリーも、
ツリーが入力テキストにとって正しいものであるということの相対的尤度を反映
する、ヘッドノードと関連づけられた得点を有する。
【0021】 このように構成された各ツリーは、2分岐ツリーであり、各非終端ノードには
ちょうど2つの子を有する。いくつかの点では、n分岐談話構造ツリーが2分岐
談話構造ツリーより便利であると考えられるため、該機能は、構成された2分岐
ツリーを「平坦に(flatten)」してn分岐ツリーを形成することが好ましい。
【0022】 さらに該機能は、このように構成されたツリーのいずれから、著者が目指す主
要な目的を反映した入力テキストのシノプシスを生成してもよい。このため、該
機能は、ツリーの幅優先のトラバーサルをその主要部から指定された深さまで行
い、立ち寄ったノードがそれぞれ表す節のテキストをサマリーに連鎖する。
【0023】 図1は、本機能が実行することが好ましい汎用コンピュータシステムのハイレ
ベルブロック図である。コンピュータシステム100は、中央処理装置(CPU
)110と、入出力装置120と、コンピュータメモリ(メモリ)130と、を
含む。入出力装置の中には、ハードディスクドライブ等の記憶装置121と、C
D−ROM等のコンピュータ読み取り可能媒体に設けられた、本機能を含むソフ
トウェア製品をインストールするために使用され得るコンピュータ読み取り可能
媒体ドライブ122と、がある。メモリ130は、好ましくは、談話構造認識機
能(「機能」)131と、入力テキストが表現される自然言語に関する語彙的お
よび意味論的情報を含む語彙知識ベース132と、論理形式を含み、これに内在
する形態論的、統語的および意味論的情報を入力テキストから導出する解析装置
133と、入力テキスト内の節のペアを関連づけ得る談話関係を仮説化するため
に使用される談話関係仮説化データ構造134と、入力テキストの節同士で仮説
化された談話関係の集合を表し、かつ入力テキストの談話構造を表す談話構造ツ
リーを構成するために本機能により使用される仮説化された談話関係データ構造
135と、を含む。解析装置133および機能131は、ともに入力テキストの
形態論、統語論、意味論および談話構造を識別し得ることから、解析装置および
該機能は、包括的に、自然言語入力テキストの形態論、統語論、意味論および談
話構造を識別する自然言語処理システムとして知られる。該機能は、上述のよう
に構成されるコンピュータシステム上で実施されることが好ましいが、当業者で
あれば、異なる構成を有するコンピュータシステム上でも実施し得ることが理解
されよう。
【0024】 図2は、入力テキストについて談話構造ツリーを1つ以上生成し、かつ入力テ
キストのシノプシスを生成するために該機能により実行されるステップの概略を
示すハイレベルフロー図である。ステップ201において、該機能は、入力テキ
ストを解析し、解析ツリーおよび論理形式を作成する。自然言語入力テキストの
解析の詳細な説明については、「統計的処理を規則ベースの自然言語解析装置に
ブートストラップする方法およびシステム(METHOD AND SYSTEM FOR BOOTSTRAPPI
NG STATISTICAL PROCESSING INTO A RULE-BASED NATURAL LANGUAGE PARSER)」と
題する米国特許出願第08/265,845号を参照されたい。論理形式を自然
言語入力テキストから生成する詳細な説明については、「意味論論理形式を統語
ツリーから演算する方法およびシステム(METHOD AND SYSTEM FOR COMPUTING SEM
ANTIC LOGICAL FORMS FROM SYNTAX TREES)」と題する米国特許出願第08/67
4,610号を参照されたい。これらの2つの出願は、その全体を参照として本
明細書に組み込まれる。
【0025】 ステップ202において、本機能は、ステップ201において生成された論理
形式を使用して、入力テキスト内の節を識別する。ステップ203において、本
機能は、1組のキューを使用して、ステップ202において識別された節のペア
同士の可能な談話関係を仮説化する。ステップ204において、本機能は、ステ
ップ203において仮説化された関係を応用して、入力テキストについて1つ以
上の談話構造ツリーを構成する。談話構造ツリーごとに、その談話構造ツリーが
入力テキストの談話構造を正確にモデル化したということの相対的尤度を示す得
点が生成される。ステップ205において、本機能は、ステップ204において
構成された2分岐談話構造ツリーを「平坦」にして、これらをより一般的なn分
岐ツリーに変換する。ステップ206において、本機能は、最も重み付けされた
談話構造ツリーから、入力テキストの最重要の節を含むサンプル入力テキストの
シノプシスを生成する。ステップ206の後、これらのステップは終了する。
【0026】 本機能をより完全に説明するために、その動作を、単純な例を参照して以下詳
細に説明する。本例のサンプル入力テキストをテキストブロック1に示す。
【0027】
【表1】
【0028】 ステップ201によれば、本機能は、まずサンプル入力テキストの各文を解析
し、文ごとに解析ツリーと論理形式の両方を生成する。図3〜図10は、サンプ
ル入力テキストの4文の解析ツリーと論理形式を示す。
【0029】 図3は、サンプル入力テキストの第1文について作成された解析ツリーを示す
解析ツリー図である。解析ツリー300は、全体として文の統語的構造を特徴づ
ける。ヘッドノード301に付随される解析ツリーの分岐は、文の異なる成分を
説明する。名詞句分岐310は、名詞句「the aardwof」を説明する。助動詞句 分岐320は、動詞「is」を説明する。動詞分岐330は、動詞「classified」
を説明する。前置詞句分岐340は、前置詞句「as Proteles cristatus」を説 明する。最後に、句読点分岐350は、文を終了するピリオドを説明する。
【0030】 図4は、サンプル入力テキストの第1文について生成された論理形式グラフを
示す論理形式図である。論理形式400は、解析ツリーより抽象的に文の統語的
編成を説明する。論理形式は、比較的少数の統語論―意味論関係に基づき、これ
を介して動詞が文中の他の語により修飾され得る。これらの関係を識別するため
に使用されるラベルのいくつかを図1に示す。さらなるこのようなラベルは、米
国特許出願第08/674,610号に記載されている。
【0031】
【表2】 入力テキストを解析することにより生成される論理形式は、本機能により使用さ
れ、(1)入力テキストをどのように節に分けるかを決定し、(2)節同士の談
話関係を仮説化する際のキューの条件をテストする。
【0032】 図3と同様に、図5、図7および図9は、サンプル入力テキストのそれぞれ第
2、第3および第4文について生成される解析ツリーを示す解析ツリー図である
。 同様に、図6、図8および図10は、サンプル入力テキストのそれぞれ第2、第
3および第4文について本機能により生成された論理形式グラフを示す論理形式
図である。
【0033】 ステップ201にしたがって入力テキストの文を本機能が解析した後、本機能
は、ステップ202にしたがって、入力テキストにおいて発生する節を識別して
いく。本機能が節を識別するために使用する基準を表2に示す。当業者であれば
、以下の表2および表4に使用される言語学的術語に精通していよう。かかる術
語についてのさらなる説明については、Finegan, Edward,「言語:その構造と使
用(Language: Its Structure and Use)」Harcourt Brace Jovanovich, San Dieg
o, 1989およびFromkin, VictoriaとRobert Rodman,「言語入門(An Introduction
to Language)」Holt, Rinehart, and Winston, New York, 1988に読み進むとよ
い。
【0034】
【表3】 本機能は、生成された論理形式のノードを徹底的にトラバースし、表2に示す基
準を各論理形式ノードに適用する。基準をすべて満たす論理形式ノードごとに、
本機能は、別個の節を識別する。
【0035】 本例のサンプル入力テキストを処理中に、本機能は、表2に示す基準を図4、
図6、図8、および図10に示す論理形式に適用し、サンプル入力テキストを表
3に示す節に分ける。
【0036】
【表4】 それぞれサンプル入力テキストの第1、第2、第3文について図4、図6および
図8に示す論理形式において、ヘッドノードのみが表2に示す節識別基準をすべ
て満たす。このため、最初の3文は、それぞれ単一節のみで構成されると識別さ
れる。図10に示すサンプル入力テキストの第4文についての論理形式の場合、
節識別基準は、ヘッドノード「have1」と内部ノードである「have2」ノードの両
方により満たされる。したがって、本機能は、第4文を節4と節5の2つの節に
分ける。
【0037】 本機能は、ステップ202にしたがって、入力テキストにおいて発生する節を
識別した後、ステップ203にしたがって、識別された節同士の談話関係を仮説
化していく。図11は、入力テキストにおいて識別される節同士の談話関係を仮
説化するために本機能が実行することが好ましいステップを示すフロー図である
。ハイレベルにおいて、節同士の談話関係を仮説化するために、これらのステッ
プは、節のペアごとに各キューと対応づけられる条件を評価して、その節のペア
のキューと対応づけられる関係を仮説化するか否かを決定する。談話関係は方向
性であるため、所与の節のペアについて、本機能は、キューの条件を適用して、
一旦前方向に関係の仮説化を考察し、再び後方向に関係の仮説化を考察する。こ
れは、単に整列されていない節のペアのみを通したループではなく、整列された
節のペアすべてを通したループとしてフロー図に示される。
【0038】 ステップ1101〜1107において、本機能は、識別された節の整列された
各ペアを通してループを形成する。識別された節の整列されたペアごとに、ステ
ップ1102〜1110において、本機能は、異なる談話関係タイプのそれぞれ
を通してループを形成する。それぞれ異なる談話関係タイプごとに、ステップ1
103〜1109において、本機能は、現行の談話関係タイプに与えられた談話
関係キューを通してループを形成する。表4は、本機能により使用されることが
好ましい談話関係キューの一覧である。各キューは、整列されたペアの節同士の
特定の談話関係を陳述する個別のベースである。キューには、キューが節のペア
に首尾よく適用され得る場合に仮説化される関係を識別する関係名称がある。さ
らに各キューには、キューを参照するために使用されるキュー番号がある。さら
に各キューには、キューに基づいて識別された関係を仮説化するために、それぞ
れが「節1」および「節2」と識別される節により満たされるべき整列された条件
の集合がある。第1の条件がテストされ、第2の条件をテストする前に満たされ
なければならないという点で、条件が整列される。同様に、キューの追加条件ご
とに、その順でこれに先行する条件は、次の条件が評価される前に評価されて満
たされなければならない。最後に、各キューは、識別された関係が、整列された
条件の集合を満たすとしたときに整列されたペアの2つの節を正しく関連づける
相対的尤度を示す得点を有する。
【0039】
【表5】 ここで挙げたキューのセットは、本機能が以下のタイプ、すなわち、非対称的対
比、原因、状況、譲歩、条件、対比、詳述、連結、列挙、目的および結果、の談
話関係を識別できるようにすることが、表4からわかる。なお、本機能の動作は
、この一覧にキューを追加または削除することにより簡単に適応され得ることに
留意すべきである。追加関係タイプを仮説化するためにこのように追加されたキ
ューは、本機能が入力テキスト内で仮説化および識別が可能な関係タイプのセッ
トを拡張するよう作用し得る。
【0040】 現行の関係を仮説化する各キューにおいて、ステップ1104において、本機
能は、現行のキューと対応づけられた条件の整列されたセットを順次評価する。
ステップ1105において、その条件のセットが満たされれば、本機能はステッ
プ1106に続行するか、そうでなればステップ1109に続行する。ステップ
1106において、現行の関係がすでに仮説化されている、すなわち、関係が仮
説化された関係の一覧上にあれば、本機能はステップ1108に続行し、そうで
なればステップ1107に続行する。ステップ1107において、本機能は該関
係を仮説化された関係の一覧に追加する。ステップ1107の後、本機能はステ
ップ1108に続行する。ステップ1108において、本機能は現行のキューの
得点を現行の関係の合計得点に加点する。ステップ1108の後、本機能はステ
ップ1109に続行する。ステップ1109において、本機能はステップ110
3にループバックして現行の関係について次のキューを処理する。すべてのキュ
ーを処理した後、本機能はステップ1110に続行する。ステップ1110にお
いて、本機能はステップ1102にループバックして現行の節の整列されたペア
について次の関係タイプを処理する。すべての関係タイプを処理した後、本機能
はステップ1111に続行する。ステップ1111において、本機能はステップ
1101にループバックして次の節の整列されたペアを処理する。すべての節の
整列されたペアを処理した後、これらのステップは終了する。
【0041】 図11に示すステップを表3に示す例の節に適用する際、本機能は、表5に示
す談話関係を仮説化する。各仮説化された関係ごとに、表5は、仮説化された関
係の関係タイプ、関係が仮説化される節の整列されたペア、その条件セットが満
たされたキュー、およびその条件セットが満たされたキューの得点を合計するこ
とによって得られる各仮説化された関係の合計得点を示す。
【0042】
【表6】
【0043】 本機能が、ステップ203にしたがって、識別された節同士の関係を仮説化し
た後、本機能は、ステップ204にしたがって、仮説化された関係を適用してサ
ンプル入力テキストの1つ以上の談話構造ツリーを構築していく。図12は、サ
ンプル入力テキストについて談話構造ツリーを生成するために本機能により実行
されることが好ましいステップを示すフロー図である。ステップ1201〜12
05において、本機能は、仮説化された関係を「袋」に分離してこれらを適用の
ために編成する。分離後、各袋は、片側方向においてある特定の節のペアを関連
づける仮説化された関係をすべて含む。このため、袋は、1つ以上の仮説化され
た関係により関連づけられた節の「整列されない」ペアごとに作成される。さら
に、各袋の仮説化された関係は、その得点の少なくなる順に並べ替えられ、袋自
体は、その最高得点から少なくなる順に並べ替えられる。この分離プロセスは、
いくつかの点で、仮説化された関係の適用を効率化する。第一に、ある特定の命
題のペアに関する仮説化された関係を単一の袋に分離することで、本機能は簡単
に、仮説化された関係を適用して形成される各談話構造ツリーが、任意の命題の
ペアを関連づけるノードを1つだけ含むように確実にできる。第二に、袋および
袋の中の仮説化された関係をその得点にしたがって並べ替え、仮説化された関係
をその順序で適用することで、本機能は、正確性の尤度が少なくなる順に談話構
造ツリーを作成することが可能である。このように、本機能は、最も正しいと思
われるツリーを素早く生成することが可能である。
【0044】 ステップ1201〜1205において、本機能は、仮説化された各関係を通し
てループを形成する。仮説化された各関係について、ステップ1202において
、関係が仮説化される節の整列されていないペアの袋が存在する場合、本機能は
、ステップ1204に続き、そうでなければ、本機能はステップ1203に続行
する。ステップ1203において、本機能は、関係が仮説化される節の整列され
ていないペアの袋を作成する。ステップ1203の後、本機能は、ステップ12
04に続行する。ステップ1204において、本機能は、関係が仮説化される節
の整列されないペアの袋に現行の仮説化された関係を追加する。ステップ120
5において、本機能は、ステップ1201にループバックして次の仮説化された
関係を処理する。仮説化された関係がすべて処理された後、本機能は、ステップ
1206に続行する。ステップ1206において、本機能は、各袋の仮説化され
た関係をその得点が少なくなる順に並べ替える。ステップ1207において、本
機能は、各袋の最初に仮説化された関係の得点が少なくなる順、すなわち、各袋
の仮説化された関係の中で最も高い得点から少なくなる順に袋を並べ替える。本
例の並べ替えられた袋を表6に示す。たとえば、仮説化された関係2および3を
含む袋5は、節1および3のものである。袋5の仮説化された関係は、仮説化さ
れた関係2の得点25から仮説化された関係3の得点20に減ずることがわかる
。さらに、袋の最大得点は、袋1の仮説化された関係4の得点35から袋5の仮
説化された関係2の得点25に減ずることがわかる。
【0045】
【表7】
【0046】 ステップ1208において、本機能は、空の談話構造ツリーを作成する。ステ
ップ1209において、本機能は、この空のツリーに入力テキストの各節の終端
ノードを追加する。これらの終端ノードは、入力テキスト用に生成された各ツリ
ーごとにベースを形成する。
【0047】 図13は、終端ノードのツリーへの追加を示す談話構造ツリー図である。この
ような追加の後、ツリー1300は終端ノード1301〜1305を含む。各ノ
ードの第1のテキストラインは、ノードによりカバーされる節のセットを識別す
る。定義による終端ノードはそれぞれ、単一の節のみをカバーする。たとえば、
終端ノード1301は、節1のみをカバーする。さらに各ノードは、そのカバー
された節の中から、カバーされた節「から突出した」すなわちその中で最も重要
な節を示している。ここでも各終端ノードは、1つだけの節を突起させる。たと
えば、終端ノード1301は、その唯一カバーされる節である節1を突出させる
【0048】 ステップ1210において、本機能は、入力テキストにとって所望の数の談話
構造ツリーを構築するように、構築ツリー(ConstructTree)とい
う名称の再帰的サブルーチンを呼び出す。本機能が再帰的呼出から戻ってくると
、所望の数のツリーが構築されており、このステップは終了する。構築ツリー再
帰的サブルーチンの擬似コード定義をコードブロック1に示す。ハイレベルにお
いて、完了まで走行することが認められれば、構築ツリーは、仮説化された談話
関係と互換性のある可能で的確な談話構造ツリーをすべて作成する。しかしなが
ら、実際に実施されるように、研究者は、通常10または20である所望の数の
ツリーを特定する。構築ツリーは次に、規定された数のツリーまたはすべての可
能なツリーのいずれかで数の小さい方を作成する。本アルゴリズムはよりよいツ
リーを最初に生成するため、通常、談話分析者が妥当と考える分析がなされる前
に多数のツリーを作成する必要はない。
【0049】 構築ツリーの再帰的バックトラックの性質は、多数の不適格なツリーの構築を
防ぐ。たとえば、R2をR1の後に適用した結果、無効なツリーが得られた場合の
5つの仮説R1…R5の虚集合を考察する。これらの5つの仮説の置換をすべてテ
ストし、次いでツリーのみを検証して{R12345}または{R123 54}を適用する等により、形成されたそのツリーが無効であったことを発見す
ることで仮説を立てようとするのではなく、構築ツリーは、R1、次いでR2を適
用する。不適格なサブツリーが結果生じたことがすぐにわかるため、これら最初
の2つのステップの後に続くいずれのツリーも構成しなくてすむ。したがって、
合計6つのツリーを作成しなくてもよいため、効率の面で相当の利得がもたらさ
れる結果となる。
【0050】 構築ツリーにより作成されたツリーは、一覧に保存される。各ツリーのルート
ノードのValue属性を用いてツリーを評価し得る−これは、ツリーを構築す
るために使用される関係の発見的得点を加点することによってValue属性が
求められるため、関係を高得点の発見的得点とともに使用して構築されるツリー
は、関係を低得点の発見的得点とともに使用して構築されるツリーより値が大き
くなる。理想的には、構築ツリーは、低ランクのツリーに先だって作成される高
ランクのツリーを作成すべきである。残念ながら、構築ツリーは、時には順序か
らはずれてツリーを生成することがある。この変則的な状況を修正するためには
、構築ツリーにより作成されたツリーのリストを各ツリーのルートノードにVa
lue属性にしたがって並べ替えることで、談話分析者によりテキストに好まし
い分析であると判断されたツリーが最上位ランクツリーとして生じるとともに、
並べ替えられたリストの最上位付近に、正しいと思われる代替的な分析が生じる
ことも確実にする。
【0051】
【表8】
【0052】 仮説化された関係を適用してツリーを生成する際、本機能は、袋1で開始し、
最初に仮説化された関係である関係4を適用しようとする。この関係は、節2と
3の間の「対比」関係を特定する。本機能は、ツリーの現行のノードであるTR
EENODESから、突起が節2を含むノードと突起が節3を含むノードを探索
する。本機能は、これらの2つのノードを見つける。本機能は、該ノードをTR
EENODESから削除し、これらを組み合わせて節2と3をカバーする新たな
ノードを形成し、この新たなノードを再びTREENODESに追加する。この
時点で、TREENODESは、図14に示す要素を含む。
【0053】 本機能は次に、他の袋、すなわち、袋2,3,4,5を置換する。第1の置換
において、最初の袋は袋2である。本機能は、節3を核とし節4を衛星とする「
詳述」関係を特定する、袋2における最初に仮説化された関係である仮説5を適
用しようとする。本機能は、TREENODESの中から、その突起が節3を含
むノードとその突起が節4を含むノードを探索する。これらの突起を有するノー
ドはTREENODESにおいて見出される。突起が節3を含むノード、すなわ
ち袋1において第1の仮説の適用から得られる「対比」ノードも突起に節2を含
む。本機能は、仮説化された関係の元のリスト「ORIGINALHYPOTH
S」が、節2を核とし節4を衛星とする「詳述」関係を含む場合にのみ、このノ
ードの衛星として節4を付随し得る。かかる関係は一切仮説化されなかったため
、ORIGINALHYPOTHSにおいて生じない。したがって、本機能は、
このノードの衛星として節4を付随させることができない。
【0054】 袋2が仮説化された関係をさらに多く含んでいれば、本機能は、この段階でこ
れらを考察する方向に動く。袋2は単一の関係を含んでいるにすぎないため、本
機能は、現行の袋の処理を完了した後、袋3に移る。
【0055】 袋3において最初に仮説化された関係である関係6は、節4を核とし節5を衛
星とする「非対称的対比」関係を特定する。本機能は、その突起がこれら2つの
節を含むノードを見つけ、図15に示すように、節4および5をカバーする新た
なノードを作成する。
【0056】 本機能は次に、他の袋、すなわち、袋2、4、5を置換する。第1の置換にお
いて、最初の袋は袋2である。上述したように、袋2は、適用され得ない単一の
仮説化された関係を、その関係により特定される突起の存在にもかかわらず含む
。したがって、本機能は、袋4に進み、関係1を適用する。関係1は、節1を核
とし節2を衛星とする「詳述」関係を特定する。不可欠な突起を有するノードが
見つけられる。節2は、他の突起を有するノード、すなわち節3において生じる
。ORIGINALHYPOTHSは、節1を核とし節3を衛星とする「詳述」
関係を含むため、本機能は、図16に示すように、節1乃至3をカバーする新た
なノードを構築する。
【0057】 本機能は、次に、他の袋、すなわち、袋2および5を置換する。第1の置換に
おいて、最初の袋は袋2である。TREENODESにおいて、本機能は、袋2
における仮説化された関係が特に節3および4をカバーする2つの突起を見つけ
ることができない。したがって、本機能は、袋2をさらなる考察から除くことに
よって、以下の探索空間におけるすべてのノードを現行の置換から外す。この特
定の例において、袋2は、単一の仮説を含み、袋2を除いたことで袋が1つだけ
、すなわち袋5が残った。しかしながら、このように探索空間を外すことは、効
率面で実質的な利得をもたらされることが多い。本機能の実行を測定すると、探
索空間を外したことで、ある袋から次のものに移るループの通過がほぼ三分の一
減少したことが示される。
【0058】 本機能は、次に袋5を考察することに移る。袋2と同様に、本機能は、袋5に
おける仮説化された関係により特定される両方の突起を見つけることができない
。したがって、本機能は、袋5をさらなる考察から除く。袋はもう残っていない
ため、本機能は、図15のツリーの状態に戻り、処理を続行する。最終的に、T
REENODESは、図17に示す2つのノードを含む。
【0059】 本機能は、仮説化された関係1を袋4から適用しようとする。この関係は、節
1を主要とし節2を衛星とする「詳述」関係を特定する。節1および節2は、と
もにTREENODESにおけるノードの突起において利用可能である。節2は
、その突起が節3も含むノードの突起として生じる。ORIGINALHYPO
THSも節1を核とし節3を衛星とする「詳述」関係を含むことから、本機能は
、節1と、節2乃至5をカバーする「対比」ノードを連結する。ここで、TRE
ENODEは、図18に示すように、節1乃至5をカバーする単一ノードを含む
。このノードは、サンプル入力テキストを著す談話構造ツリーの主要部である。
【0060】 本機能によりステップ204において構築ツリーサブルーチンを用いて生成さ
れる談話構造ツリーは、各非終端ノードが2つの子を有する2分岐ツリーである
。対称的関係を表す非終端ノードにおいて、これら2つの子は、いずれも核であ
る。一方、非対称的関係を表す非終端ノードの場合、2つの子の一方はより重要
な核であるが、他方はより重要でない衛星である。
【0061】 これらの2分岐談話構造ツリーは、これらが生成される入力テキストの談話構
造の完全表現を構成するが、談話構造ツリーの使用者の中には、談話構造ツリー
をn分岐ツリーとして呈される方を好むものもいる。n分岐談話構造ツリーにお
いて、非終端ノードは、子の数が制限されなくてもよい。対称的関係を表す非終
端ノードは、任意の数の核の子を有しても良い。同様に、非対称的関係を表す非
終端ノードは、1つの核の子を有し、衛星の子は任意の数でよい。
【0062】 図19は、2分岐談話構造ツリーをn分岐談話構造ツリーに変換するために本
機能により実行されることが好ましいステップを示すフロー図である。ステップ
1901〜1907において、本機能は、2分岐談話構造ツリーにおける各終端
ノードを通して、談話構造ツリーのボトムアップトラバーサルでループを形成す
る。非終端ノードそれぞれについて、非終端ノードが親を有する場合、本機能は
、ステップ1903において続行され、そうでなければ本機能は、ステップ19
07に続行する。ステップ1903において、非終端ノードが対称的関係を表す
場合、本機能はステップ1904に続き、そうでなければ非終端ノードは非対称
的関係を表し、本機能はステップ1905に続行する。現行の非終端ノードが対
称的関係を表すステップ1904において、現行の非終端ノードの親が現行の非
終端ノードと同一の関係タイプを表す場合、本機能はステップ1906に続いて
現行の非終端ノードをその親ノードと合併し、そうでなければ、本機能はステッ
プ1907に続行する。現行の非終端ノードが非対称的関係を表すステップ19
05において、親ノードがいずれかの非対称的関係を表す場合、本機能はステッ
プ1906に続き、現行の非終端ノードをその親ノードと合併し、そうでなけれ
ば、本機能はステップ1907に続行する。ステップ1906において非終端ノ
ードを親に合併した後、本機能は、ステップ1907に続行する。ステップ19
07において、本機能は、ステップ1901にループバックして談話構造ツリー
の次の非終端ノードを処理する。談話構造ツリーの非終端ノードをすべて処理し
た後、2分岐ツリーがn分岐ツリーに変換された後、これらのステップは終了す
る。
【0063】 図20および図21は、2分岐談話構造ツリーのn分岐談話構造ツリーへの変
換とを示す。図20は、サンプル2分岐談話構造ツリーを示す談話構造ツリー図
である。2分岐談話構造ツリー2000は、終端ノード2001〜2007を含
む。非終端ノード2011は、ノード2003をその核としノード2004を衛
星とする「結果」関係を表す。非終端ノード2012は、ノード2011をその
核としノード2005を衛星とする「手段」関係を表す。非終端ノード2013
は、ノード2012をその核としノード2002を衛星とする「詳述」関係を表
す。非終端ノード2014は、ノード2013をその核としノード2001を衛
星とする「状況」関係を表す。ノード2015は、ノード2014および200
6を核として有する「連続」関係を表す。最後に、非終端ノード2016は、ノ
ード2015および2007を核として有する「連続」関係を表す。非終端ノー
ドがそれぞれちょうど2つの子を有するため、この談話構造ツリーが2分岐談話
構造ツリーであることが、図20からわかる。
【0064】 図21は、図19に示すステップを使用して、図20に示す2分岐談話構造ツ
リーから、本機能により構成されるn分岐談話構造ツリーを示す談話構造ツリー
図である。談話構造ツリー2100では、図20に示す非終端ノード2011〜
2013がノード2014に結合されてノード2114を形成していることが、
図21において明らかである。したがって、非終端ノード2014は、ノード2
103を核としノード2104を衛星とする「結果」関係を表し、ノード210
3をその核としノード2105を衛星とする「手段」関係を表し、ノード210
3をその核としノード2102を衛星とする「詳述」関係を表し、ノード210
3をその核としノード2101を衛星とする「状況」関係を表す。さらに、図2
0に示す非終端ノード2015は、ノード2016に結合されて非終端ノード2
016を形成する。このように、非終端ノード2116は、ノード2114、2
106および2107を核として有する「連続」関係を表す。したがって、本機
能は、いずれの2分岐談話構造ツリーも同等のn分岐談話構造ツリーに変換する
ことが可能である。
【0065】 本機能が、ステップ205にしたがって2分岐談話構造ツリーを同等のn分岐
談話構造ツリーに変換した後、本機能は、ステップ206にしたがって最高得点
の談話構造ツリーからシノプシスを生成していく。図22は、本機能により生成
される最高得点の談話構造ツリーに基づき入力テキストのシノプシスを生成する
ために、本機能により実行されることが好ましいステップを示すフロー図である
。これらのステップは、「カットオフ深さ」と呼ばれる整数値を用いて、シノプ
シスに含まれる詳細のレベルを決定する。カットオフ深さが浅いほど、シノプシ
スに含まれる詳細情報が少ない。ステップ2201〜2205において、本機能
は、深さ優先の(depth-first)トラバーサルの順に最高得点の談話構造ツリーに おける各ノードを通してループを形成する。各ノードについて、ノードが、カッ
トオフ深さが少なくとも談話構造ツリーの浅さ程度であれば、本機能は、ステッ
プ2203に続き、そうでなければ、本機能はステップ2205に続行する。各
ノードの深さは、そのノードを談話構造ツリーの主要部から切り離した衛星弧の
数と定義される。ステップ2203において、現行のノードが談話構造ツリーに
おける終端ノードであれば、本機能は、ステップ2204に続き、そうでなけれ
ば本機能はステップ2203に続行する。ステップ2204において、本機能は
、現行のノードにより表される節のテキストをシノプシスに連鎖する。ステップ
2205において、本機能は、ステップ2201にループバックして深さ優先の
トラバーサルで次のノードを処理する。すべてのノードを処理した後、シノプシ
スは完了し、これらのステップは終了する。
【0066】 上述したように、生成されたシノプシスに含まれる詳細のレベルは、ユーザに
より構成可能であることが好ましいカットオフ深さの選択により制御される。表
7は、可能なカットオフ深さそれぞれについてサンプル入力テキスト用に生成さ
れるシノプシスを示す。カットオフ深さが浅い状態で生成されたシノプシスほど
入力テキストをより簡潔に要約する一方、カットオフ深さが深い状態のシノプシ
スほど入力テキストについての詳細のさらなるレベルを含むことが、表7からわ
かる。
【0067】
【表9】
【0068】 例示の実施形態を参照して本発明を図示して説明してきたが、発明の範囲から
逸脱することなく、形態または詳細の面で各種の変更または変形をし得ることが
、当業者により理解されよう。たとえば、本機能を使用することで、終端ノード
のテキストが本明細書中で記載した節より大きいかまたは小さい場合に、サンプ
ル入力テキスト内で談話構造を決定し得る。また、本機能を使用することで、発
話および視覚的身振り等のテキスト以外の自然言語表現、または指示のリスト等
の非テキスト形式において語彙知識ベースに表現された「書記」自然言語の形式
において談話構造も決定し得る。さらに、本機能を直接適応することで、予めコ
ンパイルされた語彙知識ベースから得られた統語的および意味論的情報等、解析
装置以外の情報源から得られた入力テキストについての統語的および意味論的情
報を使用し得る。
【図面の簡単な説明】
【図1】 本機能が実行することが好ましい汎用コンピュータシステムのハイレベルブロ
ック図である。
【図2】 入力テキストについて談話構造ツリーを1つ以上生成し、かつ入力テキストの
シノプシスを生成するために本機能により実行されるステップの概略を示すハイ
レベルフロー図である。
【図3】 サンプル入力テキストの第1文について作成された解析ツリーを示す解析ツリ
ー図である。
【図4】 サンプル入力テキストの第1文について生成された論理形式グラフを示す論理
形式図である。
【図5】 サンプル入力テキストの第2文について生成された解析ツリーを示す解析ツリ
ー図である。
【図6】 サンプル入力テキストの第2文について本機能により生成された論理形式グラ
フを示す論理形式図である。
【図7】 サンプル入力テキストの第3文について生成された解析ツリーを示す解析ツリ
ー図である。
【図8】 サンプル入力テキストの第3文について本機能により生成された論理形式グラ
フを示す論理形式図である。
【図9】 サンプル入力テキストの第4文について生成された解析ツリーを示す解析ツリ
ー図である。
【図10】 サンプル入力テキストの第4文について本機能により生成された論理形式グラ
フを示す論理形式図である。
【図11】 入力テキストにおいて識別される節同士の談話関係を仮説化するために本機能
が実行することが好ましいステップを示すフロー図である。
【図12】 入力テキストについて談話構造ツリーを生成するために本機能が実行すること
が好ましいステップを示すフロー図である。
【図13】 終端ノードのツリーへの追加を示す談話構造ツリー図である。
【図14】 節2乃至節3をカバーする新たなノードの追加を示す談話構造ツリー図である
【図15】 節4および節5をカバーする新たなノードの追加を示す談話構造ツリー図であ
る。
【図16】 節1乃至節3をカバーする新たなノードの追加を示す談話構造ツリー図である
【図17】 図16に示すツリーから図15に示すツリーまで本機能がバックトラックする
、さらに節3乃至節5をカバーする新たなノードの追加を示す談話構造ツリー図
である。
【図18】 本機能により生成される第1の完全談話構造ツリーを示す談話構造ツリー図で
ある。
【図19】 2分岐談話構造ツリーをn分岐談話構造ツリーに変換するために本機能が実行
することが好ましいステップを示すフロー図である。
【図20】 サンプル2分岐談話構造ツリーを示す談話構造ツリー図である。
【図21】 図20に示すステップを使用して、図21に示す2分岐談話構造ツリーから、
本機能により構成されるn分岐談話構造ツリーを示す談話構造ツリー図である。
【図22】 本機能により生成される最高得点の談話構造ツリーに基づき入力テキストのシ
ノプシスを生成するために、本機能が実行することが好ましいステップを示すフ
ロー図である。
【手続補正書】
【提出日】平成12年4月21日(2000.4.21)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【請求項23】 入力テキストにおいて生じる複数の節の少なくとも1つの
ペアについてそれぞれ仮説化される談話関係のセットを表す仮説化された談話関
係データ構造を含むコンピュータメモリであって、前記データ構造が、前記入力
テキストについて談話構造ツリーを1つ以上生成し、かつ 異なるペアの節同士で仮説化される談話関係のリストをそれぞれ含む複数の袋
であって、前記リストは、各談話関係が、これが仮説化されるペアの節を正確に
関連づける相対的尤度にしたがって整列され、前記袋は、前記袋が含むリストに
おいて前記談話関係の最大尤度が少なくなる順に整列することで、前記仮説化さ
れた談話関係を前記袋のリストのトラバーサルにしたがって適用することによっ
て、前記入力テキストの談話構造を特徴づける談話構造ツリーが生成され得る、
複数の袋、を備える、コンピュータメモリ。
【手続補正書】
【提出日】平成13年1月10日(2001.1.10)
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】図1
【補正方法】変更
【補正内容】
【図1】
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図2
【補正方法】変更
【補正内容】
【図2】
【手続補正3】
【補正対象書類名】図面
【補正対象項目名】図11
【補正方法】変更
【補正内容】
【図11】
【手続補正4】
【補正対象書類名】図面
【補正対象項目名】図12
【補正方法】変更
【補正内容】
【図12】
【手続補正5】
【補正対象書類名】図面
【補正対象項目名】図19
【補正方法】変更
【補正内容】
【図19】
【手続補正6】
【補正対象書類名】図面
【補正対象項目名】図22
【補正方法】変更
【補正内容】
【図22】
───────────────────────────────────────────────────── フロントページの続き (72)発明者 デ・カンポス,ミゲル・カルドソ アメリカ合衆国ワシントン州98144,シア トル,サーティース・アベニュー・サウス 531,ナンバー 2 Fターム(参考) 5B091 AA15 CA02 CA05 CA12 CA14 【要約の続き】

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータシステムにおいて、談話構造ツリーが節からな
    るテキストの本文の談話構造を正確に特徴づける尤度を反映する談話構造ツリー
    の数量的得点を決定する方法であって、前記談話構造ツリーは、終端ノードと非
    終端ノードとをともに含む、節を表すノードを備え、前記非終端ノードが、その
    ちょうど1つがいずれのノードの子でもないルートノードである、2つ以上の子
    ノードの間の談話関係をそれぞれ識別し、 非終端ノードそれぞれについて、 前記談話関係が、現行のノードの子ノードにより表される節同士で正確に認
    識されている尤度を反映する、現行のノードにより表される談話関係の数量的得
    点を求めるステップと、 任意の非終端の子ノードの得点を、現行のノードにより表される談話関係の
    得点と結合するステップと、 該結合した得点を前記現行ノードの属性とし、かつ前記ルートノードの得点
    を前記談話構造ツリーの属性とするステップと、 を含む、方法。
  2. 【請求項2】 前記結合ステップは、任意の非終端の子ノードの得点を、現
    行のノードで表される談話関係の得点と合計するステップを含む、請求項1記載
    の方法。
  3. 【請求項3】 テキストの本文の談話構造を特徴づける複数の談話構造ツリ
    ーのそれぞれについて上記ステップを繰り返して、得点を、前記複数の談話構造
    ツリーのそれぞれの属性とするステップと、 最高得点を属性とする談話構造ツリーを好ましい談話構造ツリーとして選択す
    るステップと、 をさらに含む、請求項1記載の方法。
  4. 【請求項4】 コンピュータシステムに、自然言語表現の談話構造を特徴づ
    ける自然言語表現の談話構造ツリーを、該自然言語表現と対応づけられる統語的
    情報を利用して生成させ、これを、 複数の節を前記自然言語表現から選択するステップと、 節のペアそれぞれについて、複数の可能な談話関係のうち、前記節のペアに対
    する前記自然言語表現の統語的構造に基づいて前記節のペア同士でどれを仮説化
    するかを決定するステップと、 前記仮説化された関係を前記節に適用して、前記自然言語表現の談話構造を特
    徴づける談話構造ツリーを作成するステップと、 を実行することにより行わせるコンテンツをもつ、コンピュータ読み取り可能媒
    体。
  5. 【請求項5】 さらに前記コンピュータ読み取り可能媒体のコンテンツによ
    り、前記コンピュータシステムに、前記自然言語表現をテキストの本文として受
    け取るステップを実行させる、請求項4記載のコンピュータ読み取り可能媒体。
  6. 【請求項6】 さらに前記コンピュータ読み取り可能媒体のコンテンツによ
    り、前記コンピュータシステムに、前記自然言語表現を発話の本文として受け取
    るステップを実行させる、請求項4記載のコンピュータ読み取り可能媒体。
  7. 【請求項7】 さらに前記コンピュータ読み取り可能媒体のコンテンツによ
    り、前記コンピュータシステムに、前記自然言語表現を視覚的身振りの本文とし
    て受け取るステップを実行させる、請求項4記載のコンピュータ読み取り可能媒
    体。
  8. 【請求項8】 前記決定ステップは、選択されたペアの節同士の談話関係を
    、前記選択されたペアの節において生じる語に対する語彙的知識ベースから作成
    される情報に基づいて仮説化するよう決定する、請求項4記載のコンピュータ読
    み取り可能媒体。
  9. 【請求項9】 さらに前記コンピュータ読み取り可能媒体のコンテンツによ
    り、前記コンピュータシステムに、前記方法により利用される統語的情報を含む
    統語的解析結果を前記自然言語表現から生成するステップを実行させる、請求項
    4記載のコンピュータ読み取り可能媒体。
  10. 【請求項10】 さらに前記コンピュータ読み取り可能媒体のコンテンツに
    より、前記コンピュータシステムに、前記方法により利用される統語的情報の少
    なくとも一部を含む論理形式を前記自然言語表現から生成するステップを実行さ
    せる、請求項4記載のコンピュータ読み取り可能媒体。
  11. 【請求項11】 前記自然言語表現と対応づけられる意味論的情報をさらに
    利用し、かつ前記決定ステップは、区別されたペアの節同士の談話関係を、前記
    選択されたペアの節に対する前記意味論的情報に基づいて仮説化するよう決定す
    る、請求項4記載のコンピュータ読み取り可能媒体。
  12. 【請求項12】 前記作成されたツリーは、前記自然言語表現において識別
    される節を表す節ノードと、前記節に適用される関係を表す関係ノードとを含む
    、該ツリーの深さをそれぞれ有するノードからなり、かつ、さらに前記コンピュ
    ータ読み取り可能媒体のコンテンツにより、前記コンピュータシステムに、その
    節ノードが所定のカットオフ深さよりも深いツリーの深さを有する節を前記自然
    言語表現から削除することによって、前記自然言語表現のサマリーを生成するス
    テップを実行させる、請求項4記載のコンピュータ読み取り可能媒体。
  13. 【請求項13】 ペアの節同士の談話関係を仮説化する際に使用される談話
    関係仮説化データ構造を含むコンピュータメモリであって、前記データ構造は、
    複数の関係それぞれについて、1つ以上の項目のリストを備え、該項目の各々が
    、 前記ペアの節に関する言語学的情報に適用する表示された順を有する条件リス
    トと、 前記関係が前記条件リストが満たされたときに前記ペアの節を正確に関連づけ
    る相対的尤度を反映する数量的得点であって、前記ペアの節について、前記関係
    の1つ以上について、前記項目のそれぞれについて、前記条件リストを前記ペア
    の節に関する言語学的情報に適用できるように、かつ前記条件リストが満たされ
    た場合、前記数量的得点を、前記関係が前記ペアの節を正確に関連づける相対的
    尤度の全数量的得点に結合できるようにする、数量的得点と、 を含む、コンピュータメモリ。
  14. 【請求項14】 前記談話関係仮説化データ構造の前記条件リストは、前記
    ペアの節に関する統語的情報にそれぞれ適用する、請求項13記載のコンピュー
    タメモリ。
  15. 【請求項15】 前記談話関係仮説化データ構造の前記条件リストは、前記
    ペアの節に関する意味論的情報にそれぞれ適用する、請求項13記載のコンピュ
    ータメモリ。
  16. 【請求項16】 前記談話関係の前記条件リストは、前記ペアの節に関する
    統語的および意味論的情報にそれぞれ適用する、請求項13記載のコンピュータ
    メモリ。
  17. 【請求項17】 前記談話関係仮説化データ構造の前記条件リストは、前記
    ペアの節の中の語に関する語彙的知識ベースから利用可能な情報にそれぞれ適用
    する、請求項13記載のコンピュータメモリ。
  18. 【請求項18】 自然言語テキストの本文において生じる2つの節同士の起
    こり得る談話関係を1つ以上認識する装置であって、複数の可能な関係のそれぞ
    れについて、 複数の可能な関係のそれぞれについて、前記2つの節に対するテキストの本文
    の統語的構造にそれぞれ関する1つ以上の条件のセットを保存するメモリと、 複数の可能な関係のそれぞれについて、前記可能な関係を、前記条件のセット
    の少なくとも1つのうちの各条件が、前記ペアの節に対するテキストの本文の統
    語的構造により満たされるとき、前記2つの節同士の起こりうる関係として認識
    する起こり得る関係の認識サブシステムと、 を備える、装置。
  19. 【請求項19】 前記メモリは、前記2つの節に対するテキストの本文の統
    語的または意味論的構造に関する条件を保存する、請求項18記載の装置。
  20. 【請求項20】 前記メモリは、満足されるように決定される条件の整列し
    たセットのそれぞれについて、現行の可能な談話関係が、前記満足された条件の
    整列したセットを満たしたことに基づいて前記節同士で正確に認識されている尤
    度を表す前記満足された条件の整列したセットと対応づけられる数量的得点をさ
    らに保存し、前記装置は、満足されるように決定される条件の整列したセットの
    それぞれについて、得られた数量的得点を現行の可能な談話関係の合計得点に加
    算することで、前記装置の動作後に、起こり得る関係として認識される各関係が
    、前記関係を満足させる条件のあらゆるセットの観点で、前記節同士で前記関係
    が正確に認識されていた相対尤度を表す合計得点を有するようにする得点サブシ
    ステムを含む、請求項18記載の装置。
JP2000517355A 1997-10-20 1998-10-15 テキストの本文の談話構造の自動認識 Expired - Fee Related JP4625178B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/954,566 1997-10-20
US08/954,566 US6112168A (en) 1997-10-20 1997-10-20 Automatically recognizing the discourse structure of a body of text
PCT/US1998/021770 WO1999021105A1 (en) 1997-10-20 1998-10-15 Automatically recognizing the discourse structure of a body of text

Publications (2)

Publication Number Publication Date
JP2001523019A true JP2001523019A (ja) 2001-11-20
JP4625178B2 JP4625178B2 (ja) 2011-02-02

Family

ID=25495626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000517355A Expired - Fee Related JP4625178B2 (ja) 1997-10-20 1998-10-15 テキストの本文の談話構造の自動認識

Country Status (6)

Country Link
US (1) US6112168A (ja)
EP (1) EP1023676A1 (ja)
JP (1) JP4625178B2 (ja)
CN (1) CN1127030C (ja)
CA (1) CA2305875A1 (ja)
WO (1) WO1999021105A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4940139B2 (ja) * 2004-08-20 2012-05-30 マルチモーダル・テクノロジーズ・インク 音声からの意味内容の自動抽出および構造化文書の生成
JP2017027111A (ja) * 2015-07-15 2017-02-02 日本電信電話株式会社 接続表現項構造解析装置、方法、及びプログラム
US9892734B2 (en) 2006-06-22 2018-02-13 Mmodal Ip Llc Automatic decision support
JP2020537224A (ja) * 2017-09-28 2020-12-17 オラクル・インターナショナル・コーポレイション 名前付きエンティティの構文解析および識別に基づくクロスドキュメントの修辞的つながりの判断
JP2021512444A (ja) * 2018-01-30 2021-05-13 オラクル・インターナショナル・コーポレイション コミュニケーション用談話ツリーを用いる、説明の要求の検出
US11556698B2 (en) 2019-10-22 2023-01-17 Oracle International Corporation Augmenting textual explanations with complete discourse trees
US11580298B2 (en) 2019-11-14 2023-02-14 Oracle International Corporation Detecting hypocrisy in text
US11782985B2 (en) 2018-05-09 2023-10-10 Oracle International Corporation Constructing imaginary discourse trees to improve answering convergent questions
US11809825B2 (en) 2017-09-28 2023-11-07 Oracle International Corporation Management of a focused information sharing dialogue based on discourse trees

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3781561B2 (ja) * 1998-08-13 2006-05-31 日本電気株式会社 自然言語解析装置、システム及び記録媒体
US6243670B1 (en) * 1998-09-02 2001-06-05 Nippon Telegraph And Telephone Corporation Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames
US6415283B1 (en) * 1998-10-13 2002-07-02 Orack Corporation Methods and apparatus for determining focal points of clusters in a tree structure
US6405190B1 (en) * 1999-03-16 2002-06-11 Oracle Corporation Free format query processing in an information search and retrieval system
US6609087B1 (en) * 1999-04-28 2003-08-19 Genuity Inc. Fact recognition system
US7509572B1 (en) * 1999-07-16 2009-03-24 Oracle International Corporation Automatic generation of document summaries through use of structured text
US6834280B2 (en) * 2000-02-07 2004-12-21 Josiah Lee Auspitz Systems and methods for determining semiotic similarity between queries and database entries
US20020046018A1 (en) * 2000-05-11 2002-04-18 Daniel Marcu Discourse parsing and summarization
US20020042707A1 (en) * 2000-06-19 2002-04-11 Gang Zhao Grammar-packaged parsing
US7013259B1 (en) * 2000-06-30 2006-03-14 Fuji Xerox Co., Ltd. System and method for teaching writing using microanalysis of text
US7219332B2 (en) * 2000-07-07 2007-05-15 Microsoft Corporation Configuring software components(merge) with transformation component using configurable and non-configurable data elements
US6961692B1 (en) * 2000-08-01 2005-11-01 Fuji Xerox Co, Ltd. System and method for writing analysis using the linguistic discourse model
US7069207B2 (en) * 2001-01-26 2006-06-27 Microsoft Corporation Linguistically intelligent text compression
US7409335B1 (en) * 2001-06-29 2008-08-05 Microsoft Corporation Inferring informational goals and preferred level of detail of answers based on application being employed by the user
US7519529B1 (en) * 2001-06-29 2009-04-14 Microsoft Corporation System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service
US7295966B2 (en) * 2002-01-14 2007-11-13 Microsoft Corporation System for normalizing a discourse representation structure and normalized data structure
US7177799B2 (en) * 2002-01-14 2007-02-13 Microsoft Corporation Semantic analysis system for interpreting linguistic structures output by a natural language linguistic analysis system
US7305336B2 (en) * 2002-08-30 2007-12-04 Fuji Xerox Co., Ltd. System and method for summarization combining natural language generation with structural analysis
JP4038717B2 (ja) * 2002-09-13 2008-01-30 富士ゼロックス株式会社 テキスト文比較装置
JP2004110161A (ja) * 2002-09-13 2004-04-08 Fuji Xerox Co Ltd テキスト文比較装置
US20040133579A1 (en) * 2003-01-06 2004-07-08 Richard Gordon Campbell Language neutral syntactic representation of text
US6980949B2 (en) * 2003-03-14 2005-12-27 Sonum Technologies, Inc. Natural language processor
US20040243531A1 (en) * 2003-04-28 2004-12-02 Dean Michael Anthony Methods and systems for representing, using and displaying time-varying information on the Semantic Web
US20050033750A1 (en) * 2003-08-06 2005-02-10 Sbc Knowledge Ventures, L.P. Rhetorical content management system and methods
US7296027B2 (en) 2003-08-06 2007-11-13 Sbc Knowledge Ventures, L.P. Rhetorical content management with tone and audience profiles
US7593845B2 (en) * 2003-10-06 2009-09-22 Microsoflt Corporation Method and apparatus for identifying semantic structures from text
US7596485B2 (en) * 2004-06-30 2009-09-29 Microsoft Corporation Module for creating a language neutral syntax representation using a language particular syntax tree
US7702500B2 (en) * 2004-11-24 2010-04-20 Blaedow Karen R Method and apparatus for determining the meaning of natural language
US7421651B2 (en) * 2004-12-30 2008-09-02 Google Inc. Document segmentation based on visual gaps
US8280719B2 (en) * 2005-05-05 2012-10-02 Ramp, Inc. Methods and systems relating to information extraction
US20060256937A1 (en) * 2005-05-12 2006-11-16 Foreman Paul E System and method for conversation analysis
RU2005124030A (ru) * 2005-07-28 2007-02-10 Александр Михайлович Юров (RU) Способ визуальной адресации команд в дереве
US20070067155A1 (en) * 2005-09-20 2007-03-22 Sonum Technologies, Inc. Surface structure generation
US8131536B2 (en) * 2007-01-12 2012-03-06 Raytheon Bbn Technologies Corp. Extraction-empowered machine translation
US7890539B2 (en) * 2007-10-10 2011-02-15 Raytheon Bbn Technologies Corp. Semantic matching using predicate-argument structure
US8959102B2 (en) 2010-10-08 2015-02-17 Mmodal Ip Llc Structured searching of dynamic structured document corpuses
US8504492B2 (en) 2011-01-10 2013-08-06 Accenture Global Services Limited Identification of attributes and values using multiple classifiers
US8620836B2 (en) * 2011-01-10 2013-12-31 Accenture Global Services Limited Preprocessing of text
US8924394B2 (en) 2011-02-18 2014-12-30 Mmodal Ip Llc Computer-assisted abstraction for reporting of quality measures
EP2915068A4 (en) * 2012-11-02 2016-08-03 Fido Labs Inc METHOD AND SYSTEM FOR NATURAL LANGUAGE PROCESSING
US9495357B1 (en) * 2013-05-02 2016-11-15 Athena Ann Smyros Text extraction
US9471561B2 (en) * 2013-12-26 2016-10-18 International Business Machines Corporation Adaptive parser-centric text normalization
US10394950B2 (en) * 2016-08-22 2019-08-27 International Business Machines Corporation Generation of a grammatically diverse test set for deep question answering systems
US10133724B2 (en) * 2016-08-22 2018-11-20 International Business Machines Corporation Syntactic classification of natural language sentences with respect to a targeted element
US11373632B2 (en) 2017-05-10 2022-06-28 Oracle International Corporation Using communicative discourse trees to create a virtual persuasive dialogue
US10817670B2 (en) * 2017-05-10 2020-10-27 Oracle International Corporation Enabling chatbots by validating argumentation
US10679011B2 (en) 2017-05-10 2020-06-09 Oracle International Corporation Enabling chatbots by detecting and supporting argumentation
US10599885B2 (en) 2017-05-10 2020-03-24 Oracle International Corporation Utilizing discourse structure of noisy user-generated content for chatbot learning
US10839154B2 (en) * 2017-05-10 2020-11-17 Oracle International Corporation Enabling chatbots by detecting and supporting affective argumentation
US11386274B2 (en) 2017-05-10 2022-07-12 Oracle International Corporation Using communicative discourse trees to detect distributed incompetence
JP7086993B2 (ja) * 2017-05-10 2022-06-20 オラクル・インターナショナル・コーポレイション コミュニケーション用談話ツリーの使用による修辞学的分析の可能化
US11615145B2 (en) 2017-05-10 2023-03-28 Oracle International Corporation Converting a document into a chatbot-accessible form via the use of communicative discourse trees
US11586827B2 (en) 2017-05-10 2023-02-21 Oracle International Corporation Generating desired discourse structure from an arbitrary text
US11960844B2 (en) * 2017-05-10 2024-04-16 Oracle International Corporation Discourse parsing using semantic and syntactic relations
US11100144B2 (en) 2017-06-15 2021-08-24 Oracle International Corporation Data loss prevention system for cloud security based on document discourse analysis
US10839161B2 (en) 2017-06-15 2020-11-17 Oracle International Corporation Tree kernel learning for text classification into classes of intent
US11138195B2 (en) * 2017-08-31 2021-10-05 Salesforce.Com, Inc. Systems and methods for translating n-ary trees to binary query trees for query execution by a relational database management system
US11182412B2 (en) * 2017-09-27 2021-11-23 Oracle International Corporation Search indexing using discourse trees
US10796099B2 (en) 2017-09-28 2020-10-06 Oracle International Corporation Enabling autonomous agents to discriminate between questions and requests
CN111656453A (zh) * 2017-12-25 2020-09-11 皇家飞利浦有限公司 用于信息提取的层次实体识别和语义建模框架
US11537645B2 (en) 2018-01-30 2022-12-27 Oracle International Corporation Building dialogue structure by using communicative discourse trees
US10956670B2 (en) 2018-03-03 2021-03-23 Samurai Labs Sp. Z O.O. System and method for detecting undesirable and potentially harmful online behavior
US11455494B2 (en) 2018-05-30 2022-09-27 Oracle International Corporation Automated building of expanded datasets for training of autonomous agents
US10467344B1 (en) 2018-08-02 2019-11-05 Sas Institute Inc. Human language analyzer for detecting clauses, clause types, and clause relationships
US11449682B2 (en) 2019-08-29 2022-09-20 Oracle International Corporation Adjusting chatbot conversation to user personality and mood
US11775772B2 (en) * 2019-12-05 2023-10-03 Oracle International Corporation Chatbot providing a defeating reply
US11494560B1 (en) * 2020-01-30 2022-11-08 Act, Inc. System and methodology for computer-facilitated development of reading comprehension test items through passage mapping
US11822892B2 (en) * 2020-12-16 2023-11-21 International Business Machines Corporation Automated natural language splitting for generation of knowledge graphs

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system
US5377103A (en) * 1992-05-15 1994-12-27 International Business Machines Corporation Constrained natural language interface for a computer that employs a browse function
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
US5642520A (en) * 1993-12-07 1997-06-24 Nippon Telegraph And Telephone Corporation Method and apparatus for recognizing topic structure of language data
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US5694523A (en) * 1995-05-31 1997-12-02 Oracle Corporation Content processing system for discourse
EP0768610B1 (en) * 1995-10-13 2000-08-09 STMicroelectronics S.r.l. Low-voltage, very-low-power neural network

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4940139B2 (ja) * 2004-08-20 2012-05-30 マルチモーダル・テクノロジーズ・インク 音声からの意味内容の自動抽出および構造化文書の生成
US9892734B2 (en) 2006-06-22 2018-02-13 Mmodal Ip Llc Automatic decision support
JP2017027111A (ja) * 2015-07-15 2017-02-02 日本電信電話株式会社 接続表現項構造解析装置、方法、及びプログラム
US11797773B2 (en) 2017-09-28 2023-10-24 Oracle International Corporation Navigating electronic documents using domain discourse trees
JP2020537224A (ja) * 2017-09-28 2020-12-17 オラクル・インターナショナル・コーポレイション 名前付きエンティティの構文解析および識別に基づくクロスドキュメントの修辞的つながりの判断
JP7187545B2 (ja) 2017-09-28 2022-12-12 オラクル・インターナショナル・コーポレイション 名前付きエンティティの構文解析および識別に基づくクロスドキュメントの修辞的つながりの判断
US11809825B2 (en) 2017-09-28 2023-11-07 Oracle International Corporation Management of a focused information sharing dialogue based on discourse trees
JP2021512444A (ja) * 2018-01-30 2021-05-13 オラクル・インターナショナル・コーポレイション コミュニケーション用談話ツリーを用いる、説明の要求の検出
JP7447019B2 (ja) 2018-01-30 2024-03-11 オラクル・インターナショナル・コーポレイション コミュニケーション用談話ツリーを用いる、説明の要求の検出
US11694040B2 (en) 2018-01-30 2023-07-04 Oracle International Corporation Using communicative discourse trees to detect a request for an explanation
US11782985B2 (en) 2018-05-09 2023-10-10 Oracle International Corporation Constructing imaginary discourse trees to improve answering convergent questions
US11556698B2 (en) 2019-10-22 2023-01-17 Oracle International Corporation Augmenting textual explanations with complete discourse trees
US11580298B2 (en) 2019-11-14 2023-02-14 Oracle International Corporation Detecting hypocrisy in text
US11880652B2 (en) 2019-11-14 2024-01-23 Oracle International Corporation Detecting hypocrisy in text

Also Published As

Publication number Publication date
JP4625178B2 (ja) 2011-02-02
EP1023676A1 (en) 2000-08-02
WO1999021105A1 (en) 1999-04-29
CN1281564A (zh) 2001-01-24
CA2305875A1 (en) 1999-04-29
WO1999021105A9 (en) 1999-07-08
US6112168A (en) 2000-08-29
CN1127030C (zh) 2003-11-05

Similar Documents

Publication Publication Date Title
JP4625178B2 (ja) テキストの本文の談話構造の自動認識
US9069750B2 (en) Method and system for semantic searching of natural language texts
US9098489B2 (en) Method and system for semantic searching
KR100515641B1 (ko) 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법
US9047275B2 (en) Methods and systems for alignment of parallel text corpora
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
US20060095250A1 (en) Parser for natural language processing
Adler et al. An unsupervised morpheme-based HMM for Hebrew morphological disambiguation
KR102013230B1 (ko) 구문 전처리 기반의 구문 분석 장치 및 그 방법
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JP2011118689A (ja) 検索方法及びシステム
CN111104803B (zh) 语义理解处理方法、装置、设备及可读存储介质
JP3765799B2 (ja) 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム
JP4278090B2 (ja) 単語の使用を訂正または改善させる装置および方法、コンピュータプログラム、並びに格納媒体
Doush et al. Improving post-processing optical character recognition documents with Arabic language using spelling error detection and correction
Don Processing natural Malay texts: A data-driven approach
JP2002503849A (ja) 漢字文における単語区分方法
Litkowski Question Answering Using XML-Tagged Documents.
Ariaratnam et al. A shallow parser for Tamil
WO1999021104A1 (en) Automatically recognizing the discourse structure of a body of text
Varshini et al. A recognizer and parser for basic sentences in telugu using cyk algorithm
Huyck A practical system for human-like parsing
WO1999021106A1 (en) Automatically recognizing the discourse structure of a body of text
Loftsson Tagging and parsing Icelandic text
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050831

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050831

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050831

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070904

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071005

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071023

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20080123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080123

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20100517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101105

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350