JP2005122743A5

JP2005122743A5 -

Info

Publication number: JP2005122743A5
Application number: JP2004299833A
Authority: JP
Filing date: 2004-10-14
Publication date: 2007-11-29
Anticipated expiration: 2024-10-14

Description

ハイブリッドテキスト要約を決定する方法、システム、及び、制御プログラム、談話構文解析方法、システム、及び、該システムにおける方法、談話構成要素にテキストを分割する方法及びシステム、談話の構造表現を決定する方法及びシステム、ハイブリッドテキスト要約システム

本発明はテキスト情報の要約を決定することに関する。詳細には、ハイブリッドテキスト要約を決定する方法、システム、及び、制御プログラム、談話構文解析方法、システム、及び、該システムにおける方法、談話構成要素にテキストを分割する方法及びシステム、談話の構造表現を決定する方法及びシステム、ハイブリッドテキスト要約システムに関する。

企業、政府政策者、情報分析者、他の研究者及び知識労働者は増え続ける大量の情報を検討し、理解することに直面している。最も関連性のある情報に基づき要約を作成することにより情報量の削減を試みた研究者もいた。関連性の基準は、多くの場合、キーワード及び／又は用語頻度、並びに情報リポジトリ内の文書の集合についての文書逆頻度統計等の非構造特徴に基づいている。しかしながら、これらの従来の非構造テキスト要約は頻繁に解体され、読むのが困難である。さらに、非構造テキスト要約のために選択される要素は統計学上の重要度の基準に基づいている。したがって、順次選択されたテキスト要約要素の代名詞は、これらの従来の要約の有用性を削減する省かれた先行する参考文献を参照することがある。

構造に基づいた要約からあまり重要ではない情報を選択的に削除することによりテキスト要約の質の改善を試みた他の研究者もいた。これらの従来の構造に基づいたテキスト要約システムでは、テキストの構造表現が決定される。あまり重要ではない情報は、テキスト要約に含まれる所望される従属のレベルを選択することにより構造表現から取り除かれる。これらの従来の構造テキスト要約は対象情報を含むことによって文法性を失わないようにする。しかしながら、結果として生じるテキスト要約は多くの場合、前記対象を解決するために必要とされる以上の情報を含んでいる。

例えば、特許文献１、２及び非特許文献１は、本願に関連する技術について記載している。詳細には、特許文献１は、コンピュータ解析支援を用いた読解技能向上システムについて記載し、特許文献２は、ワード・プロセッサのための文書要約に関する技術について記載している。
米国特許出願公開第２００４／００６７４７２Ａ１号明細書米国特許第６、３４９、３１６Ｂ２号明細書Ｅ．ホヴィ(E. Hovy)、「談話構造関係を用いた自動談話生成(Automated Discourse Generation Using Discourse Structure Relations)」、人工知能(Artificial Intelligence)、アムステルダム、１９９３年、巻６３、頁３４１〜３８５

ハイブリッドテキスト要約を決定する上で構造情報及び非構造情報の組み合わせを可能にするシステム及び方法が有用となるであろう。本発明のシステム及び方法による多様な例示的な実施形態は、文法的なハイブリッドテキスト要約を決定する際の構造情報及び非構造情報の組み合わせを可能にする。テキストは談話構成要素を決定するために談話分析の理論の分割規則に基づいて分割される。決定された談話構成要素は、談話分析の理論の結合規則に基づいて談話の構造表現に結合される。関連性スコアは、統計、キーワード、知識ベース、又は任意の既知の又は今後開発される、関連性を決定する非構造方法に基づいて決定される。関連性スコアは談話の構造表現中の構造的に関連する談話構成要素ノードに浸透されている。選択可能及び／又は調整可能な重要度スコアは、談話の構造表現から談話構成要素のサブツリーを選択するために使用される。浸透方法及び／又は関連性スコアに対する調整は、談話構成要素の前記サブツリーの圧縮を調整し、ハイブリッドテキスト要約を形成するために使用される。テキストを基本的な談話構成要素に分割し、談話構成要素を談話分析の理論に基づいて分類するシステム及び方法が提供される。各種の決定された談話構成要素を談話の構造表現に結合させるシステム及び方法も提供される。

本発明の第１の態様のハイブリッドテキスト要約を決定する方法は、テキストの談話構成要素を決定するステップと、テキストの談話の構造表現を決定するステップと、統計、キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて談話構成要素の関連性スコアを決定するステップと、談話の構造表現に基づいて関連性スコアを浸透するステップと、閾値重要性スコアと比較した関連性スコアにより、談話構成要素に基づいてハイブリッドテキスト要約を決定するステップと、を有する。

本発明の第２の態様は、第１の態様のハイブリッドテキスト要約を決定する方法であって、前記談話分析の理論が、言語談話モデル、統一言語談話モデル、修辞構造理論、談話構造理論及び構造化談話表現理論の少なくとも一つである。

本発明の第３の態様は、第１の態様のハイブリッドテキスト要約を決定する方法であって、前記関連性スコアを浸透するステップが、子の談話構成要素ノードがより関連性のある場合に、構造表現中の子の談話構成要素ノードごとに、子の談話構成要素ノードの関連性スコアを親の談話構成要素ノードに割り当てるステップと、被従属談話構成要素がより関連性がある場合に、任意の従属ノードについて、従属談話構成要素に被従属談話構成要素の関連性スコアを割り当てるステップと、任意の等位ノードについて、最も関連性のある子の関連性スコアを他の子の談話構成要素ノードに割り当てるステップと、を有する。

本発明の第４の態様は、第１の態様のハイブリッドテキスト要約を決定する方法であって、前記関連性スコアを浸透するステップが、子の談話構成要素ノードが親より関連性がある場合に、構造表現中の子の談話構成要素ノードごとに、親の談話構成要素ノードに子の談話構成要素ノードの関連性スコアを割り当てるステップと、等位にされた談話構成要素ノードごとに、等位にされた談話構成要素ノードの関連性スコアをそれぞれの先行より関連性がない同位のノードに割り当てるステップと、等位にされた談話構成要素ノードではなく、被従属談話構成要素ノードではない子の談話構成要素ノードごとに、親の談話構成要素が子より関連性がある場合に、親の談話構成要素ノードの関連性スコアを子の談話構成要素ノードに割り当てるステップと、等位にされた談話構成要素ノードごとに、等位にされた談話ノード及びすべての同位が親のノードより関連性がない場合に、親の談話構成要素ノードの関連性スコアを等位にされた談話構成要素ノードに割り当てるステップと、被従属談話構成要素が従属ノードより関連性がある場合に、被従属談話構成要素ノードごとに、被従属談話構成要素ノードの関連性スコアを従属談話構成要素に割り当てるステップと、ノードごとに、その関連性スコアが別のノードの関連性スコアに変更されるノードが見つからなくなるまで前記ステップを繰り返すステップと、を有する。

本発明の第５の態様は、ハイブリッドテキスト要約を決定する方法であって、テキストの談話構成要素を決定するステップと、テキストの談話の構造表現を決定するステップと、談話構成要素の関連性スコアを決定するステップと、談話の構造表現に基づいて関連性スコアを浸透するステップと、閾値重要性スコアに比較した関連性スコアにより談話構成要素に基づいてハイブリッドテキスト要約を決定するステップと、を有し、前記関連性スコアを浸透するステップは、談話構成要素リーフノードごとに、被従属エッジに１を加えた数を決定するステップと、被従属エッジ＋１の逆数に基づいてスコアを決定するステップと、スコアの関連性がより少ない場合に、談話構成要素ノードごとに、子の談話構成要素ノードのスコアを親の談話構成要素ノードに割り当てるステップと、被従属談話構成要素スコアがより低い場合に、任意の従属談話構成要素ノードについて、被従属談話構成要素ノードのスコアを従属談話構成要素ノードに割り当てるステップと、任意の等位構造談話構成要素ノードの関連性スコアを、より低い場合に、子の談話構成要素の等位のそれぞれに割り当てるステップと、スコア及び従属レベルに基づいて、調整された関連性スコアを決定するステップと、を有する。

本発明の第６の態様は、第１の態様のハイブリッドテキスト要約を決定する方法であって、照応を含むあらゆるリーフ談話構成要素を決定するステップと、照応ごとに、照応のユニークな先行する対象を決定するステップと、照応について、リーフ談話構成要素にユニークな先行する対象を代入するステップと、閾値重要性スコアよりさらに関連性のある関連性スコアにより、談話構成要素の集合からユニークな先行する対象を含む談話構成要素を削除するステップと、をさらに有する。

本発明の第７の態様は、第１の態様のハイブリッドテキスト要約を決定する方法であって、関連性スコアを浸透するステップが、重要談話構成要素ノードを決定するステップと、未解決照応を決定するステップと、照応を解決する可能性のある潜在的な先行する対象を含む潜在的な解決する談話構成要素を決定するステップと、潜在的な解決する談話構成要素の縮小された範囲を通して、重要談話構成要素の関連性スコアを浸透するステップと、関連性スコアに基づいて、談話構成要素の縮小された範囲を決定するステップと、を有する。

本発明の第８の態様は、ハイブリッドテキスト要約を決定するシステムであって、テキストを取り出す入力／出力回路と、テキストの談話構成要素を決定し、談話の構造表現に談話構成要素を結合するプロセッサと、キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて、談話構成要素の関連性スコアを決定する関連性スコア決定回路と、談話の構造表現に基づいて、談話構成要素関連性スコアを浸透する浸透回路と、を備え、前記プロセッサが、閾値重要性スコアを超える関連性スコアにより談話構成要素に基づいて、ハイブリッドテキスト要約を決定する。

本発明の第９の態様は、第８の態様のハイブリッドテキスト要約を決定するシステムであって、前記談話分析の理論が、言語談話モデル、統一言語談話モデル、修辞構造理論、談話構造理論及び構造化談話表現理論の少なくとも一つである。

本発明の第１０の態様は、第８の態様のハイブリッドテキスト要約を決定するシステムであって、前記浸透回路が、子の談話構成要素ノードがより関連性がある場合に、構造表現中の子の談話構成要素ノードごとに、子の談話構成要素ノードの関連性スコアを親の談話構成要素ノードに割り当て、前記浸透回路が、被従属談話構成要素がより関連性がある場合に、任意の従属ノードについて、従属談話構成要素に被従属談話構成要素の関連性スコアを割り当て、前記浸透回路が、任意の等位ノードについて、最も関連性のある子の関連性スコアを他の子の談話構成要素ノードに割り当てる。

本発明の第１１の態様は、第８の態様のハイブリッド要約を決定するシステムであって、前記浸透回路が、子の談話構成要素ノードが親より関連性がある場合に、構造表現中の子の談話構成要素ごとに、子の談話構成要素ノードの関連性スコアを親の談話構成要素ノードに割り当て、前記浸透回路が、等位にされた談話構成要素ノードごとに、それぞれの先行より関連性がない同位のノードに、等位にされた談話構成要素ノードの関連性スコアを割り当て、前記浸透回路が、等位にされた談話構成要素ノードではなく、被従属談話構成要素ノードではない子の談話構成要素ノードごとに、親の談話構成要素が子より関連性がある場合に、子の談話構成要素ノードに親の談話構成要素ノードの関連性スコアを割り当て、前記浸透回路が、等位にされた談話ノード及びすべての同位が親のノードより関連性が少ない場合に、等位にされた談話構成要素ノードごとに、親の談話構成要素ノードの関連性スコアを等位にされた談話構成要素ノードに割り当て、前記浸透回路が、被従属談話構成要素が従属ノードより関連性がある場合に、被従属談話構成要素ノードごとに、被従属談話構成要素ノードの関連性スコアを従属談話構成要素に割り当て、前記浸透回路が、関連性スコアが別のノードの関連性スコアに変更されるノードを見つけられなくなるまで、ノードごとに、前記ステップを繰り返す。

本発明の第１２の態様は、ハイブリッドテキスト要約を決定するシステムであって、テキストを取り出す入力／出力回路と、テキストの談話構成要素を決定し、談話構成要素を談話の構造表現の中に結合するプロセッサと、少なくとも一つの関連性の非構造基準に基づいて、談話構成要素の関連性スコアを決定する関連性スコア決定回路と、談話の構造表現に基づいて、談話構成要素関連性スコアを浸透する浸透回路と、を有し、前記浸透回路が、談話構成要素リーフノードごとに、被従属エッジに１を加えた数の逆数に基づいて、被従属エッジに１を加えた数及びスコアを決定し、前記浸透回路が、スコアの関連性がより少ない場合に、談話構成要素ノードごとに、子の談話構成要素ノードのスコアを親の談話構成要素に割り当て、前記浸透回路が、被従属談話構成要素スコアがより低い場合に、任意の従属談話構成要素ノードについて、被従属談話構成要素ノードのスコアを従属談話構成要素ノードに割り当て、前記浸透回路が、より低い場合に、等位の子の談話構成要素のそれぞれに任意の等位談話構成要素ノードのスコアを割り当て、前記プロセッサが、スコア及び従属レベルに基づき調整された関連性スコアを決定し、ハイブリッドテキスト要約が閾値重要性スコアを超える関連性スコアにより談話構成要素に基づいて決定される。

本発明の第１３の態様は、第８の態様のハイブリッド要約を決定するシステムであって、前記プロセッサが、照応を含むあらゆるリーフ談話構成要素を決定し、前記プロセッサが、照応ごとに、照応の任意のユニークな先行する対象を決定し、前記プロセッサが、ユニークな先行する対象を、照応対象の先行する談話構成要素に代入し、前記プロセッサが、閾値重要性スコアを超える関連性スコアにより談話構成要素からユニークな対象を含む先行する談話を削除する。

本発明の第１４の態様は、第８の態様のハイブリッド要約を決定するシステムであって、前記浸透回路が、照応を含むあらゆるリーフ談話構成要素を決定し、前記浸透回路が、照応ごとに、照応の任意のユニークな先行する対象を決定し、前記浸透回路が、ユニークな先行する対象を照応のリーフ談話構成要素に代入し、前記浸透回路が、より関連性のある関連性スコアにより談話構成要素の集合からユニークな先行する対象を含む談話構成要素を削除する。

本発明の第１５の態様は、第８の態様のハイブリッド要約を決定するシステムであって、前記プロセッサが、関連性の非構造基準に基づいて重要談話構成要素ノードを決定し、重要談話構成要素の中の未解決対象を決定し、対象を解決する可能性がある潜在的な解決する談話構成要素を決定し、潜在的な解決する談話構成要素の縮小された範囲を通して重要談話構成要素の関連性スコアを浸透し、関連性スコアに基づいて談話構成要素の縮小された範囲を決定する。

本発明の第１６の態様は、ハイブリッドテキスト要約を決定するためにコンピュータをプログラミングするために使用可能な制御プログラムであって、テキストの談話構成要素を決定する命令と、テキストの談話の構造表現を決定する命令と、キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて、談話構成要素の関連性スコアを決定する命令と、談話の構造表現に基づいて関連性スコアを浸透する命令と、閾値重要性スコアと比較した関連性スコアにより談話構成要素に基づいて、ハイブリッドテキスト要約を決定する命令と、を有する。

本発明の第１７の態様は、談話構成要素にテキストを分割する方法であって、談話分析の理論を決定するステップと、候補セグメントを決定するステップと、談話を続行することに関連付けられる候補セグメントの品詞（ｐａｒｔ−ｏｆ−ｓｐｅｅｃｈ）タグ、蓋然性構文解析ツール、統計構文解析ツール、有限状態構文解析ツール、記号構文解析ツール、語彙目録及びＷｏｒｄＮｅｔ関係の少なくとも一つに基づいて決定される属性を決定するステップと、を有する。

本発明の第１８の態様は、構造表現を決定する方法であって、テキストの談話構成要素を決定するステップと、談話構成要素の談話分析分類の理論、及び統語的な制限、意味論的な制限及び語彙的−意味論的な制限の少なくとも一つに基づいて談話の構造表現に談話構成要素を結合するステップと、を有する。

本発明の第１９の態様は、ハイブリッドテキスト要約システムであって、テキストの談話構成要素を決定する手段と、テキストの談話の構造表現を決定する手段と、キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて談話構成要素の関連性スコアを決定する手段と、談話の構造表現に基づいて関連性スコアを浸透する手段と、閾値重要性スコアと比較した関連性スコアにより談話構成要素に基づいてハイブリッドテキスト要約を決定する手段と、を有する。

本発明の第２０の態様は、ハイブリッドテキスト要約システムであって、テキストの談話構成要素を決定する手段と、テキストの談話の構造表現を決定する手段と、談話構成要素の関連性スコアを決定する手段と、談話の構造表現に基づいて関連性スコアを浸透する手段と、閾値重要性スコアと比較した関連性スコアにより談話構成要素に基づいてハイブリッドテキスト要約を決定するための手段と、を有し、前記関連性スコアを浸透する手段は、談話構成要素リーフノードごとに、被従属エッジに１を加えた数を決定し、被従属エッジ＋１の逆数に基づいてスコアを決定し、スコアの関連性がより少ない場合に、談話構成要素ノードごとに、親の談話構成要素ノードに子の談話構成要素ノードのスコアを割り当て、被従属談話構成要素スコアがより低い場合に、任意の従属談話構成要素ノードについて、従属談話構成要素ノードに被従属談話構成要素ノードのスコアを割り当て、等位の子の談話構成要素のそれぞれに任意の等位談話構成要素ノードの関連性スコアを、より低い場合に、割り当て、スコア及び従属レベルに基づいて調整された関連性スコアを決定する。

図１は、本発明による例示的なハイブリッド要約システム１００の概要である。ハイブリッド要約システム１００は、ウェブ使用可能なパーソナルコンピュータ３００、ウェブ使用可能なタブレットコンピュータ４００、及び文書１００００〜１０００２を含む情報リポジトリ２００に通信リンク９９を介して接続されている。

本発明による多様な例示的な実施形態の一つでは、ウェブ使用可能なパーソナルコンピュータ３００が情報リポジトリ２００に含まれている文書１００００のハイブリッドテキスト要約に対する要求を開始する。前記要求は通信リンク９９を介してハイブリッド要約システム１００に転送される。ハイブリッド要約システム１００はハイブリッドテキスト要約に対する要求を取り次ぐ。次に、ハイブリッド要約システム１００は情報リポジトリ２００から文書１００００を取り出す。それから、テキスト文書１００００は談話分析の理論のための決定された分割規則に基づき談話構成要素に分割される。

本発明による多様な例示的な実施形態では、分割規則はテキストを基本的な談話構成要素単位（ＢＤＵ）に分割するために使用される。基本談話構成要素単位は、統一言語談話モデル（ＵＬＤＭ）、修辞構造理論（ＲＳＴ）、談話構造理論、構造化談話表現理論（ＳＤＲＴ）又は談話分析の他の既知の、あるいは今後開発される理論について作成される分割規則に基づいて決定される。例えば、言語談話モデルのそれぞれの基本談話構成要素は、１）多くとも一つの考えられる世界の情勢についての情報、及び、２）先に発生した言語学的なジェスチャ、あるいはおそらく次の言語学的なジェスチャが、談話又は談話が発生する文脈の中の他の単位に構造上、意味論上、インタラクティブに、あるいは修辞学的にどのように関係するのかについての情報を符号化する関数情報、を伝達する文脈を基準にして解釈される言語学上のジェスチャから構成されている。言語学的に実現された基本談話構成要素単位の文の統語的な反射作用は、それが見つけられる文の外部からの連続のために利用しやすいセグメントである。事象に対する参照は必要であるが、ある単語が大部分の談話構成要素の先頭になるためには十分ではない。したがって、助動詞及び法動詞はそれらの本動詞から別個の談話構成要素を形成しないであろう。それらは別個の事象を参照しないため、「しなければならない」、「すべきである」等の不定詞を含む他の法助動詞構造も同じ論法によって、それらの補語と単一のセグメントを構成する。

このようにして、談話構成要素単位を決定するために、候補談話構成要素セグメントは事象を参照し、談話の中で後に事象を「続行する」ために十分な文脈を提供しなければならない。「試す」又は「説得する」などの同一動詞及び「と思われる」及び「信じる」などの繰り上げ動詞は、両方の事象とも続行できるためそれらの動詞補語から別個の文法項を形成する。対照的に、動名詞を含む事象名詞語句は、それらが文法項又は修飾語句である動詞とおそらく識別可能である事象を参照しても、それらの事象は容易に続行しない。

統一言語談話モデルは決定された基本的な談話構成要素を結合規則に基づいて談話の構造表現に連結する。結合規則は、基本談話構成要素が談話の右に開いたツリー構造表現にどのように連結されるのかを突き止めるために使用される。

例えば、統一言語談話モデルは、基本談話構成要素を右に開いたツリーに基づいて談話の構造表現に連結するために単独で、あるいは組み合わせて使用できる統語的、意味論的、語彙的−意味論的、構造上及びデフォルトの結合規則を提供する。統計的なキーワード及び／又は重要談話構成要素を決定する他の既知の、あるいは今後開発される方法は、連結された談話構成要素のサブツリーを定義するために使用される。追加の支持する談話構成要素は、談話分析の理論に関連付けられる結合規則に基づいて含まれる。本発明による多様な他の例示的な実施形態において、結合又は連結支持情報が統計的なキーワード及び／又は他の関連性情報と、各談話構成要素と関連付けられた単一の関連性スコアに合体されてよいことが明らかとなるであろう。ハイブリッド要約システムがハイブリッドテキスト要約を決定した後で、ハイブリッドテキスト要約はウェブ使用可能なパーソナルコンピュータ３００に転送される。

本発明による別の例示的な実施形態では、ウェブ使用可能なタブレットコンピュータ４００のユーザが情報リポジトリ２００の中の文書１０００１のハイブリッドテキスト要約を要求する。前記要求は通信リンク９９を介してハイブリッド要約システム１００に転送される。ハイブリッド要約システム１００は通信リンク９９を介して情報リポジトリ２００から文書１０００１を取り出す。談話の構造表現が、決定される談話構成要素間のリンクを指定する談話分析の理論に基づき要求された文書１０００１について決定される。テキスト中の重要談話構成要素を突き止めるために、統計的な分析、キーワード、知識ベースの検索又は重要な情報を決定する任意の既知のあるいは今後開発される方法が使用されてよい。例えば、統計的な及び／又はキーワードに基づいた技法は、閾値重要度スコアを超える関連性スコアを有する談話構成要素を決定するために適用される。決定された重要談話構成要素及び談話の構造表現中の支持する先行談話構成要素が、談話構成要素のサブツリーを定義する。

本発明による多様な例示的な実施形態では、談話構成要素リーフノードの関連性スコアが他の談話構成要素の関連性スコアを調整するために談話の構造表現を通して浸透される。関連性スコアの浸透は、変化する数の支持する利用しやすい談話構成要素を含むために談話分析の理論に基づいて調整されてよい。異なる浸透方法がテキストの異なるジャンル、テキストの異なる言語又は任意の属性、あるいは談話の構造表現に影響を及ぼす可能性のある文書に基づいて指定されてよい。

談話分析の他の理論は、情報が構造にどのように符号化されるのかの詳細で異なる可能性があるが、先行の支持する談話構成要素の識別及び関連性スコアの構造に基づいた浸透は、文法性を保つ任意のテキスト要約機能とともに使用されてよい。例えば談話の構造表現が統一言語談話モデル（ＵＬＤＭ）に基づいている場合、リーフノードとして重要談話構成要素を有する談話の構造表現からの関連する談話構成要素の縮小されたサブツリーがハイブリッドテキスト要約として決定される。

図２は、本発明の例示的な実施形態によるハイブリッドテキスト要約を決定する第１の方法である。プロセスはステップＳ１００で開始し、談話分析の理論が決定されるステップＳ２００に続行する。制御は次にステップＳ３００に続行する。

ステップＳ３００では、要約されるテキストが決定される。テキストは、ドロップダウンダイアログボックスから先に作成されたテキストを選択することにより決定され、エディタ又はワープロを使用して入力され、ウェブサーバ又はデジタルライブラリなどの情報リポジトリから取り出され、あるいは、既知のあるいは今後開発されるテキスト選択方法を使用して決定されてよい。テキストが決定された後、制御は、テキストが次に談話分析の理論の分割規則に基づいて談話構成要素に分割されるステップＳ４００に続行する。

テキストは、談話構成要素のグラフを決定する談話分析の任意の理論に基づいて分割されてよい。例えば、言語談話モデル及び統一言語談話モデルはそれぞれテキスト内の談話構成要素を決定するための分割規則を提供する。統一言語談話モデルの分割規則は、それぞれの識別された談話構成要素が、等位接続、従位接続、及びＮ分（Ｎ−ａｒｙ）ノード又は二分ノードに基づいて右に開いたツリーに結合できるようにテキストを分割する。しかしながら、本発明の多様な他の例示的な実施形態において、本発明の実践では談話構成要素を連結し、順序付けることができる他の談話分析の理論が使用されてもよい。テキストが分割された後、制御はステップＳ５００に続行する。

ステップＳ５００では、談話構成要素間のリンクが決定される。統一言語談話モデルでは、談話構成要素を談話の一つの構造表現に連結するための結合規則が、１）統語的、２）意味論的、３）語彙的−意味論的、４）構造上、及び、５）デフォルトの規則、として分類されてよい。統語的な規則は、時制、相、主語、目的語、又は、挿入句（ｐａｒｅｎｔｈｅｔｉｃａｌｓ）、コンマで区切られた部分等の文の構文識別可能な特徴などの文の構成要素によって伝えられる統語的な属性の談話構成要素内での存在に基づいて談話構成要素間の関係を指定するために使用される。

統一言語談話モデルの意味論的な規則は、自然な言語談話構成要素に割り当てられる意味論上の表現における特定の属性、真の値、又は関係の発生により確立される関係性を指定する。例えば、付加的な文脈がない場合、第２の談話構成要素の特定の要素が後に続く第１の談話構成要素の一般的な要素の存在は、意味論上の従位接続規則に一致するパターンを定義するために使用される。意味論的な従位接続規則に一致すると、特定の要素を含む談話構成要素は、２つの談話構成要素を連結する談話の構造表現に従位接続ノードを挿入することによって一般的な要素を含む談話構成要素に従属する。本発明による多様な他の例示的な実施形態では、特定の数量詞、「定冠詞ｔｈｅ」と「不定冠詞ａ」などの限定詞、あるいは談話構成要素の一般的な解釈と特定の解釈を区別することができる他のパターン又は構造が、本発明に従って意味論的な従位接続を決定するために使用される。

統一言語談話モデルの語彙的−意味論的な規則は、単純な語彙項目又は複雑な語彙項目、語彙的な集合、又は構成要素の中のエンティティ又は特性を示す慣用語句が特定の種類の互いの関係性を示す談話構成要素間の関係性を指定する。例えば、「衣服」及び「ジャケット」は特定の種類の関係性を有する。同様に、玄関は建物に対する特定の関係の建築の特徴である。すなわち、建物は必ずしも玄関を含まない場合があるが、玄関はつねに建物の内部で見つけられる。別の例は文「ヨーロッパ人は異なる言語を話す。フランス人はフランス語を話す」によって提示される。第１の文の「ヨーロッパ人」と第２の文の「フランス人」の間には一般対特定の関係性が存在する。一般対特定の関係性は、ありうる従位接続を示している。句「例えば、しかし〜に限られない」は、続く項目が互いになんらかの関係性があることを指定している。形式「の型である」、「の一部である」、「を有する」、「に同等である」、「と対照的である」等の句も、語彙的−意味論的な規則を使用して談話ツリーに談話構成要素が結合されるという情報を提供する。これらの句のどれか又はすべての発生は、語彙的−意味論的な規則の付加的な集合を使用可能にする及び／又は使用不能にするために使用されてよい。

統一言語談話モデルの構造上の規則は、談話の構造表現とその表現に結合されている談話構成要素の間で当てはまる関係の型を指定する。構造上の規則は、その結合の性質だけではなく構造表現に対する談話構成要素の構造上の結合点も制限する。構造表現に結合される談話構成要素は単一の文から導出され、談話単位の主ノードに対応する単位に基づいて結合される一つ又は複数の単位から構成される。したがって、構造上の規則が、談話構成要素を談話の構造表現に追加するときに考慮する必要のある候補結合点の数を削減する上で役立つことが明らかになるであろう。

本発明による多様な他の例示的な実施形態では、結合点変数（ＡＰ）、主要基本談話単位変数（Ｍ−ＢＤＵ）、現在の談話構成要素又は他の定義された変数などの変数が結合規則に関連付けられたパターンと一致すると、結合規則は始動（ｆｉｒｅｄ）されることが明らかとなるであろう。結合規則は随意的に相互に排他的な規則の集合、特定の規則又は規則の集合が始動した後にだけ有効にされる規則の集合、あるいは他のカテゴリに編成されてよい。本発明によるさらに他の実施形態では、複数の規則が適用されてよく、それぞれの規則は異なる重要性と関連付けられている。談話構成要素間のリンクが決定された後で、制御はステップＳ６００に続行する。

ステップＳ６００では、談話構成要素のための関連性スコアが決定される。談話構成要素の関連性スコアは、統計、キーワード検索、知識ベース又は既知のあるいは今後開発される関連性基準に基づいて決定される。談話構成要素の関連性スコアを決定した後、制御はステップＳ７００に続行する。

閾値重要性スコアがステップＳ７００で決定される。閾値重要性スコアはユーザプロファイルから取り出される、及び／又は、動的に入力されてよい。閾値重要性スコアは重要であると見なされる談話構成要素に必要な重要性値を指定する。閾値重要性値が決定された後、制御はステップＳ８００に続行する。

ステップＳ８００では、閾値重要性スコアを超える関連性スコアを有する重要談話構成要素が決定される。関連性スコア及び閾値重要性スコアが、負のスコア、相互作用を表すスコア、又は既知のあるいは今後開発される単調な機能を使用して比較できる他の値で指定されてもよいことは明らかとなるであろう。次に、制御はステップＳ９００に続行する。

重要談話構成要素に連結された支持する先行談話構成要素はステップＳ９００で決定される。支持する先行談話構成要素は、照応に対する先行する対象を見つけることができる談話構成要素である。重要談話構成要素ノードとルートノードの間のノードが決定され、制御はステップＳ１０００に続行する。

ステップＳ１０００では、ハイブリッドテキスト要約が、リーフノード又はリーフノードとして重要談話構成要素を有する範囲又はサブツリーに基づいて決定される。支持する先行ノードの子ノードが談話分析の選択された理論のための結合規則に基づいてハイブリッドテキスト要約に選択的に含まれる。ハイブリッドテキスト要約が決定された後、制御はステップＳ１１００に続行する。

ハイブリッドテキスト要約はステップＳ１１００で表示される。本発明による多様な例示的な実施形態では、Ｓ７００からＳ１０００が、異なる選択された閾値重要性値に基づいてハイブリッドテキスト要約を動的に調整するために反復されることが明らかとなるであろう。

図３は、本発明の例示的な実施形態による第１のハイブリッド要約システムである。ハイブリッドテキスト要約システム１００は、メモリ２０、プロセッサ３０、談話構成要素分割ルーチン又は回路（手段）４０、談話構成要素リンク決定ルーチン又は回路（手段）５０、関連性スコア決定ルーチン又は回路（手段）６０、及び連結先行談話構成要素決定ルーチン又は回路（手段）７０を備えている。これらの各々は、通信リンク９９及び入力／出力回路（手段）１０を介して、ウェブ使用可能なパーソナルコンピュータ３００、ウェブ使用可能なタブレットコンピュータ４００、及び、文書１００００から１０００２を含む情報リポジトリ２００に接続される

本発明による多様な例示的な実施形態の一つでは、ウェブ使用可能パーソナルコンピュータ３００のユーザが、情報リポジトリ２００に含まれる文書１００００のハイブリッド要約に対する要求を開始する。前記要求は通信リンク９００を介してハイブリッド要約システム１００の入力／出力回路１０に転送される。プロセッサ３０は、通信リンク９９を介して情報リポジトリ２００から要求された文書１００００を取り出し、文書１００００をメモリ２０に記憶するために入力／出力回路１０を起動する。

プロセッサ３０は、テキストを談話構成要素に分割するために談話構成要素分割ルーチン又は回路４０を起動する。分割は統一言語談話モデル、修辞構造理論又は任意の既知の又は今後開発される談話分析の理論を使用して実行されてよい。

テキストが談話構成要素に分割された後に、プロセッサ３０は、談話構成要素リンク決定ルーチン又は回路５０を活性化することによって談話分析の決定された理論に基づき、談話構成要素間のリンクを決定する。例えば、統一言語談話モデルの分割規則を使用して分割された談話構成要素は、結合規則に基づいて談話の右に開いたツリー構造表現に挿入される。前述したように、統一言語談話モデルは、統語的、意味論的、語彙的−意味論的、構造上、及びデフォルトの結合規則の型を指定する。一つ又は複数の異なる型の結合規則及び／又は制限を備える複合結合規則も提供される。

本発明による多様な他の例示的な実施形態では、始動する規則の条件及び／又はシーケンスを指定するために、異なる範囲の変数が使用されてよい。例えば、規則は、第１の集合での第１の規則の始動が第２のあるいは除外された集合での第２の規則の始動を一時的にあるいは恒久的に抑制できるように除外集合に合体されてよい。規則は第１の規則の始動が、第３の集合の第３の規則を始動のために検討できるように使用可能にする集合に合体されてもよい。しかしながら、規則が本発明の範囲から逸脱することなく、既知の又は今後開発されるシーケンス及び／又は組み合わせに基づいて起動できることが明らかでなければならない。

次にプロセッサ３０が関連性スコア決定ルーチン又は回路６０を起動することにより重要な又は関連する談話構成要素を決定する。重要談話構成要素は、統計、キーワード、知識ベース及び／又は他の関連性情報に基づいて決定される。関連性スコアは先に決定された閾値重要性スコアに比較される。閾値重要性スコアを超える関連性スコアの談話構成要素が重要談話構成要素と見なされる。しかしながら、関連性スコアの任意の順序付けが本発明の範囲から逸脱することなく使用されてよいことが明らかとなるであろう。

連結された先行する談話構成要素決定ルーチン又は回路７０は、重要談話構成要素とルート談話構成要素間の支持する談話構成要素を決定するために起動される。例えば、統一言語談話モデルでは、談話構成要素は談話の正しいツリー構造表現に追加される。重要談話構成要素は、談話の構造表現のサブツリーのリーフノードとしての役割を果たす。決定された重要談話構成要素ノードの各親の談話構成要素、及び親の親が支持する先行談話構成要素ノードとして決定される。重要な支持する先行談話構成要素ノードのサブツリーがハイブリッドテキスト要約を定義する。本発明による多様な例示的な実施形態では、サブツリー、ハイブリッドテキスト要約のために選択された先行する支持する談話構成要素を決定するために各談話構成要素と関連付けられる関連性スコアに対して調整が行われる。

図４は、本発明の例示的な実施形態によるハイブリッドテキスト要約を決定する第２の方法である。プロセスはステップＳ１３００で開始し、ステップＳ１４００に続行する。

ステップＳ１４００では、要約されるテキストが決定される。テキストは、エディタ又はワープロを使用してテキストを手動で入力する、ウェブサーバ、デジタルライブラリ等の情報リポジトリからテキストを選択する、ボイス・ディクテーションを使用する及び／又は既知の又は今後開発される入力及び／又は選択方法を使用して決定されるテキストを入力することによって決定されてよい。要約されるテキストが決定された後、制御はステップＳ１５００に続行する。

談話分析の理論はステップＳ１５００で決定される。談話分析の理論は、統一言語談話モデル、言語談話モデル、修辞構造理論あるいは談話の構造表現に談話構成要素を連結し、順序付けることができる他の又は今後開発される談話分析の理論を含んでよいが、それらに限られない。談話分析の理論が決定された後、制御はステップＳ１６００に続行する。

次にステップＳ１６００でテキストを談話構成要素に分割するための規則が決定される。例えば、統一言語談話モデルに関連付けられる多様な分割規則は、品詞（ｐａｒｔ−ｏｆ−ｓｐｅｅｃｈ）タグ、語彙目録及び決定された談話構成要素を従位接続、等位接続、及び二分ノード又はＮ分（Ｎ−ａｒｙ）ノードに分割、分類するための他の属性又は特徴を使用する。分割規則は分割規則記憶構造から取り出されるか、あるいは談話分析の理論に基づいて動的に入力される。分割規則が決定された後、制御はステップＳ１７００に続行する。

ステップＳ１７００では、結合規則が談話分析の理論に基づき決定される。統一言語談話モデルの結合規則は、統語的、意味論的、語彙的−意味論的、構造上、及びデフォルトの規則の型を含む。結合規則は談話構成要素が談話の構造表現にどのように結合されるのかを決定する規則シーケンス又は組み合わせに合体される。結合規則は結合規則記憶構造から取り出されるか、あるいは動的に入力されてよい。結合規則が決定された後、制御は分割されるテキストの部分が決定されるステップＳ１８００に続行する。

本発明による多様な例示的な実施形態では、テキストの部分は、強調表示、カーソルコマンド、音声制御、あるいは既知の又は今後開発されるテキスト選択方法によって決定されてよい。制御は、次に、決定されたテキスト部分が、決定された分割規則に基づいて談話構成要素に分割されるステップＳ１９００に続行する。それから制御はステップＳ２０００に続行する。

次にステップＳ２０００で談話の構造表現が決定される。談話の構造表現は談話分析の理論に関連付けられる結合規則に基づき決定された談話構成要素を連結する。統一言語談話モデルの統合的、意味論的、語彙的−意味論的、構造上及びデフォルトの規則が説明されるが、本発明の実践では談話構成要素間の順序付けられたリンクを決定する際に有効な既知の又は今後開発される結合規則も使用されてよいことが明らかとなるであろう。談話の構造表現が決定された後に、制御は次にステップＳ２１００に続行する。

ステップＳ２１００では、談話構成要素のための関連性スコアが関連性の少なくとも一つの基準に基づいて決定される。談話構成要素の関連性スコアは、統計的なスコア、キーワード等に基づいて決定されてよい。しかしながら、本発明の実践では既知の又は今後開発される関連性基準も使用されてよい。関連性スコアが決定された後、制御は、関連性スコアが談話の構造表現中の利用しやすい談話構成要素に浸透されるステップＳ２２００に続行する。例えば、各談話構成要素の終端の子のノード又はリーフノードには、より関連性が高い関連性スコアの任意の直接的に又は間接的に従属する子の談話構成要素ノードの関連性スコアが割り当てられる。

多様な他の例示的な実施形態では、関連性スコアは、潜在的に照応を分割できる先行する談話構成要素に浸透される。さらに他の例示的な実施形態では、任意の一つの先行する対象が談話構成要素リーフノードの中の照応に代用される。関連性スコアが談話の構造表現を通して浸透された後で、制御はステップＳ２３００に続行する。

ステップＳ２３００では、閾値重要性スコアが決定される。閾値重要性スコアはユーザによってインタラクティブに入力され、メモリから取り出され、ユーザｉｄ等に基づき決定される。閾値重要性スコアは重要と見なされるために必要な関連性スコアを反映する。次に、制御は、談話構成要素のための関連性スコアが閾値重要性スコアと比較されるステップＳ２４００に続行する。談話構成要素関連性スコアの比較は、テキストの圧縮を選択的に調整するために使用される。次に、制御は、照応が随意的に代用されるステップＳ２５００に続行する。照応の任意の一つの先行する対象が決定され、随意的に照応に代用される。閾値重要性スコアを超える関連性スコアの談話構成要素がステップＳ２６００で決定され、随意的に表示される。次に、制御はステップＳ２７００に続行し、プロセスは終了する。

図５は、本発明の例示的な実施形態による第２のハイブリッド要約システムである。ハイブリッド要約システム１１０は、メモリ２０、プロセッサ３０、分割規則記憶装置４０、結合規則記憶装置５０、談話構造表現決定ルーチン又は回路（手段）６０、関連性スコア決定ルーチン又は回路（手段）７０、浸透ルーチン又は回路（手段）８０、及び、表示ルーチン又は回路（手段）９０を備える。これらは、入力／出力回路１０に、及び、通信リンク９９を介してウェブ使用可能パーソナルコンピュータ３００、ウェブ使用可能タブレットコンピュータ４００、及び、文書１００００から１０００２を含む情報リポジトリ２００に、接続される、

本発明による多様な例示的な実施形態の一つでは、ウェブ使用可能パーソナルコンピュータ３００のユーザが情報リポジトリ２００に含まれる文書１００００のハイブリッドテキスト要約に対する要求を開始する。前記要求は通信リンク９９を介してハイブリッド要約システム１１０の入力／出力回路１０に転送される。プロセッサ３０は、通信リンク９９を介して情報リポジトリ２００から文書１００００を取り出し、それをメモリ２０に記憶するために入力／出力回路１０を起動する。

プロセッサ３０は分割規則記憶装置４０から取り出された分割規則を適用する。分割規則は先に決定された談話分析の理論に関連付けられている。分割規則は、テキストを談話構成要素にどのようにして分割するのかを指定する。本発明による多様な例示的な実施形態では、談話分析の理論が、本発明の範囲から逸脱することなく、ユーザによる入力、テキストのジャンル、要約されるテキストの一部に基づいて、又は他の方法によって決定されてよいことが明らかとなるであろう。

談話構造表現決定ルーチン又は回路６０は、談話の構造表現に談話構成要素を結合するために起動される。例えば、統一言語談話モデル（ＵＬＤＭ）は、談話構成要素が談話の構造表現にどのようにして結合されるのかを定義する結合規則を指定する。統一言語談話モデルは、５種類の結合規則、つまり１）統語的、２）意味論的、３）語彙的−意味論的、４）構造上、及び５）デフォルト、を指定する。結合規則の異なる種類は単独で使用されてよいし、あるいは、組み合わせ及び／又は規則シーケンスに合体されてよい。

統語的結合規則は、時制、相、主語、目的語又は挿入句、コンマで区切られた部分等の文の構文識別可能特徴などの文の構成要素により運ばれる統語的な属性の談話構成要素での存在に基づいた談話構成要素間の関係を指定する。

意味論的な結合規則は、自然な言語談話構成要素に割り当てられる意味論的な表現における特定の属性、真の値又は関係の発生により確立される関係性を指定する。例えば、付加的な文脈がない場合、第２の談話構成要素におけるより特定的な要素が後に続く第１の談話構成要素のより一般的な要素の存在が、意味論的な従位接続規則に一致するために使用できるパターンを定義する。意味論的な従位接続規則は、より一般的な談話構成要素に特定の談話構成要素を従属させる。特定の数量詞、「定冠詞ｔｈｅ」及び「不定冠詞ａ」などの限定詞、又は談話構成要素の一般的な解釈及び特定の解釈を区別することに関連付けられた他の決定されたパターン及び／又は構造も、特定の談話構成要素の一般的な談話構成要素に対する従属をトリガするために使用されてよい。

構造上の結合規則は、結合されている談話構成要素の一つ又は両方と、すでに談話構造の一部を形成している他の談話構成要素の間に当てはまる関係の種類を指定する。構造上の結合規則は、結合される一つ又は複数の談話構成要素のための結合を制限するために使用される。例えば、結合される２つの談話構成要素の場合、規則はどの談話結合物がツリーに直接的に結合されなければならないのか、及び、どこで結合が起こらなければならないのかを指定する。このようにして構造上の規則は、考慮しなければならない候補結合点の数を削減するために使用できる。デフォルトの結合規則は、他の規則が当てはまらないときに講じる処置を指定する。デフォルトの規則は他の種類の結合規則の組み合わせを含んでよい。

本発明による多様な別の例示的な実施形態では、談話構成要素の属性が規則の属性に一致すると規則が始動することが明らかとなるであろう。規則は、相互に排他的な規則、他の規則が始動した後にだけ、あるいは他の既知の又は今後開発される規則シーケンスに基づいて有効にされる規則集合に編成されてよい。本発明による多様な実施形態では、複数の規則が適用されてよく、各規則はさまざまな重みと関連付けられる。

プロセッサ３０は、次に、各談話構成要素ごとに関連性スコアを決定するために関連性スコア決定ルーチン又は回路７０を起動する。関連性の基準は、統計、キーワード、知識ベース、あるいは既知の又は今後開発される非構造方法に基づいて決定されてよい。

プロセッサ３０は、談話構成要素リーフノードから先行する談話構成要素ノードに関連性スコアを浸透するために浸透ルーチン又は回路８０を起動する。初期の関連性スコアは、談話の構造表現を通して上に浸透される。重要談話構成要素の文法性を保証するために必要な支持する利用しやすい談話構成要素は関連性スコアに基づいて選択される。多様な例示的な実施形態では、非構造関連性スコアは、ハイブリッドテキスト要約の文法性が保たれるように談話の構造表現を通して浸透される。支持する利用しやすい談話構成要素の数は、テキストジャンル、言語、要約の関数及び／又は既知のあるいは今後開発される属性又は特徴に基づいて動的に選択可能である。

表示ルーチン又は回路９０は、先に決定された閾値重要性スコアを超える関連性スコアの談話構成要素ノードを決定するために起動される。本発明による多様な別の例示的な実施形態では、支持する談話構成要素からの一つの識別された先行する対象が、ハイブリッドテキスト要約をさらに圧縮するために談話構成要素リーフノードへの照応に代用される。

図６は、本発明の実施形態による分割規則６００を記憶するための例示的なデータ構造である。分割規則６００を記憶するための例示的なデータ構造は各規則を一意的に識別する識別子部分６１０、異なる種類の規則を分類する一つ又は複数の型部分６２０、規則を始動するために必要とされる制限を指定するパターン部分６３０、及び規則の制限が一致される場合に実行される動作を指定する動作部分６４０から構成されている。

分割規則は、談話構成要素及び／又は文の単位の主要な談話構成要素として候補セグメントを分類するための条件を定義する。談話構文解析は、文の単位を談話構成要素に分割することと、一つ又は複数の主要な談話構成要素を決定することと、主要な談話構成要素に従属する文の談話構成要素のサブツリーを決定することと、談話の理論に基づいて結合規則を使用して談話の現存の構造表現に対するサブツリーの結合を決定することとを含む。結合規則は、文の主要な談話構成要素及び／又は結合点談話構成要素に対する制限を指定する。例えば、異なる結合規則は、談話構成要素が修飾語句であるのか、関係詞節であるのか、文の主語等であるのかに応じてトリガされる。候補セグメントの属性又は特徴が品詞タグ、環境変数、ゼロックス言語環境（ＸＬＥ）の出力、蓋然論的な、統計上の、有限状態の又は記号の、構文解析ツール、ＷｏｒｄＮｅｔなどの語彙目録、あるいは他の既知の又は今後開発される候補談話構成要素の特徴を決定する方法から決定されることが明らかとなるであろう。

分割規則情報を記憶するための例示的なデータ構造の第１列は識別子部分６１０に値「１」を、型部分６２０に値「ＳＩＭＰＬＥ＿ＥＶＥＮＴＳ（単純事象）」を含む。これは、規則「１」として識別される規則が単純事象型規則であることを示している。本発明による多様な例示的な実施形態では、規則は型部分６２０の値に基づいて規則の異なる集合に集められてよい。規則及び／又は型の異なる集合は、指定の規則の後に始動してよい規則のシーケンスを制限する多様な他の規則を除外する、及び／又は有効にしてよい。本発明によるさらに他の例示的な実施形態では、複数の規則が適用されてよく、それぞれの規則がさまざまな重要性と関連付けられている。

パターン部分６３０は値「（ＳＩＭＰＬＥ＿ＥＶＥＮＴ）」を含む。これは、単純事象が、規則が始動する前に候補セグメントで決定されなければならないことを示す。単純事象の決定が、蓋然論的な、統計的な、有限状態の又は記号の構文解析ツール、文の構文解析ツール、ゼロックス言語環境（ＸＬＥ）などの言語処理環境あるいは既知の又は今後開発される方法の出力に基づいてよいことは明らかとなるであろう。

規則の動作部分６４０は、パターン部分６３０が一致されると起動される。動作部分６４０は、パターン部分６３０の制限が一致すると、規則の動作部分が、フラグ又は候補セグメントが基本的な談話単位である旨の他の表示を設定するために呼び出されることを示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第２列は、識別子部分６１０に値「２」及び型部分６２０に値「ＤＩＳＣＬＯＳＵＲＥ＿ＯＰＥＲＡＴＯＲ（開示演算子）」を含む。これは、規則「２」として識別される規則が開示演算子型規則であることを示している。

パターン部分６３０は値「ＭＯＤＩＦＩＥＲ（修飾語句）」を含む。これは、候補談話構成要素セグメントが規則を始動するための修正語句でなければならないことを示している。前述されたように、修正語句の決定は、文の構文解析ツール、言語処理環境等の出力に基づいてよい。

規則の動作部分６４０は、パターン部分６３０が一致すると起動される。動作部分６４０は、パターン部分６３０の制限が一致すると実行される動作を示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第３列は、識別子部分６１０に値「３」を、型部分６２０に値「ＩＮＴＥＲＰＯＬＡＴＩＯＮ（補間）」を含む。これは、規則「３」として識別される規則が補間型規則であることを示している。

パターン部分６３０は値「ＡＰＰＯＳＩＴＩＶＥＯＲＰＡＲＥＮＴＨＥＴＩＣＡＬＯＲＩＮＴＥＲＲＵＰＴＩＯＮＯＲＮＯＮ＿ＲＥＳＴＲＩＣＴＩＶＥ＿ＣＬＡＵＳＥＯＲＲＥＦＥＲＥＮＣＥ（同格又は挿入又は中断又は非制限節又は参照）」を含む。これは、候補セグメントが同格、挿入、中断、又は非制限節又は参照であると判断される場合、規則が始動することを示している。前述したように、制限は蓋然的な、統計的な、有限状態の、記号の、文の構文解析ツール、ゼロックス言語環境（ＸＬＥ）などの言語処理環境あるいは既知の又は今後開発される方法の出力に基づいて決定される。

規則の動作部分６４０は、パターン部分６３０が一致すると起動される。動作部分６４０は、パターン部分６３０の制限が一致すると、フラグ又は候補セグメントが基本的な談話単位である旨の他の表示を設定するために、規則の動作部分が呼び出されることを示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第４列は、識別子部分６１０に値「４」を、型部分６２０に値「ＳＵＢＯＲＤＩＮＡＴＥ＿ＣＬＡＵＳＥＳ（従属節）」を含む。これは、規則「４」として識別される規則が従属節型の規則であることを示している。

パターン部分６３０は、候補セグメントが、規則が始動する前に補語節、文の主語、又は関係節でなければならないことを示す値「ＣＯＭＰＬＥＭＥＮＴ＿ＣＬＡＵＳＥＯＲ

ＳＥＮＴＥＮＴＩＡＬ＿ＳＵＢＪＥＣＴＯＲＲＥＬＡＴＩＶＥ＿ＣＬＡＵＳＥ（補語節又は文の主語又は関係節）」を含む。規則の動作部分６４０は、パターン部分６３０が一致すると起動される。動作部分６４０は、パターン部分６３０に含まれる制限が一致すると、規則の動作部分が、候補セグメントが基本的な談話単位であることを示すために呼び出されることを示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第５列は、識別子部分６１０に値「５」を、型部分６２０に値「ＰＯＳＴＮＯＭＩＮＡＬ＿ＭＯＤＩＦＩＥＲ（名詞後位修飾語）」を含む。これは、規則「５」と識別された規則が名詞後位修飾語型の規則であることを示している。

パターン部分６３０は、値「（ＤＩＳＣＲＥＴＥ＿ＥＶＥＮＴＡＮＤ（ＰＯＳＴＮＯＭＩＮＡＬ＿ＭＯＤＩＦＩＥＲＯＲＲＥＬＡＴＩＶＥ＿ＣＬＡＵＳＥＯＲＰＡＲＴＣＩＰＩＡＬ＿ＭＯＤＩＦＩＥＲ））（（非連続事象及び（名詞後位修飾語又は関係節又は分詞修飾語）））」を含む。これは、これらの制限が、規則が始動する前に候補セグメントと関連付けられていると判断されなければならないことを示している。

規則の動作部分６４０は、パターン部分６３０が一致すると起動される。動作部分６４０は、パターン部分６３０の制限が一致すると、規則の動作部分が、フラグ又は候補セグメントが基本的な談話単位である旨の他の表示を設定するために呼び出されることを示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第６列は、識別子部分６１０に値「６」を、型部分６２０に値「ＭＯＲＰＨＯＬＯＧＩＣＡＬ＿ＦＯＲＭ（形態的形）」を含む。これは、「６」と識別される規則が形態型規則であることを示している。パターン部分６３０は、候補セグメントが、規則が始動する前に非連続事象であり、不定詞又は動名詞のどちらかであると判断されなければならないことを示す値「（ＤＩＳＣＲＥＴＥ＿ＥＶＥＮＴＡＮＤ（ＩＮＦＩＮＩＴＩＶＥＳＯＲＧＥＲＵＮＤＳ））（（非連続事象と（不定詞又は動名詞）））」を含む。

規則の動作部分６４０は、パターン部分６３０が一致すると起動される。動作部分６４０は、パターン部分６３０の制限が一致すると、規則の動作部分がフラグ又は候補セグメントが基本的な談話単位である旨の他の表示を設定するために呼び出されることを示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第７列は、識別子部分６１０に値「７」を、型部分６２０に値「ＯＴＨＥＲ＿ＰＲＥＤＩＣＴＩＯＮ（他の予測）」を含む。これは、規則が他の予測型の規則と識別されることを示している。パターン部分６３０は値「（ＣＯＰＵＬＡＲ＿ＰＲＥＤＩＣＴＩＯＮＯＲＳＥＣＯＮＤＡＲＹＰＲＥＤＩＣＴＩＯＮＯＲＤＩＳＣＲＥＡＴ＿ＥＶＥＮＴ）（（連結詞予測又は二次予測又は非連続事象））」を含む。これは、連結詞予測、二次予測又は非連続事象が、規則が始動する前に決定されなければならないことを示している。

分割規則情報を記憶するための例示的なデータ構造の第８列は、識別子部分６１０に値「８」を、型部分６２０に値「ＳＵＢＯＲＤＩＮＡＴＩＮＧ＿ＣＯＮＪＵＮＣＴＩＯＮ（従属接続）」を含む。これは、規則「８」と識別される規則が従属接続詞型の規則であることを示している。パターン部分６３０は、値「（ＳＵＢＯＲＤＩＮＡＴＩＮＧ＿ＣＯＮＪＵＮＣＴＩＯＮＡＮＤＤＩＳＣＲＥＴＥ＿ＥＶＥＮＴ）（（従属接続と非連続事象））」を含む。これは、これらの制限が、規則が始動する前に候補セグメントで決定されなければならないことを示している。

規則の動作部分６４０は、パターン部分６３０が一致すると起動される。動作部分６４０は、パターン部分６３０の制限が一致されると、フラグ又は候補セグメントが基本的な談話単位である旨の他の表示を設定するために、規則の動作部分が呼び出されることを示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第９列は、識別子部分６１０に値「９」を、型部分６２０に値「ＣＯＯＲＤＩＮＡＴＩＮＧ＿ＣＯＮＪＵＮＣＴＩＯＮＳ（等位接続）」を含む。これは、規則「９」として識別される規則が等位接続詞型規則であることを示している。パターン部分６３０は、値「（（ＣＯＯＲＤＩＮＡＴＩＮＧ＿ＣＯＮＪＵＮＣＴＩＯＮＡＮＤＬＥＮＧＴＨ＝１）ＯＲ（（ＸＣＯＯＲＤＩＮＡＴＩＮＧ＿ＣＯＮＪＵＮＣＴＩＯＮＹ）ＡＮＤ（ＸＩＳＡＢＤＵＡＮＤＹＩＳＡＢＤＵ））（（（等位接続及び長さ＝１）又は（（Ｘ等位接続Ｙ）

及び（ＸはＢＤＵ及びＹはＢＤＵ）））」を含む。これは、規則が始動する前に、等位接続詞が１）長さ＝１によって示されるように候補談話構成要素セグメント内の唯一の要素、又は、２）それぞれがＢＤＵである要素ＸとＹを連結する等位接続詞、のどちらかであることを判断されなければならないことを示している。候補セグメントが指定された制限のどちらかに一致すると、規則が始動する。

パターン部分６３０が一致すると、規則の動作部分６４０が起動される。動作部分６４０は、パターン部分６３０の制限が一致すると、フラグ又は候補セグメントが基本的な談話単位である旨の他の表示を設定するために、規則の動作部分が呼び出されることを示す値「ＢＤＵ＝ＴＲＵＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第１０列は、識別子部分６１０に値「１０」を、型部分６２０に値「ＩＮＦＯＲＭＡＴＩＯＮ＿ＳＴＲＵＣＴＵＲＥ（情報構造）」を含む。これは、規則「１０」として識別される規則が情報構造型の規則であることを示している。パターン部分６３０は値「（ＣＯＰＵＬＡＡＮＤ（ＣＬＥＦＴＯＲＰＳＥＵＤＯ＿ＣＬＥＦＴ））（（連結詞及び分裂又は擬似分裂））」を含む。これは、候補セグメントが、規則が始動する前に連結詞、及び分裂又は擬似分裂のどちらかでなければならないことを示している。

パターン部分６３０が一致すると規則の動作部分６４０が起動される。動作部分６４０は、パターン部分６３０の制限が一致すると、フラグ又は候補セグメントが基本的な談話単位ではない旨の他の表示を設定するために、規則の動作部分が呼び出されることを示す値「ＢＤＵ＝ＦＡＬＳＥ」を含んでいる。

分割規則情報を記憶するための例示的なデータ構造の第１１列は、識別子部分６１０に値「１１」を、型部分６２０に値「ＥＶＥＮＴ＿ＭＯＤＩＦＩＥＲ（事象修飾語句）」を含む。これは、規則「１１」と識別される規則が事象修飾語句型の規則であることを示している。パターン部分６３０は、候補セグメントが、規則が始動するための非連続事象の修飾語句であり、非連続事象と関連付けられてはならないことを示す値「（ＥＶＥＮＴ＿ＭＯＤＩＦＩＥＲＡＮＤＮＯＴ（ＤＩＳＣＲＥＴＥ＿ＥＶＥＮＴ））（（事象修飾語及び非（非連続事象）））」を含む。

パターン部分６３０が一致すると、規則の動作部分６４０は起動される。動作部分６４０は、パターン部分６３０の制限が一致すると、フラグ又は候補セグメントが基本的な談話単位ではない旨の他の表示を設定するために、規則の動作部分が呼び出されることを示す値「ＢＤＵ＝ＦＡＬＳＥ」を含む。

分割規則情報を記憶するための例示的なデータ構造の第１４列は、識別子部分６１０に値「１４」を、型部分６２０に値「ＩＮＩＴＩＡＬ＿ＭＯＤＩＦＩＥＲ（初期修飾子）」を含む。これは、第１４の規則が初期修飾子型の規則であることを示している。パターン部分６３０は、値「（ＩＮＩＴＩＡＬ＿ＭＯＤＩＦＩＥＲＡＮＤＳＣＥＮＥ＿ＳＥＴＴＩＮＧ）（（初期修飾子及び状況設定））」を含む。これは、候補セグメントが初期修飾語句でなければならず、規則の始動をトリガするためにシーン設定値と関連付けられなければならないことを示している。

パターン部分６３０が一致すると、規則の動作部分６４０が起動される。動作部分６４０は値「ＢＤＵ＝ＴＲＵＥ」を含む。パターン部の６３０の制限が一致すると、フラグ、若しくは、候補セグメントが基本的な談話単位でないことを示す他の表示を設定するために、規則の動作部分が呼び出されることを、該値は示す。

図７は、本発明の実施形態による結合規則情報７００を記憶するための例示的なデータ構造である。結合規則情報７００を記憶するための例示的なデータ構造は、識別子部分７１０及び規則部分７２０から構成される。

結合規則情報を記憶するための例示的なデータ構造の第１列は、規則識別子部分７１０に値「１」を含む。規則部分７２０は、複合規則「＜Ｓｘ：（Ｍ−ＢＤＵ／ＴＹＰＥ）＝“ＢｅｔｗｅｅｎＰａｒｅｎｔｈｅｓｉｓ”；Ｓｔ：ＡＰｉｓＢｏｔｔｏｍＯｆＴｒｅｅ；＞→Ｓｕｂｏｒｄｉｎａｔｅ（ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「１」は、主要なＢＤＵが括弧によって区切られることを示す「Ｓｘ：（Ｍ−ＢＤＵ／ＴＹＰＥ）＝“ＢｅｔｗｅｅｎＰａｒｅｎｔｈｅｓｉｓ”」、及び、結合点が談話の構造表現の右に開いたツリーの底部になければならないことを示す第２の構造上の制限「Ｓｔ：ＡＰｉｓＢｏｔｔｏｍＯｆＴｒｅｅ」によって示される第１の統語制限から構成される複合規則である。第１の制限及び第２の制限は、両方の制限が、主要な基本談話単位（Ｍ−ＢＤＵ）の、結合点変数（ＡＰ）により示される現在の結合点に対する従属をトリガするために一致しなければならないことを示す開いた制限「＜」タグと閉じた制限「＞」タグの間で結合される。

結合規則情報を記憶するための例示的なデータ構造の第２列は、規則識別子部分７１０に「２」を含む。規則部分７２０は、複合規則「＜Ｓｘ：（ＡＰ／Ｔｅｎｓｅ）＝“Ｐｒｅｓｅｎｔ”；Ｓｘ：（Ｍ−ＢＤＵ／Ｔｅｎｓｅ）＝“Ｐａｓｔ”；＞→Ｓｕｂｏｒｄｉｎａｔｅ（ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「２」は、候補結合点談話構成要素が現在時制でなければならないことを示す「Ｓｘ：（ＡＰ／Ｔｅｎｓｅ）＝“Ｐｒｅｓｅｎｔ”」によって示される第１の統語制限、及び結合点（ＡＰ）に結合される主要な基本談話構成要素が規則をトリガするために過去時制でなければならないことを示す第２の統語制限「Ｓｘ：（Ｍ−ＢＤＵ／Ｔｅｎｓｅ）＝“Ｐａｓｔ”；」から構成される複合規則である。第１の制限及び第２の制限は、両方の制限が現在の結合点（ＡＰ）に対する主要な基本談話単位（Ｍ−ＢＤＵ）の従属をトリガするために一致しなければならないことを示す開いた制限「＜」タグと閉じた制限「＞」タグの間で結合される。

結合規則情報を記憶するための例示的なデータ構造の第３列は、規則識別子部分７１０に「３」を含む。規則部分７２０は、複合規則「＜ＬＳ：（ＡＰ）ｉｓａ（ＫＢ／Ｅｖｅｎｔ）；ＬＳ：（Ｍ−ＢＤＵ）ｉｓａ（ＫＢ／Ｅｖｅｎｔ）；Ｓｘ：（ＡＰ／Ｔｅｎｓｅ）＝（Ｍ−ＢＤＵ／Ｔｅｎｓｅ）＞→Ｃｏｏｒｄｉｎａｔｅ（ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「３」は、「ＬＳ：（ＡＰ）ｉｓａ（ＫＢ／Ｅｖｅｎｔ）；」によって示される第１の語彙的−意味論的制限から構成される複合規則である。これは、候補結合点が知識ベースＫＢに対する比較により決定されるように事象と関連付けられることを示す。第２の語彙的−意味論的制限「ＬＳ：（Ｍ−ＢＤＵ）ｉｓａ（ＫＢ／Ｅｖｅｎｔ）；」は、主要な基本談話単位も、知識ベースＫＢに対する比較により決定されるように事象と関連付けられることを示す。第３の統語制限「Ｓｘ：（ＡＰ／Ｔｅｎｓｅ）＝（Ｍ−ＢＤＵ／Ｔｅｎｓｅ）」は、結合点ＡＰ及び主要な基本談話単位（Ｍ−ＢＤＵ）の時制が一致しなければならないことを示す。第１の制限、第２の制限及び第３の制限は、すべて３つの制限が、主要な基本談話単位（Ｍ−ＢＤＵ）及び現在の結合点（ＡＰ）の等位構造をトリガするために始動しなければならないことを示す開いた制限「＜」タグと閉じた制限「＞」タグの間で結合される。

結合規則情報を記憶するための例示的なデータ構造の第４列は、規則識別子部分７１０に「４」を含む。規則部分７２０は複合規則「＜ＬＳ：（ＡＰ／Ｌｅｘｅｍｅ）ｈａｓａ（Ｍ−ＢＤＵ／Ｌｅｘｅｍｅ）：＄１：＄２；Ｓｘ：（ＡＰ／＊／ＣＯＭＰ）ｉｓ＄１；Ｓｘ：（Ｍ−ＢＤＵ／＊／ＳＵＢＪ）ｉｓ＄２；＞→Ｓｕｂｏｒｄｉｎａｔｅ（ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「４」は、２つの統語制限が後に続く語彙的−意味論的制限から構成される複合規則である。第１、第２、第３の制限は、３の全ての制限が主要な基本談話単位（Ｍ−ＢＤＵ）の現在の結合点（ＡＰ）に対する従属をトリガするために始動しなければならないことを示す開いた制限「＜」タグと閉じた制限「＞」タグの間で結合される。

結合規則情報を記憶するための例示的なデータの第５列は、規則識別子部分７１０に「５」を含む。規則部分７２０は、複合規則「＜Ｓｘ：（Ｍ−ＢＤＵ／Ｔｙｐｅ）＝“Ｔｅｍｐｏｒａｌ”；Ｓｔ：Ｍ−ＢＤＵｉｓＳｕｂｏｒｄｉｎａｔｅｄＴｏＡＰ；＞→ＣｒｅａｔｅＮａｒｙ（Ｃｘ，ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「５」は、「Ｓｘ：（Ｍ−ＢＤＵ／Ｔｙｐｅ）＝“Ｔｅｍｐｏｒａｌ”；」によって示される第１の統語制限から構成される複合規則である。これは、主要な基本談話単位（Ｍ−ＢＤＵ）談話構成要素が、「時制（Ｔｅｍｐｏｒａｌ）」型の談話構成要素でなければならないことを示している。第２の統語制限「Ｓｔ：Ｍ−ＢＤＵｉｓＳｕｂｏｒｄｉｎａｔｅｄＴｏＡＰ」は、主要な基本談話単位Ｍ−ＢＤＵが結合点に従属することを示している。第１の制限及び第２の制限は、両方の制限が結合点（ＡＰ）及び主要な基本談話単位（Ｍ−ＢＤＵ）の等位構造をトリガするために一致しなければならないことを示す、開いた制限「＜」タグと閉じた制限「＞」タグの間で結合される。項「Ｃｘ」は質疑応答型等位などの等位型を示す。

結合規則情報を記憶するための例示的なデータ構造の第６列は規則識別子部分７１０に「６」を含む。規則部分７２０は、複合規則「＜Ｓｍ：Σ（ＡＰ）ｉｓ“Ｇｅｎｅｒｉｃ”；ＳＭ：Σ（Ｍ−ＢＤＵ）ｉｓ“Ｓｐｅｃｉｆｉｃ”；＞→Ｓｕｂｏｒｄｉｎａｔｅ（ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「６」は、「Ｓｍ：Σ（ＡＰ）ｉｓ“Ｇｅｎｅｒｉｃ”；」により示される第１の意味論的な制限から構成される複合規則である。これは、結合点が総称的な言語要素を含むことを示している。「Ｓｍ：Σ（Ｍ−ＢＤＵ）ｉｓ“Ｓｐｅｃｉｆｉｃ”；」により示される第２の意味論的な制限は、主要な基本談話単位（Ｍ−ＢＤＵ）が特定の言語要素を含むことを示している。第１の制限及び第２の制限は、両方の制限が、主要な基本談話単位（Ｍ−ＢＤＵ）の、変数ＰＡによって示される現在の結合点への従属をトリガするために一致しなければならないことを示す開いた制限「＜」タグと閉じた制限「＞」タグの間で結合される。

結合規則情報を記憶するための例示的なデータ構造の第７列は規則識別子部分７１０に「７」を含む。規則部分７２０は、複合規則「＜Ｓｍ：Σ（ＡＰ）ｉｓ“Ｉｒｒｅａｌｉｓ”；ＳＭ：Σ（Ｍ−ＢＤＵ）ｉｓ“Ｒｅａｌｉｓ”；Ｓｘ：ｉｆＡＰｔｈｅｎＭ−ＢＤＵ；＞→ＣｒｅａｔｅＮａｒｙ（ＨＹＰ，ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「７」はＡＰが「非現実相（Ｉｒｒｅａｌｉｓ）」であること、及び主要な基本談話構成要素が「現実相（Ｒｅａｌｉｓ）」であること、並びに結合点（ＡＰ）が、結合点と主要な基本談話構成要素の間のＮ分関係を作成するために規則が始動される前に一致するという構造制限を必要とする。同様に、８から１２の列は、談話の構造表現を決定する上で有用な他の統一言語談話モデル結合規則を記述する。

結合規則情報を記憶するための例示的なデータ構造の第９９列は規則識別子部分７１０に「９９」を含む。規則部分７２０は複合規則「＜Ｓｔ：ＡＰｉｓＢｏｔｔｏｍＯｆＴｒｅｅ；Ｐｘ：ＩｆｎｏｔＡｎｙｒｕｌｅａｐｐｌｉｅｓ；＞→Ｓｕｂｏｒｄｉｎａｔｅ（ＡＰ，Ｍ−ＢＤＵ）」を含む。規則「７」は、候補結合点がツリーの底部で発生しなければならないことを示す第１の構造上の制限「Ｓｔ：ＡＰｉｓＢｏｔｔｏｍＯｆＴｒｅｅ」から構成される複合規則である。先手（ｐｒｅｅｍｐｔｏｒ）制限「Ｐｘ：ＩｆｎｏｔＡｎｙｒｕｌｅａｐｐｌｉｅｓ；」は、他の制限が適用しない場合にだけ一致される。第１の制限及び第２の制限は、両方の制限が、主要な基本談話単位（Ｍ−ＢＤＵ）の現在の結合点（ＡＰ）に対する従属をトリガするために一致しなければならないことを示す開いた制限「＜」タグと閉じた制限「＞」タグの間で結合される。

図８は、本発明の実施形態による関連性スコアを浸透する第１の例示的な方法の展開図である。プロセスはステップＳ２２００で開始し、ステップＳ２２０２に続行する。

ステップＳ２２０２では、各談話構成要素の子のノードの関連性スコアが親の談話構成要素ノードに割り当てられる。これが、重要談話構成要素の関連性スコアを支持する先行する談話構成要素ノードに浸透し、結果として生じるハイブリッドテキスト要約の文法性を保つのに役立つ。制御は次にステップＳ２２０４に続行する。

ステップＳ２２０４では、被従属談話構成要素ノードの関連性スコアがより関連性がある場合には、各被従属ノードの関連性スコアが従属談話構成要素に割り当てられる。これにより、支持する従属談話構成要素ノードがハイブリッドテキスト要約に含まれることが確実になる。次に制御は、各等位構造又はＮ分（Ｎ−ａｒｙ）ノードの関連性スコアが、関連性スコアがより関連性がある場合に、すべての等位とされた子の談話構成要素ノードに割り当てられるステップＳ２２０６に続行する。これにより、すべての等位構造情報が捕捉されることが確実になる。次に、制御はステップＳ２２０８に続行し、ただちに図４のステップＳ２３００にジャンプする。

図９は、本発明の実施形態に従って関連性スコアを浸透する第２の例示的な方法の展開図である。プロセスはステップＳ２２１０で開始し、ステップＳ２２１２に続行する。

談話構成要素の子のノードのそれぞれの関連性スコアが、ステップＳ２２１２で、親の談話構成要素ノードに割り当てられる。これは、重要談話構成要素の関連性スコアを、支持する先行する談話構成要素ノードに浸透し、結果として生じるハイブリッドテキスト要約の文法性を保つのに役立つ。次に制御はステップＳ２２１４に続行する。

ステップＳ２２１４では、被従属談話構成要素ノードの関連性スコアがより関連性があり、ノードが被従属ノードの左側にあると思われる場合には、各被従属ノードの関連性スコアが従属談話構成要素に割り当てられる。これにより、支持する従属談話構成要素ノードがハイブリッドテキスト要約に含まれるが、支持する談話構成要素の、左側にある談話構成要素への追加をさらに制限することが確実になる。言語談話モデルの構造表現では、従属ノードの左側の子のノードは従属ノードである。しかしながら、多様な他の談話分析の理論と関連付けられる談話の構造表現での差異のために、支持する先行する談話構成要素情報を識別する他の方法が、本発明の範囲から逸脱することなく使用されてよいことが明らかになるであろう。次に、制御は、各等位構造又はＮ分（ｎ−ａｒｙ）談話構成要素ノード又は二分談話構成要素ノードでは、子の談話構成要素のさらに関連性のある関連性スコアが左側のすべての子の談話構成要素に割り当てられるステップＳ２２１６に続行する。次に、制御は、ステップＳ２２１８に続行し、図４のステップＳ２３００にジャンプする。

図１０は、本発明の例示的な実施形態に従って関連性スコアを浸透する第３の例示的な方法の展開図である。プロセスはステップＳ２２３４で開始し、ステップＳ２２３６に続行する。

ステップＳ２２３６では、各談話構成要素ノードは、談話構成要素ノードとルートノードに１を加えたものの間の被従属エッジの数でマーキングされる。これは、談話の構造表現のノードレベルを示している。各談話構成要素ノードのレベルがマーキングされてから、制御はステップＳ２２３８に続行する。

ステップＳ２２３８では、各終端の子又はリーフノード談話構成要素が談話の構造表現での被従属エッジの数の逆数に等しいスコアを割り当てられる。スコアがノードごとに決定された後に、制御はステップＳ２２４０に続行する。

ステップＳ２２４０では、低い方のスコアが談話の構造表現を通して浸透される。したがって、親のノードのスコアが子のノードより関連性がある場合には、スコアは親のノードに割り当てられる。次に制御はステップＳ２２４２に続行する。

任意の被従属ノードのスコアは、被従属スコアがステップＳ２２４２でより低い場合には従属ノードに割り当てられる。次に制御はステップＳ２２４４に続行する。ステップＳ２２４４では、子のノードがより低いスコアを有さない限り、任意の等位構造又はＮ分（Ｎ−ａｒｙ）ノードのスコアが各子のノードに割り当てられる。次に制御はステップＳ２２４６に続行する。

ステップＳ２２４６では、談話構成要素ノードのそれぞれについて調整された関連性スコアが従属レベル及びスコアに基づいて決定される。例示的な関連性スコアは、以下の式（１）に基づいて決定される。

ｒ＝１−（Ｌ−１）^*ｉ（１）

ここで、Ｌはノードの従属レベルであり、ｉは各ノードに割り当てられるスコアである。項「−１」は、より低い関連性と関連するより低い数値を有する実際の値に、関連性スコアをするために追加される。ルートノードは関連性「１」を有し、リーフノードは１／Ｌという初期関連性スコアを有する。関連性スコアを決定した後、制御はステップＳ２２４８に続行し、図４のステップＳ２３００にジャンプする。

図１１は、本発明の実施形態による照応置換の第１の例示的な方法の展開図である。プロセスはステップＳ２５００で開始し、代名詞などの照応を含む各談話構成要素の子のノードが決定されるステップＳ２５０５に続行する。制御は次にステップＳ２５１０に続行する。

ステップＳ２５１０では、照応の任意のユニークな先行する対象が決定される。代名詞などの照応が通常それらの対象に続くことが明らかとなるであろう。このようにして、照応又は代名詞の、任意のユニークな先行する対象は、通常、談話の構造表現中の照応又は代名詞の前に発生する。これにより、調べられなければならない先行する談話構成要素の数が削減される。次に、任意の決定されたユニークな先行する対象が照応又は代名詞に代用される。次に制御はステップＳ２５１５に続行し、それから図４のステップＳ２６００にジャンプする。

図１２は、本発明の実施形態による照応置換の第２の例示的な方法の展開図である。プロセスはステップＳ２５２０で開始し、ステップＳ２５２５に続行する。

重要談話構成要素はステップＳ２５２５で決定される。重要談話構成要素は、通常、前のステップで決定され、取り出される。しかしながら、重要談話構成要素は、統計、キーワード、知識ベース等を使用して動的に決定されてもよい。重要談話構成要素が決定されてから、制御はステップＳ２５３０に続行する。

次に重要談話構成要素の解決されていない照応がステップＳ２５３０で決定される。例えば、重要談話構成要素の中の任意の代名詞は、解決されていない照応としてフラグが立てられる。次に制御はステップＳ２５３５に続行する。

ステップＳ２５３５では、潜在的な解決先行談話構成要素が決定される。代名詞又は他の未解決照応の潜在的な先行する参照を含む任意の談話構成要素は潜在的な解決先行談話構成要素である。本発明による多様な例示的な実施形態では、潜在的に解決する先行談話構成要素はＷｏｒｄＮｅｔ関係、存在論又は他の任意の関係連鎖の方法に基づいて決定される。潜在的な解決先行談話構成要素が決定されてから、制御はステップＳ２５４０に続行する。

重要談話構成要素の関連性スコアは、ステップＳ２５４０で決定された潜在的な解決先行談話構成要素を通して浸透される。潜在的な解決先行談話構成要素を通して浸透する関連性スコアは、考慮される分岐の範囲を削減してよい。これは、頻繁に、より縮約されたハイブリッドテキスト要約を生じさせる。次に制御はステップＳ２５４５に続行する。

ステップＳ２５４５では、談話構成要素の縮約された集合が重要談話構成要素、談話の構造表現及び関連性スコアに基づいて決定される。浸透チャネルは重要談話構成要素の中で潜在的に照応を解決できる談話構成要素に制限される。談話構成要素の縮約された集合がハイブリッドテキスト要約として選択されてから、制御はステップＳ２５５０に続行し、図４のステップＳ２６００にジャンプする。

図１３は要約されるテキストである。テキストは１２の文から構成されている。

図１４は、要約されるテキストの談話の例示的な構造表現である。談話の例示的な構造表現は結合されている談話構成要素から構成されている。例示的なテキストの行１０は、重要談話構成要素９１０として示されている。談話構成要素は、統計、キーワード、知識ベース又は他の任意の重要性の非構造基準に基づいて重要であると決定されてよい。

図１５は、本発明による関連性スコアを浸透する第１の例示的な方法を示す談話の例示的な構造表現である。重要談話構成要素１０１８は、なんらかの関連性の非構造基準に基づいて識別される。矢印はＲ値「１」により示される関連性スコア情報の談話の構造表現を通る浸透を示している。重要談話構成要素１０１８の関連性スコアは子であるため、より関連性のある子の談話構成要素の関連性スコアは親の談話構成要素ノードに割り当てられる。選択された関連性の非構造基準により決定されるように、重要な談話１０１８は最も関連性のある談話構成要素ノードであるため、重要談話構成要素１０１８の関連性スコアは親の従属ノード１０１６に割り当てられる。親のノードの関連性スコアは、順に、同じ理論的根拠に基づいて等位ノード１０１２、従属ノード１０１０、等位ノード１００２及びルート従属ノード１０１６に割り当てられる。

従属談話構成要素ノード１００１、１００４、１０１１、１０１４及び１０１７のそれぞれには、矢印により示されている被従属談話構成要素の関連性スコアが割り当てられる。最も関連性のある子のノードの関連性スコアは、等位ノードのそれぞれに割り当てられる。等位ノード１００２と１０１２は、重要談話構成要素の親のノードとしてのそれらのステータスに基づいて含まれる。次に関連性スコアは識別された等位ノード１００２と１０１２のそれぞれの子達に浸透される。このようにして、従属ノード１０１３と１０１１及びリーフノード１０１９と１０２０にも関連性スコアが割り当てられる。最も関連性のある関連性スコアの各談話構成要素がハイブリッドテキスト要約に選択される。

図１６は、本発明に従って関連性スコアを浸透する第２の例示的な方法を示す談話の例示的な構造表現である。重要談話構成要素１０１６は、一つ又は複数の関連性の非構造基準に基づいて決定される。浸透は等位構造及び二分の子のノードの処理において前述した方法とは異なる。等位ノード又は二分ノードの子達のより関連性のある関連性スコアはそれぞれの先行する同位に割り当てられる。これにより、ハイブリッドテキスト要約９２０に含まれる談話構成要素の数が削減する。

図１７は、本発明に従って逆数スコアを浸透する第３の例示的な方法を示す談話の例示的な構造表現の第１の図である。例示的なテキストの行４と５は例示的な目的のために省略されている。談話構成要素のそれぞれは、被従属エッジに１を加えたものの数に基づいて従属レベルＬでマーキングされる。各リーフノードには、従属レベルの逆数に等しいスコア「ｉ」が割り当てられる。

ｉ＝１／Ｌ（２）

次に、スコアの低い方の値が、以下の規則に基づき談話の構造表現を通して浸透される。スコア「ｉ」の任意のノードでは、親がさらに低いスコアを有さない場合にはスコアを親に割り当てる。スコア「ｉ」の任意の従属ノードでは、従属の子のノードのスコアがさらに低くない場合には従属子のノードにスコアを割り当てる。スコア「ｉ」の任意の等位ノード又は二分ノードでは、子のノードがさらに低いスコアを有さない場合、各子のノードにスコア「ｉ」を割り当てる。関連性スコアは、次に以下のようなスコア及び従属レベルに基づいて決定される。

ｒ＝１−（Ｌ−１）^*ｉ（３）

ここで、ｒは関連性スコアであり、Ｌは従属レベルであり、「ｉ」はスコア１／Ｌである。

図１８は、本発明に従って逆数スコアを浸透する第３の例示的な方法を示す談話の例示的な構造表現の第２の図である。次に関連付けられる関連性スコアは、式（３）又は他の関数に基づいて決定される。

図１９は、本発明による閾値重要性レベルに基づいてハイブリッドテキスト要約に談話構成要素を選択する例示的な方法を示す談話の例示的な構造表現の第３の図である。例示的なテキストの行４と５は、例示的な目的のために省略されている。「１／２」の重要性閾値関連性レベルが指定される。ハイブリッドテキスト要約９３０は、「１／２」閾値関連性レベルを超えて関連性スコアと関連付けられる談話構成要素から構成される。

図２０は、本発明に従った照応解決に基づいて関連性スコアの浸透を示す談話の例示的な構造表現の第１図である。行５は、重要談話構成要素として識別される。この方法では、関連性スコアは、談話構成要素関連性スコアの調整が、談話構成要素が選択された談話構成要素リーフノードの対象を潜在的に解決できる場合にだけ発生するように限定的に浸透される。このようにして、語「温かいスープ(a hot soup)」が行５の「そのスープ(the

soup)」に対する参照を潜在的に解決するために、行４が追加される。しかしながら、行４を加えると、対象「それらは(they)」を導く。語「それらは(they)」は、行３に関連性スコアを浸透することにより解決される。行３は、対象を一意的に識別する語「麺類(Noodles)」を含む。本発明による多様な他の例示的な実施形態では、語「麺類(Noodles)」はさらに圧縮されたハイブリッドテキスト要約９２３を形成するために行４に代入されてよい。

図３及び図５に説明されるハイブリッド要約システム１００、１１０の回路１０〜９０のそれぞれは、適切にプログラミングされた汎用コンピュータの部分として実現できる。代わりに、前記に概略されたハイブリッド要約システム１００、１１０の１０〜９０は、ＡＳＩＣ内の物理的に別個のハードウェア回路として、つまりＦＰＧＡ、ＰＤＬ、ＰＬＡ又はＰＡＬを使用して、あるいは離散論理要素又は離散回路要素を使用して実現できる。前記に概略されたハイブリッド要約システム１００、１１０の回路１０〜９０のそれぞれが採る特定の形式は設計選択肢であり、当業者にとって明白であり予測できるであろう。

さらに、ハイブリッド要約システム１００、１１０及び／又は前述された多様な回路のそれぞれは、それぞれソフトウェアルーチン、プログラミングされた汎用コンピュータで実行するマネージャ又はオブジェクト、特殊目的コンピュータ、マイクロプロセッサ等として実現できる。このケースでは、ハイブリッド要約システム１００、１１０及び／又は前述された多様な回路のそれぞれは、それぞれ、サーバ等上に常駐するリソースとして、通信網に埋め込まれる一つ又は複数のルーチンとして実現できる。ハイブリッド要約システム１００、１１０及び前述された多様な回路は、ウェブサーバ又はクライアントデバイスのハードウェアシステム及びソフトウェアシステムなどのソフトウェア及び／又はハードウェアシステムの中にハイブリッド要約システム１００、１１０を物理的に組み込むことによっても実現できる。

図３及び図５に図示されるように、メモリ２０は、改変可能な揮発性又は不揮発性のメモリ又は改変不可つまり固定されたメモリの任意の適切な組み合わせを使用して実現できる。改変可能なメモリは、揮発性であるか、不揮発性であるかに関係なく、スタティック又はダイナミックＲＡＭ、フロッピー（登録商標）ディスクとディスクドライブ、書き込み可能又は再書き込み可能の光ディスクとディスクドライブ、ハードディスクドライブ、フラッシュメモリ等の一つ又は複数を使用して実現できる。同様に、改変不可つまり固定されたメモリはＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭ又はＤＶＤ−ＲＯＭディスクなどの光ＲＯＭディスク、及びディスクドライブ等の任意の一つ又は複数を使用して実現できる。

図１、図３及び図５に示される通信リンク９９は、それぞれ直接ケーブル接続、ワイドエリアネットワーク又はローカルエリアネットワーク上の接続、イントラネット上の接続、インターネット上の接続、又は他の分散処理ネットワーク又はシステム上の接続を含む、ハイブリッド要約システム１００、１１０に通信装置を接続するための既知の又は今後開発される装置又はシステムである場合がある。一般的には、通信リンク９９は装置を接続し、通信を容易にするために有用な任意の既知の又は今後開発される接続システム又は構造である場合がある。

さらに、通信リンク９９がネットワークに対する有線リンク又は無線リンクである場合があることが理解される必要がある。ネットワークはローカルエリアネットワーク、ワイドエリアネットワーク、イントラネット、インターネット、又は他の分散処理記憶ネットワークである場合がある。

本発明は上記概略された例示的な実施形態とともに説明されてきたが、多くの代替策、変型及び変形が当業者に明らかになるであろうことは確かである。したがって、上述されたような本発明の例示的な実施形態は、制限的ではなく例証となることが意図される。多様な変更は本発明の精神及び範囲を逸脱することなく加えられてよい。

本発明による例示的なハイブリッド要約システムの概要である。本発明の例示的な実施形態によるハイブリッドテキスト要約を決定する第１の方法である。本発明の例示的な実施形態による第１のハイブリッド要約システムである。本発明の例示的な実施形態によるハイブリッドテキスト要約を決定する第２の方法である。本発明の例示的な実施形態による第２のハイブリッド要約システムである。本発明の実施形態による分割規則を記憶するための例示的なデータ構造である。本発明の実施形態による結合規則情報を記憶するための例示的なデータ構造である。本発明の実施形態による関連性スコアを浸透する第１の例示的な方法の展開図である。本発明の実施形態による関連性スコアを浸透する第２の例示的な方法の展開図である。本発明の例示的な実施形態による関連性スコアを浸透する第３の例示的な方法の展開図である。本発明の実施形態による照応置換の第１の例示的な方法の展開図である。本発明の実施形態による照応置換の第２の例示的な方法の展開図である。要約されるテキストである。要約されるテキストのための談話の例示的な構造表現である。本発明による関連性スコアを浸透する第１の例示的な方法を示す談話の例示的な構造表現である。本発明による関連性スコアを浸透する第２の例示的な方法を示す談話の例示的な構造表現である。本発明による逆スコアを浸透する第３の例示的な方法を示す談話の例示的な構造表現の第１の図である。本発明による逆スコアを浸透する第３の例示的な方法を示す談話の例示的な構造表現の第２の図である。本発明による閾値重要度レベルに基づいたハイブリッドテキスト要約のために談話構成要素を選択する例示的な方法を示す談話の例示的な構造表現である第３の図である。本発明による照応解決に基づいた関連性スコアの浸透を示す談話の例示的な構造表現の第１の図である。

符号の説明

１００ハイブリッド要約システム
２００情報リポジトリ
３００ウェブ使用可能パーソナル・コンピュータ
４００ウェブ使用可能タブレット・コンピュータ
１００００、１０００１、１０００２文書

Claims

テキストの談話構成要素を決定するステップと、
テキストの談話の構造表現を決定するステップと、
統計、キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて談話構成要素の関連性スコアを決定するステップと、
談話の構造表現に基づいて関連性スコアを浸透するステップと、
閾値重要性スコアと比較した関連性スコアにより、談話構成要素に基づいてハイブリッドテキスト要約を決定するステップと、
を有するハイブリッドテキスト要約を決定する方法。
前記談話分析の理論が、言語談話モデル、統一言語談話モデル、修辞構造理論、談話構造理論及び構造化談話表現理論の少なくとも一つである、請求項１に記載のハイブリッドテキスト要約を決定する方法。
前記関連性スコアを浸透するステップが、
子の談話構成要素ノードがより関連性のある場合に、構造表現中の子の談話構成要素ノードごとに、子の談話構成要素ノードの関連性スコアを親の談話構成要素ノードに割り当てるステップと、
被従属談話構成要素がより関連性がある場合に、任意の従属ノードについて、従属談話構成要素に被従属談話構成要素の関連性スコアを割り当てるステップと、
任意の等位ノードについて、最も関連性のある子の関連性スコアを他の子の談話構成要素ノードに割り当てるステップと、
を有する、請求項１に記載のハイブリッドテキスト要約を決定する方法。
前記関連性スコアを浸透するステップが、
子の談話構成要素ノードが親より関連性がある場合に、構造表現中の子の談話構成要素ノードごとに、親の談話構成要素ノードに子の談話構成要素ノードの関連性スコアを割り当てるステップと、
等位にされた談話構成要素ノードごとに、等位にされた談話構成要素ノードの関連性スコアをそれぞれの先行より関連性がない同位のノードに割り当てるステップと、
等位にされた談話構成要素ノードではなく、被従属談話構成要素ノードではない子の談話構成要素ノードごとに、親の談話構成要素が子より関連性がある場合に、親の談話構成要素ノードの関連性スコアを子の談話構成要素ノードに割り当てるステップと、
等位にされた談話構成要素ノードごとに、等位にされた談話ノード及びすべての同位が親のノードより関連性がない場合に、親の談話構成要素ノードの関連性スコアを等位にされた談話構成要素ノードに割り当てるステップと、
被従属談話構成要素が従属ノードより関連性がある場合に、被従属談話構成要素ノードごとに、被従属談話構成要素ノードの関連性スコアを従属談話構成要素に割り当てるステップと、
ノードごとに、その関連性スコアが別のノードの関連性スコアに変更されるノードが見つからなくなるまで前記ステップを繰り返すステップと、
を有する請求項１に記載のハイブリッドテキスト要約を決定する方法。
テキストの談話構成要素を決定するステップと、
テキストの談話の構造表現を決定するステップと、
談話構成要素の関連性スコアを決定するステップと、
談話の構造表現に基づいて関連性スコアを浸透するステップと、
閾値重要性スコアに比較した関連性スコアにより談話構成要素に基づいてハイブリッドテキスト要約を決定するステップと、
を有し、
前記関連性スコアを浸透するステップは、
談話構成要素リーフノードごとに、被従属エッジに１を加えた数を決定するステップと、
被従属エッジ＋１の逆数に基づいてスコアを決定するステップと、
スコアの関連性がより少ない場合に、談話構成要素ノードごとに、子の談話構成要素ノードのスコアを親の談話構成要素ノードに割り当てるステップと、
被従属談話構成要素スコアがより低い場合に、任意の従属談話構成要素ノードについて、被従属談話構成要素ノードのスコアを従属談話構成要素ノードに割り当てるステップと、
任意の等位構造談話構成要素ノードの関連性スコアを、より低い場合に、子の談話構成要素の等位のそれぞれに割り当てるステップと、
スコア及び従属レベルに基づいて、調整された関連性スコアを決定するステップと、
を有する、
ハイブリッドテキスト要約を決定する方法。
照応を含むあらゆるリーフ談話構成要素を決定するステップと、
照応ごとに、照応のユニークな先行する対象を決定するステップと、
照応について、リーフ談話構成要素にユニークな先行する対象を代入するステップと、
閾値重要性スコアよりさらに関連性のある関連性スコアにより、談話構成要素の集合からユニークな先行する対象を含む談話構成要素を削除するステップと、
をさらに有する請求項１のハイブリッドテキスト要約を決定する方法。
関連性スコアを浸透するステップが、
重要談話構成要素ノードを決定するステップと、
未解決照応を決定するステップと、
照応を解決する可能性のある潜在的な先行する対象を含む潜在的な解決する談話構成要素を決定するステップと、
潜在的な解決する談話構成要素の縮小された範囲を通して、重要談話構成要素の関連性スコアを浸透するステップと、
関連性スコアに基づいて、談話構成要素の縮小された範囲を決定するステップと、
を有する請求項１に記載のハイブリッドテキスト要約を決定する方法。
テキストを取り出す入力／出力回路と、
テキストの談話構成要素を決定し、談話の構造表現に談話構成要素を結合するプロセッサと、
キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて、談話構成要素の関連性スコアを決定する関連性スコア決定回路と、
談話の構造表現に基づいて、談話構成要素関連性スコアを浸透する浸透回路と、
を備え、
前記プロセッサが、閾値重要性スコアを超える関連性スコアにより談話構成要素に基づいて、ハイブリッドテキスト要約を決定する、
ハイブリッドテキスト要約を決定するシステム。
前記談話分析の理論が、言語談話モデル、統一言語談話モデル、修辞構造理論、談話構造理論及び構造化談話表現理論の少なくとも一つである、請求項８に記載のハイブリッドテキスト要約を決定するシステム。
前記浸透回路が、子の談話構成要素ノードがより関連性がある場合に、構造表現中の子の談話構成要素ノードごとに、子の談話構成要素ノードの関連性スコアを親の談話構成要素ノードに割り当て、
前記浸透回路が、被従属談話構成要素がより関連性がある場合に、任意の従属ノードについて、従属談話構成要素に被従属談話構成要素の関連性スコアを割り当て、
前記浸透回路が、任意の等位ノードについて、最も関連性のある子の関連性スコアを他の子の談話構成要素ノードに割り当てる、
請求項８に記載のハイブリッドテキスト要約を決定するシステム。
前記浸透回路が、子の談話構成要素ノードが親より関連性がある場合に、構造表現中の子の談話構成要素ごとに、子の談話構成要素ノードの関連性スコアを親の談話構成要素ノードに割り当て、
前記浸透回路が、等位にされた談話構成要素ノードごとに、それぞれの先行より関連性がない同位のノードに、等位にされた談話構成要素ノードの関連性スコアを割り当て、
前記浸透回路が、等位にされた談話構成要素ノードではなく、被従属談話構成要素ノードではない子の談話構成要素ノードごとに、親の談話構成要素が子より関連性がある場合に、子の談話構成要素ノードに親の談話構成要素ノードの関連性スコアを割り当て、
前記浸透回路が、等位にされた談話ノード及びすべての同位が親のノードより関連性が少ない場合に、等位にされた談話構成要素ノードごとに、親の談話構成要素ノードの関連性スコアを等位にされた談話構成要素ノードに割り当て、
前記浸透回路が、被従属談話構成要素が従属ノードより関連性がある場合に、被従属談話構成要素ノードごとに、被従属談話構成要素ノードの関連性スコアを従属談話構成要素に割り当て、
前記浸透回路が、関連性スコアが別のノードの関連性スコアに変更されるノードを見つけられなくなるまで、ノードごとに、前記ステップを繰り返す、
請求項８に記載のハイブリッド要約を決定するシステム。
テキストを取り出す入力／出力回路と、
テキストの談話構成要素を決定し、談話構成要素を談話の構造表現の中に結合するプロセッサと、
少なくとも一つの関連性の非構造基準に基づいて、談話構成要素の関連性スコアを決定する関連性スコア決定回路と、
談話の構造表現に基づいて、談話構成要素関連性スコアを浸透する浸透回路と、
を有し、
前記浸透回路が、談話構成要素リーフノードごとに、被従属エッジに１を加えた数の逆数に基づいて、被従属エッジに１を加えた数及びスコアを決定し、
前記浸透回路が、スコアの関連性がより少ない場合に、談話構成要素ノードごとに、子の談話構成要素ノードのスコアを親の談話構成要素に割り当て、
前記浸透回路が、被従属談話構成要素スコアがより低い場合に、任意の従属談話構成要素ノードについて、被従属談話構成要素ノードのスコアを従属談話構成要素ノードに割り当て、
前記浸透回路が、より低い場合に、等位の子の談話構成要素のそれぞれに任意の等位談話構成要素ノードのスコアを割り当て、
前記プロセッサが、スコア及び従属レベルに基づき調整された関連性スコアを決定し、
ハイブリッドテキスト要約が閾値重要性スコアを超える関連性スコアにより談話構成要素に基づいて決定される、
ハイブリッドテキスト要約を決定するシステム。
前記プロセッサが、照応を含むあらゆるリーフ談話構成要素を決定し、
前記プロセッサが、照応ごとに、照応の任意のユニークな先行する対象を決定し、
前記プロセッサが、ユニークな先行する対象を、照応対象の先行する談話構成要素に代入し、
前記プロセッサが、閾値重要性スコアを超える関連性スコアにより談話構成要素からユニークな対象を含む先行する談話を削除する、
請求項８に記載のハイブリッドテキスト要約を決定するシステム。
前記浸透回路が、照応を含むあらゆるリーフ談話構成要素を決定し、
前記浸透回路が、照応ごとに、照応の任意のユニークな先行する対象を決定し、
前記浸透回路が、ユニークな先行する対象を照応のリーフ談話構成要素に代入し、
前記浸透回路が、より関連性のある関連性スコアにより談話構成要素の集合からユニークな先行する対象を含む談話構成要素を削除する、
請求項８に記載のハイブリッドテキスト要約を決定するシステム。
前記プロセッサが、関連性の非構造基準に基づいて重要談話構成要素ノードを決定し、
重要談話構成要素の中の未解決対象を決定し、
対象を解決する可能性がある潜在的な解決する談話構成要素を決定し、
潜在的な解決する談話構成要素の縮小された範囲を通して重要談話構成要素の関連性スコアを浸透し、
関連性スコアに基づいて談話構成要素の縮小された範囲を決定する、
請求項８に記載のハイブリッドテキスト要約を決定するシステム。
テキストの談話構成要素を決定する命令と、
テキストの談話の構造表現を決定する命令と、
キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて、談話構成要素の関連性スコアを決定する命令と、
談話の構造表現に基づいて関連性スコアを浸透する命令と、
閾値重要性スコアと比較した関連性スコアにより談話構成要素に基づいて、ハイブリッドテキスト要約を決定する命令と、
を有する、ハイブリッドテキスト要約を決定するためにコンピュータをプログラミングするために使用可能な制御プログラム。
談話分析の理論を決定するステップと、
候補セグメントを決定するステップと、
談話を続行することに関連付けられる候補セグメントの品詞（ｐａｒｔ−ｏｆ−ｓｐｅｅｃｈ）タグ、蓋然性構文解析ツール、統計構文解析ツール、有限状態構文解析ツール、記号構文解析ツール、語彙目録及びＷｏｒｄＮｅｔ関係の少なくとも一つに基づいて決定される属性を決定するステップと、
を有する談話構成要素にテキストを分割する方法。
テキストの談話構成要素を決定するステップと、
談話構成要素の談話分析分類の理論、及び統語的な制限、意味論的な制限及び語彙的−意味論的な制限の少なくとも一つに基づいて談話の構造表現に談話構成要素を結合するステップと、
を有する談話の構造表現を決定する方法。
テキストの談話構成要素を決定する手段と、
テキストの談話の構造表現を決定する手段と、
キーワード、知識ベースの少なくとも一つに基づいて決定される少なくとも一つの関連性の非構造基準に基づいて談話構成要素の関連性スコアを決定する手段と、
談話の構造表現に基づいて関連性スコアを浸透する手段と、
閾値重要性スコアと比較した関連性スコアにより談話構成要素に基づいてハイブリッドテキスト要約を決定する手段と、
を有するハイブリッドテキスト要約システム。
テキストの談話構成要素を決定する手段と、
テキストの談話の構造表現を決定する手段と、
談話構成要素の関連性スコアを決定する手段と、
談話の構造表現に基づいて関連性スコアを浸透する手段と、
閾値重要性スコアと比較した関連性スコアにより談話構成要素に基づいてハイブリッドテキスト要約を決定するための手段と、
を有し、
前記関連性スコアを浸透する手段は、
談話構成要素リーフノードごとに、被従属エッジに１を加えた数を決定し、
被従属エッジ＋１の逆数に基づいてスコアを決定し、
スコアの関連性がより少ない場合に、談話構成要素ノードごとに、親の談話構成要素ノードに子の談話構成要素ノードのスコアを割り当て、
被従属談話構成要素スコアがより低い場合に、任意の従属談話構成要素ノードについて、従属談話構成要素ノードに被従属談話構成要素ノードのスコアを割り当て、
等位の子の談話構成要素のそれぞれに任意の等位談話構成要素ノードの関連性スコアを、より低い場合に、割り当て、
スコア及び従属レベルに基づいて調整された関連性スコアを決定する、
ハイブリッドテキスト要約システム。