JP2005266980A

JP2005266980A - 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム

Info

Publication number: JP2005266980A
Application number: JP2004075242A
Authority: JP
Inventors: Tomoko Okuma; 智子大熊; Kazuki Hirata; 和貴平田
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2004-03-16
Filing date: 2004-03-16
Publication date: 2005-09-29

Abstract

【課題】関連文書から抽出した構文意味情報と視聴覚データの持つ索引情報を用いて、再利用可能な意味的に詳細な索引を視聴覚データに自動的に付与する。
【解決手段】自然言語処理部１０３は、テキスト・データの構文意味解析を行ない、構文意味情報を抽出する。索引データ解析部１０４は、関連する索引付き視聴覚データに付与された索引を抽出する。索引付与部１０６は、自然言語処理部１０３並びに索引データ解析部１０４でそれぞれ抽出されたデータに対し、索引関連付け規則保持部１０５に保持された規則を適用する。そして、このルールによって導かれた索引を索引記憶部１０７に保持する。
【選択図】図１

Description

本発明は、自然言語処理を用いてデータに関連付けられたテキスト・データを処理する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに係り、特に、会議資料や議事録からキーワードや文を抽出して、例えば会議を収録したビデオ・データの検索や要約をまとめるなど再利用を行なうための索引を自動的に付与する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに関する。

さらに詳しくは、本発明は、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに係り、特に、再利用可能な程度に意味的に詳細な索引を視聴覚データに自動的に付与する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに関する。

昨今のコンピューティング技術の発展に伴い、コンピュータがオフィスや一般家庭内に深く浸透してきている。これと相俟って、さまざまな適用業務はコンピュータの支援を受けることができるようになってきている。例えば、企業における産業活動やその他のさまざまに日常生活において、会議が頻繁に行なわれているが、会議室にコンピュータを取り込むことで、会議の運用を支援することができる。

会議支援システムの一例として、遠隔会議システムを取り上げることができる。遠隔会議システムによれば、遠隔に位置する複数の会議室において、カメラやマイクなどの画像・音声入力装置や、モニタやスピーカなどの画像・音声出力装置を設置し、通信回線を利用して、各会議室において行なわれる発言や質疑応答などのイベントを共有し、遠隔地間で議事を同期して進行させることができる。

例えば、複数のユーザが端末装置のネットワーク接続によって対話を可能とした会議システムとしての対話システム制御方式がある（例えば、特許文献１を参照のこと）。この方式によれば、各端末装置において対話への参加、参加者の離脱を処理することによって、自由な参加や離脱を可能にして会議に相当する対話をすることができる。

また、会議の進行上、会議の参加者を撮影した映像や、参加者の初全内容などの音声だけでなく、会議で使用されるホワイトボードや、スライドその他のプレゼンテーション資料など、会議に関連するさまざまな資料を会議室間で共有し、保管することができる。

さらに、会議システムでは、映像や音声などの会議の進行上で発生するさまざまなデータをデジタル化して保存し、さらに、ホワイトボードや、スライドその他のプレゼンテーション資料など、会議に関連するさまざまなメディア・データを、映像や音声すなわち会議の進行と同期させて保管することができる。このように会議に関連するデータを保存しておくことにより、これらを次回の会議において再利用することが可能となる。

例えば、プレゼンテーションを収録したビデオ・データと、その場で使用された資料画像データとを実際のプレゼンテーション行為を反映させて対応付け、これによってプレゼンテーションを収録したコンテンツの品質を高めることができる（例えば、非特許文献１を参照のこと）。この場合、カメラ収録されたビデオ・データを入力し、プレゼンテーションで使用される資料画像データ、並びにプレゼンテーションにおいてプレゼンテータが行った資料画像の切換指示をそれぞれ入力し、ビデオ・データを基準とした時間軸に対して切換指示の入力タイミングを当該切り換えられる資料画像データの表示開始タイミングとして設定する処理を行ない、複数の資料画像を切換え表示しながら行なうプレゼンテーションを収録したビデオ・データに対して使用された資料画像のデータと対応付ける。これによって、ビデオ・データの再生時には、ビデオ・データと資料画像データとを実際の使用状態を反映して対応付けることができ、プレゼンテーションを忠実に再現することができるコンテンツを作成することが可能となる。

会議は、ほぼ毎日、複数の会議において時間毎に開催される。このため、会議毎に捕捉され、蓄積された会議データは膨大であり、その数は日々増加していく。ここで、会議での決定事項を見返すなど、会議データを再利用したいときに、所望の会議における所望の議題が扱われた箇所を探し出す手間が煩わしくなる、あるいは探し出すことが困難若しくは不可能である、という問題が浮上する。

ここで、会議の内容を収録したビデオ・データを音声認識して、テキスト・ベースの会議資料を作成することができる。さらに会議資料や議事録などからキーワードや文を抽出して、会議を収録したビデオ・データの検索や要約など再利用を行なうための索引を付与することが可能である。

例えば、タグ付き属性情報中のテキストより抽出した単語を利用して索引の付与を行なうことができる（例えば、特許文献２を参照のこと）。この場合、タグ付き属性情報中のテキストより抽出した単語で、不要語に該当しない個々の単語(見出し語）と、各タグとの関連度を要素とした行列であるタグ付き属性情報による概念ベースを作成し、対象コンテンツを検索する際に、該タグつき属性情報による概念ベースを参照し、検索の質問文中に含まれる見出し語と関連度が高いタグに係る属性情報を検索することができる。

また、関連する文書から特定の品詞を抽出して索引とすることができる（例えば、特許文献３を参照のこと）。すなわち、所定のテキスト・データを解釈してインデックスを得るため、単語認識によりテキスト・データから、所定の品詞（インデックス）として名詞を抽出したり、インデックスとしてキーワードを抽出したりする。

しかしながら、索引を意味検索や要約などに再利用する場合、上記のような単語に基づく情報、言い換えれば形態素解析結果に基づく情報では不充分である。

また、構文解析を利用して、関連付けられた文書の依存関係を抽出することができる（例えば、特許文献４を参照のこと）。この場合、文書データを要素に分解する文章解析手段と、該分解された要素に対応するキーワードに基づいてハイパーメディア部品を検索するハイパーメディア部品検索手段と、該検索されたハイパーメディア部品を文書データ中の対応する要素の位置に関連付けてリンクさせるハイパーメディア部品連結手段によりハイパーメディアを構築し、ユーザが文書データに基づいて、ハイパーメディア部品のサンプルなどを用いて極めて簡単にハイパーメディア文書を作成することを可能にする。

しかしながら、構文解析結果により得られる単語間の係り受け関係すなわち依存関係を用いたとしても、単語の情報すなわち形態素解析結果を用いた場合と同様に、索引や意味検索や要約などに再利用することは困難である。

一方、意味的に詳細な索引を付与して再利用する方式も挙げられる。例えば、相互の関係によって構造化された１又は複数の要素を含み、保存される情報を記述する構造化索引を作成し、前記構造化索引と前記情報の記憶位置のポインタとをマッチドペアとして結合させる（例えば、特許文献５を参照のこと）。この好適例では、ヒューリスティック・インターフェースが、写真クリップ等の情報をユーザに提示し、ユーザから単語句等の入力文字列を受信する。ヒューリスティック・インターフェースは、ユーザが入力文字列を、文法規則のセットに従う構造を持つ要素へと組織化するのを支援する。

また、文書データを要素に分解し、分解された要素に対応するキーワードに基づいてハイパーメディア部品を検索し、検索されたハイパーメディア部品を文書データ中の対応する要素の位置に関連付けてリンクさせることにより、ハイパーメディア部品のサンプルなどを用いて極めて簡単にハイパーメディア文書を作成することを可能にする（例えば、特許文献６を参照のこと）。

しかしながら、意味的に詳細な索引を付与して再利用するというこれらの方式では、索引の付与は人手で入力される。すなわち、自動的な索引付与の場合、索引の質が低減し、この索引を再利用することが困難である。また、再利用可能な程度に詳細な索引を付与する場合、人手によるコストが発生する。

上述した従来技術は、要するに会議資料などのテキスト・データを形態素解析し、抽出された単語情報を索引に利用する、あるいは構文解析により得られた文章の係り受け関係を基に索引を作成するというものである。

しかしながら、形態素解析により得られる単語情報では、基本的には情報量が少なく、十分な成果が得られない。また、構文解析の結果として、一般に、個々の形態素が係り受け関係などを基にして接合された木構造しか得られず、意味的に詳細な索引を作成するためには情報量が十分ではない。

特開平３−１９２８４５号公報特開２００２-１８３１９５号公報特開２００３-１５０９３１号公報特開平９-２８２３２７号公報特開平６-３２５１０４号公報特開平９-３４７７５号公報特願２００３−２０１６７３号

本発明の目的は、会議資料や議事録からキーワードや文を抽出して、会議を収録したビデオ・データの検索や要約をまとめるなど再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することにある。

本発明のさらなる目的は、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することにある。

本発明のさらなる目的は、再利用可能な程度に意味的に詳細な索引を視聴覚データに自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することにある。

本発明は、上記課題を参酌してなされたものであり、その第１の側面は、原データに関連付けられたテキスト・データを処理する情報処理装置であって、テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名又は意味的形式を取得する自然言語処理手段と、原データを解析してその特徴を取得する原データ解析手段と、前記原データが持つ特徴に応じた文法的な機能名又は意味的形式を持つ部分をテキスト・データから取り出して索引として保持する索引付与手段とを具備することを特徴とする情報処理装置である。

ここで、原データは会議を収録したビデオ・データ又はそのメタ情報などであある。そして、テキスト・データは、例えば会議で使用された会議資料、議事録、又は前記ビデオ・データから音声認識又はその他の処理により抽出されたテキスト・データである。

前記原データ解析手段は、収録された会議における対話形式を取得する。また、原データが持つ特徴毎の、索引として要求される文法的な機能名又は意味的形式を記述した索引関連付け規則を備えている。例えば、視聴覚データが質疑応答に関するものである場合など、視聴覚データのタイプに応じて、索引として使用すべき単語の意味属性（ｐｒｅｄｉｃａｔｅ）などを索引関連付け規則として規定している。そして、前記索引付与手段は、索引関連付け規則によって導かれた索引を保持する。

したがって、本発明によれば、会議を収録した視聴覚データなどを再利用するために必要又は有効となる意味的に詳細な索引を、会議資料や議事録などの関連文書から構文意味解析により抽出した構文意味情報と視聴覚データを解析して得た情報が持つ索引情報を用いて、視聴覚データに自動的に付与することができる。これによって、索引を人手で付与するコストを低減すると同時に、再利用可能な索引を付与することができる。

例えば、前記原データ解析手段により原データが質疑応答であると特定された場合には、前記索引付与手段は、テキスト・データの構文意味解析結果をスキャンして疑問文となるセンテンスを抽出し、疑問文の索引として要求される文法的な機能名又は意味的形式を当該センテンスの構文意味解析結果の中から探索する。また、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンして疑問文に対する応答文となるセンテンスを抽出し、応答文の索引として要求される文法的な機能名又は意味的形式を当該センテンスの構文意味解析結果の中から探索する。そして、導き出された索引をそれぞれ疑問文の索引、並びに応答文の索引として保持する。

前記索引付与手段は、例えば、疑問文のセンテンス自体と、疑問文の形式（ｑ−ｔｙｐｅ）、質問されている対象（ｑ−ｆｏｃｕｓ）を疑問文に関する索引として取り出す。

ここで、前記自然言語処理手段は、ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒ（レキシカル・ファンクショナル・グラマー：ＬＦＧ（語彙機能的文法））文法理論に基づく構文意味解析を行なうようにしてもよい。このような場合、センテンス毎の各属性との属性値の対応関係を記述したｆ−ｓｔｒｕｃｔｕｒｅが構文意味解析結果として出力される。

したがって、前記索引付与手段は、疑問文のｆ−ｓｔｒｕｃｔｕｒｅ（エフ−ストラクチャ）のうち、疑問タグを含む述部、及び疑問タグを含む述部の質問形式を索引として抽出することができる。あるいは、疑問文のｆ−ｓｔｒｕｃｔｕｒｅに疑問タグを含まない場合は、ｙｅｓ／ｎｏ質問形式を索引として抽出する。

また、前記索引付与手段は、応答文のセンテンス自体と、疑問文における質問の対象に対応する回答の対象（ａ−ｆｏｃｕｓ）を応答文に関する索引として取り出すようにしてもよい。例えば、応答文を構文意味解析して得たｆ−ｓｔｒｕｃｔｕｒｅのうち、疑問文において疑問タグを含む述部に対応するインデックスの述部を回答の対象として抽出することができる。

また、前記原データ解析手段により原データが商品の売り込みであると特定された場合には、前記索引付与手段は、商品の機能と商品に対する要望を索引として付与するようにしてもよい。

この場合、前記索引付与手段は、例えば、可能属性（ｐｏｓｓｉｂｌｅ）を持ち且つ発言者がプレゼンターであるセンテンスに対し商品の機能（ｆｕｎｃｔｉｏｎ）を表す索引を付与することができる。あるいは、可能属性を持ち、発言者がプレゼンターでなく、且つ疑問文形式のセンテンスに対し商品の要望（ｒｅｑｕｅｓｔ）を表す索引を付与することができる。あるいは、可能属性を持たないが、希望を言及するセンテンスに対し商品の要望を表す索引を付与することができる。

また、本発明の第２の側面は、原データに関連付けられたテキスト・データの処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名又は意味的形式を取得する自然言語処理ステップと、原データを解析してその特徴を取得する原データ解析ステップと、前記原データが持つ特徴に応じた文法的な機能名又は意味的形式を持つ部分をテキスト・データから取り出して索引として保持する索引付与ステップとを具備することを特徴とするコンピュータ・プログラムである。

本発明の第２の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第２の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第１の側面に係る情報処理装置と同様の作用効果を得ることができる。

本発明によれば、会議資料や議事録からキーワードや文を抽出して、会議を収録したビデオ・データの検索や要約をまとめるなど再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することができる。

また、本発明によれば、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することができる。

本発明によれば、再利用可能な意味的に詳細な索引を、関連文書から構文意味解析により抽出した構文意味情報と視聴覚データの持つ索引情報を用いて、視聴覚データに自動的に付与することができる。これによって、索引を人手で付与するコストを低減すると同時に、再利用可能な索引を付与することができる。

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。

以下、図面を参照しながら本発明の実施形態について詳解する。

図１には、本発明の一実施形態に係る情報処理装置１００の機能構成を模式的に示している。この情報処理装置１００は、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与するものであり、図示の通り、テキスト・データ記憶部１０１と視聴覚データ記憶部１０２と、自然言語処理部１０３と、索引データ解析部１０４と、索引関連付け規則保持部１０５と、索引付与部１０６と、索引記憶部１０７で構成される。

テキスト・データ記憶部１０１は、会議資料や議事録などの関連するテキスト・データを保持している。また、テキスト・データ記憶部１０１は、会議を収録したビデオを音声認識して得られたテキスト・データを保持しておいてもよい。

自然言語処理部１０３は、テキスト・データ記憶部１０１からこれらのテキスト・データを取り出し、構文意味解析を行ない、構文意味情報を抽出する。ここでは、構文意味解析システムとしてＬＦＧ（ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒ（レキシカル・ファンクショナル・グラマー）：語彙機能的文法）に基づく処理システムを想定する。

また、視聴覚データ記憶部１０２は、会議の内容を収録したビデオ・データ、あるいはビデオ・データのメタ情報などの視聴覚データを格納している。索引データ解析部１０４は、視聴覚データ記憶部１０２から関連する索引付き視聴覚データを取り出し、視聴覚データに付与された索引を抽出する。

索引付与部１０６は、自然言語処理部１０３並びに索引データ解析部１０４でそれぞれ抽出されたデータに対し、索引関連付け規則保持部１０５に保持された規則を適用する。そして、この索引関連付け規則によって導かれた索引を索引記憶部１０７に保持する。索引関連付け規則は、例えば、視聴覚データを解析して得られた視聴覚データの特徴（例えば、場面や状況など）と、テキスト・データのうち索引として使用すべき単語の意味属性などとの対応関係を規定するものである。例えば視聴覚データが質疑応答に関するものである場合など、視聴覚データのタイプに応じて異なる索引関連付け規則が規定している。

なお、自然言語処理部１０３、索引データ解析部１０４、並びに索引付与部１０６は、それぞれ独立した計算機システム上で構築することもできるが、単一の計算機システム上で動作する個別のアプリケーション・プログラムとして構成したり、あるいは単一のアプリケーション・プログラムにおける一連の処理ルーチンとして実装したりすることも可能である。

図２には、自然言語処理部１０３の内部構成を模式的に示している。構文・意味解析を行うための文法理論の代表的な例として、ＬＦＧを挙げることができる。自然言語処理部１０３は、このＬＦＧ文法理論に基づく構文意味解析処理に組み込んで実装することができる。ＬＦＧでは、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している。

形態素解析部２は、日本語など特定の言語に関する形態素ルール２Ａと形態素辞書２Ｂを持ち、入力文を意味的最小単位である形態素に分節して品詞の認定処理を行なう。形態素解析システムとして、例えば「茶筌（Ｃｈａｓｅｎ）」など日本語形態素解析システムを適用することができるが、本発明の要旨はこれに限定されるものではない。茶筌による形態素解析システムについては、例えば、松本裕治、北内啓、山下達雄、平野善隆、松田寛、高岡一馬、浅原正幸共著「日本語形態素解析システム茶筌ｖｅｒｓｉｏｎ２．２．１使用説明書」（奈良先端科学技術大学院大学，２０００）を参照されたい。

形態素解析処理により、例えば、「どの世代をターゲットにしているのか」という文が入力された場合、「どの｛｛ＰＲＯＮ｝世代｛Ｎｏｕｎ｝を｛ＰＰ｝ターゲット｛Ｎｏｕｎ｝に｛ＰＰ｝して｛ＡＵＸＶ｝いる｛ＡＵＸＶ｝の｛ＰＰ｝か｛ＰＰ｝」という形態素解析結果が出力される。

このような形態素解析結果は、次いで、構文意味解析部３に入力される。構文意味解析部３は、文法ルール３Ａや結合価辞書３Ｂなどの辞書を持ち、文法ルールなどに基づく句構造の解析や、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう（結合価辞書３Ｂは動詞と主語などの文中の他の構成要素との関係を記述したものであり、述部とそれに係る語の意味関係を抽出することができる）。そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表した“ｃ−ｓｔｒｕｃｔｕｒｅ（ｃｏｎｓｔｉｔｕｅｎｔｓｔｒｕｃｔｕｒｅ（シー−ストラクチャ））”と、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文などさらに意味的・機能的に解析した結果として“ｆ−ｓｔｒｕｃｔｕｒｅ（ｆｕｎｃｔｉｏｎａｌｓｔｒｕｃｔｕｒｅ（エフ−ストラクチャ））”を出力する。

ｃ−ｓｔｒｕｃｔｕｒｅは、文中の単語や句の構造を木構造形式で表したものであり、構文カテゴリによって定義される。例えば音素列を生成するための音韻学的な解釈を、ｃ−ｓｔｒｕｃｔｕｒｅを基に行なうことができる。一方、ｆ−ｓｔｒｕｃｔｕｒｅは、文法的な機能を明確に表現したものであり、文法的な機能名、意味的形式、並びに特徴シンボルにより構成される。ｆ−ｓｔｒｕｃｔｕｒｅを参照することにより、主語（ｓｕｂｊｅｃｔ）、目的語（ｏｂｊｅｃｔ）、補語（ｃｏｍｐｌｅｍｅｎｔ）、修飾語（ａｄｊｕｎｃｔ）といった意味理解を得ることができる。ｆ−ｓｔｒｕｃｔｕｒｅは、ｃ−ｓｔｒｕｃｔｕｒｅの各節点に付随する素性の集合であり、例えば属性−属性値のマトリックスの形で表現される。すなわち、［］で囲まれた中の左側は素性（属性）の名前であり、右側は素性の値（属性値）である。

なお、ＬＦＧの詳細に関しては、例えばＲ．Ｍ．Ｋａｐｌａｎ及びＪ．Ｂｒｅｓｎａｎ共著の論文“Ｌｅｘｉｃａｌ−ＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒ：ＡＦｏｒｍａｌＳｙｓｔｅｍｆｏｒＧｒａｍｍａｔｉｃａｌＲｅｐｒｅｓｅｎｔａｔｉｏｎ”（ＴｈｅＭＩＴＰｒｅｓｓ，Ｃａｍｂｒｉｄｇｅ（１９８２）．ＲｅｐｒｉｎｔｅｄｉｎＦｏｒｍａｌＩｓｓｕｅｓｉｎＬｅｘｉｃａｌ−ＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒ，ｐｐ．２９−１３０．ＣＳＬＩｐｕｂｌｉｃａｔｉｏｎｓ，ＳｔａｎｆｏｒｄＵｎｉｖｅｒｓｉｔｙ（１９９５）．）などに記述されている。

続いて、テキスト・データから具体的な索引の付与を行なう処理過程について説明する。

図３には、関連文書から自然言語処理を用いて抽出した構文意味情報と視聴覚データの持つ索引情報を用いて索引を自動的に付与するための概略的な処理手順をフローチャートの形式で示している。

自然言語処理部１０３は、テキスト・データ記憶部１０１からテキスト・データを取り出し、これらに形態素解析並びに構文意味解析からなる自然言語処理を順次適用していき、それぞれについての構文意味解析結果をｆ−ｓｔｒｕｃｔｕｒｅの形式で得る（ステップＳ１）。この構文意味解析結果により、テキスト・データに含まれる素性（属性）の名前とその素性の値（属性値）が明らかとなる。

また、テキスト・データの自然言語処理に並行して、視聴覚データ記憶部１０２からは対応する視聴覚データを読み出し、索引データ解析部１０４により解析して、視聴覚データの特徴（例えば、場面や状況など）を得る（ステップＳ２）。例えば、会議を収録したビデオ・データ又はそのメタ情報が解析され、読み出された場面が質疑応答であることを特定する。

そして、索引付与部１０６では、自然言語処理部１０３並びに索引データ解析部１０４でそれぞれ抽出されたデータに対して索引関連付け規則を適用する（ステップＳ３）。索引関連付け規則は、例えば、視聴覚データを解析して得られた視聴覚データの特徴（例えば、場面や状況など）と、構文意味解析結果との対応関係（例えばテキスト・データのうち索引として使用すべき単語の意味属性など）を規定しており、この索引関連付け規則によって導かれた索引を索引記憶部１０７に保持する。

索引関連付け規則の形態は、視聴覚データの特徴（例えば、場面や状況など）に応じてさまざまな例が考えられる。図４には、視聴覚データとしての会議を収録したビデオ・データの特徴すなわち場面（ｓｃｅｎｅ）が質疑応答形式である場合に行なわれる、索引付与の処理手順をフローチャートの形式で示している。

この場合、当該処理系に投入されたテキスト・データの構文意味解析結果をスキャンし、疑問文となるセンテンスを抽出する（Ｓ１１）。ｆ−ｓｔｒｕｃｔｕｒｅでは、センテンス毎のセンテンス型式（Ｓ−ｔｙｐｅ）が記述されているので、疑問文を容易に特定することができる。

次いで、疑問文として取り出されたセンテンスについての構文意味解析結果に対し索引関連付け規則を適用し、疑問文の索引として要求される文法的な機能名又は意味的形式を当該構文意味解析結果の中から探索する（ステップＳ１２）。

次いで、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンし、疑問文に対する応答文となるセンテンスを抽出する（Ｓ１３）。ｆ−ｓｔｒｕｃｔｕｒｅでは、センテンス毎のセンテンス型式（Ｓ−ｔｙｐｅ）が記述されているので、疑問文を容易に特定することができる。

次いで、応答文として取り出されたセンテンスについての構文意味解析結果に対し索引関連付け規則を適用し、応答文の索引として要求される文法的な機能名又は意味的形式を当該構文意味解析結果の中から探索する（ステップＳ１４）

そして、ステップＳ１２並びにステップＳ１４においてそれぞれ導き出された索引を、当該ビデオ・データを再利用するための索引データとして出力する（ステップＳ１５）。

以下では、テキスト・データから具体的な索引の付与を行なう処理過程の具体例について説明する。索引付与規則の形態として、入力されたテキスト・データが持つ文書タイプに応じたさまざまな例が考えられるが、ここでは質疑応答文を例に取る。

会議の議事録として、図５に示すようなテキスト・データがテキスト・データ記憶部１０１から取り出されたとする。図示の例では、議事録は、発言者（ｓｐｅａｋｅｒ）と発言内容（ｔｘｔ）の組み合わせからなるレコードが時系列的に配置して構成されている。

また、テキスト・データの取り出しに並行して、視聴覚データ記憶部１０２からは対応する視聴覚データが索引情報として読み出され、索引データ解析部１０４により解析される。図６には、索引データの解析により得られる視聴覚データの構成例を示している。図示の例では、視聴覚データは、いわゆるメタ情報形式で構成され、会議形式（ＭｅｅｔｉｎｇＴｙｐｅ）としてプレゼンテーション、司会者（Ｐｒｅｓｅｎｔｅｒ）として小林、場面若しくは状況（Ｓｃｅｎｅ）として質疑応答（ＱａｎｄＡ）、記録（Ｎｏｔｅ）として保存ファイル名が記述されている。

図７〜図９には、テキスト・データとして、発言者鈴木氏による発言内容「どの世代をターゲットにしているのか」、「この説明でははっきりしない」、並びに発言者小林氏による発言内容「３０代後半を狙っている」が自然言語処理部１０３に投入され、構文意味解析処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅをコード形式並びに入れ子構造形式でそれぞれ示している。図示のような入れ子構造形式でｆ−ｓｔｒｕｃｔｕｒｅを出力した場合、属性−属性値のマトリックスの形で表現され、［］で囲まれた中の左側は素性（属性）の名前であり、右側は素性の値（属性値）である。

図６に示すように、メタ情報が質疑応答（Ｑ＆Ａ）であることを示しているので、質疑応答文に関する索引関連付け規則が適用される。まず、投入されたテキスト・データの構文意味解析結果をスキャンし、疑問文となるセンテンスを抽出する。そして、この疑問文に対し索引関連付け規則を適用する。疑問文についての索引関連付け規則は、例えば、疑問文のセンテンス自体と、疑問文の形式（ｑ−ｔｙｐｅ）、質問されている対象（ｑ−ｆｏｃｕｓ）を疑問文に関する索引として取り出す。

図１０には、疑問文に対する索引関連付け規則を適用する処理手順をフローチャートの形式で示している。

テキスト・データのｆ−ｓｔｒｕｃｔｕｒｅ並びにメタ情報をそれぞれスキャンし、発言者（Ｓｐｅａｋｅｒ）がプレゼンター（Ｐｒｅｓｅｎｔｅｒ）となり（ステップＳ２１）、且つ、センテンス型式（Ｓ−ｔｙｐｅ）が疑問文（ｉｎｔｅｒｒｏｇａｔｉｖｅ）となるセンテンスを見つけ出し（ステップＳ２２）、これを変数Ｑｕｅｓｔｉｏｎに代入して記憶しておく（ステップＳ２３）。

そして、このセンテンスのｆ−ｓｔｒｕｃｔｕｒｅを参照し、ｉｎｔタグが存在するか否かを判別する（ステップＳ２４）。

ここで、センテンスのｆ−ｓｔｒｕｃｔｕｒｅにｉｎｔタグが含まれない場合には、当該疑問文の質問形式（ｑ−ｔｙｐｅ）をｙｅｓ／ｎｏ形式として出力する（ステップＳ２５）。

また、センテンスのｆ−ｓｔｒｕｃｔｕｒｅにｉｎｔタグが含まれる場合には、ｉｎｔタグが含まれている述部（ＰＲＥＤ）を質問されている対象（ｑ−ｔｙｐｅ）として出力するとともに（ステップＳ２６）、ｉｎｔタグが含まれている述部の質問形式を当該疑問文の質問形式（ｑ−ｔｙｐｅ）として出力する（ステップＳ２７）。

そして、ｉｎｔタグの含まれているインデックスをケース情報としてメモリに格納する（ステップＳ２８）。

ここでは、図５に示したテキスト・データのうち、センテンス「どの世代をターゲットにしているのか。」を構文意味解析して得られたｆ−ｓｔｒｕｃｔｕｒｅがメタ情報とともに図１０に示した処理に投入されたとする。

この場合、ｓｐｅａｋｅｒは鈴木でありｐｒｅｓｅｎｔｅｒは小林であるため、判断ブロックＳ２１の条件を満たす。さらに、この疑問文のｆ−ｓｔｒｕｃｔｕｒｅのＳ−ｔｙｐｅはｉｎｔｅｒｒｏｇａｔｉｖｅであるため、判断ブロックＳ２２の条件も満たす。したがって、ステップＳ２３では索引ｑｕｅｓｔｉｏｎの値にｓｅｎｔｅｎｃｅ、すなわち「どの世代をターゲットにしているのか」を代入する。

また、当該ｆ−ｓｔｒｕｃｔｕｒｅにはｉｎｔタグが存在するため、判断ブロックＳ２４の条件も満たす。したがって、ステップＳ２６でｉｎｔタグを含んでいるＰＲＥＤ、すなわち「世代」をｑ−ｆｏｃｕｓの値に代入する。次にステップＳ２７でｉｎｔタグを含んでいるＰＲＥＤのｑ−ｔｙｐｅ、すなわち「ｗｈｉｃｈ」をｑ−ｔｙｐｅの値に代入する。さらに、ステップＳ２８でｉｎｔタグを含んでいる索引（インデックス）、すなわち「ｏｂｊ」をケース情報としてメモリに格納する。

つまり、「どの世代をターゲットにしているのか。」から、以下に示すような索引が抽出され、疑問文に関する索引関連付けルールの適用が終了する。

<question>どの世代をターゲットにしているのか。<q-focus>世代<\q-focus><q-type>which<\q-type><\question>

疑問文に対して索引関連付け規則を適用して索引を抽出した後は、さらに疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンし、疑問文に対する応答文となるセンテンスを抽出し、今度は、応答文に対し索引関連付け規則を適用する。応答文についての索引関連付け規則は、応答文のセンテンス自体と、対応する疑問文においてケース情報とされているインデックスの述部（ＰＲＥＤ）を回答の対象（ａ−ｆｏｃｕｓ）を応答文に関する索引として取り出す。

図１１には、疑問文に対する索引関連付け規則を適用する処理手順をフローチャートの形式で示している。

疑問文以降のテキスト・データのｆ−ｓｔｒｕｃｔｕｒｅ並びにメタ情報をそれぞれスキャンし、発言者がプレゼンター（Ｐｒｅｓｅｎｔｅｒ）となり（ステップＳ３１）、且つ、センテンス型式（Ｓ−ｔｙｐｅ）が平叙文（ｄｅｃｌａｒａｔｉｖｅ）となるセンテンスを見つけ出し（ステップＳ３２）、これを変数Ａｎｓｗｅｒに代入して記憶しておく（ステップＳ３３）。

次いで、ケース情報（前述）がメモリに格納されているかどうかを確認する（ステップＳ３４）。そして、ケース情報が格納されている場合には、当該回答文のｆ−ｓｔｒｕｃｔｕｒｅを参照し、そのケース情報に該当するインデックスの述部（ＰＲＥＤ）を回答の対象（ａ−ｆｏｃｕｓ）として出力する（ステップＳ３４）。

ここで、図５に示したテキスト・データのうち、疑問文「どの世代をターゲットにしているのか。」以降の文を図１０並びに図１１に示す処理に投入したとする。

次の文「この説明ではよく分からなかった。」の場合、図１０ではｓｐｅａｋｅｒは鈴木でありｐｒｅｓｅｎｔｅｒは小林であるため、判断ブロックＳ２１の条件を満たす。しかし、当該ｆ−ｓｔｒｕｃｔｕｒｅのＳ−ｔｙｐｅはｄｅｃｌａｒａｔｉｖｅであるため、判断ブロックＳ２２の条件は満たさず、疑問文に関する索引関連付けルールの適用を終了する。次いで、図１１に示した回答文に関する索引関連付けルールを適用する。判断ブロックＳ３１でｓｐｅａｋｅｒはｐｒｅｓｅｎｔｅｒと一致しないため、ルールの適用は終了する。

つまり、「この説明ではよく分からなかった。」からは、いかなる索引情報も抽出されない。

さらに次の文「３０代後半を狙っている。」の場合、図１０に示した疑問無人ついての索引関連付けルールでは、ｓｐｅａｋｅｒとｐｒｅｓｅｎｔｅｒが同じで、判断ブロックＳ２１の条件を満たさないため、このルールの適用を終了する。次いで、図１１に示した回答文に関する索引関連付けルールを適用する。ここで、ｓｐｅａｋｅｒとｐｒｅｓｅｎｔｅｒは一致するため、判断ブロックＳ３１の条件を満たす。また、当該センテンスのｆ−ｓｔｒｕｃｔｕｒｅのＳ−ｔｙｐｅはｄｅｃｌａｒａｔｉｖｅであるため、判断ブロックＳ３２の条件も満たす。そこで、ステップＳ３３でＡｎｓｗｅｒの値に当該センテンス、すなわち「３０代後半を狙っている。」を代入する。また、現在、メモリにはケース情報として、「ｏｂｊ」が記憶されているので、判断ブロックＳ３４の条件を満たす。そこで、ステップＳ３５でｏｂｊのＰＲＥＤ、すなわち「３０代後半」をａ−ｆｏｃｕｓの値にする。

つまり、「３０代後半を狙っている。」から以下に示すような索引が抽出され、回答文に関する索引関連付けルールの適用が終了する。

<answer>どの世代をターゲットにしているのか。<a-focus>世代<\a-focus>< \answer>

図１２には、以上の処理手続きにより得られた索引データの出力例を示している。

ここまでは、質疑応答文を例にとり、索引付与の処理手順について説明してきたが、続いて、別の文書タイプについて索引付与の処理を行なう例について説明する。会議の議事録として、図１３に示すようなテキスト・データがテキスト・データ記憶部１０１から取り出された場合の索引付与の処理手順について説明する。テキスト・データとしての議事録は、発言者（ｓｐｅａｋｅｒ）と発言内容（ｔｘｔ）の組み合わせからなるレコードが時系列的に配置して構成されている（同上）。図示のテキスト・データは、質疑応答形式ではなく、商品の売り込みを行なう形態である。

また、テキスト・データの取り出しに並行して、視聴覚データ記憶部１０２からは対応する視聴覚データが索引情報として読み出され、索引データ解析部１０４により解析される。図１４には、索引データの解析により得られる視聴覚データの構成例を示している。図示の例では、視聴覚データは、いわゆるメタ情報形式で構成され、会議形式（ＭｅｅｔｉｎｇＴｙｐｅ）としてプレゼンテーション、司会者（Ｐｒｅｓｅｎｔｅｒ）として田中、場面若しくは状況（Ｓｃｅｎｅ）として売り込み（ｓａｌｅｓ）、記録（Ｎｏｔｅ）として保存ファイル名が記述されている。

図１５〜図１７には、テキスト・データとして、発言者田中氏による発言内容「新製品はＦＡＸと印刷とコピーが同時にできます」、発言者川村氏による発言内容「カラーと白黒両方印刷できるか」、並びに発言者藤沢氏による発言内容「スキャナーとしても使いたい」が自然言語処理部１０３に投入され、構文意味解析処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅをコード形式並びに入れ子構造形式でそれぞれ示している。入れ子構造形式では、属性−属性値のマトリックスの形で表現され、［］で囲まれた中の左側は素性（属性）の名前であり、右側は素性の値（属性値）である。

図１４に示すように、メタ情報が商品の売込み（ｓａｌｅｓ）であることを示している場合、商品の機能（ｆｕｎｃｔｉｏｎ）と商品に対する要望（ｒｅｑｕｅｓｔ）を索引として付与する索引関連付け規則が適用される。

図１８には、商品の売り込みに関するテキスト・データに対する索引関連付け規則を適用する処理手順をフローチャートの形式で示している。この処理手順によれば、商品の機能若しくは商品に対する要望だった場合、属性Ｓｅｎｔｅｎｃｅ−ｃｏｎｔｅｎｔｓと属性値ｆｕｎｃｔｉｏｎ若しくはｒｅｑｕｅｓｔを付与することができる。

テキスト・データのｆ−ｓｔｒｕｃｔｕｒｅ並びにメタ情報をそれぞれスキャンし、入力されたセンテンスが可能属性を持ち（ｐｏｓｓｉｂｌｅ＝＋）（ステップＳ４１）、且つ、発言者（Ｓｐｅａｋｅｒ）がプレゼンター（Ｐｒｅｓｅｎｔｅｒ）である場合には（ステップＳ４２）、当該センテンスのＳｅｎｔｅｎｃｅ−ｃｏｎｔｅｎｔｓの値にｆｕｎｃｔｉｏｎを代入し（ステップＳ４３）、商品の機能を表す索引を付与する

また、入力されたセンテンスが可能属性を持ち（ｐｏｓｓｉｂｌｅ＝＋）（ステップＳ４１）、発言者がプレゼンターではないが（ステップＳ４２）、疑問文形式のセンテンス（Ｓ−ｔｙｐｅ＝ｉｎｔｅｒｒｏｇａｔｉｖｅ）である場合には（ステップＳ４４）、当該センテンスのＳｅｎｔｅｎｃｅ−ｃｏｎｔｅｎｔｓの値にｒｅｑｕｅｓｔを代入し（ステップＳ４５）、商品の要望を表す索引を付与する。

また、入力したセンテンスが可能属性を持たないが（ステップＳ４１）、希望を言及する場合、すなわちａｄｄｒｅｓｓ＝ｗｉｓｈである場合には（ステップＳ４６）、当該センテンスのＳｅｎｔｅｎｃｅ−ｃｏｎｔｅｎｔｓの値にｒｅｑｕｅｓｔを代入し（ステップＳ４５）、商品の要望を表す索引を付与する。

ここで、図１３に示したテキスト・データのうち、センテンス「新製品はＦＡＸと印刷とコピーが同時にできます。」を構文意味解析して得られたｆ−ｓｔｒｕｃｔｕｒｅがメタ情報とともに図１８に示した処理に投入されたとする。この場合、属性ｐｏｓｓｉｂｌｅが＋なので、判断ブロックＳ４１の条件を満たす。さらに、ｓｐｅａｋｅｒは田中でありｐｒｅｓｅｎｔｅｒと一致するため、判断ブロックＳ４２の条件も満たす。したがって、ステップＳ４３で、発話内容を示す属性Ｓｅｎｔｅｎｃｅ−ｃｏｎｔｅｎｔｓの値にｆｕｎｃｔｉｏｎを代入し、処理が終了する。

次に、図１３に示したテキスト・データのうち、センテンス「カラーと白黒両方印刷できるか。」がメタ情報とともに図１８に示した処理に投入されたとする。この場合、属性ｐｏｓｓｉｂｌｅが＋なので、判断ブロックＳ４１の条件を満たす。このテキストのｓｐｅａｋｅｒは川村でありｐｒｅｓｅｎｔｅｒと一致しないため、判断ブロックＳ４２の条件を満たさない。そして、このテキストのＳ−ｔｙｐｅはｉｎｔｅｒｒｏｇａｔｉｖｅなので、判断ブロックＳ４４の条件を満たす。したがって、ステップＳ４５で、発話内容を示す属性Ｓｅｎｔｅｎｃｅ−ｃｏｎｔｅｎｔｓの値にｒｅｑｕｅｓｔを代入し、処理が終了する。

次に、図１３に示したテキスト・データのうち、センテンス「スキャナーとして使いたい。」がメタ情報とともに図１８に示した処理に投入されたとする。この場合、ｆ−ｓｔｒｕｃｔｕｒｅ中に属性ｐｏｓｓｉｂｌｅが存在しないので、判断ブロックＳ４１の条件を満たさない。また、このテキストのｓｐｅａｋｅｒは藤沢でありｐｒｅｓｅｎｔｅｒと一致しないため、判断ブロックＳ４２の条件を満たさない。一方、このテキストのａｄｄｒｅｓｓはｗｉｓｈなので、判断ブロックＳ４６の条件を満たす。したがって、ステップＳ４５で、発話内容を示す属性Ｓｅｎｔｅｎｃｅ−ｃｏｎｔｅｎｔｓの値にｒｅｑｕｅｓｔを代入し、処理が終了する。

以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。

図１は、本発明の一実施形態に係る情報処理装置１００の機能構成を模式的に示した図である。図２は、自然言語処理部１０３の内部構成を模式的に示した図である。図３は、関連文書から構文意味解析手段を用いて抽出した構文意味情報と視聴覚データの持つ索引情報を用いて索引を自動的に付与するための概略的な処理手順を示したフローチャートである。図４は、視聴覚データとしての会議を収録したビデオ・データの特徴すなわち場面が質疑応答形式である場合に行なわれる、索引付与の処理手順を示したフローチャートである。図５は、テキスト・データ記憶部１０１から取り出されたテキスト・データの構成例を示した図である。図６は、索引データの解析により得られる視聴覚データの構成例を示した図である。図７は、入力文「どの世代をターゲットにしているのか」を構文意味解析部１により処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。図８は、入力文「この説明でははっきりしない」を構文意味解析部１により処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。図９は、入力文「３０代後半を狙っている」を構文意味解析部１により処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。図１０は、疑問文に対しする索引関連付け規則を適用する処理手順を示したフローチャートである。図１１は、疑問文に対する索引関連付け規則を適用する処理手順を示したフローチャートである。図１２は、索引データの出力例を示した図である。図１３は、テキスト・データ記憶部１０１から取り出されたテキスト・データの構成例を示した図である。図１４は、索引データの解析により得られる視聴覚データの構成例を示した図である。図１５は、入力文「新製品はＦＡＸと印刷とコピーが同時にできます」を構文意味解析部１により処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。図１６は、入力文「カラーと白黒両方印刷できるか」を構文意味解析部１により処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。図１７は、入力文「スキャナーとしても使いたい」を構文意味解析部１により処理した結果として得られるｆ−ｓｔｒｕｃｔｕｒｅを示した図である。図１８は、商品の売り込みに関するテキスト・データに対する索引関連付け規則を適用する処理手順を示したフローチャートである。

符号の説明

１…自然言語処理システム
２…形態素解析部
２Ａ…形態素ルール，２Ｂ…形態素辞書
３…統語・意味解析部
３Ａ…文法ルール，３Ｂ…結合価辞書
１００…情報処理装置
１０１…テキスト・データ記憶部
１０２…視聴覚データ記憶部
１０３…自然言語処理部
１０４…索引データ解析部
１０５…索引関連付け規則保持部
１０６…索引付与部
１０７…索引記憶部

Claims

原データに関連付けられたテキスト・データを処理する情報処理装置であって、
テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名及び意味的形式のうち少なくとも一方を取得する自然言語処理手段と、
原データを解析してその特徴を取得する原データ解析手段と、
前記原データが持つ特徴に応じた文法的な機能名及び意味的形式のうち少なくとも一方を持つ部分をテキスト・データから取り出して索引として保持する索引付与手段と、
を具備することを特徴とする情報処理装置。
原データは会議を収録したビデオ・データ及びそのメタ情報のうち少なくとも一方であり、
テキスト・データは前記会議で使用された会議資料、議事録、又は前記ビデオ・データから音声認識又はその他の処理により抽出されたテキスト・データである、
ことを特徴とする請求項１に記載の情報処理装置。
前記原データ解析手段は、収録された会議における対話形式を取得する、
ことを特徴とする請求項２に記載の情報処理装置。
原データが持つ特徴毎の、索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を記述した索引関連付け規則を備え、
前記索引付与手段は、索引関連付け規則によって導かれた索引を保持する、
ことを特徴とする請求項１に記載の情報処理装置。
前記原データ解析手段により原データが質疑応答であると特定された場合に、
前記索引付与手段は、テキスト・データの構文意味解析結果をスキャンして疑問文となるセンテンスを抽出し、疑問文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索するとともに、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンして疑問文に対する応答文となるセンテンスを抽出し、応答文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索し、導き出された索引を保持する、
ことを特徴とする請求項１に記載の情報処理装置。
前記索引付与手段は、疑問文のセンテンス自体と、疑問文の形式（ｑ−ｔｙｐｅ）、質問されている対象（ｑ−ｆｏｃｕｓ）を疑問文に関する索引として取り出す、
ことを特徴とする請求項５に記載の情報処理装置。
前記自然言語処理手段は、レキシカル・ファンクショナル・グラマー（ＬＦＧ：語彙機能的文法）文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャ（ｆ−ｓｔｒｕｃｔｕｒｅ）を構文意味解析結果として出力し、
前記索引付与手段は、疑問文のエフ−ストラクチャのうち、疑問タグを含む述部、及び疑問タグを含む述部の質問形式を索引として抽出する、
ことを特徴とする請求項６に記載の情報処理装置。
前記索引付与手段は、疑問文のエフ−ストラクチャに疑問タグを含まない場合は、イエス／ノー質問形式を索引として抽出する、
ことを特徴とする請求項７に記載の情報処理装置。
前記索引付与手段は、応答文のセンテンス自体と、疑問文における質問の対象に対応する回答の対象（ａ−ｆｏｃｕｓ）を応答文に関する索引として取り出す、
ことを特徴とする請求項５に記載の情報処理装置。
前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー（ＬＦＧ）文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
前記索引付与手段は、応答文のエフ−ストラクチャのうち、疑問文において疑問タグを含む述部に対応するインデックスの述部を回答の対象として抽出する、
ことを特徴とする請求項９に記載の情報処理装置。
前記原データ解析手段により原データが商品の売り込みであると特定された場合に、
前記索引付与手段は、商品の機能と商品に対する要望を索引として付与する、
ことを特徴とする請求項１に記載の情報処理装置。
前記自然言語処理手段は、レキシカル・ファンクショナル・グラマー（ＬＦＧ）文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
前記索引付与手段は、可能属性を持ち且つ発言者がプレゼンターであるセンテンスに対し商品の機能を表す索引を付与する、
ことを特徴とする請求項１１に記載の情報処理装置。
前記索引付与手段は、可能属性を持ち、発言者がプレゼンターでなく、且つ疑問文形式のセンテンスに対し商品の要望を表す索引を付与する、
ことを特徴とする請求項１２に記載の情報処理装置。
前記索引付与手段は、可能属性を持たないが、希望を言及するセンテンスに対し商品の要望を表す索引を付与する、
ことを特徴とする請求項１２に記載の情報処理装置。
原データに関連付けられたテキスト・データを処理する情報処理方法であって、
テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名及び意味的形式のうち少なくとも一方を取得する自然言語処理ステップと、
原データを解析してその特徴を取得する原データ解析ステップと、
前記原データが持つ特徴に応じた文法的な機能名及び意味的形式のうち少なくとも一方を持つ部分をテキスト・データから取り出して索引として保持する索引付与ステップと、
を具備することを特徴とする情報処理方法。
原データは会議を収録したビデオ・データ及びそのメタ情報のうち少なくとも一方であり、
テキスト・データは前記会議で使用された会議資料、議事録、又は前記ビデオ・データから音声認識又はその他の処理により抽出されたテキスト・データである、
ことを特徴とする請求項１５に記載の情報処理方法。
前記原データ解析ステップでは、収録された会議における対話形式を取得する、
ことを特徴とする請求項１６に記載の情報処理方法。
前記索引付与ステップでは、原データが持つ特徴毎の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を記述した索引関連付け規則を参照し、該当する索引関連付け規則によって導かれた索引を保持する、
ことを特徴とする請求項１５に記載の情報処理方法。
前記原データ解析ステップにより原データが質疑応答であると特定された場合に、
前記索引付与ステップでは、テキスト・データの構文意味解析結果をスキャンして疑問文となるセンテンスを抽出し、疑問文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索するとともに、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンして疑問文に対する応答文となるセンテンスを抽出し、応答文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索し、導き出された索引を保持する、
ことを特徴とする請求項１５に記載の情報処理方法。
前記索引付与ステップでは、疑問文のセンテンス自体と、疑問文の形式（ｑ−ｔｙｐｅ）、質問されている対象（ｑ−ｆｏｃｕｓ）を疑問文に関する索引として取り出す、
ことを特徴とする請求項１９に記載の情報処理方法。
前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー（ＬＦＧ）文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
前記索引付与ステップでは、疑問文のエフ−ストラクチャのうち、疑問タグを含む述部、及び疑問タグを含む述部の質問形式を索引として抽出する、
ことを特徴とする請求項２０に記載の情報処理方法。
前記索引付与ステップでは、疑問文のエフ−ストラクチャに疑問タグを含まない場合は、イエス／ノー質問形式を索引として抽出する、
ことを特徴とする請求項２１に記載の情報処理方法。
前記索引付与ステップでは、応答文のセンテンス自体と、疑問文における質問の対象に対応する回答の対象（ａ−ｆｏｃｕｓ）を応答文に関する索引として取り出す、
ことを特徴とする請求項１９に記載の情報処理方法。
前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー（ＬＦＧ）文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
前記索引付与ステップでは、応答文のエフ−ストラクチャのうち、疑問文において疑問タグを含む述部に対応するインデックスの述部を回答の対象として抽出する、
ことを特徴とする請求項２３に記載の情報処理方法。
前記原データ解析ステップにより原データが商品の売り込みであると特定された場合に、
前記索引付与ステップでは、商品の機能と商品に対する要望を索引として付与する、
ことを特徴とする請求項１５に記載の情報処理方法。
前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー（ＬＦＧ）文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
前記索引付与ステップでは、可能属性を持ち且つ発言者がプレゼンターであるセンテンスに対し商品の機能を表す索引を付与する、
ことを特徴とする請求項２５に記載の情報処理方法。
前記索引付与ステップでは、可能属性を持ち、発言者がプレゼンターでなく、且つ疑問文形式のセンテンスに対し商品の要望を表す索引を付与する、
ことを特徴とする請求項２６に記載の情報処理方法。
前記索引付与ステップでは、可能属性を持たないが、希望を言及するセンテンスに対し商品の要望を表す索引を付与する、
ことを特徴とする請求項１５に記載の情報処理方法。
原データに関連付けられたテキスト・データの処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名及び意味的形式のうち少なくとも一方を取得する自然言語処理ステップと、
原データを解析してその特徴を取得する原データ解析ステップと、
前記原データが持つ特徴に応じた文法的な機能名及び意味的形式のうち少なくとも一方を持つ部分をテキスト・データから取り出して索引として保持する索引付与ステップと、
を具備することを特徴とするコンピュータ・プログラム。