JP2005266980A - 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム - Google Patents

情報処理装置及び情報処理方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP2005266980A
JP2005266980A JP2004075242A JP2004075242A JP2005266980A JP 2005266980 A JP2005266980 A JP 2005266980A JP 2004075242 A JP2004075242 A JP 2004075242A JP 2004075242 A JP2004075242 A JP 2004075242A JP 2005266980 A JP2005266980 A JP 2005266980A
Authority
JP
Japan
Prior art keywords
index
sentence
question
information processing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004075242A
Other languages
English (en)
Inventor
Tomoko Okuma
智子 大熊
Kazuki Hirata
和貴 平田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004075242A priority Critical patent/JP2005266980A/ja
Publication of JP2005266980A publication Critical patent/JP2005266980A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 関連文書から抽出した構文意味情報と視聴覚データの持つ索引情報を用いて、再利用可能な意味的に詳細な索引を視聴覚データに自動的に付与する。
【解決手段】 自然言語処理部103は、テキスト・データの構文意味解析を行ない、構文意味情報を抽出する。索引データ解析部104は、関連する索引付き視聴覚データに付与された索引を抽出する。索引付与部106は、自然言語処理部103並びに索引データ解析部104でそれぞれ抽出されたデータに対し、索引関連付け規則保持部105に保持された規則を適用する。そして、このルールによって導かれた索引を索引記憶部107に保持する。
【選択図】 図1

Description

本発明は、自然言語処理を用いてデータに関連付けられたテキスト・データを処理する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに係り、特に、会議資料や議事録からキーワードや文を抽出して、例えば会議を収録したビデオ・データの検索や要約をまとめるなど再利用を行なうための索引を自動的に付与する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに関する。
さらに詳しくは、本発明は、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに係り、特に、再利用可能な程度に意味的に詳細な索引を視聴覚データに自動的に付与する情報処理装置及び情報処理方法、並びにコンピュータ・プログラムに関する。
昨今のコンピューティング技術の発展に伴い、コンピュータがオフィスや一般家庭内に深く浸透してきている。これと相俟って、さまざまな適用業務はコンピュータの支援を受けることができるようになってきている。例えば、企業における産業活動やその他のさまざまに日常生活において、会議が頻繁に行なわれているが、会議室にコンピュータを取り込むことで、会議の運用を支援することができる。
会議支援システムの一例として、遠隔会議システムを取り上げることができる。遠隔会議システムによれば、遠隔に位置する複数の会議室において、カメラやマイクなどの画像・音声入力装置や、モニタやスピーカなどの画像・音声出力装置を設置し、通信回線を利用して、各会議室において行なわれる発言や質疑応答などのイベントを共有し、遠隔地間で議事を同期して進行させることができる。
例えば、複数のユーザが端末装置のネットワーク接続によって対話を可能とした会議システムとしての対話システム制御方式がある(例えば、特許文献1を参照のこと)。この方式によれば、各端末装置において対話への参加、参加者の離脱を処理することによって、自由な参加や離脱を可能にして会議に相当する対話をすることができる。
また、会議の進行上、会議の参加者を撮影した映像や、参加者の初全内容などの音声だけでなく、会議で使用されるホワイトボードや、スライドその他のプレゼンテーション資料など、会議に関連するさまざまな資料を会議室間で共有し、保管することができる。
さらに、会議システムでは、映像や音声などの会議の進行上で発生するさまざまなデータをデジタル化して保存し、さらに、ホワイトボードや、スライドその他のプレゼンテーション資料など、会議に関連するさまざまなメディア・データを、映像や音声すなわち会議の進行と同期させて保管することができる。このように会議に関連するデータを保存しておくことにより、これらを次回の会議において再利用することが可能となる。
例えば、プレゼンテーションを収録したビデオ・データと、その場で使用された資料画像データとを実際のプレゼンテーション行為を反映させて対応付け、これによってプレゼンテーションを収録したコンテンツの品質を高めることができる(例えば、非特許文献1を参照のこと)。この場合、カメラ収録されたビデオ・データを入力し、プレゼンテーションで使用される資料画像データ、並びにプレゼンテーションにおいてプレゼンテータが行った資料画像の切換指示をそれぞれ入力し、ビデオ・データを基準とした時間軸に対して切換指示の入力タイミングを当該切り換えられる資料画像データの表示開始タイミングとして設定する処理を行ない、複数の資料画像を切換え表示しながら行なうプレゼンテーションを収録したビデオ・データに対して使用された資料画像のデータと対応付ける。これによって、ビデオ・データの再生時には、ビデオ・データと資料画像データとを実際の使用状態を反映して対応付けることができ、プレゼンテーションを忠実に再現することができるコンテンツを作成することが可能となる。
会議は、ほぼ毎日、複数の会議において時間毎に開催される。このため、会議毎に捕捉され、蓄積された会議データは膨大であり、その数は日々増加していく。ここで、会議での決定事項を見返すなど、会議データを再利用したいときに、所望の会議における所望の議題が扱われた箇所を探し出す手間が煩わしくなる、あるいは探し出すことが困難若しくは不可能である、という問題が浮上する。
ここで、会議の内容を収録したビデオ・データを音声認識して、テキスト・ベースの会議資料を作成することができる。さらに会議資料や議事録などからキーワードや文を抽出して、会議を収録したビデオ・データの検索や要約など再利用を行なうための索引を付与することが可能である。
例えば、タグ付き属性情報中のテキストより抽出した単語を利用して索引の付与を行なうことができる(例えば、特許文献2を参照のこと)。この場合、タグ付き属性情報中のテキストより抽出した単語で、不要語に該当しない個々の単語(見出し語)と、各タグとの関連度を要素とした行列であるタグ付き属性情報による概念ベースを作成し、対象コンテンツを検索する際に、該タグつき属性情報による概念ベースを参照し、検索の質問文中に含まれる見出し語と関連度が高いタグに係る属性情報を検索することができる。
また、関連する文書から特定の品詞を抽出して索引とすることができる(例えば、特許文献3を参照のこと)。すなわち、所定のテキスト・データを解釈してインデックスを得るため、単語認識によりテキスト・データから、所定の品詞(インデックス)として名詞を抽出したり、インデックスとしてキーワードを抽出したりする。
しかしながら、索引を意味検索や要約などに再利用する場合、上記のような単語に基づく情報、言い換えれば形態素解析結果に基づく情報では不充分である。
また、構文解析を利用して、関連付けられた文書の依存関係を抽出することができる(例えば、特許文献4を参照のこと)。この場合、文書データを要素に分解する文章解析手段と、該分解された要素に対応するキーワードに基づいてハイパーメディア部品を検索するハイパーメディア部品検索手段と、該検索されたハイパーメディア部品を文書データ中の対応する要素の位置に関連付けてリンクさせるハイパーメディア部品連結手段によりハイパーメディアを構築し、ユーザが文書データに基づいて、ハイパーメディア部品のサンプルなどを用いて極めて簡単にハイパーメディア文書を作成することを可能にする。
しかしながら、構文解析結果により得られる単語間の係り受け関係すなわち依存関係を用いたとしても、単語の情報すなわち形態素解析結果を用いた場合と同様に、索引や意味検索や要約などに再利用することは困難である。
一方、意味的に詳細な索引を付与して再利用する方式も挙げられる。例えば、相互の関係によって構造化された1又は複数の要素を含み、保存される情報を記述する構造化索引を作成し、前記構造化索引と前記情報の記憶位置のポインタとをマッチドペアとして結合させる(例えば、特許文献5を参照のこと)。この好適例では、ヒューリスティック・インターフェースが、写真クリップ等の情報をユーザに提示し、ユーザから単語句等の入力文字列を受信する。ヒューリスティック・インターフェースは、ユーザが入力文字列を、文法規則のセットに従う構造を持つ要素へと組織化するのを支援する。
また、文書データを要素に分解し、分解された要素に対応するキーワードに基づいてハイパーメディア部品を検索し、検索されたハイパーメディア部品を文書データ中の対応する要素の位置に関連付けてリンクさせることにより、ハイパーメディア部品のサンプルなどを用いて極めて簡単にハイパーメディア文書を作成することを可能にする(例えば、特許文献6を参照のこと)。
しかしながら、意味的に詳細な索引を付与して再利用するというこれらの方式では、索引の付与は人手で入力される。すなわち、自動的な索引付与の場合、索引の質が低減し、この索引を再利用することが困難である。また、再利用可能な程度に詳細な索引を付与する場合、人手によるコストが発生する。
上述した従来技術は、要するに会議資料などのテキスト・データを形態素解析し、抽出された単語情報を索引に利用する、あるいは構文解析により得られた文章の係り受け関係を基に索引を作成するというものである。
しかしながら、形態素解析により得られる単語情報では、基本的には情報量が少なく、十分な成果が得られない。また、構文解析の結果として、一般に、個々の形態素が係り受け関係などを基にして接合された木構造しか得られず、意味的に詳細な索引を作成するためには情報量が十分ではない。
特開平3−192845号公報 特開2002-183195号公報 特開2003-150931号公報 特開平9-282327号公報 特開平6-325104号公報 特開平9-34775号公報 特願2003−201673号
本発明の目的は、会議資料や議事録からキーワードや文を抽出して、会議を収録したビデオ・データの検索や要約をまとめるなど再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明のさらなる目的は、再利用可能な程度に意味的に詳細な索引を視聴覚データに自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することにある。
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、原データに関連付けられたテキスト・データを処理する情報処理装置であって、テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名又は意味的形式を取得する自然言語処理手段と、原データを解析してその特徴を取得する原データ解析手段と、前記原データが持つ特徴に応じた文法的な機能名又は意味的形式を持つ部分をテキスト・データから取り出して索引として保持する索引付与手段とを具備することを特徴とする情報処理装置である。
ここで、原データは会議を収録したビデオ・データ又はそのメタ情報などであある。そして、テキスト・データは、例えば会議で使用された会議資料、議事録、又は前記ビデオ・データから音声認識又はその他の処理により抽出されたテキスト・データである。
前記原データ解析手段は、収録された会議における対話形式を取得する。また、原データが持つ特徴毎の、索引として要求される文法的な機能名又は意味的形式を記述した索引関連付け規則を備えている。例えば、視聴覚データが質疑応答に関するものである場合など、視聴覚データのタイプに応じて、索引として使用すべき単語の意味属性(predicate)などを索引関連付け規則として規定している。そして、前記索引付与手段は、索引関連付け規則によって導かれた索引を保持する。
したがって、本発明によれば、会議を収録した視聴覚データなどを再利用するために必要又は有効となる意味的に詳細な索引を、会議資料や議事録などの関連文書から構文意味解析により抽出した構文意味情報と視聴覚データを解析して得た情報が持つ索引情報を用いて、視聴覚データに自動的に付与することができる。これによって、索引を人手で付与するコストを低減すると同時に、再利用可能な索引を付与することができる。
例えば、前記原データ解析手段により原データが質疑応答であると特定された場合には、前記索引付与手段は、テキスト・データの構文意味解析結果をスキャンして疑問文となるセンテンスを抽出し、疑問文の索引として要求される文法的な機能名又は意味的形式を当該センテンスの構文意味解析結果の中から探索する。また、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンして疑問文に対する応答文となるセンテンスを抽出し、応答文の索引として要求される文法的な機能名又は意味的形式を当該センテンスの構文意味解析結果の中から探索する。そして、導き出された索引をそれぞれ疑問文の索引、並びに応答文の索引として保持する。
前記索引付与手段は、例えば、疑問文のセンテンス自体と、疑問文の形式(q−type)、質問されている対象(q−focus)を疑問文に関する索引として取り出す。
ここで、前記自然言語処理手段は、Lexical Functional Grammar(レキシカル・ファンクショナル・グラマー:LFG(語彙機能的文法))文法理論に基づく構文意味解析を行なうようにしてもよい。このような場合、センテンス毎の各属性との属性値の対応関係を記述したf−structureが構文意味解析結果として出力される。
したがって、前記索引付与手段は、疑問文のf−structure(エフ−ストラクチャ)のうち、疑問タグを含む述部、及び疑問タグを含む述部の質問形式を索引として抽出することができる。あるいは、疑問文のf−structureに疑問タグを含まない場合は、yes/no質問形式を索引として抽出する。
また、前記索引付与手段は、応答文のセンテンス自体と、疑問文における質問の対象に対応する回答の対象(a−focus)を応答文に関する索引として取り出すようにしてもよい。例えば、応答文を構文意味解析して得たf−structureのうち、疑問文において疑問タグを含む述部に対応するインデックスの述部を回答の対象として抽出することができる。
また、前記原データ解析手段により原データが商品の売り込みであると特定された場合には、前記索引付与手段は、商品の機能と商品に対する要望を索引として付与するようにしてもよい。
この場合、前記索引付与手段は、例えば、可能属性(possible)を持ち且つ発言者がプレゼンターであるセンテンスに対し商品の機能(function)を表す索引を付与することができる。あるいは、可能属性を持ち、発言者がプレゼンターでなく、且つ疑問文形式のセンテンスに対し商品の要望(request)を表す索引を付与することができる。あるいは、可能属性を持たないが、希望を言及するセンテンスに対し商品の要望を表す索引を付与することができる。
また、本発明の第2の側面は、原データに関連付けられたテキスト・データの処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名又は意味的形式を取得する自然言語処理ステップと、原データを解析してその特徴を取得する原データ解析ステップと、前記原データが持つ特徴に応じた文法的な機能名又は意味的形式を持つ部分をテキスト・データから取り出して索引として保持する索引付与ステップとを具備することを特徴とするコンピュータ・プログラムである。
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係る情報処理装置と同様の作用効果を得ることができる。
本発明によれば、会議資料や議事録からキーワードや文を抽出して、会議を収録したビデオ・データの検索や要約をまとめるなど再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することができる。
また、本発明によれば、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与することができる、優れた情報処理装置及び情報処理方法、並びにコンピュータ・プログラムを提供することができる。
本発明によれば、再利用可能な意味的に詳細な索引を、関連文書から構文意味解析により抽出した構文意味情報と視聴覚データの持つ索引情報を用いて、視聴覚データに自動的に付与することができる。これによって、索引を人手で付与するコストを低減すると同時に、再利用可能な索引を付与することができる。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
以下、図面を参照しながら本発明の実施形態について詳解する。
図1には、本発明の一実施形態に係る情報処理装置100の機能構成を模式的に示している。この情報処理装置100は、会議資料や議事録などのテキスト・データの自然言語処理結果と、会議を収録したビデオ・データなどの視聴覚データの持つ索引情報とを用いて、再利用を行なうための索引を自動的に付与するものであり、図示の通り、テキスト・データ記憶部101と視聴覚データ記憶部102と、自然言語処理部103と、索引データ解析部104と、索引関連付け規則保持部105と、索引付与部106と、索引記憶部107で構成される。
テキスト・データ記憶部101は、会議資料や議事録などの関連するテキスト・データを保持している。また、テキスト・データ記憶部101は、会議を収録したビデオを音声認識して得られたテキスト・データを保持しておいてもよい。
自然言語処理部103は、テキスト・データ記憶部101からこれらのテキスト・データを取り出し、構文意味解析を行ない、構文意味情報を抽出する。ここでは、構文意味解析システムとしてLFG(Lexical Functional Grammar(レキシカル・ファンクショナル・グラマー):語彙機能的文法)に基づく処理システムを想定する。
また、視聴覚データ記憶部102は、会議の内容を収録したビデオ・データ、あるいはビデオ・データのメタ情報などの視聴覚データを格納している。索引データ解析部104は、視聴覚データ記憶部102から関連する索引付き視聴覚データを取り出し、視聴覚データに付与された索引を抽出する。
索引付与部106は、自然言語処理部103並びに索引データ解析部104でそれぞれ抽出されたデータに対し、索引関連付け規則保持部105に保持された規則を適用する。そして、この索引関連付け規則によって導かれた索引を索引記憶部107に保持する。索引関連付け規則は、例えば、視聴覚データを解析して得られた視聴覚データの特徴(例えば、場面や状況など)と、テキスト・データのうち索引として使用すべき単語の意味属性などとの対応関係を規定するものである。例えば視聴覚データが質疑応答に関するものである場合など、視聴覚データのタイプに応じて異なる索引関連付け規則が規定している。
なお、自然言語処理部103、索引データ解析部104、並びに索引付与部106は、それぞれ独立した計算機システム上で構築することもできるが、単一の計算機システム上で動作する個別のアプリケーション・プログラムとして構成したり、あるいは単一のアプリケーション・プログラムにおける一連の処理ルーチンとして実装したりすることも可能である。
図2には、自然言語処理部103の内部構成を模式的に示している。構文・意味解析を行うための文法理論の代表的な例として、LFGを挙げることができる。自然言語処理部103は、このLFG文法理論に基づく構文意味解析処理に組み込んで実装することができる。LFGでは、ネイティブ・スピーカの言語知識すなわち文法を、コンピュータ処理や、コンピュータの処理動作に影響を及ぼすその他の非文法的な処理パラメータとは切り離したコンポーネントとして構成している。
形態素解析部2は、日本語など特定の言語に関する形態素ルール2Aと形態素辞書2Bを持ち、入力文を意味的最小単位である形態素に分節して品詞の認定処理を行なう。形態素解析システムとして、例えば「茶筌(Chasen)」など日本語形態素解析システムを適用することができるが、本発明の要旨はこれに限定されるものではない。茶筌による形態素解析システムについては、例えば、松本裕治、北内啓、山下達雄、平野善隆、松田寛、高岡一馬、浅原正幸共著「日本語形態素解析システム 茶筌 version 2.2.1 使用説明書」(奈良先端科学技術大学院大学,2000)を参照されたい。
形態素解析処理により、例えば、「どの世代をターゲットにしているのか」という文が入力された場合、「どの{{PRON}世代{Noun}を{PP}ターゲット{Noun}に{PP}して{AUXV}いる{AUXV}の{PP}か{PP}」という形態素解析結果が出力される。
このような形態素解析結果は、次いで、構文意味解析部3に入力される。構文意味解析部3は、文法ルール3Aや結合価辞書3Bなどの辞書を持ち、文法ルールなどに基づく句構造の解析や、文中の語の語義や語と語の間の意味関係などに基づいて文が伝える意味を表現する意味構造の解析を行なう(結合価辞書3Bは動詞と主語などの文中の他の構成要素との関係を記述したものであり、述部とそれに係る語の意味関係を抽出することができる)。そして、構文解析した結果として、単語や形態素などからなる文章の句構造を木構造として表した“c−structure(constituent structure(シー−ストラクチャ))”と、主語、目的語などの格構造に基づいて入力文を疑問文、過去形、丁寧文などさらに意味的・機能的に解析した結果として“f−structure(functional structure(エフ−ストラクチャ))”を出力する。
c−structureは、文中の単語や句の構造を木構造形式で表したものであり、構文カテゴリによって定義される。例えば音素列を生成するための音韻学的な解釈を、c−structureを基に行なうことができる。一方、f−structureは、文法的な機能を明確に表現したものであり、文法的な機能名、意味的形式、並びに特徴シンボルにより構成される。f−structureを参照することにより、主語(subject)、目的語(object)、補語(complement)、修飾語(adjunct)といった意味理解を得ることができる。f−structureは、c−structureの各節点に付随する素性の集合であり、例えば属性−属性値のマトリックスの形で表現される。すなわち、[]で囲まれた中の左側は素性(属性)の名前であり、右側は素性の値(属性値)である。
なお、LFGの詳細に関しては、例えばR.M.Kaplan及びJ.Bresnan共著の論文“Lexical−Functional Grammar: A Formal System for Grammatical Representation”(The MIT Press,Cambridge (1982). Reprinted in Formal Issues in Lexical−Functional Grammar,pp.29−130.CSLI publications,Stanford University(1995).)などに記述されている。
続いて、テキスト・データから具体的な索引の付与を行なう処理過程について説明する。
図3には、関連文書から自然言語処理を用いて抽出した構文意味情報と視聴覚データの持つ索引情報を用いて索引を自動的に付与するための概略的な処理手順をフローチャートの形式で示している。
自然言語処理部103は、テキスト・データ記憶部101からテキスト・データを取り出し、これらに形態素解析並びに構文意味解析からなる自然言語処理を順次適用していき、それぞれについての構文意味解析結果をf−structureの形式で得る(ステップS1)。この構文意味解析結果により、テキスト・データに含まれる素性(属性)の名前とその素性の値(属性値)が明らかとなる。
また、テキスト・データの自然言語処理に並行して、視聴覚データ記憶部102からは対応する視聴覚データを読み出し、索引データ解析部104により解析して、視聴覚データの特徴(例えば、場面や状況など)を得る(ステップS2)。例えば、会議を収録したビデオ・データ又はそのメタ情報が解析され、読み出された場面が質疑応答であることを特定する。
そして、索引付与部106では、自然言語処理部103並びに索引データ解析部104でそれぞれ抽出されたデータに対して索引関連付け規則を適用する(ステップS3)。索引関連付け規則は、例えば、視聴覚データを解析して得られた視聴覚データの特徴(例えば、場面や状況など)と、構文意味解析結果との対応関係(例えばテキスト・データのうち索引として使用すべき単語の意味属性など)を規定しており、この索引関連付け規則によって導かれた索引を索引記憶部107に保持する。
索引関連付け規則の形態は、視聴覚データの特徴(例えば、場面や状況など)に応じてさまざまな例が考えられる。図4には、視聴覚データとしての会議を収録したビデオ・データの特徴すなわち場面(scene)が質疑応答形式である場合に行なわれる、索引付与の処理手順をフローチャートの形式で示している。
この場合、当該処理系に投入されたテキスト・データの構文意味解析結果をスキャンし、疑問文となるセンテンスを抽出する(S11)。f−structureでは、センテンス毎のセンテンス型式(S−type)が記述されているので、疑問文を容易に特定することができる。
次いで、疑問文として取り出されたセンテンスについての構文意味解析結果に対し索引関連付け規則を適用し、疑問文の索引として要求される文法的な機能名又は意味的形式を当該構文意味解析結果の中から探索する(ステップS12)。
次いで、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンし、疑問文に対する応答文となるセンテンスを抽出する(S13)。f−structureでは、センテンス毎のセンテンス型式(S−type)が記述されているので、疑問文を容易に特定することができる。
次いで、応答文として取り出されたセンテンスについての構文意味解析結果に対し索引関連付け規則を適用し、応答文の索引として要求される文法的な機能名又は意味的形式を当該構文意味解析結果の中から探索する(ステップS14)
そして、ステップS12並びにステップS14においてそれぞれ導き出された索引を、当該ビデオ・データを再利用するための索引データとして出力する(ステップS15)。
以下では、テキスト・データから具体的な索引の付与を行なう処理過程の具体例について説明する。索引付与規則の形態として、入力されたテキスト・データが持つ文書タイプに応じたさまざまな例が考えられるが、ここでは質疑応答文を例に取る。
会議の議事録として、図5に示すようなテキスト・データがテキスト・データ記憶部101から取り出されたとする。図示の例では、議事録は、発言者(speaker)と発言内容(txt)の組み合わせからなるレコードが時系列的に配置して構成されている。
また、テキスト・データの取り出しに並行して、視聴覚データ記憶部102からは対応する視聴覚データが索引情報として読み出され、索引データ解析部104により解析される。図6には、索引データの解析により得られる視聴覚データの構成例を示している。図示の例では、視聴覚データは、いわゆるメタ情報形式で構成され、会議形式(MeetingType)としてプレゼンテーション、司会者(Presenter)として小林、場面若しくは状況(Scene)として質疑応答(QandA)、記録(Note)として保存ファイル名が記述されている。
図7〜図9には、テキスト・データとして、発言者鈴木氏による発言内容「どの世代をターゲットにしているのか」、「この説明でははっきりしない」、並びに発言者小林氏による発言内容「30代後半を狙っている」が自然言語処理部103に投入され、構文意味解析処理した結果として得られるf−structureをコード形式並びに入れ子構造形式でそれぞれ示している。図示のような入れ子構造形式でf−structureを出力した場合、属性−属性値のマトリックスの形で表現され、[]で囲まれた中の左側は素性(属性)の名前であり、右側は素性の値(属性値)である。
図6に示すように、メタ情報が質疑応答(Q&A)であることを示しているので、質疑応答文に関する索引関連付け規則が適用される。まず、投入されたテキスト・データの構文意味解析結果をスキャンし、疑問文となるセンテンスを抽出する。そして、この疑問文に対し索引関連付け規則を適用する。疑問文についての索引関連付け規則は、例えば、疑問文のセンテンス自体と、疑問文の形式(q−type)、質問されている対象(q−focus)を疑問文に関する索引として取り出す。
図10には、疑問文に対する索引関連付け規則を適用する処理手順をフローチャートの形式で示している。
テキスト・データのf−structure並びにメタ情報をそれぞれスキャンし、発言者(Speaker)がプレゼンター(Presenter)となり(ステップS21)、且つ、センテンス型式(S−type)が疑問文(interrogative)となるセンテンスを見つけ出し(ステップS22)、これを変数Questionに代入して記憶しておく(ステップS23)。
そして、このセンテンスのf−structureを参照し、intタグが存在するか否かを判別する(ステップS24)。
ここで、センテンスのf−structureにintタグが含まれない場合には、当該疑問文の質問形式(q−type)をyes/no形式として出力する(ステップS25)。
また、センテンスのf−structureにintタグが含まれる場合には、intタグが含まれている述部(PRED)を質問されている対象(q−type)として出力するとともに(ステップS26)、intタグが含まれている述部の質問形式を当該疑問文の質問形式(q−type)として出力する(ステップS27)。
そして、intタグの含まれているインデックスをケース情報としてメモリに格納する(ステップS28)。
ここでは、図5に示したテキスト・データのうち、センテンス「どの世代をターゲットにしているのか。」を構文意味解析して得られたf−structureがメタ情報とともに図10に示した処理に投入されたとする。
この場合、speakerは鈴木でありpresenterは小林であるため、判断ブロックS21の条件を満たす。さらに、この疑問文のf−structureのS−typeはinterrogativeであるため、判断ブロックS22の条件も満たす。したがって、ステップS23では索引questionの値にsentence、すなわち「どの世代をターゲットにしているのか」を代入する。
また、当該f−structureにはintタグが存在するため、判断ブロックS24の条件も満たす。したがって、ステップS26でintタグを含んでいるPRED、すなわち「世代」をq−focusの値に代入する。次にステップS27でintタグを含んでいるPREDのq−type、すなわち「which」をq−typeの値に代入する。さらに、ステップS28でintタグを含んでいる索引(インデックス)、すなわち「obj」をケース情報としてメモリに格納する。
つまり、「どの世代をターゲットにしているのか。」から、以下に示すような索引が抽出され、疑問文に関する索引関連付けルールの適用が終了する。
<question>どの世代をターゲットにしているのか。<q-focus>世代<\q-focus><q-type>which<\q-type><\question>
疑問文に対して索引関連付け規則を適用して索引を抽出した後は、さらに疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンし、疑問文に対する応答文となるセンテンスを抽出し、今度は、応答文に対し索引関連付け規則を適用する。応答文についての索引関連付け規則は、応答文のセンテンス自体と、対応する疑問文においてケース情報とされているインデックスの述部(PRED)を回答の対象(a−focus)を応答文に関する索引として取り出す。
図11には、疑問文に対する索引関連付け規則を適用する処理手順をフローチャートの形式で示している。
疑問文以降のテキスト・データのf−structure並びにメタ情報をそれぞれスキャンし、発言者がプレゼンター(Presenter)となり(ステップS31)、且つ、センテンス型式(S−type)が平叙文(declarative)となるセンテンスを見つけ出し(ステップS32)、これを変数Answerに代入して記憶しておく(ステップS33)。
次いで、ケース情報(前述)がメモリに格納されているかどうかを確認する(ステップS34)。そして、ケース情報が格納されている場合には、当該回答文のf−structureを参照し、そのケース情報に該当するインデックスの述部(PRED)を回答の対象(a−focus)として出力する(ステップS34)。
ここで、図5に示したテキスト・データのうち、疑問文「どの世代をターゲットにしているのか。」以降の文を図10並びに図11に示す処理に投入したとする。
次の文「この説明ではよく分からなかった。」の場合、図10ではspeakerは鈴木でありpresenterは小林であるため、判断ブロックS21の条件を満たす。しかし、当該f−structureのS−typeはdeclarativeであるため、判断ブロックS22の条件は満たさず、疑問文に関する索引関連付けルールの適用を終了する。次いで、図11に示した回答文に関する索引関連付けルールを適用する。判断ブロックS31でspeakerはpresenterと一致しないため、ルールの適用は終了する。
つまり、「この説明ではよく分からなかった。」からは、いかなる索引情報も抽出されない。
さらに次の文「30代後半を狙っている。」の場合、図10に示した疑問無人ついての索引関連付けルールでは、speakerとpresenterが同じで、判断ブロックS21の条件を満たさないため、このルールの適用を終了する。次いで、図11に示した回答文に関する索引関連付けルールを適用する。ここで、speakerとpresenterは一致するため、判断ブロックS31の条件を満たす。また、当該センテンスのf−structureのS−typeはdeclarativeであるため、判断ブロックS32の条件も満たす。そこで、ステップS33でAnswerの値に当該センテンス、すなわち「30代後半を狙っている。」を代入する。また、現在、メモリにはケース情報として、「obj」が記憶されているので、判断ブロックS34の条件を満たす。そこで、ステップS35でobjのPRED、すなわち「30代後半」をa−focusの値にする。
つまり、「30代後半を狙っている。」から以下に示すような索引が抽出され、回答文に関する索引関連付けルールの適用が終了する。
<answer>どの世代をターゲットにしているのか。<a-focus>世代<\a-focus>< \answer>
図12には、以上の処理手続きにより得られた索引データの出力例を示している。
ここまでは、質疑応答文を例にとり、索引付与の処理手順について説明してきたが、続いて、別の文書タイプについて索引付与の処理を行なう例について説明する。会議の議事録として、図13に示すようなテキスト・データがテキスト・データ記憶部101から取り出された場合の索引付与の処理手順について説明する。テキスト・データとしての議事録は、発言者(speaker)と発言内容(txt)の組み合わせからなるレコードが時系列的に配置して構成されている(同上)。図示のテキスト・データは、質疑応答形式ではなく、商品の売り込みを行なう形態である。
また、テキスト・データの取り出しに並行して、視聴覚データ記憶部102からは対応する視聴覚データが索引情報として読み出され、索引データ解析部104により解析される。図14には、索引データの解析により得られる視聴覚データの構成例を示している。図示の例では、視聴覚データは、いわゆるメタ情報形式で構成され、会議形式(MeetingType)としてプレゼンテーション、司会者(Presenter)として田中、場面若しくは状況(Scene)として売り込み(sales)、記録(Note)として保存ファイル名が記述されている。
図15〜図17には、テキスト・データとして、発言者田中氏による発言内容「新製品はFAXと印刷とコピーが同時にできます」、発言者川村氏による発言内容「カラーと白黒両方印刷できるか」、並びに発言者藤沢氏による発言内容「スキャナーとしても使いたい」が自然言語処理部103に投入され、構文意味解析処理した結果として得られるf−structureをコード形式並びに入れ子構造形式でそれぞれ示している。入れ子構造形式では、属性−属性値のマトリックスの形で表現され、[]で囲まれた中の左側は素性(属性)の名前であり、右側は素性の値(属性値)である。
図14に示すように、メタ情報が商品の売込み(sales)であることを示している場合、商品の機能(function)と商品に対する要望(request)を索引として付与する索引関連付け規則が適用される。
図18には、商品の売り込みに関するテキスト・データに対する索引関連付け規則を適用する処理手順をフローチャートの形式で示している。この処理手順によれば、商品の機能若しくは商品に対する要望だった場合、属性Sentence−contentsと属性値function若しくはrequestを付与することができる。
テキスト・データのf−structure並びにメタ情報をそれぞれスキャンし、入力されたセンテンスが可能属性を持ち(possible=+)(ステップS41)、且つ、発言者(Speaker)がプレゼンター(Presenter)である場合には(ステップS42)、当該センテンスのSentence−contentsの値にfunctionを代入し(ステップS43)、商品の機能を表す索引を付与する
また、入力されたセンテンスが可能属性を持ち(possible=+)(ステップS41)、発言者がプレゼンターではないが(ステップS42)、疑問文形式のセンテンス(S−type=interrogative)である場合には(ステップS44)、当該センテンスのSentence−contentsの値にrequestを代入し(ステップS45)、商品の要望を表す索引を付与する。
また、入力したセンテンスが可能属性を持たないが(ステップS41)、希望を言及する場合、すなわちaddress=wishである場合には(ステップS46)、当該センテンスのSentence−contentsの値にrequestを代入し(ステップS45)、商品の要望を表す索引を付与する。
ここで、図13に示したテキスト・データのうち、センテンス「新製品はFAXと印刷とコピーが同時にできます。」を構文意味解析して得られたf−structureがメタ情報とともに図18に示した処理に投入されたとする。この場合、属性possibleが+なので、判断ブロックS41の条件を満たす。さらに、speakerは田中でありpresenterと一致するため、判断ブロックS42の条件も満たす。したがって、ステップS43で、発話内容を示す属性Sentence−contentsの値にfunctionを代入し、処理が終了する。
次に、図13に示したテキスト・データのうち、センテンス「カラーと白黒両方印刷できるか。」がメタ情報とともに図18に示した処理に投入されたとする。この場合、属性possibleが+なので、判断ブロックS41の条件を満たす。このテキストのspeakerは川村でありpresenterと一致しないため、判断ブロックS42の条件を満たさない。そして、このテキストのS−typeはinterrogativeなので、判断ブロックS44の条件を満たす。したがって、ステップS45で、発話内容を示す属性Sentence−contentsの値にrequestを代入し、処理が終了する。
次に、図13に示したテキスト・データのうち、センテンス「スキャナーとして使いたい。」がメタ情報とともに図18に示した処理に投入されたとする。この場合、f−structure中に属性possibleが存在しないので、判断ブロックS41の条件を満たさない。また、このテキストのspeakerは藤沢でありpresenterと一致しないため、判断ブロックS42の条件を満たさない。一方、このテキストのaddressはwishなので、判断ブロックS46の条件を満たす。したがって、ステップS45で、発話内容を示す属性Sentence−contentsの値にrequestを代入し、処理が終了する。
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
図1は、本発明の一実施形態に係る情報処理装置100の機能構成を模式的に示した図である。 図2は、自然言語処理部103の内部構成を模式的に示した図である。 図3は、関連文書から構文意味解析手段を用いて抽出した構文意味情報と視聴覚データの持つ索引情報を用いて索引を自動的に付与するための概略的な処理手順を示したフローチャートである。 図4は、視聴覚データとしての会議を収録したビデオ・データの特徴すなわち場面が質疑応答形式である場合に行なわれる、索引付与の処理手順を示したフローチャートである。 図5は、テキスト・データ記憶部101から取り出されたテキスト・データの構成例を示した図である。 図6は、索引データの解析により得られる視聴覚データの構成例を示した図である。 図7は、入力文「どの世代をターゲットにしているのか」を構文意味解析部1により処理した結果として得られるf−structureを示した図である。 図8は、入力文「この説明でははっきりしない」を構文意味解析部1により処理した結果として得られるf−structureを示した図である。 図9は、入力文「30代後半を狙っている」を構文意味解析部1により処理した結果として得られるf−structureを示した図である。 図10は、疑問文に対しする索引関連付け規則を適用する処理手順を示したフローチャートである。 図11は、疑問文に対する索引関連付け規則を適用する処理手順を示したフローチャートである。 図12は、索引データの出力例を示した図である。 図13は、テキスト・データ記憶部101から取り出されたテキスト・データの構成例を示した図である。 図14は、索引データの解析により得られる視聴覚データの構成例を示した図である。 図15は、入力文「新製品はFAXと印刷とコピーが同時にできます」を構文意味解析部1により処理した結果として得られるf−structureを示した図である。 図16は、入力文「カラーと白黒両方印刷できるか」を構文意味解析部1により処理した結果として得られるf−structureを示した図である。 図17は、入力文「スキャナーとしても使いたい」を構文意味解析部1により処理した結果として得られるf−structureを示した図である。 図18は、商品の売り込みに関するテキスト・データに対する索引関連付け規則を適用する処理手順を示したフローチャートである。
符号の説明
1…自然言語処理システム
2…形態素解析部
2A…形態素ルール,2B…形態素辞書
3…統語・意味解析部
3A…文法ルール,3B…結合価辞書
100…情報処理装置
101…テキスト・データ記憶部
102…視聴覚データ記憶部
103…自然言語処理部
104…索引データ解析部
105…索引関連付け規則保持部
106…索引付与部
107…索引記憶部

Claims (29)

  1. 原データに関連付けられたテキスト・データを処理する情報処理装置であって、
    テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名及び意味的形式のうち少なくとも一方を取得する自然言語処理手段と、
    原データを解析してその特徴を取得する原データ解析手段と、
    前記原データが持つ特徴に応じた文法的な機能名及び意味的形式のうち少なくとも一方を持つ部分をテキスト・データから取り出して索引として保持する索引付与手段と、
    を具備することを特徴とする情報処理装置。
  2. 原データは会議を収録したビデオ・データ及びそのメタ情報のうち少なくとも一方であり、
    テキスト・データは前記会議で使用された会議資料、議事録、又は前記ビデオ・データから音声認識又はその他の処理により抽出されたテキスト・データである、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記原データ解析手段は、収録された会議における対話形式を取得する、
    ことを特徴とする請求項2に記載の情報処理装置。
  4. 原データが持つ特徴毎の、索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を記述した索引関連付け規則を備え、
    前記索引付与手段は、索引関連付け規則によって導かれた索引を保持する、
    ことを特徴とする請求項1に記載の情報処理装置。
  5. 前記原データ解析手段により原データが質疑応答であると特定された場合に、
    前記索引付与手段は、テキスト・データの構文意味解析結果をスキャンして疑問文となるセンテンスを抽出し、疑問文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索するとともに、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンして疑問文に対する応答文となるセンテンスを抽出し、応答文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索し、導き出された索引を保持する、
    ことを特徴とする請求項1に記載の情報処理装置。
  6. 前記索引付与手段は、疑問文のセンテンス自体と、疑問文の形式(q−type)、質問されている対象(q−focus)を疑問文に関する索引として取り出す、
    ことを特徴とする請求項5に記載の情報処理装置。
  7. 前記自然言語処理手段は、レキシカル・ファンクショナル・グラマー(LFG:語彙機能的文法)文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャ(f−structure)を構文意味解析結果として出力し、
    前記索引付与手段は、疑問文のエフ−ストラクチャのうち、疑問タグを含む述部、及び疑問タグを含む述部の質問形式を索引として抽出する、
    ことを特徴とする請求項6に記載の情報処理装置。
  8. 前記索引付与手段は、疑問文のエフ−ストラクチャに疑問タグを含まない場合は、イエス/ノー質問形式を索引として抽出する、
    ことを特徴とする請求項7に記載の情報処理装置。
  9. 前記索引付与手段は、応答文のセンテンス自体と、疑問文における質問の対象に対応する回答の対象(a−focus)を応答文に関する索引として取り出す、
    ことを特徴とする請求項5に記載の情報処理装置。
  10. 前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー(LFG)文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
    前記索引付与手段は、応答文のエフ−ストラクチャのうち、疑問文において疑問タグを含む述部に対応するインデックスの述部を回答の対象として抽出する、
    ことを特徴とする請求項9に記載の情報処理装置。
  11. 前記原データ解析手段により原データが商品の売り込みであると特定された場合に、
    前記索引付与手段は、商品の機能と商品に対する要望を索引として付与する、
    ことを特徴とする請求項1に記載の情報処理装置。
  12. 前記自然言語処理手段は、レキシカル・ファンクショナル・グラマー(LFG)文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
    前記索引付与手段は、可能属性を持ち且つ発言者がプレゼンターであるセンテンスに対し商品の機能を表す索引を付与する、
    ことを特徴とする請求項11に記載の情報処理装置。
  13. 前記索引付与手段は、可能属性を持ち、発言者がプレゼンターでなく、且つ疑問文形式のセンテンスに対し商品の要望を表す索引を付与する、
    ことを特徴とする請求項12に記載の情報処理装置。
  14. 前記索引付与手段は、可能属性を持たないが、希望を言及するセンテンスに対し商品の要望を表す索引を付与する、
    ことを特徴とする請求項12に記載の情報処理装置。
  15. 原データに関連付けられたテキスト・データを処理する情報処理方法であって、
    テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名及び意味的形式のうち少なくとも一方を取得する自然言語処理ステップと、
    原データを解析してその特徴を取得する原データ解析ステップと、
    前記原データが持つ特徴に応じた文法的な機能名及び意味的形式のうち少なくとも一方を持つ部分をテキスト・データから取り出して索引として保持する索引付与ステップと、
    を具備することを特徴とする情報処理方法。
  16. 原データは会議を収録したビデオ・データ及びそのメタ情報のうち少なくとも一方であり、
    テキスト・データは前記会議で使用された会議資料、議事録、又は前記ビデオ・データから音声認識又はその他の処理により抽出されたテキスト・データである、
    ことを特徴とする請求項15に記載の情報処理方法。
  17. 前記原データ解析ステップでは、収録された会議における対話形式を取得する、
    ことを特徴とする請求項16に記載の情報処理方法。
  18. 前記索引付与ステップでは、原データが持つ特徴毎の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を記述した索引関連付け規則を参照し、該当する 索引関連付け規則によって導かれた索引を保持する、
    ことを特徴とする請求項15に記載の情報処理方法。
  19. 前記原データ解析ステップにより原データが質疑応答であると特定された場合に、
    前記索引付与ステップでは、テキスト・データの構文意味解析結果をスキャンして疑問文となるセンテンスを抽出し、疑問文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索するとともに、疑問文以降のテキスト・データの構文意味解析結果をさらにスキャンして疑問文に対する応答文となるセンテンスを抽出し、応答文の索引として要求される文法的な機能名及び意味的形式のうち少なくとも一方を当該センテンスの構文意味解析結果の中から探索し、導き出された索引を保持する、
    ことを特徴とする請求項15に記載の情報処理方法。
  20. 前記索引付与ステップでは、疑問文のセンテンス自体と、疑問文の形式(q−type)、質問されている対象(q−focus)を疑問文に関する索引として取り出す、
    ことを特徴とする請求項19に記載の情報処理方法。
  21. 前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー(LFG)文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
    前記索引付与ステップでは、疑問文のエフ−ストラクチャのうち、疑問タグを含む述部、及び疑問タグを含む述部の質問形式を索引として抽出する、
    ことを特徴とする請求項20に記載の情報処理方法。
  22. 前記索引付与ステップでは、疑問文のエフ−ストラクチャに疑問タグを含まない場合は、イエス/ノー質問形式を索引として抽出する、
    ことを特徴とする請求項21に記載の情報処理方法。
  23. 前記索引付与ステップでは、応答文のセンテンス自体と、疑問文における質問の対象に対応する回答の対象(a−focus)を応答文に関する索引として取り出す、
    ことを特徴とする請求項19に記載の情報処理方法。
  24. 前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー(LFG)文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
    前記索引付与ステップでは、応答文のエフ−ストラクチャのうち、疑問文において疑問タグを含む述部に対応するインデックスの述部を回答の対象として抽出する、
    ことを特徴とする請求項23に記載の情報処理方法。
  25. 前記原データ解析ステップにより原データが商品の売り込みであると特定された場合に、
    前記索引付与ステップでは、商品の機能と商品に対する要望を索引として付与する、
    ことを特徴とする請求項15に記載の情報処理方法。
  26. 前記自然言語処理ステップでは、レキシカル・ファンクショナル・グラマー(LFG)文法理論に基づく構文意味解析を行ない、センテンス毎の各属性との属性値の対応関係を記述したエフ−ストラクチャを構文意味解析結果として出力し、
    前記索引付与ステップでは、可能属性を持ち且つ発言者がプレゼンターであるセンテンスに対し商品の機能を表す索引を付与する、
    ことを特徴とする請求項25に記載の情報処理方法。
  27. 前記索引付与ステップでは、可能属性を持ち、発言者がプレゼンターでなく、且つ疑問文形式のセンテンスに対し商品の要望を表す索引を付与する、
    ことを特徴とする請求項26に記載の情報処理方法。
  28. 前記索引付与ステップでは、可能属性を持たないが、希望を言及するセンテンスに対し商品の要望を表す索引を付与する、
    ことを特徴とする請求項15に記載の情報処理方法。
  29. 原データに関連付けられたテキスト・データの処理をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
    テキスト・データを構文意味解析して、テキストに含まれる単語毎の文法的な機能名及び意味的形式のうち少なくとも一方を取得する自然言語処理ステップと、
    原データを解析してその特徴を取得する原データ解析ステップと、
    前記原データが持つ特徴に応じた文法的な機能名及び意味的形式のうち少なくとも一方を持つ部分をテキスト・データから取り出して索引として保持する索引付与ステップと、
    を具備することを特徴とするコンピュータ・プログラム。
JP2004075242A 2004-03-16 2004-03-16 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム Pending JP2005266980A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004075242A JP2005266980A (ja) 2004-03-16 2004-03-16 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004075242A JP2005266980A (ja) 2004-03-16 2004-03-16 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム

Publications (1)

Publication Number Publication Date
JP2005266980A true JP2005266980A (ja) 2005-09-29

Family

ID=35091497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004075242A Pending JP2005266980A (ja) 2004-03-16 2004-03-16 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP2005266980A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011065237A (ja) * 2009-09-15 2011-03-31 Konica Minolta Business Technologies Inc 画像送信装置、画像送信方法および画像送信プログラム
US8831945B2 (en) 2010-10-12 2014-09-09 Nec Informatec Systems, Ltd. Language model generating device, method thereof, and recording medium storing program thereof
EP4231633A4 (en) * 2020-11-18 2023-12-06 BOE Technology Group Co., Ltd. INTERACTION METHOD FOR TERMINAL AND ELECTRONIC WHITEBOARD AND NON-TRANSITORY COMPUTER-READABLE STORAGE MEDIUM

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011065237A (ja) * 2009-09-15 2011-03-31 Konica Minolta Business Technologies Inc 画像送信装置、画像送信方法および画像送信プログラム
US8615395B2 (en) 2009-09-15 2013-12-24 Konica Minolta Business Technologies, Inc. Generating a display screen in response to detecting keywords in speech
US8831945B2 (en) 2010-10-12 2014-09-09 Nec Informatec Systems, Ltd. Language model generating device, method thereof, and recording medium storing program thereof
US9128907B2 (en) 2010-10-12 2015-09-08 Nec Informatec Systems, Ltd. Language model generating device, method thereof, and recording medium storing program thereof
EP4231633A4 (en) * 2020-11-18 2023-12-06 BOE Technology Group Co., Ltd. INTERACTION METHOD FOR TERMINAL AND ELECTRONIC WHITEBOARD AND NON-TRANSITORY COMPUTER-READABLE STORAGE MEDIUM

Similar Documents

Publication Publication Date Title
US7263659B2 (en) Paper-based interface for multimedia information
US7266568B1 (en) Techniques for storing multimedia information with source documents
US7979786B1 (en) Techniques for retrieving multimedia information using a paper-based interface
Weisser Practical corpus linguistics: An introduction to corpus-based language analysis
US7215436B2 (en) Device for generating a multimedia paper document
US7266782B2 (en) Techniques for generating a coversheet for a paper-based interface for multimedia information
EP1467288B1 (en) Translation of slides in a multimedia presentation file
US8539344B2 (en) Paper-based interface for multimedia information stored by multiple multimedia documents
US20050216851A1 (en) Techniques for annotating multimedia information
US7743347B2 (en) Paper-based interface for specifying ranges
US20040034523A1 (en) Divided multimedia page and method and system for learning language using the page
Gol et al. Why take the risk? Motivations of highly skilled workers to participate in crowdworking platforms
JP2004212895A (ja) 教育支援システム及び方法並びに教育支援用プログラム
KR101618084B1 (ko) 회의록 관리 방법 및 그 장치
Schaeffer‐Lacroix Integrating corpus‐based audio description tasks into an intermediate‐level German course
JP2005266980A (ja) 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム
JP2004199407A (ja) 情報表示処理方法、情報表示処理システム、管理サーバ、クライアント端末、プログラム
Asadi et al. Quester: A Speech-Based Question Answering Support System for Oral Presentations
Trilsbeek et al. Archiving challenges
Williams et al. The Media Ecology Project: Collaborative DH Synergies to Produce New Research in Visual Culture History.
Ruskov et al. A Knowledge Graph of Values across Space and Time
JP2006195900A (ja) マルチメディアコンテンツ生成装置及び方法
Hürst et al. Searching in recorded lectures
CN114780793B (zh) 信息标注方法、装置、终端设备以及存储介质
JP2024069065A (ja) 字幕データ生成装置及び字幕データ生成プログラム