JP2002268667A - プレゼンテーションシステムおよびその制御方法 - Google Patents

プレゼンテーションシステムおよびその制御方法

Info

Publication number
JP2002268667A
JP2002268667A JP2001062468A JP2001062468A JP2002268667A JP 2002268667 A JP2002268667 A JP 2002268667A JP 2001062468 A JP2001062468 A JP 2001062468A JP 2001062468 A JP2001062468 A JP 2001062468A JP 2002268667 A JP2002268667 A JP 2002268667A
Authority
JP
Japan
Prior art keywords
page
voice
input
word
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001062468A
Other languages
English (en)
Inventor
Kenichiro Nakagawa
賢一郎 中川
Hiroki Yamamoto
寛樹 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001062468A priority Critical patent/JP2002268667A/ja
Publication of JP2002268667A publication Critical patent/JP2002268667A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 音声入力によってページ操作を行う場合に、
音声認識誤りが生じても所望のページを簡単な操作によ
って容易に開くことのできるプレゼンテーションシステ
ムおよびその制御方法を提供すること。 【解決手段】 ページジャンプモードに入ると、講演
者の音声をマイクロフォン101から取り込み、音声認
識部104において単語−ページ対応テーブル107の
単語を認識語彙とする音声認識処理を行う。ページ一覧
表示部105は、音声認識の尤度の上位N個の単語に各
々対応するページのページイメージをプレゼンテーショ
ンデータ108から取得し、一覧にして画面表示する。
講演者はマウス/キーボード102を用いて、表示され
たページ一覧の中から目的のページを選択すると、目的
のページにジャンプして表示される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、講演会等に使用す
るプロジェクタ等のプレゼンテーション装置に関し、特
に、音声認識機能を備えるプレゼンテーション装置に関
する。
【0002】
【従来の技術】近年、講演会等のプレゼンテーションを
行う際に、プロジェクタ(例えば、投写型液晶プロジェ
クタ)とパーソナルコンピュータとを接続し、これを利
用してプレゼンテーションを行うことが一般的になりつ
つある。プロジェクタを用いると、パーソナルコンピュ
ータ上の画面をそのままスクリーンに投影することがで
きるので、わざわざスライドやOHPシート等に出力する
必要がないという利点を有する。また、プレゼンテーシ
ョンソフトウェア(プレゼンテーションのための資料を
効率良く作成し、発表するためのアプリケーションソフ
トウェア)を用いれば、容易にスライドショーを見せる
ことができ、さらにはアニメーションや効果音といった
凝った演出を組み込むことも可能になっている。
【0003】ところで、このようなプレゼンテーション
を行う場合に、プレゼンテーションデータ(プレゼンテ
ーションソフトウェアで作成した発表用資料データ)の
所望の画面ページへの切替表示(以下、「ページジャン
プ」という。)等を行うためには、パーソナルコンピュ
ータを操作する必要がある。実際には、講演者自身がマ
ウスやキーボードを用いてこれらの操作を行うことにな
るが、スピーチしながら行うことは難しく、よほど慣れ
た講演者でないと、これらの操作の間はスピーチを中断
せざるをえない。
【0004】このため、より容易に画面切り替え等の操
作を行う手法が提案されている。例えば、特許02924717
号公報および特開平11-259269号公報は、音声認識を用
いて操作する手法を開示している。上記公報によれば、
特定の語彙(例えば、「次のページ」、「一つ前のスラ
イド」等)を音声認識し、その認識結果に応じたページ
を表示させることでスライドショーを実現している。
【0005】
【発明が解決しようとする課題】例えば、講演中の質疑
応答時等にページジャンプのための操作(以下、「ペー
ジ操作」という。)を行うことは、なかなか厄介な作業
である。該当ページは何ページにあったかを憶えていな
い場合には、プレゼンテーションデータの最初または最
後から、所望のページが得られるまで一枚一枚表示して
確認することになり、この間の操作は視聴者にとっては
見苦しいものがある。全ページの縮小イメージを一覧表
示し、講演者のその中から選択させる手法もあるが、ペ
ージ数が多い場合には一覧自体も表示上の制限を受け、
これも手間がかかる。
【0006】ページジャンプ時に音声認識技術を利用
し、例えば「経済効果の図」、「第二章」といったキー
ワードを発声すると一度で該当するページにジャンプす
る機能があれば便利ではあるが、そのためには現状の音
声認識技術につきまとう誤認識の問題に対処することが
重要となる。
【0007】従来の技術では、音声認識で第1位に認識
されたページのみを信頼してページジャンプしていたた
め、例えば講演会場の音響環境(反響音や背景雑音)に
よって音声認識がうまく働かないときには、認識誤りに
よって無関係のページを開いてしまい、場合によっては
音声入力を繰り返しても所望の結果を得ることができ
ず、結局所望のページを開くことができない状況に陥る
という問題があった。
【0008】したがって、音声認識の技術を用いてペー
ジ操作を行う場合には、現状の音声認識技術が抱える誤
認識の問題を考慮しつつ、容易な操作を実現するための
アプローチが必要である。
【0009】すなわち、本発明が目的とするところは、
音声入力によってページ操作を行う場合に、音声認識誤
りが生じても所望のページを簡単な操作によって容易に
開くことのできるプレゼンテーションシステムおよびそ
の制御方法を提供することにある。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、例えば本発明のプレゼンテーションシステムは、以
下の構成を備える。すなわち、複数のページを有するプ
レゼンテーションデータの、所望のページを開いて表示
するプレゼンテーションシステムであって、前記プレゼ
ンテーションデータに含まれる語と当該語が出現するペ
ージとの対応関係を記述したテーブルと、話者の音声を
入力する音声入力手段と、該入力された音声を認識して
複数の認識語候補を出力する音声認識手段と、該出力さ
れた各認識語候補に対応するページを、前記テーブルか
ら検索する検索手段と、該検索されたページを一覧表示
する一覧表示手段と、該一覧表示されたページのうちい
ずれかのページを選択する選択手段と、を備えることを
特徴とする。
【0011】
【発明の実施の形態】以下、添付図面を参照して本発明
の好適な実施形態を詳細に説明する。
【0012】(実施形態1)図1は、本実施形態におけ
るプレゼンテーションシステムの機能構成図である。
【0013】同図におけるプレゼンテーションシステム
は、講演者の音声を入力するためのマイクロフォン10
1、各種指示信号を入力するためのマウス/キーボード
102を備えるとともに、ページジャンプ用の単語と当
該単語が存在するページとの対応関係を表す単語−ペー
ジ対応テーブル107(詳細は後述)、および作成され
たプレゼンテーションデータ108を記憶している。そ
して、以下の機能を有する。
【0014】ページジャンプ部103は、例えば講演会
の質疑応答時等において、表示している画面ページを目
的のページにジャンプするときに機能させる処理部であ
って、具体的には以下の機能を有する。
【0015】104は、マイクロフォン101より入力
された音声に対して、単語−ページ対応テーブル107
に登録されている単語を認識語彙とする音声認識処理を
行う音声認識部である。105は、プレゼンテーション
データ108から、音声認識部104で認識された単語
候補に対応するページを一覧表示するページ一覧表示部
である。また、106は講演者からのページ指定の指示
を受け付けるページ指定取得部である。以上3つの機能
がページジャンプ部103に含まれている。
【0016】プレゼンテーション操作部109は、ペー
ジ指定取得部106で取得されたページに切り替える処
理を行い、プレゼンテーション出力部110は、当該ペ
ージを出力(投影)する。
【0017】テーブル作成部111は、単語−ページ対
応テーブル作成部112を有し、この単語−ページ対応
テーブル作成部112は、単語−ページ対応テーブル1
07を作成する。
【0018】以上が、本実施形態におけるプレゼンテー
ションシステムの機能構成である。次に、単語−ページ
対応テーブル作成部112による、単語−ページ対応テ
ーブル107の作成処理について、図3のフローチャー
トを用いて説明する。
【0019】単語−ページ対応テーブル107の作成は
講演に先立ってあらかじめ行っておく。これは、プレゼ
ンテーションデータ108を作成するときに、使用者が
手動で(すなわち、キーボード/マウス102の操作を
介して)登録してもよいし、プレゼンテーションデータ
をセットした時点で、プレゼンテーションデータ内の全
ての単語を自動で登録するようにしてもよい。自動登録
を行う場合には、単語−ページ対応テーブル作成部11
2により、図3に示すフローチャートにしたがって処理
される。
【0020】システムが立ち上がると、まず、カウンタ
変数Aに1を代入する(ステップS301)。次に、プレ
ゼンテーションデータ108を検索し、Aページ目が存
在するか否かを判定する(ステップS302)。Aペー
ジ目が存在しない場合は、全てのページを処理し終わっ
たと判断して、本処理を終了する。
【0021】プレゼンテーションデータ108にAペー
ジ目が存在した場合、Aページ目に含まれる全てのテキ
ストデータを取り込む(ステップS303)。このテキ
ストは言語解析(例えば、形態素解析)にかけられ、単
語単位に分割される(ステップS304)。
【0022】なお、特に日本語の場合、「単語」の定義
は一義的ではないが、本明細書では、上記言語解析によ
って最小単位の品詞に分割される語のことを、便宜上、
「単語」とよぶことにする。
【0023】続いて、分割された単語から1単語が取り
出される(ステップS305)。
【0024】なお、取り出す単語は、特定種類、例えば
名詞に限定するようにしてもよい。または、ページタイ
トルや図表タイトルに係る単語に限定するようにしても
よい。あるいは、特定のフォント、特定の文字サイズ、
特定の文字飾り等が施されている部分に係る単語に限定
するようにしてもよいであろう。
【0025】この取り出した単語をBとする。ステップ
S305で取り出したすべての単語について後述するス
テップS308からステップS310までの処理を行
う。ステップS306では、取り出す単語が未だあるか
否かを判断している。
【0026】ステップS308では、システムは単語−
ページ対応テーブル107を検索し、単語Bが既に登録
されているか否かを調べる。その結果、単語Bが存在せ
ず、単語Bが初めて登録される場合には、単語Bをその
ときのページを示すカウンタ変数Aと共に単語−ページ
対応テーブル107に登録する(ステップS309)。
既に単語Bが単語−ページ対応テーブル107に登録さ
れていた場合、テーブル107中のBのページ情報にA
を追加する(ステップS310)。
【0027】ステップS308からステップS310ま
での処理をページ中の全ての単語に対して行い、処理す
べき単語が無くなった時点でステップS307に進み、
Aに1を加え、ページがあるかどうかのチェック(ステ
ップS302)に戻って処理を繰り返す。
【0028】以上の処理によって、プレゼンテーション
データ108中の全ての単語、もしくは所定種類の単語
が、単語−ページ対応テーブル107に登録されること
になる。作成される単語−ページ対応テーブル107の
構造例は、図2に示すとおりである。
【0029】次に、本実施形態におけるページ操作の処
理について説明する。本実施形態におけるページ操作の
処理の概要は次のとおりである。
【0030】ページ操作を行うためのシステムの動作モ
ードのことを、本明細書では「ページジャンプモード」
とよぶ。講演者がページ操作を行うためにはまず、シス
テムをページジャンプモードとする指示を出すことにな
り、その指示は、マウス/キーボード102を用いて行
う。例えば、キーボードの「j」キーが押されるとペー
ジジャンプモードに切り替わるようになっている。
【0031】ページジャンプモードに入ると、講演者の
音声をマイクロフォン101から取り込み、音声認識部
104において音声認識処理を行う。このときの認識対
象語彙は、先に作成した単語−ページ対応テーブル10
7の単語を用いる。
【0032】音声認識部104は、尤もらしい上位N個
の候補語彙に対し、当該語彙が現れたページを単語−ペ
ージ対応テーブル107から取得する。そして、ページ
一覧表示部105は、そのページイメージをプレゼンテ
ーションデータ108から取得し、一覧にして画面表示
する。ページ指定取得部106は、講演者がマウス/キ
ーボード102を用いて、表示されたページ一覧の中か
ら目的のページを選択することでページ情報を得る。指
定されたページ情報はプレゼンテーション操作部109
に送られ、目的のページにジャンプして表示させる。
【0033】続いて、上記したページ操作の処理につい
て、図4のフローチャートを用いて詳細に説明する。
【0034】ステップS401では、例えば講演中、ペ
ージジャンプモードに割り当てられたキー「j」が押さ
れたことを監視しており、このキーが押されたことを検
出すると、講演者の音声をマイクロフォン101より一
定時間取り込む(ステップS402)。このとき得られ
た音声は、先に作成された単語−ページ対応テーブル1
07に登録されている単語を認識語彙とする音声認識処
理にかけられる(ステップS403)。
【0035】音声認識処理自体は公知のアルゴリズムを
使用することができるのでその詳細は省略するが、ここ
では、入力音声と認識語彙の音響データとの照合を経
て、その尤度が所定の閾値を超えたものを尤度の高い順
に出力するものとする。ここで得られた認識候補数(認
識語彙の内、入力音声の尤度が所定の閾値を超えた語彙
の数)は、変数Nとして記憶される。Nが0の場合、音
声認識処理は確証のある語彙を選択できなかったことに
なるため、ページジャンプモードを抜ける。Nが0でな
い場合、ページイメージ作成の処理に移る。
【0036】まず、カウンタ変数Iに1を代入し(ステ
ップS404)、I番目の認識結果である単語をCとす
る(ステップS405)。次に、単語−ページ対応テー
ブル107を検索し、単語Cが現れたページ情報を取得
し、そのページイメージをページイメージ一覧に追加す
る(ステップS406)。次に、カウンタ変数Iと認識
候補数Nとが等しいか否かを判断する(ステップS40
7)。両者が等しくない場合、Iに1を加えて(ステッ
プS408)、次の単語をCに代入する処理(ステップ
S405)に戻る。カウンタ変数Iと認識候補数Nが等
しくなった場合は、認識結果全てに対して処理を行った
ことになるため、ページ一覧表示部105により、作成
されたページイメージ一覧を表示する(ステップS40
9)。このページイメージ一覧の例を図5に示す。
【0037】図5において、501は検索結果を表示す
る検索情報ウィンドウである。図示の例では「5ページ
がマッチしました」と表示されており、音声認識の結
果、ジャンプ先候補のページが5ページあったことを示
している。そして、検索情報ウィンドウ501の下部に
は、当該5枚のページイメージ502a、502b、5
02c、502d、そして502eが表示されている。
講演者は、マウスを用いてマウスカーソル503を移動
してクリックすることにより所望のページイメージを選
択し、ジャンプ先のページを確定することができる。
【0038】システムは講演者がページイメージを選択
するまで待機し(ステップS410)、講演者がこのペ
ージイメージ一覧から目的のページを選択してクリック
することでそのページにジャンプする(ステップS41
1)。ページジャンプが終わると、このモードを抜け、
再び「j」キーが押されるまで待機することになる。
【0039】以上、実施形態1におけるページ操作につ
いて説明した。
【0040】先に述べたとおり、従来は、音声認識で第
1位に認識されたページに直接ジャンプするようにして
いたため、例えば講演会場の音響環境(反響音や背景雑
音)によって音声認識がうまく働かないときには、認識
誤りによって無関係のページを開いてしまい、場合によ
っては音声入力を繰り返しても所望の結果を得ることが
できず、結局所望のページを開くことができない状況に
陥るという問題があった。
【0041】これに対し、上述した実施形態のページ操
作手順によれば、操作者はページジャンプモードにする
ための1回のキー入力と、ジャンプしたいページに含ま
れていそうなキーワードの発声によって、まずはジャン
プ先候補が絞り込まれたページ一覧が表示され、そし
て、その中から所望のページを確定することができる。
このようなステップを踏むことによって、多少の音声認
識誤りは許容できることになる。
【0042】なお、上述した実施形態では、キーボード
入力によってページジャンプモードに入ることとした
が、キーボード入力の代わりに音声認識を用い、講演者
が所定のキーワード(例えば、「ページジャンプモー
ド」)を発声した場合に、ページジャンプモードに入る
ようにすることも可能である。
【0043】また、講演者にページを選択させる処理
(ステップS409、ステップS410)において、図
5に示すように、各ページイメージに数字をふっておき
(各イメージページの左上部に数字が大きく表示されて
いる)、その数字を認識語彙とする音声認識処理を行う
ことで、マイクロフォン101からの音声入力だけでペ
ージを選択させることが可能である。
【0044】また、同図に示すように、「絞り込み再検
索」ボタン504を用意し、検索結果が予想以上に多か
った場合にこのボタンをクリックすることで、再び絞り
込み検索をかけることが可能である。
【0045】「新規再検索」ボタン505は新たに検索
をし直す場合に用い、「キャンセル」ボタン506はペ
ージジャンプモードを抜けるときに用いる。
【0046】また、上述した実施形態では、音声認識の
尤度が高い順にページイメージを並べて表示するように
したが、表示順序はこれに限らず、他の観点により並べ
て表示することができる。さらに、順位によってページ
イメージの表示態様を変化させることも考えられる。
【0047】図6は、講演者が「シサン」と発声し、
「資産」と「期間」が認識候補単語となった場合のペー
ジ一覧の表示例を示している。この例では、認識候補単
語が多く含まれるページほど順位を上げ、順位が高いペ
ージほど、ページイメージを大きく表示している。さら
に、認識結果の単語(「資産」と「期間」)はアンダー
ラインを付したうえ字体を大きくすることで強調表示し
ている。
【0048】(実施形態2)図7は、本実施形態におけ
るプレゼンテーションシステムの機能構成図である。な
お、図1における処理部と同じ処理部には同じ参照番号
を付して、それらの詳細な説明は省略する。
【0049】図7におけるプレゼンテーションシステム
は、マイクロフォン101およびマウス/キーボード1
02を備えるとともに、収録された講演中の音声データ
と収録時に表示していたページの情報とを関連づけて格
納する講演データベース709、および作成されたプレ
ゼンテーションデータ108を記憶している。そして、
以下のような機能を有する。
【0050】ページジャンプ部703は、図1のページ
ジャンプ部103と同様に、例えば講演会の質疑応答時
等において、表示している画面ページを目的のページに
ジャンプするときに機能させる処理部であって、具体的
には以下の機能を有する。
【0051】704はページジャンプのためのキーワー
ド音声(以下、「ジャンプキーワード音声」という。)
マイクロフォン101より取得するジャンプキーワード
音声取得部、705はジャンプキーワード音声取得部7
04で取得された音声を講演データベース709から検
索する講演データベース検索部である。この他、ページ
一覧表示部105およびページ指定取得部106が、ペ
ージジャンプ部703に含まれる。
【0052】本システムは、2つのモードを有する。1
つは、講演中に、その講演音声を収録するための「講演
モード」、もう1つは、質疑応答時等に、ページ操作を
行うための「ページジャンプモード」である。
【0053】モード切り替え部708は講演中の所定の
キーやマウス操作があったか否かを監視し、所定のキー
またはマウス操作を検出してページジャンプモードを切
り替える。ここでは例えば、「j」キーが押された場合
にページジャンプモードに切り替わる。
【0054】講演録音部713は、マイクロフォン10
1から入力される講演中の音声を録音する講演音声録音
部714および講演データベース709を作成する講演
データベース作成部715を含む。
【0055】以上が本実施形態におけるプレゼンテーシ
ョンシステムの機能構成である。
【0056】講演が始まると、本システムは講演モード
となる。講演モードでは、講演音声録音部714は、マ
イクロフォン101から講演者の音声を収録する。ここ
で収録された音声は、講演データベース作成部715に
おいて現在表示されているページ情報が付加されて、講
演データベース709に格納される。このとき格納され
る音声データは、収録された音声そのままでもよいし、
既存の技術によって音声圧縮された形式であってもよ
い。
【0057】図8は講演データベースに格納される講演
音声データとページ情報との関係の一例を示す模式図で
ある。区間a−bにおける講演音声データは第7ページ
を表示していたときのものであり、区間b−cにおける
講演音声データは第8ページを表示していたときのもの
である。例えば、各区間の講演音声データのヘッダ部に
それぞれのページ番号が記録される。
【0058】ページジャンプモードに入ると、ジャンプ
キーワード音声取得部704は、マイクロフォン101
からジャンプキーワード音声を取得する。講演データベ
ース検索部705は、このジャンプキーワード音声に近
い発声を講演データベース709の音声から検索する。
この時の検索方法は、既存の音声検索技術を用いること
ができる。簡単に説明すると、ジャンプキーワード音声
と、講演データベースの音声とのDP(dynamic programmi
ng)マッチングを行う。このときのマッチングスコア
(尤度)が閾値より大きくなる講演データベース音声の
開始点をマッチング候補とし、その音声部分に対応した
ページ情報を取得する。このページがページジャンプ候
補とされ、ページ一覧表示部105においてその縮小ペ
ージイメージがページ一覧として表示される。ページ指
定取得部106は、講演者がマウス/キーボード102
を用いて、表示されたページ一覧の中から目的のページ
イメージを選択することでページ情報を得る。指定され
たページ情報はプレゼンテーション操作部109に送ら
れ、目的のページにジャンプして表示させる。
【0059】続いて、上記したページ操作の処理につい
て、図9のフローチャートを用いて詳細に説明する。
【0060】まず、ステップS901では、ページジャ
ンプモードに割り当てられた「j」キーが押されたこと
を監視する。「j」キーが押されないかぎり、講演モー
ドとして、ステップS902に進み、講演者の音声を一
定時間取り込む。さらに、現在表示しているページ情報
を取得し(ステップS903)、取り込んだ音声と共に
講演データベース709に追加して(ステップS90
4)、ステップS901に戻る。
【0061】ステップS901で、「j」キーが押され
たこと検出すると、システムはページジャンプモードに
切り替わる。ここではマイクロフォン101から一定時
間、ジャンプキーワード音声を取り込み(ステップS9
05)、そのジャンプキーワード音声が講演データベー
ス709における音声にマッチする部分を検索して、そ
の検索結果数(すなわち、講演データベース709にお
けるジャンプキーワード音声の出現回数)を変数Nに格
納する(ステップS906)。
【0062】このときNが0ならば、キーワードに相当
する音声部分は見つからなかったとみなし、ステップS
901に戻ってジャンプモードを抜ける。Nが0以外で
ある場合は、講演データベース709中にキーワードと
マッチする部分が見つかったことになり、ステップS9
07に進む。
【0063】ステップS907では、カウンタ変数Iに
1を代入する。続くステップS908では、これらのマ
ッチした音声部分は尤度順にソートされ、順位が上のも
のから処理される。まずI番目にマッチした音声部分に
対応するページ情報を講演データベース709から検索
し、そのページ番号をAに格納する。
【0064】次に、ページAが既にページイメージ一覧
に登録されているか否かを判断する(ステップS90
9)。ここで、ページAは未だページイメージ一覧に登
録されていない場合には、ステップS910に進み、ペ
ージイメージ一覧に追加して、ステップS911に進
む。すでにページAがページイメージ一覧に登録されて
いる場合には、そのままステップS911に進む。
【0065】ステップS911では、カウンタ変数Iの
値が講演データベース709におけるジャンプキーワー
ド音声の出現回数Nと等しいか否かを判断する。noで
あればステップS912に進み、Iに1を加えてステッ
プS908に戻って処理を繰り返す。すなわち、このル
ープによって、ジャンプキーワード音声を講演中に発声
したときに表示されていたページが特定されることにな
る。
【0066】ステップS911の判断がyesであれ
ば、ステップS913に進み、ページイメージ一覧を表
示する。講演者はこの一覧の中から目的のページをクリ
ックすることで選択する(ステップS914)。この選
択により、システムは選択されたページにジャンプして
表示し(ステップS915)、ステップS901に戻っ
てページジャンプモードを終了する。
【0067】以上、実施形態2におけるページ操作につ
いて説明した。
【0068】上述した実施形態2によれば、講演中の音
声を収録し、その音声データはそのときに開いていたペ
ージ番号とを関連づけて、講演データベース709が作
成される。そして、ページ操作時に入力されたジャンプ
キーワード音声がこの講演データベース709から検索
されて該当するページが表示されるので、講演に先立っ
てあらかじめ所定の単語とページとの対応関係を示すテ
ーブルを作成しておく必要がなくなるという利点を有す
る。
【0069】
【他の実施形態】図1に示した実施形態1および図7に
示した実施形態2に係るプレゼンテーションシステムの
機能を、一般的なパーソナルコンピュータを用いて実現
する場合について説明する。
【0070】図10は図1または図7に示したプレゼン
テーションシステムを実現するパーソナルコンピュータ
50であって、そのハードウエア構成を示すブロック図
である。このパーソナルコンピュータ50は、CRT6
に表示される内容と同じ内容をスクリーンに投影するた
めのプロジェクタ60と通信可能に接続されている。
【0071】図示するように、パーソナルコンピュータ
50全体の制御をつかさどるCPU1、ブートプログラ
ム等を記憶しているROM2、主記憶装置として機能す
るRAM3をはじめ、以下の構成を備える。
【0072】HDD4はハードディスク装置である。ま
た、VRAM5は表示しようとするイメージデータを展
開するメモリであり、ここにイメージデータ等を展開す
ることでCRT6に表示させることができる。
【0073】さらに、図1と同じマイクロフォン101
およびキーボード/マウス102も備える。
【0074】また、110はマイクロフォン101から
入力された信号を増幅するマイクアンプ、111は不要
な高周波成分を遮断するためのローパスフィルタ、11
2はローパスフィルタ111の出力信号をディジタル信
号に変換するためのA/D変換器、そして、10はプロ
ジェクタ60との通信を行うためのインタフェースであ
る。
【0075】図1に示した実施形態1に係るプレゼンテ
ーションシステムを実現する場合、HDD4は、図11
に示す如く、OS40をはじめ、図1の音声認識部10
4の機能を担う音声認識プログラム41、テーブル作成
部111の機能を担うテーブル作成プログラム42が格
納される。
【0076】さらに、プレゼンテーションデータ108
を作成し、プレゼンテーション操作部109、プレゼン
テーション出力部110、ページ一覧表示部105、そ
してページ指定取得部106としての機能を担うプレゼ
ンテーションソフトウェア43も格納される。この他、
テーブル作成プログラム42により作成される単語−ペ
ージ対応テーブル107およびプレゼンテーションソフ
トウェア43により作成されるプレゼンテーションデー
タ108も、このHDD4に格納される。
【0077】また、図7に示した実施形態2に係るプレ
ゼンテーションシステムを実現する場合、HDD4は、
図12に示す如く、OS40をはじめ、図7の講演音声
録音部714および講演データベース作成部715とし
ての機能を担う講演データベース作成プログラム45、
ジャンプキーワード音声取得部704、講演データベー
ス検索部705としての機能を担う講演データベース検
索プログラム46が格納される。
【0078】さらに、プレゼンテーションデータ108
を作成し、プレゼンテーション操作部109、プレゼン
テーション出力部110、ページ一覧表示部105、ペ
ージ指定取得部106、そしてモード切り替え部708
としての機能を担うプレゼンテーションソフトウェア4
4も格納される。この他、講演データベース作成プログ
ラム45により作成される講演データベース709およ
びプレゼンテーションソフトウェア44により作成され
るプレゼンテーションデータ108も、このHDD4に
格納される。
【0079】HDD4に格納されているOS40をはじ
め各プログラムは、電源の投入後、RAM3にロードさ
れて、CPU1によって実行されることになる。
【0080】以上の構成によれば、上述した実施形態の
処理をパーソナルコンピュータをプロジェクタに接続し
た形態で実現することができることは理解されよう。
【0081】上述したように、本発明の目的は、前述し
た実施形態の機能を実現するソフトウェアのプログラム
コードを記録した記憶媒体(または記録媒体)を、シス
テムあるいは装置に供給し、そのシステムあるいは装置
のコンピュータ(またはCPUやMPU)が記憶媒体に
格納されたプログラムコードを読み出し実行することに
よっても、達成される。この場合、記憶媒体から読み出
されたプログラムコード自体が前述した実施形態の機能
を実現することになり、そのプログラムコードを記憶し
た記憶媒体は本発明を構成することになる。
【0082】また、コンピュータが読み出したプログラ
ムコードを実行することにより、前述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼働しているオペレーテ
ィングシステム(OS)などが実際の処理の一部または
全部を行い、その処理によって前述した実施形態の機能
が実現される場合も含まれることは言うまでもない。
【0083】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
【0084】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した図3および図4、または
図9のフローチャートに対応するプログラムコードが格
納されることになる。
【0085】
【発明の効果】以上説明したように、本発明によれば、
音声入力によってページ操作を行う場合に、音声認識誤
りが生じても所望のページを簡単な操作によって容易に
開くことのできるプレゼンテーションシステムおよびそ
の制御方法を提供することができる。
【図面の簡単な説明】
【図1】実施形態1におけるプレゼンテーションシステ
ムの機能構成図である。
【図2】実施形態1において作成される単語−ページ対
応テーブルの構造例を示す模式図である。
【図3】実施形態1における単語−ページ対応テーブル
の作成処理を示すフローチャートである。
【図4】実施形態1におけるページ操作の処理を示すフ
ローチャートである。
【図5】実施形態におけるページイメージ一覧の表示例
を示す図である。
【図6】実施形態におけるページイメージ一覧の表示例
を示す図である。
【図7】実施形態2におけるプレゼンテーションシステ
ムの機能構成図である。
【図8】実施形態2における講演データベースに格納さ
れる講演音声データとページ情報との関係の一例を示す
模式図である。
【図9】実施形態2におけるページ操作の処理を示すフ
ローチャートである。
【図10】実施形態におけるプレゼンテーションシステ
ムを実現するパーソナルコンピュータのハードウエア構
成を示すブロック図である。
【図11】実施形態におけるハードディスクの格納内容
を示す模式図である。
【図12】実施形態におけるハードディスクの格納内容
を示す模式図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/08 G10L 3/00 531W 15/10 Fターム(参考) 5D015 AA04 KK02 KK03 LL08 5E501 AC14 BA05 CA03 CB02 CB09 CB15 EA02 EA05 EA13 FA06 FA14 FA22 FA32 FA42 FB34 FB43

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 複数のページを有するプレゼンテーショ
    ンデータの、所望のページを開いて表示するプレゼンテ
    ーションシステムであって、 前記プレゼンテーションデータに含まれる語と当該語が
    出現するページとの対応関係を記述したテーブルと、 話者の音声を入力する音声入力手段と、 該入力された音声を認識して複数の認識語候補を出力す
    る音声認識手段と、 該出力された各認識語候補に対応するページを、前記テ
    ーブルから検索する検索手段と、 該検索されたページを一覧表示する一覧表示手段と、 該一覧表示されたページのうちいずれかのページを選択
    する選択手段と、 を備えることを特徴とするプレゼンテーションシステ
    ム。
  2. 【請求項2】 前記テーブルを作成するテーブル作成手
    段を更に備え、 該テーブル作成手段は、 前記プレゼンテーションデータ中のテキストに含まれる
    語を抽出する抽出手段と、 該抽出された語と当該語が出現するページとを対応付け
    て当該テーブルの所定領域に記述する記述手段と、 を備えることを特徴とする請求項1に記載のプレゼンテ
    ーションシステム。
  3. 【請求項3】 前記抽出手段は、前記プレゼンテーショ
    ンデータ中のテキストに含まれる語のうち、所定の種類
    の語を抽出することを特徴とする請求項2に記載のプレ
    ゼンテーションシステム。
  4. 【請求項4】 前記検索手段は、 前記音声入力手段より別途入力された音声に対して前記
    音声認識手段より出力された各認識語候補を含むページ
    を、前記一覧表示手段により一覧表示されたページの中
    から検索する、絞り込み検索手段を更に備えることを特
    徴とする請求項1ないし3のいずれか1項に記載のプレ
    ゼンテーションシステム。
  5. 【請求項5】 複数のページを有するプレゼンテーショ
    ンデータの、所望のページを開いて表示するプレゼンテ
    ーションシステムであって、 話者の音声を入力する第1の入力手段と、 該第1の入力手段より入力された音声を、当該音声が入
    力された時に表示されていた前記プレゼンテーションデ
    ータのページと対応付けて記憶することで音声データベ
    ースを作成するデータベース作成手段と、 話者のキーワード音声を入力する第2の入力手段と、 前記音声データベースから、該第2の入力手段より入力
    された前記キーワード音声に近似する音声部分を検出
    し、該検出された音声部分に対応する前記プレゼンテー
    ションデータのページを特定する検索手段と、 該検索手段で特定されたページを一覧表示する一覧表示
    手段と、 該一覧表示されたページのうちいずれかのページを選択
    する選択手段と、 を備えることを特徴とするプレゼンテーションシステ
    ム。
  6. 【請求項6】 前記検索手段は、 前記音声データベースのうち、前記一覧表示手段により
    一覧表示された各ページに対応する音声の中から、前記
    第2の入力手段より別途入力されたキーワード音声に近
    似する音声部分を検出し、該検出された音声部分に対応
    するページを特定する、絞り込み検索手段を更に備える
    ことを特徴とする請求項5に記載のプレゼンテーション
    システム。
  7. 【請求項7】 複数のページを有するプレゼンテーショ
    ンデータの、所望のページを開いて表示するプレゼンテ
    ーションシステムの制御方法であって、 話者の音声を入力する音声入力工程と、 該入力された音声を認識して複数の認識語候補を出力す
    る音声認識工程と、 該出力された各認識語候補に対応するページを、前記プ
    レゼンテーションデータに含まれる語と当該語が出現す
    るページとの対応関係を記述したテーブルから検索する
    検索工程と、 該検索されたページを一覧表示する一覧表示工程と、 該一覧表示されたページのうちいずれかのページを選択
    する選択工程と、 を有することを特徴とするプレゼンテーションシステム
    の制御方法。
  8. 【請求項8】 前記音声入力工程に先立ち、前記テーブ
    ルを作成するテーブル作成工程を更に有し、 該テーブル作成工程は、 前記プレゼンテーションデータ中のテキストに含まれる
    語を抽出する抽出工程と、 該抽出された語と当該語が出現するページとを対応付け
    て当該テーブルの所定領域に記述する記述工程と、 を有することを特徴とする請求項7に記載のプレゼンテ
    ーションシステムの制御方法。
  9. 【請求項9】 前記抽出工程は、前記プレゼンテーショ
    ンデータ中のテキストに含まれる語のうち、所定の種類
    の語を抽出することを特徴とする請求項8に記載のプレ
    ゼンテーションシステムの制御方法。
  10. 【請求項10】 前記選択工程は、 別途、話者の音声を入力し、 該入力された音声を認識して複数の認識語候補を出力
    し、 該出力された各認識語候補を含むページを、前記一覧表
    示工程において一覧表示されたページの中から検索す
    る、絞り込み検索工程を更に有することを特徴とする請
    求項7ないし9のいずれか1項に記載のプレゼンテーシ
    ョンシステムの制御方法。
  11. 【請求項11】 複数のページを有するプレゼンテーシ
    ョンデータの、所望のページを開いて表示するプレゼン
    テーションシステムの制御方法であって、 話者の音声を入力する第1の入力工程と、 該第1の入力工程において入力された音声を、当該音声
    が入力された時に表示されていた前記プレゼンテーショ
    ンデータのページと対応付けて記憶することで音声デー
    タベースを作成するデータベース作成工程と、 話者のキーワード音声を入力する第2の入力工程と、 前記音声データベースから、該第2の入力工程において
    入力された前記キーワード音声に近似する音声部分を検
    出し、該検出された音声部分に対応する前記プレゼンテ
    ーションデータのページを特定する検索工程と、 該検索工程で特定されたページを一覧表示する一覧表示
    工程と、 該一覧表示されたページのうちいずれかのページを選択
    する選択工程と、 を有することを特徴とするプレゼンテーションシステム
    の制御方法。
  12. 【請求項12】 前記検索工程は、 別途、話者のキーワード音声を入力し、 前記一覧表示工程において一覧表示された各ページに対
    応する音声の中から、前記キーワード音声に近似する音
    声部分を検出し、 該検出された音声部分に対応するページを特定する、絞
    り込み検索工程を更に有することを特徴とする請求項1
    1に記載のプレゼンテーションシステムの制御方法。
  13. 【請求項13】 コンピュータが読み込み実行すること
    で、複数のページを有するプレゼンテーションデータ
    の、所望のページを開いて表示するプレゼンテーション
    システムとして機能するプログラムであって、 話者の音声を入力する音声入力工程のプログラムコード
    と、 該入力された音声を認識して複数の認識語候補を出力す
    る音声認識工程のプログラムコードと、 該出力された各認識語候補に対応するページを、前記プ
    レゼンテーションデータに含まれる語と当該語が出現す
    るページとの対応関係を記述したテーブルから検索する
    検索工程のプログラムコードと、 該検索されたページを一覧表示する一覧表示工程のプロ
    グラムコードと、 該一覧表示されたページのうちいずれかのページを選択
    する選択工程のプログラムコードと、 を有することを特徴とするプログラム。
  14. 【請求項14】 前記音声入力工程に先立ち、前記テー
    ブルを作成するテーブル作成工程のプログラムコードを
    更に有し、 該テーブル作成工程のプログラムコードは、 前記プレゼンテーションデータ中のテキストに含まれる
    語を抽出する抽出工程のプログラムコードと、 該抽出された語と当該語が出現するページとを対応付け
    て当該テーブルの所定領域に記述する記述工程のプログ
    ラムコードと、 を有することを特徴とする請求項13に記載のプログラ
    ム。
  15. 【請求項15】 前記抽出工程のプログラムコードは、
    前記プレゼンテーションデータ中のテキストに含まれる
    語のうち、所定の種類の語を抽出することを特徴とする
    請求項14に記載のプログラム。
  16. 【請求項16】 前記選択工程のプログラムコードは、 別途、話者の音声を入力し、 該入力された音声を認識して複数の認識語候補を出力
    し、 該出力された各認識語候補を含むページを、前記一覧表
    示工程において一覧表示されたページの中から検索す
    る、絞り込み検索工程のプログラムコードを更に有する
    ことを特徴とする請求項13ないし15のいずれか1項
    に記載のプログラム。
  17. 【請求項17】 コンピュータが読み込み実行すること
    で、複数のページを有するプレゼンテーションデータ
    の、所望のページを開いて表示するプレゼンテーション
    システムとして機能するプログラムであって、 話者の音声を入力する第1の入力工程のプログラムコー
    ドと、 該第1の入力工程において入力された音声を、当該音声
    が入力された時に表示されていた前記プレゼンテーショ
    ンデータのページと対応付けて記憶することで音声デー
    タベースを作成するデータベース作成工程のプログラム
    コードと、 話者のキーワード音声を入力する第2の入力工程のプロ
    グラムコードと、 前記音声データベースから、該第2の入力工程において
    入力された前記キーワード音声に近似する音声部分を検
    出し、該検出された音声部分に対応する前記プレゼンテ
    ーションデータのページを特定する検索工程のプログラ
    ムコードと、 該検索工程で特定されたページを一覧表示する一覧表示
    工程のプログラムコードと、 該一覧表示されたページのうちいずれかのページを選択
    する選択工程のプログラムコードと、 を有することを特徴とするプログラム。
  18. 【請求項18】 前記検索工程のプログラムコードは、 別途、話者のキーワード音声を入力し、 前記一覧表示工程において一覧表示された各ページに対
    応する音声の中から、前記キーワード音声に近似する音
    声部分を検出し、 該検出された音声部分に対応するページを特定する、絞
    り込み検索工程のプログラムコードを更に有することを
    特徴とする請求項17に記載のプログラム。
  19. 【請求項19】 請求項13ないし18のいずれか1項
    に記載のプログラムを格納した記憶媒体。
JP2001062468A 2001-03-06 2001-03-06 プレゼンテーションシステムおよびその制御方法 Withdrawn JP2002268667A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001062468A JP2002268667A (ja) 2001-03-06 2001-03-06 プレゼンテーションシステムおよびその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001062468A JP2002268667A (ja) 2001-03-06 2001-03-06 プレゼンテーションシステムおよびその制御方法

Publications (1)

Publication Number Publication Date
JP2002268667A true JP2002268667A (ja) 2002-09-20

Family

ID=18921600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001062468A Withdrawn JP2002268667A (ja) 2001-03-06 2001-03-06 プレゼンテーションシステムおよびその制御方法

Country Status (1)

Country Link
JP (1) JP2002268667A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005027092A1 (ja) * 2003-09-08 2005-03-24 Nec Corporation 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
JP2007156286A (ja) * 2005-12-08 2007-06-21 Hitachi Ltd 情報認識装置及び情報認識プログラム
JP2007206886A (ja) * 2006-01-31 2007-08-16 Canon Inc 情報処理装置および方法
US7739116B2 (en) 2004-12-21 2010-06-15 International Business Machines Corporation Subtitle generation and retrieval combining document with speech recognition
WO2017124692A1 (zh) * 2016-01-20 2017-07-27 百度在线网络技术(北京)有限公司 查找表单页面和目标页面转化关系的方法和装置
US10768887B2 (en) 2017-02-22 2020-09-08 Samsung Electronics Co., Ltd. Electronic apparatus, document displaying method thereof and non-transitory computer readable recording medium

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005027092A1 (ja) * 2003-09-08 2005-03-24 Nec Corporation 文書作成閲覧方法、文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
US7734996B2 (en) 2003-09-08 2010-06-08 Nec Corporation Documentation browsing method, documentation browsing apparatus, documentation browsing robot, and documentation browsing program
US7739116B2 (en) 2004-12-21 2010-06-15 International Business Machines Corporation Subtitle generation and retrieval combining document with speech recognition
US8155969B2 (en) 2004-12-21 2012-04-10 International Business Machines Corporation Subtitle generation and retrieval combining document processing with voice processing
JP2007156286A (ja) * 2005-12-08 2007-06-21 Hitachi Ltd 情報認識装置及び情報認識プログラム
JP2007206886A (ja) * 2006-01-31 2007-08-16 Canon Inc 情報処理装置および方法
JP4603988B2 (ja) * 2006-01-31 2010-12-22 キヤノン株式会社 情報処理装置および方法
WO2017124692A1 (zh) * 2016-01-20 2017-07-27 百度在线网络技术(北京)有限公司 查找表单页面和目标页面转化关系的方法和装置
US10768887B2 (en) 2017-02-22 2020-09-08 Samsung Electronics Co., Ltd. Electronic apparatus, document displaying method thereof and non-transitory computer readable recording medium
US11556302B2 (en) 2017-02-22 2023-01-17 Samsung Electronics Co., Ltd. Electronic apparatus, document displaying method thereof and non-transitory computer readable recording medium

Similar Documents

Publication Publication Date Title
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
US6510412B1 (en) Method and apparatus for information processing, and medium for provision of information
US7054817B2 (en) User interface for speech model generation and testing
TWI554984B (zh) 電子裝置
US8903724B2 (en) Speech recognition device and method outputting or rejecting derived words
CN115082602B (zh) 生成数字人的方法、模型的训练方法、装置、设备和介质
JP6280312B2 (ja) 議事録記録装置、議事録記録方法及びプログラム
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
US11881209B2 (en) Electronic device and control method
US10347243B2 (en) Apparatus and method for analyzing utterance meaning
JP2016045420A (ja) 発音学習支援装置およびプログラム
JP2924717B2 (ja) プレゼンテーション装置
JP2008083100A (ja) 音声対話装置及びその方法
JP2003005789A (ja) 文字処理装置および方法
JP2002268667A (ja) プレゼンテーションシステムおよびその制御方法
JP2001272990A (ja) 対話記録編集装置
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
JP6746886B2 (ja) 学習支援装置及びその学習支援装置用のプログラム
JPH07219587A (ja) 音声処理装置および方法
JP2009301266A (ja) ユーザインタフェース装置
JP2003108566A (ja) エージェントを用いた情報検索方法および情報検索装置
JP4229627B2 (ja) ディクテーション装置、方法及びプログラム
JP2002304407A (ja) プログラム及び情報処理装置
JP2004118856A (ja) エージェントを用いた情報検索方法および情報検索装置
KR102479023B1 (ko) 외국어 학습 서비스 제공 장치, 방법 및 프로그램

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080513