JPH08339198A - プレゼンテーション装置 - Google Patents

プレゼンテーション装置

Info

Publication number
JPH08339198A
JPH08339198A JP7167896A JP16789695A JPH08339198A JP H08339198 A JPH08339198 A JP H08339198A JP 7167896 A JP7167896 A JP 7167896A JP 16789695 A JP16789695 A JP 16789695A JP H08339198 A JPH08339198 A JP H08339198A
Authority
JP
Japan
Prior art keywords
presentation
unit
voice
voice recognition
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7167896A
Other languages
English (en)
Other versions
JP2924717B2 (ja
Inventor
Koichi Shinoda
浩一 篠田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7167896A priority Critical patent/JP2924717B2/ja
Publication of JPH08339198A publication Critical patent/JPH08339198A/ja
Application granted granted Critical
Publication of JP2924717B2 publication Critical patent/JP2924717B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 マイクロフォンに入力された音声に含まれる
キーワードを認識できるとともに、この認識したキーワ
ードに基づいて画像,音声等のプレゼンテーションデー
タの操作を自動的に行うことができるようにする。 【構成】 マイクロフォン1と、音声の認識に用いる音
声認識用辞書2aを参照して、マイクロフォン1から入
力された音声に含まれるキーワードを認識する音声認識
部3と、その認識したキーワードに対応する操作コマン
ドを生成するコマンド生成部4と、プレゼンテーション
に使用する画像,音声等のプレゼンテーションデータを
記憶したプレゼンテーション記憶部6と、この記憶され
たプレゼンテーションデータを上記操作コマンドに基づ
いて操作するプレゼンテーション操作部5と、この操作
に係るプレゼンテーションデータを出力するプレゼンテ
ーション出力部7とを有している。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、発表・講演・宣伝等の
プレゼンテーションに使用するプレゼンテーション装置
に関する。特に、音声に含まれるキーワードを認識し
て、これに対応してスライド画像等の送り動作あるいは
その一部の拡大等の操作を自動的に行うプレゼンテーシ
ョン装置に関するものである。
【0002】
【従来の技術】近年、コンピュータの小型化,高速化,
高性能化が進み、発表,講演,宣伝等において、コンピ
ュータを用いたプレゼンテーションが盛んになってきて
いる。
【0003】具体的には、従来から使用されていたOH
P・スライド等を用いずに、フロッピィーディスク等に
プレゼンテーションの内容を示すプレゼンテーションデ
ータ(以下、題材という)を記憶させておく。
【0004】そして、プレゼンテーションを行う会場や
部屋等で、コンピュータに搭載されたプレゼンテーショ
ン用のソフトウェア(たとえばマイクロソフト社の製品
「パワーポイント バージョン4.0」)を起動させ、
適宜フロッピィーディスク等から題材を読み出して、プ
レゼンテーションの補助を行うようにしている。
【0005】このようなコンピュータを用いたプレゼン
テーションシステムは、OHP・スライド等に比べて題
材の携帯がより容易であり、しかも、題材が動画、音声
等の静止画以外の情報も含んで構成されている場合であ
っても、同じコンピュータでプレゼンテーションを行え
るとともに、同期をとる操作も容易であるという利点が
ある。
【0006】
【発明が解決しようとする課題】ところで、上記従来の
プレゼンテーションシステムでは、画像,音声等の切り
替え,起動等の操作を指示するために、マウス,キーボ
ード等を用いている。
【0007】しかしながら、効果的なプレゼンテーショ
ンを行うには、これらマウス,キーボードは望ましいも
のではない。
【0008】すなわち、マウスは釦の数が少ないため
に、可能な操作数が限られる。また、キーボードは大き
すぎるために携帯に不便であり、さらに、どちらも操作
を行う際に、プレゼンテーションが止まってしまうとい
う欠点がある。
【0009】そこで本発明は、マイクロフォンに入力さ
れた音声に含まれるキーワードを認識できるとともに、
この認識したキーワードに基づいて画像,音声等のプレ
ゼンテーションデータの操作を自動的に行うことができ
るプレゼンテーション装置の提供を目的とする。
【0010】
【課題を解決するための手段】本発明の構成は次の通り
である。マイクロフォン1と、音声の認識に用いる音声
認識用辞書2aを参照して、マイクロフォン1から入力
された音声に含まれるキーワードを認識する音声認識部
3と、その認識したキーワードに対応する操作コマンド
を生成するコマンド生成部4と、プレゼンテーションに
使用する画像,音声等のプレゼンテーションデータを記
憶したプレゼンテーション記憶部6と、この記憶された
プレゼンテーションデータを上記操作コマンドに基づい
て操作するプレゼンテーション操作部5と、この操作に
係るプレゼンテーションデータを出力するプレゼンテー
ション出力部7とを有している。
【0011】上記の構成に次のような構成を加えてもよ
い。上記音声認識部3は、入力された音声の認識をキー
ワードスポッティング手法により行う。
【0012】音声認識部3による音声認識の開始・終了
を行わせる音声認識スイッチ部8を設ける。
【0013】マイクロフォン1から出力された音声を順
次所要時間分だけ記憶しておくデータ記憶部9を設ける
とともに、音声認識スイッチ部8がオン操作されたとき
には、音声認識部3はデータ記憶部9に記憶されている
音声データを含めて音声認識の対象とするようにする。
【0014】音声認識の終了をある一定時間遅延させて
音声認識部に伝達する終了命令遅延部を設ける。
【0015】プレゼンテーション記憶部から、キーワー
ドを自動的に抽出して音声認識用辞書を作成する自動辞
書作成部を設ける。
【0016】音声認識用辞書には、認識候補となる単語
モデルが登録されており、これをプレゼンテーション出
力部に表示させる認識候補単語出力部を設ける。
【0017】プレゼンテーション出力部を複数設けると
ともに、そのうちの1つに認識候補単語出力部を設け
る。
【0018】音声以外の複数のメディアからの入力デー
タにより操作コマンドを生成する複数の副コマンド生成
部と、これらの副コマンド生成部及びコマンド生成部か
ら出力された操作コマンドの中から、プレゼンテーショ
ン出力部に送出する操作コマンドを選択するメディア選
択部とを設ける。
【0019】
【作用】マイクロフォンから入力された音声を入力され
た音声認識部は、音声認識用辞書を参照して、入力され
た音声に含まれるキーワードを認識し、この認識結果を
コマンド生成部に出力する。コマンド生成部では認識さ
れたキーワードに対応する操作コマンドを生成し、これ
をプレゼンテーション操作部に出力する。
【0020】プレゼンテーション操作部は、プレゼンテ
ーション記憶部に記憶されているプレゼンテーションデ
ータを操作コマンドに基づいて操作する。そして、この
操作に係るプレゼンテーションデータは、プレゼンテー
ション出力部によって出力される。
【0021】音声認識部がキーワードスポッティング手
法を用いた場合には、入力音声中の全ての音声の中か
ら、予め登録しておいた認識候補単語に良く適合する部
分を探し出し、その適合度がある閾値を越えた場合に、
その単語を認識する。
【0022】音声認識スイッチ部を設けた場合には、こ
れをオン操作すると音声認識部による音声認識を開始さ
せることができ、オフ操作するとその音声認識を終了さ
せられる。
【0023】データ記憶部を設けた場合には、次のよう
になる。音声認識スイッチ部がオン操作されたときに
は、音声認識部はデータ記憶部に記憶されている音声デ
ータと、音声認識スイッチ部がオン操作された以降、マ
イクロフォンから入力される音声とを含めて音声認識す
ることができ、これにより認識性能を向上させられる。
【0024】終了命令遅延部を設けた場合には、音声認
識スイッチ部のオフ操作以降の所要時間内に入力した音
声データを含む音声データを、音声認識対象にできる。
【0025】自動辞書作成部を設けた場合には、プレゼ
ンテーション記憶部に記憶されているプレゼンテーショ
ンデータからキーワードを自動的に抽出し、これに基づ
いて音声認識辞書を作成できる。
【0026】認識候補単語出力部を設けた場合には、音
声認識用辞書から抽出された認識候補となる単語モデル
が、プレゼンテーション出力部に出力される。
【0027】プレゼンテーション出力部を複数設けた場
合には、そのうちの1つだけに認識候補となる単語モデ
ルを表示できる。
【0028】副コマンド生成部とメディア選択部とを設
けた場合には、音声以外のメディアからのデータに基づ
いて、プレゼンテーションデータの操作を行なえる。
【0029】
【実施例】本発明の実施例について図面を参照して説明
する。図1(A)は本発明のプレゼンテーション装置の
第1実施例を示すブロック図、(B)は辞書管理部の詳
細を示すブロック図である。
【0030】本装置は、音声を入力するマイクロフォン
1、辞書管理部2、音声認識部3、コマンド生成部4、
プレゼンテーション操作部5、資料記憶部6、プレゼン
テーション出力部7を有している。
【0031】辞書管理部2には認識候補となる単語モデ
ルとともに、音声認識用辞書2aが記憶されている(図
1(B))。このうち、音声認識用辞書2aは単語モデ
ルとプレゼンテーションデータの操作コマンドとの対応
付けを記述した対応テーブル等を辞書として格納したも
のである。
【0032】上記音声認識用辞書2aは、プレゼンテー
ションを行う前に予め作成されるもので、プレゼンテー
ションの途中で想定される場面で必要と考えられる操作
に対し、単語が割り当てられる。たとえば、プレゼンテ
ーションにおいて使用される単語としては、「次のスラ
イド」「図からグラフ」「数式の拡大」「ビデオ開始」
「(スライドの題名)」「(スライド中のキーワー
ド)」等が考えられる。
【0033】これらの単語に対し、上記単語モデルが作
成される。すなわち、音声のモデルがたとえば音節等を
1単位として作成されていれば、それらのモデルを連結
することにより単語モデルが作成される。また、使用者
が事前に単語を発声した音声データから単語モデルを作
成することも可能である。
【0034】音声認識部3は、入力された音声をある一
定時間間隔の特徴ベクトルの時系列として解析し、さら
にこれらの特徴ベクトル列と、辞書管理部2から出力さ
れた認識候補となる各々の単語モデルとのパターンマッ
チングを行うことで、入力された音声の分析を行う機能
を有している。そして、その認識結果をコマンド生成部
4に出力するものである。
【0035】パターンマッチングの方法としては、たと
えば「デジダル音声処理」(古井貞煕著、1985年、
東海大学出版会)、「確率モデルによる音声認識」(中
川聖一著、1988年、電子情報通信学会)に詳述され
ている。
【0036】また、音声認識の手法としては、上記パタ
ーンマッチィングの他、入力音声中の全ての音声の中か
ら、予め登録しておいた認識候補単語に良く適合する部
分を探し出し、その適合度がある閾値を越えた場合に、
その単語を認識するキーワードスポッティングを用いて
もよい。
【0037】この手法としては、たとえば「拡張連続D
P法による連続音声アルゴリズム」(中川聖一、電子情
報通信学会論文誌、1984/10、Vol.J67−
DNo.10)を挙げることができる。
【0038】コマンド生成部4は、辞書管理部2に格納
されている音声認識用辞書2aの単語モデルと操作コマ
ンドとの対応テーブルから対応関係を獲得し、これを参
照して操作コマンドを生成して出力するものである。
【0039】資料記憶部6は、たとえば磁気ディスク,
光ディスク等の各種の情報記録媒体と、これを駆動する
ドライバ等から構成されており、上記磁気ディスク等に
は操作の対象となるプレゼンテーションデータが記憶さ
れている。
【0040】このプレゼンテーションデータは、プレゼ
ンテーションに使用するスライド画像等の静止画像デー
タ,動画像データ,音声データ等であり、これらには、
それぞれを識別するタイトルや、たとえばスライド画像
データの全部又は一部を拡大/縮小するマクロ等が関連
付けされて記録してある。
【0041】プレゼンテーション操作部5は、入力され
た操作コマンドに対応した操作を資料記憶部6に記憶さ
れているプレゼンテーションデータに対して行うもので
ある。
【0042】プレゼンテーション出力部7は、マイクロ
フォン1から入力された音声とともに、プレゼンテーシ
ョン操作部5の操作に係るプレゼンテーションデータを
出力するものであり、たとえばディスプレイ,スピー
カ,アンプ等から構成されている。
【0043】上記の構成を有するプレゼンテーション装
置の動作について説明する。マイクロフォン1から入力
された講演者の音声は、プレゼンテーション出力部7及
び音声認識部3に出力される。
【0044】音声認識部3では、辞書管理部2から出力
された単語モデルを用いて入力音声の認識を行い、その
認識結果をコマンド生成部4に出力する。
【0045】コマンド生成部4では、音声認識結果に対
応する操作コマンド、すなわち、入力音声に最も適合度
の高い単語モデルに対応する操作コマンドを生成し、こ
れをプレゼンテーション操作部5に出力する。
【0046】プレゼンテーション操作部5では、資料記
憶部6に記憶されているプレゼンテーションデータに対
して操作コマンドに対応する操作を行う。たとえば操作
コマンドがスライド画像の送り動作という内容のもので
あれば、これに対応する操作をプレゼンテーションデー
タに対して行う。
【0047】これにより次のスライド画像データが資料
記憶部6から読み出され、これがプレゼンテーション出
力部7のディスプレイに表示される。
【0048】次に、本発明の第2実施例について図2を
参照して説明する。なお、図1において説明したものと
同等のものについては、同一の符号を付して、それらの
説明を省略する。
【0049】図2に示すプレゼンテーション装置は、図
1に示す回路に音声認識スイッチ部8を加えた構成とし
ている。
【0050】音声認識スイッチ部8はたとえばトグルス
イッチを有しており、このトグルスイッチのオン/オフ
操作によって、音声認識部3における音声認識の開始命
令及び終了命令を出力するようになっている。トグルス
イッチは、たとえばマイクロフォンに付属させることが
好ましく、この場合には、講演者が簡単な操作で音声認
識の開始/終了操作を行える。
【0051】なお、このような音声認識スイッチ部8を
設けた場合、音声認識部3においてはワードスポッティ
ングの代わりに通常の単語認識を行うことも可能であ
る。
【0052】上記音声認識スイッチ部8を設けた場合の
音声認識部3の動作は、次のようになる。
【0053】音声認識部3は、音声認識スイッチ部8か
ら音声認識の開始命令が出力されない間は、マイクロフ
ォン1から入力された音声の認識動作を行わない。そし
て、トグルスイッチがオン操作されると、音声認識スイ
ッチ部3から音声認識の開始命令が音声認識部3に出力
される。これにより、音声認識部3は入力音声の認識を
開始し、そのオン操作の間中その認識動作を続行する。
【0054】次に、トグルスイッチをオフ操作すると、
音声認識部3に音声認識の終了命令が出力される。これ
により、音声認識部3は入力音声の認識を終了する。
【0055】図3に示すプレゼンテーション装置は、図
2に示す回路にデータ記憶部9を加えた構成としたもの
である。データ記憶部9は、マイクロフォン1から入力
された音声を、順次所要時間分だけ記憶しておく記憶容
量のRAM(Random Access Memory)等を有するもので
あり、このデータ記憶部9に記憶されている音声データ
は、音声認識部3に出力されるようになっている。
【0056】このようなデータ記憶部9を設けた場合
の、音声認識部の動作は次のようになる。講演を行って
いる最中の任意の時点で音声認識スイッチ部8のトグル
スイッチをオン操作すると、データ記憶部9に記憶され
ている所要時間分の音声データが音声認識部3に出力さ
れる。
【0057】音声認識部3は、データ記憶部9に記憶さ
れている所要時間分の音声データと、トグルスイッチを
オン操作した以降、マイクロフォン1から入力される音
声とに基づいて入力音声の認識を実行する。そして、ト
グルスイッチがオフ操作されると、音声認識部3は認識
動作を停止し、その後、認識結果をコマンド生成部4に
出力する。
【0058】図4に示すプレゼンテーション装置は、図
2に示す回路に終了命令遅延部10を加えた構成とした
ものである。終了命令遅延部10は、音声認識スイッチ
部8のトグルスイッチのオフ操作に伴う終了命令の、音
声認識部3への伝達を所要時間遅延させるものである。
【0059】このような終了命令遅延部10を設けた場
合の、音声認識部3の動作は次のようになる。音声認識
スイッチ部8から出力された終了命令は、終了命令遅延
部10に入力される。そして、ある一定時間が経過した
後に音声認識部3に伝達される。所要時間後に終了命令
を受けた音声認識部3は認識動作を終了し、その認識結
果をコマンド生成部4に出力する。
【0060】図5に示すプレゼンテーション装置は、図
1に示す構成に、上述した音声認識スイッチ部8、デー
タ記憶部9及び終了命令遅延部10を設けたものであ
る。
【0061】このような構成とした場合の、音声認識部
3の動作は次のようになる。音声認識部3は、データ記
憶部9に記憶されている所要時間分の音声データと、ト
グルスイッチをオン操作した以降、マイクロフォン1か
ら入力される音声とに基づいて入力音声の認識を実行す
る。
【0062】そして、音声認識スイッチ部8のトグルス
イッチがオフ操作されると、該音声認識スイッチ部8か
らの終了命令が終了命令遅延部10に出力される。そし
て、終了命令が終了命令遅延部10に出力されから所定
時間が経過すると、入力された終了命令が音声認識部3
に出力される。所要時間後に終了命令を受けた音声認識
部3は認識動作を終了し、その認識結果をコマンド生成
部4に出力する。
【0063】図6に示すプレゼンテーション装置は、図
2に示す回路に自動辞書作成部11を加えた構成とした
ものである。自動辞書作成部11は、資料記憶部6に記
憶されているプレゼンテーションデータからキーワード
を自動的に抽出し、音声認識用辞書を作成する機能を有
するものである。
【0064】具体的には、どの場面でも有効な「次のス
ライド」「前のスライド」等のキーワードは、予め登録
しておく。そして、「(各スライドの題名)」「(図の
名前)」等のキーワードを、自動的にプレゼンテーショ
ンデータから抽出し、該キーワードに対応する単語モデ
ルを作成してこれに操作コマンドを対応付けして、音声
認識用辞書に登録する。
【0065】このような構成とした場合には、単語モデ
ルと操作コマンドとの対応関係を示す参照テーブルをプ
レゼンテーション毎に音声認識用辞書に登録する作業を
必要としない。
【0066】図7に示すプレゼンテーション装置は、図
2に示す回路に認識候補単語出力部12を加えた構成と
したものである。
【0067】認識候補単語出力部12は、辞書管理部2
から出力された認識候補となる単語モデルを、プレゼン
テーション出力部7に出力する機能を有するものであ
る。具体的には、プレゼンテーション出力部7を複数設
け、このうちの1つに認識候補単語出力部12を接続す
る構成が好ましい。
【0068】この認識候補単語出力部12は、プレゼン
テーションが始まると、当該プレゼンテーションで使用
する単語モデルを、辞書管理部2から読み出して、これ
をプレゼンテーション出力部7に出力する。プレゼンテ
ーション出力部7は、入力した単語モデルをディスプレ
イ上の講演者の見える位置に表示する。
【0069】また、プレゼンテーション出力部7に複数
のディスプレイを設けた場合には、そのうちの1つのデ
ィスプレイを講演者の方に向けておき、このディスプレ
イだけに単語モデルを表示する。
【0070】図8に示すプレゼンテーション装置は、図
2に示す回路に複数の副コマンド生成部131 〜13n
と、メディア選択部14とを設けた構成のものである。
各コマンド生成部131 等は、たとえばキーボード,マ
ウスあるいは他の音声等、外部からの入力データに基づ
いて操作コマンドを生成する機能を有するものである。
【0071】メディア選択部14は、副コマンド生成部
131 及びコマンド生成部4から出力された操作コマン
ドを選択して、これらのうちの1つをプレゼンテーショ
ン出力部7に出力する機能を有している。この選択は、
たとえばあるタイミングで該メディア選択部14に最初
に入力された操作コマンドのみをプレゼンテーション出
力部7に出力する等、様々な基準のものを採用できる。
【0072】なお、本発明は前述した実施例に限るもの
ではなく、その要旨の範囲内で様々に変形実施が可能で
ある。
【0073】
【発明の効果】請求項1〜9に記載した発明によれば、
マイクロフォンに入力された音声に含まれるキーワード
を自動的に認識し、この認識したキーワードに基づいて
画像,音声等のプレゼンテーションデータの操作を自動
的に行うことができる。
【0074】具体的には、たとえば項目の強調、図から
表への変換、図の拡大、任意のスライドへの移動等のプ
レゼンテーションデータの操作を、音声によって容易に
行うことができる。また、講演者自身の音声によって操
作できるため、講演者はマウスやキーボード等の操作に
煩わされることなく、途切れない自然なプレゼンテーシ
ョンを行うことができる。
【0075】請求項2に記載した発明によれば、全ての
音声を認識対象としなくてよいため、より短時間で適合
単語を認識することができる。
【0076】請求項3に記載した発明によれば、音声認
識スイッチ部を設けることで、キーワードを含む音声部
分だけを対象にできるので、認識性能を向上させること
ができる。
【0077】請求項4に記載した発明によれば、音声認
識スイッチ部グルスイッチをオン操作した時点以前の所
要時間内に入力した音声データも音声認識の対象にでき
るので、認識対象となる音声データの中にキーワードが
完全に含めることができ、認識性能を向上させることが
できる。
【0078】請求項5に記載した発明によれば、音声認
識スイッチ部をオフ操作した時点以降の所要時間内に入
力した音声データを含む音声データを音声認識対象にで
きるので、認識率を向上させられる。
【0079】また、音声認識スイッチ部をオン操作した
時点以前の所要時間内に入力した音声データと、該スイ
ッチ部をオフ操作した時点以降の所要時間内に入力した
音声データを含む音声データを、音声認識対象にできる
ので、認識率を向上させられる。
【0080】請求項6に記載した発明によれば、単語モ
デルと操作コマンドとの対応関係を示す参照テーブル
を、プレゼンテーション毎に音声認識用辞書に登録する
作業を必要とせず、事前の登録作業を軽減することがで
きる。
【0081】請求項7に記載した発明によれば、プレゼ
ンテーションを行う者は、ディスプレイに表示されてい
るキーワードを参照しながらプレゼンテーションを行え
るので、予めキーワードを記憶することや、暗記した場
合の記憶違いを防止することができる。
【0082】請求項8に記載した発明によれば、複数の
ディスプレイのうちの1台をプレゼンテーションを行う
者に向けておき、このディスプレイだけにキーワードを
表示させられる。このため、観衆にはプレゼンテーショ
ンデータのみを見せることができ、キーワードが表示さ
れることによる注意力の低下を防止することができる。
【0083】請求項9に記載した発明によれば、音声以
外のメディアからのデータに基づいて、プレゼンテーシ
ョンデータの操作を行うことができる。また、簡単な操
作をマウス等によって行い、複雑な操作を音声によって
行う等、操作の多様化を図ることもできる。
【図面の簡単な説明】
【図1】(A)は本発明のプレゼンテーション装置の第
1実施例を示すブロック図、(B)は辞書管理部の詳細
を示すブロック図である。
【図2】本発明プレゼンテーション装置の第2実施例を
示すブロック図である。
【図3】本発明プレゼンテーション装置の第3実施例を
示すブロック図である。
【図4】本発明プレゼンテーション装置の第4実施例を
示すブロック図である。
【図5】本発明プレゼンテーション装置の第5実施例を
示すブロック図である。
【図6】本発明プレゼンテーション装置の第6実施例を
示すブロック図である。
【図7】本発明プレゼンテーション装置の第7実施例を
示すブロック図である。
【図8】本発明プレゼンテーション装置の第8実施例を
示すブロック図である。
【符号の説明】
1 マイクロフォン 2 辞書管理部 2a 音声認識用辞書 3 音声認識部 4 コマンド生成部 5 プレゼンテーション操作部 6 資料記憶部(プレゼンテーション記憶
部) 7 プレゼンテーション出力部 8 音声認識スイッチ部 9 データ記憶部 10 終了命令遅延部 11 自動辞書作成部 12 認識候補単語出力部 131 〜13n 副コマンド生成部 14 メディア選択部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 マイクロフォンと、音声認識用辞書を参
    照して、マイクロフォンから入力された音声に含まれる
    キーワードを認識する音声認識部と、その認識したキー
    ワードに対応する操作コマンドを生成するコマンド生成
    部と、プレゼンテーションに使用する画像,音声等のプ
    レゼンテーションデータを記憶したプレゼンテーション
    記憶部と、この記憶されたプレゼンテーションデータを
    上記操作コマンドに基づいて操作するプレゼンテーショ
    ン操作部と、この操作に係るプレゼンテーションデータ
    を出力するプレゼンテーション出力部とを有することを
    特徴とするプレゼンテーション装置。
  2. 【請求項2】 音声認識部は、入力された音声の認識を
    キーワードスポッティング手法により行う請求項1記載
    のプレゼンテーション装置。
  3. 【請求項3】 音声認識部による音声認識の開始・終了
    を行わせる音声認識スイッチ部を設けた請求項1又は2
    記載のプレゼンテーション装置。
  4. 【請求項4】 マイクロフォンから出力された音声を順
    次所要時間分だけ記憶しておくデータ記憶部を設けると
    ともに、音声認識スイッチ部がオン操作されたときに
    は、音声認識部はデータ記憶部に記憶されている音声デ
    ータを含めて音声認識の対象とする請求項3記載のプレ
    ゼンテーション装置。
  5. 【請求項5】 音声認識の終了を所要時間遅延させて音
    声認識部に伝達する終了命令遅延部を設けた請求項3又
    は4記載のプレゼンテーション装置。
  6. 【請求項6】 プレゼンテーション記憶部から、キーワ
    ードを自動的に抽出して音声認識用辞書を作成する自動
    辞書作成部を設けた請求項1,2,3,4又は5記載の
    プレゼンテーション装置。
  7. 【請求項7】 音声認識用辞書には、認識候補となる単
    語モデルが登録されており、これをプレゼンテーション
    出力部に表示させる認識候補単語出力部を設けた請求項
    1,2,3,4,5又は6記載のプレゼンテーション装
    置。
  8. 【請求項8】 プレゼンテーション出力部を複数設ける
    とともに、そのうちの1つに認識候補単語出力部を設け
    た請求項7記載のプレゼンテーション装置。
  9. 【請求項9】 音声以外の複数のメディアからの入力デ
    ータにより操作コマンドを生成する複数の副コマンド生
    成部と、これらの副コマンド生成部及びコマンド生成部
    から出力された操作コマンドの中から、プレゼンテーシ
    ョン出力部に送出する操作コマンドを選択するメディア
    選択部とを設けた請求項1,2,3,4又は5記載のプ
    レゼンテーション装置。
JP7167896A 1995-06-12 1995-06-12 プレゼンテーション装置 Expired - Fee Related JP2924717B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7167896A JP2924717B2 (ja) 1995-06-12 1995-06-12 プレゼンテーション装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7167896A JP2924717B2 (ja) 1995-06-12 1995-06-12 プレゼンテーション装置

Publications (2)

Publication Number Publication Date
JPH08339198A true JPH08339198A (ja) 1996-12-24
JP2924717B2 JP2924717B2 (ja) 1999-07-26

Family

ID=15858075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7167896A Expired - Fee Related JP2924717B2 (ja) 1995-06-12 1995-06-12 プレゼンテーション装置

Country Status (1)

Country Link
JP (1) JP2924717B2 (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355747A (ja) * 1998-06-10 1999-12-24 Nec Corp 映像・音声通信装置と同装置を用いたテレビ会議装置
JP2000137498A (ja) * 1998-10-30 2000-05-16 Olympus Optical Co Ltd 音声録音装置
JP2000250392A (ja) * 1999-03-02 2000-09-14 Kansai Tlo Kk 遠隔講義装置
JP2001014135A (ja) * 1999-06-29 2001-01-19 Seiko Epson Corp プレゼンテーションシステム、プレゼンテーション方法および情報記憶媒体
JP2001515611A (ja) * 1997-12-30 2001-09-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コマンド辞書を使用する音声認識装置
JP2002297374A (ja) * 2001-03-30 2002-10-11 Alpine Electronics Inc 音声検索装置
FR2823585A1 (fr) * 2001-04-13 2002-10-18 Cantoche Production Procede et systeme d'animation d'une personnage en trois dimensions
JP2002304286A (ja) * 2001-04-04 2002-10-18 Nec Viewtechnology Ltd 音声認識機能を内蔵した映像表示装置
JP2004007358A (ja) * 2002-03-28 2004-01-08 Fujitsu Ltd 同期コンテンツ情報生成プログラム、同期コンテンツ情報生成装置および同期コンテンツ情報生成方法
JP2004234604A (ja) * 2003-01-29 2004-08-19 Mitac Technology Corp 無線音声信号受信モジュールを配置したコンピュータ装置
JP2004265329A (ja) * 2003-03-04 2004-09-24 Toshiba Corp 情報処理装置およびプログラム
JP2004343232A (ja) * 2003-05-13 2004-12-02 Nec Corp 通信装置及び通信方法
JP2006208696A (ja) * 2005-01-27 2006-08-10 Sony Corp プレゼンテーション用アプリケーションをリモートコントロールするための装置,方法,プログラム及び記録媒体
JP2007264473A (ja) * 2006-03-29 2007-10-11 Toshiba Corp 音声処理装置、音声処理方法および音声処理プログラム
JP2011150705A (ja) * 2011-02-10 2011-08-04 Necディスプレイソリューションズ株式会社 音声認識機能を内蔵した映像表示装置
JP5242856B1 (ja) * 2012-07-06 2013-07-24 株式会社メディアシーク 音楽再生プログラム及び音楽再生システム
JP2019144732A (ja) * 2018-02-19 2019-08-29 日本電信電話株式会社 動作指示生成システム、方法およびプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3956708B2 (ja) * 2002-01-22 2007-08-08 セイコーエプソン株式会社 プロジェクタの遠隔操作装置
JP2003215707A (ja) * 2002-01-22 2003-07-30 Seiko Epson Corp プレゼンテーションシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6045960A (ja) * 1984-04-18 1985-03-12 Sanyo Electric Co Ltd 音声認識テープレコーダー
JPH02184915A (ja) * 1989-01-12 1990-07-19 Toshiba Corp 音声認識装置及び方法
JPH04308923A (ja) * 1991-04-05 1992-10-30 Seiko Epson Corp 音声入力装置
JPH06119140A (ja) * 1992-10-09 1994-04-28 Ricoh Co Ltd 販売支援装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6045960A (ja) * 1984-04-18 1985-03-12 Sanyo Electric Co Ltd 音声認識テープレコーダー
JPH02184915A (ja) * 1989-01-12 1990-07-19 Toshiba Corp 音声認識装置及び方法
JPH04308923A (ja) * 1991-04-05 1992-10-30 Seiko Epson Corp 音声入力装置
JPH06119140A (ja) * 1992-10-09 1994-04-28 Ricoh Co Ltd 販売支援装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001515611A (ja) * 1997-12-30 2001-09-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コマンド辞書を使用する音声認識装置
JPH11355747A (ja) * 1998-06-10 1999-12-24 Nec Corp 映像・音声通信装置と同装置を用いたテレビ会議装置
JP2000137498A (ja) * 1998-10-30 2000-05-16 Olympus Optical Co Ltd 音声録音装置
JP2000250392A (ja) * 1999-03-02 2000-09-14 Kansai Tlo Kk 遠隔講義装置
JP2001014135A (ja) * 1999-06-29 2001-01-19 Seiko Epson Corp プレゼンテーションシステム、プレゼンテーション方法および情報記憶媒体
JP2002297374A (ja) * 2001-03-30 2002-10-11 Alpine Electronics Inc 音声検索装置
JP2002304286A (ja) * 2001-04-04 2002-10-18 Nec Viewtechnology Ltd 音声認識機能を内蔵した映像表示装置
FR2823585A1 (fr) * 2001-04-13 2002-10-18 Cantoche Production Procede et systeme d'animation d'une personnage en trois dimensions
WO2002084597A1 (fr) * 2001-04-13 2002-10-24 La Cantoche Production Procede et systeme d'animation d'un personnage en trois dimensions
JP2004007358A (ja) * 2002-03-28 2004-01-08 Fujitsu Ltd 同期コンテンツ情報生成プログラム、同期コンテンツ情報生成装置および同期コンテンツ情報生成方法
JP2004234604A (ja) * 2003-01-29 2004-08-19 Mitac Technology Corp 無線音声信号受信モジュールを配置したコンピュータ装置
JP2004265329A (ja) * 2003-03-04 2004-09-24 Toshiba Corp 情報処理装置およびプログラム
US7123880B2 (en) 2003-03-04 2006-10-17 Kabushiki Kaisha Toshiba Voice command-operable information processing apparatus and program for external data presentation
JP2004343232A (ja) * 2003-05-13 2004-12-02 Nec Corp 通信装置及び通信方法
JP2006208696A (ja) * 2005-01-27 2006-08-10 Sony Corp プレゼンテーション用アプリケーションをリモートコントロールするための装置,方法,プログラム及び記録媒体
JP2007264473A (ja) * 2006-03-29 2007-10-11 Toshiba Corp 音声処理装置、音声処理方法および音声処理プログラム
US7801726B2 (en) 2006-03-29 2010-09-21 Kabushiki Kaisha Toshiba Apparatus, method and computer program product for speech processing
JP2011150705A (ja) * 2011-02-10 2011-08-04 Necディスプレイソリューションズ株式会社 音声認識機能を内蔵した映像表示装置
JP5242856B1 (ja) * 2012-07-06 2013-07-24 株式会社メディアシーク 音楽再生プログラム及び音楽再生システム
WO2014006746A1 (ja) * 2012-07-06 2014-01-09 株式会社メディアシーク 音楽再生プログラム及び音楽再生システム
JP2019144732A (ja) * 2018-02-19 2019-08-29 日本電信電話株式会社 動作指示生成システム、方法およびプログラム

Also Published As

Publication number Publication date
JP2924717B2 (ja) 1999-07-26

Similar Documents

Publication Publication Date Title
JP2924717B2 (ja) プレゼンテーション装置
KR101826714B1 (ko) 말하기 학습 기능을 구비한 외국어 학습 시스템 및 외국어 학습 방법
US7636662B2 (en) System and method for audio-visual content synthesis
US20140036023A1 (en) Conversational video experience
US20050259959A1 (en) Media data play apparatus and system
JP4729902B2 (ja) 音声対話システム
JP2008152605A (ja) プレゼンテーション解析装置およびプレゼンテーション視聴システム
WO2005094437A2 (en) System and method for automatically cataloguing data by utilizing speech recognition procedures
JP4192703B2 (ja) コンテンツ処理装置、コンテンツ処理方法及びプログラム
JP2017064853A (ja) ロボット、コンテンツ決定装置、コンテンツ決定方法、及びプログラム
KR20050008723A (ko) 말하는 전자책
Bouamrane et al. Meeting browsing: State-of-the-art review
JP2007018290A (ja) 手書き文字入力表示支援装置及び方法並びにプログラム
JPH10326176A (ja) 音声対話制御方法
JP2005321706A (ja) 電子書籍の再生方法及びその装置
JP2001014135A (ja) プレゼンテーションシステム、プレゼンテーション方法および情報記憶媒体
CN110796718A (zh) 一种口型切换渲染方法、系统、装置和存储介质
JP4649082B2 (ja) スピーチ中に機能を自動で制御する方法及びシステム
JP2005326811A (ja) 音声合成装置および音声合成方法
JP2003271532A (ja) コミュニケーションシステム、当該システムのデータ転送方法、当該システムのサーバ、当該システムのための処理プログラム、および、記録媒体
JP3548900B2 (ja) マルチメディア情報処理装置
KR102636708B1 (ko) 프레젠테이션 문서에 대한 수어 발표 영상을 제작할 수 있는 전자 단말 장치 및 그 동작 방법
JP2001005476A (ja) プレゼンテーション装置
JP2003263184A (ja) 音声合成装置及びその方法、プログラム
KR102479023B1 (ko) 외국어 학습 서비스 제공 장치, 방법 및 프로그램

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19981023

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990406

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090507

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100507

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110507

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110507

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120507

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120507

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130507

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees