JPH1153163A - 音声伝言メモ装置 - Google Patents
音声伝言メモ装置Info
- Publication number
- JPH1153163A JPH1153163A JP9215305A JP21530597A JPH1153163A JP H1153163 A JPH1153163 A JP H1153163A JP 9215305 A JP9215305 A JP 9215305A JP 21530597 A JP21530597 A JP 21530597A JP H1153163 A JPH1153163 A JP H1153163A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- message
- recording
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
動作とを自動的に切替可能とし、音声伝言メモ装置の操
作をスムースにする。 【解決手段】 入力される音声を切替えて録音部、また
は音声認識手段12のいずれかに出力する切替手段11
と、手段11からの出力を受けて入力音声を認識し、該
認識結果に基づいて、入力音声を録音部側に出力するこ
とを切手段11に指示し、かつ録音部に録音の開始を指
示するか、または伝言記憶部に格納されている伝言デー
タの再生を再生部に指示する音声認識手段12とを備え
る。
Description
置に係り、更に詳しくは入力される音声の認識結果に従
って録音動作と再生動作を切替える音声伝言メモ装置に
関する。
伝言メモ装置の従来例の構成ブロック図である。同図に
おいて音声伝言メモシステムは伝言メモ装置1、音声が
入力されるマイク2、音声出力用のスピーカ3、および
伝言メモ装置1の録音動作と再生動作を切替えるための
スイッチ4から構成されている。
を録音するための録音部5、録音された音声、すなわち
伝言を記憶する伝言記憶部6、伝言記憶部6に記憶され
ている伝言を再生してスピーカ3に出力する再生部7を
備えている。伝言メモ装置1の録音動作と再生動作はス
イッチ4によって切替えられ、スイッチ4はマイク2か
らの入力音声を録音する場合には録音部5を動作させ、
伝言記憶部6に記憶されている伝言をスピーカ3に出力
して再生するためには再生部7を動作させる。
従来例では、伝言の録音、あるいは再生を行うために
は、スイッチ4で指示を行う必要があり、例えばユーザ
が伝言を録音する場合にはスイッチ4を用いて録音部5
を起動した後に録音を行い、再生時にもスイッチ4で再
生部7を起動した後に伝言の再生を受ける必要があり、
操作に連続性がなく、使いづらいという問題点があっ
た。
音動作と再生動作を自動的に切替え可能とし、音声伝言
メモ装置のスムースな操作を可能とすることを目的とす
る。
ブロック図である。同図は音声を録音する録音部と、録
音部によって録音された伝言データを格納する伝言記憶
部と、伝言記憶部に格納されているデータを再生する再
生部とを有する音声伝言メモ装置の原理構成ブロック図
である。
クからの入力音声を切替える切替部であり、入力される
音声を2つの方向のいずれかに切替えて出力するもので
ある。音声認識手段12は、例えば音声認識部であり、
切替手段11からの音声出力を受けて入力音声を認識
し、その認識結果に基づいて伝言メモ装置の録音動作と
再生動作とを切替えるものである。すなわち音声の認識
結果に基づいて、入力音声を録音部側に出力することを
切替手段11に指示し、かつ録音部に録音の開始を指示
するか、または伝言記憶部に格納されているデータの再
生を再生部に指示するものである。
音声は、最初は切替手段11によって音声認識手段12
側に出力される。これによって入力音声の中に、例えば
録音を指示する音声が含まれている時には、その認識結
果に基づいて録音動作を実行するために、切替手段11
に入力音声を録音部側に切替えて出力することが指示さ
れるとともに、録音部に対して録音の開始の指示が行わ
れる。これに対して入力音声の認識結果として、例えば
再生を指示する音声が認識されると、記憶されている伝
言データの再生のために、再生部に対して伝言データの
再生が指示される。
音部が例えば音声入力レベルの低下によって録音の終了
を検出した時、切替手段11に音声出力を録音部側から
音声認識手段12側に切替える指示を出すことも可能で
あり、これによって録音が終了した時には、その後の入
力音声は切替手段11によって音声認識手段12側に出
力される初期状態となる。
声認識手段12が、例えば最初に入力される音声に基づ
いて、録音部によって録音される伝言データに対応する
キーワードを求め、伝言記憶部が求められたキーワード
と録音部から出力される伝言とを対応させて記憶するこ
とも可能である。このようなキーワードが伝言記憶部に
記憶された後に、伝言の再生を目的として外部から入力
された音声に含まれるキーワードが音声認識手段12に
よって認識された時、キーワードに対応する伝言データ
を検索して再生を行うことにより、ユーザが必要とする
伝言データの再生を効率的に実行することができる。
または音声認識手段のいずれかに切替えて出力する第1
の手順と、該第1の手順からの出力を受けて入力音声を
認識し、該認識結果に基づいて、入力音声を前記録音部
側に出力することを第1の手順に指示し、かつ該録音部
に録音の開始を指示するか、または伝言記憶部に格納さ
れている伝言データの再生を前記再生部に指示する第2
の手順をコンピュータに実行させるプログラムを記憶し
たコンピュータ読み取り可能な記憶媒体を構成する。
音声の認識結果に基づいて、録音動作と再生動作との自
動的な切替えが行われる。
の第1の実施形態の構成ブロック図である。同図におい
て、従来例の図12と同じ動作を行う部分には同じ符号
を付してある。図2の伝言メモ装置20の内部には録音
部5、伝言記憶部6、再生部7に加えて、マイク2から
入力される音声を2つの方向のいずれかに切替えて出力
する切替部21、切替部21からの音声を認識する音声
認識部22を備えている。
を音声認識部22、または録音部5のいずれかに切替え
て出力する。初期状態においては切替部21は入力音声
を音声認識部22側に出力し、音声認識部22は、音声
認識の結果に従って、その音声入力の中に例えば録音を
指示する音声が含まれている場合には、切替部21に対
して入力音声を録音部5側に切替えて出力することを指
示すると共に、録音部5に対して録音の開始を指示し、
これによって伝言データは伝言記憶部6に記憶される。
を指示する音声が含まれている場合には、音声認識部2
2は切替部21に対して音声出力の切替えを指示するこ
となく、再生部7に対して伝言記憶部6に記憶されてい
る伝言データの再生を指示し、その伝言データは再生さ
れてスピーカ3から出力される。
ータによる実現方式の説明図である。同図においてコン
ピュータ30には、音声入力用のマイクロホン2と音声
出力用のスピーカ3が接続されている。
マイクロプロセッサユニット(MPU)31、図2の伝
言記憶部6に相当するメモリ32、図2の録音部5に対
応する録音プログラム、再生部7に対応する再生プログ
ラム、切替部21を含む音声認識部22に対応する音声
認識プログラムを格納したディスク33、音声入出力用
のサウンドボード34、バス35から構成されている。
サウンドボード34の内部には、スピーカ3が接続され
る音出力部36、マイクロホン2が接続される音入力部
37が含まれている。
実施形態の構成ブロック図である。同図を図2の第1の
実施形態と比較すると、録音部23が伝言データの録音
を開始した後、例えば録音レベルの低下の継続によって
録音の終了を検出し、切替部21に対してそれ以後に入
力される音声を音声認識部22側に切替えて出力するこ
とを指示する動作を実行することだけが異なっている。
これによって切替部21による切替え状態は初期状態に
戻り、以後入力される音声は音声認識部22に出力さ
れ、その認識結果に従って録音動作と再生動作の切替え
が行われる。
の構成ブロック図である。同図を図4の第2の実施形態
と比較すると、統合部24、キーワード抽出部25、検
索部26が追加されている点が基本的に異なっている。
るキーワードを統合して、伝言記憶部27に出力するも
のである。ここでキーワードとは、例えばユーザに対し
て伝言の先頭にキーワードを発声させ、それを音声認識
部22によって認識したものである。このキーワードは
音声認識結果としての文字列でもよく、認識途中の音声
パラメータでもよい。このキーワードは統合部24に出
力され、録音部23から出力される伝言データと統合部
24によって統合され、1対1に対応する形式で伝言記
憶部27に格納される。
生時に伝言記憶部27に格納されているキーワードを抽
出し、音声認識部22に与えるものである。一般に音声
認識においては入力される音声を1つの音毎に正しく認
識することが要求されるが、認識対象があらかじめある
程度与えられていない場合には、マイクの特性や人の声
のくせなどによって正しい認識を行うことが難しい。そ
こで伝言記憶部27にすでに記憶されている、一般に複
数のキーワードを、認識対象として音声認識部22に与
えることにより、音声認識部22は入力される音声が複
数のキーワードのいずれに最も近いかを認識することに
なり、認識動作が容易となる。
ザから入力される音声に含まれるキーワードの音声認識
部22による認識結果の出力を受けて、伝言記憶部27
に格納されているキーワードを検索し、そのキーワード
に対応する伝言データを、伝言記憶部27から再生部7
に送ることを指示するものである。
ワードが音声パラメータである場合の伝言記憶部27内
のレコードのデータ構造とその例の説明図である。同図
(a)はレコードのデータ構造を示し、このデータ構造で
はキーワード部、例えば音声の認識途中の音声パラメー
タ、音声データ部は伝言データに対応する音声波形であ
る。同図(b) はレコードの具体例であり、例えば“東
京”を示す音声パラメータがキーワード部に、東京の天
気予報を示す音声波形が音声データ部に格納されてい
る。
場合のレコードのデータ構造と、その具体例の説明図で
ある。同図(a) はデータ構造を示し、キーワード部には
テキストとしての文字列、音声データ部には伝言データ
に対応する音声波形が格納される。同図(b) はレコード
の具体例であり、例えばキーワード部には文字列として
の“トウキョウ”が、音声データ部には東京の天気予報
を示す音声波形が格納されている。
5の検索部26の構成例のブロック図である。同図にお
いて検索部26は、音声認識部22から与えられるキー
ワードとしての音声パラメータが格納される入力パラメ
ータバッファ40、伝言記憶部27に格納されているキ
ーワードとしての音声パラメータが入力されるキーワー
ドパラメータバッファ41、2つのパラメータバッファ
40および41のパラメータを照合するDP照合部4
2、DP照合の結果、入力キーワードに最も近いキーワ
ードを判定し、そのキーワードに対応する伝言を再生部
7に送るように伝言記憶部27に指示を出す制御部43
から構成されている。なお検索部26によって入力キー
ワードが伝言記憶部27に記憶されているキーワードと
照合されるので、前述のように入力キーワードの音声認
識のために、キーワード抽出部25によって抽出された
キーワードを音声認識部22に与えることは絶対必要な
ことではなく、キーワード抽出部25を使用しなくとも
よいが、音声認識を正確にするためにはキーワード抽出
部25を使う方がよい。
ートである。同図において処理が開始されると、まずス
テップS1で音声認識部22から出力される入力音声パ
ラメータが獲得され、ステップS2で伝言記憶部27に
格納されている次のキーワードの音声パラメータが獲得
され、ステップS3でDP照合が行われる。そしてステ
ップS4で伝言記憶部27に記憶されている伝言データ
が最後のものであるかが判定され、最後のものでない時
にはステップS2に戻り、次の伝言に対応するキーワー
ドのパラメータの獲得以降の処理が実行される。最後の
伝言である場合には、ステップS5で、ステップS1で
得られた入力音声パラメータに最も近いキーワードに対
応する伝言を再生部7に送るように伝言記憶部27に指
示が出されて、処理を終了する。
に用いる場合の検索部26の構成ブロック図である。同
図において検索部26は、音声認識部22から出力され
る文字列としてのキーワードが格納される入力文字バッ
ファ45、伝言記憶部27に格納されているキーワード
としての文字列が格納されるキーワードバッファ46、
2つのバッファ45,46の格納内容としての文字列を
比較する文字列比較部47から構成されている。
ャートである。同図において処理が開始されると、まず
ステップS11で音声認識部22から入力文字列として
このキーワードが獲得され、ステップS12で伝言記憶
部27に格納されている次の伝言に対応するキーワード
の文字列が獲得され、ステップS13で2つの文字列の
比較が行われる。
定された場合には、ステップS15でそのキーワードに
対応する伝言を再生部7に送るように指示が出されて、
処理を終了する。ステップS14で2つの文字列が同じ
でないと判定された時には、伝言記憶部27に格納され
ている伝言が終りか否かがステップS16で判定され、
終りでない時にはステップS12の、次の伝言に対応す
るキーワードを獲得する処理以降が実行される。終りの
伝言の場合にはその時点で処理を終了する。
ればユーザから入力される音声の認識結果に基づいて録
音動作と再生動作とを自動的に切替えることができ、音
声伝言メモ装置の操作をスムースにすることができる。
また伝言の先頭にキーワードを発声させ、それを伝言デ
ータと対応させて記憶することにより、再生時における
伝言データの検索が容易になり、音声伝言メモ装置の実
用性の向上に寄与するところが大きい。
構成ブロック図である。
テムによる実現例を説明する図である。
ック図である。
ック図である。
データ構造とその具体例を説明する図である。
造とその具体例を説明する図である。
部の構成ブロック図である。
る。
成ブロック図である。
である。
である。
Claims (7)
- 【請求項1】 音声を録音する録音部と、該録音部によ
って録音された伝言データを格納する伝言記憶部と、該
伝言記憶部に格納されている伝言データを再生する再生
部とを有する音声伝言メモ装置において、 音声を認識する音声認識手段と、 入力される音声を前記録音部、または音声認識手段のい
ずれかに切替えて出力する切替手段とを備え、 該音声認識手段が、該切替手段からの出力を受けて入力
音声を認識し、該認識結果に基づいて、入力音声を前記
録音部側に出力することを該切替手段に指示し、かつ該
録音部に録音の開始を指示するか、または前記伝言記憶
部に格納されている伝言データの再生を前記再生部に指
示することを特徴とする音声伝言メモ装置。 - 【請求項2】 前記録音部が、録音の終了を検出した
時、前記切替手段に音声出力を該録音部側から前記音声
認識手段側に切替える指示を出すことを特徴とする請求
項1記載の音声伝言メモ装置。 - 【請求項3】 前記音声認識手段が、入力される音声に
基づいて前記録音部によって録音される伝言データに対
応するキーワードを求め、 前記伝言記憶部が該求められたキーワードと録音部から
出力される伝言データとを対応させて記憶することと、 伝言の再生を目的として外部から入力された音声に含ま
れるキーワードが該音声認識手段によって認識された
時、該キーワードに対応する伝言データを検索して該伝
言記憶部から前記再生部に出力させる検索手段を更に備
えることを特徴とする請求項1、または2記載の音声伝
言メモ装置。 - 【請求項4】 前記キーワードが、入力される音声の認
識結果の一部としての文字列、または認識途中の音声パ
ラメータの一部であることを特徴とする請求項3記載の
音声伝言メモ装置。 - 【請求項5】 前記伝言の再生を目的として外部から入
力された音声に含まれるキーワードの認識対象として、
前記伝言記憶部に記憶されているキーワードを抽出して
前記音声認識手段に与えるキーワード抽出手段を更に備
えることを特徴とする請求項3記載の音声伝言メモ装
置。 - 【請求項6】 入力される音声を録音部、または音声認
識手段のいずれかに切替えて出力する第1の手順と、 該第1の手順からの出力を受けて入力音声を認識し、該
認識結果に基づいて、入力音声を前記録音部側に出力す
ることを第1の手順に指示し、かつ該録音部に録音の開
始を指示するか、または伝言記憶部に格納されている伝
言データの再生を前記再生部に指示する第2の手順をコ
ンピュータに実行させるプログラムを記憶したコンピュ
ータ読み取り可能な記憶媒体。 - 【請求項7】 入力される音声を録音部、または音声認
識手段のいずれかに切替えて出力する第1の手順と、 該第1の手順からの出力を受けて入力音声を認識し、該
認識結果に基づいて、入力音声を前記録音部側に出力す
ることを第1の手順に指示し、かつ該録音部に録音の開
始を指示するか、または伝言記憶部に格納されている伝
言データの再生を前記再生部に指示する第2の手順を備
えることを特徴とする音声伝言メモ方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9215305A JPH1153163A (ja) | 1997-08-08 | 1997-08-08 | 音声伝言メモ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9215305A JPH1153163A (ja) | 1997-08-08 | 1997-08-08 | 音声伝言メモ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1153163A true JPH1153163A (ja) | 1999-02-26 |
Family
ID=16670130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9215305A Pending JPH1153163A (ja) | 1997-08-08 | 1997-08-08 | 音声伝言メモ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1153163A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293279A (ja) * | 1999-04-07 | 2000-10-20 | Nippon Telegr & Teleph Corp <Ntt> | マルチメディアデータ取得装置及びそのプログラムを記録した記録媒体 |
JP2001042983A (ja) * | 1999-07-30 | 2001-02-16 | Nippon Telegr & Teleph Corp <Ntt> | マルチメディア制御装置およびそのプログラムを記録した記録媒体 |
-
1997
- 1997-08-08 JP JP9215305A patent/JPH1153163A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293279A (ja) * | 1999-04-07 | 2000-10-20 | Nippon Telegr & Teleph Corp <Ntt> | マルチメディアデータ取得装置及びそのプログラムを記録した記録媒体 |
JP2001042983A (ja) * | 1999-07-30 | 2001-02-16 | Nippon Telegr & Teleph Corp <Ntt> | マルチメディア制御装置およびそのプログラムを記録した記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6128146B2 (ja) | 音声検索装置、音声検索方法及びプログラム | |
WO2005094437A2 (en) | System and method for automatically cataloguing data by utilizing speech recognition procedures | |
JP2006522363A (ja) | 信頼水準の指示により音声認識の結果を訂正するためのシステム | |
CN111813301B (zh) | 内容播放方法、装置、电子设备及可读存储介质 | |
JP2013025299A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP4622728B2 (ja) | 音声再生装置および音声再生処理プログラム | |
US20050016364A1 (en) | Information playback apparatus, information playback method, and computer readable medium therefor | |
JP2001272990A (ja) | 対話記録編集装置 | |
JPH1153163A (ja) | 音声伝言メモ装置 | |
JP2000206987A (ja) | 音声認識装置 | |
JP2000089789A (ja) | 音声認識装置及び記録媒体 | |
JP2010008938A (ja) | ボイスレコーダー、及び音声録音方法 | |
JP7240271B2 (ja) | カラオケ用入力装置 | |
KR101576683B1 (ko) | 히스토리 저장모듈을 포함하는 오디오 재생장치 및 재생방법 | |
JP2001312288A (ja) | 音楽データ処理装置 | |
JP6387044B2 (ja) | テキスト処理装置、テキスト処理方法およびテキスト処理プログラム | |
JPH1031492A (ja) | オーディオ装置 | |
KR200218257Y1 (ko) | 어학 학습용 장치 | |
JP2000293187A (ja) | データ音声合成装置及びデータ音声合成方法 | |
KR20010027052A (ko) | 어학 학습용 장치 및 그 제어 방법 | |
JP2000214878A (ja) | 音声情報処理装置 | |
CN112236816A (zh) | 信息处理装置、信息处理系统以及影像装置 | |
JPS62231992A (ja) | 音声分析処理方法 | |
KR100563320B1 (ko) | 단일 메모리를 갖는 어학학습장치 및 그 제어방법 | |
JPH05344214A (ja) | ガイダンス出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060502 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060609 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061226 |