JPH1153163A

JPH1153163A - 音声伝言メモ装置

Info

Publication number: JPH1153163A
Application number: JP9215305A
Authority: JP
Inventors: Akihiro Kimura; 晋太木村; Yasuo Sato; 泰雄佐藤; Tomio Koide; 富夫小出
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1997-08-08
Filing date: 1997-08-08
Publication date: 1999-02-26

Abstract

(57)【要約】【課題】入力音声の認識結果に従って録音動作と再生
動作とを自動的に切替可能とし、音声伝言メモ装置の操
作をスムースにする。【解決手段】入力される音声を切替えて録音部、また
は音声認識手段１２のいずれかに出力する切替手段１１
と、手段１１からの出力を受けて入力音声を認識し、該
認識結果に基づいて、入力音声を録音部側に出力するこ
とを切手段１１に指示し、かつ録音部に録音の開始を指
示するか、または伝言記憶部に格納されている伝言デー
タの再生を再生部に指示する音声認識手段１２とを備え
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声の録音・再生装
置に係り、更に詳しくは入力される音声の認識結果に従
って録音動作と再生動作を切替える音声伝言メモ装置に
関する。

【０００２】

【従来の技術と発明が解決しようとする課題】図１２は
伝言メモ装置の従来例の構成ブロック図である。同図に
おいて音声伝言メモシステムは伝言メモ装置１、音声が
入力されるマイク２、音声出力用のスピーカ３、および
伝言メモ装置１の録音動作と再生動作を切替えるための
スイッチ４から構成されている。

【０００３】伝言メモ装置１はマイク２からの入力音声
を録音するための録音部５、録音された音声、すなわち
伝言を記憶する伝言記憶部６、伝言記憶部６に記憶され
ている伝言を再生してスピーカ３に出力する再生部７を
備えている。伝言メモ装置１の録音動作と再生動作はス
イッチ４によって切替えられ、スイッチ４はマイク２か
らの入力音声を録音する場合には録音部５を動作させ、
伝言記憶部６に記憶されている伝言をスピーカ３に出力
して再生するためには再生部７を動作させる。

【０００４】図１２に示したような音声伝言メモ装置の
従来例では、伝言の録音、あるいは再生を行うために
は、スイッチ４で指示を行う必要があり、例えばユーザ
が伝言を録音する場合にはスイッチ４を用いて録音部５
を起動した後に録音を行い、再生時にもスイッチ４で再
生部７を起動した後に伝言の再生を受ける必要があり、
操作に連続性がなく、使いづらいという問題点があっ
た。

【０００５】本発明は、入力音声の認識結果に従って録
音動作と再生動作を自動的に切替え可能とし、音声伝言
メモ装置のスムースな操作を可能とすることを目的とす
る。

【０００６】

【課題を解決するための手段】図１は本発明の原理構成
ブロック図である。同図は音声を録音する録音部と、録
音部によって録音された伝言データを格納する伝言記憶
部と、伝言記憶部に格納されているデータを再生する再
生部とを有する音声伝言メモ装置の原理構成ブロック図
である。

【０００７】図１において切替手段１１は、例えばマイ
クからの入力音声を切替える切替部であり、入力される
音声を２つの方向のいずれかに切替えて出力するもので
ある。音声認識手段１２は、例えば音声認識部であり、
切替手段１１からの音声出力を受けて入力音声を認識
し、その認識結果に基づいて伝言メモ装置の録音動作と
再生動作とを切替えるものである。すなわち音声の認識
結果に基づいて、入力音声を録音部側に出力することを
切替手段１１に指示し、かつ録音部に録音の開始を指示
するか、または伝言記憶部に格納されているデータの再
生を再生部に指示するものである。

【０００８】本発明においては、マイクから入力される
音声は、最初は切替手段１１によって音声認識手段１２
側に出力される。これによって入力音声の中に、例えば
録音を指示する音声が含まれている時には、その認識結
果に基づいて録音動作を実行するために、切替手段１１
に入力音声を録音部側に切替えて出力することが指示さ
れるとともに、録音部に対して録音の開始の指示が行わ
れる。これに対して入力音声の認識結果として、例えば
再生を指示する音声が認識されると、記憶されている伝
言データの再生のために、再生部に対して伝言データの
再生が指示される。

【０００９】次に本発明の実施形態の１つとしては、録
音部が例えば音声入力レベルの低下によって録音の終了
を検出した時、切替手段１１に音声出力を録音部側から
音声認識手段１２側に切替える指示を出すことも可能で
あり、これによって録音が終了した時には、その後の入
力音声は切替手段１１によって音声認識手段１２側に出
力される初期状態となる。

【００１０】更に本発明の異なる実施形態においては音
声認識手段１２が、例えば最初に入力される音声に基づ
いて、録音部によって録音される伝言データに対応する
キーワードを求め、伝言記憶部が求められたキーワード
と録音部から出力される伝言とを対応させて記憶するこ
とも可能である。このようなキーワードが伝言記憶部に
記憶された後に、伝言の再生を目的として外部から入力
された音声に含まれるキーワードが音声認識手段１２に
よって認識された時、キーワードに対応する伝言データ
を検索して再生を行うことにより、ユーザが必要とする
伝言データの再生を効率的に実行することができる。

【００１１】また、本発明は入力される音声を録音部、
または音声認識手段のいずれかに切替えて出力する第１
の手順と、該第１の手順からの出力を受けて入力音声を
認識し、該認識結果に基づいて、入力音声を前記録音部
側に出力することを第１の手順に指示し、かつ該録音部
に録音の開始を指示するか、または伝言記憶部に格納さ
れている伝言データの再生を前記再生部に指示する第２
の手順をコンピュータに実行させるプログラムを記憶し
たコンピュータ読み取り可能な記憶媒体を構成する。

【００１２】以上のように本発明によれば、入力される
音声の認識結果に基づいて、録音動作と再生動作との自
動的な切替えが行われる。

【００１３】

【発明の実施の形態】図２は本発明の音声伝言メモ装置
の第１の実施形態の構成ブロック図である。同図におい
て、従来例の図１２と同じ動作を行う部分には同じ符号
を付してある。図２の伝言メモ装置２０の内部には録音
部５、伝言記憶部６、再生部７に加えて、マイク２から
入力される音声を２つの方向のいずれかに切替えて出力
する切替部２１、切替部２１からの音声を認識する音声
認識部２２を備えている。

【００１４】切替部２１はマイク２から入力される音声
を音声認識部２２、または録音部５のいずれかに切替え
て出力する。初期状態においては切替部２１は入力音声
を音声認識部２２側に出力し、音声認識部２２は、音声
認識の結果に従って、その音声入力の中に例えば録音を
指示する音声が含まれている場合には、切替部２１に対
して入力音声を録音部５側に切替えて出力することを指
示すると共に、録音部５に対して録音の開始を指示し、
これによって伝言データは伝言記憶部６に記憶される。

【００１５】これに対して入力音声の中に、例えば再生
を指示する音声が含まれている場合には、音声認識部２
２は切替部２１に対して音声出力の切替えを指示するこ
となく、再生部７に対して伝言記憶部６に記憶されてい
る伝言データの再生を指示し、その伝言データは再生さ
れてスピーカ３から出力される。

【００１６】図３は図２の伝言メモシステムのコンピュ
ータによる実現方式の説明図である。同図においてコン
ピュータ３０には、音声入力用のマイクロホン２と音声
出力用のスピーカ３が接続されている。

【００１７】コンピュータ３０は全体の動作を制御する
マイクロプロセッサユニット（ＭＰＵ）３１、図２の伝
言記憶部６に相当するメモリ３２、図２の録音部５に対
応する録音プログラム、再生部７に対応する再生プログ
ラム、切替部２１を含む音声認識部２２に対応する音声
認識プログラムを格納したディスク３３、音声入出力用
のサウンドボード３４、バス３５から構成されている。
サウンドボード３４の内部には、スピーカ３が接続され
る音出力部３６、マイクロホン２が接続される音入力部
３７が含まれている。

【００１８】図４は本発明の音声伝言メモ装置の第２の
実施形態の構成ブロック図である。同図を図２の第１の
実施形態と比較すると、録音部２３が伝言データの録音
を開始した後、例えば録音レベルの低下の継続によって
録音の終了を検出し、切替部２１に対してそれ以後に入
力される音声を音声認識部２２側に切替えて出力するこ
とを指示する動作を実行することだけが異なっている。
これによって切替部２１による切替え状態は初期状態に
戻り、以後入力される音声は音声認識部２２に出力さ
れ、その認識結果に従って録音動作と再生動作の切替え
が行われる。

【００１９】図５は音声伝言メモ装置の第３の実施形態
の構成ブロック図である。同図を図４の第２の実施形態
と比較すると、統合部２４、キーワード抽出部２５、検
索部２６が追加されている点が基本的に異なっている。

【００２０】統合部２４は、伝言データとそれに対応す
るキーワードを統合して、伝言記憶部２７に出力するも
のである。ここでキーワードとは、例えばユーザに対し
て伝言の先頭にキーワードを発声させ、それを音声認識
部２２によって認識したものである。このキーワードは
音声認識結果としての文字列でもよく、認識途中の音声
パラメータでもよい。このキーワードは統合部２４に出
力され、録音部２３から出力される伝言データと統合部
２４によって統合され、１対１に対応する形式で伝言記
憶部２７に格納される。

【００２１】キーワード抽出部２５は、伝言データの再
生時に伝言記憶部２７に格納されているキーワードを抽
出し、音声認識部２２に与えるものである。一般に音声
認識においては入力される音声を１つの音毎に正しく認
識することが要求されるが、認識対象があらかじめある
程度与えられていない場合には、マイクの特性や人の声
のくせなどによって正しい認識を行うことが難しい。そ
こで伝言記憶部２７にすでに記憶されている、一般に複
数のキーワードを、認識対象として音声認識部２２に与
えることにより、音声認識部２２は入力される音声が複
数のキーワードのいずれに最も近いかを認識することに
なり、認識動作が容易となる。

【００２２】検索部２６は、伝言データの再生時にユー
ザから入力される音声に含まれるキーワードの音声認識
部２２による認識結果の出力を受けて、伝言記憶部２７
に格納されているキーワードを検索し、そのキーワード
に対応する伝言データを、伝言記憶部２７から再生部７
に送ることを指示するものである。

【００２３】図６は図５の第３の実施形態におけるキー
ワードが音声パラメータである場合の伝言記憶部２７内
のレコードのデータ構造とその例の説明図である。同図
(a)はレコードのデータ構造を示し、このデータ構造で
はキーワード部、例えば音声の認識途中の音声パラメー
タ、音声データ部は伝言データに対応する音声波形であ
る。同図(b) はレコードの具体例であり、例えば“東
京”を示す音声パラメータがキーワード部に、東京の天
気予報を示す音声波形が音声データ部に格納されてい
る。

【００２４】図７はキーワードが文字列（テキスト）の
場合のレコードのデータ構造と、その具体例の説明図で
ある。同図(a) はデータ構造を示し、キーワード部には
テキストとしての文字列、音声データ部には伝言データ
に対応する音声波形が格納される。同図(b) はレコード
の具体例であり、例えばキーワード部には文字列として
の“トウキョウ”が、音声データ部には東京の天気予報
を示す音声波形が格納されている。

【００２５】図８は図６のキーワードを用いる場合の図
５の検索部２６の構成例のブロック図である。同図にお
いて検索部２６は、音声認識部２２から与えられるキー
ワードとしての音声パラメータが格納される入力パラメ
ータバッファ４０、伝言記憶部２７に格納されているキ
ーワードとしての音声パラメータが入力されるキーワー
ドパラメータバッファ４１、２つのパラメータバッファ
４０および４１のパラメータを照合するＤＰ照合部４
２、ＤＰ照合の結果、入力キーワードに最も近いキーワ
ードを判定し、そのキーワードに対応する伝言を再生部
７に送るように伝言記憶部２７に指示を出す制御部４３
から構成されている。なお検索部２６によって入力キー
ワードが伝言記憶部２７に記憶されているキーワードと
照合されるので、前述のように入力キーワードの音声認
識のために、キーワード抽出部２５によって抽出された
キーワードを音声認識部２２に与えることは絶対必要な
ことではなく、キーワード抽出部２５を使用しなくとも
よいが、音声認識を正確にするためにはキーワード抽出
部２５を使う方がよい。

【００２６】図９は図８の検索部２６の処理フローチャ
ートである。同図において処理が開始されると、まずス
テップＳ１で音声認識部２２から出力される入力音声パ
ラメータが獲得され、ステップＳ２で伝言記憶部２７に
格納されている次のキーワードの音声パラメータが獲得
され、ステップＳ３でＤＰ照合が行われる。そしてステ
ップＳ４で伝言記憶部２７に記憶されている伝言データ
が最後のものであるかが判定され、最後のものでない時
にはステップＳ２に戻り、次の伝言に対応するキーワー
ドのパラメータの獲得以降の処理が実行される。最後の
伝言である場合には、ステップＳ５で、ステップＳ１で
得られた入力音声パラメータに最も近いキーワードに対
応する伝言を再生部７に送るように伝言記憶部２７に指
示が出されて、処理を終了する。

【００２７】図１０は図７のように文字列をキーワード
に用いる場合の検索部２６の構成ブロック図である。同
図において検索部２６は、音声認識部２２から出力され
る文字列としてのキーワードが格納される入力文字バッ
ファ４５、伝言記憶部２７に格納されているキーワード
としての文字列が格納されるキーワードバッファ４６、
２つのバッファ４５，４６の格納内容としての文字列を
比較する文字列比較部４７から構成されている。

【００２８】図１１は図１０の検索部の処理のフローチ
ャートである。同図において処理が開始されると、まず
ステップＳ１１で音声認識部２２から入力文字列として
このキーワードが獲得され、ステップＳ１２で伝言記憶
部２７に格納されている次の伝言に対応するキーワード
の文字列が獲得され、ステップＳ１３で２つの文字列の
比較が行われる。

【００２９】２つの文字列がステップＳ１４で同じと判
定された場合には、ステップＳ１５でそのキーワードに
対応する伝言を再生部７に送るように指示が出されて、
処理を終了する。ステップＳ１４で２つの文字列が同じ
でないと判定された時には、伝言記憶部２７に格納され
ている伝言が終りか否かがステップＳ１６で判定され、
終りでない時にはステップＳ１２の、次の伝言に対応す
るキーワードを獲得する処理以降が実行される。終りの
伝言の場合にはその時点で処理を終了する。

【００３０】

【発明の効果】以上詳細に説明したように、本発明によ
ればユーザから入力される音声の認識結果に基づいて録
音動作と再生動作とを自動的に切替えることができ、音
声伝言メモ装置の操作をスムースにすることができる。
また伝言の先頭にキーワードを発声させ、それを伝言デ
ータと対応させて記憶することにより、再生時における
伝言データの検索が容易になり、音声伝言メモ装置の実
用性の向上に寄与するところが大きい。

【図面の簡単な説明】

【図１】本発明の原理構成ブロック図である。

【図２】本発明の音声伝言メモ装置の第１の実施形態の
構成ブロック図である。

【図３】本発明の音声伝言メモ装置のコンピュータシス
テムによる実現例を説明する図である。

【図４】音声伝言メモ装置の第２の実施形態の構成ブロ
ック図である。

【図５】音声伝言メモ装置の第３の実施形態の構成ブロ
ック図である。

【図６】音声パラメータをキーワードとするレコードの
データ構造とその具体例を説明する図である。

【図７】文字列をキーワードとするレコードのデータ構
造とその具体例を説明する図である。

【図８】キーワードが音声パラメータである場合の検索
部の構成ブロック図である。

【図９】図８における検索部の処理フローチャートであ
る。

【図１０】キーワードが文字列である場合の検索部の構
成ブロック図である。

【図１１】図１０における検索部の処理フローチャート
である。

【図１２】音声伝言メモ装置の従来例の構成ブロック図
である。

【符号の説明】

１，２０伝言メモ装置２マイク３スピーカ５，２３録音部６，２７伝言記憶部７再生部１１切替手段１２音声認識手段２１切替部２２音声認識部２４統合部２５キーワード抽出部２６検索部

Claims

【特許請求の範囲】

【請求項１】音声を録音する録音部と、該録音部によ
って録音された伝言データを格納する伝言記憶部と、該
伝言記憶部に格納されている伝言データを再生する再生
部とを有する音声伝言メモ装置において、音声を認識する音声認識手段と、入力される音声を前記録音部、または音声認識手段のい
ずれかに切替えて出力する切替手段とを備え、該音声認識手段が、該切替手段からの出力を受けて入力
音声を認識し、該認識結果に基づいて、入力音声を前記
録音部側に出力することを該切替手段に指示し、かつ該
録音部に録音の開始を指示するか、または前記伝言記憶
部に格納されている伝言データの再生を前記再生部に指
示することを特徴とする音声伝言メモ装置。
【請求項２】前記録音部が、録音の終了を検出した
時、前記切替手段に音声出力を該録音部側から前記音声
認識手段側に切替える指示を出すことを特徴とする請求
項１記載の音声伝言メモ装置。
【請求項３】前記音声認識手段が、入力される音声に
基づいて前記録音部によって録音される伝言データに対
応するキーワードを求め、前記伝言記憶部が該求められたキーワードと録音部から
出力される伝言データとを対応させて記憶することと、伝言の再生を目的として外部から入力された音声に含ま
れるキーワードが該音声認識手段によって認識された
時、該キーワードに対応する伝言データを検索して該伝
言記憶部から前記再生部に出力させる検索手段を更に備
えることを特徴とする請求項１、または２記載の音声伝
言メモ装置。
【請求項４】前記キーワードが、入力される音声の認
識結果の一部としての文字列、または認識途中の音声パ
ラメータの一部であることを特徴とする請求項３記載の
音声伝言メモ装置。
【請求項５】前記伝言の再生を目的として外部から入
力された音声に含まれるキーワードの認識対象として、
前記伝言記憶部に記憶されているキーワードを抽出して
前記音声認識手段に与えるキーワード抽出手段を更に備
えることを特徴とする請求項３記載の音声伝言メモ装
置。
【請求項６】入力される音声を録音部、または音声認
識手段のいずれかに切替えて出力する第１の手順と、該第１の手順からの出力を受けて入力音声を認識し、該
認識結果に基づいて、入力音声を前記録音部側に出力す
ることを第１の手順に指示し、かつ該録音部に録音の開
始を指示するか、または伝言記憶部に格納されている伝
言データの再生を前記再生部に指示する第２の手順をコ
ンピュータに実行させるプログラムを記憶したコンピュ
ータ読み取り可能な記憶媒体。
【請求項７】入力される音声を録音部、または音声認
識手段のいずれかに切替えて出力する第１の手順と、該第１の手順からの出力を受けて入力音声を認識し、該
認識結果に基づいて、入力音声を前記録音部側に出力す
ることを第１の手順に指示し、かつ該録音部に録音の開
始を指示するか、または伝言記憶部に格納されている伝
言データの再生を前記再生部に指示する第２の手順を備
えることを特徴とする音声伝言メモ方法。