JPH03188500A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03188500A
JPH03188500A JP1327755A JP32775589A JPH03188500A JP H03188500 A JPH03188500 A JP H03188500A JP 1327755 A JP1327755 A JP 1327755A JP 32775589 A JP32775589 A JP 32775589A JP H03188500 A JPH03188500 A JP H03188500A
Authority
JP
Japan
Prior art keywords
voice
memory
reference data
data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1327755A
Other languages
English (en)
Inventor
Ryuhei Fujiwara
隆平 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1327755A priority Critical patent/JPH03188500A/ja
Publication of JPH03188500A publication Critical patent/JPH03188500A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声認識装置に関し、特に認識した音声を利用
者に確認させる為にその音声を復唱する機能を持つ音声
認識装置に関する。
〔従来の技術〕
各種の機器を音声によって操作し得るようにする為に、
利用者が発した音声による言葉を自動的に認識し、その
認識結果に応じた制御信号を機器に与えて機器を制御す
る音声認識装置が種々提案されている0例えば、自動車
電話機のダイヤル操作を音声にて行える音声ダイヤル装
置がある。この音声ダイヤル装置では、自動車電話機を
音声ダイヤル入力モードにした状態でマイクロフォンに
向かって利用者が音声を発すると、内部の音声認識装置
がマイクロフォンから入力された音声信号を分析して得
たデータを予めメモリに記憶されたデータ(参照データ
)と比較し、一致するデータがあれば、そのデータに対
応して予め記憶された電話番号を使用して発信動作を行
うものである。
ところで、音声認識による各種機器の操作は多くの利点
を有する反面、手入力に比べて正確性に劣る。特に、音
声!!識の手法として、特定話者方式と不特定話者方式
とが知られているが、後者の不特定話者方式は前者の特
定話者方式より認識率が低く且つ任意の音声(単語)を
登録し得ないという欠点を持つ、従って、認識率を高め
て音声入力の正確性を向上し更に任意の音声が扱えるよ
うにする上では特定話者方式の音声認識装置が有効であ
るが、その方式においても手入力に比べて正確性は劣る
。特に、自動車電話機の音声ダイヤル装置の如く騒音の
大きな環境で使用される音声認識装置では特定話者方式
であっても認識率を100%にすることは困難である。
そこで、このような環境で使用される音声g!識装置に
は、利用者の発生した音声を装置が認識した場合、何等
かの音を発する機能が付加されている。このような機能
としては、次のようなものがある。
(1)入力音声を認識したとき、装置からビープ音(ピ
ーという音)を発する。
(2)  利用者が発生した言葉をおうむ返しに装置が
復唱する。
〔発明が解決しようとする課題〕
上述したビープ音による確認方法は、何等かの認識が音
声認識装置で為されたことは分かるが、果たして正確に
認識されたかは不明である。このため、音声ダイヤル装
置の場合、誤った認識により違った相手に電話がかかっ
てしまう欠点がある。
他方、利用者が発生した言葉をおうむ返しに装置が復唱
する方法は、正解に認識されたか否かまで確認できるの
で優れている。しかしながら、この方法は不特定話者方
式の音声認識装置には適するが、特定話者方式の音声認
識装置には遺さない。
すなわち、不特定話者方式では認識する言葉が予め決め
られているので、その言葉を音声合成用データで用意し
ておけば良いが、特定話者方式では利用者によって登録
される言葉が予想できないため、復唱用の音声合成用デ
ータを用意することができないからである。なお、一般
に音声認識と音声合成では扱う音声データの形式が異な
るため、利用者による音声登録時に分析されてメモリに
記憶されたデータ(参照データ)を使用して音声を合成
することは困難である。
本発明はこのような事情に鑑みて為されたものであり、
その目的は、特定話者方式による音声認識装置において
も復唱による認識のi認を可能ならしめることにある。
〔課題を解決するための手段〕
本発明は上記の目的を達成するために、登録モード時に
マイクロフォンから入力された音声を分析して得たデー
タを参照データとしてメモリに記憶し、認識モード時に
前記マイクロフォンから入力された音声を分析して得た
データと前記メモリに記憶された参照データとを比較し
て音声認識を行う音声認識装置において、前記登録モー
ド時に前記マイクロフォンから入力された音声に対し所
定の処理を加えたデータを該音声の分析により得られた
前記参照データと関連付けて前記メモリに記憶する手段
と、前記認識モード時に前記マイクロフォンから入力さ
れた音声を分析して得たデータと合致する参照データが
前記メモリに存在したときに、その参照データと関連付
けて前記メモリに記憶されたデータに対し所定の処理を
加えて再生音を生成する手段とを備え、前記両手段の少
な(とも一方において音声の性質を変換する処理を行う
ことにより、登録モード時にマイクロフォンから入力さ
れた音声の性質を異ならせた音声を確認応答として出力
する構成を有する。
〔作用〕
本発明の音声認識装置においては、登録モード時に利用
者がマイクロフォンに向かって登録すべき言葉を発する
と、その音声を分析して得られたデータが参照データと
してメモリに記憶されると共に、その音声に対し所定の
処理が加えられたデータがその参照データと関連付けて
メモリに記憶され、認識モード時に利用者がマイクロフ
ォンに向かって言葉を発すると、その音声を分析して得
られたデータと前記メモリに記憶された参照データとが
比較され、この比較により前記メモリ中の成る参照デー
タに合致することが確認されると、その合致した参照デ
ータに関連付けて前記メモリに記憶されたデータに対し
所定の処理が加えられて再生音が生成される。ここで、
音声をあたかも別人の音声のように換える為に必要な音
声性質変換処理が音声をメモリへの登録時または再生時
に行われるものであり、これによって、登録モード時に
入力された音声とは別人の音声で確認応答が行われる。
〔実施例〕
次に、本発明の実施例について図面を参照して詳細に説
明する。
第1図は本発明の一実施例の要部ブロック図であり、本
発明を自動車電話機の音声ダイヤル装置に適用した場合
のものである。この実施例は、同図に示すように、マイ
クロプロセッサ(MPU)1と、そのバス2に接続され
たメモリ3と、バス2およびDMAコントロール線4に
接続されたDMAコントローラ5,6.7と、バス2に
接続されたI10コントローラ8と、I10コントロー
ラ8に接続されたキー操作部9と、マイクロフォン10
と、このマイクロフォン10とDMAコントローラ5と
の間に設けられた音声登録時処理部11と、マイクロフ
ォン10とDMAコントローラ6との間に設けられたA
/D変換器12および参照データ生成部13と、スピー
カ14と、このスピーカ14とDMAコントローラ7と
の間に設けられたアンプ15および音声再生時処理部1
6とを含んでいる。
第2図はメモリ3の要部構成例を示し、複数の記憶エリ
ア31−1.31−2.・・・と、ディレクトリ32と
を含む領域を有している。各記憶エリア31−1.31
−2.・・・は1つの登録音声に対応するもので、それ
ぞれ参照データ部DI、音声データ部D2およびダイヤ
ル番号部D3から構成されている。ここで、参照データ
部D1は第1図の参照データ生成部13によって生成さ
れた参照データを記憶する部分、音声データ部D2は第
1図の音声登録時処理部11で処理されたデータを記憶
する部分、ダイヤル番号部D3は発信先の相手ダイヤル
番号を記憶する部分である。また、ディレクトリ32は
、各記憶エリアの先頭アドレス。
各記憶エリア内の参照データ部り1.音声データ部D2
.ダイヤル番号部D3の先頭アドレス等を管理する情報
を記憶する部分である。
第3図は音声登録時処理部11の一構成例を示すブロッ
ク図であり、マイクロフォン10から加わるアナログの
音声信号をディジタルな音声信号に変換するA/D変換
器111から構成されている。また、第4図は第3図の
音声登録時処理部11と組にして使用する音声再生時処
理部16の一構成例を示すブロック図であり、いわゆる
分析合成方式による音声合成系における分析段階で得ら
れた各種パラメータのうちの所定のパラメータの値を予
め用意された別の値に置換することにより、音声の表す
言葉の明瞭度をそれほど悪化させずに音声の性質を変換
するようにしたものである。即ち、第1図のDMAコン
トローラ7から加わるディジタルな音声信号をD/A変
換器160でアナログの音声信号に一旦変換して音声分
析部161に加え、この音声分析部161で分析処理を
行ってピッチ周期、有声音/無声音の区別情報、振幅。
線形予測係数等の各種パラメータを抽出する0次いで、
パラメータ変換部162で上記得られた各種パラメータ
のうちの予め定められた一部のパラメータの値を置換用
パラメータ記憶部163に記憶された値によって置換し
て音声合成部164に加え、この音声合成部164でそ
の置換後の各種パラメータに基づいて音声を合成し、得
られたディジタルな音声をD/A変換器165でアナロ
グの音声信号に変換して第1図のアンプ15に加えるも
のである。
次に、上述のように構成された本実施例の動作を説明す
る。
利用者がキー操作部9から音声登録モードに切り替える
指示を入力すると、I10コントローラ8の出力を受け
たマイクロプロセッサ1は当該音声ダイヤル装置を音声
登録モードにする。この状態で利用者がマイクロフォン
10から登Hすル音声を発すると、その音声はマイクロ
フォンIOでアナログの電気信号に変換されて音声登録
時処理部11とA/D変換器12とに入力される。A/
D変換器12はその音声信号をディジタルな音声信号に
変換して参照データ生成部13に加え、参照データ生成
部13は特定話者方式の音声認識装置において一般に使
用されている分析方法にてその音声を分析して参照デー
タを生成し、これをDMAコントローラ6に送出する。
他方、第3図の如き構成を有する音声登録時処理部11
は、マイクロフォン10から入力されたアナログの音声
信号をディジタルな音声信号に変換してDMAコントロ
ーラ5に送出する。その後、DMAコントローラ5.6
とマイクロプロセッサlとの制御信号の授受によりDM
Aが起動され、DMAコントローラ5から送出された音
声登録時処理部11の出力データは第2図に示すメモリ
3の1つの記憶エリアたとえば記憶エリア31−1の音
声データ部D2に記憶され、DMAコントローラ6から
送出された参照データ生成部13の出力データは同じ記
憶エリア31−1の参照データ部D1に記憶される。な
お、ダイヤル番号部D3には従来と同様な方法にて発信
先のダイヤル番号が記憶される。
以上と同様な動作は次の登録音声に対しても行われ、そ
れにかかる参照データ、音声データ、ダイヤル番号がメ
モリ3の次の記憶エリア31−2に記憶され、以下、同
様にして必要な分のデータがメモリ3に登録される。
さて次に、利用者がキー操作部9から音声認識モードに
切り替える指示を入力すると、I10コントローラ8の
出力を受けたマイクロプロセッサ1は当該音声ダイヤル
装置を音声認識モードにする。この状態で利用者がマイ
クロフォンlOから音声を入力すると、次のような動作
が行われる。
利用者が発した音声はマイクロフォン10でアナログの
音声信号に変換された後にA/D変換器12でディジタ
ルな音声信号に変換されて参照データ生成部13に入力
され、この参照データ生成部13で参照データが生成さ
れる0次にDMAコントローラ6によって参照データが
メモリ3のワーク領域へ転送され、マイクロプロセッサ
1による比較処理が行われる。即ち、今回得られた参照
データと、メモリ3の第2図の各記憶エリア311 3
1−2.・・・内の参照データ部D1に記憶された参照
データとが1つずつ比較され、合致する参照データが存
在するか否かが調べられる。そして、合致する参照デー
タがメモリ3に記憶されていた場合には、その参照デー
タを記憶する記憶エリアの音声データ部D2に記憶され
たデータをDMAコントローラ7を起動して、メモリ3
から音声再生時処理部16へ転送する。
第4図の如き構成を有する音声再生時処理部16は、D
MAコントローラ7からデータが加わるとこれをD/A
変換器160でアナログ信号に変換することにより、登
録時と同じ性質のアナログの音声信号に一旦復元する0
次に、その音声信号を音声分析部161で分析して各種
パラメータを抽出し、パラメータ変換部162でこの抽
出した各種パラメータのうちの予め定められた一部のパ
ラメータの値を置換用パラメータ記憶部163に記憶さ
れた値によって置換する。そして、音声合成部164で
その置換後の各種パラメータに基づいて音声を合成し、
それをD/A変換器165でアナログの音声信号に変換
して第1図のアンプ15に加える。これによって、適当
なタイミングでI10コントローラ8の出力によって動
作可能な状態にされているアンプ15で再生音声が増幅
され、スピーカ14から音声が送出されることになる。
ここで、パラメータ置換部162によって一部のパラメ
ータの値が別の値に置換されているので、再生された音
声は同一の言葉を意味しているけれども登録者とは別人
の声となって出力される。
例えば男性の声が女性の声となって再生される。
なお、実際のダイヤル発信は、合致した参照データを記
憶する記憶エリア31−1.31−2.・・・のダイヤ
ル番号部D3に記憶されたダイヤル番号を使用して従来
と同様に実施される。
第5図は音声登録時処理部11の別の構成例を示すブロ
ック図、第6図はこれと組にして使用する音声再生時処
理部16の構成例を示すブロック図である。第5図に示
す構成の音声登録時処理部11は第3図に示したA/D
変換器111と第4図に示した音声分析部161とで構
成されており、音声分析により抽出した各種パラメータ
を出力するものである。従って、第2図の音声データ部
D2には各種パラメータが記憶される。また、第6図に
示す構成の音声登録時処理部11は第4図の構成からD
/A変換器160および音声分析部161を除いたもの
で、メモリ3から読み出された各種パラメータを直接人
力して処理するものである。一般に音声信号を単にディ
ジタル化して記憶するより、各種パラメータを記憶する
方がメモリ量が少なくて済むので、第5図および第6図
に示す構成によれば、メモリの使用量を削減することが
可能である。
第7図は音声登録時処理部11の更に別の構成例を示す
ブロック図、第8図はこれと組にして使用する音声再生
時処理部16の構成例を示すブロック図である。第3図
乃至第6図までの構成は音声の再生時に音声の性質を変
換する処理を施したが、第7図および第8図の構成は音
声の登録時に音声の性質を変換するものである。このた
めに、第7図に示す構成の音声登録時処理部11では、
第3図のA/D変換器111に加え第4図の音声分析部
161.パラメータ置換部162.置換用パラメータ記
憶部163.音声合成部164を有している。従って、
第2図の音声データ部D2には音声合成部164で生成
された音声性質変換後のディジタルな音声信号が記憶さ
れる。このため、第8図に示す構成の音声再生時処理部
16は単にD/A変換器165から構成されている。
第9図は音声登録時処理部11のまた更に別の構成例を
示すブロック図、第10図はこれと組にして使用する音
声再生時処理部16の構成例を示すブロック図である。
第9図に示す構成の音声登録時処理部11はA/D変換
器111.音声分析部161.パラメータ置換部162
および置換用パラメータ記憶部163から構成され、一
部のパラメータの値を別の値に置換した各種パラメータ
を出力するものである。従って、第2図の音声データ部
D2には置換後の各種パラメータが記憶される。また、
第10図に示す構成の音声再生時処理部16は、音声合
成部164とD/A変換器165とで構成され、メモリ
3から読み出された置換後の各種パラメータに基づいて
音声合成部164で音声を合成し、これをD/A変換器
165でアナログの音声信号に変換するものである。
以上本発明の実施例について説明したが、本発明は以上
の実施例にのみ限定されずにその他各種の付加変更が可
能である0例えば、第1図のA/D変換器12と第3図
、第5図、第7図、第9図のA/D変換器111とを1
つのA/D変換器で実現しても良い。
〔発明の効果〕
以上説明した本発明の音声認識装置によれば、次のよう
な効果を得ることができる。
(1)  利用者の自由な言葉が登録でき且つ認識率が
優れている等の各種の利点を有する特定話者方式を採用
しつつ、利用者が発生した言葉をおうむ返しに装置が復
唱して利用者に確認させる確認応答方法が実現できた。
(2)利用者の音声を登録しそのまま再生して復唱する
方法も考えられるが、大部分の人は自分自身の声を聞か
されると不愉快に感じる0本発明では、おうむ返しの音
声を利用者本人の音声をもとにして別人の音声に仕立て
て復唱するので、そのような不愉快さを利用者に与える
ことがない。
【図面の簡単な説明】
第1図は本発明の実施例の要部ブロック図、第2図はメ
モリ3の要部構成例を示す図、第3図は音声登録時処理
部の一構成例を示すブロック図、 第4図は第3図の音声登録時処理部と姐にして使用する
音声再生時処理部の構成例を示すブロック図、 第5図は音声登録時処理部の別の構成例を示すブロック
図、 第6図は第5図の音声登録時処理部と組にして使用する
音声再生時処理部の構成例を示すブロック図、 第7図は音声登録時処理部の更に別の構成例を示すブロ
ック図、 第8図は第7図の音声登録時処理部と組にして使用する
音声再生時処理部の構成例を示すブロック図、 第9図は音声登録時処理部のまた更に別の構成例を示す
ブロック図および、 第10図は第9図の音声登録時処理部と組にして使用す
る音声再生時処理部の構成例を示すブロック図である。 図において、 1・・・マイクロプロセッサ(MPU)2・・・バス 3・・・メモリ 4・・・DMAコントロール線 5.6.7・・・DMAコントローラ 8・・弓10コントローラ 本発明の賓斃例の要部ブロック図 男1 図 9・・・キー操作部 10・・・マイクロフォン 11・・・音声登録時処理部 12・・・A/D変換器 13・・・参照データ生成部 14・・・スピーカ 15・・・アンプ 16・・・音声再生時処理部

Claims (1)

  1. 【特許請求の範囲】 登録モード時にマイクロフォンから入力された音声を分
    析して得たデータを参照データとしてメモリに記憶し、
    認識モード時に前記マイクロフォンから入力された音声
    を分析して得たデータと前記メモリに記憶された参照デ
    ータとを比較して音声認識を行う音声認識装置において
    、 前記登録モード時に前記マイクロフォンから入力された
    音声信号に対し所定の処理を加えたデータを該音声の分
    析により得られた前記参照データと関連付けて前記メモ
    リに記憶する手段と、前記認識モード時に前記マイクロ
    フォンから入力された音声を分析して得たデータと合致
    する参照データが前記メモリに存在したときに、その参
    照データと関連付けて前記メモリに記憶されたデータに
    対し所定の処理を加えて再生音を生成する手段とを備え
    、 前記両手段の少なくとも一方において音声の性質を変換
    する処理を行うことにより、登録モード時にマイクロフ
    ォンから入力された音声の性質を異ならせた音声を確認
    応答として出力する構成を有することを特徴とする音声
    認識装置。
JP1327755A 1989-12-18 1989-12-18 音声認識装置 Pending JPH03188500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1327755A JPH03188500A (ja) 1989-12-18 1989-12-18 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1327755A JPH03188500A (ja) 1989-12-18 1989-12-18 音声認識装置

Publications (1)

Publication Number Publication Date
JPH03188500A true JPH03188500A (ja) 1991-08-16

Family

ID=18202626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1327755A Pending JPH03188500A (ja) 1989-12-18 1989-12-18 音声認識装置

Country Status (1)

Country Link
JP (1) JPH03188500A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011027905A (ja) * 2009-07-23 2011-02-10 Denso Corp 音声認識装置およびそれを用いたナビゲーション装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011027905A (ja) * 2009-07-23 2011-02-10 Denso Corp 音声認識装置およびそれを用いたナビゲーション装置

Similar Documents

Publication Publication Date Title
JP3968133B2 (ja) 音声認識対話処理方法および音声認識対話装置
US8768701B2 (en) Prosodic mimic method and apparatus
KR20210114518A (ko) 종단간 음성 변환
JPH0361959B2 (ja)
TW546632B (en) System and method for efficient storage of voice recognition models
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
JPS60247697A (ja) 音声対話装置
JP2003524795A (ja) スピーチエネーブル装置のユーザインターフェースの完全性をテストする方法および装置
JP2005055667A (ja) 音声処理装置
JP2003029776A (ja) 音声認識装置
JPH0237600B2 (ja)
JPH03188500A (ja) 音声認識装置
JP2005055666A (ja) 音声処理装置
JPH0215080B2 (ja)
JPS6126677B2 (ja)
JPS59223499A (ja) 音素認識装置
JPH09198085A (ja) 電話をベースとする音声認識用時変特徴スペース処理手順
JP2003295892A (ja) 通訳システム及びプログラム
JPH0345839B2 (ja)
JPH0194398A (ja) 音声標準パターンの作成方法
JP2000311077A (ja) 音声情報入力装置
JP2705061B2 (ja) 音声認識方法
JP2002014687A (ja) 音声合成装置
JPH04324499A (ja) 音声認識装置