JPH03179499A - 単語音声認識装置 - Google Patents

単語音声認識装置

Info

Publication number
JPH03179499A
JPH03179499A JP1320017A JP32001789A JPH03179499A JP H03179499 A JPH03179499 A JP H03179499A JP 1320017 A JP1320017 A JP 1320017A JP 32001789 A JP32001789 A JP 32001789A JP H03179499 A JPH03179499 A JP H03179499A
Authority
JP
Japan
Prior art keywords
voice
recognition
speech
parameters
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1320017A
Other languages
English (en)
Inventor
Hiroaki Tsutsumi
堤 宏彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1320017A priority Critical patent/JPH03179499A/ja
Publication of JPH03179499A publication Critical patent/JPH03179499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声ダイヤル方式等に利用する単語音声認識
装置に関する。
従来の技術 従来の単語音声認識装置として、第2図に示すような構
成が知られている。第2図において、51は音声信号入
力用のマイクロホン、52はマイクロホン51から出力
された音声のアナログ信号をデジタル信号に変換するA
/D変換器、53はA/D変換器52でデジタル信号に
変換された音声信号を音響分析して音声認識パラメータ
を得る認識パラメータ抽出部、54はA/D変換器52
でデジタル信号に変換された音声信号を音響分析して音
声合戊パラメータを得る合成パラメータ抽出部、55は
A/D変換器52でデジタル信号に変換された音声信号
から発声された音声の始端と終端を検出する音声区間検
出部、56はN単語針の音声合成パラメータを格納する
メモリ、57はN単語針の音声認識パラメータを音声認
識参照用として格納するメモリ、58はメモリ制御部で
あり、音声区間検出部55の検出結果をもとに認識パラ
メータ抽出部53、合成パラメータ抽出部54の出力デ
ータを認識パラメータ格納メモリ57、合成パラメータ
格納メモリ56に格納し、また、各格納メモリ57.5
6に格納しているデータを読み出す。59は音声認識の
マツチング部であり、認識パラメータ抽出部53からの
音声認識パラメータの時系列データと、認識パラメータ
格納メモリ57に格納されている音声認識パラメータの
時系列データとのマツチングを行なう。60はマツチン
グ部59の出力をもとに認識結果、すなわち、合成パラ
メータ格納メモリ56から音声合成パラメータの時系列
データを出力する認識結果出力部、61は認識結果出力
部60の出力をもとにデジタル値の音声信号を生成する
音声合成部、62は音声合成部61から出力された音声
合成デジタル信号をアナログ信号に変換するD/A変換
器、63はD/A変換器62で変換された音声合成信号
を増幅する増幅器、64は増幅器63で増幅された音声
合成信号をもとに音声波を出力するスピーカー 65.
66はそれぞれA/D変換器52と合成パラメータ抽出
部54の間、メモリ制御部58とマツチング部59の間
に設けられ、音声登録モードと音声認識モードを切り替
えるスイッチである。
以上の構成において、以下、その動作について説明する
まず、スイッチ65.66を接点a側に切り替え、音声
登録モードにする。そして、マイクロホン51から音声
を入力すると、その音声信号はA/D変換器52でデジ
タル信号に変換される。この音声デジタル信号は認識パ
ラメータ抽出部53および合成パラメータ抽出部54で
それぞれ単位時間毎に音響分析が施されて特徴抽出が行
なわれ、音声認識パラメータおよび音声合成パラメータ
が時系列データとして生成され、メモリ制御部58に出
力される。一方、上記時系列データと同期し、音声区間
検出部55において、上記音声のデジタル信号をもとに
、その音声の始端と終端が検出される。メモリ制御部5
8では、上記音声の始端と終端の値を用い、音声認識パ
ラメータおよび音声合成パラメータの時系列データの始
端から終端までの値を認識パラメータ格納メモリ57お
よび合成パラメータ格納メモリ56に格納する。以上の
動作を各単語毎に繰り返し、N単語針の音声認識パラメ
ータおよび音声合成パラメータをそれぞれ格納メモリ5
7.56に格納する。
次に、スイッチ65.66を接点す側に切り替え、音声
認識モードにする。そして、マイクロホン51から音声
を入力すると、その音声信号はA/D変換器52でデジ
タル信号に変換され、認識パラメータ抽出部53および
音声区間検出部55に入り、入力した音声信号の始端と
終端に対応して音声認識パラメータの時系列データが生
成され、メモリ制御部58に入力される。メモリ制御部
58は上記音声認識パラメータの時系列データと、認識
パラメータ格納メモリ57に予め格納しである各々の単
語の音声認識パラメータの時系列データとの距離計算を
マツチング部59で行なわせ、各単語毎の距離を求める
。認識結果出力部60では、得られた各単語毎の距離が
最小の単語を選び、合成パラメータ格納メモリ56から
上記単語に対応する音声合成パラメータの時系列データ
をメモリ制御部58を通して音声合成部61に出力する
。音声合成部61は、入力された音声合成パラメータの
時系列データからデジタル値の音声信号を生成する。こ
のようにして得られたデジタル値の音声信号をD/A変
換器62でアナログ信号に変換し、増幅器63で増幅し
、スピーカ64から音声波として認識結果を出力する。
このように、従来の単語音声認識装置でも、音声認識結
果を予め登録時に生成した音声合成パラメータを使用す
ることにより、スピーカ64から出力される合成音声に
より確認することができる。
発明が解決しようとする課題 しかしながら、上記従来例の単語音声認識装置では、音
声登録時の入力音声レベルが各単語毎に異なるため、音
声認識結果としての合成音声の信号レベルが各単語毎に
大きく異なり、認識結果を確認することができないとい
う課題があった。
本発明は、このような従来の課題を解決するものであり
、音声認識結果としての合成音声の信号レベルを各単語
毎にほぼ等しくすることができ、音声認識結果を容易に
、かつ確実に確認することができるようにした単語音声
認識装置を提供することを目的とするものである。
課題を解決するための手段 上記目的を遠戚するための本発明の技術的解決手段は、
入力された各単語音声に対し、予め音声の特徴抽出を行
ない、音声認識パラメータ、音声合成パラメータをそれ
ぞれ抽出する手段および音声レベルの大小範囲を符号化
する手段と、抽出された音声認識パラメータ、音声合成
ハラメータ、符号化された音声レベルの大小範囲を格納
するメモリと、音声認識時に入力された音声から上記音
声認識パラメータ抽出手段で抽出された音声認識パラメ
ータおよび予め上記格納メモリに格納されている各単語
の音声認識パラメータを用いて認識を行ない、認識結果
として予め上記格納メモリに格納されている音声合成パ
ラメータを出力すると共に、予め上記格納メモリに格納
され、上記認識した単語に対応した音声レベルの大小範
囲を示す符号を出力する手段と、出力された音声合成パ
ラメータから音声信号を合成する手段と、出力された音
声レベルの大小範囲を示す符号をもとに上記合成されて
出力される音声信号を他単語との出力レベル差が最小と
なるように制御する手段を備えたものである。
作用 したがって、本発明によれば、入力された各単語音声に
対し、抽出手段で予め音声の特徴抽出を行ない、音声認
識パラメータおよび音声合成パラメータを抽出して格納
メモリに格納し、符号化手段で入力音声レベルの大小範
囲を符号化して格納メモリに格納し、音声認識時に入力
された音声から抽出手段で抽出された音声認識パラメー
タおよび予め格納メモリに格納しである各単語の音声認
識パラメータを用いて認識を行ない、認識結果として予
め格納メモリに格納しである音声合成パラメータを出力
すると共に、予め格納メモリに格納し、認識した単語に
対応した音声レベルの大小範囲を示す符号を出力し、音
声合成パラメータをもとに音声信号を合成する際、音声
レベルの大小範囲を示す符号をもとに他単語との出力レ
ベル差が最小となるように制御することができる。
実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は本発明の一実施例における単語音声認識装置を
示す概略ブロック図である。
第1図において、1は音声信号入力用のマイクロホン、
2はマイクロホン1から出力された音声のアナログ信号
をデジタル信号に変換するA/D変換器、3はA/D変
換器2でデジタル信号に変換された音声信号を音響分析
して音声認識パラメータを得る認識パラメータ抽出部、
4はA/D変換器2でデジタル信号に変換された音声信
号を音響分析して音声合成パラメータを得る合成パラメ
ータ抽出部、5はA/D変換器2でデジタル信号に変換
された音声信号から音声レベルの大小範囲として、音声
パワーの最大値と平均値を符号化して求める音声パワー
レベル符号化部、6はA/D変換器2でデジタル信号に
変換された音声信号から発声された音声の始端と終端を
検出する音声区間検出部、7はN単語分の音声合成パラ
メータを格納するメモリ、8はN単語針の音声認識パラ
メータを音声認識参照用として格納するメモリ、9はN
単語針の音声パワーの最大値と平均値を格納するメモリ
、10はメモリ制御部であり、音声区間検出部6の検出
結果をもとに認識パラメータ抽出部3、合成パラメータ
抽出部4、音声パワーレベル符号化部5の出力データを
各格納メモリ8.7.9に格納し、また、各格納メモリ
8.7.9に格納しているデータを読み出す。11は音
声認識のマツチング部であり、認識パラメータ抽出部3
からの音声認識パラメータの時系列データと、認識パラ
メータ格納メモリ8に格納されている音声認識パラメー
タの時系列データとのマツチングを行なう。12はマツ
チング部11の出力をもとに認識結果、すなわち、合成
パラメータ格納メモリ7から音声合成パラメータの時系
列データを出力し、かつパワーレベル符号格納メモリ9
から認識した単語に対応した音声パワーの最大値と平均
値を出力する認識結果出力部、13は認識結果出力部1
2から出力された音声合成パラメータの時系列データを
もとにデジタル値の音声信号を生成する音声合成部、1
4は音声合成部13から出力された音声合成デジタル信
号をアナログ信号に変換するD/A変換器、15はD/
A変換器14で変換された音声合成信号を基準レベルに
対して一定にするためのアラティネタ−16は認識結果
出力部12から出力された音声パワーの最大値と平均値
をもとにアラティネタ−15を制御する音声パワー制御
部、17は基準レベルに対して一定にされた音声合成信
号を増幅する増幅器、18は増幅器17で増幅された音
声合成信号をもとに音声波を出力するスピーカー19.
20.21はそれぞれA/D変換器2と合成パラメータ
抽出部4および音声パワーレベル符号化部4の間、メモ
リ制御部10とマツチング部11の間、メモリ制御部1
0と認識結果出力部12の間に設けられ、音声登録モー
ドと音声認識モードを切り替えるスイッチである。
以上の構成において、以下、その動作について説明する
まず、スイッチ19.20.21を接点a側に切り替え
、音声登録モードにする。そして、マイクロホン1から
音声を入力すると、その音声信号はA/D変換器2でデ
ジタル信号に変換される。この音声のデジタル信号は認
識パラメータ抽出部3および合成パラメータ抽出部4で
それぞれ単位時間毎に音響分析が施されて音声の特徴抽
出が行なわれ、音声認識および音声合成パラメータが時
系列データとして生成され、メモリ制御部10に出力さ
れる。一方、上記時系列データと同期し、音声区間検出
部6において、上記音声のデジタル信号をもとに、その
音声の始端と終端が検出される。また、音声パワーレベ
ル符号化部5において、上記検出された音声の始端、終
端間の音声パワーの最大値と平均値が求められ、メモリ
制御部10に出力される。メモリ制御部10は上記音声
の始端と終端の値を用い、音声認識パラメータの時系列
データの始端から終端までの値、音声合成パラメータの
時系列データの始端から終端までの値、音声パワーの最
大値と平均値をそれぞれ認識パラメータ格納メモリ8、
合成パラメータ格納メモリ7、パワーレベル符号格納メ
モリ9に格納する。
以上の動作を各単語毎に繰り返し、N単語針の音声認識
パラメータ、合成パラメータ、音声パワーの最大値と平
均値を求め、それぞれ格納メモリ8.7.9に格納する
次に、スイッチ19.20.21を接点す側に切り替え
、音声認識モードにする。そして、マイクロホン1から
音声を入力すると、その音声信号はA/D変換器2でデ
ジタル信号に変換され、認識パラメータ抽出部3および
音声区間検出部6に入り、入力した音声信号の始端と終
端に対応して音声認識パラメータの時系列データが生成
され、メモリ制御部10に入力される。メモリ制御部1
0は上記音声認識パラメータの時系列データと、認識パ
ラメータ格納メモリ8に予め格納しである各々の単語の
音声認識パラメータの時系列データとの距離計算をマツ
チング部11で行なわせ、各単語毎の距離を求める。認
識結果出力部12では、得られた各単語毎の距離が最小
の単語を選び、合成パラメータ格納メモリ7から上記単
語に対応する音声合成パラメータの時系列データをメモ
リ制御部10を通して音声合成部13に出力する。音声
合成部13では、入力された音声合成パラメータの時系
列データからデジタル値の音声信号を生成する。このよ
うにして得られたデジタル値の音声信号をD/A変換器
14でアナログ信号に変換する。一方、認識結果出力部
12はパワーレベル符号格納メモリ9から認識した単語
に対応した音声パワーの最大値と平均値をメモリ制御部
10を通して音声パワー制御部16に入力する。音声パ
ワー制御部16では、入力された値をもとに基準レベル
に対して音声出力が一定になるようアラティネタ−15
を調整する。基準レベルに対して一定にされた音声合成
信号を増幅器17で増幅し、スピーカ18から音声波と
して認識結果を出力する。したがって、音声認識時に各
単語毎の合成音声レベルの差を最小にすることができ、
音声認識結果を容易に、かつ確実に確認することができ
る。
発明の効果 以上述べたように本発明によれば、入力された各単語音
声に対し、抽出手段で予め音声の特徴抽出を行ない、音
声認識パラメータおよび音声合成パラメータを抽出して
格納メモリに格納し、符号化手段で入力音声レベルの大
小範囲を符号化して格納メモリに格納し、音声認識時に
入力された音声から抽出手段で抽出された音声認識パラ
メータおよび予め格納メモリに格納しである各単語の音
声認識パラメータを用いて認識を行ない、認識結果とし
て予め格納メモリに格納しである音声合成パラメータを
出力すると共に、予め格納メモリに格納し、認識した単
語に対応した音声レベルの大小範囲を示す符号を出力し
、音声合成パラメータをもとに音声信号を合成する際、
音声レベルの大小範囲を示す符号をもとに他単語との出
力レベル差が最小となるように制御することができる。
このように、音声認識時、認識結果を確認するための各
単語の合成音声出力レベル差を最小にすることができる
ので、音声認識結果を容易に、かつ確実にすることがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例における単語音声認識装置を
示す概略ブロック図、第2図は従来の単語音声認識装置
を示す概略ブロック図である。 1・・・マイクロホン、3・・・認識パラメータ抽出部
、4・・・合成パラメータ抽出部、5・・・音声パワー
レベル符号化部、6・・・音声区間検出部、7・・・合
成パラメータ格納メモリ、8・・・認識パラメータ格納
メモリ、9・・・パワーレベル符号格納メモリ、10・
・・メモリ制御部、11・・・マツチング部、12・・
・認識結果出力部、13・・・音声合成部、15・・・
アラティネタ−16・・・音声ハワー制御部。

Claims (1)

    【特許請求の範囲】
  1. 入力された各単語音声に対し、予め音声の特徴抽出を行
    ない、音声認識パラメータ、音声合成パラメータをそれ
    ぞれ抽出する手段および音声レベルの大小範囲を符号化
    する手段と、抽出された音声認識パラメータ、音声合成
    パラメータ、符号化された音声レベルの大小範囲を格納
    するメモリと、音声認識時に入力された音声から上記音
    声認識パラメータ抽出手段で抽出された音声認識パラメ
    ータおよび予め上記格納メモリに格納されている各単語
    の音声認識パラメータを用いて認識を行ない、認識結果
    として予め上記格納メモリに格納されている音声合成パ
    ラメータを出力すると共に、予め上記格納メモリに格納
    され、上記認識した単語に対応した音声レベルの大小範
    囲を示す符号を出力する手段と、出力された音声合成パ
    ラメータから音声信号を合成する手段と、出力された音
    声レベルの大小範囲を示す符号をもとに上記合成されて
    出力される音声信号を他単語との出力レベル差が最小に
    なるよう制御する手段を備えたことを特徴とする単語音
    声認識装置。
JP1320017A 1989-12-08 1989-12-08 単語音声認識装置 Pending JPH03179499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1320017A JPH03179499A (ja) 1989-12-08 1989-12-08 単語音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1320017A JPH03179499A (ja) 1989-12-08 1989-12-08 単語音声認識装置

Publications (1)

Publication Number Publication Date
JPH03179499A true JPH03179499A (ja) 1991-08-05

Family

ID=18116825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1320017A Pending JPH03179499A (ja) 1989-12-08 1989-12-08 単語音声認識装置

Country Status (1)

Country Link
JP (1) JPH03179499A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5520240A (en) * 1978-07-28 1980-02-13 Mitsubishi Electric Corp Ozonizer
JPS57188100A (en) * 1981-05-15 1982-11-18 Nippon Telegraph & Telephone Voice recognition/synthesization system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5520240A (en) * 1978-07-28 1980-02-13 Mitsubishi Electric Corp Ozonizer
JPS57188100A (en) * 1981-05-15 1982-11-18 Nippon Telegraph & Telephone Voice recognition/synthesization system

Similar Documents

Publication Publication Date Title
EP0077194B1 (en) Speech recognition system
EP0757342B1 (en) User selectable multiple threshold criteria for voice recognition
EP0683481A3 (en) Voice operated game apparatus
JPS63503487A (ja) 音声処理装置
JPH03179499A (ja) 単語音声認識装置
JP2000122678A (ja) 音声認識機器制御装置
JPH0430040B2 (ja)
WO2019214299A1 (zh) 自动翻译装置、方法及计算机设备
JP2500761Y2 (ja) 音声認識装置
JPH039400A (ja) 音声認識装置
KR100262576B1 (ko) 운전자의 음성 신호 구간 검출 장치 및 그 방법
JPH05224694A (ja) 音声認識装置
JPH0637734A (ja) 音声伝送方式
JP3063426B2 (ja) テキスト入力装置
JPS6334477B2 (ja)
JPH09218696A (ja) 音声認識装置
JPH0343639B2 (ja)
JP2969663B2 (ja) 音声認識装置
JPH0548763A (ja) 音声認識応答装置
JPS6340398B2 (ja)
JPH06130983A (ja) 音声認識機構の音声区間検出装置
JPH09198382A (ja) 音声入力かな漢字変換装置
JPH0410080B2 (ja)
JPS58205199A (ja) 音声認識装置
JPH06222788A (ja) 音声認識装置