JPS58209799A - 音声メツセ−ジ識別方式 - Google Patents
音声メツセ−ジ識別方式Info
- Publication number
- JPS58209799A JPS58209799A JP9353982A JP9353982A JPS58209799A JP S58209799 A JPS58209799 A JP S58209799A JP 9353982 A JP9353982 A JP 9353982A JP 9353982 A JP9353982 A JP 9353982A JP S58209799 A JPS58209799 A JP S58209799A
- Authority
- JP
- Japan
- Prior art keywords
- input
- output
- voice
- pattern
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は電子機器を音声メツセージによって操作するた
めの音声メツセージ識別方式に関するものである。
めの音声メツセージ識別方式に関するものである。
第1図は従来の一般的な音声メツセージ識別装置の概略
構成を示すものである。%1図の構成において、入力音
声にマイク(1すにより電気信号に変換され、プリアン
プ(2+f:経てフィルタFz−Fsにより各同波数成
分に分解される。各フィルタF1〜F8tIi8チャン
ネル分のバシドへスフィルタと整流口。
構成を示すものである。%1図の構成において、入力音
声にマイク(1すにより電気信号に変換され、プリアン
プ(2+f:経てフィルタFz−Fsにより各同波数成
分に分解される。各フィルタF1〜F8tIi8チャン
ネル分のバシドへスフィルタと整流口。
路および平均化回路で構成されており、100 H2乃
至IQKHzの周波数領域を対数目−盛上で略8等分し
た各帯域FB1〜FB8の平均化された出力f1〜f8
が得られるようになっている。各出力f]〜fsHマル
チラレクサ(31とサンプルホールド回路(4)とを介
して順次A/Dコシコンタ(6)により8ピツトのデジ
タル値に変換され、■」ホード(6)とマイコシパス(
7)とを通ってCPU (8)に読み込まれる。音声の
分析フームは約10rnsecであり、各分析フレーム
毎に8チt’:/ネル分のフィルタ出力f1〜f8がA
/D変換されるので、1フレームあたり64ピツトの情
報量になる。し1こがって例えば1秒間の音声人力に対
応する情報量ば6400ヒ・リドIでなり、この情報は
入カバターンRAM (91に格納されるものである。
至IQKHzの周波数領域を対数目−盛上で略8等分し
た各帯域FB1〜FB8の平均化された出力f1〜f8
が得られるようになっている。各出力f]〜fsHマル
チラレクサ(31とサンプルホールド回路(4)とを介
して順次A/Dコシコンタ(6)により8ピツトのデジ
タル値に変換され、■」ホード(6)とマイコシパス(
7)とを通ってCPU (8)に読み込まれる。音声の
分析フームは約10rnsecであり、各分析フレーム
毎に8チt’:/ネル分のフィルタ出力f1〜f8がA
/D変換されるので、1フレームあたり64ピツトの情
報量になる。し1こがって例えば1秒間の音声人力に対
応する情報量ば6400ヒ・リドIでなり、この情報は
入カバターンRAM (91に格納されるものである。
(10)は音声メ・ソセージの始端と終端とを検知する
始端終端検知回路である。また(11)は標準パターy
R)Mであり、入力バターシと照合するための噸準パタ
ーシが予め複数個登録されているものである。(I2)
は入カバターンを複数個の標準パターンと照合して入カ
バターンに最も近い啜j!凡ターンを判定するための頃
合演算回路である。照合演算回路政により入カバターン
がどの柴準バターylで一致するかが判定されると、そ
の標準ハターンに対応する制御命令がI10ボート(6
)全弁して被制御機器(I3)に送出さするようになっ
ている1つなお(141はプログラムRQζ(I5)は
り−+−,Iり腑、詞は操作パネルである。
始端終端検知回路である。また(11)は標準パターy
R)Mであり、入力バターシと照合するための噸準パタ
ーシが予め複数個登録されているものである。(I2)
は入カバターンを複数個の標準パターンと照合して入カ
バターンに最も近い啜j!凡ターンを判定するための頃
合演算回路である。照合演算回路政により入カバターン
がどの柴準バターylで一致するかが判定されると、そ
の標準ハターンに対応する制御命令がI10ボート(6
)全弁して被制御機器(I3)に送出さするようになっ
ている1つなお(141はプログラムRQζ(I5)は
り−+−,Iり腑、詞は操作パネルである。
とCろでかかる従来例1 (r(おいては、入力され1
こ音声が母音である場合にも子音である場合にも全く同
し条件で入カバターンを作成している。しかしながら、
−役に母音の周波数灰分は音声信号の中音域に多く分布
し、反対に子音のり波数成分けるものである。したがっ
て音声信号の母音の部分では中音域の特徴を誇張し、反
対に子音の部分では低音域および高音域の特性を誇張し
た入カバターン全作成すれば音声メ・ソセージの認識率
が高まるはずである。本発明はこのような点に鑑みて為
されたものであり、母音と子音との周波数特性の差を有
効に利用して、音声メ・υセージの認識率を向上させた
音声メツセージ識別方式全提供することを目的とするも
のである。
こ音声が母音である場合にも子音である場合にも全く同
し条件で入カバターンを作成している。しかしながら、
−役に母音の周波数灰分は音声信号の中音域に多く分布
し、反対に子音のり波数成分けるものである。したがっ
て音声信号の母音の部分では中音域の特徴を誇張し、反
対に子音の部分では低音域および高音域の特性を誇張し
た入カバターン全作成すれば音声メ・ソセージの認識率
が高まるはずである。本発明はこのような点に鑑みて為
されたものであり、母音と子音との周波数特性の差を有
効に利用して、音声メ・υセージの認識率を向上させた
音声メツセージ識別方式全提供することを目的とするも
のである。
第2図は本発明の一実施例の全体構成を示すものであり
、第3図は1同上の要部ブロック図を示している。入力
音声はマイク11)により電気信号に変換さね、づリア
ルづ(2)全組てフィルタF1〜Fg[入力される0フ
イルタF1〜F8はそれぞれ通過周波数帯域の異なるバ
ンドパスフィルタと整流回路および平均化回路によって
構成されており、各周波数帯域毎の平均化された出力f
x −fsが得られるようになっている。各フィルタF
l−Fsに含すれるパントノ<スフイルタの通過周波数
帯域の半値幅は、フイIL、 夕FI VCツイテh
158 Hzから251 Hzまで、フィルタF2につ
いて91251 Hzから898 H2まで、フィルタ
F3 vCツイテij 398 Hzから631 H2
まで、フイJLりF4 K ツイテfd 681 Hz
かう1000 Hzまで、フイJLりFs ICツイテ
ta 1000 Hzから1585 Hzまで、フィル
タF6YCツイテ011585 H2から2512 H
zまで、フイllzりF7 K ツイテi 2512
Hzから8981 Hzまで、そしテ’)イ11. タ
Fs VCツイテh 8981 Hlから6810 H
zまでとなるよ′うに設計されている。各フィルタF1
〜F8の出力はマルチづレクサ(3(を介して対数変換
器(171)に入力さするものである。対数変換器(1
71)HフィルタFl−Fsの出力を人間の耳の特性に
合致した対数特性に変換するものである。
、第3図は1同上の要部ブロック図を示している。入力
音声はマイク11)により電気信号に変換さね、づリア
ルづ(2)全組てフィルタF1〜Fg[入力される0フ
イルタF1〜F8はそれぞれ通過周波数帯域の異なるバ
ンドパスフィルタと整流回路および平均化回路によって
構成されており、各周波数帯域毎の平均化された出力f
x −fsが得られるようになっている。各フィルタF
l−Fsに含すれるパントノ<スフイルタの通過周波数
帯域の半値幅は、フイIL、 夕FI VCツイテh
158 Hzから251 Hzまで、フィルタF2につ
いて91251 Hzから898 H2まで、フィルタ
F3 vCツイテij 398 Hzから631 H2
まで、フイJLりF4 K ツイテfd 681 Hz
かう1000 Hzまで、フイJLりFs ICツイテ
ta 1000 Hzから1585 Hzまで、フィル
タF6YCツイテ011585 H2から2512 H
zまで、フイllzりF7 K ツイテi 2512
Hzから8981 Hzまで、そしテ’)イ11. タ
Fs VCツイテh 8981 Hlから6810 H
zまでとなるよ′うに設計されている。各フィルタF1
〜F8の出力はマルチづレクサ(3(を介して対数変換
器(171)に入力さするものである。対数変換器(1
71)HフィルタFl−Fsの出力を人間の耳の特性に
合致した対数特性に変換するものである。
次に加算器(19)ld各フィルタFl−Faの出力を
すべて加算して入力音声の全体的なパワー全検出するも
のであり、この加算器α9)の出力は対数変換4(17
2)によって人間の耳の特性に合致した対数出力に変換
されて、始端終端検知回路(lO)とa/L倹知回路の
1)および差動増!蝙fi(国に入力される。始端終端
検知回路110) u第3図に示すように一対のR8T
フリッづフロ1ソづ(2Qx)(202)と、クロック
パルス発生用の発振器12υと、この発11vから出力
されるクロワクパルスをカラシトするオシカウンタ(2
21)およびオシカウンタ(222)と、人力信号しベ
ルを所定の基準値と比較するコンパレータ(231と、
その他の論理ゲートとにはって構成されている。対数変
換器(172)から出力される入力音声の対数値パワー
はコニ7J’lレータ123) VC入力されて所定の
基準値と比較される。そして@4図(a)に示すように
入力音声の対数値パワーが所定の基準値よりも大きい場
合に汀、第4図(b)に示すはうにコニ/パレータ尚の
出力がHレベルとなり、音声矛ン信号がI10小−)
(61に入力される。しかしてコシパレータ(23iの
出力がHレベルになると、アシトゲ−) (241)を
介して発振器(2すのクロックパルスかオシカウンタ(
221)[入力さjる。一定時間経過してオシカウンタ
(221)かカラシトアップすると、オシ用のフリッづ
フロツj(201)がセ・ントさする。これによってオ
アゲート(251)を介してオシカウンタ(220がリ
セットされるから1/10ポート(6)には第4図(C
1に示すような心(転)増号が入力される。ま1こオシ
カウンタ(221)の出力tg−よってオフ用のフリッ
づフロラづ(202)かリセ・シトされるので、フリッ
づフロップ(202)からオアゲート(252)に入力
される信号はLレベルになる。次に入力音声が小さくな
ると、コンパレータ1オ)の出力はLレベルになる。こ
t′1によってオアゲート(252)の両入力は共にL
レベルになるから、オシカウンタ(222)のリセット
は解除されてカラシト動作を開始し得る状態となる。ま
fここのときイシバータ漫の出力はHしベルVCfxる
ので、アントゲート(242)k介してオシカウンタ(
222)に発振器12υからのクロ゛ツクへルスが入力
さする。一定時間経過してオフカウンタ(222)がカ
ラシトアップすると、オフ用フリッづフロラづ(202
)がセットさね、る。これによってオフカウンタ(22
2)はオアゲート(252) 全弁してフリッづフロラ
づ(2oz)の出力によってリセ・シトされるから、I
10ボート+61!/rは第4図(切に示すような終端
信号が入力さするものである。またオシカウンタ(22
2)の出力VC,rつてオン用フリップフQツブ2o1
)がリセットされるから、再びオシカウンタ(221)
がカラシト可能な状態となる。以下同様の納作を繰り返
して、音声メツセージが入力される度毎に始端信号と終
端信号がI10ホード(6)に入力されるようになって
いるものである。
すべて加算して入力音声の全体的なパワー全検出するも
のであり、この加算器α9)の出力は対数変換4(17
2)によって人間の耳の特性に合致した対数出力に変換
されて、始端終端検知回路(lO)とa/L倹知回路の
1)および差動増!蝙fi(国に入力される。始端終端
検知回路110) u第3図に示すように一対のR8T
フリッづフロ1ソづ(2Qx)(202)と、クロック
パルス発生用の発振器12υと、この発11vから出力
されるクロワクパルスをカラシトするオシカウンタ(2
21)およびオシカウンタ(222)と、人力信号しベ
ルを所定の基準値と比較するコンパレータ(231と、
その他の論理ゲートとにはって構成されている。対数変
換器(172)から出力される入力音声の対数値パワー
はコニ7J’lレータ123) VC入力されて所定の
基準値と比較される。そして@4図(a)に示すように
入力音声の対数値パワーが所定の基準値よりも大きい場
合に汀、第4図(b)に示すはうにコニ/パレータ尚の
出力がHレベルとなり、音声矛ン信号がI10小−)
(61に入力される。しかしてコシパレータ(23iの
出力がHレベルになると、アシトゲ−) (241)を
介して発振器(2すのクロックパルスかオシカウンタ(
221)[入力さjる。一定時間経過してオシカウンタ
(221)かカラシトアップすると、オシ用のフリッづ
フロツj(201)がセ・ントさする。これによってオ
アゲート(251)を介してオシカウンタ(220がリ
セットされるから1/10ポート(6)には第4図(C
1に示すような心(転)増号が入力される。ま1こオシ
カウンタ(221)の出力tg−よってオフ用のフリッ
づフロラづ(202)かリセ・シトされるので、フリッ
づフロップ(202)からオアゲート(252)に入力
される信号はLレベルになる。次に入力音声が小さくな
ると、コンパレータ1オ)の出力はLレベルになる。こ
t′1によってオアゲート(252)の両入力は共にL
レベルになるから、オシカウンタ(222)のリセット
は解除されてカラシト動作を開始し得る状態となる。ま
fここのときイシバータ漫の出力はHしベルVCfxる
ので、アントゲート(242)k介してオシカウンタ(
222)に発振器12υからのクロ゛ツクへルスが入力
さする。一定時間経過してオフカウンタ(222)がカ
ラシトアップすると、オフ用フリッづフロラづ(202
)がセットさね、る。これによってオフカウンタ(22
2)はオアゲート(252) 全弁してフリッづフロラ
づ(2oz)の出力によってリセ・シトされるから、I
10ボート+61!/rは第4図(切に示すような終端
信号が入力さするものである。またオシカウンタ(22
2)の出力VC,rつてオン用フリップフQツブ2o1
)がリセットされるから、再びオシカウンタ(221)
がカラシト可能な状態となる。以下同様の納作を繰り返
して、音声メツセージが入力される度毎に始端信号と終
端信号がI10ホード(6)に入力されるようになって
いるものである。
次にH/L検知回路t3tlは音声入力のパワーの大小
を検出するものであり、コンパレータ(821X322
)とアンドゲート(至)およびインバータ(33)な
どから構成されている。各コンパレータ(821X32
2 )の−万の入力には対数変換器(172)から出力
される音声入力の対数値パワーが入力されており、他方
の入力には基準値設定用電源μsからそれぞれ相異なる
基準端vHおよびVLが入力されている。ただし4!、
準値VH7d基準値Vt、よりも大きく設定されている
。し刀・して音声入力の対数値パワーが基準値VHより
も傷い場合にはコンパレータ(321)の出力がHレベ
ルになる。このときインバータ鰻の出力はLレベルにな
るので、アクトゲート(圓の出力はLレベルになる。次
に音声入力の対数値パワーが基準値VLよりも高く、か
つ基準値VHよりも低い場合には、コシJ\し−9(3
21)の出力灯Lレベル、]−Jパレータ(822)の
出力はHレベル(yなり、アシドゲート(財)の出力は
Rレベルとなる。さらに音声入力の対数値パワーが基準
直VLよりも低い場合に汀、コンパレータ(821)(
322)の出力は共にLレベルになり、アンドゲート(
圓の出力ばLレベルとなる。しかしてコシパレータ(3
21)の出力およびアシドゲート(財)の出力にそれぞ
れH1号およびL信号としてI10ボート(6)に入力
さねる。
を検出するものであり、コンパレータ(821X322
)とアンドゲート(至)およびインバータ(33)な
どから構成されている。各コンパレータ(821X32
2 )の−万の入力には対数変換器(172)から出力
される音声入力の対数値パワーが入力されており、他方
の入力には基準値設定用電源μsからそれぞれ相異なる
基準端vHおよびVLが入力されている。ただし4!、
準値VH7d基準値Vt、よりも大きく設定されている
。し刀・して音声入力の対数値パワーが基準値VHより
も傷い場合にはコンパレータ(321)の出力がHレベ
ルになる。このときインバータ鰻の出力はLレベルにな
るので、アクトゲート(圓の出力はLレベルになる。次
に音声入力の対数値パワーが基準値VLよりも高く、か
つ基準値VHよりも低い場合には、コシJ\し−9(3
21)の出力灯Lレベル、]−Jパレータ(822)の
出力はHレベル(yなり、アシドゲート(財)の出力は
Rレベルとなる。さらに音声入力の対数値パワーが基準
直VLよりも低い場合に汀、コンパレータ(821)(
322)の出力は共にLレベルになり、アンドゲート(
圓の出力ばLレベルとなる。しかしてコシパレータ(3
21)の出力およびアシドゲート(財)の出力にそれぞ
れH1号およびL信号としてI10ボート(6)に入力
さねる。
次[t27)に加算器であり1対数変換器(171)に
よって得らするフィルタF1〜F8の出力の対数値に、
所定のバイアス1゛頁ヲ加算するものである。このバイ
アス値はD/A DンtS−夕(2))から出力さjる
ようになっテB l’)、D/A ]−)バータcJl
vcti′1t10ホード(6)からバイアス値がデジ
タルデータとして入力さねている。那算器幻の出力は差
wJ増幅器瞥に入力されて、対数変換器(172)の出
力を減算される。っしたがって差動増幅器(18)から
出力さする信号灯フィルタF1〜F8の出力f1〜f8
のデジタル値から音声入力のパワーのヂシベ1し値を減
算して振幅成分を規格化し1こ信号に所定のバイアス値
を加算した信号となる。この信号はサンプルホールド回
路(4)とA、/D Dンバータ(51f:介してデジ
タルデータに変換され、■ルホート61に入力される。
よって得らするフィルタF1〜F8の出力の対数値に、
所定のバイアス1゛頁ヲ加算するものである。このバイ
アス値はD/A DンtS−夕(2))から出力さjる
ようになっテB l’)、D/A ]−)バータcJl
vcti′1t10ホード(6)からバイアス値がデジ
タルデータとして入力さねている。那算器幻の出力は差
wJ増幅器瞥に入力されて、対数変換器(172)の出
力を減算される。っしたがって差動増幅器(18)から
出力さする信号灯フィルタF1〜F8の出力f1〜f8
のデジタル値から音声入力のパワーのヂシベ1し値を減
算して振幅成分を規格化し1こ信号に所定のバイアス値
を加算した信号となる。この信号はサンプルホールド回
路(4)とA、/D Dンバータ(51f:介してデジ
タルデータに変換され、■ルホート61に入力される。
かかるデジタルデータは各フィルタFr−Fsの出力に
ついてそれぞれ8ピツトで表現さね、このため1フレー
ム当たりの情報量は64ヒツトとなる。したがって例え
ば1秒間の音声入力に対応する情報量は1フレ一ム’1
10m5ecとすれば、6400ヒツトとなる。かかる
デジタルデータよりなる入力情報に入カバターンRAM
(91に格納されるものである。
ついてそれぞれ8ピツトで表現さね、このため1フレー
ム当たりの情報量は64ヒツトとなる。したがって例え
ば1秒間の音声入力に対応する情報量は1フレ一ム’1
10m5ecとすれば、6400ヒツトとなる。かかる
デジタルデータよりなる入力情報に入カバターンRAM
(91に格納されるものである。
ところで入力される音声のうち、/1’、//、/l/
のような破裂音や、/S/のような摩擦音、あるいIr
Vr/のような流者のパワーは、対数値で母音のA近く
に下かり、なおかつスペクトルの主要部は低音域と傷音
域とに現われるという性質がある。また母音はスペクト
ルの主要部が中音域VC集中し、かつパワーも大きいと
いう性質がある。しTこかつて、音声パワーの谷の部分
、すなわち子音の部分では低音域および高音域を強調し
た照合処理を行ない、反対に音声ノ\ワーの山の部分、
すなわち母音の部分では中音域を強肩しに照合処理を行
なうようにすね、ば、入力音声の認識精変金向上させ得
るものである。H/L 倹(8)回路町)および加算器
(@にかかる照合処理の部分的な強調を行なうrコめに
設けられたもノテあルo @ 561al (bl n
”L’J知回路(31)の創作を示すものであり、ま
ず第5図(a) id音声テータ「5enakaosa
sure jにおける対数値パワーの時間変化を示して
いる。第5図(alの対数値パワーのうち、上述のH/
L検出回路(3I)の辛準電圧VHよりも高いけ6分を
山部とし、基準′螺圧VLよりも高く基準厘王VHより
も低い部分を谷部とすれば、第5図(blに示すように
子音部分と母音部分とからなる各音節Syr〜Sys
/1いずれも「谷部十山部」の組合せで形成されている
ごとがわかる。したがってI(/L検出回路!31)か
らI10ホード(6)に入力されるH信号およびL信号
VC応じてバイアス値を切り変えれば、母音と子音との
固波数特性の差に応じた照合処理を行なうことができる
ものである。
のような破裂音や、/S/のような摩擦音、あるいIr
Vr/のような流者のパワーは、対数値で母音のA近く
に下かり、なおかつスペクトルの主要部は低音域と傷音
域とに現われるという性質がある。また母音はスペクト
ルの主要部が中音域VC集中し、かつパワーも大きいと
いう性質がある。しTこかつて、音声パワーの谷の部分
、すなわち子音の部分では低音域および高音域を強調し
た照合処理を行ない、反対に音声ノ\ワーの山の部分、
すなわち母音の部分では中音域を強肩しに照合処理を行
なうようにすね、ば、入力音声の認識精変金向上させ得
るものである。H/L 倹(8)回路町)および加算器
(@にかかる照合処理の部分的な強調を行なうrコめに
設けられたもノテあルo @ 561al (bl n
”L’J知回路(31)の創作を示すものであり、ま
ず第5図(a) id音声テータ「5enakaosa
sure jにおける対数値パワーの時間変化を示して
いる。第5図(alの対数値パワーのうち、上述のH/
L検出回路(3I)の辛準電圧VHよりも高いけ6分を
山部とし、基準′螺圧VLよりも高く基準厘王VHより
も低い部分を谷部とすれば、第5図(blに示すように
子音部分と母音部分とからなる各音節Syr〜Sys
/1いずれも「谷部十山部」の組合せで形成されている
ごとがわかる。したがってI(/L検出回路!31)か
らI10ホード(6)に入力されるH信号およびL信号
VC応じてバイアス値を切り変えれば、母音と子音との
固波数特性の差に応じた照合処理を行なうことができる
ものである。
第6喝はかかるバイアス値の切換動作を示すフしてH信
号およびL信号f:読みとり、H信号が入力されている
ときには母音部分であると判定し、マルチプレクサ(3
1がフィルタF2〜F6に棲婿されているときにけD/
A :l−1バータ(列に供給するJSイアス値を大き
くし、反対にフィルタFL、F7、あるいにFBに椿続
されているときにばLI/AコシJS−夕11匁に供給
するバイアス値?小さくするものである。
号およびL信号f:読みとり、H信号が入力されている
ときには母音部分であると判定し、マルチプレクサ(3
1がフィルタF2〜F6に棲婿されているときにけD/
A :l−1バータ(列に供給するJSイアス値を大き
くし、反対にフィルタFL、F7、あるいにFBに椿続
されているときにばLI/AコシJS−夕11匁に供給
するバイアス値?小さくするものである。
またL信号が入力されているときVC汀子音部分である
と判定し、マルチづレフ+j13)がフィルタF1%F
2、あるいはF7. FBに接続されているとき/1(
lqD/Aコシバーコン桐に供給するJSイアス値を大
きくするものであり、反対にフィルタF3〜Fe17i
′:接況さねているときにはD/A :l−)バータ@
1ノに供給されるバイアス値を小さくするものである。
と判定し、マルチづレフ+j13)がフィルタF1%F
2、あるいはF7. FBに接続されているとき/1(
lqD/Aコシバーコン桐に供給するJSイアス値を大
きくするものであり、反対にフィルタF3〜Fe17i
′:接況さねているときにはD/A :l−)バータ@
1ノに供給されるバイアス値を小さくするものである。
このようにすわば母音部分については中音域が強調され
、子音部分【ついては低音域と高音域jが強調された入
カッ\ターンが得られるものである。そしてこのように
JSイアス値によって部分的に強調された入カバターン
と照合される標準ノ\り、−ンば、入カハターシの場合
と1イ儂にバイアス値に裏ってん・公的に強調されfこ
ハ゛ターンとしておくものである。このような嘩準ハタ
ーシは噸準的に発声した場合における入力バター−Jを
標準パターンRAM (Illに成像することにより容
易に作成することができるものである。
、子音部分【ついては低音域と高音域jが強調された入
カッ\ターンが得られるものである。そしてこのように
JSイアス値によって部分的に強調された入カバターン
と照合される標準ノ\り、−ンば、入カハターシの場合
と1イ儂にバイアス値に裏ってん・公的に強調されfこ
ハ゛ターンとしておくものである。このような嘩準ハタ
ーシは噸準的に発声した場合における入力バター−Jを
標準パターンRAM (Illに成像することにより容
易に作成することができるものである。
ところで入カバターンは入力さ旧、る音声メツセージが
短いときにはサシプル数が少なくなり、反対に入力され
る音声メツセージが長いときに汀サンプル数が多くなる
。例えば音声入力が「ウニ」「ジ、り」のよう例継続時
間が0.5秒程ザの比較的短いものである場合vcは、
入力ハターシは5oサシプル程度の短いものとなり、反
対(C音声入力が「セナカヲサスレJや「カタヲ芒メ」
のまうfc継続時間が1.5秒程度の比較的長いもので
ある場合に汀、入カバターンに150サシプル程准り)
長いものとなる。1こだし1サンプルは8子’f’yネ
ル×8ピツト=64ピツトである。しかして本実施例に
おいては、短い音声メツセージに対する標準バターシの
サシづル数1/lj: 82サシづルに統一し、長い音
声メ・リセージに対する噌準バターシのサシづル敗は1
28サンプルに統一している。そ(−でサシプル数の少
ない入カパターシは32サンプルの標準パターシと照合
し、サシプル数の多い入力バター:/は128サンプル
の標準ハターンと照合するようにしている。第7図は入
カバターンのサンつル数ヲ規格化する動作を示すフロー
チセートであり、まず入力パターンのサシプル数Sが6
4サンプルまりも多いときには、入力パターシのサンプ
ル@rが128サンプルになるように規格化を行ない、
反対に入カバターンのサシプル数Sか64サシプル以下
であるときVCは、入カバターンのサンプル数が32サ
ンラル゛でなるように規格化を行なうものである。そし
てこのようにして32サンプルまたは128サンフルに
規格化された入力へターシ全、サシプル数の等しい標準
バターシと照合するものである。
短いときにはサシプル数が少なくなり、反対に入力され
る音声メツセージが長いときに汀サンプル数が多くなる
。例えば音声入力が「ウニ」「ジ、り」のよう例継続時
間が0.5秒程ザの比較的短いものである場合vcは、
入力ハターシは5oサシプル程度の短いものとなり、反
対(C音声入力が「セナカヲサスレJや「カタヲ芒メ」
のまうfc継続時間が1.5秒程度の比較的長いもので
ある場合に汀、入カバターンに150サシプル程准り)
長いものとなる。1こだし1サンプルは8子’f’yネ
ル×8ピツト=64ピツトである。しかして本実施例に
おいては、短い音声メツセージに対する標準バターシの
サシづル数1/lj: 82サシづルに統一し、長い音
声メ・リセージに対する噌準バターシのサシづル敗は1
28サンプルに統一している。そ(−でサシプル数の少
ない入カパターシは32サンプルの標準パターシと照合
し、サシプル数の多い入力バター:/は128サンプル
の標準ハターンと照合するようにしている。第7図は入
カバターンのサンつル数ヲ規格化する動作を示すフロー
チセートであり、まず入力パターンのサシプル数Sが6
4サンプルまりも多いときには、入力パターシのサンプ
ル@rが128サンプルになるように規格化を行ない、
反対に入カバターンのサシプル数Sか64サシプル以下
であるときVCは、入カバターンのサンプル数が32サ
ンラル゛でなるように規格化を行なうものである。そし
てこのようにして32サンプルまたは128サンフルに
規格化された入力へターシ全、サシプル数の等しい標準
バターシと照合するものである。
入カバターンと標準バターシとを照合する方法ごしては
、従来から広く用いられているDPマ・ソチ:/グ法や
相互相関係数を計算する方法のほか、任意の方法を用い
ることができるが、ここでは両バターフの相互羽辺係数
?計唾する方法について簡fiff説明しておく。例1
えば入カバターンの1子セシネル分のサンづル・面金x
1〜X32とし、同じチセンネルfおける象伽パターン
のサンプル!i1!全71〜732とすると、両パター
ンの1千17シネル分の相互相輸係教Rは第8同に示す
ようなアルゴリズムで簡単に計算することができる。す
なわち、まずxiおよびYi/fの各平均値xmおよび
ymヲ求めて、各xiおよびyiと平均値xmおよびy
mとの差の積(xi −xm )(yi−ym)の総和
を求める。そしてこの襦和f xmおよびymの夫々の
幾何平均で割ること例より相互相四係数R’k ’l出
することができるものである。
、従来から広く用いられているDPマ・ソチ:/グ法や
相互相関係数を計算する方法のほか、任意の方法を用い
ることができるが、ここでは両バターフの相互羽辺係数
?計唾する方法について簡fiff説明しておく。例1
えば入カバターンの1子セシネル分のサンづル・面金x
1〜X32とし、同じチセンネルfおける象伽パターン
のサンプル!i1!全71〜732とすると、両パター
ンの1千17シネル分の相互相輸係教Rは第8同に示す
ようなアルゴリズムで簡単に計算することができる。す
なわち、まずxiおよびYi/fの各平均値xmおよび
ymヲ求めて、各xiおよびyiと平均値xmおよびy
mとの差の積(xi −xm )(yi−ym)の総和
を求める。そしてこの襦和f xmおよびymの夫々の
幾何平均で割ること例より相互相四係数R’k ’l出
することができるものである。
この計課手11伯中、サンプルg!1B21.でよる除
算はレジスタ上の2進デ一タ全5回右シフトすることに
より容易に行なうことができる。しかしてか刀する相互
相関係数Ri各チ′p、:/ネル(Cついて大々計算し
て、その総和が最大である標準パターンが入カバターン
に最も近いパターンであると判定されるものである1、
このようlてして入力パターンに一番近い標準パターン
が判定されると、その標準パターンに対応する制御命令
がI10ホートロ)2介して破割a機@瞥に送出される
ようになっている。1こだし、入カバターンに1番近い
標準パターンにつLlでの頓似闇が所定の基準値を下回
っている場合や、人カッ\ターンに2:を目に近い標準
パターンにつL)での類似度との差がきわめて小さシ)
場合には被制御機器(13)に制御命令を送出せずに、
音声の再入力を促すものである。
算はレジスタ上の2進デ一タ全5回右シフトすることに
より容易に行なうことができる。しかしてか刀する相互
相関係数Ri各チ′p、:/ネル(Cついて大々計算し
て、その総和が最大である標準パターンが入カバターン
に最も近いパターンであると判定されるものである1、
このようlてして入力パターンに一番近い標準パターン
が判定されると、その標準パターンに対応する制御命令
がI10ホートロ)2介して破割a機@瞥に送出される
ようになっている。1こだし、入カバターンに1番近い
標準パターンにつLlでの頓似闇が所定の基準値を下回
っている場合や、人カッ\ターンに2:を目に近い標準
パターンにつL)での類似度との差がきわめて小さシ)
場合には被制御機器(13)に制御命令を送出せずに、
音声の再入力を促すものである。
本発明は以上のように構成されており、通過周波数帯域
の異なる複数個のフィルタにより、音声入力の周波数成
分に応じた入力バターニアを作我し、複数種の音声メツ
セー、;を標準的に発声したときに生じる各入カバター
ン全標準パターンとしてメモリに予め記憶し、入カバタ
ーンと各標準パターンと全照合して入カバターンとの類
似度が最大となる標準パターンを入力メツセージとして
識別する方式において、音声入力の大きさを検出する手
段を投けて、音声入力の小さい子音部分では音声入力の
うち低音域および高音域全検出するフィルタの出力を強
調し、音声入力の大きい母音部分で汀音声人力1′)う
ち中音域全検出するフィルタの出力?、、ψ週して入カ
ッ\ターン全作成するようにしγこものでちるから、音
声入力のうち母音の部分ヲ、識別する際′(は母音の周
波′a成分が多く分布している中音域の、特徴が強調し
て識別され、反対に子音の部分を識別する際には子音の
周波数成分が多く分布している高音域および低音域の特
徴が強調して域別されるものであり、したがって音声メ
ツセージの認識率が向上するという利点を何するもので
ある。
の異なる複数個のフィルタにより、音声入力の周波数成
分に応じた入力バターニアを作我し、複数種の音声メツ
セー、;を標準的に発声したときに生じる各入カバター
ン全標準パターンとしてメモリに予め記憶し、入カバタ
ーンと各標準パターンと全照合して入カバターンとの類
似度が最大となる標準パターンを入力メツセージとして
識別する方式において、音声入力の大きさを検出する手
段を投けて、音声入力の小さい子音部分では音声入力の
うち低音域および高音域全検出するフィルタの出力を強
調し、音声入力の大きい母音部分で汀音声人力1′)う
ち中音域全検出するフィルタの出力?、、ψ週して入カ
ッ\ターン全作成するようにしγこものでちるから、音
声入力のうち母音の部分ヲ、識別する際′(は母音の周
波′a成分が多く分布している中音域の、特徴が強調し
て識別され、反対に子音の部分を識別する際には子音の
周波数成分が多く分布している高音域および低音域の特
徴が強調して域別されるものであり、したがって音声メ
ツセージの認識率が向上するという利点を何するもので
ある。
第1図は従来例のブロック閃、第21’Jは本発明の一
実施例のづロック図、第31図は向上の要部ブロック回
路−1、第4 ’a (al −(dlおよび@5図f
ai (bl ij同上の忙作悦明図、%6図乃至第8
川に同上の動作2示すフロー千セートである。 F1〜F8はフィルタ、t9) i1人カバターごメモ
リ、11]は標準パターンメ七り、(27;は加算器、
(4))」/A〕ンバータ、4311けH/L検珊回路
である。 代理人 弁理士 石 1)長 七 16図 1i17図 手続補正書(自発) 昭和58年5月1を日 特許庁長官殿 2、発 明の名称 音声メツセージ識別方式 3、補正をする者 事件との関係 特許出願人 件 所 大阪府門真市大字門真1048番地名 称
(583)松下電工株式会社 代表者小 林 郁 4゜代理人 電話大阪(06) 345−7777 (代表)5、補
正命令の日付 自 発 訂 正 書 出願番号 特許11857−93539Jy91、
不顧明細M第1はの特許請求の範囲金欠のように訂正致
します。 [・l) 通過周波帯域の異なる複数個のフィルタによ
り、音声入力の周波ff1ff1分に応じ九人カバター
ンを作成し、複奴種の音声メツセージ全標準的に発声し
たときに生じる各入カバターンを標準パターンとしてメ
七りに予め記慣し、入カバターンと各標準JSターンと
km合して入カバターンとの類似度か最大となる標準パ
ターンを人力メツセージとして識別する方式において、
音声入力の子音部分では音声入力のうち低音域および高
音域を検出するフイ′ルタの出力ヲ強禰し、音声入力の
母音部分では音声入力のうち中音域を検出するフィルタ
の出力?強調して入カバターン?作成することを特徴と
する音声メツセージ! WIJ刀式。」2、 同上第1
5貞第15行目の1できる。」の後に次の文を挿入式し
ま丁。 il+ [また木実施例にあっては、各サンプルi+faxi1
.lは対奴変換されているので、積の代わりにΣ 和?とって・(xi+yi)によって相互相関係奴R’
z略式計算することも0T能であり、この揚台には平均
値xrnt釆める手数か1略できるものである。」 3、 同上第16貞第17行目乃至第18行目の[大き
さを・・・・・・・小さい、J’trfglJ除炊し1
丁。 4、同上第16頁第20行目の「大きい」を剛途致しま
す。 代理人 弁理士 ろ 1)長 七
実施例のづロック図、第31図は向上の要部ブロック回
路−1、第4 ’a (al −(dlおよび@5図f
ai (bl ij同上の忙作悦明図、%6図乃至第8
川に同上の動作2示すフロー千セートである。 F1〜F8はフィルタ、t9) i1人カバターごメモ
リ、11]は標準パターンメ七り、(27;は加算器、
(4))」/A〕ンバータ、4311けH/L検珊回路
である。 代理人 弁理士 石 1)長 七 16図 1i17図 手続補正書(自発) 昭和58年5月1を日 特許庁長官殿 2、発 明の名称 音声メツセージ識別方式 3、補正をする者 事件との関係 特許出願人 件 所 大阪府門真市大字門真1048番地名 称
(583)松下電工株式会社 代表者小 林 郁 4゜代理人 電話大阪(06) 345−7777 (代表)5、補
正命令の日付 自 発 訂 正 書 出願番号 特許11857−93539Jy91、
不顧明細M第1はの特許請求の範囲金欠のように訂正致
します。 [・l) 通過周波帯域の異なる複数個のフィルタによ
り、音声入力の周波ff1ff1分に応じ九人カバター
ンを作成し、複奴種の音声メツセージ全標準的に発声し
たときに生じる各入カバターンを標準パターンとしてメ
七りに予め記慣し、入カバターンと各標準JSターンと
km合して入カバターンとの類似度か最大となる標準パ
ターンを人力メツセージとして識別する方式において、
音声入力の子音部分では音声入力のうち低音域および高
音域を検出するフイ′ルタの出力ヲ強禰し、音声入力の
母音部分では音声入力のうち中音域を検出するフィルタ
の出力?強調して入カバターン?作成することを特徴と
する音声メツセージ! WIJ刀式。」2、 同上第1
5貞第15行目の1できる。」の後に次の文を挿入式し
ま丁。 il+ [また木実施例にあっては、各サンプルi+faxi1
.lは対奴変換されているので、積の代わりにΣ 和?とって・(xi+yi)によって相互相関係奴R’
z略式計算することも0T能であり、この揚台には平均
値xrnt釆める手数か1略できるものである。」 3、 同上第16貞第17行目乃至第18行目の[大き
さを・・・・・・・小さい、J’trfglJ除炊し1
丁。 4、同上第16頁第20行目の「大きい」を剛途致しま
す。 代理人 弁理士 ろ 1)長 七
Claims (1)
- (11通過周波数帯域の異なる複数個のフィルタにより
、音声入力の周波数成分に応じた入力バター:/全作成
し、複を種の音声メツセージを標準的に発声したときに
生じる各入力パターンを標準パターンとしてメモリに予
め記憶し、入カハターシと各標準パターンとを照合して
入カバターンとの類似便が最大となる標準パターンを入
力メツセージとして識別する方式において、音声入力の
大きさを検出する手段を設けて、音声入力の小さい子音
部分では音声入力のうち低音域および高音域を検出する
フィルタの出力を強調し、音声入力の大きい母音部分で
は音声入力のうち中音域全演出するフィルタの出力を強
調して入カバターンを作成することを特徴とする音声メ
ツセージ識別方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9353982A JPS58209799A (ja) | 1982-05-31 | 1982-05-31 | 音声メツセ−ジ識別方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9353982A JPS58209799A (ja) | 1982-05-31 | 1982-05-31 | 音声メツセ−ジ識別方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58209799A true JPS58209799A (ja) | 1983-12-06 |
Family
ID=14085073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9353982A Pending JPS58209799A (ja) | 1982-05-31 | 1982-05-31 | 音声メツセ−ジ識別方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58209799A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60121394U (ja) * | 1984-01-25 | 1985-08-16 | パイオニア株式会社 | 音響効果装置 |
JPH01130200U (ja) * | 1988-02-29 | 1989-09-05 |
-
1982
- 1982-05-31 JP JP9353982A patent/JPS58209799A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60121394U (ja) * | 1984-01-25 | 1985-08-16 | パイオニア株式会社 | 音響効果装置 |
JPH01130200U (ja) * | 1988-02-29 | 1989-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4181813A (en) | System and method for speech recognition | |
US4284846A (en) | System and method for sound recognition | |
Dautrich et al. | On the effects of varying filter bank parameters on isolated word recognition | |
KR910002198B1 (ko) | 음성인식방법과 그 장치 | |
JPS58134698A (ja) | 音声認識方法および装置 | |
JPS58134700A (ja) | 連続音声認識の改良 | |
JPS58102299A (ja) | 部分単位音声パタン発生装置 | |
Fry et al. | The solution of some fundamental problems in mechanical speech recognition | |
JPH0312319B2 (ja) | ||
Chaurasiya | Time-frequency representations: Spectrogram, cochleogram and correlogram | |
JPS58209799A (ja) | 音声メツセ−ジ識別方式 | |
CN116110370A (zh) | 基于人机语音交互的语音合成系统及相关设备 | |
CN114420100B (zh) | 语音检测方法及装置、电子设备及存储介质 | |
EP3718107B1 (en) | Speech signal processing and evaluation | |
Elbaz et al. | End to end deep neural network frequency demodulation of speech signals | |
JPS6120880B2 (ja) | ||
MacKinnon et al. | Realtime recognition of unvoiced fricatives in continuous speech to aid the deaf | |
CN117672261A (zh) | 一种音频处理方法、装置、设备及介质 | |
Gazdag | A method of decoding speech | |
Baker et al. | Cost-effective speech processing | |
CN115129923A (zh) | 语音搜索方法、设备及存储介质 | |
JPS58209795A (ja) | 音声メツセ−ジ識別方式 | |
JPS5888797A (ja) | 音声認識装置 | |
Holmes et al. | Applications of very-low-cost small vocabulary connected word recognition | |
JPH06324696A (ja) | 音声認識装置及び方法 |