JPS58209795A - 音声メツセ−ジ識別方式 - Google Patents
音声メツセ−ジ識別方式Info
- Publication number
- JPS58209795A JPS58209795A JP9353582A JP9353582A JPS58209795A JP S58209795 A JPS58209795 A JP S58209795A JP 9353582 A JP9353582 A JP 9353582A JP 9353582 A JP9353582 A JP 9353582A JP S58209795 A JPS58209795 A JP S58209795A
- Authority
- JP
- Japan
- Prior art keywords
- input
- pattern
- output
- filter
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
未発明は′磁子機器を音声メツセージによって操作する
ための音声メツセージ識別方式に関するものである。
ための音声メツセージ識別方式に関するものである。
%1図は従来の一般的な音声メツセージ識別装置の概略
構成を示すものである□!1図の構成において、入力音
声はマイクfilにより電気信号に変換され、づリアー
7 j 121を経てフィルタF1〜Fmにより各同波
数夜分に分解される。各フィルタF、〜F8は8チャン
ネル分のバンドパスフィルタと整流回路およ、び平均化
回路で構成されており、100Hz乃至10KHzの周
波数領域を対数目盛上で8等分した各帯域FBI〜FB
8の平均化された出力f1〜f8が得られるようになっ
ている。各出力f、−f。
構成を示すものである□!1図の構成において、入力音
声はマイクfilにより電気信号に変換され、づリアー
7 j 121を経てフィルタF1〜Fmにより各同波
数夜分に分解される。各フィルタF、〜F8は8チャン
ネル分のバンドパスフィルタと整流回路およ、び平均化
回路で構成されており、100Hz乃至10KHzの周
波数領域を対数目盛上で8等分した各帯域FBI〜FB
8の平均化された出力f1〜f8が得られるようになっ
ている。各出力f、−f。
はマルチづレクサ13)とサシプルホールド回路(4)
とを介して順次A/Dコンバータ16)により8ピツト
のデジタル値に変換され、I10ポート161とマイコ
ンパス(7)とを通ってCP U i81に読み込まれ
る。音声の分析フレームは約10 mgI!eであり、
各分析フレーム毎に8チャンネル分のフィルタ出力f1
〜f、がA/+)変沖されるので、1フレームあたり6
4ピツトの情報量(でなる。したがって例えば1秒間の
音声入力に対応する清報遣は6400ピツトになり、こ
の情罐社人カバターニアRAM’91に格納さhるもの
である。・lotは音声メツセージの始端と終端とを横
用する始端終端検知回路である。またIl+ !/′i
標隼バターJ−RAMであり、入力バター〕・と照合す
るための1−・rパターンが予め複数f固登録されてい
るものである。IZ/ま入カバターンε傅叙個の標準パ
ターンと一合して入カバターンに鏝も近い俸準ノ\ター
ンを判定するための照り寅昧回路である。照合−曝回路
’+21により人カバターンがどの標準パターンlに一
致するかが判定されると、そのゆ植パターンに対応する
制御命令がI10ポート(61を介して坂制御機器13
1に透出されるようになっている。
とを介して順次A/Dコンバータ16)により8ピツト
のデジタル値に変換され、I10ポート161とマイコ
ンパス(7)とを通ってCP U i81に読み込まれ
る。音声の分析フレームは約10 mgI!eであり、
各分析フレーム毎に8チャンネル分のフィルタ出力f1
〜f、がA/+)変沖されるので、1フレームあたり6
4ピツトの情報量(でなる。したがって例えば1秒間の
音声入力に対応する清報遣は6400ピツトになり、こ
の情罐社人カバターニアRAM’91に格納さhるもの
である。・lotは音声メツセージの始端と終端とを横
用する始端終端検知回路である。またIl+ !/′i
標隼バターJ−RAMであり、入力バター〕・と照合す
るための1−・rパターンが予め複数f固登録されてい
るものである。IZ/ま入カバターンε傅叙個の標準パ
ターンと一合して入カバターンに鏝も近い俸準ノ\ター
ンを判定するための照り寅昧回路である。照合−曝回路
’+21により人カバターンがどの標準パターンlに一
致するかが判定されると、そのゆ植パターンに対応する
制御命令がI10ポート(61を介して坂制御機器13
1に透出されるようになっている。
なお(14I′/′iづOグラムROM1.16I′r
iワ一+シクRAM、+lfQば慄咋パネルであるう ぐころでη工つする従来例IVcおtハてけ、入力1\
ターンと標準パターンとを照合するための力士として両
パターンの相互相関係数を計算する方法や、あるいr1
問知のDrマ・リチンタ法などが用いられているが、こ
れらの方法はいすhも入力バター:/を陣間軸上で正規
化する必要があり、この正規化処理のために演算時間が
長くかかり、音声メツセージの認識速度が遅くなるとい
う問題があった・またかかる時間軸上の正規化処理を省
略した場合には、発声者の発声速度の変化によって入カ
バターンの長さが変化するために標準パターンとの照合
処理をうまく行なうことができず、音声メ・ソで−ジの
認識率が低下するという問題かあった。
iワ一+シクRAM、+lfQば慄咋パネルであるう ぐころでη工つする従来例IVcおtハてけ、入力1\
ターンと標準パターンとを照合するための力士として両
パターンの相互相関係数を計算する方法や、あるいr1
問知のDrマ・リチンタ法などが用いられているが、こ
れらの方法はいすhも入力バター:/を陣間軸上で正規
化する必要があり、この正規化処理のために演算時間が
長くかかり、音声メツセージの認識速度が遅くなるとい
う問題があった・またかかる時間軸上の正規化処理を省
略した場合には、発声者の発声速度の変化によって入カ
バターンの長さが変化するために標準パターンとの照合
処理をうまく行なうことができず、音声メ・ソで−ジの
認識率が低下するという問題かあった。
木見明は従来例のこのような問題点を解決するために為
されたものであり、入カバターンの時曲軸上の正規化処
理を省略して演算時間を短縮し、しかも認識率を充分に
高くすることができるようにした音声メ・ソセージ識別
方式を提供することを目的とするものである。
されたものであり、入カバターンの時曲軸上の正規化処
理を省略して演算時間を短縮し、しかも認識率を充分に
高くすることができるようにした音声メ・ソセージ識別
方式を提供することを目的とするものである。
第2図は未発明の一実施例の全体構成を示すものであり
、′@3図は向上の要部ブロック図を示している。入力
音声はマイク(1)に−より電気信号に変換さね−プリ
アンプ、!+を経てフィルタF1〜F8により各洲波数
成分(C分解される。各フィルタF0〜F。
、′@3図は向上の要部ブロック図を示している。入力
音声はマイク(1)に−より電気信号に変換さね−プリ
アンプ、!+を経てフィルタF1〜F8により各洲波数
成分(C分解される。各フィルタF0〜F。
の出力はマルチづレクサ(31)(32)を介して対数
【換器(1”b)(17□〕に入力されるものである。
【換器(1”b)(17□〕に入力されるものである。
対数変換4(1′ハ) (172)けフイ1し夕Fl−
Faの出力を人間の耳の特性に合致した対数特性に変換
するものである。:18け対ば変換器(17l)と(1
71との出力の差を検出するための差動増幅器であり、
マル・チプレクサ(31)(3x)の切換によって順次
フィルタF1とF@−ト、とF3、F4とF5、および
F6とF7の対数変換された出力の差、すなわちフィル
タ出力のパワーの比を検出すBようになっている〇 各フィルターF、〜F8の通過筒波数帯域は第1図従来
例の一合と汀異すっている。まずフィルタF。
Faの出力を人間の耳の特性に合致した対数特性に変換
するものである。:18け対ば変換器(17l)と(1
71との出力の差を検出するための差動増幅器であり、
マル・チプレクサ(31)(3x)の切換によって順次
フィルタF1とF@−ト、とF3、F4とF5、および
F6とF7の対数変換された出力の差、すなわちフィル
タ出力のパワーの比を検出すBようになっている〇 各フィルターF、〜F8の通過筒波数帯域は第1図従来
例の一合と汀異すっている。まずフィルタF。
とF8とけ有声音と無声音とを識別するためのものであ
り、フィルタF!は有声音のスペクトルが多く分布する
0〜1KHzの低局波成分を抽出し、フィルタF1は無
声音のスペクトもが寥く分布する5〜10KH2の高同
波成分を抽出するようになっている0次にフィルタト2
とF3とは有声音のうち、顎の開きの広い有声音(例え
ば/a/の音)と顎の開きの狭い有声音(例えば/1/
の音)とを識別するためのものであり、フィルタF!は
顎の開きの広い有声音のスペクトルが多く分布するθ〜
500Hzの同波数成分を抽出し、フィルタFsri顎
の開きの狭い有声音のスペクトルが多く分布する500
Hz〜IKH,の周波数成分を抽出するようになってい
る。
り、フィルタF!は有声音のスペクトルが多く分布する
0〜1KHzの低局波成分を抽出し、フィルタF1は無
声音のスペクトもが寥く分布する5〜10KH2の高同
波成分を抽出するようになっている0次にフィルタト2
とF3とは有声音のうち、顎の開きの広い有声音(例え
ば/a/の音)と顎の開きの狭い有声音(例えば/1/
の音)とを識別するためのものであり、フィルタF!は
顎の開きの広い有声音のスペクトルが多く分布するθ〜
500Hzの同波数成分を抽出し、フィルタFsri顎
の開きの狭い有声音のスペクトルが多く分布する500
Hz〜IKH,の周波数成分を抽出するようになってい
る。
またフィルタF4とFiとは、同じく有声音のうち、高
舌の有声音(/U/、10/など)と前古の有声音(/
i/、/−/など)とを識別するためのものであり、フ
ィルタF4は高舌の有声音のスペクトルが多く分布する
0、8〜1.8KHzの同波数成分を抽出し、フィルタ
Fld前古の有声音のスペクトルが多く分布する1、8
〜3.2 K Hzの同波数成分を抽出するようになっ
ている。さらにフィルタFlと−F−tとは、無声音の
うち比較的高目波成分の多いものと、比較的高目波成分
の多いものとを識別するためのものであり、フィル漬F
藝は4〜6.3 K Hzの同波数成分を抽出し、フィ
ルタF7ば6.3〜10KHzの同波数成分を抽出する
ようになっている。
舌の有声音(/U/、10/など)と前古の有声音(/
i/、/−/など)とを識別するためのものであり、フ
ィルタF4は高舌の有声音のスペクトルが多く分布する
0、8〜1.8KHzの同波数成分を抽出し、フィルタ
Fld前古の有声音のスペクトルが多く分布する1、8
〜3.2 K Hzの同波数成分を抽出するようになっ
ている。さらにフィルタFlと−F−tとは、無声音の
うち比較的高目波成分の多いものと、比較的高目波成分
の多いものとを識別するためのものであり、フィル漬F
藝は4〜6.3 K Hzの同波数成分を抽出し、フィ
ルタF7ば6.3〜10KHzの同波数成分を抽出する
ようになっている。
次にフィルタF、ばO〜10KHzの周波数成分を抽出
して入力音声の全体的なパワーfr:検出するものであ
り、このフィルタF9の出力は対数変換器(17s)に
よって人間の耳の特性に合致した対数出力に変換されて
、始端終端検知回路(lαとセレクタ回路舖に入力され
る。始端終端検知回路11αは@3図に示すように一対
のR5Tフリップフロッづ(201) (20t)と、
りO’Jクバルス発生用の発振器−と、この発振器t2
1)から出力されるり0ツクノ\ルスをカウントするオ
フカウンタ(22+)およびオフカウンタ(22x)と
、入力信号しベルを所定の基準値と比較するコンパレー
タ(23Iと、その他の論理ゲートとによって構成され
ている。対数変(II器07s)から出力される入力音
声の対数値パワーはコンパレータ困に入力されて所定の
基準値と比較される。そして第4図(alに示すように
入力音声の対数値パワーが所定の基準値よりも大きい場
合には、@4図fblに示すようにコシパレータ(23
1の出力がHレベルとなり、音声オン信号がI10ホー
ド(61に入力される。しがしてコンパレータ(23I
の出力がHレベルになると、アンドゲート(241)を
介して発振器−のり0・ツク時間経過してオンカウンタ
(22+)がカウント可能ウすると、オン用のフリッづ
フロップ(20,)がセットされる。これによってオア
ゲート(25+)を介してオンカラン4(22□)かり
ピットされるから、I10ホード;61には44図(c
lに示すような始41g号が入力される。またオンカウ
ンタ(221)の出力によってオフ用のフリ・ソフフ0
ツづ(2Qz)がリセ・ソトされるので、フリツウフロ
ップ(2U*)がらオアゲート(ZSt)に入力される
信号V′iLレベルになる。次に入力音声か小さくなる
と、コシパレータ(231の出力、dLレベルになる。
して入力音声の全体的なパワーfr:検出するものであ
り、このフィルタF9の出力は対数変換器(17s)に
よって人間の耳の特性に合致した対数出力に変換されて
、始端終端検知回路(lαとセレクタ回路舖に入力され
る。始端終端検知回路11αは@3図に示すように一対
のR5Tフリップフロッづ(201) (20t)と、
りO’Jクバルス発生用の発振器−と、この発振器t2
1)から出力されるり0ツクノ\ルスをカウントするオ
フカウンタ(22+)およびオフカウンタ(22x)と
、入力信号しベルを所定の基準値と比較するコンパレー
タ(23Iと、その他の論理ゲートとによって構成され
ている。対数変(II器07s)から出力される入力音
声の対数値パワーはコンパレータ困に入力されて所定の
基準値と比較される。そして第4図(alに示すように
入力音声の対数値パワーが所定の基準値よりも大きい場
合には、@4図fblに示すようにコシパレータ(23
1の出力がHレベルとなり、音声オン信号がI10ホー
ド(61に入力される。しがしてコンパレータ(23I
の出力がHレベルになると、アンドゲート(241)を
介して発振器−のり0・ツク時間経過してオンカウンタ
(22+)がカウント可能ウすると、オン用のフリッづ
フロップ(20,)がセットされる。これによってオア
ゲート(25+)を介してオンカラン4(22□)かり
ピットされるから、I10ホード;61には44図(c
lに示すような始41g号が入力される。またオンカウ
ンタ(221)の出力によってオフ用のフリ・ソフフ0
ツづ(2Qz)がリセ・ソトされるので、フリツウフロ
ップ(2U*)がらオアゲート(ZSt)に入力される
信号V′iLレベルになる。次に入力音声か小さくなる
と、コシパレータ(231の出力、dLレベルになる。
こ!1によってオアヶーh (25x−)の両入力は共
にLレベルになる〃)ら−オンカランi (22t)の
りt゛ソト解除されてカウント動作を開始し得る状態と
なる0またこのときインバータ悠の出力!″iHiHレ
ベルので、アンドゲート(24x)を介してオフカウン
タ(22z)に発振器−からのクロツクバLスが入力さ
れる。一定時間経過してオフカウンタ(22z)がカウ
シトア・ツブすると、オフ用フリッづフロップ(20t
)がE・ソトされる。こhcてよってオフカウンタ(2
2鵞)はオアケート(25,)と介してフリ・ブつフロ
・ソづ(20*)の出力によってリセ・リドされるから
、I10ホード18)には第4図(diに示すような終
端信号が入力されるものである。またオフカウンタ(2
2*)の出力によってオン用フリップフロップ(201
)がリセットされるから、再びオンカウンタ(22+)
がカウント可能な状態となる。J2tド同様の動作?操
り返して音声メツセージが入力される度毎に始端浦号と
終端信号がI10ボートillに入力されるようになっ
ているものである。
にLレベルになる〃)ら−オンカランi (22t)の
りt゛ソト解除されてカウント動作を開始し得る状態と
なる0またこのときインバータ悠の出力!″iHiHレ
ベルので、アンドゲート(24x)を介してオフカウン
タ(22z)に発振器−からのクロツクバLスが入力さ
れる。一定時間経過してオフカウンタ(22z)がカウ
シトア・ツブすると、オフ用フリッづフロップ(20t
)がE・ソトされる。こhcてよってオフカウンタ(2
2鵞)はオアケート(25,)と介してフリ・ブつフロ
・ソづ(20*)の出力によってリセ・リドされるから
、I10ホード18)には第4図(diに示すような終
端信号が入力されるものである。またオフカウンタ(2
2*)の出力によってオン用フリップフロップ(201
)がリセットされるから、再びオンカウンタ(22+)
がカウント可能な状態となる。J2tド同様の動作?操
り返して音声メツセージが入力される度毎に始端浦号と
終端信号がI10ボートillに入力されるようになっ
ているものである。
次に171に加算器であり、差動増幅器・181によっ
て得られるフィルタ出力の対数値の差信号に、所定のバ
イアス値を加算するものである。このバイアス儲はセレ
クタ回路廁によって選択されるようになっている。セレ
クタ回路19)は基準値設定用電源281を有しており
、この處源晋からバイアスせレクタa[8通りの基準電
圧を供給している。バイアスセレクタ鴎はアナロジスイ
ッチにより構成されており、I10ボート引から出力さ
れるバイアス設定信号に応じて8通りの基a電圧のうち
4通りの基準電圧を選択してH/Lセレクタ(30)に
供給する。
て得られるフィルタ出力の対数値の差信号に、所定のバ
イアス値を加算するものである。このバイアス儲はセレ
クタ回路廁によって選択されるようになっている。セレ
クタ回路19)は基準値設定用電源281を有しており
、この處源晋からバイアスせレクタa[8通りの基準電
圧を供給している。バイアスセレクタ鴎はアナロジスイ
ッチにより構成されており、I10ボート引から出力さ
れるバイアス設定信号に応じて8通りの基a電圧のうち
4通りの基準電圧を選択してH/Lセレクタ(30)に
供給する。
)f/L tレクタ■は入力音声のパワーが大きい場合
と小さい場合とに応じて、4通りの基準電圧のうち2通
りの基準電圧を選択するものであり、アナ0ジスイツチ
によって構成されている。このH/Lセしフタ渕には、
H/L検出回路(31)が接続されているつH/L検出
回路(311r1入力音声のパワーの大小を検出するも
のであり、コンパレータ(321H32□)とアンドゲ
ート例およびインバータ器から構成されている。各コシ
パレータ(32,)(32i)の一方の入力には対数変
換器(17g)から出力さhる音声入力の対数値パワー
が入力されており、他方の入力には基準値設定用電源(
至)からそれぞれ相異なる基準値VHおよびVLが入力
されている。ただし基準値vHは基準値VLよりも大き
く設定されている。しかして音声入力の対数値JT1つ
−が基準値VFIよ吟も高い場合にはコンパレータ(3
2+)の出力がHL/ベルになる。このときインバータ
淵の出力はLレベルになるので、アンドゲート例の出力
はLレベルになる。次にg重入力の#数頓へワーが基幅
値vLよりも高く、かつ基醇1直vHよりも−1,−1
場合にはコンパレータC32s)の出力はLレベル、]
コンパレータ322)の出力はHレベルになり、アシド
ゲート例の出力はHしベルとなる。さらに音声入力の対
数1直ハワーが基準値VLよりも低い場合には、コシパ
レータ(32+)(32*)の出力に共にLレベルにな
り、アンドケート、例の出力はLレベルとなる。
と小さい場合とに応じて、4通りの基準電圧のうち2通
りの基準電圧を選択するものであり、アナ0ジスイツチ
によって構成されている。このH/Lセしフタ渕には、
H/L検出回路(31)が接続されているつH/L検出
回路(311r1入力音声のパワーの大小を検出するも
のであり、コンパレータ(321H32□)とアンドゲ
ート例およびインバータ器から構成されている。各コシ
パレータ(32,)(32i)の一方の入力には対数変
換器(17g)から出力さhる音声入力の対数値パワー
が入力されており、他方の入力には基準値設定用電源(
至)からそれぞれ相異なる基準値VHおよびVLが入力
されている。ただし基準値vHは基準値VLよりも大き
く設定されている。しかして音声入力の対数値JT1つ
−が基準値VFIよ吟も高い場合にはコンパレータ(3
2+)の出力がHL/ベルになる。このときインバータ
淵の出力はLレベルになるので、アンドゲート例の出力
はLレベルになる。次にg重入力の#数頓へワーが基幅
値vLよりも高く、かつ基醇1直vHよりも−1,−1
場合にはコンパレータC32s)の出力はLレベル、]
コンパレータ322)の出力はHレベルになり、アシド
ゲート例の出力はHしベルとなる。さらに音声入力の対
数1直ハワーが基準値VLよりも低い場合には、コシパ
レータ(32+)(32*)の出力に共にLレベルにな
り、アンドケート、例の出力はLレベルとなる。
し刀、してコンパレータ(321)の出力およびアシド
ゲート例の出力はそれぞれH信号およびL信号としてH
/Lセレクタ隔Oで入力きれると共に、I10ホード(
6)に入力される、次に[(/L Eレクタ:瑚から出
力芒ハる2通りの礒準電圧は、正負℃レクタ脇に入力さ
れ、正負セレクタ(至)はコ−J)\レータ□1圀の出
力に応じていずれか一方の基準電圧を加算器圀に供給す
る。コシパレータ瀾の一方の入力は接地されており、他
方の入力には差i#I増幅器(I81から出力される差
信号が入力されているものであり、上記差1j8が正で
あるか負であるかを判定しているものであろう かかるセレクタ回路(l傷において選択されたバイアス
値は加算器−において、差動増幅器σ&の出力に加算さ
れる。加算器+271の出力にサシプルホールド回路(
41とA/Dコシバーダ+51を介してデジタルデータ
に変換され、I10ボート・61に入力される。かかる
デジタルデータはl対のフィルタF1とFs、FzとF
s、F4とFsおよびトロとFvの出力の差信号につい
てそ九ぞれ8ピツトで表現され、このため1フレーム当
たりの情報量は32ピツトとなる。したがって例えば1
秒間の音声入力に対応する情報量は1フレーム′t−1
0m5eとすれば、3200 ピットとなる。かかるデ
ジタルデータよりなる入力情報は入力バター>RAM!
91に格納されるものである。
ゲート例の出力はそれぞれH信号およびL信号としてH
/Lセレクタ隔Oで入力きれると共に、I10ホード(
6)に入力される、次に[(/L Eレクタ:瑚から出
力芒ハる2通りの礒準電圧は、正負℃レクタ脇に入力さ
れ、正負セレクタ(至)はコ−J)\レータ□1圀の出
力に応じていずれか一方の基準電圧を加算器圀に供給す
る。コシパレータ瀾の一方の入力は接地されており、他
方の入力には差i#I増幅器(I81から出力される差
信号が入力されているものであり、上記差1j8が正で
あるか負であるかを判定しているものであろう かかるセレクタ回路(l傷において選択されたバイアス
値は加算器−において、差動増幅器σ&の出力に加算さ
れる。加算器+271の出力にサシプルホールド回路(
41とA/Dコシバーダ+51を介してデジタルデータ
に変換され、I10ボート・61に入力される。かかる
デジタルデータはl対のフィルタF1とFs、FzとF
s、F4とFsおよびトロとFvの出力の差信号につい
てそ九ぞれ8ピツトで表現され、このため1フレーム当
たりの情報量は32ピツトとなる。したがって例えば1
秒間の音声入力に対応する情報量は1フレーム′t−1
0m5eとすれば、3200 ピットとなる。かかるデ
ジタルデータよりなる入力情報は入力バター>RAM!
91に格納されるものである。
ところで未発明に幇いては、入力パターンと標準パター
ンとの照合を音節単位に行なっており、したがって入力
パターンもまた音節単位に区切られて入力バターy R
A M 191に記憶されるものである。第5図1al
(blは本発明に詔ける音節の識別方法を示すもので
あり、まず第5図(alは音声データ「Sθnakao
8a8urs J における対数値パワーの時間変化
を示している。第5図1alの対数値パワーのうち、と
述のH/ L a大小回路−3□5の基鴻緘圧V、より
も1伍い部分を山部とし、基準電圧VLよりも高く基準
電圧″vHよりも低い品分を谷部とす九ば、45図(b
lに示すように各音節Sy+〜Sys ′riいずれも
「谷部本山部」の組合せで杉我されていることがわかる
。本発明においてはこの性質を利用して音節を識別して
いるものであり、f(/L検出回路St+からI10ネ
ート6)に入力されるH11号およびL信号を検出して
音節の区切りを識別し、各音jiO5y+〜Sysに対
応する入カバ・λ−パ、〜P6士入カムターーJRAM
:9iに格納しているものである。また標準パターンR
A M +Illシでは、旨節毎VC区切った標準バタ
ーニアQ、〜Q、が記憶さnてあり、各音節Sv1〜5
75毎に個別に入カパーーンr1〜P、と焦合さhるも
のである。
ンとの照合を音節単位に行なっており、したがって入力
パターンもまた音節単位に区切られて入力バターy R
A M 191に記憶されるものである。第5図1al
(blは本発明に詔ける音節の識別方法を示すもので
あり、まず第5図(alは音声データ「Sθnakao
8a8urs J における対数値パワーの時間変化
を示している。第5図1alの対数値パワーのうち、と
述のH/ L a大小回路−3□5の基鴻緘圧V、より
も1伍い部分を山部とし、基準電圧VLよりも高く基準
電圧″vHよりも低い品分を谷部とす九ば、45図(b
lに示すように各音節Sy+〜Sys ′riいずれも
「谷部本山部」の組合せで杉我されていることがわかる
。本発明においてはこの性質を利用して音節を識別して
いるものであり、f(/L検出回路St+からI10ネ
ート6)に入力されるH11号およびL信号を検出して
音節の区切りを識別し、各音jiO5y+〜Sysに対
応する入カバ・λ−パ、〜P6士入カムターーJRAM
:9iに格納しているものである。また標準パターンR
A M +Illシでは、旨節毎VC区切った標準バタ
ーニアQ、〜Q、が記憶さnてあり、各音節Sv1〜5
75毎に個別に入カパーーンr1〜P、と焦合さhるも
のである。
ところで、入カバターンP1〜Ps’d発声者の発声速
度が早いときには長さが急くなり、反対に発声速度が通
いとさして汀長さが長くなる。そこで本発明Vこお・A
て)まも6図のフD−チセートに示すように、人力パタ
ーンP1(1=1〜5)の長さと標準パターンQi(1
=1〜5〕の長さとを比較して、長い方のパターンの後
端の超過部分を切り捨てるようにしている。このように
すれば両バターシの長さが等しくなるから照合処理が容
易になるものである。またパターンの後端の部分は音節
の後111i11部、すなわち定常的な母音の後4部分
に対応しているので、少々切り捨てても照合処理に支障
を来たすことはないものである。つまり未発明の照合方
式を用いれば、音節の前111m1mに位置する過渡的
な子音の部分と、音節の中間部に位置する定常的な母音
の前端部分とは必ず照合されるので充分正確に照合処理
を行なうことができるものである。
度が早いときには長さが急くなり、反対に発声速度が通
いとさして汀長さが長くなる。そこで本発明Vこお・A
て)まも6図のフD−チセートに示すように、人力パタ
ーンP1(1=1〜5)の長さと標準パターンQi(1
=1〜5〕の長さとを比較して、長い方のパターンの後
端の超過部分を切り捨てるようにしている。このように
すれば両バターシの長さが等しくなるから照合処理が容
易になるものである。またパターンの後端の部分は音節
の後111i11部、すなわち定常的な母音の後4部分
に対応しているので、少々切り捨てても照合処理に支障
を来たすことはないものである。つまり未発明の照合方
式を用いれば、音節の前111m1mに位置する過渡的
な子音の部分と、音節の中間部に位置する定常的な母音
の前端部分とは必ず照合されるので充分正確に照合処理
を行なうことができるものである。
次に第7図は各音節ごとの入カバターンP1と標準バタ
ー:JQlとを照合するための方法を示すフロー子ヤー
トである。各バターシP、勿よびQiがそれぞれN個の
フレームから構成されているものとすると、48 n
フL/−ム(n=1.2、・−・−1N )におけるバ
ター:/P1. ChO値は8ピツトのデジタルデータ
で表わされる−127から+128 までの256通り
の値をとり得るものである。しかして第nフレームにお
ける入力バター:/ Piの値をX、標準バター”i
Qlの値をyとすると、第7図フローチャートの左欄に
示すようなアルゴリズムにより評価値Hが計算されるも
のである。まず値x、yが共に0であるときには、評価
値Hが正の数αだけ増加する。また値X、yのうちいず
れか一方のみが0であるときには評価値Hは変化しない
0次に値x、yが共に正であるとき、または共に負であ
るときには評価値Hは(x+y )だけ増加する。さら
に値x−yのうちいずれか一方が正であり他方が負であ
るときには評価値Hは(x+y)だけ減少する。かかる
評価値Hの計算はフレームの番号nが1からNに至るま
でN回繰り返されるものであり、最終的な評価値Hを累
積計算回数Nで割った値が大きいものほどパターンが類
似すると判定されるものである。このようにして入力パ
ターンに一番近い標準パターンが判定されると、その標
準パターンに対応する制御命令がI10ポート(6)を
介して被制御機器0国に送出されるようになっている。
ー:JQlとを照合するための方法を示すフロー子ヤー
トである。各バターシP、勿よびQiがそれぞれN個の
フレームから構成されているものとすると、48 n
フL/−ム(n=1.2、・−・−1N )におけるバ
ター:/P1. ChO値は8ピツトのデジタルデータ
で表わされる−127から+128 までの256通り
の値をとり得るものである。しかして第nフレームにお
ける入力バター:/ Piの値をX、標準バター”i
Qlの値をyとすると、第7図フローチャートの左欄に
示すようなアルゴリズムにより評価値Hが計算されるも
のである。まず値x、yが共に0であるときには、評価
値Hが正の数αだけ増加する。また値X、yのうちいず
れか一方のみが0であるときには評価値Hは変化しない
0次に値x、yが共に正であるとき、または共に負であ
るときには評価値Hは(x+y )だけ増加する。さら
に値x−yのうちいずれか一方が正であり他方が負であ
るときには評価値Hは(x+y)だけ減少する。かかる
評価値Hの計算はフレームの番号nが1からNに至るま
でN回繰り返されるものであり、最終的な評価値Hを累
積計算回数Nで割った値が大きいものほどパターンが類
似すると判定されるものである。このようにして入力パ
ターンに一番近い標準パターンが判定されると、その標
準パターンに対応する制御命令がI10ポート(6)を
介して被制御機器0国に送出されるようになっている。
ただし入力パターンに1番近い標準パターンにつぃての
類似度が所定の基準値を下回っている場合や、入カバタ
ーンに2番目に近い標準パターンについての類似度との
差がきわめて小さい場合には破割−機器Iに制御命令を
送出せずに、音声の再入力を促すものである。なお標準
パターンの数が特に多い場合には、音節の数や全フレー
ム数が入カバターンに比較的近いものから数個の候補者
を選んで、その候補者についてのみ照合を行なうように
すれば照合速度の向上を図るこ、とができるものである
、 ところで入力される音声のうち、/に/、/1/のよう
な破裂音や、/S/ のような摩擦音、あるの’Id
/r/のような流雪のパワーは、対数値で母音の1/2
近くに下がり、なおかつスペクトルの主要部は低音域と
高音域とに現われるという性質がある。また母音はスペ
クトルの主要部が中音域に集中し、かつパワーも大きい
という性質がある。したがって、音声パワーの谷の部分
、すなわち音節の前半の部分では低音域および高音域を
強調した照合処理を行ない、反対に音声パワーの山の部
分、すなわち音節の後半の部分では中音域を強調した照
合処理を行なうようにすれば、入力音声の認識精度を向
上させ得るものである。セレクタ回路、19)および加
算器(9)はかかる照合処理の部分的な強調を行なうた
めに設けられたものである。1%8図はセレクタ回路(
19)と加算器ばの動作を示すフローチャートである。
類似度が所定の基準値を下回っている場合や、入カバタ
ーンに2番目に近い標準パターンについての類似度との
差がきわめて小さい場合には破割−機器Iに制御命令を
送出せずに、音声の再入力を促すものである。なお標準
パターンの数が特に多い場合には、音節の数や全フレー
ム数が入カバターンに比較的近いものから数個の候補者
を選んで、その候補者についてのみ照合を行なうように
すれば照合速度の向上を図るこ、とができるものである
、 ところで入力される音声のうち、/に/、/1/のよう
な破裂音や、/S/ のような摩擦音、あるの’Id
/r/のような流雪のパワーは、対数値で母音の1/2
近くに下がり、なおかつスペクトルの主要部は低音域と
高音域とに現われるという性質がある。また母音はスペ
クトルの主要部が中音域に集中し、かつパワーも大きい
という性質がある。したがって、音声パワーの谷の部分
、すなわち音節の前半の部分では低音域および高音域を
強調した照合処理を行ない、反対に音声パワーの山の部
分、すなわち音節の後半の部分では中音域を強調した照
合処理を行なうようにすれば、入力音声の認識精度を向
上させ得るものである。セレクタ回路、19)および加
算器(9)はかかる照合処理の部分的な強調を行なうた
めに設けられたものである。1%8図はセレクタ回路(
19)と加算器ばの動作を示すフローチャートである。
まずバイアスセレクタツはマルチづレフ寸(3,)(3
s)の切換状態に応じてI10ボート161力為ら出力
される信号によって切換操作される。
s)の切換状態に応じてI10ボート161力為ら出力
される信号によって切換操作される。
またH/Lセレクタ羽)はf(/L検出回路(30から
出力される信号によって切換操作される。そしてバイア
ス値の大きさけ、第8図フローチャートに示すように、
フィルタF2とFlあるいはF4とF6が選択されてい
る場合において、音声パワーが大きいときにはバイアス
値が大きくなり、反対に音声パワーが小さいときにはバ
イアス値が小さくなるようになっている。またフィルタ
FtとF8あるいはF・とFWが選択されている場合に
おいて、音声パワーが大きいときにはバイアス値は小さ
くなり、反対に音声パワーが小さいときにはバイアス値
は大きくなるものである。次に正負セレクタ・3(へ)
ば]ンバl/−タ霞の出力に応じてバイアス値の符号を
切り換えるものであり、差動増14器;&から出力され
る差1]号が止であるときにはバイアス値の符号を正に
して、反対に差信号が負であるときにはバイアス値の符
号を負にするものである。このようにすれば加算器@に
おいて差信号にバイアス値を加算したときに、差信号の
絶対値が大きくなるのでバイアス値が大きいほど照合判
定時の評価値Hが大きくなるものである。な詔このよう
にバイアス値によって部分的に強調された入カパターシ
と照合されるS準パターンは、入カバターンの場合と同
様にバイアス値によって部分的に強調されたパターンと
してあくもので1邊つこのような41準バターシria
卓的に発声した場合における入カバターンを標準パター
ンRA M 、+11に登録することにより容易に作成
することができるものである。
出力される信号によって切換操作される。そしてバイア
ス値の大きさけ、第8図フローチャートに示すように、
フィルタF2とFlあるいはF4とF6が選択されてい
る場合において、音声パワーが大きいときにはバイアス
値が大きくなり、反対に音声パワーが小さいときにはバ
イアス値が小さくなるようになっている。またフィルタ
FtとF8あるいはF・とFWが選択されている場合に
おいて、音声パワーが大きいときにはバイアス値は小さ
くなり、反対に音声パワーが小さいときにはバイアス値
は大きくなるものである。次に正負セレクタ・3(へ)
ば]ンバl/−タ霞の出力に応じてバイアス値の符号を
切り換えるものであり、差動増14器;&から出力され
る差1]号が止であるときにはバイアス値の符号を正に
して、反対に差信号が負であるときにはバイアス値の符
号を負にするものである。このようにすれば加算器@に
おいて差信号にバイアス値を加算したときに、差信号の
絶対値が大きくなるのでバイアス値が大きいほど照合判
定時の評価値Hが大きくなるものである。な詔このよう
にバイアス値によって部分的に強調された入カパターシ
と照合されるS準パターンは、入カバターンの場合と同
様にバイアス値によって部分的に強調されたパターンと
してあくもので1邊つこのような41準バターシria
卓的に発声した場合における入カバターンを標準パター
ンRA M 、+11に登録することにより容易に作成
することができるものである。
次に1g9図は本発明の他の実施例を示すものであり、
未実施例にあってはフィルタの出力の差信号を計算した
り、上記差信号に所定のバイアス値を加算し1ごり、あ
・;・いは音声バC゛−の山部や容顔を検出したりする
動作をすべてI10ボート1b)以降のマイクロニンし
ユータに行なわせるようにしてあり、マルチプレクサ1
3(により、各フィルタFl〜F9の出力・と;IIA
次I10ボート61に入力しているものである。また第
10図は本発明のさチに他の実施例を示すものであり、
本実施例にあってはA/Dコシバータ:5)の出力iR
AMiに一旦、格納したのち、デジタルフィルタ+39
iによって各鞠波数弗域毎の振幅成分をデジタル信号と
して抽出するようにしてフィルタF1.〜FQテ省略し
たものである。・4101バうメータROMであつ、デ
ジタルフィルターjの係数を記憶しているものである。
未実施例にあってはフィルタの出力の差信号を計算した
り、上記差信号に所定のバイアス値を加算し1ごり、あ
・;・いは音声バC゛−の山部や容顔を検出したりする
動作をすべてI10ボート1b)以降のマイクロニンし
ユータに行なわせるようにしてあり、マルチプレクサ1
3(により、各フィルタFl〜F9の出力・と;IIA
次I10ボート61に入力しているものである。また第
10図は本発明のさチに他の実施例を示すものであり、
本実施例にあってはA/Dコシバータ:5)の出力iR
AMiに一旦、格納したのち、デジタルフィルタ+39
iによって各鞠波数弗域毎の振幅成分をデジタル信号と
して抽出するようにしてフィルタF1.〜FQテ省略し
たものである。・4101バうメータROMであつ、デ
ジタルフィルターjの係数を記憶しているものである。
このようにデジタルフィルタ39)を用いた4合には、
A/Dコンバーターb1以降を1チツプのLSIによっ
て構成することができるので好都合なものである。
A/Dコンバーターb1以降を1チツプのLSIによっ
て構成することができるので好都合なものである。
X発+/′i以上のように構成さhており、音声入力の
小さい子音部分と音声入力の大きい母音部分とを一組と
する音節ごとに入カバターンを分辿」し、複数種の標準
パターンをそれぞれ各音節ごとて分割1−て予め記録し
、各音節ごとに入カバターンと標準パターンとの長さを
比較して、長い方のパターンの後場側の超過部分を切り
捨てて、長さの等しいパターン同士を照合するようにし
たものであるから、入力パターンを時間軸上で正規化す
る必要がなくなって処理速度が著しく速くなるという利
点があり、また音節の前端邪に位置する過渡的な子音の
部分と、音節の中間部に位置する定常的な母音の前端部
分とけ必ず照合されるので、音節の後嗜部に位置する定
常的な母音の後場部分が少々切り捨てられても照合処理
に支障を来たすことはなく、したがって充分に認識率を
高くすることができるという利点を有するものである。
小さい子音部分と音声入力の大きい母音部分とを一組と
する音節ごとに入カバターンを分辿」し、複数種の標準
パターンをそれぞれ各音節ごとて分割1−て予め記録し
、各音節ごとに入カバターンと標準パターンとの長さを
比較して、長い方のパターンの後場側の超過部分を切り
捨てて、長さの等しいパターン同士を照合するようにし
たものであるから、入力パターンを時間軸上で正規化す
る必要がなくなって処理速度が著しく速くなるという利
点があり、また音節の前端邪に位置する過渡的な子音の
部分と、音節の中間部に位置する定常的な母音の前端部
分とけ必ず照合されるので、音節の後嗜部に位置する定
常的な母音の後場部分が少々切り捨てられても照合処理
に支障を来たすことはなく、したがって充分に認識率を
高くすることができるという利点を有するものである。
第1図は従来例のブロック図、第2図は未発明の一実施
例のブロック図、4@3図は同上の要部づ[]”jり回
路図、第4図fat 〜falおよび第5図fal (
bl R同上の1作説明図、第6図乃至s8図は同上の
動作を示すフローチャート、第9図は本発明の他の実施
例のブロック図、第10図は未発明のさらに他の実啼例
のづ口・リフ図である。 ゛Fl〜F6ケフイItz
り、+91 ri人カッ\ター、RAM、111)は標
準パターンRAM、のlIばH/L検出回路である。 代理入 弁理士 石 1)長 七 手続補正書(自発) 昭和58年5 月 7日 特許庁長官殿 1、事件の表示 昭和57年特許m!93535号 2、発 明の名称 音声メツ℃−ジill 1IIIJ方式3、補正をする
者 事件との関係 特許出願人 任 所 大阪府門真市大字門真1048番地名 称
(583)松下電工株式会社 代表者小 林 郁 4、代理人 郵便番号 530 電話大阪(06) 345−7777 (代表)5、補
正命令の日付 、自 発 8、補正の内容 別紙の通り 訂 正 書 出願番号 特願昭57−9凸555号 1 本願明細書第5頁第5行目の「合致し之」を「近づ
け友」と訂正致します。 2 同上第6頁第2行目の「広い」を「狭い」と訂正致
します。 5 同上第6頁第2行目の「狭い」を「広い」と訂正致
します。 4 同上第6頁!!!8行目及び第10行目の「高舌」
を「後舌」と訂正致します。 5 同上第6頁第19行目の「いる6」の後に「フィル
タの周波数区分はこれに限つ皮ものではなく、対象とな
る音声全グループ分けできるものであればよい。」を挿
入致します。 6 同上第6頁第2行目の[合致しtJを「近づけt」
と訂正致します。 7 向上第14頁第19行目のr−127から+128
」會r + 127から−128」と訂正致します。
例のブロック図、4@3図は同上の要部づ[]”jり回
路図、第4図fat 〜falおよび第5図fal (
bl R同上の1作説明図、第6図乃至s8図は同上の
動作を示すフローチャート、第9図は本発明の他の実施
例のブロック図、第10図は未発明のさらに他の実啼例
のづ口・リフ図である。 ゛Fl〜F6ケフイItz
り、+91 ri人カッ\ター、RAM、111)は標
準パターンRAM、のlIばH/L検出回路である。 代理入 弁理士 石 1)長 七 手続補正書(自発) 昭和58年5 月 7日 特許庁長官殿 1、事件の表示 昭和57年特許m!93535号 2、発 明の名称 音声メツ℃−ジill 1IIIJ方式3、補正をする
者 事件との関係 特許出願人 任 所 大阪府門真市大字門真1048番地名 称
(583)松下電工株式会社 代表者小 林 郁 4、代理人 郵便番号 530 電話大阪(06) 345−7777 (代表)5、補
正命令の日付 、自 発 8、補正の内容 別紙の通り 訂 正 書 出願番号 特願昭57−9凸555号 1 本願明細書第5頁第5行目の「合致し之」を「近づ
け友」と訂正致します。 2 同上第6頁第2行目の「広い」を「狭い」と訂正致
します。 5 同上第6頁第2行目の「狭い」を「広い」と訂正致
します。 4 同上第6頁!!!8行目及び第10行目の「高舌」
を「後舌」と訂正致します。 5 同上第6頁第19行目の「いる6」の後に「フィル
タの周波数区分はこれに限つ皮ものではなく、対象とな
る音声全グループ分けできるものであればよい。」を挿
入致します。 6 同上第6頁第2行目の[合致しtJを「近づけt」
と訂正致します。 7 向上第14頁第19行目のr−127から+128
」會r + 127から−128」と訂正致します。
Claims (1)
- 111 通過周波数帯域の異なる煩欽個のフィルタに
より、音声入力の周波数成分に応じた入カバターンを作
成し、この入カバターンを予め記録されているad種の
標蟲パターンと照合して入カッ\ターンとの傾似変が最
大となるHaパターンを入力メツセージとして識別する
方式において、音声入力の大きさを検出する手段を設け
て、音声入力の小さい子音部分と音声入力の大きい母音
部分とを一組とする背面ごとに入カバターンを分割し、
複数棟のS準パターンをそれぞれ各音節ごとに分割して
予め記録し、各背面ごとに入カバターンと標準パターン
との長さを比較して、長い方のパターンの後端側の超過
部分を切り捨てて、長さの等しいパターン1同士を照合
することを特徴とする音声メツセージ識別方式っ
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9353582A JPS58209795A (ja) | 1982-05-31 | 1982-05-31 | 音声メツセ−ジ識別方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9353582A JPS58209795A (ja) | 1982-05-31 | 1982-05-31 | 音声メツセ−ジ識別方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58209795A true JPS58209795A (ja) | 1983-12-06 |
Family
ID=14084974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9353582A Pending JPS58209795A (ja) | 1982-05-31 | 1982-05-31 | 音声メツセ−ジ識別方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58209795A (ja) |
-
1982
- 1982-05-31 JP JP9353582A patent/JPS58209795A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4624011A (en) | Speech recognition system | |
US4100370A (en) | Voice verification system based on word pronunciation | |
JPS6147440B2 (ja) | ||
Pols | Real-time recognition of spoken words | |
JP2001166789A (ja) | 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置 | |
De Mori | A descriptive technique for automatic speech recognition | |
JPS58209795A (ja) | 音声メツセ−ジ識別方式 | |
Welling et al. | Connected digit recognition using statistical template matching. | |
JP2980382B2 (ja) | 話者適応音声認識方法および装置 | |
JP2989231B2 (ja) | 音声認識装置 | |
JPS60164800A (ja) | 音声認識装置 | |
JPS6331798B2 (ja) | ||
JPH0534679B2 (ja) | ||
Gazdag | A method of decoding speech | |
JPS58209799A (ja) | 音声メツセ−ジ識別方式 | |
JPH045398B2 (ja) | ||
JPS60200296A (ja) | 音声認識装置 | |
JPS59124388A (ja) | 単語音声認識処理方式 | |
JPS59124392A (ja) | 音声認識方式 | |
JPH0223876B2 (ja) | ||
JPS59124390A (ja) | 候補削減音声認識方式 | |
JPS6131476B2 (ja) | ||
JPS59124394A (ja) | 単音節音声認識方式 | |
JPS58116595A (ja) | 単語音声認識装置 | |
JPS59124389A (ja) | 単語音声認識方式 |