JPH0369996A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH0369996A JPH0369996A JP1204804A JP20480489A JPH0369996A JP H0369996 A JPH0369996 A JP H0369996A JP 1204804 A JP1204804 A JP 1204804A JP 20480489 A JP20480489 A JP 20480489A JP H0369996 A JPH0369996 A JP H0369996A
- Authority
- JP
- Japan
- Prior art keywords
- cpu
- input
- cpus
- speech recognition
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 239000000284 extract Substances 0.000 claims abstract description 4
- 230000005236 sound signal Effects 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 11
- 230000015654 memory Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 239000013256 coordination polymer Substances 0.000 description 2
- 102100029368 Cytochrome P450 2C18 Human genes 0.000 description 1
- 101000919360 Homo sapiens Cytochrome P450 2C18 Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
この発明は音声認識装置に関するものであり、特に、階
層構造に接続された複数個のCPUによって所要のデー
タ処理部を1戒し、対象の入力音声信号に関する前処理
を下位階層をなすCPU群で実行するとともに、音声認
識のためのパターン・マッチング処理を上位階層をなす
CPU群で分担して実行することにより、音声の認識処
理が迅速かつ的確に行われるようにされた音声認識装置
に関するものである。
層構造に接続された複数個のCPUによって所要のデー
タ処理部を1戒し、対象の入力音声信号に関する前処理
を下位階層をなすCPU群で実行するとともに、音声認
識のためのパターン・マッチング処理を上位階層をなす
CPU群で分担して実行することにより、音声の認識処
理が迅速かつ的確に行われるようにされた音声認識装置
に関するものである。
[従来の技術]
第4図は、パワー・パターン・マッチング手法に基づく
、−殻内な音声認識装置を原理的に示す概略tR戒図で
ある。この第4図において、音声入力部(40)は適当
なマイクロホン(40^〉およびマイク・アンプ(40
B)からなるものである、そして、これに続けて、特徴
抽出部(41)およびz2識処理部(42)が順次接続
されており、この認識処理部(42)の後段には、登録
パターン・メモリ(43)と認識パターン・メモリ(4
4)とが並列に接続されている。
、−殻内な音声認識装置を原理的に示す概略tR戒図で
ある。この第4図において、音声入力部(40)は適当
なマイクロホン(40^〉およびマイク・アンプ(40
B)からなるものである、そして、これに続けて、特徴
抽出部(41)およびz2識処理部(42)が順次接続
されており、この認識処理部(42)の後段には、登録
パターン・メモリ(43)と認識パターン・メモリ(4
4)とが並列に接続されている。
なお、認識処理部(42)、登録(標準)パターン・メ
モリ(43)および認識パターン・メモリ(44)は、
ある所要のデータ処理機能を備えたデジタル・コンピユ
ータ・システムとして具体化されている。
モリ(43)および認識パターン・メモリ(44)は、
ある所要のデータ処理機能を備えたデジタル・コンピユ
ータ・システムとして具体化されている。
そして、この−殻内な音声認識装置の動作についてみる
と、A)認識すべき音声を単語単位で登録する登録モー
ド、および、B)入力された音声を認識する認識モード
の双方のモードで動作するものである。
と、A)認識すべき音声を単語単位で登録する登録モー
ド、および、B)入力された音声を認識する認識モード
の双方のモードで動作するものである。
A)登録モード:
マイクロホン(40^)およびマイク・アンプ(40B
)を備えた音声入力部(40)からの音声信号は、その
特徴が特徴抽出部(41)において抽出されて、時系列
パターンとして登録(標準)パターン・メモリ(43)
に登録・格納される。
)を備えた音声入力部(40)からの音声信号は、その
特徴が特徴抽出部(41)において抽出されて、時系列
パターンとして登録(標準)パターン・メモリ(43)
に登録・格納される。
B)認識モード:
マイクロホン(40^)およびマイク・アンプ(40B
)を備えた音声入力部(40)からの音声信号の特徴が
特徴抽出部(41)において抽出されるまでは、前記登
録モードの場合と同様であるが、この認識モードの場合
には前記の特徴が認識パターン・メモリ(44)に格納
される0次いで、この認識パターン・メモリ(44)に
現に格納されている内容と登録(標準)パターン・メモ
リ(43〉に登録・格納されている幾つかの登録パター
ンとの間の類似度が、認識処理部(42)における所定
の演算処理によって算出される。そして、最大の類似度
のものが対応の認識パターンとして得られることになる
。
)を備えた音声入力部(40)からの音声信号の特徴が
特徴抽出部(41)において抽出されるまでは、前記登
録モードの場合と同様であるが、この認識モードの場合
には前記の特徴が認識パターン・メモリ(44)に格納
される0次いで、この認識パターン・メモリ(44)に
現に格納されている内容と登録(標準)パターン・メモ
リ(43〉に登録・格納されている幾つかの登録パター
ンとの間の類似度が、認識処理部(42)における所定
の演算処理によって算出される。そして、最大の類似度
のものが対応の認識パターンとして得られることになる
。
第5図は、例えば特開昭56−122098号に開示さ
れているような、従来の音声認識装置を示す概略構成図
である。この第5図において、音声入力部(50)を構
成するものは、マイクロホン(501)、マイク・アン
プ(502)、および、入力音声信号のレベルを入力音
声の強弱にかかわらずほぼ一定に保持するAGC回路(
503)である。
れているような、従来の音声認識装置を示す概略構成図
である。この第5図において、音声入力部(50)を構
成するものは、マイクロホン(501)、マイク・アン
プ(502)、および、入力音声信号のレベルを入力音
声の強弱にかかわらずほぼ一定に保持するAGC回路(
503)である。
また、このAGC回路(503)の後段におけるM個の
帯域通過フィルタ(以下BPFと略記)(511−1)
、(511−2)、・・・(511−M)は、それぞれ
に、対応の低域フィルタ(以下LPFと略記)(512
−1)、(512−2)、・ ・・(512−M)と接
続されて、所要の特徴抽出部(51)の主要部がie、
されている。
帯域通過フィルタ(以下BPFと略記)(511−1)
、(511−2)、・・・(511−M)は、それぞれ
に、対応の低域フィルタ(以下LPFと略記)(512
−1)、(512−2)、・ ・・(512−M)と接
続されて、所要の特徴抽出部(51)の主要部がie、
されている。
次に、LPF (512−1)、(512〜2)、・
・・(512−M)は、マルチプレクサ(513)の入
力部に並列に接続されていて、それぞれのフィルタ成分
がある所定の時間間隔をもって直列に加゛えられ、所要
のサンプリングがなされる。そして、このようにサンプ
リングされたアナログ信号は、次段のA−D変換器(5
14)に加えられて、対応のデジタル信号にされる。音
声検出回路(515)は、AGC回路(503)と後述
されるI10ボート(526)との間に接続されていて
、入力音声信号の始端および終端を、当該入力音声信号
のレベル、周波数分布、ゼロ交差数等の所要のデータに
基づいて規定するようにされる。全域L P F (5
16)は、AGC回路(503)とマルチプレクサ(5
13)との間のバイパス路を形式するようにされていて
、音声入力部(50〉がらの全音域音声信号の信号振幅
エンベロープを検出するようにされる。また、ピーク検
出回路(517)は、AD変換器(514)と工/○ボ
ート(526)との間に接続されていて、対象の音声信
号の極大値を検出するようにされる。即ち、前記特徴抽
出部(51)の全体的なm戒は、これら各種の手段によ
りなされるものである。
・・(512−M)は、マルチプレクサ(513)の入
力部に並列に接続されていて、それぞれのフィルタ成分
がある所定の時間間隔をもって直列に加゛えられ、所要
のサンプリングがなされる。そして、このようにサンプ
リングされたアナログ信号は、次段のA−D変換器(5
14)に加えられて、対応のデジタル信号にされる。音
声検出回路(515)は、AGC回路(503)と後述
されるI10ボート(526)との間に接続されていて
、入力音声信号の始端および終端を、当該入力音声信号
のレベル、周波数分布、ゼロ交差数等の所要のデータに
基づいて規定するようにされる。全域L P F (5
16)は、AGC回路(503)とマルチプレクサ(5
13)との間のバイパス路を形式するようにされていて
、音声入力部(50〉がらの全音域音声信号の信号振幅
エンベロープを検出するようにされる。また、ピーク検
出回路(517)は、AD変換器(514)と工/○ボ
ート(526)との間に接続されていて、対象の音声信
号の極大値を検出するようにされる。即ち、前記特徴抽
出部(51)の全体的なm戒は、これら各種の手段によ
りなされるものである。
また、デジタル・コンピュータ・システム(52)は以
下の諸手段によって構成されている。即ち、CP U
(521)、バッファ・メモリ(522)、ROM(5
23)、登録(標準〉パターン・メモリ(524)、お
よび、認識パターン・メモリ(525)であって、これ
らの手段は、前段の特徴抽出部(51)の所要部位と接
続された■/○ボート(526)との間で、適当なデー
タ・バス(527)を介して相互に接続されている。な
お、所要の入力制御部(528)がI10ボー) (5
26)に接続されており、また、一種のワーキング・メ
モリである認識処理用メモリ(529)がデータ・バス
(527)を介して前記の諸手段と相互に接続されてい
る。
下の諸手段によって構成されている。即ち、CP U
(521)、バッファ・メモリ(522)、ROM(5
23)、登録(標準〉パターン・メモリ(524)、お
よび、認識パターン・メモリ(525)であって、これ
らの手段は、前段の特徴抽出部(51)の所要部位と接
続された■/○ボート(526)との間で、適当なデー
タ・バス(527)を介して相互に接続されている。な
お、所要の入力制御部(528)がI10ボー) (5
26)に接続されており、また、一種のワーキング・メ
モリである認識処理用メモリ(529)がデータ・バス
(527)を介して前記の諸手段と相互に接続されてい
る。
以下、上記された従来例の動作について説明する。
いま、マイクロホン(501)により、ある音声信号が
入力されたとすると、マイク・アンプ(502)および
AGC回路(503)を介して、B P F (511
−1)、(511−2)、・・・(511−M)に加え
られ、ここで所定の周波数成分からなる信号に分解され
る。
入力されたとすると、マイク・アンプ(502)および
AGC回路(503)を介して、B P F (511
−1)、(511−2)、・・・(511−M)に加え
られ、ここで所定の周波数成分からなる信号に分解され
る。
このように分解された成分信号は、それぞれに対応のL
PF (512−1)、(512−2) 、 ・・・
(512−M)に加えられて、所要の特徴抽出がなされ
る。
PF (512−1)、(512−2) 、 ・・・
(512−M)に加えられて、所要の特徴抽出がなされ
る。
このように、所要の特徴抽出がなされた結果としての各
LPF毎のアナログ信号は、マルチプレクサ(513)
を介して、A−D変換器(513)により対応のデジタ
ル信号に変換される。
LPF毎のアナログ信号は、マルチプレクサ(513)
を介して、A−D変換器(513)により対応のデジタ
ル信号に変換される。
そして、このようにして得られたデジタル信号はデータ
・バス(527)を介してバッファ・メモリ(522)
に取り込まれる。なお、前記デジタル信号がピーク検出
回路(517)を通される場合には、所定のピーク信号
が取り込まれることになる。
・バス(527)を介してバッファ・メモリ(522)
に取り込まれる。なお、前記デジタル信号がピーク検出
回路(517)を通される場合には、所定のピーク信号
が取り込まれることになる。
次いで、前記バッファ・メモリ(522)に取り込まれ
たデジタル信号について、これがサンプリングされて認
識パターン・メモリ(525)に記憶されている対応の
データが、CP U (521)の動作により、登録(
標準)パターン・メモリ(524)に登録されている標
準的なデータとの間でのパターン・マッチングが収られ
て、入力された音声信号の認識が行われる。
たデジタル信号について、これがサンプリングされて認
識パターン・メモリ(525)に記憶されている対応の
データが、CP U (521)の動作により、登録(
標準)パターン・メモリ(524)に登録されている標
準的なデータとの間でのパターン・マッチングが収られ
て、入力された音声信号の認識が行われる。
このような従来例においては、規格化等の所要の演算処
理が単一のCPUによって行われているために、所要の
作業を連続して行うことが困難であり、また、専用ハー
ドウェアによるときには、入力条件のいかん等によりフ
ィードバック動作が容易ではなくなる。また、処理すべ
き単語数が多くなると、所望の高速処理が極めて困難に
なる。
理が単一のCPUによって行われているために、所要の
作業を連続して行うことが困難であり、また、専用ハー
ドウェアによるときには、入力条件のいかん等によりフ
ィードバック動作が容易ではなくなる。また、処理すべ
き単語数が多くなると、所望の高速処理が極めて困難に
なる。
[発明が解決しようとする課題]
上記されたように、従来の音声認識装置においては、規
格化等の所要の演算処理が単一のCPUによって行われ
ており、所要の作業を連続して行うことが困難であるこ
と、専用ハードウェアによるときには、入力条件のいか
ん等によりフィードバック動作が容易ではなくなること
、処理すべき単語数が多くなると、所望の高速処理が極
めて困難になること等の問題点があった。
格化等の所要の演算処理が単一のCPUによって行われ
ており、所要の作業を連続して行うことが困難であるこ
と、専用ハードウェアによるときには、入力条件のいか
ん等によりフィードバック動作が容易ではなくなること
、処理すべき単語数が多くなると、所望の高速処理が極
めて困難になること等の問題点があった。
この発明は、上記の問題点を解決するためになされたも
のであって、階層構造に接続された複数個のCPUによ
って所要のデータ処理部を構成し、対象の入力音声信号
に関する前処理を下位階層をなすCPU群で実行すると
ともに、音声認識のためのパターン・マッチング処理を
上位階層をなすCPU群で分担して実行することにより
、音声の認識処理が迅速かつ的確に行われるようにされ
た音声認識装置を提供することをB的とするものである
。
のであって、階層構造に接続された複数個のCPUによ
って所要のデータ処理部を構成し、対象の入力音声信号
に関する前処理を下位階層をなすCPU群で実行すると
ともに、音声認識のためのパターン・マッチング処理を
上位階層をなすCPU群で分担して実行することにより
、音声の認識処理が迅速かつ的確に行われるようにされ
た音声認識装置を提供することをB的とするものである
。
[課題を解決するための手段]
この発明に係る音声認識装置は、
入力音声信号を対応の電気信号に変換する音声入力部;
前記入力音声信号の波形における特徴部分を抽出する特
徴抽出部:および、 階層構造をなして接続された複数個のCPUからなるデ
ータ処理部; を含んでなるものである。
徴抽出部:および、 階層構造をなして接続された複数個のCPUからなるデ
ータ処理部; を含んでなるものである。
[作用]
この発明によれば、入力音声信号に間するノイズ除去の
ような前処理を下位階層をなすCPU群で実行するとと
もに、音声認識のためのパターン・マッチング処理を上
位階層をなすCPU群で分担して実行するようにされる
。
ような前処理を下位階層をなすCPU群で実行するとと
もに、音声認識のためのパターン・マッチング処理を上
位階層をなすCPU群で分担して実行するようにされる
。
[実施例]
第1図は、この発明の第1実施例に係る音声認識装置を
示す概略楕或図である。この第1図において、音声入力
部(10)は適当なマイクロホン(IOA>およびマイ
ク・アンプ(10B)からなるものである。
示す概略楕或図である。この第1図において、音声入力
部(10)は適当なマイクロホン(IOA>およびマイ
ク・アンプ(10B)からなるものである。
そして、これに続けて、所要個数(この例においては4
個)の帯域通過フィルタ(以下BPFと略記)(11−
1)、 (11−2)、(11−3)、(11−4)は
、所定の接点構成部(12)を介して、適宜に対応する
4個のマルチプレクサ(以下MPと略記)(13−1)
、 (13−2)、(13−3)、(13−4)に接続
されている。そして、これらのM P (13−1)、
(13−2)、(13−3>、(13−4)の後段には
、それぞれに対応するA/D変換器(14〜1)、(1
4−2)、(14−3)、(14−4>が接続されてい
る。更に、これらのA/D変換器(14−1)、(14
−2)、(14−3)、(14−4>に続けて、#1階
層コンピュータを構成するC P U (15−1)、
(15−2)、(15−3)、(15−4>がそれぞれ
に接続されている。そして、CP U (15−1>お
よび(15−2)の後段にはCP U (16−1)が
接続され、CP U (15−3)および(15−4)
の後段にはCPU(16−2>が接続されていて、これ
らのCP U (16−1)および(16−2>により
#2階層コンピュータが構成されている。更に、これら
のCP U (16−1>および(16−2)の後段に
は、#3tllJIコンピュータを構成するC P U
(17)が接続されている。また、上位コンピュータ
としてのホスト・コンピュータ(18)がCP U (
17)の後段に接続されている。
個)の帯域通過フィルタ(以下BPFと略記)(11−
1)、 (11−2)、(11−3)、(11−4)は
、所定の接点構成部(12)を介して、適宜に対応する
4個のマルチプレクサ(以下MPと略記)(13−1)
、 (13−2)、(13−3)、(13−4)に接続
されている。そして、これらのM P (13−1)、
(13−2)、(13−3>、(13−4)の後段には
、それぞれに対応するA/D変換器(14〜1)、(1
4−2)、(14−3)、(14−4>が接続されてい
る。更に、これらのA/D変換器(14−1)、(14
−2)、(14−3)、(14−4>に続けて、#1階
層コンピュータを構成するC P U (15−1)、
(15−2)、(15−3)、(15−4>がそれぞれ
に接続されている。そして、CP U (15−1>お
よび(15−2)の後段にはCP U (16−1)が
接続され、CP U (15−3)および(15−4)
の後段にはCPU(16−2>が接続されていて、これ
らのCP U (16−1)および(16−2>により
#2階層コンピュータが構成されている。更に、これら
のCP U (16−1>および(16−2)の後段に
は、#3tllJIコンピュータを構成するC P U
(17)が接続されている。また、上位コンピュータ
としてのホスト・コンピュータ(18)がCP U (
17)の後段に接続されている。
第2図は、この発明の第2実施例に係る音声認識装置を
示す概略tlI戒図である。この第2図において、音声
入力部(20)は適当なマイクロホン(20^)および
マイク・アンプ(20B)からなるものである。
示す概略tlI戒図である。この第2図において、音声
入力部(20)は適当なマイクロホン(20^)および
マイク・アンプ(20B)からなるものである。
そして、これに続けて、所要個数(この例においては5
個)の帯域通過フィルタ(以下BPFと略記)(21−
1)、(21−2)、・・・(21−5)には、それぞ
れに対応するA/D変換器(22−1)、 (22−2
)、・(22−5)が接続されている0次いで、これら
のA/D変換器(22−1)、(22−2)、・・・(
22−5)の後段には、それぞれに対応するC P U
(23−1)、(23−2)、・・・(23−5)が
接続されて、入力音声信号に関するノイズ処理を行うた
めの#1階層コンピュータを構成している。そして、こ
の#1階層コンピュータの後段には、音声データ・バス
(24)を介して所要個数(この例においては8個)の
CPUCPU(25−1)、(25−2)、・・・(2
5−8)が接続されていて、これらにより#2階層コン
ピュータが構成されている。次いで、CP U (25
−1)および(25−2)の後段にはCP U (26
−1)が接続され、CP U (25−3)および(2
5−4)の後段にはCP U (26−2)が接続され
、CP U (25−5)および(25−6)の後段に
はCPU(26−3)が接続され、また、CP U (
25−7)および(25−8)の後段にはCP U (
2B−4)が接続されていて、これらのCP U (2
6−1)、(26−2)、(26−3)、(26−4)
により#3階層コンピュータが構成されている。
個)の帯域通過フィルタ(以下BPFと略記)(21−
1)、(21−2)、・・・(21−5)には、それぞ
れに対応するA/D変換器(22−1)、 (22−2
)、・(22−5)が接続されている0次いで、これら
のA/D変換器(22−1)、(22−2)、・・・(
22−5)の後段には、それぞれに対応するC P U
(23−1)、(23−2)、・・・(23−5)が
接続されて、入力音声信号に関するノイズ処理を行うた
めの#1階層コンピュータを構成している。そして、こ
の#1階層コンピュータの後段には、音声データ・バス
(24)を介して所要個数(この例においては8個)の
CPUCPU(25−1)、(25−2)、・・・(2
5−8)が接続されていて、これらにより#2階層コン
ピュータが構成されている。次いで、CP U (25
−1)および(25−2)の後段にはCP U (26
−1)が接続され、CP U (25−3)および(2
5−4)の後段にはCP U (26−2)が接続され
、CP U (25−5)および(25−6)の後段に
はCPU(26−3)が接続され、また、CP U (
25−7)および(25−8)の後段にはCP U (
2B−4)が接続されていて、これらのCP U (2
6−1)、(26−2)、(26−3)、(26−4)
により#3階層コンピュータが構成されている。
また、CP U (26−1)および(26−2)の後
段にはcpU (27−1)が接続され、CP U (
26−3)および(26−4)の後段にはCP tJ
(27−2>が接続されていて、これらのCP U (
27−1)、(27−2)により#4階層コンピュータ
が構成されている。更に、これらのCPU(27−1)
および(27−2)の後段には、#5階層コンピュータ
を構成するC P U (28)が接続されている。ま
た、上位コンピュータとしてのホスト・コンピュータ(
29)がCP U (28)の後段に接続されている。
段にはcpU (27−1)が接続され、CP U (
26−3)および(26−4)の後段にはCP tJ
(27−2>が接続されていて、これらのCP U (
27−1)、(27−2)により#4階層コンピュータ
が構成されている。更に、これらのCPU(27−1)
および(27−2)の後段には、#5階層コンピュータ
を構成するC P U (28)が接続されている。ま
た、上位コンピュータとしてのホスト・コンピュータ(
29)がCP U (28)の後段に接続されている。
第3図は、この発明の第3実施例に係る音声認識装置を
示す概略横戊図である。この第3図において、音声入力
部〈30〉は適当なマイクロホン(30^〉およびマイ
ク・アンプ(30B)からなるものである。
示す概略横戊図である。この第3図において、音声入力
部〈30〉は適当なマイクロホン(30^〉およびマイ
ク・アンプ(30B)からなるものである。
そして、これに続けて、所要個数(この例においては4
個)の帯域通過フィルタ(以下BPFと略記)(31−
1>、 (31−2)、<3l−3)、(31−4)に
は、それぞれに、対応するA/D変換器(32−1)、
(32−2)、(32−3)、(32−4)が接続され
ている1次いで、これらのA/D変換器(32−1)、
(32−2)、(32−3>、<32−4)の後段には
、それぞれに対応するCPU(33−1)、(33−2
>、(33−3)、(33−4)が接続されていて、こ
れらにより#1階層コンピュータが構成されている。そ
して、CP U (33−1)および(33−2)の後
段にはCP U (34−1)が接続され、CPU(3
3−3)および(33−4)の後段にはCP U (3
4−2>が接続されていて、これらのCP U (34
−1)、(34−2)により#2111J!lコンピュ
ータが構成されている。
個)の帯域通過フィルタ(以下BPFと略記)(31−
1>、 (31−2)、<3l−3)、(31−4)に
は、それぞれに、対応するA/D変換器(32−1)、
(32−2)、(32−3)、(32−4)が接続され
ている1次いで、これらのA/D変換器(32−1)、
(32−2)、(32−3>、<32−4)の後段には
、それぞれに対応するCPU(33−1)、(33−2
>、(33−3)、(33−4)が接続されていて、こ
れらにより#1階層コンピュータが構成されている。そ
して、CP U (33−1)および(33−2)の後
段にはCP U (34−1)が接続され、CPU(3
3−3)および(33−4)の後段にはCP U (3
4−2>が接続されていて、これらのCP U (34
−1)、(34−2)により#2111J!lコンピュ
ータが構成されている。
更に、これらのCP U (34−1)および(34−
2)の後段には、#3階層コンピュータを構成するCP
tJ(35)が接続されている。また、上位コンピュー
タとしてのホスト・コンピュータ(36〉がCP U
(35)の後段に接続されている。
2)の後段には、#3階層コンピュータを構成するCP
tJ(35)が接続されている。また、上位コンピュー
タとしてのホスト・コンピュータ(36〉がCP U
(35)の後段に接続されている。
この第3実施例においては、次のような認識アルゴリズ
ムが実行される。
ムが実行される。
(イ)デジタル化された単語音声の登録BPF (31
−1)、(31−2)、(31−3)、 (31−4)
には、それぞれに、互いに異なる特定の中心周波数を有
する帯域が個別に割り当てられている。そして、この特
定の中心周波数に帯域化された単語音声波形を、対応の
単語音声のエネルギを表わす直流電圧波形に整形する。
−1)、(31−2)、(31−3)、 (31−4)
には、それぞれに、互いに異なる特定の中心周波数を有
する帯域が個別に割り当てられている。そして、この特
定の中心周波数に帯域化された単語音声波形を、対応の
単語音声のエネルギを表わす直流電圧波形に整形する。
そして、これを対応のA/D変換器(32−1)、(3
2−2)、(32−3)、(32−4>を介して、#I
N層コンピュータを構成するCPU(33−1)、(3
3−2)、(33−3)、(33−4)のメモリ部(図
示されない)に記憶させる。このようにして記憶された
単語音声データは、#2階層コンピュータをi戒する
CP U (34−1)、 (34−2)、および、#
3階層コンピュータをi戒するC P U (35)を
経由してホスト・コンピュータ(36)に送られて、そ
のデイスプレィ部にグラフィック表示される。そして、
正確な登録がなされたか否かがここで確認される。例え
ば、ノイズ等が誤って登録されたとしても、ここでの確
認作業により直ちに変更または取り消しをすることがで
きる。
2−2)、(32−3)、(32−4>を介して、#I
N層コンピュータを構成するCPU(33−1)、(3
3−2)、(33−3)、(33−4)のメモリ部(図
示されない)に記憶させる。このようにして記憶された
単語音声データは、#2階層コンピュータをi戒する
CP U (34−1)、 (34−2)、および、#
3階層コンピュータをi戒するC P U (35)を
経由してホスト・コンピュータ(36)に送られて、そ
のデイスプレィ部にグラフィック表示される。そして、
正確な登録がなされたか否かがここで確認される。例え
ば、ノイズ等が誤って登録されたとしても、ここでの確
認作業により直ちに変更または取り消しをすることがで
きる。
(ロ) #1階層コンピュータによる認識#1階層コン
ピュータを構成するCPU(33−1)、(33−2)
、(33−3)、(33−4)においては、複数個の単
語音声の登録を行ってから、新たに入力される音声波形
について、既に登録しである全ての単語音声の波形との
相関を求め、その結果を#2階層コンピュータを構成す
る CP U (34−1>、(34−2)・に送る。
ピュータを構成するCPU(33−1)、(33−2)
、(33−3)、(33−4)においては、複数個の単
語音声の登録を行ってから、新たに入力される音声波形
について、既に登録しである全ての単語音声の波形との
相関を求め、その結果を#2階層コンピュータを構成す
る CP U (34−1>、(34−2)・に送る。
(ハ) #2、#3階層コンピュータによる認識#2、
#311it層コンピュータにおいては、それぞれに、
下位の2台のCPUから送られた各単語との相関係数に
基づいて、新たに相間係数を総合した値の算出を行い、
これをより上位のCPUに送る。ここで、#3階層コン
ピュータを構成するC P U (35)は全ての周波
数から得られる相関係数の総合値を求めたことになる。
#311it層コンピュータにおいては、それぞれに、
下位の2台のCPUから送られた各単語との相関係数に
基づいて、新たに相間係数を総合した値の算出を行い、
これをより上位のCPUに送る。ここで、#3階層コン
ピュータを構成するC P U (35)は全ての周波
数から得られる相関係数の総合値を求めたことになる。
(ニ)ホスト・コンピュータによる動作ホスト・コンピ
ュータ(36)は、#3階層コンピュータをm成するC
P U (35)から送られてきた各登録単語との相
関係数の総合値の最も大きなものを、発声単語と認識し
て適当に表示を行う。
ュータ(36)は、#3階層コンピュータをm成するC
P U (35)から送られてきた各登録単語との相
関係数の総合値の最も大きなものを、発声単語と認識し
て適当に表示を行う。
[発明の効果〕
以上説明されたように、この発明に係る音声認識装置は
、 入力音声信号を対応の電気信号に変換する音声入力部; 前記入力音声信号の波形における特徴部分を抽出する特
徴抽出部;および、 階層構造をなして接続された複数個のCPCIからなる
データ処理部; を含んで構成されており、 入力音声信号に間するノイズ除去のような前処理を下位
階層をなすCPU群で実行するとともに、音声認識のた
めのパターン・マッチング処理を上位階層をなすCPU
群で分担して実行するようにされていることから、音声
の認識処理が迅速かつ的確に行われるという効果が奏せ
られるものである。
、 入力音声信号を対応の電気信号に変換する音声入力部; 前記入力音声信号の波形における特徴部分を抽出する特
徴抽出部;および、 階層構造をなして接続された複数個のCPCIからなる
データ処理部; を含んで構成されており、 入力音声信号に間するノイズ除去のような前処理を下位
階層をなすCPU群で実行するとともに、音声認識のた
めのパターン・マッチング処理を上位階層をなすCPU
群で分担して実行するようにされていることから、音声
の認識処理が迅速かつ的確に行われるという効果が奏せ
られるものである。
第1図は、この発明の第1実施例に係る音声認識装置を
示す概略構成図、第2図は、この発明の第2実施例に係
る音声認識装置を示す概略構成図、第3図は、この発明
の第3実施例に係る音声認識装置を示す概略構成図、第
4図は、−殻内な音声認識装置を原理的に示す概略構成
図、第5図は、従来の音声認識装置を示す概略構成図で
ある。 (10)は音声入力部、 (10^)はマイクロホン、 (IOB)はマイク・アンプ、 (11−1)、・・・(11−4)は帯域通過フィルタ
(BPF)、 (12)は接点tII或部、 (13−1)、 ・・・(13−4)はマルチプレク
サ(MP)、(14−1)、・・・(14−4)はA/
D変換器、(15−1>、・・・(15−4)は#1コ
ンピュータを構成するCPU、 (16−1>、(16−2)は#2コンピュータを構成
するCPU。 (17)は#3コンピュータを構成するCPU、(18
)はホスト・コンピュータ。
示す概略構成図、第2図は、この発明の第2実施例に係
る音声認識装置を示す概略構成図、第3図は、この発明
の第3実施例に係る音声認識装置を示す概略構成図、第
4図は、−殻内な音声認識装置を原理的に示す概略構成
図、第5図は、従来の音声認識装置を示す概略構成図で
ある。 (10)は音声入力部、 (10^)はマイクロホン、 (IOB)はマイク・アンプ、 (11−1)、・・・(11−4)は帯域通過フィルタ
(BPF)、 (12)は接点tII或部、 (13−1)、 ・・・(13−4)はマルチプレク
サ(MP)、(14−1)、・・・(14−4)はA/
D変換器、(15−1>、・・・(15−4)は#1コ
ンピュータを構成するCPU、 (16−1>、(16−2)は#2コンピュータを構成
するCPU。 (17)は#3コンピュータを構成するCPU、(18
)はホスト・コンピュータ。
Claims (1)
- (1)入力音声信号を対応の電気信号に変換する音声入
力部; 前記入力音声信号の波形における特徴部 分を抽出する特徴抽出部;および 階層構造をなして接続された複数個のC PUからなるデータ処理部; を含んでなる音声認識装置であって; 前記入力音声信号に関する前処理を下位 階層をなすCPU群で実行するとともに、音声認識のた
めのパターン・マッチング処理を上位階層をなすCPU
群で分担して実行するようにしたことを特徴とする音声
認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1204804A JPH0369996A (ja) | 1989-08-09 | 1989-08-09 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1204804A JPH0369996A (ja) | 1989-08-09 | 1989-08-09 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0369996A true JPH0369996A (ja) | 1991-03-26 |
Family
ID=16496642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1204804A Pending JPH0369996A (ja) | 1989-08-09 | 1989-08-09 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0369996A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005269649A (ja) * | 2004-03-17 | 2005-09-29 | Harman Becker Automotive Systems Gmbh | マイクロフォンアレイを介してノイズを検知し、かつ、減少させる方法 |
WO2015059866A1 (en) | 2013-10-24 | 2015-04-30 | Toyota Jidosha Kabushiki Kaisha | Wind detection apparatus |
-
1989
- 1989-08-09 JP JP1204804A patent/JPH0369996A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005269649A (ja) * | 2004-03-17 | 2005-09-29 | Harman Becker Automotive Systems Gmbh | マイクロフォンアレイを介してノイズを検知し、かつ、減少させる方法 |
WO2015059866A1 (en) | 2013-10-24 | 2015-04-30 | Toyota Jidosha Kabushiki Kaisha | Wind detection apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1973101B1 (en) | Pitch extraction with inhibition of harmonics and sub-harmonics of the fundamental frequency | |
WO2007015776A2 (en) | Instruction based parallel median filtering processor and method | |
JPH06215164A (ja) | 乗算回路 | |
JPH0369996A (ja) | 音声認識装置 | |
US20060195500A1 (en) | Determination of a common fundamental frequency of harmonic signals | |
JP2003030656A (ja) | 追加学習可能なパターン分離装置 | |
EP1605439A1 (en) | Unified treatment of resolved and unresolved harmonics | |
RU2005128564A (ru) | Способ определения последовательности обработки функциональных модулей системы автоматизации и система автоматизации | |
Tadokoro et al. | Pitch detection of duet song using double comb filters | |
JP3021065U (ja) | ピッチ抽出装置 | |
CN1707609B (zh) | 已分辨和未分辨谐波的统一处理 | |
CN115221953A (zh) | 一种实验室实验仪器数据分析方法 | |
JP2556369B2 (ja) | アナログ波形のオーバーシュート位置検出方式 | |
JPS6269120A (ja) | 信号処理方式 | |
JPS59214900A (ja) | 音声認識装置 | |
JPS61221980A (ja) | 領域のラベル付け方式 | |
CN115166429A (zh) | 一种基于同步多元传感器的局部放电监测分析方法及系统 | |
CN101499274A (zh) | 声音信号的音高参考点筛选方法及系统 | |
JPS61273095A (ja) | デイジタル信号受信器 | |
JPH01233497A (ja) | ピッチ抽出装置 | |
JPS63169525A (ja) | ピツチ抽出装置 | |
JPS58190999A (ja) | 音声認識装置 | |
JPH0816304A (ja) | タブレット装置 | |
JPH09190420A (ja) | パターン認識装置 | |
JPH0320926B2 (ja) |