JPH0369996A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0369996A
JPH0369996A JP1204804A JP20480489A JPH0369996A JP H0369996 A JPH0369996 A JP H0369996A JP 1204804 A JP1204804 A JP 1204804A JP 20480489 A JP20480489 A JP 20480489A JP H0369996 A JPH0369996 A JP H0369996A
Authority
JP
Japan
Prior art keywords
cpu
input
cpus
speech recognition
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1204804A
Other languages
English (en)
Inventor
Shinji Takahashi
伸治 高橋
Koji Kawashima
河島 浩二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ibiden Co Ltd
Original Assignee
Ibiden Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibiden Co Ltd filed Critical Ibiden Co Ltd
Priority to JP1204804A priority Critical patent/JPH0369996A/ja
Publication of JPH0369996A publication Critical patent/JPH0369996A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は音声認識装置に関するものであり、特に、階
層構造に接続された複数個のCPUによって所要のデー
タ処理部を1戒し、対象の入力音声信号に関する前処理
を下位階層をなすCPU群で実行するとともに、音声認
識のためのパターン・マッチング処理を上位階層をなす
CPU群で分担して実行することにより、音声の認識処
理が迅速かつ的確に行われるようにされた音声認識装置
に関するものである。
[従来の技術] 第4図は、パワー・パターン・マッチング手法に基づく
、−殻内な音声認識装置を原理的に示す概略tR戒図で
ある。この第4図において、音声入力部(40)は適当
なマイクロホン(40^〉およびマイク・アンプ(40
B)からなるものである、そして、これに続けて、特徴
抽出部(41)およびz2識処理部(42)が順次接続
されており、この認識処理部(42)の後段には、登録
パターン・メモリ(43)と認識パターン・メモリ(4
4)とが並列に接続されている。
なお、認識処理部(42)、登録(標準)パターン・メ
モリ(43)および認識パターン・メモリ(44)は、
ある所要のデータ処理機能を備えたデジタル・コンピユ
ータ・システムとして具体化されている。
そして、この−殻内な音声認識装置の動作についてみる
と、A)認識すべき音声を単語単位で登録する登録モー
ド、および、B)入力された音声を認識する認識モード
の双方のモードで動作するものである。
A)登録モード: マイクロホン(40^)およびマイク・アンプ(40B
)を備えた音声入力部(40)からの音声信号は、その
特徴が特徴抽出部(41)において抽出されて、時系列
パターンとして登録(標準)パターン・メモリ(43)
に登録・格納される。
B)認識モード: マイクロホン(40^)およびマイク・アンプ(40B
)を備えた音声入力部(40)からの音声信号の特徴が
特徴抽出部(41)において抽出されるまでは、前記登
録モードの場合と同様であるが、この認識モードの場合
には前記の特徴が認識パターン・メモリ(44)に格納
される0次いで、この認識パターン・メモリ(44)に
現に格納されている内容と登録(標準)パターン・メモ
リ(43〉に登録・格納されている幾つかの登録パター
ンとの間の類似度が、認識処理部(42)における所定
の演算処理によって算出される。そして、最大の類似度
のものが対応の認識パターンとして得られることになる
第5図は、例えば特開昭56−122098号に開示さ
れているような、従来の音声認識装置を示す概略構成図
である。この第5図において、音声入力部(50)を構
成するものは、マイクロホン(501)、マイク・アン
プ(502)、および、入力音声信号のレベルを入力音
声の強弱にかかわらずほぼ一定に保持するAGC回路(
503)である。
また、このAGC回路(503)の後段におけるM個の
帯域通過フィルタ(以下BPFと略記)(511−1)
、(511−2)、・・・(511−M)は、それぞれ
に、対応の低域フィルタ(以下LPFと略記)(512
−1)、(512−2)、・ ・・(512−M)と接
続されて、所要の特徴抽出部(51)の主要部がie、
されている。
次に、LPF  (512−1)、(512〜2)、・
・・(512−M)は、マルチプレクサ(513)の入
力部に並列に接続されていて、それぞれのフィルタ成分
がある所定の時間間隔をもって直列に加゛えられ、所要
のサンプリングがなされる。そして、このようにサンプ
リングされたアナログ信号は、次段のA−D変換器(5
14)に加えられて、対応のデジタル信号にされる。音
声検出回路(515)は、AGC回路(503)と後述
されるI10ボート(526)との間に接続されていて
、入力音声信号の始端および終端を、当該入力音声信号
のレベル、周波数分布、ゼロ交差数等の所要のデータに
基づいて規定するようにされる。全域L P F (5
16)は、AGC回路(503)とマルチプレクサ(5
13)との間のバイパス路を形式するようにされていて
、音声入力部(50〉がらの全音域音声信号の信号振幅
エンベロープを検出するようにされる。また、ピーク検
出回路(517)は、AD変換器(514)と工/○ボ
ート(526)との間に接続されていて、対象の音声信
号の極大値を検出するようにされる。即ち、前記特徴抽
出部(51)の全体的なm戒は、これら各種の手段によ
りなされるものである。
また、デジタル・コンピュータ・システム(52)は以
下の諸手段によって構成されている。即ち、CP U 
(521)、バッファ・メモリ(522)、ROM(5
23)、登録(標準〉パターン・メモリ(524)、お
よび、認識パターン・メモリ(525)であって、これ
らの手段は、前段の特徴抽出部(51)の所要部位と接
続された■/○ボート(526)との間で、適当なデー
タ・バス(527)を介して相互に接続されている。な
お、所要の入力制御部(528)がI10ボー) (5
26)に接続されており、また、一種のワーキング・メ
モリである認識処理用メモリ(529)がデータ・バス
(527)を介して前記の諸手段と相互に接続されてい
る。
以下、上記された従来例の動作について説明する。
いま、マイクロホン(501)により、ある音声信号が
入力されたとすると、マイク・アンプ(502)および
AGC回路(503)を介して、B P F (511
−1)、(511−2)、・・・(511−M)に加え
られ、ここで所定の周波数成分からなる信号に分解され
る。
このように分解された成分信号は、それぞれに対応のL
PF (512−1)、(512−2) 、  ・・・
(512−M)に加えられて、所要の特徴抽出がなされ
る。
このように、所要の特徴抽出がなされた結果としての各
LPF毎のアナログ信号は、マルチプレクサ(513)
を介して、A−D変換器(513)により対応のデジタ
ル信号に変換される。
そして、このようにして得られたデジタル信号はデータ
・バス(527)を介してバッファ・メモリ(522)
に取り込まれる。なお、前記デジタル信号がピーク検出
回路(517)を通される場合には、所定のピーク信号
が取り込まれることになる。
次いで、前記バッファ・メモリ(522)に取り込まれ
たデジタル信号について、これがサンプリングされて認
識パターン・メモリ(525)に記憶されている対応の
データが、CP U (521)の動作により、登録(
標準)パターン・メモリ(524)に登録されている標
準的なデータとの間でのパターン・マッチングが収られ
て、入力された音声信号の認識が行われる。
このような従来例においては、規格化等の所要の演算処
理が単一のCPUによって行われているために、所要の
作業を連続して行うことが困難であり、また、専用ハー
ドウェアによるときには、入力条件のいかん等によりフ
ィードバック動作が容易ではなくなる。また、処理すべ
き単語数が多くなると、所望の高速処理が極めて困難に
なる。
[発明が解決しようとする課題] 上記されたように、従来の音声認識装置においては、規
格化等の所要の演算処理が単一のCPUによって行われ
ており、所要の作業を連続して行うことが困難であるこ
と、専用ハードウェアによるときには、入力条件のいか
ん等によりフィードバック動作が容易ではなくなること
、処理すべき単語数が多くなると、所望の高速処理が極
めて困難になること等の問題点があった。
この発明は、上記の問題点を解決するためになされたも
のであって、階層構造に接続された複数個のCPUによ
って所要のデータ処理部を構成し、対象の入力音声信号
に関する前処理を下位階層をなすCPU群で実行すると
ともに、音声認識のためのパターン・マッチング処理を
上位階層をなすCPU群で分担して実行することにより
、音声の認識処理が迅速かつ的確に行われるようにされ
た音声認識装置を提供することをB的とするものである
[課題を解決するための手段] この発明に係る音声認識装置は、 入力音声信号を対応の電気信号に変換する音声入力部; 前記入力音声信号の波形における特徴部分を抽出する特
徴抽出部:および、 階層構造をなして接続された複数個のCPUからなるデ
ータ処理部; を含んでなるものである。
[作用] この発明によれば、入力音声信号に間するノイズ除去の
ような前処理を下位階層をなすCPU群で実行するとと
もに、音声認識のためのパターン・マッチング処理を上
位階層をなすCPU群で分担して実行するようにされる
[実施例] 第1図は、この発明の第1実施例に係る音声認識装置を
示す概略楕或図である。この第1図において、音声入力
部(10)は適当なマイクロホン(IOA>およびマイ
ク・アンプ(10B)からなるものである。
そして、これに続けて、所要個数(この例においては4
個)の帯域通過フィルタ(以下BPFと略記)(11−
1)、 (11−2)、(11−3)、(11−4)は
、所定の接点構成部(12)を介して、適宜に対応する
4個のマルチプレクサ(以下MPと略記)(13−1)
、 (13−2)、(13−3)、(13−4)に接続
されている。そして、これらのM P (13−1)、
(13−2)、(13−3>、(13−4)の後段には
、それぞれに対応するA/D変換器(14〜1)、(1
4−2)、(14−3)、(14−4>が接続されてい
る。更に、これらのA/D変換器(14−1)、(14
−2)、(14−3)、(14−4>に続けて、#1階
層コンピュータを構成するC P U (15−1)、
(15−2)、(15−3)、(15−4>がそれぞれ
に接続されている。そして、CP U (15−1>お
よび(15−2)の後段にはCP U (16−1)が
接続され、CP U (15−3)および(15−4)
の後段にはCPU(16−2>が接続されていて、これ
らのCP U (16−1)および(16−2>により
#2階層コンピュータが構成されている。更に、これら
のCP U (16−1>および(16−2)の後段に
は、#3tllJIコンピュータを構成するC P U
 (17)が接続されている。また、上位コンピュータ
としてのホスト・コンピュータ(18)がCP U (
17)の後段に接続されている。
第2図は、この発明の第2実施例に係る音声認識装置を
示す概略tlI戒図である。この第2図において、音声
入力部(20)は適当なマイクロホン(20^)および
マイク・アンプ(20B)からなるものである。
そして、これに続けて、所要個数(この例においては5
個)の帯域通過フィルタ(以下BPFと略記)(21−
1)、(21−2)、・・・(21−5)には、それぞ
れに対応するA/D変換器(22−1)、 (22−2
)、・(22−5)が接続されている0次いで、これら
のA/D変換器(22−1)、(22−2)、・・・(
22−5)の後段には、それぞれに対応するC P U
 (23−1)、(23−2)、・・・(23−5)が
接続されて、入力音声信号に関するノイズ処理を行うた
めの#1階層コンピュータを構成している。そして、こ
の#1階層コンピュータの後段には、音声データ・バス
(24)を介して所要個数(この例においては8個)の
CPUCPU(25−1)、(25−2)、・・・(2
5−8)が接続されていて、これらにより#2階層コン
ピュータが構成されている。次いで、CP U (25
−1)および(25−2)の後段にはCP U (26
−1)が接続され、CP U (25−3)および(2
5−4)の後段にはCP U (26−2)が接続され
、CP U (25−5)および(25−6)の後段に
はCPU(26−3)が接続され、また、CP U (
25−7)および(25−8)の後段にはCP U (
2B−4)が接続されていて、これらのCP U (2
6−1)、(26−2)、(26−3)、(26−4)
により#3階層コンピュータが構成されている。
また、CP U (26−1)および(26−2)の後
段にはcpU (27−1)が接続され、CP U (
26−3)および(26−4)の後段にはCP tJ 
(27−2>が接続されていて、これらのCP U (
27−1)、(27−2)により#4階層コンピュータ
が構成されている。更に、これらのCPU(27−1)
および(27−2)の後段には、#5階層コンピュータ
を構成するC P U (28)が接続されている。ま
た、上位コンピュータとしてのホスト・コンピュータ(
29)がCP U (28)の後段に接続されている。
第3図は、この発明の第3実施例に係る音声認識装置を
示す概略横戊図である。この第3図において、音声入力
部〈30〉は適当なマイクロホン(30^〉およびマイ
ク・アンプ(30B)からなるものである。
そして、これに続けて、所要個数(この例においては4
個)の帯域通過フィルタ(以下BPFと略記)(31−
1>、 (31−2)、<3l−3)、(31−4)に
は、それぞれに、対応するA/D変換器(32−1)、
(32−2)、(32−3)、(32−4)が接続され
ている1次いで、これらのA/D変換器(32−1)、
(32−2)、(32−3>、<32−4)の後段には
、それぞれに対応するCPU(33−1)、(33−2
>、(33−3)、(33−4)が接続されていて、こ
れらにより#1階層コンピュータが構成されている。そ
して、CP U (33−1)および(33−2)の後
段にはCP U (34−1)が接続され、CPU(3
3−3)および(33−4)の後段にはCP U (3
4−2>が接続されていて、これらのCP U (34
−1)、(34−2)により#2111J!lコンピュ
ータが構成されている。
更に、これらのCP U (34−1)および(34−
2)の後段には、#3階層コンピュータを構成するCP
tJ(35)が接続されている。また、上位コンピュー
タとしてのホスト・コンピュータ(36〉がCP U 
(35)の後段に接続されている。
この第3実施例においては、次のような認識アルゴリズ
ムが実行される。
(イ)デジタル化された単語音声の登録BPF (31
−1)、(31−2)、(31−3)、 (31−4)
には、それぞれに、互いに異なる特定の中心周波数を有
する帯域が個別に割り当てられている。そして、この特
定の中心周波数に帯域化された単語音声波形を、対応の
単語音声のエネルギを表わす直流電圧波形に整形する。
そして、これを対応のA/D変換器(32−1)、(3
2−2)、(32−3)、(32−4>を介して、#I
N層コンピュータを構成するCPU(33−1)、(3
3−2)、(33−3)、(33−4)のメモリ部(図
示されない)に記憶させる。このようにして記憶された
単語音声データは、#2階層コンピュータをi戒する 
CP U (34−1)、 (34−2)、および、#
3階層コンピュータをi戒するC P U (35)を
経由してホスト・コンピュータ(36)に送られて、そ
のデイスプレィ部にグラフィック表示される。そして、
正確な登録がなされたか否かがここで確認される。例え
ば、ノイズ等が誤って登録されたとしても、ここでの確
認作業により直ちに変更または取り消しをすることがで
きる。
(ロ) #1階層コンピュータによる認識#1階層コン
ピュータを構成するCPU(33−1)、(33−2)
、(33−3)、(33−4)においては、複数個の単
語音声の登録を行ってから、新たに入力される音声波形
について、既に登録しである全ての単語音声の波形との
相関を求め、その結果を#2階層コンピュータを構成す
る CP U (34−1>、(34−2)・に送る。
(ハ) #2、#3階層コンピュータによる認識#2、
#311it層コンピュータにおいては、それぞれに、
下位の2台のCPUから送られた各単語との相関係数に
基づいて、新たに相間係数を総合した値の算出を行い、
これをより上位のCPUに送る。ここで、#3階層コン
ピュータを構成するC P U (35)は全ての周波
数から得られる相関係数の総合値を求めたことになる。
(ニ)ホスト・コンピュータによる動作ホスト・コンピ
ュータ(36)は、#3階層コンピュータをm成するC
 P U (35)から送られてきた各登録単語との相
関係数の総合値の最も大きなものを、発声単語と認識し
て適当に表示を行う。
[発明の効果〕 以上説明されたように、この発明に係る音声認識装置は
、 入力音声信号を対応の電気信号に変換する音声入力部; 前記入力音声信号の波形における特徴部分を抽出する特
徴抽出部;および、 階層構造をなして接続された複数個のCPCIからなる
データ処理部; を含んで構成されており、 入力音声信号に間するノイズ除去のような前処理を下位
階層をなすCPU群で実行するとともに、音声認識のた
めのパターン・マッチング処理を上位階層をなすCPU
群で分担して実行するようにされていることから、音声
の認識処理が迅速かつ的確に行われるという効果が奏せ
られるものである。
【図面の簡単な説明】
第1図は、この発明の第1実施例に係る音声認識装置を
示す概略構成図、第2図は、この発明の第2実施例に係
る音声認識装置を示す概略構成図、第3図は、この発明
の第3実施例に係る音声認識装置を示す概略構成図、第
4図は、−殻内な音声認識装置を原理的に示す概略構成
図、第5図は、従来の音声認識装置を示す概略構成図で
ある。 (10)は音声入力部、 (10^)はマイクロホン、 (IOB)はマイク・アンプ、 (11−1)、・・・(11−4)は帯域通過フィルタ
(BPF)、 (12)は接点tII或部、 (13−1)、  ・・・(13−4)はマルチプレク
サ(MP)、(14−1)、・・・(14−4)はA/
D変換器、(15−1>、・・・(15−4)は#1コ
ンピュータを構成するCPU、 (16−1>、(16−2)は#2コンピュータを構成
するCPU。 (17)は#3コンピュータを構成するCPU、(18
)はホスト・コンピュータ。

Claims (1)

    【特許請求の範囲】
  1. (1)入力音声信号を対応の電気信号に変換する音声入
    力部; 前記入力音声信号の波形における特徴部 分を抽出する特徴抽出部;および 階層構造をなして接続された複数個のC PUからなるデータ処理部; を含んでなる音声認識装置であって; 前記入力音声信号に関する前処理を下位 階層をなすCPU群で実行するとともに、音声認識のた
    めのパターン・マッチング処理を上位階層をなすCPU
    群で分担して実行するようにしたことを特徴とする音声
    認識装置。
JP1204804A 1989-08-09 1989-08-09 音声認識装置 Pending JPH0369996A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1204804A JPH0369996A (ja) 1989-08-09 1989-08-09 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1204804A JPH0369996A (ja) 1989-08-09 1989-08-09 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0369996A true JPH0369996A (ja) 1991-03-26

Family

ID=16496642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1204804A Pending JPH0369996A (ja) 1989-08-09 1989-08-09 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0369996A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005269649A (ja) * 2004-03-17 2005-09-29 Harman Becker Automotive Systems Gmbh マイクロフォンアレイを介してノイズを検知し、かつ、減少させる方法
WO2015059866A1 (en) 2013-10-24 2015-04-30 Toyota Jidosha Kabushiki Kaisha Wind detection apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005269649A (ja) * 2004-03-17 2005-09-29 Harman Becker Automotive Systems Gmbh マイクロフォンアレイを介してノイズを検知し、かつ、減少させる方法
WO2015059866A1 (en) 2013-10-24 2015-04-30 Toyota Jidosha Kabushiki Kaisha Wind detection apparatus

Similar Documents

Publication Publication Date Title
EP1973101B1 (en) Pitch extraction with inhibition of harmonics and sub-harmonics of the fundamental frequency
WO2007015776A2 (en) Instruction based parallel median filtering processor and method
JPH06215164A (ja) 乗算回路
JPH0369996A (ja) 音声認識装置
US20060195500A1 (en) Determination of a common fundamental frequency of harmonic signals
JP2003030656A (ja) 追加学習可能なパターン分離装置
EP1605439A1 (en) Unified treatment of resolved and unresolved harmonics
RU2005128564A (ru) Способ определения последовательности обработки функциональных модулей системы автоматизации и система автоматизации
Tadokoro et al. Pitch detection of duet song using double comb filters
JP3021065U (ja) ピッチ抽出装置
CN1707609B (zh) 已分辨和未分辨谐波的统一处理
CN115221953A (zh) 一种实验室实验仪器数据分析方法
JP2556369B2 (ja) アナログ波形のオーバーシュート位置検出方式
JPS6269120A (ja) 信号処理方式
JPS59214900A (ja) 音声認識装置
JPS61221980A (ja) 領域のラベル付け方式
CN115166429A (zh) 一种基于同步多元传感器的局部放电监测分析方法及系统
CN101499274A (zh) 声音信号的音高参考点筛选方法及系统
JPS61273095A (ja) デイジタル信号受信器
JPH01233497A (ja) ピッチ抽出装置
JPS63169525A (ja) ピツチ抽出装置
JPS58190999A (ja) 音声認識装置
JPH0816304A (ja) タブレット装置
JPH09190420A (ja) パターン認識装置
JPH0320926B2 (ja)