JPS5862700A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5862700A
JPS5862700A JP56162203A JP16220381A JPS5862700A JP S5862700 A JPS5862700 A JP S5862700A JP 56162203 A JP56162203 A JP 56162203A JP 16220381 A JP16220381 A JP 16220381A JP S5862700 A JPS5862700 A JP S5862700A
Authority
JP
Japan
Prior art keywords
noise
input
voice
frequency distribution
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56162203A
Other languages
English (en)
Inventor
信之 寺浦
野尻 忠雄
岡本 敦稔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
NipponDenso Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NipponDenso Co Ltd filed Critical NipponDenso Co Ltd
Priority to JP56162203A priority Critical patent/JPS5862700A/ja
Publication of JPS5862700A publication Critical patent/JPS5862700A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は、例えば自動車等の車輛、あるいは工場内等
の騒音環境内に設置し使用される音声認識・装置に関す
る。
人間の話声前によって指令を発生し、各種装置を制御す
るために音声認識装置が用いられる。
この種の音声認識装置においては、特定話者装置ではあ
らかじめその特定される話者の音声ノ4ターンを学習し
、また不特定話者装置ではあらかじめ標準的゛な音声・
やターンを設定しておき、これら音声パターンと入力さ
れた音声の音声ツタターンとのAター/マ、チングを行
なうことによって、音声W1m操作が行なわれる。す危
わち、このような装置にあっては、入力され丸音がすべ
て話者の発声した音声であり、ナベて認識のために意味
のあるものとして取9扱われてきた。
したがって、この種の音声llj!!識装置は、話者か
らの音声のみが入力される静かな環境、あるいは騒音が
存在して4その騒音が常に一定の状態で存在する特定さ
れる環境においてのみ効果的に使用できるものである。
しかし、音声g#装置は上記のような特定される環境下
のみではなく、例えば自動車等の車輛内あるいは工場内
等に設置することが広く賛望される。すなわち、音声に
よって車輛の運転等の制御あるいは工場内の機械装置等
の制御を行なうようにするものがあるが、この場合は被
制御装置若し・〈は設置される物体それ自体KM音の発
生源を有する状態となるものであり、また例えば車輛の
場合には走行状態によってエンジンルーム等から発生す
る騒音の音圧レベルとこの騒音の周波数分布が時々刻々
に変化するものである。したがって、前述し丸ように静
寂な場所に設置され使用することを前提とした装置、あ
るいは騒音のレベルおよび周波数分布が時間的にほぼ一
様である場所に設置され使用されることを前提とし九装
置では、時間的に変動する鰻音壌壇に設置したのでは、
その変動する騒音によって音声成分相互の/4ターンマ
、チングを行なうことができない。すなわち、音声認識
装置として機能させることができない。
この発明は、上記のような点に鑑みなされたもので、時
間的に変化する音圧レベル、周波数分布O・−音櫨境、
例えば車輛内、工場内等であっても、音声による入力を
確実にgtすることができるようにする音声11i1識
装置を提供しようとするものである。
すなわち、この発明に係る音声gd&装置は、騒音発生
源の状態を検出する検出器を設けると共に、上記騒音発
生源の状態に対応した発生騒音の周波数分布成分を記憶
設定し、上記検出器の検出信号にもとすき上記記憶され
た周波数分布成分を推定して読み出し、この推定された
周波数分布成分をマイクロホ/で捕捉され九入力音声の
周波数分布成分から差し引いて、g識すべき音声入力の
周波数分布成分を得るようにしたものである。
以下図面を参照してこの発明の一実施例を説明する。こ
の実施・例は、自動車等の車輛に装備される車載用音声
g識装置の場合を示すもので、第1図はその構成を示す
。図において1ノはマイクロホンであり、このマイクロ
ホン1ノは車室内に設置され、音声入力と共にその車室
内に存在するエンジンルームからの騒音、エアコン装置
のファン等からの騒音等も同時に捕捉される。このマイ
クロホン11で捕捉された音声に対応する音声入力信号
は、増幅器12で適宜増幅され、それぞれ通過周波数帯
琥を順次異ならせるように設定した複数、例えば15段
にしたパントノ母スフィルタzs−i、1s−x・・・
13−nに並列的に供給される。そして、このバンド/
譬スフィルタ13−1〜13−nそれぞれを通過した信
号は、それぞれ検波器14−1゜14−2・・・14−
nに供給され、パントノ臂スフィルタ13−1〜13−
nそれぞれに対応する周波数分布におけるそれぞれ信号
成分レベルに対応した信号とされる。すなわち、パント
ノ々スフィルタ13−1〜IS−胞および検波器14−
1−14− n部分で、入力音声信号の周波数分析が行
なわれるもので、この検波器14−1〜14−nそれぞ
れからの出力信号は、マルチブレフサ15に結合して順
次取り出すようにし、このマルチプレクサ15からの出
力信号はAy’t)変換器16でディジタル信号に変換
して演算処理を行なうCPU 17に供給する。
このCPU 17には、タイマー18からクロ。
りが与えられ、サン!リングのための割り込み指令等を
発するもので、上記マルチプレクサ15はCPU 1 
Fによって制御される。
また、この装置にはアクセル踏み込み量、ゼヤチェンジ
の位置、エンジンの回転数、ファンスイッチの位置等の
、車輌における騒音発生源の状態を検出する種数の検出
器19 m + 19 b +19c、19dが設けら
れ、これら検出器19鳳〜19dの検出信号は、CPU
 J rに供給される。このCPU I Fには、!ロ
グラムを格納するROM 20、上記検出器19m−J
#dそれぞれによって検出された信号とマイクロホン1
1に入力される騒音の周波数成分を対応ず仕るテーブル
を記憶するROM 21 、および前記A/1)変換さ
れた入力音声信号の周波数分布成分のサン!リングデー
タ等を一時記憶するRAM22が付属されている。そし
て、このCPU J Fによって、例えばエアコン23
等の出力装置を制御するものである。24はエアコン2
3を手動で制御するスイッチである。
すなわち、上記のように構成される音声ia!繊装置に
おいては、マイクロホン1ノによって車室内の音声が捕
捉され、電気的音声信号に変換サレテノぐンドノ譬スフ
イルター3−1〜13−1に供給され、その各出力信号
が検波器14−1〜14−mで検波されるようになる。
したがりて、この検波器14−1〜14−nからの出力
信号は、入力音声信号の周波数分布を示すようになる。
そして、この周波数分布を示す検波器14−1〜14−
 nの出力信号は、CPU J ’/の指令によって1
ルチルクサ15およびυ変換器16でフィシタルデータ
としてサン!す/グされ、RAMJJに一時記憶される
ようになる。
・□;・ このサン!リングされ九入力音声信号の各周波数成分は
、話者によって発声された音声の周波数成分のみではな
く、車室内に存在する騒音、すなわちエンジンルーム内
から発生する騒音、車室内のエアコンのファン等の騒音
の成分を含んでいる。したがって、入力された音声のサ
ン!リングデータのすべてが意味のあるr−夕ではなく
、これら騒音の成分、すなわち無意味な成分を、上記サ
ン!リングされた各周波数成分から差し引くことによっ
て、有用の話者の音声の周波数分布成分を知ることがで
きる。
ここで、上記騒音による周波数成分は次のようにして推
定する。すなわち、騒音をエンジンルーム内から発生す
る音と、車室内から発生する音に分類する。エンジンル
ーム内から発生する音は、エンジンの回転数および負荷
を検出する検出器により検出された量と、エンジンルー
ム内から発生し車室内のマイクロホン11に捕捉される
音の周波数分布および音圧レベルとを、あらかじめ実験
によって対応ずけておき、ROM1:″ 2ノに記憶設定しておく。そして、認識動作時において
は、検出器19m、19b、J9eの検出器からROM
 21に記憶された変換テーブルを用いて、エンジンル
ーム内で発生し、マイクロホン11で捕捉される騒音の
各周波数成分を推定するものである。
また、車室内から発生する音は、車室内に設けられ九各
スイッチによってその動作が規定されている。そこで、
この音を発生する機能部品の動作を規定するスイッチの
状態を検出器194によって検出し、その検出量とマイ
クロホン1ノに捕捉される音の周波数分布および音圧レ
ベルの対応を、前記ニンジンルーム内から発生する音の
場合と同様にROM j 1に記憶しておき、−織動作
時に検出器194の検出量からROM21に記憶され九
変換テーブルを用いて、各周波数成分を推定するもので
ある。
そして、サン!リングされた入力音声信号の周波数成分
から、上記推定された騒音成分を差し引いた残りの周波
数成分からなる入力音声71ターンと、あらかじめ学習
若しくは設定され九音声/lターンとのパター/マ、チ
/グを行なうことにより、音声の認識を行なうようにな
るものである。
この°実施例では、車輛の走行状態を代表してエンジン
騒音をあられすことができる量として、アクセルの踏み
込み量、ギヤのチェンジ位置、エンジンの回転数をとり
、また車室内騒音源としてファン音をとりそれを代表す
る量としてファンスイッチの位置をとるようにし、これ
ら騒音源の状態が検出器1 ’9 a〜19dで検出さ
れるものである。そして、認識装置の駆動装置としてエ
アコン23をとった場合において、その2−夕処理の過
程は第2図に示す流れ図のようになる。
すなわち、音声認識装置が作動を開始するスタート状態
では、初期設定として有効入力カウンタを零にセットし
、割り込み待ちの状態とされる。そして、タイマー18
からの割り込み「1」によってステ、frooに進み、
検出器19mからアクセルの踏み込み量を検出し、この
検出量をディジタル量としてサン!リングする。ここで
この検出量を例えばSノとする。次に、ステ、fzor
に進み検出器19bからチェンジ位置、例えば「ロー」
「セカンド」「ト、!」等の別を検出し、その位置を代
表する量S2としてサンプリングする。さらに、ステ。
f102に進み、検出器19cによってエンジンの回転
数を検出し、その検出量をディジタル量S3としてサン
プリングする。
そして、次にステラf103に進み、あらかじめ実験に
より定められROM j I K記憶されたテーブルを
用いて、上記ステ、fl 00 、101゜102で検
出された検出量81,82.B3に対応して、車輛走行
に基因して発生し、マイクロホン11に捕捉されてCP
U i yに供給される入力音声信号の各周波数成分に
含まれるようになる騒音の各周波数成分を推定する。こ
れら走行に基因する騒音の各周波数成分■は、次式で表
現される。
■・ = (ダ;訓−・・ 、−)、  ・・・ 、 
豐:5 )ここで、!)は走行に基因する騒音の1番目
のバンドパスフィルタ13−fの検波出力がん市変換さ
れると推定される値であり、この式はパントノ譬゛スフ
ィルタ13−ノ〜J、y−nが15段に構成された場合
を示している。
次に、ステラf104に進み、ファンの回転数を規定す
るファンスイッチの位lft−検出し、それを代表する
値を84とする。そして、ステップ105に進み前記ス
テ、ノ103と同様にあらかじめ実験によって定められ
ROM J Jに記憶されたテーブルを用い、ステツノ
104で検出された検出量S4に対応して、ファン音が
マイクロホン1ノで捕捉され周波数分析されてディジタ
ル1111としてCPU 17によってサンプリングさ
nる谷間波数成分の値を推定する。これらの各成分は次
式で表現される。
Vム=(咋弓、・・・、す、・・、Vτ5)ここで、す
は11フアン音の1番目の・櫂ンド2fスフィルタ13
−fの検出出力が検波されA/b変換されると推定され
る値である。そして、以上で割り込み「1」の演算を終
了し、再び割り込み待ちとなる。
次に、タイマーJ8からの割り込み信号による割り込み
「2」によって、ステ、ゾ106に進む。すなわち、上
記割シ込み信号によってCPU J 7からマルチルク
サ15に指令を与え、その時マイク・ロホン11に入力
されバンドパスフィルタ13−1〜13−nおよび検波
器14−1〜14−nから検出される入力音声に対応す
る各周波数成分に対応する検出信号を順次取シ出し、Φ
変換器16でディジタル値に変換してCPU 1 Fで
入力音声のサンプリングを行なう。このサンプリングは
前述したように15段にしたパントノ臂スフィルタ13
−1〜13−勘のそれぞれ検波出力について行なうもの
で、これらのす/!リングデータは次式であられされる
VIN=<911”71・・・1号、・・・、!電、)
ここで、すは入力音の1番目のパンp /lスフィルタ
zs−fの検波出力のサンプリング値であるつ この割り込み「2」を前記割り込み「1」と独立して設
けたのは、入力音声のサンプリングを定時間、例えば2
0m秒単位で行なうためである。
次に、ステップ107に進み、入力音声に含まれる各周
波数成分の中で、走行に基因する騒音およびファン音を
除いた命令音声の各周波数成分を推定する。この命令音
声の各周波数成分は、次式であられされる。
Vgyy==(ml、 、 112. ・” 、 l/
、 −、W、5 )ここで、1fは命令音声の1番目の
パントノ譬スフィルタ13−fの検波出力の推定値であ
る。
そして、この命令音声の各周波数成分Vgyrは次式に
よって与えられる。
Vmyy =VIN Vg VA これを各成分について表現すると v!=リーν)−り となる。ただし、マイナス(−)となった成分vfにつ
いては、 9t = 0 とおく。以上の過程で割り込み「2」を終了し、メイン
ルーチンに戻る。
次に、ステ、frogに進み、有効な音声入力がちった
か、否かを判定する。すなわち、推定された命令音声の
各周波数成分について、音声ノヤワーPを S とし、あらかじめ定められたしきい値P・に対してrp
>psJ となった場合、有効な音声入力有りとして、
音声入力が継続していると判定する。すなわち、有効入
力カウンタに「1」を加えて割り込み「l」待ちとなり
、タイマー18からの割り込み信号による割り込みによ
って再びステ、7’700に戻る。まえ、「p<p・」
の場合は、今のサン!リングデー□りが有効な音−入力
では表かつ九と判定し、ステラfJO9に進み、このス
テ、f109ではすでに有効な音声入力が規定時間以上
存在したか否かを判定する・すなわち、有効な音声入力
の時間を示す有効入力カウンタNがあらかじめ定められ
た値N・に対して、「NくN・」の場合は、有効な巣語
音声入力がなされなかっ九と判定し、有効入力カウンタ
を零にセ、トシて割シ込み待ちとなる。そして、タイマ
ーノ8の割り込み信号による割り込みrlJによってス
テラf100に進む。
ステラf109で「N>No」と判定された場合は、有
効な羊語音戸入力があり、且つ入力は終了したと判定し
てステツノ110に進む。
このステツノ110は、命令音声の周波数分布Vg F
 Fの時間的推移4ター/と、あらかじめ学習若しくは
設定されたノ母ターフ、例えば「エアコンオン」 「エ
アコンオン」 「オ/ト1ア、!」「オンドダウ/」「
すt′−イクル」「フレ、シエ」等のエアコン23に対
する制御命令に対応する音声の周波数分布の時間的推移
ノ9ターンとの・ダターンマ、チングを行なう。このi
4ターンマツチングは、ダイナミ、り!ログラミング(
=[) p)を用いて、入力命令音声の/譬ターンと最
っとも類似しているノ譬ターンを選び出す。入力命令音
声のノ1メーンと各学習若しくは設定され九パターンと
の類似度はDPによって計算し、i番目の・母ターンに
、対する類似度をQlとし、値が大きい程類似度が大き
いものとする。そして、Qlの中で最大の値をQ(1)
とし、2番目に大きい値をQ(2)とする。
次に、ステ、!11ノに進み、あらかじめ定められたし
きい値Qt、Qoに対して Q(1)<QT である場合には入力命令音声に対応するノ4ターンは存
在しないと判定し、また Q(1) −Q(2) < Q。
である場合は、入力命令音声が2つのノターンのいずれ
に対応するのか、断定できないと判定し、有効入力カラ
/りを零にセットして割り込み待ちとする本のであり、
タイマー18からのiooに進む。
そして、 Q(1)>QT であり、且つ −Q(1) −Q(2)ンQ。
である場合に、入力命令音声は類似度Q(1)である・
母、夕、−ンと同じであると判定し、ステツノ112に
進む。このステツノ112ではノ4ターンマツチングに
よって固定された音声に対応する操作を、エアコン23
に対して行なう。そして、これによって音声v!d操作
に伴なう手続きが終了される。
尚、以上説明した実施例では、複数のバンドパスフィル
タを用いて周波数分析を行なったが、これは音声波形そ
のもののす/!リングを行ない、一定数(例えば256
)のデータ毎に高速フーリエ変換(FFT )を行なう
ことによって周波数分析を行なうようにしても同様に1
!施することができる。ま走、実施例では車輛の機能部
を検出し、受動騒音を推定することも可能であり、この
騒音検出は任意必要に応じて選定できるものである。
を九、実施例ではこの音声認識装置を自動車等の車輛に
載置する場合について示したが、これは工場内等に設置
する場合も同様に実施可能なもので、この場合は工場内
の機械の状態等を検出し、機械騒音等を推定するのであ
る。、以上のようにこの発明によれば、音声認識装置を
走行する車輛内、工場内等の時間的に一様性を有さない
騒音環境内に設置し九場合でも、各騒音源の音声Wlf
I&に対する寄与を容易に推定することができ、したが
ってその寄与を大幅に減少させて音声認識の一鐵率の向
上を効果的にはかることができるものである。
【図面の簡単な説明】
第1図はこの発明の一実11114.例に係る音声im
繊装置を説明する構成図、第2図は上記装置の認識動作
を説明する流れ図である。 1ノ・・・マイクロホン、13−1.〜13−1・・・
パントノ母スフィルタ、14−1〜14−n・・Φ検波
器、15・・・マルチ!レクサ、ノロ・・・A/l)変
換器、17 ・−CPU、  7 g ・・タイマー、
19m+19b・・・検出器、20.21・・・ROM
、j!・・・RAM。 出願人代理人  弁理士 鈴 江 武 彦1を 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 騒音発生源の状態を検出する検出器と、上記騒音発生源
    の状態に対応する発生騒音の周波数分布成分を記憶設定
    した記憶装置と、上記検出器の検出信号にもとすき上記
    記憶装置から騒音の周波数分布の各成分を推定し読み出
    す手段と、上記騒音環境内に設けられ1iai繊すべき
    音声を入力スルマイクロホンと、このマイクロ小ンから
    の入力音声信号の周波数分布成分を検出する周波数分析
    手段と、この周波数分析手段で得られた周波数分布成分
    から上記推定された周波数分布成分を差し引く手段とを
    具備し、この差し引かれた結果の周波数分布成分にもと
    すき音声認識するようにし九ことを特徴とする音声g識
    装置0
JP56162203A 1981-10-12 1981-10-12 音声認識装置 Pending JPS5862700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56162203A JPS5862700A (ja) 1981-10-12 1981-10-12 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56162203A JPS5862700A (ja) 1981-10-12 1981-10-12 音声認識装置

Publications (1)

Publication Number Publication Date
JPS5862700A true JPS5862700A (ja) 1983-04-14

Family

ID=15749930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56162203A Pending JPS5862700A (ja) 1981-10-12 1981-10-12 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5862700A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03206499A (ja) * 1989-10-04 1991-09-09 Matsushita Electric Ind Co Ltd 音声認識装置
JP2004163458A (ja) * 2002-11-08 2004-06-10 Sony Corp 音声認識装置
JP2017097206A (ja) * 2015-11-26 2017-06-01 マツダ株式会社 車両用音声認識装置
JP2020085836A (ja) * 2018-11-30 2020-06-04 東芝産業機器システム株式会社 分析装置および分析プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55117197A (en) * 1979-03-01 1980-09-09 Mitsubishi Electric Corp Voice input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55117197A (en) * 1979-03-01 1980-09-09 Mitsubishi Electric Corp Voice input device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03206499A (ja) * 1989-10-04 1991-09-09 Matsushita Electric Ind Co Ltd 音声認識装置
JP2004163458A (ja) * 2002-11-08 2004-06-10 Sony Corp 音声認識装置
JP2017097206A (ja) * 2015-11-26 2017-06-01 マツダ株式会社 車両用音声認識装置
JP2020085836A (ja) * 2018-11-30 2020-06-04 東芝産業機器システム株式会社 分析装置および分析プログラム

Similar Documents

Publication Publication Date Title
US10089989B2 (en) Method and apparatus for a low power voice trigger device
US4802231A (en) Pattern recognition error reduction system
CN110880329B (zh) 一种音频识别方法及设备、存储介质
CN110232933B (zh) 音频检测方法、装置、存储介质及电子设备
CN113539294A (zh) 一种生猪异常状态声音采集及识别方法
CN110570870A (zh) 一种文本无关的声纹识别方法、装置及设备
CN1678129B (zh) 啸叫频率分量加重方法及设备
JPS5862700A (ja) 音声認識装置
CN109841208A (zh) 一种应用于吸油烟机中的语音增强方法
CN109377982A (zh) 一种有效语音获取方法
Noh et al. Smart home with biometric system recognition
CN116364108A (zh) 变压器声纹检测方法及装置、电子设备、存储介质
US5946649A (en) Esophageal speech injection noise detection and rejection
CN115132191B (zh) 基于机器学习的抗噪声语音识别方法及系统
CN111862991A (zh) 一种婴儿哭声的识别方法及系统
WO1991011802A1 (en) Time series association learning
Thakur et al. Design of Hindi key word recognition system for home automation system using MFCC and DTW
JPH0527751A (ja) 自動採譜装置等に用いられるテンポ抽出装置
EP0125422A1 (en) Speaker-independent word recognizer
JPS58149099A (ja) パタ−ン認識方式
Pramanik et al. Speaker independent word recognition using cepstral distance measurement
JP2975808B2 (ja) 音声認識装置
CN117894335A (zh) 一种音乐的处理方法、系统和计算机设备
JPS6227798A (ja) 音声認識装置
CN115798521A (zh) 基于双向循环链表的语音检测方法