JPH0727519Y2 - Voice recognizer - Google Patents

Voice recognizer

Info

Publication number
JPH0727519Y2
JPH0727519Y2 JP1988150759U JP15075988U JPH0727519Y2 JP H0727519 Y2 JPH0727519 Y2 JP H0727519Y2 JP 1988150759 U JP1988150759 U JP 1988150759U JP 15075988 U JP15075988 U JP 15075988U JP H0727519 Y2 JPH0727519 Y2 JP H0727519Y2
Authority
JP
Japan
Prior art keywords
voice
noise
parameter
correction value
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1988150759U
Other languages
Japanese (ja)
Other versions
JPH0271900U (en
Inventor
靖彦 加藤
雅男 渡
太郎 仲上
正照 赤羽
幸 田中
泰 勝又
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP1988150759U priority Critical patent/JPH0727519Y2/en
Publication of JPH0271900U publication Critical patent/JPH0271900U/ja
Application granted granted Critical
Publication of JPH0727519Y2 publication Critical patent/JPH0727519Y2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【考案の詳細な説明】 〔産業上の利用分野〕 本考案は、例えば音声入力ワードプロセッサ等に用いて
好適な音声認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Industrial field of application] The present invention relates to a speech recognition apparatus suitable for use in, for example, a speech input word processor.

〔考案の概要〕[Outline of device]

本考案は入力音声信号から音声パラメータを求め、この
音声パラメータから騒音パラメータを差し引き、上記音
声パラメータのレベルに応じた補正値を加えて対数変換
することにより、上記音声レベルの大きさ部分の特徴を
失うことなく、且つ、音声レベルの小さな部分の特徴パ
ラメータの安定化をはかることのできるような音声認識
装置である。
The present invention obtains a voice parameter from an input voice signal, subtracts a noise parameter from the voice parameter, adds a correction value according to the level of the voice parameter, and performs logarithmic conversion to determine the characteristics of the portion of the voice level. It is a voice recognition device capable of stabilizing feature parameters in a low voice level portion without loss.

〔従来の技術〕[Conventional technology]

従来の音声認識装置において、騒音を測定して得られる
騒音パラメータを騒音の混入した音声パラメータより差
し引き、対数変換を行って音声の特徴パラメータを得る
ことにより、耐騒音性を向上させる方法がある。
In a conventional voice recognition device, there is a method of improving noise resistance by subtracting a noise parameter obtained by measuring noise from a voice parameter mixed with noise and performing logarithmic conversion to obtain a characteristic parameter of the voice.

しかし、対数変換の性質上、音声パラメータの値の小さ
い部分で変化量が大きく、上述のように音声パラメータ
から騒音パラメータを差し引いた信号を対数変換する
と、音声及び騒音の揺らぎ等が強調されてしまい、音声
の特徴パラメータが不安定になってしまう。
However, due to the nature of logarithmic conversion, the amount of change is large in the portion where the value of the voice parameter is small, and when the signal obtained by subtracting the noise parameter from the voice parameter is logarithmically converted, fluctuations of voice and noise are emphasized. , The characteristic parameter of voice becomes unstable.

〔考案が解決しようとする課題〕[Problems to be solved by the device]

ところで、上記音声パラメータから騒音パラメータを差
し引き、一定の補正値を加えてから対数変換を行うこと
によって上記音声及び騒音の揺らぎ等の影響を軽減する
方法が提案されている。
By the way, a method has been proposed in which the noise parameter is subtracted from the voice parameter, a constant correction value is added, and then logarithmic conversion is performed to reduce the influence of the voice and noise fluctuations.

しかし、この場合に音声レベルの大きな部分にも小さな
部分にも一定の補正値を加えているため、音声レベルの
小さな部分においては音声及び騒音の揺らぎ等を軽減で
きるが、逆に音声レベルの大きな部分は元々音声及び騒
音の揺らぎ等の影響を受けにくいにもかかわらず、上記
一定の補正値を加えることによりその特徴を失ってしま
っていた。
However, in this case, since a constant correction value is added to both the high and low voice levels, fluctuations of voice and noise can be reduced in the low voice level. Although the part was originally not susceptible to fluctuations of voice and noise, its characteristic was lost by adding the above-mentioned constant correction value.

本考案は上述のような課題に鑑みて成されたものであ
り、音声レベルの小さな部分での音声及び騒音の揺らぎ
等の影響を受けることなく、音声レベルの大きな部分で
の特徴を失うことがないような音声確認装置の提供を目
的とする。
The present invention has been made in view of the above-mentioned problems, and it is possible to lose the characteristics in a high voice level portion without being affected by fluctuations of voice and noise in a low voice level portion. The purpose is to provide a voice confirmation device that does not exist.

〔課題を解決するための手段〕[Means for Solving the Problems]

本考案は上述の課題を解決するために、騒音の混入した
入力音声信号から得られる音声パラメータより、上記騒
音に対応する騒音パラメータを差し引き、対数変換を施
して特徴パラメータを抽出する音声認識装置において、
上記騒音パラメータの差し引かれた対数変換前の音声パ
ラメータに補正値を重畳する補正値重畳手段と、上記入
力音声信号のパワーレベルを算出する音声パワーレベル
算出手段とを有し、上記音声パワーレベル算出手段から
の出力に応じて上記補正値を変化させることを特徴とし
ている。
In order to solve the above-mentioned problems, the present invention provides a speech recognition device that extracts a characteristic parameter by performing logarithmic conversion by subtracting a noise parameter corresponding to the noise from a speech parameter obtained from an input speech signal containing noise. ,
Comprising correction value superimposing means for superimposing a correction value on the audio parameter before logarithmic conversion from which the noise parameter has been subtracted, and audio power level calculating means for calculating the power level of the input audio signal. The correction value is changed according to the output from the means.

〔作用〕[Action]

本考案に係る音声認識装置では、入力音声信号から得ら
れる音声パラメータから騒音パラメータを差し引き、上
記入力音声信号のレベルに応じた補正値を加えることに
より、音声及び騒音の揺らぎ等の影響に左右されず低レ
ベル部分が安定し、且つ高レベル部分の特徴を失わない
音声の特徴パラメータを得ることができる。
In the voice recognition device according to the present invention, the noise parameter is subtracted from the voice parameter obtained from the input voice signal, and the correction value is added according to the level of the input voice signal, thereby being influenced by the influence of voice and noise fluctuations. It is possible to obtain a speech feature parameter in which the low-level portion is stable and the features of the high-level portion are not lost.

〔実施例〕〔Example〕

以下、本発明に係る音声認識装置の実施例について図面
を参照しながら説明する。
An embodiment of a voice recognition device according to the present invention will be described below with reference to the drawings.

第1図は本考案に係る音声認識装置の実施例を示す概略
的な回路図である。
FIG. 1 is a schematic circuit diagram showing an embodiment of a voice recognition device according to the present invention.

この第1図に示す音声認識装置において、入力音声信号
の入力される入力端子1は、通過帯域を異ならせた複数
個(n個)のパンドパスフィルタ21,22・・・2n及び上
記入力音声信号のパワーレベルを算出する音声パワー算
出回路3に接続されている。上記各バンドパスフィルタ
21,22・・・2nは、それぞれ整流回路41,42・・・4nに接
続されており、この各整流回路41,42・・・4nは、それ
ぞれローパスフィルタ51,52・・・5nに接続されてい
る。この各ローパスフィルタ51,52・・・5nを介した音
声信号は、それぞれ加算器61,62・・・6nに入力される
ように接続されている。この加算器61,62・・・6n
は、騒音パラメータ出力回路71,72・・・7nから出力さ
れる騒音パラメータ信号に負の係数(−α)を乗算する
係数乗算器81,82・・・8nを介した信号が入力されて、
実質的に減算を行うように接続されている。上記各加算
器61,62・・・6nからの出力信号は、加算器111,112・・
・11nに供給されており、この加算器111,112・・・11n
には補正値出力回路91,92・・・9nからの補正値信号に
係数(β)を乗算する係数乗算器101,102・・・10nを介
した信号が入力されるように接続されている。上記各加
算器111,112・・・11nからの信号は、それぞれ対数変換
回路131,132・・・13nに入力されており、この各対数変
換回路131,132・・・13nはそれぞれの出力端子141,142
・・・14nに接続されている。
In the speech recognition apparatus shown in FIG. 1, an input terminal 1 to which an input speech signal is input has a plurality (n) of pand pass filters 2 1 , 2 2 ... 2 n having different pass bands and It is connected to an audio power calculation circuit 3 for calculating the power level of the input audio signal. Each band pass filter
2 1, 2 2 ··· 2 n are respectively connected to the rectifier circuit 4 1, 4 2 ··· 4 n, the respective rectifier circuits 4 1, 4 2 ··· 4 n are each low-pass filter It is connected to 5 1 , 5 2 ... 5 n . The audio signals passed through the low-pass filters 5 1 , 5 2, ... 5 n are connected so as to be input to the adders 6 1 , 6 2, ... 6 n , respectively. This adder 6 1 , 6 2 ... 6 n is multiplied by a coefficient for multiplying the noise parameter signal output from the noise parameter output circuit 7 1 , 7 2 ... 7 n by a negative coefficient (−α). 8 1 , 8 2 ... 8 n signals are input,
Substantially connected to perform the subtraction. The output signals from the adders 6 1 , 6 2 ... 6 n are added by the adders 11 1 , 11 2 ...
・ Supplied to 11 n , this adder 11 1 , 11 2 ... 11 n
9 n is input with a signal via a coefficient multiplier 10 1 , 10 2 ... 10 n for multiplying the correction value signal from the correction value output circuit 9 1 , 9 2 ... 9 n by a coefficient (β) Are connected as. The signal from the adders 11 1, 11 2 ··· 11 n, respectively are inputted to the logarithmic converter 13 1, 13 2 · · · 13 n, the respective logarithmic converter 13 1, 13 2, ..13 n are output terminals 14 1 and 14 2
... Connected to 14 n .

なお、上記音声パワーレベル算出回路3からの出力がバ
イアス値コントロール回路12を介して各補正値出力回路
91,92・・・9nに送られている。
The output from the audio power level calculation circuit 3 is output to each correction value output circuit via the bias value control circuit 12.
It is sent to 9 1 , 9 2 ... 9 n .

次に動作説明をする。Next, the operation will be described.

この実施例においては、入力音声信号の各バンドパスフ
ィルタ21,22・・・2nの通過帯域毎に音声の特徴パラメ
ータを抽出し、例えば周波数スペクトラムのパターンマ
ッチングにより、音声認識を行うものを想定している。
In this embodiment, a voice characteristic parameter is extracted for each pass band of each band-pass filter 2 1 , 2 2 ... 2 n of an input voice signal, and voice recognition is performed by pattern matching of a frequency spectrum, for example. Is assumed.

すなわち、入力端子1には騒音の混入した入力音声信号
が供給されており、この入力信号は、それぞれのバンド
パスフィルタ21,22・・・2nを介すことによって、各通
過周波数帯域毎に分別される。この各バンドパスフィル
タ21,22・・・2nからの各周波数帯域別に分けられた上
記入力音声信号は、整流回路41,42・・・4n及びローパ
スフィルタ51,52・・・5nによってレベル検出されて、
騒音成分の混入した音声パラメータが得られる。これら
の各帯域毎の音声パラメータは、各加算器61,62・・・6
nに供給されて、上記入力音声信号の騒音に対応する騒
音パラメータがそれぞれ差し引かれる。すなわち、これ
らの加算器61,62・・・6nには、騒音パラメータ出力回
路71,72・・・7nからの騒音パラメータが係数乗算器81,
82・・・8nにより負(−α)の係数が乗算されて供給さ
れているため、上記音声信号から騒音パラメータを減算
する働きをしている。この騒音パラメータが差し引かれ
た音声パラメータは、加算器111,112・・・11nに入力さ
れ、補正値出力回路91,92・・・9nからの補正値(のβ
倍)が加算されている。ここで、入力端子1を介して入
力された入力音声信号の音声パワーレベルが音声パワー
レベル算出回路3から出力され、バイアス値コントロー
ル回路12を介して各補正値出力回路91,92・・・9nのバ
イアス値を制御するため、入力音声信号のレベルに応じ
て上記各補正値が変化する。
That is, the input terminal 1 is supplied with the input audio signal mixed noise, the input signal, each of the band pass filter 2 1, 2 by the intervention of the 2 · · · 2 n, each pass band It is separated by each. The input audio signals divided by the respective frequency bands from the band pass filters 2 1 , 2 2 ... 2 n are rectifier circuits 4 1 , 4 2 ... 4 n and low pass filters 5 1 , 5 2 ... The level is detected by 5 n ,
A voice parameter containing a noise component is obtained. The speech parameters for each band are added by each adder 6 1 , 6 2, ... 6
The noise parameters corresponding to the noise of the input audio signal are respectively subtracted by being supplied to n . That is, these adders 6 1, 6 2, ... 6 n, the noise parameter output circuit 7 1, 7 2, ... 7 noise parameter coefficient multiplier 8 1 from n,
Since it is supplied after being multiplied by a negative (-α) coefficient by 8 2 ... 8 n, it serves to subtract the noise parameter from the audio signal. The voice parameter from which this noise parameter has been subtracted is input to the adders 11 1 , 11 2 ... 11 n , and the correction value (β of the correction value output circuit 9 1 , 9 2 ... 9 n
Double) has been added. Here, the audio power level of the input audio signal input through the input terminal 1 is output from the audio power level calculation circuit 3, and the correction value output circuits 9 1 , 9 2 ... Through the bias value control circuit 12.・ Because the bias value of 9 n is controlled, the above correction values change according to the level of the input audio signal.

すなわち、第2図に示す入力音声信号の音声パワーレベ
ルの変化〔第2図(a)〕に対する上記補正値の変化
〔同図(b)〕を用いて説明すると、音声パワーレベル
の大きくなる部分では上記補正値を小さくし、逆に音声
及び騒音の揺らぎ等の影響を受けやすい上記音声パワー
レベルの小さくなる部分では上記補正値を大きくして、
上記騒音パラメータの差し引かれた音声信号に重畳して
いる。そして、このような補正値が重畳された加算器11
1,112・・・11nからの音声パラメータは、それぞれ対数
変換回路131,132・・・13nに入力され、対数変換処理さ
れることにより、入力音声レベルの小さい部分では補正
値が大きいため、音声及び騒音の揺らぎ等の影響を受け
ることがなく、且つ入力音声レベルの大きい部分では補
正値が小さいため、音声の特徴を失わないような音声の
特徴パラメータを出力端子141,142・・・14nから取り出
すことができる。
That is, the change in the correction value [FIG. 2 (b)] with respect to the change in the audio power level of the input audio signal [FIG. 2 (a)] shown in FIG. 2 will be explained. Then, the correction value is reduced, and conversely, the correction value is increased in a portion where the voice power level is easily affected by fluctuations of voice and noise.
It is superimposed on the audio signal from which the noise parameters have been subtracted. Then, the adder 11 on which such a correction value is superimposed
1, 11 2 speech parameters from · · · 11 n are respectively inputted to the logarithmic converter 13 1, 13 2 ··· 13 n , by being logarithmic conversion process, the correction value is a small portion of the input speech level Is large, it is not affected by fluctuations in voice and noise, and since the correction value is small in a portion where the input voice level is high, a voice characteristic parameter that does not lose the voice characteristic is output terminal 14 1 , It can be taken out from 14 2 ... 14 n .

〔考案の効果〕[Effect of device]

本考案に係る音声認識装置は、入力音声信号のパワーレ
ベルに応じた補正値を騒音パラメータの差し引かれた音
声パラメータに重畳し、対数変換処理を行うことによ
り、音声及び騒音の揺らぎ等の影響を受けず入力音声レ
ベルの小さい部分が安定し、且つ該入力音声レベルの大
きい部分の特徴を失わない音声の特徴パラメータを取り
出すことができる。
A speech recognition apparatus according to the present invention superimposes a correction value according to a power level of an input speech signal on a speech parameter from which a noise parameter has been subtracted, and performs a logarithmic conversion process to reduce the influence of fluctuations in speech and noise. It is possible to extract a characteristic parameter of a voice that is stable without being received, and that does not lose the characteristics of a portion with a high input voice level.

【図面の簡単な説明】[Brief description of drawings]

第1図は本考案に係る実施例の音声認識装置を示す概略
的な回路図、第2図は入力音声信号と補正値の関係を説
明するための波形図である。 1……入力端子 21,22・・・2n……バンドパスフィルタ 3……音声パワーレベル算出回路 61,62・・・6n……加算器 71,72・・・7n……騒音パラメータ出力回路 81,82・・・8n……係数乗算器 91,92・・・9n……補正値出力回路 101,102・・・10n……係数乗算器 111,112・・・11n……加算器 12……バイアス値コントロール回路 131,132・・・13n……対数変換回路 141,142・・・14n……出力端子
FIG. 1 is a schematic circuit diagram showing a speech recognition apparatus according to an embodiment of the present invention, and FIG. 2 is a waveform diagram for explaining the relationship between an input speech signal and a correction value. 1 …… Input terminal 2 1 , 2 2・ ・ ・ 2 n …… Bandpass filter 3 …… Voice power level calculation circuit 6 1 , 6 2・ ・ ・ 6 n …… Adder 7 1 , 7 2・ ・ ・7 n …… Noise parameter output circuit 8 1 , 8 2・ ・ ・ 8 n …… Coefficient multiplier 9 1 , 9 2・ ・ ・ 9 n・ ・ ・ Correction value output circuit 10 1 , 10 2・ ・ ・ 10 n・ ・ ・… Coefficient multiplier 11 1 , 11 2・ ・ ・ 11 n …… Adder 12 …… Bias value control circuit 13 1 , 13 2・ ・ ・ 13 n …… Logarithmic conversion circuit 14 1 , 14 2・ ・ ・ 14 n ...... Output terminal

───────────────────────────────────────────────────── フロントページの続き (72)考案者 赤羽 正照 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)考案者 田中 幸 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)考案者 勝又 泰 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (56)参考文献 特開 昭56−88199(JP,A) 実開 昭56−159400(JP,U) 特公 昭63−34477(JP,B2) 特公 昭61−2960(JP,B2) ─────────────────────────────────────────────────── ─── Continuation of front page (72) Masateru Akabane Masateru Akabane 6-735 Kita-Shinagawa, Shinagawa-ku, Tokyo Sony Corporation (72) Inventor Yuko Tanaka 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Sony Corporation (72) Inventor Yasushi Katsumata 6-35 Kitashinagawa, Shinagawa-ku, Tokyo Sony Corporation (56) References JP-A-56-88199 (JP, A) 159400 (JP, U) JP 63-34477 (JP, B2) JP 61-2960 (JP, B2)

Claims (1)

【実用新案登録請求の範囲】[Scope of utility model registration request] 【請求項1】騒音の混入した入力音声信号から得られる
音声パラメータより、上記騒音に対応する騒音パラメー
タを差し引き、対数変換を施して特徴パラメータを抽出
する音声認識装置において、 上記騒音パラメータの差し引かれた対数変換前の音声パ
ラメータに補正値を重畳する補正値重畳手段と、 上記入力音声信号のパワーレベルを算出する音声パワー
レベル算出手段とを有し、 上記音声パワーレベル算出手段からの出力に応じて上記
補正値を変化させることを特徴とする音声認識装置。
1. A voice recognition device for subtracting a noise parameter corresponding to the noise from a voice parameter obtained from an input voice signal containing noise and performing logarithmic conversion to extract a characteristic parameter, wherein the noise parameter is subtracted. And a correction value superimposing means for superimposing a correction value on the audio parameter before logarithmic conversion, and an audio power level calculating means for calculating the power level of the input audio signal, according to the output from the audio power level calculating means. A voice recognition device, characterized in that the correction value is changed.
JP1988150759U 1988-11-21 1988-11-21 Voice recognizer Expired - Lifetime JPH0727519Y2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1988150759U JPH0727519Y2 (en) 1988-11-21 1988-11-21 Voice recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1988150759U JPH0727519Y2 (en) 1988-11-21 1988-11-21 Voice recognizer

Publications (2)

Publication Number Publication Date
JPH0271900U JPH0271900U (en) 1990-05-31
JPH0727519Y2 true JPH0727519Y2 (en) 1995-06-21

Family

ID=31424185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1988150759U Expired - Lifetime JPH0727519Y2 (en) 1988-11-21 1988-11-21 Voice recognizer

Country Status (1)

Country Link
JP (1) JPH0727519Y2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5688199A (en) * 1979-12-21 1981-07-17 Hitachi Ltd Pattern pretreatment method in voice identifier
JPS56159400U (en) * 1980-04-24 1981-11-27
DE3419477C1 (en) * 1984-05-24 1985-11-28 Hörmann KG Antriebs- und Steuerungstechnik, 4834 Harsewinkel Gearbox for converting a rotary into a translatory movement
JPS6334477A (en) * 1986-07-29 1988-02-15 松下冷機株式会社 Vegetable storage vessel for refrigerator

Also Published As

Publication number Publication date
JPH0271900U (en) 1990-05-31

Similar Documents

Publication Publication Date Title
CN1801611B (en) Bass boosting processing method and device
US4809331A (en) Apparatus and methods for speech analysis
JPH0727519Y2 (en) Voice recognizer
JPH0744135Y2 (en) Contour enhancement circuit
JPS56106433A (en) Noise reducing circuit
JPH069000B2 (en) Voice information processing method
JP2744006B2 (en) Nonlinear A / D conversion circuit and non-linear A / D conversion method
US4590615A (en) Multipath distortion reducing circuit
JPH01126826A (en) A/d converting equipment with a/d converter
JPS60188A (en) Acc circuit
JPS6165299A (en) Voice recognition equipment
JPS6145628Y2 (en)
JPH0461359B2 (en)
US4914749A (en) Method capable of extracting a value of a spectral envelope parameter with a reduced amount of operations and a device therefor
JP2549449B2 (en) Noise reduction circuit
JPH0472907A (en) Coefficient setting method for noise shaping filter
JPS6041886B2 (en) noise reduction device
JP3089477B2 (en) Quantizer and quantization method
JPH0277659A (en) Circuit for measuring signal-to-noise ratio
JPS6141200Y2 (en)
EP0847559A1 (en) Methods and systems for designing and making signal-processor circuits with internal companding, and the resulting circuits
JPH06164275A (en) Signal processor
JPH1169480A (en) Sound gathering device
JPS6115665Y2 (en)
JPS6246348Y2 (en)