JPS61278000A - 有声音無声音判別装置 - Google Patents
有声音無声音判別装置Info
- Publication number
- JPS61278000A JPS61278000A JP60119685A JP11968585A JPS61278000A JP S61278000 A JPS61278000 A JP S61278000A JP 60119685 A JP60119685 A JP 60119685A JP 11968585 A JP11968585 A JP 11968585A JP S61278000 A JPS61278000 A JP S61278000A
- Authority
- JP
- Japan
- Prior art keywords
- voiced
- discrimination
- threshold
- cepstrum
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、ケプストラム法によって音声の分析を行う
音声分析装置における有声音無声音判別装置に関するも
のである。
音声分析装置における有声音無声音判別装置に関するも
のである。
一般に音声の特徴にその周波数スペクトル、すなわち、
音声信号の各周波数成分の分布によって表される。従っ
て、音声の特徴を表わすパラメータはスペクトルを何ら
かの形で表現する物理量を用いる。ケプストラムに対数
スペクトルのコサイン展開で求められるパラメータで一
般的に(1)式で表現される。
音声信号の各周波数成分の分布によって表される。従っ
て、音声の特徴を表わすパラメータはスペクトルを何ら
かの形で表現する物理量を用いる。ケプストラムに対数
スペクトルのコサイン展開で求められるパラメータで一
般的に(1)式で表現される。
但し、5(Klは対数スペクトル、
kは周波数、
C(m)はケプストラム、
である。
そして、第5図(均は音声信号At−フーリエ分析・対
数スペクトルで表わし友ものである。例えば(1)式に
おいて、ケプストラム00次項&。)は第6図(A)K
示すように対数スペクトル5(K)の平均値であり、C
(1)はS(。のコサインの一次の成分となる。
数スペクトルで表わし友ものである。例えば(1)式に
おいて、ケプストラム00次項&。)は第6図(A)K
示すように対数スペクトル5(K)の平均値であり、C
(1)はS(。のコサインの一次の成分となる。
すなわち、対数スペクトルS(。は第6図(8に示す如
く、各次項の成分の和として表現される。従って、この
種の有声音無声音判別装置では上述のケプストラムの0
次項の値に対する閾値判定、ケプストラムの1次項の値
に対する閾値判定、ケプストラム各次数の2乗和、つ−
1、スペクトルの分数の値に対する閾値判定、あるいは
ケグストラムの各次数の積和計算によるスペクトルのあ
るW域の平均値に対する閾値判定、もしくはこれらの組
合せによって有声音か無声音かの判別を行うようにして
い友。例えばケグストラムの0次項による方法とはケグ
ストラムのO次項が音声のパワーに相当し、この値が有
声音では大きくなり、また無声音では小さいことを利用
し次男法であり、更にケプストラムの1次項による方法
とは、ケグストラムの1次項がスペクトルのだい几いの
傾きに相当すること(第6図(BlのC(11’用い、
有声音では低域にパワーが集中しこの値が大きくなるこ
とを用い次男法で1)、いずれの場合にも非常に簡単な
装置として実現できる。
く、各次項の成分の和として表現される。従って、この
種の有声音無声音判別装置では上述のケプストラムの0
次項の値に対する閾値判定、ケプストラムの1次項の値
に対する閾値判定、ケプストラム各次数の2乗和、つ−
1、スペクトルの分数の値に対する閾値判定、あるいは
ケグストラムの各次数の積和計算によるスペクトルのあ
るW域の平均値に対する閾値判定、もしくはこれらの組
合せによって有声音か無声音かの判別を行うようにして
い友。例えばケグストラムの0次項による方法とはケグ
ストラムのO次項が音声のパワーに相当し、この値が有
声音では大きくなり、また無声音では小さいことを利用
し次男法であり、更にケプストラムの1次項による方法
とは、ケグストラムの1次項がスペクトルのだい几いの
傾きに相当すること(第6図(BlのC(11’用い、
有声音では低域にパワーが集中しこの値が大きくなるこ
とを用い次男法で1)、いずれの場合にも非常に簡単な
装置として実現できる。
従来の有声音無声音判別装置は以上のようになされてい
たので、装置が簡単というだけで、判定誤差が多く、そ
の几めこの装置t−用いた音声合成装置では合成音品質
の劣下が生じ、音声認識装置の前処理部に用いると誤認
識率の低下?もたらすなどの問題点があつ几。ま友、ス
ペクトルの分散による方法でも同様であった。−万スベ
クトルのある帯域の平均値を用いる方法でに音声のスペ
クトラムと周波数上の荷重関数のケグストラムの積和に
よって希望する帯域の平均パワーを求めるものであり、
有声音でパワーが集中する100〜1000Hz程度に
帯域を選べば、判別誤りはかなり少なくなる。しかしこ
の様な装置ではケグストラムの次数だけの積和計算が必
要となり比較的大きな計算量が必要であるという問題点
があった。
たので、装置が簡単というだけで、判定誤差が多く、そ
の几めこの装置t−用いた音声合成装置では合成音品質
の劣下が生じ、音声認識装置の前処理部に用いると誤認
識率の低下?もたらすなどの問題点があつ几。ま友、ス
ペクトルの分散による方法でも同様であった。−万スベ
クトルのある帯域の平均値を用いる方法でに音声のスペ
クトラムと周波数上の荷重関数のケグストラムの積和に
よって希望する帯域の平均パワーを求めるものであり、
有声音でパワーが集中する100〜1000Hz程度に
帯域を選べば、判別誤りはかなり少なくなる。しかしこ
の様な装置ではケグストラムの次数だけの積和計算が必
要となり比較的大きな計算量が必要であるという問題点
があった。
この発明は、上記の様な問題点を解決するためになされ
たもので、ケグストラムの低次項で加算する加算回路と
、その加算値と閾値を比較する閾値比較回路を設けるこ
とにより、少ない計算量で判別誤りの少ない有声音無声
音判別装置を得ることを目的とする。
たもので、ケグストラムの低次項で加算する加算回路と
、その加算値と閾値を比較する閾値比較回路を設けるこ
とにより、少ない計算量で判別誤りの少ない有声音無声
音判別装置を得ることを目的とする。
この発明に係る有声音無声音判別装置はケグストラム分
析装置から得られるケグストラム系数の低次項の和を算
出する加算回路?設け、その加算回路の結果と閾値と全
比較する閾値比較回路とを備え閾値以上であれば有声音
、閾値以下であれば無声音と判断して有声音無声音判別
結果を得るようにし九ものである。
析装置から得られるケグストラム系数の低次項の和を算
出する加算回路?設け、その加算回路の結果と閾値と全
比較する閾値比較回路とを備え閾値以上であれば有声音
、閾値以下であれば無声音と判断して有声音無声音判別
結果を得るようにし九ものである。
この発明における有声音無声音の判別に加算回路で得ら
れ九判別パラメータを固定的な閾値と比較し、その比較
結果の大小に応じて有声音又は無声音と判定する。
れ九判別パラメータを固定的な閾値と比較し、その比較
結果の大小に応じて有声音又は無声音と判定する。
以下、この発明の一実施例を図について説明する。第1
図は有声音無声音判別装置を示すブロック構成図で1図
において、1は分析装置によって得られ友音声のケプス
トラム、2はケグストラムの各次項を加算する加算回路
、6は判定パラメータ、4は加算回路2で得られ九判定
パラメータ3を固定的な閾値と比較する閾値比較回路、
5は有声音無声音判別−結果である。
図は有声音無声音判別装置を示すブロック構成図で1図
において、1は分析装置によって得られ友音声のケプス
トラム、2はケグストラムの各次項を加算する加算回路
、6は判定パラメータ、4は加算回路2で得られ九判定
パラメータ3を固定的な閾値と比較する閾値比較回路、
5は有声音無声音判別−結果である。
また、第2図は第1図の有声音無声音判別装置における
音声スペクトルと判別パラメータの関係例を示す説明図
である。
音声スペクトルと判別パラメータの関係例を示す説明図
である。
次にこの発明の動作について説明する。まず、音声の対
数スペクトル5(Kl ”、ケプストラムC(m)(m
=0.1.・・・M)により、(2)式で表される。
数スペクトル5(Kl ”、ケプストラムC(m)(m
=0.1.・・・M)により、(2)式で表される。
但し、に=o、1.・・・N、N−1゜すなわち、この
対数スペクトル5(Klは第2図において音声スペクト
ル11で示される。これに対して、ケプストラムの次数
(m)kごく低次のみに注目すると、 (3)式となり、コサイン級数展開の意味で平滑化した
スペクトル12が得られる。このスペクトルの周波数0
に対する値、すなわち、判別パラメータ16は 鳩 PヨΣC(m) ・・・曲・・(4
)m=0 (4)式となりケプストラムの和として表すことができ
る。今Mg3〜4程度に選ぶとこの値Pは、もとの音声
スペクトル11の従来の装置におけるケグストラム丁ぺ
ての次数項の積和で求めていた有声音でパワーが集申す
ぶ従来の方式の判別低域14のパワーとほぼ同様の値と
なる。よって、第1図における加算回路2は、図示して
いないケプヌトラム分析装置によって得られるケプスト
ラム1の低次の数項の和を第3図の如く加算回路2によ
って算出し、上記(4)式のPで表す判定パラメータ6
を得る。ここで加算回路2で得られる判別パラメータ1
3は第4図の如く表わされる。Xは無声音、Yは有声音
である。このようにして閾値比較回路4により閾値に、
との比較がなされ一間値に、23L上であれば有声音、
閾値kP以下であれば無声音と判断して有声音無声音判
別結果5を得る。
対数スペクトル5(Klは第2図において音声スペクト
ル11で示される。これに対して、ケプストラムの次数
(m)kごく低次のみに注目すると、 (3)式となり、コサイン級数展開の意味で平滑化した
スペクトル12が得られる。このスペクトルの周波数0
に対する値、すなわち、判別パラメータ16は 鳩 PヨΣC(m) ・・・曲・・(4
)m=0 (4)式となりケプストラムの和として表すことができ
る。今Mg3〜4程度に選ぶとこの値Pは、もとの音声
スペクトル11の従来の装置におけるケグストラム丁ぺ
ての次数項の積和で求めていた有声音でパワーが集申す
ぶ従来の方式の判別低域14のパワーとほぼ同様の値と
なる。よって、第1図における加算回路2は、図示して
いないケプヌトラム分析装置によって得られるケプスト
ラム1の低次の数項の和を第3図の如く加算回路2によ
って算出し、上記(4)式のPで表す判定パラメータ6
を得る。ここで加算回路2で得られる判別パラメータ1
3は第4図の如く表わされる。Xは無声音、Yは有声音
である。このようにして閾値比較回路4により閾値に、
との比較がなされ一間値に、23L上であれば有声音、
閾値kP以下であれば無声音と判断して有声音無声音判
別結果5を得る。
以上のように、この発明によれば、ケプヌトラム分析装
置によって得られるケプストラムの低次の数項を加算回
路に取り込み閾値比較回路によって有声音無声音の判別
上行うようにしたので、従来の如く多くの計算量を実行
してい九判別パラメータとほぼ同様の性能を持つパラメ
ータが得られ、従来装置では得られない高い判別率?得
ることができる優れt効果を奏する。
置によって得られるケプストラムの低次の数項を加算回
路に取り込み閾値比較回路によって有声音無声音の判別
上行うようにしたので、従来の如く多くの計算量を実行
してい九判別パラメータとほぼ同様の性能を持つパラメ
ータが得られ、従来装置では得られない高い判別率?得
ることができる優れt効果を奏する。
第1図はこの発明の一実施例である有声音無声音判別装
置で示すブロック構成図、第2図は第1図の有声音無声
音判別装置の判定に用いられるパラメータと音声スペク
トルの説明図、第3図は加算回路の説明用図、第4図は
閾値比較回路の説明用図、第5図は従来における一般的
なケプヌトラム説明図、第6図はケプヌトラム低次項と
対数スペクトルとの関係図である。 図において、1框ケプストラム、2は加算回路、3は判
別パラメータ、4は閾値比較回路、5は有声音無声音判
別結果である。 1:PTフOストラA 3:判別ノv7メーグ 第2面5:有声音・墨声音判別紹果 第5図
置で示すブロック構成図、第2図は第1図の有声音無声
音判別装置の判定に用いられるパラメータと音声スペク
トルの説明図、第3図は加算回路の説明用図、第4図は
閾値比較回路の説明用図、第5図は従来における一般的
なケプヌトラム説明図、第6図はケプヌトラム低次項と
対数スペクトルとの関係図である。 図において、1框ケプストラム、2は加算回路、3は判
別パラメータ、4は閾値比較回路、5は有声音無声音判
別結果である。 1:PTフOストラA 3:判別ノv7メーグ 第2面5:有声音・墨声音判別紹果 第5図
Claims (1)
- 音声のケプストラム分析装置によつて得られるケプスト
ラム系数の低次項の和を算出する加算回路と、前記加算
回路の加算結果から得られる判別パラメータを入力とし
て予め固定した閾値と比較し、該閾値より該判別パラメ
ータが大なる時に有声音、小なる時に無声音と判別する
閾値比較回路とを備えた有声音無声音判別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60119685A JPS61278000A (ja) | 1985-06-04 | 1985-06-04 | 有声音無声音判別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60119685A JPS61278000A (ja) | 1985-06-04 | 1985-06-04 | 有声音無声音判別装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61278000A true JPS61278000A (ja) | 1986-12-08 |
JPH0439680B2 JPH0439680B2 (ja) | 1992-06-30 |
Family
ID=14767513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60119685A Granted JPS61278000A (ja) | 1985-06-04 | 1985-06-04 | 有声音無声音判別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61278000A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02239293A (ja) * | 1989-03-13 | 1990-09-21 | Canon Inc | 音声処理方法 |
-
1985
- 1985-06-04 JP JP60119685A patent/JPS61278000A/ja active Granted
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02239293A (ja) * | 1989-03-13 | 1990-09-21 | Canon Inc | 音声処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JPH0439680B2 (ja) | 1992-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108900725B (zh) | 一种声纹识别方法、装置、终端设备及存储介质 | |
Hunt et al. | A comparison of several acoustic representations for speech recognition with degraded and undegraded speech | |
CA2796948C (en) | Apparatus and method for modifying an input audio signal | |
JP4040126B2 (ja) | 音声復号化方法および装置 | |
EP0843302A2 (en) | Voice coder using sinusoidal analysis and pitch control | |
CN111415644B (zh) | 一种音频舒缓度预测方法及装置、服务器、存储介质 | |
JPS61278000A (ja) | 有声音無声音判別装置 | |
JP3555490B2 (ja) | 声質変換システム | |
JP3082625B2 (ja) | 音声信号処理回路 | |
JP4760179B2 (ja) | 音声特徴量算出装置およびプログラム | |
JP3230782B2 (ja) | 広帯域音声信号復元方法 | |
JPH0738114B2 (ja) | フオルマント型パタンマツチングボコ−ダ | |
JPH0318720B2 (ja) | ||
JPH05127697A (ja) | ホルマントの線形転移区間の分割による音声の合成方法 | |
US20090326932A1 (en) | Reducing Computational Complexity in Determining the Distance from Each of a Set of Input Points to Each of a Set of Fixed Points | |
JPH0311479B2 (ja) | ||
Salor et al. | Kalman filter approach for pitch determination of speech signals | |
JPS6148898A (ja) | 音声の有声無声判定装置 | |
JPS62139600A (ja) | 音声の特徴比較方式 | |
JPH0785200B2 (ja) | スペクトル標準パタンの作成方法 | |
JPH0123800B2 (ja) | ||
JPH07129194A (ja) | 音声合成方法及び音声合成装置 | |
JPH03206500A (ja) | 音声認識装置 | |
Rabiner et al. | Use of a Computer Voice‐Response System for Wiring Communications Equipment | |
Hernando Pericás et al. | A Unified Parameterization Scheme for Noisy Speech Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |