JPH0318720B2 - - Google Patents

Info

Publication number
JPH0318720B2
JPH0318720B2 JP58123666A JP12366683A JPH0318720B2 JP H0318720 B2 JPH0318720 B2 JP H0318720B2 JP 58123666 A JP58123666 A JP 58123666A JP 12366683 A JP12366683 A JP 12366683A JP H0318720 B2 JPH0318720 B2 JP H0318720B2
Authority
JP
Japan
Prior art keywords
low
signal
autocorrelation
order
autocorrelation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58123666A
Other languages
English (en)
Other versions
JPS6014300A (ja
Inventor
Satoru Nakamura
Koji Fujimoto
Mitsuhiro Toya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP58123666A priority Critical patent/JPS6014300A/ja
Publication of JPS6014300A publication Critical patent/JPS6014300A/ja
Publication of JPH0318720B2 publication Critical patent/JPH0318720B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、重み付き自己相関係数を用いて音声
の特徴抽出を行う音声の特徴抽出方法に関するも
のである。
(従来技術及び背景) 従来より、自己相関係数が音声の特徴として多
用されているが、これは聴覚がスペクトル情報に
対応していることによつており、自己相関係数は
Wiener−Khintchineの公式により正規化パワー
スペクトルに対応している。今、デイジタル化さ
れた音声信号をS(n)、相関関数をR(τ)とす
ると、 R(τ)=1/NNK=1 S(K)・S(K+τ) ……(1) で表わされ、さらに、R(τ)をR(φ)で正規化
することにより(2)式のように自己相関係数C(τ)
を得る。
C(τ)=R(τ)/R(φ) ……(2) 従来の方式では、上式のR(τ)を分析フレー
ム毎に抽出し特徴パラメータとしているが、
A/D変換の際の高周波成分のダイナミツクレン
ジを大きくとるためと、音声波形が一般に−
6dB/oct程度の周波数特性をもつていることの
二つから、A/D変換の前に+6dB/octのプリ
エンフアシスを施している。これにより、周波数
の次元ではスペクトルが平坦化される効果がある
が、自己相関の次元では、スペクトルは自己相関
波形に対し重なり合う形(従属する形)で存在す
るので、ホルマントの弁別、ホルマントの変動に
対して極めて弱いパラメータとなつている。
ところで、音声をその音源が声帯であるか否か
により分けると、母音等に代表される有音声と摩
擦系子音に代表される無声音とがある。継続時間
的にも長い有声音については、声道の伝達特性が
音韻性を決定し、声道伝達特性は声道における共
振、反共振により規定され、周波数領域上でのス
ペクトル包絡となる。また、このスペクトル包絡
上では、音声の音韻情報は包絡の谷より山のピー
クにあつてホルマントと呼ばれており、周波数の
低い方から2つないしは3つ目の第3ホルマント
までによつて音韻性の大部分を表現している。こ
こに第1ホルマントは、同一話者内の発声変動が
比較的小さく弁別精度はよいが、全ての有声音の
弁別はできず、大まかなグループ分けに効果があ
るのみである。他方、第2、第3ホルマントは発
声変動が大きいが有声音の弁別には不可欠なの
で、上記第1ホルマントと併用する必要がある。
日本語5母音については、第1ホルマントと第2
ホルマントの2軸により非常によく分離でき、
BPF群の出力をパラメータとする方法では、こ
れに基いて有声音を弁別している。自己相関係数
を用いる方法でも、2チヤンネルのBPFの出力
より求めた2系列の自己相関係数を用いれば可能
である。しかし、パラメータ数が2倍になること
及びこれに伴つてのメモリー増加、応答時間の増
加など多くの問題がある。
(発明の目的) そこで本発明では、自己相関係数の性質に基づ
き2系列を持つことなく、第1ホルマント、第
2、3ホルマントを効果的に弁別し得るパラメー
タの抽出方法を提供することを目的とする。
この目的を達成するため考究されたことは、入
力信号をx(n)、自己相関関数をR(τ)、パワー
スペクトルP(f)、複素スペクトルF(f)の関係が第
1図で示されるが、第1図のように、パワースペ
クトルと自己相関関数はフーリエ変換で結ばれて
いるので、P(f)が高域で強ければ、自己相関関数
波形は小さな周期の波となり、逆の場合は大きな
周期となり、波形としてはこれらの重なり合つた
形となつている。これは、フーリエ変換が直交変
換であることから自己相関の次元では、周波数は
独立でなく従属関係にあるためである。また、自
己相関波のピークに関しては、単一共振の場合、
T=1/fより相関遅れτ=Tのときピークを示
す。このことから、P(f)上で高域に主成分のある
ものは、自己相関関数の低次に既に情報があり、
高次についてはその繰り返しとなる。逆に、低域
に主成分のあるものは、自己相関の高次に情報を
含む。従つて次の知見を得る。
A 第1ホルマントの弁別のためには、入力音声
信号を低域強調すればよく、このとき自己相関
上では、高次(遅れ時間τが大)に弁別的特徴
が現れる。
B 第2、第3ホルマントの弁別のためには、原
波形に対して高域強調すればよく、このとき自
己相関上では、低次に弁別的特徴が現れる。
(発明の概要) このため、本発明は、音声入力信号の高域成分
を低域成分よりも強調する処理を行つた信号に対
応した自己相関係数の低次を抽出し、音声入力信
号の低域成分を高域成分よりも強調する処理を行
つた信号に対応した自己相関係数の高次を抽出
し、上記自己相関係数の低次と高次とを組み合わ
せて重み付き自己相関係数を求め、この重み付き
自己相関係数から音声入力信号の特徴を抽出する
ことを特徴としている。
また、本発明は、音声入力信号の高域成分を低
域成分よりも強調する処理を行つた信号に対応し
た自己相関係数の低次を抽出し、音声入力信号の
高域成分を低域成分よりも強調する処理を行つた
信号に対応した自己相関係数を低域重み付け処理
することによつて得られる自己相関係数の高次を
抽出し、上記自己相関係数の低次と高次とを組み
合わせて重み付き自己相関係数を求め、この重み
付き自己相関係数から音声入力信号の特徴と抽出
することをいま一つの特徴としている。
(実施例) 以下、本発明を実施例に基づいて説明するが、
実施例を開示するに当り、予め、実施例に係る特
徴抽出方式の物理・数学的な根拠を与えておく。
すなわち、プリエンンフアシスされA/D変換
された入力信号S(n)に対し、低域強調した出
力信号をZ(n)とし、(3)式のように1次系によ
るフイルタリングを考える。
Z(n)=y(n)+μy(n−1)……(3) ここで、μは重み付け係数である。このとき、
伝達特性H(z)は、 H(z)=Z(z)/y(z)=1+μ2 -1 …(4) Z=ej〓として周波数伝達特性を求めると、 |H(ej〓)|2=(1+μe-j〓) ・(1+μej〓) =(1+μ2)+2μcosω …(5) ここで、重み係数をμ=1とすると、 |H(ej〓)|2は(7)式で与えられる。
|H(ej〓)|2=2(1+cosω) …(7) (7)式より、周波数特性にcosω形の低域強調を行
うことになる。
一方、Z(n)の自己相関関数Rz(τ)は、 Rz(τ)=1/MMi=1 Z(i)Z(i+τ) =1/MMi=1 (y(i)+μy(i−1) ・(y(i+τ)+μy(i+τ−1)) =1/MMi=1 (y(i)y(i+τ)+ μ2y(i−1)y(i+τ−1)+ μy(i−1)y(i+τ)+μy(i)y (i+τ−1)) =(1+μ2)Ry(τ)+μ(Ry(τ+
1) +Ry(τ−1)) ……(8) 自己相関係数Cz(τ)は、 Cz(τ)=Rz(τ)/Rz(φ)=(1+μ2)Ry(τ)
+μ(Ry(τ+1)+Ry(τ+1))/(1+μ2)Ry
(0)+2μRy(1) =(1+μ2)Cy(τ)+μ(Cy
(τ+1)+Cy(τ−1))/(1+μ2)+2μCy(1)
……(9) さらに、μ=1として、 Cz(τ)=2Cy(τ)+Cy(τ+1)+Cy(τ−1)
/2(1+Cy(1)) ……(10) この(10)式により、プリエンフアシスされた信号
から求められる自己相関係数から低域の重み付け
を行つた自己相関係数が単純な演算で求められ
る。従つて、切り換え自己相関係数の次数をθAL
とすると、相関次数τは、 φ≦τ<θALのとき、高域強調による Cy(τ);(2)式に基づくもの。
θAL≦τ<τMAXのとき、高域強調に低域重み
付けを行つたCz(τ);(10)式に基づくもの。
(ただし、τMAX(θMAX)は、分析する最大次数) を用いることで、第1、第2、第3ホルマントに
対する弁別能力を効果的に増加できる。この概念
を図解した説明図を第2図のa,b,c,d,e
順次に示す。
第3図は、本案特徴抽出方式の実施例を示す。
第3図において、マイクロホン1より、音声が入
力されアンプ2に入る。アンプ2で増巾された信
号102は、プリエンフアシス回路3に入る。プ
リエンフアシス回路3は、約1KHzから6dB/oct
の高域強調特性となつている。プリエンフアシス
回路3の出力103は、ローパスフイルタの
LPF4に入力される。LPF4は、A/D変換の
折り返し雑音を除くためのアンチエイリアスフイ
ルタとなつている。LDF4の出力104は、
A/D変換器5に入力されデイジタル信号105
に変換された後、自己相関器6に入力される。自
己相関器6では、5ms〜10ms程度の分析区間内
の自己相関係数106が求められ、分析区間終了
毎に重み付き組み合わせ自己相関係数演算回路7
に送られ、前掲の式(10)に基づく変換と組み合わせ
処理後、判別処理回路8に送られ、ここで音声の
識別が行なわれる。
次に、第4図に従つて、第3図の重み付き組み
合わせ自己相関係数演算回路7の詳細を示し、具
体的な動作を説明する。
回路7の各ブロツク要素は制御回路部70によ
つて統括して制御される。
(イ) 式(10)における分母部分の計算 初期状態では、マルチプレクサ74セレクト信
号203により“1”をセレクトしている。次
に、アドレス制御信号201によりアドレス1を
出力し、リード制御信号202により、第1のバ
ツフア71からC(1)が信号線301に出力され
る。加算器72は信号線301上のC(1)と信号線
304上の値を加算し、第1のレジスタ73に格
納する。第1のレジスタ73の出力線303は、
さらに、シフト回路あるいは加算器により成る2
倍演算器75により2倍される。2倍された値は
信号線305を経て第2のレジスタ76に格納さ
れる。これで第2レジスタ76には、式(10)の分母
の値が格納されたことになる。
(ロ) 自己相関次数φ<τ<τALの場合 この場合、アドレス制御信号201にアドレス
τを出力し、リード制御信号202は、第1のバ
ツフア71から次数順に自己相関係数を信号線3
01に出力する。このとき、マルチプレクサ8
は、制御信号207により信号線301をセレク
トしているので、第2のバツフア79の入力線3
08は、信号線301に接続されており、アドレ
ス制御信号209にアドレスτを出力し、ライト
制御信号208により第2のバツフア79に格納
される。以上の演算がφ<τ<τALのτについて
くり返される。
(ハ) 自己相関次数τAL≦τ≦τMAXの場合 まず、アドレス制御信号201にアドレスτを
出力し、リード制御信号202により、信号線3
01にC(τ)が出力され、第1レジスタ73に
格納される。このとき、マルチプレクサ74は
“φ”をセレクトして、加算器72は“φ”を加
算する。次に第1レジスタ73の値C(τ)は、
信号線303に出力され、2倍演算器75を通
る。次に、制御回路部70は、アドレス制御信号
201にアドレス(τ−1)を出力し、リード制
御信号202により第1バツフア71からC(τ
−1)を信号線301に出力する。マルチプレク
サ74は、このとき、制御信号203により、信
号線305にセレクトされていて、加算器72に
より2C(τ)+C(τ−1)が演算され第1レジス
タ73に格納される。さらに、アドレス制御線2
01に、アドレス(τ+1)を出力し、リード制
御線202により第1バツフア71からC(τ+
1)が信号線301に出力される。このとき、マ
ツチプレクサ74は、再び信号線303をセレク
トしており、レジスタ1の出力303と、信号線
301上のC(τ+1)が加算され、式(10)の分子
の値が第1レジスタ73に格納される。
そこで、1/x・ROMあるいは除算ソフトウ
エアにより構成される割り算回路77は、信号線
303と306の値を読み込み、割り算を実行し
てC′(τ)を信号線307に出力する。このとき、
マルチプレクサ78は信号線307をセレクトし
ていてアドレス制御線209にアドレスτを出力
し、ライト制御線208により第2のバツフア7
9に格納される。以上の演算がτAL≦τ≦τMAX
τについてくり返される。
以上の如くして重み付き組み合わせ自己相関係
数が第2のバツフア79に格納される。また、第
2のバツフア79の内容はアドレス制御信号20
9にアドレスτを出力し、リード制御線210に
より遂次、信号線107に出力され、判別処理回
路8に送られ音声の識別が行なわれる。
(効果) 以上のことから明らかなように、本発明によれ
ば、音声入力信号の高域成分を低域成分よりも強
調する処理を行つた信号に対応した自己相関係数
の低次と、音声入力信号の低域成分を高域成分よ
りも強調する処理を行つた信号に対応した自己相
関係数の高次とを組み合わせて求めた重み付き自
己相関係数から音声入力信号の特徴を抽出する方
法であるので、従来のように2系列の自己相関係
数を持つことなく第1ホルマント及び第2、第3
ホルマントを精度よく弁別し得るパラメータを抽
出できる効果がある。
また、本発明によれば、音声入力信号の高域成
分を低域成分よりも強調する処理を行つた信号に
対応した自己相関係数とその低域重み付け処理を
行つた自己相関係数とから音声入力信号の特徴を
抽出する方法であるので、1系列の自己相関係数
により、パラメータ数を増加させることなく、小
さいメモリ容量で、第1フオルマント及び第2、
第3フオルマントを短い応答時間で精度よく抽出
することができる。
【図面の簡単な説明】
第1図は入力信号x(n)、その自己相関関数R
(τ)、パワースペクトルP(f)及び複素スペクトル
F(f)の関係を示す説明図、第2図は本発明の基本
概念を示す説明図、第3図は本発明の実施例を示
すブロツク図、第4図は第3図中の重み付き組み
合わせ自己相関演算回路7を詳細に示したブロツ
ク回路図である。 3…プリエンフアシス回路、4…ローパスフイ
ルタ(LPF)、5…A/D変換器、6…自己相関
器、7…重み付き組み合わせ自己相関演算回路。

Claims (1)

  1. 【特許請求の範囲】 1 音声入力信号の高域成分を低域成分よりも強
    調する処理を行つた信号に対応した自己相関係数
    の低次を抽出し、音声入力信号の低域成分を高域
    成分よりも強調する処理を行つた信号に対応した
    自己相関係数の高次を抽出し、上記自己相関係数
    の低次と高次とを組み合わせて重み付き自己相関
    係数を求め、この重み付き自己相関係数から音声
    入力信号の特徴と抽出することを特徴とする音声
    の特徴抽出方法。 2 音声入力信号の高域成分を低域成分よりも強
    調する処理を行つた信号に対応した自己相関係数
    の低次を抽出し、音声入力信号の高域成分を低域
    成分よりも強調する処理を行つた信号に対応した
    自己相関係数を低域重み付け処理することによつ
    て得られる自己相関係数の高次を抽出し、上記自
    己相関係数の低次と高次とを組み合わせて重み付
    き自己相関係数を求め、この重み付き自己相関係
    数から音声入力信号の特徴と抽出することを特徴
    とする音声の特徴抽出方法。
JP58123666A 1983-07-06 1983-07-06 音声の特徴抽出方法 Granted JPS6014300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58123666A JPS6014300A (ja) 1983-07-06 1983-07-06 音声の特徴抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58123666A JPS6014300A (ja) 1983-07-06 1983-07-06 音声の特徴抽出方法

Publications (2)

Publication Number Publication Date
JPS6014300A JPS6014300A (ja) 1985-01-24
JPH0318720B2 true JPH0318720B2 (ja) 1991-03-13

Family

ID=14866286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58123666A Granted JPS6014300A (ja) 1983-07-06 1983-07-06 音声の特徴抽出方法

Country Status (1)

Country Link
JP (1) JPS6014300A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02273799A (ja) * 1989-04-14 1990-11-08 Sekisui Chem Co Ltd 話者認識方式
JPH02304500A (ja) * 1989-05-18 1990-12-18 Sekisui Chem Co Ltd 単語認識方式
JPH03111899A (ja) * 1989-09-26 1991-05-13 Sekisui Chem Co Ltd 音声錠装置
JP2543603B2 (ja) * 1989-11-16 1996-10-16 積水化学工業株式会社 単語認識システム

Also Published As

Publication number Publication date
JPS6014300A (ja) 1985-01-24

Similar Documents

Publication Publication Date Title
US5884260A (en) Method and system for detecting and generating transient conditions in auditory signals
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
JP5507596B2 (ja) スピーチ増強
US8359195B2 (en) Method and apparatus for processing audio and speech signals
Kesarkar et al. Feature extraction for speech recognition
JPH07248794A (ja) 音声信号処理方法
JP6533959B2 (ja) 音声信号処理装置および音声信号処理方法
EP1074968B1 (en) Synthesized sound generating apparatus and method
JP2005157363A (ja) フォルマント帯域を利用したダイアログエンハンシング方法及び装置
US5812966A (en) Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair
JPH0318720B2 (ja)
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
JP2992324B2 (ja) 音声区間検出方法
JP3035939B2 (ja) 音声分析合成装置
JP2997668B1 (ja) 雑音抑圧方法および雑音抑圧装置
JP3921416B2 (ja) 音声合成装置及び音声明瞭化方法
JP3336098B2 (ja) 音声効果装置
JPH04342298A (ja) 瞬時ピッチ分析方法及び有声・無声判定方法
JPS58147797A (ja) 音声認識装置
JPS62164100A (ja) 声帯特徴抽出装置
JP2001013977A (ja) 音声スペクトルのホルマント強調装置
JPH0123800B2 (ja)
Varho et al. Spectral estimation of voiced speech with regressive linear prediction
JPS62235996A (ja) 合成音質変化方法
Ariki et al. Real Time Noise Canceling by Bandpass Filter.