JPS63155197A - 無声音検出方法 - Google Patents

無声音検出方法

Info

Publication number
JPS63155197A
JPS63155197A JP30451686A JP30451686A JPS63155197A JP S63155197 A JPS63155197 A JP S63155197A JP 30451686 A JP30451686 A JP 30451686A JP 30451686 A JP30451686 A JP 30451686A JP S63155197 A JPS63155197 A JP S63155197A
Authority
JP
Japan
Prior art keywords
autocorrelation function
function
unvoiced
short
maximum value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP30451686A
Other languages
English (en)
Inventor
健作 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP30451686A priority Critical patent/JPS63155197A/ja
Publication of JPS63155197A publication Critical patent/JPS63155197A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要] 入力音声の所定区間での短時間エネルギ関数の増加状態
が基準条件に合致し、且つ入力音声がピッチを周期とす
る周期性が低下している場合に、入力音声を無声音を判
定する。
〔産業上の利用分野〕
本発明は、音声からピッチを抽出するに際し、ピッチ抽
出の対象とならぬ無声音を検出する無声音検出方法の改
良に関する。
音声から重要なパラメータの一つであるピンチを高精度
に抽出する為には、音声の中でピッチの抽出対象として
必要な有声音のみを残し、他の無声音並びに音声の全く
無い無声の状態(以後無声の状態を含み無声音と総称す
る)を除去する無声音検出方法の精度向上が強く要望さ
れる。
〔従来の技術〕
一般に有声音は周期性を有する為、自己相関関数は大き
い値を示し、無声音は周期性を持たぬ為、自己相関関数
は小さい値を示す。従って有声音と無声音とを自己相関
関数で識別する基準値を設け、対象とする音声の自己相
関関数を基準値と比較することにより無声音を検出する
ことが考慮される。
第6図は、かかる原理を用いた従来ある無声音検出方法
の一例を示す図である。
第6図において、自己相関関数算出回路2は、入力端子
1から入力される音声Xに対し、エネルギで正規化した
短時間自己相関関数R(i)  (以後単に自己相関関
数と称する)を(1)弐に基づき算出し、判定回路3に
伝達する。
・・・・・・(11 但し、W(k)  :窓関数 X (n+k) 、X (n+に+i)  :音声n:
積分区間の始点 i:自己相関関数の遅延量 に:積分区間(例えば128) なおi、nおよびkは、何れも標本化周期T(例えば1
25マイクロ秒)を単位とする。
判定回路3は、自己相関関数算出回路2から伝達された
自己相関関数R(i)を、予め定められた基準値(例え
ば完全な周期性を有する有声音が示す自己相関関数値−
1と、完全な非周期性を有する無声音が示す自己相関関
数−0との中間値として0.5に定める)と比較し、自
己相関関数R(i)が基準値(0,5)を上回れば有声
音、下回れば無声音と判定し、判定結果を出力端子4か
ら出力し、図示されぬピッチ抽出回路に伝達する。
ピッチ抽出回路は、有声音の判定結果が伝達された場合
には、公知の方法により音声に対してピッチ抽出処理を
実行し、無声音の判定結果が伝達された場合には、音声
に対してピッチ抽出処理を実行せず、判定結果(無声音
)のみを出力する。
〔発明が解決しようとする問題点〕
以上の説明から明らかな如く、従来ある無声音検出方法
においては、対象とする音声の自己相関関数R(i)が
基準値を下廻る場合には無声音と判定していた。
然し有声音も、例えば音韻の変化点では周期性が崩れ、
自己相関関数R(i)が基準値を下回って無声音として
検出される恐れがある。また、高い周期性を有する無声
音に対する自己相関関数R(i)は基準値を上回って有
声音として検出される恐れがある。従って、自己相関関
数の大きさだけで有声音および無声音の判別を行うこと
は困難であった。
〔問題点を解決するための手段〕
第1図は本発明の原理を示す図である。
第1図において、100は本発明により設けられ、入力
音声の対象区間における短時間エネルギ関数P (i)
を(2)弐に基づいて算出する過程である。
200は本発明により設けられ、過程100で算出され
た短時間キネルギ関数の増加状態を、予め定められた基
準条件と照合する過程である。
300は本発明により設けられ、入力音声から算出され
た自己相関関数が最大値を示す遅延量を抽出する過程で
ある。
なお自己相関関数の最大値は、該最大値から定められる
基準値を上回る極大値から選択されるものとする。
400は本発明により設けられ、入力音声から算出され
た自己相関関数を積分する過程である。
500は本発明により設けられ、過程400で算出され
た積分結果の最長零交差間隔を抽出する過程である。
600は本発明により設けられ、短時間キネルギ関数の
増加状態が基準条件に合致したことを検出する過程であ
る。
700は本発明により設けられ、自己相関関数が最大値
を示す遅延量を周期とする周波数が、最長零交差間隔を
周期とする周波数を上回ることを検出する過程である。
800は本発明により設けられ、過程600および過程
700が共に検出された場合に、入力音声を無声音と判
定する過程である。
〔作用〕
短時間エネルギ関数P (i)は、入力音声Xのエネル
ギ変動に対応して変動する。従って、工lルギの小さい
無声音からエネルギの大きい有声音への遷移区間におい
ては、短時間エネルギ関数P(i)も有声音および無声
音の継続区間に比して急激に増加する。
従って、対象区間における短時間エネルギ関数P(i)
が急激に増加している場合には、対象区間は無声音から
有声音への遷移区間と見做される。
かかる遷移区間において、短時間エネルギ関数P(i)
が無声音と思われる低値を示す期間が長く継続する場合
には、対象区間を無声音と見做し、また短時間エネルギ
関数P(i)が有声音と思われる高値を示す期間が長く
継続する場合には、対象区間を有声音と見做すことが出
来る。
一方、自己相関関数R(i>は、原信号である入力音声
の周期性を保存している為、自己相関関数R(i)の積
分結果が含む最低周波数は、人力音声のピッチ周波数に
漸近する筈である。従って、自己相関関数R(i)が最
大値を示す遅延量i=mHを周期とする周波数fRが、
自己相関間¥lR(i)の積分結果が含む最低周波数f
Kを上回る場合には、最大値はピンチでは無(ホルマン
トに対応すると見做される。自己相関関数R(i)の最
大値がピンチでは無くホルマントに対応する場合には、
入力音声のピッチを周期とする周期性が崩れていると判
定される。
本発明はかかる原理に基づき、無声音と見做される遷移
区間と判定する短時間エネルギ関数P(i)に対する基
準条件を予め設定し、入力音声の対象区間における短時
間エネルギ関数P(i)が基準条件に合致することを検
出し、更に自己相関関数R(i)の最大値がホルマント
に対応することを検出した場合に、入力音声を無声音と
判定する。
従って、自己相関関数の大きな無声音を有声音と判定す
ることが防止され、ピンチの抽出処理の精度を向上する
ことが出来る。
〔実施例〕
以下、本発明の一実施例を図面により説明する。
第2図は本発明の一実施例による無声音検出方法を示す
図であり、第3図は第2図における遷移区間検出条件を
例示する図であり、第4図は遷移区間の説明図であり、
第5図(al乃至第5図(d)は第2図の動作を説明す
る波形図である。なお、全図を通じて同一符号は同一対
象物を示す。
第2図において、自己相関関数算出回路10は、入力端
子1から対象区間内に人力される音声Xに対し、短時間
エネルギ関数P(i)を(2)式に基づき算出し、エネ
ルギ最大点検出回路20に伝達し、更に短時間エネルギ
関数P (i)を用いて自己相関関数R(i)を算出し
、最大点検出回路30および積分回路40に伝達する。
なお対象区間は、ピッチ周波数領域(通常50ヘルツ乃
至500ヘルツ)を充分包含する範囲(例えばi=1乃
至192)に設定する。
エネルギ最大点検出回路20は、受信した短時間エネル
ギ関数P (i)の最大値P、を抽出し、全区間(i−
1乃至192)における短時間エネルギ関数P(i)の
値を最大値P、により正規化し、最大値P、の抽出点i
=m、と共に遷移区間検出回路50に伝達する。
遷移区間検出回路50は、エネルギ最大点検出回路20
から伝達された正規化された短時間エネルギ関数P (
i)の、区間(i=1乃至192)内における値を、第
3図に示される遷移区間検出条件と照合し、無声音と見
做し得る遷移区間を検出する。
先ず遷移区間検出回路50は、 条件mp ”192  (ステップSl)および、条件
P (64) < 0.125  (ステップS2)が
成立した場合、 短時間エネルギ関数P(i)が第4図の曲線■に示され
る如き増加状態を示し、無声音と見做し得る遷移区間で
あると判定する(ステップS 100)。
また遷移区間検出回路30は、 条件mp =192  (ステップ31)が成立し、条
件P (64) < 0.125  (ステップS2)
が成立せず、且つ条件P(128) <0.125  
(ステップS3)が成立した場合、 短時間エネルギ関数P (i)が第4図の曲線■に示さ
れる如き増加状態を示し、無声音と見做し得る遷移区間
であると判定する(ステップ3100)。
また遷移区間検出回路50は、 条件mp ”192  (ステップSL)が成立せず、
条件P(1) <0.125  (ステップ34)およ
び条件P(64)<0.125  (ステップS5)が
成立した場合、 短時間エネルギ関数P (i)が第4図の曲線■に示さ
れる如き増加状態を示し、無声音と見做し得る遷移区間
であると判定する(ステップS 100)。
なお遷移区間検出回路50は、 条件mP=192 (ステップSl)が成立し、条件P
(64)<0.125  (ステップS2)および条件
P(128) <0.125  (ステップS3)が不
成立の場合、または 条件my =192  (ステップSL)および条件P
 (1) <0.125  (7,テ7ブS4)が不成
立の場合、または 条件m、 =192  (ステップSl)が成立せず、
条件P(1) <0.125  (ステップS4)が成
立し、且つ条件P(64)<0.125  (ステップ
S5)が不成立の場合に、 短時間エネルギ関数P(i)が区間(i−1乃至192
)内において、無声音と見做し得る遷移区間では無いと
判定する(ステップ5200)。
遷移区間検出回路50は、以上の判定結果を、判定回路
70に伝達する。
一方最大点検出回路30は、受信した自己相関関数R(
i)から最大値R1を抽出し、最大値R1を示す遅延量
i=mRを求め、判定回路7oに伝達する。
また積分回路40は、受信した自己相関関数R(i)の
高周波数成分を抑圧して低周波数成分を強調する為に、
各遅延iiに就いて(3)式の如く積分し、得られた積
分結果S (i)を最長零交差間隔抽出回路60に伝達
する。
5(i)=ΣR(D          ・・・・・・
(3)/繻l 最長零交差間隔抽出回路60は、受信した積分結果S 
(i)の極性だけを抽出した平均自己相関関数Ra (
i)を(4)式により算出する。
Ra  (i)  −5GN   (S(i)  )=
SGN  (、ΣR(j))    ・・・・・・(4
)j=1 (但し、SGN  (A)はAの極性を示す。)更に最
長零交差間隔抽出回路60は、算出した平均自己相関関
数Ra (i)の、区間(i=1乃至192)内に存在
する零交差点B M A X B (y)〔但しy=1
乃至Y〕の間隔を算出し、その中で最も長い最長間隔K
BMAXを抽出し、判定回路70に伝達する。
判定回路70は、最大点検出回路30から伝達された遅
延量i=m、、を周期とする周波数fえと、最長零交差
間隔抽出回路60から伝達された最長間隔KBMAXを
周期とする周波数fK、即ち平均自己相関関数Ra (
+)が含む最低周波数fKとを比較し、周波数rRが周
波数fXを上回る場合には、周波数fRはピッチでは無
くホルマントの周波数を与えると判定する。
更に判定回路70は、遷移区間検出回路50から伝達さ
れる判定結果が無声音と見做し得る遷移区間であり、且
つ周波数r、がホルマントの周波数を与えると判定され
る場合には、対象区間を無声音と判定し、判定結果(無
声音)を出力端子4に出力する。
第5図(al乃至第5図(d)は何れも入力音声に対す
る短時間エネルギ関数P(i)、自己相関関数R(i)
および平均自己相関関数Ra (i)を例示した図であ
る。
第5図(a)に示される短時間エネルギ関数P (i)
は、遷移区間検出回路50により無声音と見做す遷移区
間と判定されぬ為、判定回路70は音声Xを無声音と判
定しない。
第5図(′b)に示される短時間エネルギ関数P (i
)は、遷移区間検出回路50により無声音と見做す遷移
区間と判定されるが、自己相関関数R(i)の遅延量i
=m、、を周期とする周波数f、lが、平均自己相関関
数Ra (i)の最長間隔KBMAXを周期とする周波
数fKを下回る為、判定回路70は音声Xを無声音と判
定しない。
第5図(C1に示される短時間エネルギ関数P (i)
は、遷移区間検出回路50により無声音と見做す遷移区
間と判定され、また自己相関間数R(i)の遅延量i=
m、、を周期とする周波数fRが、平均自己相関関数R
a (i)の最長間隔KBMAXを周期とする周波数f
Kを上回る為、判定回路70は音声Xを無声音と判定す
る。
自己相関関数R(i)の最大値R1のみを比較する第6
図に示される無声音検出方法によれば、第5図(′b)
に示すされる最大値R1は、第5図(C)に示される最
大値R,%より小さく、前述の如き判定を下し難い。
以上の説明から明らかな如く、本実施例によれば、音声
Xの短時間エネルギ関数P (i)の変化から無声音と
見做し得る遷移区間を検出し、且つ自己相関関数R(i
)の遅延量i=mgと平均自己相関間数Ra (i)の
最長間隔KBMAXとから、自己相関関数R(i)のピ
ンチを周期とする周期性の低下とにより無声音を検出し
ている為、自己相関関数R(i)の大きさからは判定し
難い無声音の検出が可能となる。
なお、第2図乃至第5図はあく迄本発明の一実施例に過
ぎず、例えば遷移区間の検出条件は図示されるものに限
定されることは無く、他に幾多の変形が考慮されるが、
何れの場合にも本発明の効果は変わらない。
また自己相関関数R(i)は標本点と極大点との不一致
により、ピッチの二倍以上の周期において最大値R1を
示す場合が考慮される。かかる場合にピッチの誤判定を
防止する為に、最大値R0を示す遅延量i=m*の前後
の遅延量i=(mR−1)および(mR+1)における
自己相関関数値R(m++   1)およびR(m* 
+ 1 )の平均値を基準値AMAXAとし、該基準値
AMAXAを上回る自己相関関数R(i)の極大点に対
応する遅延量iの内、最小値を示す遅延量i=mR’に
より周波数fRを定める。第5図(dlは、かかる遅延
量i=m、1  ”により定められた周波数f11が、
最長間隔KBMAXにより定められた周波数fKを上回
ることにより、無声音と判定される。
〔発明の効果〕
以上、本発明によれば、自己相関関数が大きな無声音も
有声音と判定されることは防止され、ピッチの抽出処理
の精度を向上することが出来る。
【図面の簡単な説明】
第1図は本発明の原理を示す図、第2図は本発明の一実
施例による無声音検出方法を示す図、第3図は第2図に
おける遷移区間検出条件を例示する図、第4図は遷移区
間の説明図、第5図(a)乃至第5図(dlは第2図の
動作を説明する波形図、第6図は従来ある無声音検出方
法の一例を示す図である。 図において、1は入力端子、2および10は自己相関関
数算出回路、3および70は判定回路、4は出力端子、
20はエネルギ最大点検出回路、30は最大点検出回路
、40は積分回路、50は遷移区間検出回路、60は最
長零交差間隔抽出回゛・く全〉′ 木徐呵θ原可阻 寥 1 図 蒸移区間説、Wi聞 竿4 旧

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声の対象区間における短時間エネルギ関数
    を算出し(100)、 該算出された短時間キネルギ関数の増加状態を予め定め
    られた基準条件と照合し(200)、入力音声から算出
    された自己相関関数が最大値を示す遅延量を抽出し(3
    00)、 前記算出された自己相関関数を積分し(400)、 該自己相関関数の積分結果の最長零交差間隔を抽出し(
    500)、 前記短時間キネルギ関数の増加状態が前記基準条件に合
    致し(600)、 且つ前記自己相関関数が最大値を示す前記遅延量を周期
    とする周波数が、前記最長零交差間隔を周期とする周波
    数を上回ることを検出した場合に(700)、 前記区間における入力音声を無声音と判定する(800
    )ことを特徴とする無声音検出方法。
  2. (2)前記自己相関関数の最大値は、該最大値から定め
    られる基準値を上回る極大値から選択することを特徴と
    する特許請求の範囲第1項記載の無声音検出方法。
JP30451686A 1986-12-19 1986-12-19 無声音検出方法 Pending JPS63155197A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30451686A JPS63155197A (ja) 1986-12-19 1986-12-19 無声音検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30451686A JPS63155197A (ja) 1986-12-19 1986-12-19 無声音検出方法

Publications (1)

Publication Number Publication Date
JPS63155197A true JPS63155197A (ja) 1988-06-28

Family

ID=17933968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30451686A Pending JPS63155197A (ja) 1986-12-19 1986-12-19 無声音検出方法

Country Status (1)

Country Link
JP (1) JPS63155197A (ja)

Similar Documents

Publication Publication Date Title
EP0398180B1 (en) Method of and arrangement for distinguishing between voiced and unvoiced speech elements
JPH0121519B2 (ja)
JPH0462398B2 (ja)
JPH0462399B2 (ja)
JPS63155197A (ja) 無声音検出方法
Ali et al. Automatic detection and classification of stop consonants using an acoustic-phonetic feature-based system
Niederjohn et al. Computer recognition of the continuant phonemes in connected English speech
JPS63220295A (ja) 音声区間検出方式
JPS63155196A (ja) 無声音検出方法
JPS5936759B2 (ja) 音声認識方法
JP2744622B2 (ja) 破裂子音識別方式
JPH0398098A (ja) 音声認識装置
JPH06110492A (ja) 音声認識装置
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
JP2697995B2 (ja) 発声発語訓練器
JPS61246800A (ja) 音声応答スイツチ
JPS63155199A (ja) 無声音検出方法
JPS6334479B2 (ja)
JPS62141597A (ja) 有声破裂子音識別方式
JPS63168700A (ja) 音韻変化点検出方法
JPH0573035B2 (ja)
JPS63153599A (ja) ピツチ抽出回路
JPS59223498A (ja) 音素判別法
JP2000010577A (ja) 有声音/無声音判定装置
JPS6363919B2 (ja)