JPH08292787A - 音声・非音声判別方法 - Google Patents

音声・非音声判別方法

Info

Publication number
JPH08292787A
JPH08292787A JP7095492A JP9549295A JPH08292787A JP H08292787 A JPH08292787 A JP H08292787A JP 7095492 A JP7095492 A JP 7095492A JP 9549295 A JP9549295 A JP 9549295A JP H08292787 A JPH08292787 A JP H08292787A
Authority
JP
Japan
Prior art keywords
voice
calculated
determined
predetermined
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7095492A
Other languages
English (en)
Inventor
Koji Tanaka
浩司 田中
Masayuki Iida
正幸 飯田
Masanori Miyatake
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP7095492A priority Critical patent/JPH08292787A/ja
Publication of JPH08292787A publication Critical patent/JPH08292787A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 この発明は、新規な音声・非音声判定方法を
提供することを目的とする。 【構成】 音声・非音声判定方法において、入力音声か
ら同じピッチ周期の継続時間を算出し、算出された同じ
ピッチ周期の継続時間が所定範囲内にあるか否かに基づ
いて、入力音声が音声か非音声かを判定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、入力音声が音声かま
たは非音声かを判定する音声・非音声判定方法に関す
る。
【0002】
【従来の技術】入力音声が音声かまたは非音声かを判定
する従来方法としては、入力音声からピッチ周期を算出
し、算出されたピッチ周期が所定範囲にあるか否かによ
って行うものがある。
【0003】
【発明が解決しようとする課題】この発明は、新規な音
声・非音声判定方法を提供することを目的とする。
【0004】
【課題を解決するための手段】この発明による第1の音
声・非音声判定方法は、入力音声から同じピッチ周期の
継続時間を算出し、算出された同じピッチ周期の継続時
間が所定範囲内にあるか否かに基づいて、入力音声が音
声か非音声かを判定することを特徴とする。
【0005】この発明による第2の音声・非音声判定方
法は、入力音声から、ピッチ周期を算出するステップ、
同じピッチ周期の継続時間を算出するステップ、算出さ
れた同じピッチ周期の継続時間が所定範囲内にあるか否
かを判定するステップ、算出された同じピッチ周期の継
続時間が所定範囲内にあると判定されたときに、入力音
声が音声であると判別するステップ、ならびに算出され
た同じピッチ周期の継続時間が所定範囲外にあると判定
されたときには、入力音声が非音声であると判別するス
テップを備えていることを特徴とする。
【0006】この発明による第3の音声・非音声判定方
法は、入力音声のピッチ周期と、同じピッチ周期の継続
時間を算出し、入力音声のピッチ周期が所定範囲内にあ
るか否か、および同じピッチ周期の継続時間が所定範囲
内にあるか否かに基づいて、入力音声が音声か非音声か
を判定することを特徴とする。
【0007】この発明による第4の音声・非音声判定方
法は、入力音声から、ピッチ周期を算出するステップ、
同じピッチ周期の継続時間を算出するステップ、算出さ
れたピッチ周期が所定範囲内にあるか否かを判定するス
テップ、算出されたピッチ周期が所定範囲内にあると判
定されたときに、算出された同じピッチ周期の継続時間
が所定範囲内にあるか否かを判定するステップ、算出さ
れたピッチ周期が所定範囲内にあると判定され、かつ算
出された同じピッチ周期の継続時間が所定範囲内にある
と判定されたときに、入力音声が音声であると判別する
ステップ、ならびに算出されたピッチ周期が所定範囲外
にあると判定されたときまたは算出された同じピッチ周
期の継続時間が所定範囲外にあると判定されたときに
は、入力音声が非音声であると判別するステップを備え
ていることを特徴とする。
【0008】この発明による第5の音声・非音声判定方
法は、入力音声の振幅またはパワー値に関する値と、同
じピッチ周期の継続時間を算出し、入力音声の振幅また
はパワー値に関する値が所定値以上であるか否か、およ
び同じピッチ周期の継続時間が所定範囲内にあるか否か
に基づいて、入力音声が音声か非音声かを判定すること
を特徴とする。
【0009】この発明による第6の音声・非音声判定方
法は、入力音声から、振幅またはパワー値に関する値と
ピッチ周期を算出するステップ、同じピッチ周期の継続
時間を算出するステップ、算出された振幅またはパワー
値に関する値が所定値以上であるか否かを判定するステ
ップ、算出された振幅またはパワー値に関する値が所定
値以上であると判定されたときに、算出された同じピッ
チ周期の継続時間が所定範囲内にあるか否かを判定する
ステップ、算出された振幅またはパワー値に関する値が
所定値以上であると判定され、かつ算出された同じピッ
チ周期の継続時間が所定範囲内にあると判定されたとき
に、入力音声が音声であると判別するステップ、ならび
に算出された振幅またはパワー値に関する値が所定値よ
り小さいと判定されたときまたは算出された同じピッチ
周期の継続時間が所定範囲外にあると判定されたときに
は、入力音声が非音声であると判別するステップを備え
ていることを特徴とする。
【0010】この発明による第7の音声・非音声判定方
法は、入力音声からホルマントの時間的変化量を算出
し、算出されたホルマントの時間的変化量が所定量より
小さいか否かに基づいて、入力音声が音声か非音声かを
判定することを特徴とする。
【0011】この発明による第8の音声・非音声判定方
法は、入力音声から、ホルマントの時間的変化量を算出
するステップ、算出されたホルマントの時間的変化量が
所定量より小さいか否かを判定するステップ、算出され
たホルマントの時間的変化量が所定量より小さいと判定
されたときに、入力音声が音声であると判別するステッ
プ、ならびに算出されたホルマントの時間的変化量が所
定量以上であると判定されたときには、入力音声が非音
声であると判別するステップを備えていることを特徴と
する。
【0012】この発明による第9の音声・非音声判定方
法は、入力音声から、ホルマントの時間的変化量を算出
するステップ、算出されたホルマントの時間的変化量が
所定量より小さいか否かを判定するステップ、算出され
たホルマントの時間的変化量が所定量より小さいと判定
されたときに、ホルマントの時間的変化量が所定量より
小さい状態の継続長を算出するステップ、ホルマントの
時間的変化量が所定量より小さい状態の継続長が所定長
以下であるか否かを判定するステップ、ホルマントの時
間的変化量が所定量より小さい状態の継続長が所定長以
下であると判定されたときには、入力音声が音声である
と判別するステップ、ならびに算出されたホルマントの
時間的変化量が所定量以上であると判定されたとき、ま
たはホルマントの時間的変化量が所定量より小さい状態
の継続長が所定長より長いと判定されたときには、入力
音声が非音声であると判別するステップを備えているこ
とを特徴とする。
【0013】この発明による第10の音声・非音声判定
方法は、入力音声から音声帯域の振幅累積値と、非音声
帯域の振幅累積値との比率を算出し、算出された比率が
所定値より小さいか否かに基づいて、入力音声が音声か
非音声かを判定することを特徴とする。
【0014】この発明による第11の音声・非音声判定
方法は、入力音声から非音声帯域の振幅累積値(Qb)
に対する音声帯域の振幅累積値(Qa)の比率(Qa/
Qb)を算出するステップ、算出された比率(Qa/Q
b)が所定値より大きいか否かを判定するステップ、算
出された比率(Qa/Qb)が所定値より大きいと判定
されたときに、入力音声が音声であると判別するステッ
プ、ならびに算出された比率(Qa/Qb)が所定値以
下と判定されたときには、入力音声が非音声であると判
別するステップを備えていることを特徴とする。
【0015】この発明による第12の音声・非音声判定
方法は、入力音声から非音声帯域の振幅累積値(Qb)
に対する音声帯域の振幅累積値(Qa)の比率(Qa/
Qb)を算出するステップ、算出された比率(Qa/Q
b)が所定値より大きいか否かを判定するステップ、算
出された比率(Qa/Qb)が所定値より大きいと判定
されたときに、比率(Qa/Qb)が所定値より大きい
状態の継続長を算出するステップ、比率(Qa/Qb)
が所定値より大きい状態の継続長が所定長以上であるか
否かを判定するステップ、比率(Qa/Qb)が所定値
より大きい状態の継続長が所定長以上であると判定され
たときには、入力音声が音声であると判別するステッ
プ、ならびに算出された比率(Qa/Qb)が所定値以
下であると判定されたとき、または比率(Qa/Qb)
が所定値より大きい状態の継続長が所定長より短いと判
定されたときには、入力音声が非音声であると判別する
ステップを備えていることを特徴とする。
【0016】この発明による第13の音声・非音声判定
方法は、入力音声から非音声帯域の振幅累積値(Qb)
に対する音声帯域の振幅累積値(Qa)の比率(Qa/
Qb)を算出するステップ、算出された比率(Qa/Q
b)が所定値より大きいか否かを判定するステップ、算
出された比率(Qa/Qb)が所定値より大きいと判定
されたときに、比率(Qa/Qb)が所定値より大きい
状態の継続長を算出するステップ、比率(Qa/Qb)
が所定値より大きい状態の継続長が所定範囲内にあるか
否かを判定するステップ、比率(Qa/Qb)が所定値
より大きい状態の継続長が所定範囲内にあると判定され
たときには、入力音声が音声であると判別するステッ
プ、ならびに算出された比率(Qa/Qb)が所定値以
下であると判定されたとき、または比率(Qa/Qb)
が所定値より大きい状態の継続長が所定範囲外にあると
判定されたときには、入力音声が非音声であると判別す
るステップを備えていることを特徴とする。
【0017】
【作用】この発明による第1の音声・非音声判定方法で
は、入力音声から同じピッチ周期の継続時間が算出され
る。そして、算出された同じピッチ周期の継続時間が所
定範囲内にあるか否かに基づいて、入力音声が音声か非
音声かが判定される。
【0018】この発明による第2の音声・非音声判定方
法では、入力音声から、ピッチ周期が算出される。同じ
ピッチ周期の継続時間が算出される。算出された同じピ
ッチ周期の継続時間が所定範囲内にあるか否かが判定さ
れる。算出された同じピッチ周期の継続時間が所定範囲
内にあると判定されたときに、入力音声が音声であると
判別される。算出された同じピッチ周期の継続時間が所
定範囲外にあると判定されたときには、入力音声が非音
声であると判別される。
【0019】この発明による第3の音声・非音声判定方
法では、入力音声のピッチ周期と、同じピッチ周期の継
続時間が算出される。そして、入力音声のピッチ周期が
所定範囲内にあるか否か、および同じピッチ周期の継続
時間が所定範囲内にあるか否かに基づいて、入力音声が
音声か非音声かが判定される。
【0020】この発明による第4の音声・非音声判定方
法では、入力音声から、ピッチ周期が算出される。同じ
ピッチ周期の継続時間が算出される。算出されたピッチ
周期が所定範囲内にあるか否かが判定される。算出され
たピッチ周期が所定範囲内にあると判定されたときに、
算出された同じピッチ周期の継続時間が所定範囲内にあ
るか否かが判定される。算出されたピッチ周期が所定範
囲内にあると判定され、かつ算出された同じピッチ周期
の継続時間が所定範囲内にあると判定されたときには、
入力音声が音声であると判別される。算出されたピッチ
周期が所定範囲外にあると判定されたときまたは算出さ
れた同じピッチ周期の継続時間が所定範囲外にあると判
定されたときには、入力音声が非音声であると判別され
る。
【0021】この発明による第5の音声・非音声判定方
法では、入力音声の振幅またはパワー値に関する値と、
同じピッチ周期の継続時間とが算出される。入力音声の
振幅またはパワー値に関する値が所定値以上であるか否
か、および同じピッチ周期の継続時間が所定範囲内にあ
るか否かに基づいて、入力音声が音声か非音声かが判定
される。
【0022】この発明による第6の音声・非音声判定方
法では、入力音声から、振幅またはパワー値に関する値
とピッチ周期とが算出される。同じピッチ周期の継続時
間が算出される。算出された振幅またはパワー値に関す
る値が所定値以上であるか否かが判定される。算出され
た振幅またはパワー値に関する値が所定値以上であると
判定されたときに、算出された同じピッチ周期の継続時
間が所定範囲内にあるか否かが判定される。算出された
振幅またはパワー値に関する値が所定値以上であると判
定され、かつ算出された同じピッチ周期の継続時間が所
定範囲内にあると判定されたときに、入力音声が音声で
あると判別される。算出された振幅またはパワー値に関
する値が所定値より小さいと判定されたときまたは算出
された同じピッチ周期の継続時間が所定範囲外にあると
判定されたときには、入力音声が非音声であると判別さ
れる。
【0023】この発明による第7の音声・非音声判定方
法では、入力音声からホルマントの時間的変化量が算出
される。そして、算出されたホルマントの時間的変化量
が所定量より小さいか否かに基づいて、入力音声が音声
か非音声かが判定される。
【0024】この発明による第8の音声・非音声判定方
法では、入力音声から、ホルマントの時間的変化量が算
出される。算出されたホルマントの時間的変化量が所定
量より小さいか否かが判定される。算出されたホルマン
トの時間的変化量が所定量より小さいと判定されたとき
に、入力音声が音声であると判別される。算出されたホ
ルマントの時間的変化量が所定量以上であると判定され
たときには、入力音声が非音声であると判別される。
【0025】この発明による第9の音声・非音声判定方
法では、入力音声から、ホルマントの時間的変化量が算
出される。算出されたホルマントの時間的変化量が所定
量より小さいか否かが判定される。算出されたホルマン
トの時間的変化量が所定量より小さいと判定されたとき
に、ホルマントの時間的変化量が所定量より小さい状態
の継続長が算出される。ホルマントの時間的変化量が所
定量より小さい状態の継続長が所定長以下であるか否か
が判定される。ホルマントの時間的変化量が所定量より
小さい状態の継続長が所定長以下であると判定されたと
きには、入力音声が音声であると判別される。算出され
たホルマントの時間的変化量が所定量以上であると判定
されたとき、またはホルマントの時間的変化量が所定量
より小さい状態の継続長が所定長より長いと判定された
ときには、入力音声が非音声であると判別される。
【0026】この発明による第10の音声・非音声判定
方法では、入力音声から音声帯域の振幅累積値と、非音
声帯域の振幅累積値との比率が算出される。そして、算
出された比率が所定値より小さいか否かに基づいて、入
力音声が音声か非音声かが判定される。
【0027】この発明による第11の音声・非音声判定
方法では、入力音声から非音声帯域の振幅累積値(Q
b)に対する音声帯域の振幅累積値(Qa)の比率(Q
a/Qb)が算出される。算出された比率(Qa/Q
b)が所定値より大きいか否かが判定される。算出され
た比率(Qa/Qb)が所定値より大きいと判定された
ときに、入力音声が音声であると判別される。算出され
た比率(Qa/Qb)が所定値以下と判定されたときに
は、入力音声が非音声であると判別される。
【0028】この発明による第12の音声・非音声判定
方法では、入力音声から非音声帯域の振幅累積値(Q
b)に対する音声帯域の振幅累積値(Qa)の比率(Q
a/Qb)が算出される。算出された比率(Qa/Q
b)が所定値より大きいか否かが判定される。算出され
た比率(Qa/Qb)が所定値より大きいと判定された
ときに、比率(Qa/Qb)が所定値より大きい状態の
継続長が算出される。比率(Qa/Qb)が所定値より
大きい状態の継続長が所定長以上であるか否かが判定さ
れる。比率(Qa/Qb)が所定値より大きい状態の継
続長が所定長以上であると判定されたときには、入力音
声が音声であると判別される。算出された比率(Qa/
Qb)が所定値以下であると判定されたとき、または比
率(Qa/Qb)が所定値より大きい状態の継続長が所
定長より短いと判定されたときには、入力音声が非音声
であると判別される。
【0029】この発明による第13の音声・非音声判定
方法では、入力音声から非音声帯域の振幅累積値(Q
b)に対する音声帯域の振幅累積値(Qa)の比率(Q
a/Qb)が算出される。算出された比率(Qa/Q
b)が所定値より大きいか否かが判定される。算出され
た比率(Qa/Qb)が所定値より大きいと判定された
ときに、比率(Qa/Qb)が所定値より大きい状態の
継続長が算出される。比率(Qa/Qb)が所定値より
大きい状態の継続長が所定範囲内にあるか否かが判定さ
れる。比率(Qa/Qb)が所定値より大きい状態の継
続長が所定範囲内にあると判定されたときには、入力音
声が音声であると判別される。算出された比率(Qa/
Qb)が所定値以下であると判定されたとき、または比
率(Qa/Qb)が所定値より大きい状態の継続長が所
定範囲外にあると判定されたときには、入力音声が非音
声であると判別される。
【0030】
【実施例】以下、図面を参照して、この発明の実施例に
ついて説明する。
【0031】(1)第1の音声・非音声判定方法の説明
【0032】まず、第1の音声・非音声判定方法の考え
方について説明する。
【0033】図3はランダム雑音に対する入力音声波形
を示し、図2は人間の音声に対する入力音声波形を示し
ている。
【0034】図3に示すように、ランダム雑音に対する
入力音声波形では、同じピッチ周期の継続時間(周期継
続時間)が比較的短い。これに対し、人間の音声に対す
る入力音声波形では、各音素に対して、所定ピッチ周期
の波形が連続して現れるため、同じピッチ周期の継続時
間(周期継続時間)が比較的長い。また、図示は省略さ
れているが、周期的雑音に対する入力音声波形では、同
じピッチ周期の継続時間は、非常に長い。
【0035】そこで、ランダム雑音に対する入力音声波
形の周期継続時間と、人間の音声に対する入力音声波形
の周期継続時間とを弁別するための第1のしきい値TL
を設定する。また、人間の音声に対する入力音声波形の
周期継続時間と、周期的雑音に対する入力音声波形の周
期継続時間とを弁別するための第2のしきい値TH(T
L<TH)を設定する。たとえば、TLとしては15m
sが設定され、THとしては150msが設定される。
【0036】そして、入力音声波形の周期継続時間を算
出し、算出された周期継続時間Tが、TL以上でかつT
H以下であれば、その入力音声波形を音声と判別する。
算出された周期継続時間Tが、TLより短い場合または
THより長い場合には、その入力音声波形を非音声と判
別する。
【0037】図1は、第1の音声・非音声判定方法の手
順を示している。
【0038】まず、入力音声波形からピッチ周期Tpを
算出する(ステップ1)。このピッチ周期Tpの算出
は、たとえば、よく知られているように自己相関法を用
いて行われる。
【0039】次に、同じピッチ周期Tpが継続している
継続時間T(周期継続時間)を算出する(ステップ
2)。
【0040】次に、2つのしきい値TLとTH(TL<
TH)とを用いて、音声か非音声かを判別する(ステッ
プ3)。
【0041】すなわち、ステップ2で算出された継続時
間Tが次式で表される条件を満たす場合には(ステップ
3でYES)、当該入力音声波形は音声であると判別さ
れる(ステップ4)。この条件を満たさない場合には
(ステップ3でNO)、当該入力音声波形は非音声と判
別される(ステップ5)。
【0042】
【数1】TL≦T≦TH
【0043】(2)第2の音声・非音声判定方法の説明
【0044】図4は、第2の音声・非音声判定方法の手
順を示している。
【0045】人間の音声に対する入力音声波形から抽出
されたピッチの周波数範囲は、例えば、66Hz〜32
0Hzであることが知られている。いいかえれば、人間
の音声に対する入力音声波形から抽出されたピッチ周期
Tpの範囲は、1/320〜1/66であることが知ら
れている。
【0046】そこで、まず、入力音声波形からピッチ周
期Pを算出する(ステップ11)。
【0047】そして、算出されたピッチ周期Tpが、所
定範囲内に有るか(1/320≦Tp≦1/66)、否
かを判定する(ステップ12)。
【0048】算出されたピッチ周期Tpが、所定範囲外
であるときには当該入力音声波形は、非音声であると判
別される(ステップ16)。
【0049】算出されたピッチ周期Tpが、所定範囲内
であるときには、上記第1の音声・非音声判定方法と同
様な方法でさらに音声か非音声かを判別する。
【0050】すなわち、まず、同じピッチ周期Tpが継
続している継続時間T(周期継続時間)を算出する(ス
テップ13)。
【0051】ステップ13で算出された継続時間Tが上
記数式1で表される条件を満たす場合には(ステップ1
4でYES)、当該入力音声波形は音声であると判別さ
れる(ステップ15)。この条件を満たさない場合には
(ステップ14でNO)、当該入力音声波形は非音声と
判別される(ステップ16)。
【0052】(3)第3の音声・非音声判定方法の説明
【0053】図5は、第3の音声・非音声判定方法の手
順を示している。
【0054】まず、入力音声波形のパワー平均値Pを算
出し(ステップ21)、算出されたパワー平均値所定の
しきい値Po以上か否かを判別する(ステップ22)。
【0055】パワー平均値Pは、入力音声波形の所定数
N分の各サンプリングデータの振幅をi0 ,i1 ,…i
N -1とすると、次の数式2によって算出される。
【0056】
【数2】
【0057】算出された平均パワー値Pがしきい値Po
未満(P<Po)のときには、当該入力音声波形は非音
声であると判別される(ステップ27)。
【0058】算出された平均パワー値Pがしきい値Po
以上(P≧Po)のときには、上記第1の音声・非音声
判定方法と同様な方法でさらに音声か非音声かを判別す
る。
【0059】すなわち、まず、入力音声波形からピッチ
周期Tpを算出する(ステップ23)。
【0060】次に、同じピッチ周期Tpが継続している
継続時間T(周期継続時間)を算出する(ステップ2
4)。
【0061】ステップ24で算出された継続時間Tが上
記数式1で表される条件を満たす場合には(ステップ2
5でYES)、当該入力音声波形は音声であると判別さ
れる(ステップ26)。この条件を満たさない場合には
(ステップ25でNO)、当該入力音声波形は非音声と
判別される(ステップ27)。
【0062】なお、平均パワー値の代わりに、パワー累
積値、振幅累積値または振幅平均値を用いてもよい。
【0063】(4)第4の音声・非音声判定方法の説明
【0064】第4の音声・非音声判定方法は、入力音声
波形から求められたホルマントの時間的変化に基づい
て、入力音声波形が音声か非音声かを判別する。
【0065】ここで、ホルマント( formant )とは、音
素を特徴づける優勢な周波数成分をいい、声道の共振周
波数に対応している。特に、母音には、図7に示すよう
に、3個程度の特徴的なホルマントf1、f2およびf
3を有している。ここで、f1は第1ホルマント(極:
ピーク)と呼ばれ、f2は第2ホルマントと呼ばれ、f
3は第3ホルマントと呼ばれる。
【0066】図6は、第4の音声・非音声判定方法によ
る音声検出手順を示している。
【0067】まず、入力音声波形の分析フレーム(たと
えば、8ms)ごとに、第1ホルマントf1を求める
(ステップ31)。つまり、分析フレームごとに、パワ
ースペクトルの極を求める。
【0068】次に、連続する2つの分析フレームのう
ち、第1分析フレームで求めた第1ホルマント1と、第
2分析フレームで求めた第1ホルマントf1との変化量
Δf1を算出する(ステップ32)。
【0069】次に、変化量Δf1が所定値Δoより小さ
いか否かが判別される(ステップ33)。この所定値Δ
oとしては、たとえば10Hzが用いられる。
【0070】変化量Δf1が所定値Δoより小さいとき
には、当該入力音声波形は音声であると判別される(ス
テップ34)。
【0071】変化量Δf1が所定値Δo以上であれば、
当該入力音声波形は非音声と判別される(ステップ3
5)。
【0072】なお、入力音声波形のパワー平均値、パワ
ー累積値、振幅平均値または振幅累積値に基づいて、音
声と判別されたときのみ、第4の音声・非音声判定方法
を適用するようにしてもよい。
【0073】(5)第5の音声・非音声判定方法の説明
【0074】図8は、第5の音声・非音声判定方法の手
順を示している。
【0075】まず、入力音声波形の分析フレーム(たと
えば、8ms)ごとに、第1ホルマントf1を求める
(ステップ41)。つまり、分析フレームごとに、パワ
ースペクトルの極を求める。
【0076】次に、連続する2つの分析フレームのう
ち、第1分析フレームで求めた第1ホルマント1と、第
2分析フレームで求めた第1ホルマントf1との変化量
Δf1を算出する(ステップ42)。
【0077】次に、変化量Δf1が所定値Δoより小さ
いか否かが判別される(ステップ43)。変化量Δf1
が所定値Δo以上であれば、当該入力音声波形はランダ
ム雑音(非音声)と判別される(ステップ44)。
【0078】変化量Δf1が所定値Δoより小さいとき
には、変化量Δf1が所定値Δoより小さい状態の継続
長Sが算出される(ステップ45)。
【0079】次に、算出された継続長Sが所定時間So
以内か否かが判別される(ステップ46)。
【0080】ステップ45で算出された継続時間Tが所
定時間So以内であるときには、当該入力音声波形は音
声であると判別される(ステップ47)。
【0081】ステップ45で算出された継続時間Tが所
定時間Soより長いときには、当該入力音声波形は周期
的雑音(非音声)と判別される(ステップ48)。
【0082】なお、入力音声波形のパワー平均値、パワ
ー累積値、振幅平均値または振幅累積値に基づいて、音
声と判別されたときのみ、第5の音声・非音声判定方法
を適用するようにしてもよい。
【0083】(6)第6の音声・非音声判定方法の説明
【0084】図9は、第6の音声・非音声判定方法の手
順を示している。
【0085】まず、分析フレームごとに入力音声波形か
ら音声帯域(〜4KHz)の振幅累積値Qaと、非音声
帯域の振幅累積値Qbとを求める(ステップ51)。
【0086】次に、非音声帯域の振幅累積値Qbに対す
る音声帯域の振幅累積値Qaとの比率R(=Qa/Q
b)を算出する(ステップ52)。
【0087】次に、算出された比率Rが所定値Roより
大きいか(R>Ro)否かを判定する(ステップ5
3)。
【0088】算出された比率Rが所定値Roより大きい
ときには(R>Ro)、当該入力音声波形は音声である
と判別する(ステップ54)。
【0089】算出された比率Rが所定値Ro以下のとき
には(R≦Ro)、当該入力音声波形は非音声であると
判別する(ステップ55)。
【0090】(7)第7の音声・非音声判定方法の説明
【0091】図10は、第7の音声・非音声判定方法に
よる音声検出手順を示している。
【0092】まず、分析フレームごとに入力音声波形か
ら音声帯域(〜4KHz)の振幅累積値Qaと、非音声
帯域の振幅累積値Qbとを求める(ステップ61)。
【0093】次に、非音声帯域の振幅累積値Qbに対す
る音声帯域の振幅累積値Qaとの比率R(=Qa/Q
b)を算出する(ステップ62)。
【0094】次に、算出された比率Rが所定値Roより
大きいか(R>Ro)否かを判定する(ステップ6
3)。
【0095】算出された比率Rが所定値Ro以下のとき
には(R≦Ro)、当該入力音声波形は非音声であると
判別する(ステップ67)。
【0096】算出された比率Rが所定値Roより大きい
ときには(R>Ro)、算出された比率Rが所定値Ro
より大きい状態の継続長Uが算出される(ステップ6
4)。
【0097】次に、算出された継続長Uが所定時間Uo
以上か否かが判別される(ステップ65)。
【0098】ステップ64で算出された継続時間Uが所
定時間Uo以上であるときには、当該入力音声波形は音
声であると判別される(ステップ66)。
【0099】ステップ64で算出された継続時間Uが所
定時間Uoより短いときには、当該入力音声波形は非音
声と判別される(ステップ67)。
【0100】(8)第8の音声・非音声判定方法の説明
【0101】図11は、第8の音声・非音声判定方法に
よる音声検出手順を示している。
【0102】まず、分析フレームごとに入力音声波形か
ら音声帯域(〜4KHz)の振幅累積値Qaと、非音声
帯域の振幅累積値Qbとを求める(ステップ71)。
【0103】次に、非音声帯域の振幅累積値Qbに対す
る音声帯域の振幅累積値Qaとの比率R(=Qa/Q
b)を算出する(ステップ72)。
【0104】次に、算出された比率Rが所定値Roより
大きいか(R>Ro)否かを判定する(ステップ7
3)。
【0105】算出された比率Rが所定値Ro以下のとき
には(R≦Ro)、当該入力音声波形は非音声であると
判別する(ステップ77)。
【0106】算出された比率Rが所定値Roより大きい
ときには(R>Ro)、算出された比率Rが所定値Ro
より大きい状態の継続長Uが算出される(ステップ7
4)。
【0107】次に、ステップ74で算出された継続時間
Uが第1の所定時間UL以上ありかつ第2の所定時間U
H(ただし、UL<UH)以内であるかが判別される
(ステップ75)。
【0108】ステップ74で算出された継続時間Uが、
UL≦U≦UHの範囲内であるときには、当該入力音声
波形は音声であると判別される(ステップ76)。
【0109】ステップ74で算出された継続時間UがU
L≦U≦UHの範囲外であるときには、当該入力音声波
形は非音声と判別される(ステップ77)。
【0110】以上のような音声・非音声判定方法を、音
声と非音声が録音されているVTR、テープレーコーダ
に応用した場合には、音声および非音声の両方を再生出
力させたり、音声のみを再生出力させたり、非音声のみ
を再生出力させたりすることが可能となる。
【0111】
【発明の効果】この発明によれば、新規な音声・非音声
判定方法が得られる。
【図面の簡単な説明】
【図1】第1の音声・非音声判定方法を示すフローチャ
ートである。
【図2】人間の音声に対する入力音声波形を示すタイム
チャートである。
【図3】ランダム雑音に対する入力音声波形を示すタイ
ムチャートである。
【図4】第2の音声・非音声判定方法を示すフローチャ
ートである。
【図5】第3の音声・非音声判定方法を示すフローチャ
ートである。
【図6】第4の音声・非音声判定方法を示すフローチャ
ートである。
【図7】ホルマントを示すスペクトル図である。
【図8】第5の音声・非音声判定方法を示すフローチャ
ートである。
【図9】第6の音声・非音声判定方法を示すフローチャ
ートである。
【図10】第7の音声・非音声判定方法を示すフローチ
ャートである。
【図11】第8の音声・非音声判定方法を示すフローチ
ャートである。

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力音声から同じピッチ周期の継続時間
    を算出し、算出された同じピッチ周期の継続時間が所定
    範囲内にあるか否かに基づいて、入力音声が音声か非音
    声かを判定する音声・非音声判定方法。
  2. 【請求項2】 入力音声から、ピッチ周期を算出するス
    テップ、 同じピッチ周期の継続時間を算出するステップ、 算出された同じピッチ周期の継続時間が所定範囲内にあ
    るか否かを判定するステップ、 算出された同じピッチ周期の継続時間が所定範囲内にあ
    ると判定されたときに、入力音声が音声であると判別す
    るステップ、ならびに算出された同じピッチ周期の継続
    時間が所定範囲外にあると判定されたときには、入力音
    声が非音声であると判別するステップ、 を備えている音声・非音声判定方法。
  3. 【請求項3】 入力音声のピッチ周期と、同じピッチ周
    期の継続時間を算出し、入力音声のピッチ周期が所定範
    囲内にあるか否か、および同じピッチ周期の継続時間が
    所定範囲内にあるか否かに基づいて、入力音声が音声か
    非音声かを判定する音声・非音声判定方法。
  4. 【請求項4】 入力音声から、ピッチ周期を算出するス
    テップ、 同じピッチ周期の継続時間を算出するステップ、 算出されたピッチ周期が所定範囲内にあるか否かを判定
    するステップ、 算出されたピッチ周期が所定範囲内にあると判定された
    ときに、算出された同じピッチ周期の継続時間が所定範
    囲内にあるか否かを判定するステップ、 算出されたピッチ周期が所定範囲内にあると判定され、
    かつ算出された同じピッチ周期の継続時間が所定範囲内
    にあると判定されたときに、入力音声が音声であると判
    別するステップ、ならびに算出されたピッチ周期が所定
    範囲外にあると判定されたときまたは算出された同じピ
    ッチ周期の継続時間が所定範囲外にあると判定されたと
    きには、入力音声が非音声であると判別するステップ、 を備えている音声・非音声判定方法。
  5. 【請求項5】 入力音声の振幅またはパワー値に関する
    値と、同じピッチ周期の継続時間を算出し、入力音声の
    振幅またはパワー値に関する値が所定値以上であるか否
    か、および同じピッチ周期の継続時間が所定範囲内にあ
    るか否かに基づいて、入力音声が音声か非音声かを判定
    する音声・非音声判定方法。
  6. 【請求項6】 入力音声から、振幅またはパワー値に関
    する値とピッチ周期を算出するステップ、 同じピッチ周期の継続時間を算出するステップ、 算出された振幅またはパワー値に関する値が所定値以上
    であるか否かを判定するステップ、 算出された振幅またはパワー値に関する値が所定値以上
    であると判定されたときに、算出された同じピッチ周期
    の継続時間が所定範囲内にあるか否かを判定するステッ
    プ、 算出された振幅またはパワー値に関する値が所定値以上
    であると判定され、かつ算出された同じピッチ周期の継
    続時間が所定範囲内にあると判定されたときに、入力音
    声が音声であると判別するステップ、ならびに算出され
    た振幅またはパワー値に関する値が所定値より小さいと
    判定されたときまたは算出された同じピッチ周期の継続
    時間が所定範囲外にあると判定されたときには、入力音
    声が非音声であると判別するステップ、 を備えている音声・非音声判定方法。
  7. 【請求項7】 入力音声からホルマントの時間的変化量
    を算出し、算出されたホルマントの時間的変化量が所定
    量より小さいか否かに基づいて、入力音声が音声か非音
    声かを判定する音声・非音声判定方法。
  8. 【請求項8】 入力音声から、ホルマントの時間的変化
    量を算出するステップ、 算出されたホルマントの時間的変化量が所定量より小さ
    いか否かを判定するステップ、 算出されたホルマントの時間的変化量が所定量より小さ
    いと判定されたときに、入力音声が音声であると判別す
    るステップ、ならびに算出されたホルマントの時間的変
    化量が所定量以上であると判定されたときには、入力音
    声が非音声であると判別するステップ、 を備えている音声・非音声判定方法。
  9. 【請求項9】 入力音声から、ホルマントの時間的変化
    量を算出するステップ、 算出されたホルマントの時間的変化量が所定量より小さ
    いか否かを判定するステップ、 算出されたホルマントの時間的変化量が所定量より小さ
    いと判定されたときに、ホルマントの時間的変化量が所
    定量より小さい状態の継続長を算出するステップ、 ホルマントの時間的変化量が所定量より小さい状態の継
    続長が所定長以下であるか否かを判定するステップ、 ホルマントの時間的変化量が所定量より小さい状態の継
    続長が所定長以下であると判定されたときには、入力音
    声が音声であると判別するステップ、ならびに算出され
    たホルマントの時間的変化量が所定量以上であると判定
    されたとき、またはホルマントの時間的変化量が所定量
    より小さい状態の継続長が所定長より長いと判定された
    ときには、入力音声が非音声であると判別するステッ
    プ、 を備えている音声・非音声判定方法。
  10. 【請求項10】 入力音声から音声帯域の振幅累積値
    と、非音声帯域の振幅累積値との比率を算出し、算出さ
    れた比率が所定値より小さいか否かに基づいて、入力音
    声が音声か非音声かを判定する音声・非音声判定方法。
  11. 【請求項11】 入力音声から非音声帯域の振幅累積値
    (Qb)に対する音声帯域の振幅累積値(Qa)の比率
    (Qa/Qb)を算出するステップ、 算出された比率(Qa/Qb)が所定値より大きいか否
    かを判定するステップ、 算出された比率(Qa/Qb)が所定値より大きいと判
    定されたときに、入力音声が音声であると判別するステ
    ップ、ならびに算出された比率(Qa/Qb)が所定値
    以下と判定されたときには、入力音声が非音声であると
    判別するステップ、 を備えている音声・非音声判定方法。
  12. 【請求項12】 入力音声から非音声帯域の振幅累積値
    (Qb)に対する音声帯域の振幅累積値(Qa)の比率
    (Qa/Qb)を算出するステップ、 算出された比率(Qa/Qb)が所定値より大きいか否
    かを判定するステップ、 算出された比率(Qa/Qb)が所定値より大きいと判
    定されたときに、比率(Qa/Qb)が所定値より大き
    い状態の継続長を算出するステップ、 比率(Qa/Qb)が所定値より大きい状態の継続長が
    所定長以上であるか否かを判定するステップ、 比率(Qa/Qb)が所定値より大きい状態の継続長が
    所定長以上であると判定されたときには、入力音声が音
    声であると判別するステップ、ならびに算出された比率
    (Qa/Qb)が所定値以下であると判定されたとき、
    または比率(Qa/Qb)が所定値より大きい状態の継
    続長が所定長より短いと判定されたときには、入力音声
    が非音声であると判別するステップ、 を備えている音声・非音声判定方法。
  13. 【請求項13】 入力音声から非音声帯域の振幅累積値
    (Qb)に対する音声帯域の振幅累積値(Qa)の比率
    (Qa/Qb)を算出するステップ、 算出された比率(Qa/Qb)が所定値より大きいか否
    かを判定するステップ、 算出された比率(Qa/Qb)が所定値より大きいと判
    定されたときに、比率(Qa/Qb)が所定値より大き
    い状態の継続長を算出するステップ、 比率(Qa/Qb)が所定値より大きい状態の継続長が
    所定範囲内にあるか否かを判定するステップ、 比率(Qa/Qb)が所定値より大きい状態の継続長が
    所定範囲内にあると判定されたときには、入力音声が音
    声であると判別するステップ、ならびに算出された比率
    (Qa/Qb)が所定値以下であると判定されたとき、
    または比率(Qa/Qb)が所定値より大きい状態の継
    続長が所定範囲外にあると判定されたときには、入力音
    声が非音声であると判別するステップ、 を備えている音声・非音声判定方法。
JP7095492A 1995-04-20 1995-04-20 音声・非音声判別方法 Pending JPH08292787A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7095492A JPH08292787A (ja) 1995-04-20 1995-04-20 音声・非音声判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7095492A JPH08292787A (ja) 1995-04-20 1995-04-20 音声・非音声判別方法

Publications (1)

Publication Number Publication Date
JPH08292787A true JPH08292787A (ja) 1996-11-05

Family

ID=14139105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7095492A Pending JPH08292787A (ja) 1995-04-20 1995-04-20 音声・非音声判別方法

Country Status (1)

Country Link
JP (1) JPH08292787A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003107326A1 (ja) * 2002-06-12 2003-12-24 三菱電機株式会社 音声認識方法及びその装置
JP2007233267A (ja) * 2006-03-03 2007-09-13 National Institute Of Advanced Industrial & Technology 音声信号と非音声信号の判別装置及び方法
JP2008158316A (ja) * 2006-12-25 2008-07-10 Yamaha Corp 音信号処理装置およびプログラム
JP2009157406A (ja) * 2009-04-15 2009-07-16 Yamaha Corp 音信号処理装置およびプログラム
JP2010136080A (ja) * 2008-12-04 2010-06-17 Sony Corp 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
WO2010131470A1 (ja) * 2009-05-14 2010-11-18 シャープ株式会社 ゲイン制御装置及びゲイン制御方法、音声出力装置
US8069039B2 (en) 2006-12-25 2011-11-29 Yamaha Corporation Sound signal processing apparatus and program
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003107326A1 (ja) * 2002-06-12 2003-12-24 三菱電機株式会社 音声認識方法及びその装置
JP2007233267A (ja) * 2006-03-03 2007-09-13 National Institute Of Advanced Industrial & Technology 音声信号と非音声信号の判別装置及び方法
JP4595124B2 (ja) * 2006-03-03 2010-12-08 独立行政法人産業技術総合研究所 音声信号と非音声信号の判別装置及び方法
JP2008158316A (ja) * 2006-12-25 2008-07-10 Yamaha Corp 音信号処理装置およびプログラム
US8069039B2 (en) 2006-12-25 2011-11-29 Yamaha Corporation Sound signal processing apparatus and program
JP2010136080A (ja) * 2008-12-04 2010-06-17 Sony Corp 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
US8548173B2 (en) 2008-12-04 2013-10-01 Sony Corporation Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment
JP2009157406A (ja) * 2009-04-15 2009-07-16 Yamaha Corp 音信号処理装置およびプログラム
WO2010131470A1 (ja) * 2009-05-14 2010-11-18 シャープ株式会社 ゲイン制御装置及びゲイン制御方法、音声出力装置
CN102422349A (zh) * 2009-05-14 2012-04-18 夏普株式会社 增益控制装置和增益控制方法、声音输出装置
JPWO2010131470A1 (ja) * 2009-05-14 2012-11-01 シャープ株式会社 ゲイン制御装置及びゲイン制御方法、音声出力装置

Similar Documents

Publication Publication Date Title
US7567900B2 (en) Harmonic structure based acoustic speech interval detection method and device
US6484137B1 (en) Audio reproducing apparatus
US6272459B1 (en) Voice signal coding apparatus
CN1286788A (zh) 关于低比特率语音编码器的噪声抑制
US20010010037A1 (en) Adaptive speech rate conversion without extension of input data duration, using speech interval detection
JP3105465B2 (ja) 音声区間検出方法
JPH08292787A (ja) 音声・非音声判別方法
US5696873A (en) Vocoder system and method for performing pitch estimation using an adaptive correlation sample window
US6125344A (en) Pitch modification method by glottal closure interval extrapolation
US20020156620A1 (en) Method and apparatus for speech coding with voiced/unvoiced determination
US7277847B2 (en) Method for determining intensity parameters of background noise in speech pauses of voice signals
JP3378672B2 (ja) 話速変換装置
JP3422716B2 (ja) 話速変換方法および装置および話速変換プログラムを格納した記録媒体
JP3520430B2 (ja) 左右音像方向抽出方法
JP3357742B2 (ja) 話速変換装置
US6385570B1 (en) Apparatus and method for detecting transitional part of speech and method of synthesizing transitional parts of speech
US7318025B2 (en) Method for improving speech quality in speech transmission tasks
JPH07191695A (ja) 話速変換装置
KR100345402B1 (ko) 피치 정보를 이용한 실시간 음성 검출 장치 및 그 방법
JP3607775B2 (ja) 音声状態判別装置
US20240105213A1 (en) Signal energy calculation with a new method and a speech signal encoder obtained by means of this method
JPH03114100A (ja) 音声区間検出装置
JPH0558551B2 (ja)
JP2951333B2 (ja) 音声信号の区間判別方法
JPS6039700A (ja) 音声区間検出方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees