JP4432893B2 - 声質判定装置、声質判定方法、および声質判定プログラム - Google Patents
声質判定装置、声質判定方法、および声質判定プログラム Download PDFInfo
- Publication number
- JP4432893B2 JP4432893B2 JP2005361612A JP2005361612A JP4432893B2 JP 4432893 B2 JP4432893 B2 JP 4432893B2 JP 2005361612 A JP2005361612 A JP 2005361612A JP 2005361612 A JP2005361612 A JP 2005361612A JP 4432893 B2 JP4432893 B2 JP 4432893B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- parameter
- audio signal
- voice
- voice quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
この発明は、上記発明において、前記声質判定部は、音声の切れ目およびサスティン部を前記音色変化度により判定した結果である音声分割情報に基づいて、前記判定値を算出するか否かを決定し、算出すると決定した区間の判定値の累積値に基づいて音声信号の音質を判定することを特徴とする。
図1は、同声質判定装置の機能ブロック図である。
この声質判定装置は、人の歌唱または発話による音声信号(以下、単に音声信号という)を入力して分析し、物理パラメータを出力するDSP1(物理パラメータ分析部)、および、この分析結果である物理パラメータに基づいて声質を判定するCPU2(音質判定部)で構成されている。
透明度:透明な声←→濁った声
安定度:安定した声←→不安定な声
高音余裕度:(高域に)余裕のある声←→余裕のない声
低音余裕度:(低域に)余裕のある声←→余裕のない声
なお、CPU2内部では、声質判定値を算出するために、さらに中間的なパラメータであるエネルギ安定度(Energy Stability)、ピッチ安定度(Pitch Stability)、ピッチ/エネルギ分布(Pitch/EnergyPlot)を算出している。各パラメータおよび声質判定値の詳細については、後述する。
なお、図1において、長円で示したブロックは、処理(処理機能部)を示しており、長方形で示したブロックは、処理によって算出・決定されたパラメータを示している。
ここで、メルスケールとは、人の聴覚の周波数分解能に基づく尺度であり、低い周波数では細かく、高い周波数では荒くなっている。対数に近い特性であるため、対数スケールで代用してもよい。
図8(A)は、メルスケール上に等間隔に配置した帯域フィルタバンクをリニアスケール上に展開した例を示している。このように、高い周波数ほど周波数分
解能が荒いため、フィルタバンクの幅が広くなっている。
音声分割判定部37は、これら音色変化度27、ビブラートデータ28、平均エネルギ29、平均ピッチデータ30の各データに基づいて音声の区切り、特にサスティン部の区間を判定する。
歌唱の音声信号は、図9に示すようなエンベロープ形状をしており、各音符毎にアタック部、サスティン部およびディケイ部が形成されている。そして、アタック部と音素の子音が一致する場合が多い。以下の声質判定処理部53〜57では、定常波形の音声が発声されているサスティン部の波形を用いて声質を判定する。このため、音声分割判定部37は、入力された音色変化度27、ビブラートデータ28、平均エネルギデータ29、平均ピッチデータ30の各データに基づいて、音声の切れ目およびサスティン部を判定する。
この響き度判定値60の算出手法の1例について説明する。判定部53は、響き度判定値60をスペクトル傾斜度38から算出する。この響き度判定値60を算出する際に、スペクトル傾斜度38に対して種々の特徴量による重み付けを行う。例えば音色変化度27が大きくなるにつれてスペクトル傾斜度38の値による響き度判定値60が小さくなるようにする。図10(A)は、音色変化度の重み付けについて説明する図である。このグラフの横軸は音色変化度(DeltaTimbre)27の値を示し、縦軸は音色変化度の重み付け(WDeltaTimbre=0〜1)を示す。同図(A)に示すように、音色変化度27が小さい場合は重み付けを1とし、音色変化度27が下限値(Bottom)を超えた場合に放物線状に重み付けを小さくし、上限値(Top)で重み付けを0とする。
(2)音色変化度<音色変化度上限値
上記の条件を満たす場合に、響き度判定値60を算出する。図10において、このように設定した音色変化度の範囲でスペクトル傾斜度38に対して重み付けを行う。また、音色変化度による重み付けに乗算して、さらに、ビブラート発生度、および平均エネルギデータ29による重み付けも行う。すなわち、全体の重み付けWは、以下のような数式で表される。
(2)ピッチデータ有
(3)|DeltaTimbre2|<y
平均エネルギの閾値xはどのような値であってもよいが、例えば数dB程度とする。また、音色変化度の自乗値の閾値yもどのような値であってもよいが、音色変化が無いと判断できる程度の値に任意に設定する。上記条件を満たす場合に音色変化度を次のように改訂する。
Harm.To Spect.Areaは、スペクトル値の減衰の程度を表すものであり、上記ピーク間減衰量分析部35が割り出すピーク間減衰量42に相当する。この場合、図1において、ピーク間減衰量42を判定部53に入力するようにする。
Delta Energy without Vib.は、平均エネルギデータ29の1フレーム前と1フレーム後のエネルギ差である。なお、1フレームとは、判定部53の動作する最小時間単位を示す(1音は例えば20フレーム程度)。また、2フレーム前と2フレーム後のエネルギ差とその平均としてもよい。
同様にDelta Pitch without Vib.は平均ピッチデータ30の1フレーム前と1フレーム後のピッチ差(絶対値)を表す。また、2フレーム前と2フレーム後のエネルギ差とその平均としてもよい。
Mel5は、MEL係数18の前後5フレーム(2フレーム前、1フレーム前、現フレーム、1フレーム後、および2フレーム後)の累積である。
(2)音色変化度<音色変化度上限値
なお、上述の方式以外にも、スペクトル傾斜度38、スペクトル励起度39およびフォルマント明瞭度40について相加平均等により響き度判定値60を割り出してもよい。また、各パラメータ値に応じた判定値を予めテーブル化しておいてこのテーブルにパラメータ値を当てはめて判定値を割り出してもよく、ファジィ等の他の推論エンジンを用いてもよい。
(2)音色変化度<音色変化度上限値
上記の条件を満たす場合に、透明度判定値61を算出する。図10において、このように設定した音色変化度の範囲でピーク間減衰量42、および波形ピークレベル安定度43に重み付けを行う。また、平均エネルギデータ29による重み付けも行う。全体の重み付けWeightは、以下のような数式で表される。
この補正項を次の数式に示すように、ピーク間減衰量42、および波形ピークレベル安定度43に乗算してそれぞれの瞬時値を算出する。
(2)ピッチデータ有
(3)|DeltaTimbre2|<y
上記条件を満たす場合に(数5)に示した数式で音色変化度を改訂する。
Spect.Tiltは、周波数スペクトルの傾斜を示す値であり、上記スペクトル傾斜度分析部31が割り出すスペクトル傾斜度38を表す。この場合、図1において、スペクトル傾斜度38を判定部54に入力するようにする。
Harm.To Spect.Areaは、スペクトル値の減衰の程度を表すものであり、上記ピーク間減衰量分析部35が割り出すピーク間減衰量42に相当する。
Pitch Centsは平均ピッチ30を表す。
各項目の係数a〜d、およびオフセット値eは、上述した判定値と同様に機械学習方式(教師あり)で求める。ニューラルネットワーク等の手法を用い、入力値に対し、人間が導き出した数値結果に近づくように各係数を決定していく。
(2)音色変化度<音色変化度上限値
なお、上述の方式以外にも、倍音安定度41、ピーク間減衰量42および波形ピークレベル安定度43について相加平均等により透明度判定値61を割り出してもよい。また、各パラメータ値に応じた判定値を予めテーブル化しておいてこのテーブルにパラメータ値を当てはめて判定値を割り出してもよく、ファジィやニューラルネットワーク等の推論エンジンを用いてもよい。
この安定度62の算出手法の1例について説明する。判定部55は、安定度62を算出する際に、平均ピッチ30に対して重み付けを行う。例えば音色変化度27が大きくなるにつれて平均ピッチ30の値による安定度62が小さくなるようにする。
上記の条件を満たす場合に、安定度62を算出する。N数は音声が安定している状態であると判断できる値を実験により求める。サスティン区間がNフレーム未満であった場合は、フレーム累積数をリセットする。
この補正項を次の数式に示すように、平均ピッチ30に乗算してその瞬時値を算出する。
Pitch Centsは平均ピッチデータ30を表す。
DeltaPitch without Vib.は、平均ピッチデータ30の1フレーム前と1フレーム後のピッチ差を表す。また、2フレーム前と2フレーム後のエネルギ差とその平均としてもよい。
Freq.Stabilityは、倍音ピークデータ26各倍音ピーク成分について周波数成分の安定度を表す。ここでは、各倍音ピーク成分について現在のフレームと1つ前のフレームとの差の平均値をとり、これをFreq.Stabilityとする。
(2)音色変化度<音色変化度上限値
次に、高音余裕度63は、高音の発生にどの程度余裕があるか(金切り声になっていないか)を表す指標である。高音余裕度分析部56は、平均エネルギデータ29に基づいて高音余裕度63を判定する。
(2)音色変化度<音色変化度上限値
上記の条件を満たす場合に、高音余裕度63を算出する。上述した特徴量で平均エネルギデータ29に対して重み付けを行う。ここで、本実施形態においては、平均ピッチデータ30による重み付けを行った値と平均ピッチデータ30による重み付けを行わない値とを算出し、この比を算出する。全体の重み付けW(ピッチ無し)、およびWpitch(ピッチ有り)は、以下のような数式で表される。
最後に、半音階逸脱度と高音余裕度63の素点を乗算する。この乗算値を高音余裕度63として判定する。
Spect.Tiltは、周波数スペクトルの傾斜を示す値であり、上記スペクトル傾斜度分析部31が割り出すスペクトル傾斜度38を表す。この場合、図1において、スペクトル傾斜度38を判定部56に入力するようにする。
Vob.Prob.は、ビブラート発生度を表す。
Energy at High pitchは、高音領域におけるエネルギを示す値であり、平均エネルギデータ29についてピッチによる重み付き累積平均処理を行い、非線形処理を加味したものである。すなわち、ピッチの重み付けを平均エネルギデータ29に乗算する。ただし、平均エネルギデータ29をスケーリングしてから重み付けを行う。図23は、ピッチのスケーリングを示した図である。同図に示すように、平均ピッチデータ30が任意の値Pa以下の場合はピッチ(Pitch')をPaとし、Pb以上の場合にピッチ(Pitch')をPbとする。このPaからPbまでの間は、平均ピッチデータ30が大きくなるにつれてピッチを直線的に大きくする。このスケーリングしたピッチ(Pitch')について図24に示すように重み付け(WPitch')を設定する。この重み付けを、次の数式に示すように平均エネルギデータ29に乗算する。
(2)音色変化度<音色変化度上限値
次に、低音余裕度64は、低音の発生にどの程度余裕があるかを表す指標である。低音余裕度分析部57は、例えば以下の手法で低音余裕度64を算出する。判定部57は、低音余裕度64を算出する際に、倍音ピークデータ26に対して種々の特徴量による重み付けを行う。例えば音色変化度27が大きくなるにつれて低音余裕度64が小さくなるようにする。
HL Energy Ratioは、高周波帯域と低周波帯域のampの比を表す。図27に示すように、ピッチ/エネルギ分布52のうち、任意の高周波数帯域と任意の低周波帯域についてそれぞれ平均を算出する。このそれぞれの平均値について次の数式に示すように比を算出する。
Pitch Dew From Perfect Scaleは、上述した半音階逸脱度を表す。
(2)音色変化度<音色変化度上限値
なお、上記実施形態は、本発明の1つの具体例に過ぎず、音声信号を評価する内容は、響き度、透明度、安定度、高音余裕度、低音余裕度に限定されない。また、途中算出する物理パラメータも、上記のものに限定されない。
Spect.Tiltは、周波数スペクトルの傾斜を示す値であり、スペクトル傾斜度分析部31が割り出すスペクトル傾斜度38を表す。
2…CPU
10…音声信号
60…響き度
61…透明度
62…安定度
63…高音余裕度
64…低音余裕度
65…鼻音検出値
Claims (11)
- 入力した音声信号から、その音声信号の音素変化を示す音色変化度を割り出す音色変化度分析部と、
前記音声信号の物理的な特徴である物理パラメータを割り出す物理パラメータ分析部と、
この物理パラメータに対して重み付けを行い判定値を算出し、該判定値の累積値に基づいて音声信号の声質を判定する声質判定部と、
を備え、
前記声質判定部は、前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくする声質判定装置。 - 前記声質判定部は、音声の切れ目およびサスティン部を前記音色変化度により判定した結果である音声分割情報に基づいて、前記判定値を算出するか否かを決定し、算出すると決定した区間の判定値の累積値に基づいて音声信号の音質を判定する請求項1に記載の音質判定装置。
- 音声信号の音素変化を示す音色変化度を割り出す音色変化度分析部と、
音声信号の周波数スペクトルの傾斜を示すスペクトル傾斜度パラメータ、音声信号の基本波の倍音成分の減衰曲線を表すスペクトル励起度パラメータ、および、音声信号のフォルマント成分の明瞭度を表すフォルマント明瞭度パラメータを分析する物理パラメータ分析部と、
前記スペクトル傾斜度パラメータ、前記スペクトル励起度パラメータおよび前記フォルマント明瞭度パラメータのうち、少なくともいずれか1つに対して重み付けを行い響き度判定値を算出し、該響き度判定値の累積値に基づいて前記音声信号の響き度を判定する声質判定部と、
を備え、
前記声質判定部は、前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくする声質判定装置。 - 音声信号の音素変化を示す音色変化度を割り出す音色変化度分析部と、
音声信号の基本波の倍音成分の安定度を示す倍音安定度パラメータ、音声信号の周波数スペクトルにおける基本波の倍音成分以外の少なさを表すピーク間減衰量パラメータ、および、音声信号の時間軸波形におけるピーク値の安定性を示す波形ピークレベル安定度パラメータを分析する物理パラメータ分析部と、
前記倍音安定度パラメータ、前記ピーク間減衰量パラメータ、および前記波形ピークレベル安定度パラメータのうち、少なくともいずれか1つに対して重み付けを行い透明度判定値を算出し、該透明度判定値の累積値に基づいて前記音声信号の透明度を判定する声質判定部と、
を備え、
前記声質判定部は、前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくする声質判定装置。 - 音声信号の音素変化を示す音色変化度を割り出す音色変化度分析部と、
音声信号の基本周波数を表すピッチパラメータを分析する物理パラメータ分析部と、
前記ピッチパラメータに対して重み付けを行い安定度判定値を算出し、該安定度判定値の累積値に基づいて前記音声信号の安定度を判定する声質判定部と、
を備え、
前記声質判定部は、前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくする声質判定装置。 - 前記物理パラメータ分析部は、音声信号のパワーレベルを表すエネルギパラメータ、音声信号の基本波の倍音成分の安定度を示す倍音安定度パラメータ、音声信号の周波数スペクトルにおける基本波の倍音成分以外の少なさを表すピーク間減衰量パラメータ、および音声信号の時間軸波形におけるピーク値の安定性を示す波形ピークレベル安定度パラメータを分析し、
前記声質判定部は、前記ピッチパラメータおよび前記エネルギパラメータに基づいて音声信号のピッチに対応するエネルギの分布を表すピッチ/エネルギ分布パラメータを分析するとともに、
前記倍音安定度パラメータ、前記ピーク間減衰量パラメータおよび前記波形ピークレベル安定度パラメータのうち、少なくともいずれか1つに対して前記重み付けを行い透明度判定値を算出し、
前記ピッチパラメータ、前記ピッチ/エネルギ分布パラメータ、前記安定度判定値、および前記透明度判定値に基づいて前記音声信号の高音域の余裕度を示す高音余裕度を判定する請求項5に記載の声質判定装置。 - 音声信号の音素変化を示す音色変化度を割り出す音色変化度分析部と、
音声信号のパワーレベルを表すエネルギパラメータを分析する物理パラメータ分析部と、
前記エネルギパラメータに対して重み付けを行い高音余裕度を算出し、該高音余裕度の乗算値に基づいて前記音声信号の高音域の余裕度を示す高音余裕度を判定する声質判定部と、
を備え、
前記声質判定部は、前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくする声質判定装置。 - 前記物理パラメータ分析部は、音声信号の基本周波数を表すピッチパラメータ、音声信号のパワーレベルを表すエネルギパラメータを分析し、
前記声質判定部は、前記ピッチパラメータおよびエネルギパラメータに基づいて音声信号のピッチに対応するエネルギの分布を表すピッチ/エネルギ分布パラメータを分析するとともに、前記ピッチパラメータ、前記ピッチ/エネルギ分布パラメータ、および前記響き度判定値に基づいて、音声信号の低音域の余裕度を示す低音余裕度を判定する請求項2に記載の声質判定装置。 - 音声信号の音素変化を示す音色変化度を割り出す音色変化度分析部と、
音声信号の基本波の倍音成分を表す倍音ピークパラメータを分析する物理パラメータ分析部と、
前記倍音ピークパラメータに対して重み付けを行い低音余裕度を算出し、該低音余裕度の累積値に基づいて前記音声信号の低音域の余裕度を示す低音余裕度を判定する声質判定部と、
を備え、
前記声質判定部は、前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくする声質判定装置。 - 入力した音声信号から、その音声信号の物理的な特徴である物理パラメータを割り出す物理パラメータ分析手順と、
前記音声信号の音素変化を示す音色変化度を割り出す音色変化度分析手順と、
前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくするように重み付けを決定する決定手順と、
前記物理パラメータに対して重み付けを行い判定値を算出し、該判定値の累積値に基づいて音声信号の声質を判定する声質判定手順と、
を備えた声質判定方法。 - コンピュータに、
入力した音声信号から、その音声信号の物理的な特徴である物理パラメータを割り出す物理パラメータ分析手順と、
前記音声信号の音素変化を示す音色変化度を割り出す音色変化度分析手順と、
前記音色変化度に基づいて、音素変化が母音定常状態に近づくほど重み付けを大きくし、過渡状態に近づくほど重み付けを小さくするように重み付けを決定する決定手順と、
この物理パラメータに対して重み付けを行い判定値を算出し、該判定値の累積値に基づいて音声信号の声質を判定する声質判定手順と、
を実行させる声質判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005361612A JP4432893B2 (ja) | 2004-12-15 | 2005-12-15 | 声質判定装置、声質判定方法、および声質判定プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004363730 | 2004-12-15 | ||
JP2005361612A JP4432893B2 (ja) | 2004-12-15 | 2005-12-15 | 声質判定装置、声質判定方法、および声質判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006195449A JP2006195449A (ja) | 2006-07-27 |
JP4432893B2 true JP4432893B2 (ja) | 2010-03-17 |
Family
ID=36801541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005361612A Expired - Fee Related JP4432893B2 (ja) | 2004-12-15 | 2005-12-15 | 声質判定装置、声質判定方法、および声質判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4432893B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4595934B2 (ja) * | 2006-12-13 | 2010-12-08 | ヤマハ株式会社 | 音声評価装置及び音声評価方法 |
JP4900017B2 (ja) * | 2007-04-17 | 2012-03-21 | ヤマハ株式会社 | ビブラート検出装置、ビブラート評価装置、ビブラート検出方法、ビブラート評価方法およびプログラム |
EP2329399A4 (en) | 2008-09-19 | 2011-12-21 | Newsouth Innovations Pty Ltd | METHOD FOR ANALYZING A TONE SIGNAL |
JP5463655B2 (ja) * | 2008-11-21 | 2014-04-09 | ソニー株式会社 | 情報処理装置、音声解析方法、及びプログラム |
JP5515342B2 (ja) * | 2009-03-16 | 2014-06-11 | ヤマハ株式会社 | 音波形抽出装置、およびプログラム |
JP5456370B2 (ja) * | 2009-05-25 | 2014-03-26 | 任天堂株式会社 | 発音評価プログラム、発音評価装置、発音評価システムおよび発音評価方法 |
JP5697395B2 (ja) * | 2010-10-05 | 2015-04-08 | ヤマハ株式会社 | 歌唱音声評価装置およびプログラム |
KR101250051B1 (ko) * | 2011-09-09 | 2013-04-03 | (주)알고코리아 | 발음 교정을 위한 음성 신호 분석 방법 및 장치 |
JP5740353B2 (ja) * | 2012-06-05 | 2015-06-24 | 日本電信電話株式会社 | 音声明瞭度推定装置、音声明瞭度推定方法及びそのプログラム |
WO2016141538A1 (zh) * | 2015-03-09 | 2016-09-15 | 常平 | 一种音高排名时的产品信息推送方法和点歌系统 |
CN115424636B (zh) * | 2022-11-04 | 2023-02-03 | 广州声博士声学技术有限公司 | 一种基于语音传输指数的音质测量方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2709926B2 (ja) * | 1987-10-09 | 1998-02-04 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | 声質変換方法 |
JPH02109100A (ja) * | 1988-10-19 | 1990-04-20 | Fujitsu Ltd | 音声入力装置 |
JPH09325791A (ja) * | 1996-06-07 | 1997-12-16 | Matsushita Electric Ind Co Ltd | 音質診断装置 |
JP2001034280A (ja) * | 1999-07-21 | 2001-02-09 | Matsushita Electric Ind Co Ltd | 電子メール受信装置および電子メールシステム |
JP3631657B2 (ja) * | 2000-04-03 | 2005-03-23 | シャープ株式会社 | 声質変換装置および声質変換方法、並びに、プログラム記録媒体 |
JP3754613B2 (ja) * | 2000-12-15 | 2006-03-15 | シャープ株式会社 | 話者特徴推定装置および話者特徴推定方法、クラスタモデル作成装置、音声認識装置、音声合成装置、並びに、プログラム記録媒体 |
JP3945356B2 (ja) * | 2002-09-17 | 2007-07-18 | 株式会社デンソー | 音声対話装置及びプログラム |
-
2005
- 2005-12-15 JP JP2005361612A patent/JP4432893B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006195449A (ja) | 2006-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4432893B2 (ja) | 声質判定装置、声質判定方法、および声質判定プログラム | |
Morise et al. | WORLD: a vocoder-based high-quality speech synthesis system for real-time applications | |
US7567900B2 (en) | Harmonic structure based acoustic speech interval detection method and device | |
EP0625774B1 (en) | A method and an apparatus for speech detection | |
KR100744352B1 (ko) | 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치 | |
KR100929958B1 (ko) | 음성 인증 장치, 음성 인증 방법 및 기계 판독가능 매체 | |
US20020035915A1 (en) | Generation of a note-based code | |
US8069039B2 (en) | Sound signal processing apparatus and program | |
EP2083417A2 (en) | Sound processing device and program | |
JP3687181B2 (ja) | 有声音/無声音判定方法及び装置、並びに音声符号化方法 | |
JP2969862B2 (ja) | 音声認識装置 | |
Narendra et al. | Robust voicing detection and F 0 estimation for HMM-based speech synthesis | |
Dubuisson et al. | On the use of the correlation between acoustic descriptors for the normal/pathological voices discrimination | |
US5809453A (en) | Methods and apparatus for detecting harmonic structure in a waveform | |
KR100744288B1 (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
CN106356076A (zh) | 基于人工智能的语音活动性检测方法和装置 | |
WO2007049879A1 (en) | Apparatus for vocal-cord signal recognition and method thereof | |
JP4585590B2 (ja) | 基本周波数変化量抽出装置、方法及びプログラム | |
JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
US20060150805A1 (en) | Method of automatically detecting vibrato in music | |
KR20050003814A (ko) | 음정 인식 장치 | |
JP5151103B2 (ja) | 音声認証装置、音声認証方法およびプログラム | |
Hassan et al. | A method for voiced/unvoiced classification of Noisy speech by analyzing time-domain features of spectrogram image | |
JP5157474B2 (ja) | 音処理装置およびプログラム | |
JP4807261B2 (ja) | 音声処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060724 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090202 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091201 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4432893 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140108 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |