JPS5925238B2 - 音声分析合成方式の音声区間判定方法 - Google Patents

音声分析合成方式の音声区間判定方法

Info

Publication number
JPS5925238B2
JPS5925238B2 JP54157127A JP15712779A JPS5925238B2 JP S5925238 B2 JPS5925238 B2 JP S5925238B2 JP 54157127 A JP54157127 A JP 54157127A JP 15712779 A JP15712779 A JP 15712779A JP S5925238 B2 JPS5925238 B2 JP S5925238B2
Authority
JP
Japan
Prior art keywords
unvoiced
section
speech
value
sections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54157127A
Other languages
English (en)
Other versions
JPS5678900A (en
Inventor
浩二 浮穴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Mobile Communications Co Ltd
Original Assignee
Matsushita Communication Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Communication Industrial Co Ltd filed Critical Matsushita Communication Industrial Co Ltd
Priority to JP54157127A priority Critical patent/JPS5925238B2/ja
Publication of JPS5678900A publication Critical patent/JPS5678900A/ja
Publication of JPS5925238B2 publication Critical patent/JPS5925238B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 本発明は音声分析合成方式における、音声の有声区間、
無声区間、無声区間を短時間に判定する方法に関するも
のである。
一般に音声分析合成装置においては、音声情報の圧縮を
行なうために有声区間、無声区間、無音区間を決定し、
それぞれの区間において、最適で最少量になるように情
報を抽出する方法がとられている。
したがつて上記区間を決定する方法は音声分析合成等で
重要なポイントとなつている。従来の音声分析合成装置
において、例えばパーコール方式を用いた装置では音声
信号からフオルマント等の周波数スペクトル包絡成分を
除去した残差信号を作成し、その残差信号の自己相関関
数である変形相関関数を求めた後、その最大値と第一次
のパーコール係数に、によつて有声、無声の決定を行な
つている。しかし実用上、残差信号を求めたわ、変形相
関関数を求める処理にはかなわの時間を要する。演算処
理の高速化の一環として、音声波形の自己相関関数にデ
ィジタルフィルタをかける荷重移動平均操作によつて変
形相関関数を求め、その変形相関関数と第一次のパーコ
ール係数に1の組合せで有声、無声区間を判別するとか
、音声波形の遅れ時間零の自己相関関数の値φ0と、例
えば0<に0<1層sの範囲で示される小さな遅れ時間
roの自己相関関数φ(ro)との組合せにより、有声
無声区間を判別する方法等が考案されているが、前者は
演算時間に関してやや改善されてはいてもまだかなりの
時間を要する。後者は演算時間が短縮されてはいるもの
の判定結果にまだ難が多い。本発明は有声、無声、無音
区間の決定に際し、零交差率であらかじめ確実に無音、
無声区間を決定した後、未決定の区間に関してだけ、簡
単な前処理を施した音声波形の自己相関関数と第一次の
パーコール係数に、の組合せにより効率よく高速で、確
度よく有声、無声、無音区間の判定を行ない、今までの
欠点であつた演算時間の問題を改善するものである。
以下に図面を用いて、本発明の一実施例とともに説明す
る。
第1図はフローチャートである。101は音声波形デー
タで、この波形をある時間(例えば30ms)毎にフレ
ームに区切わ、そのフレーム毎に有声、無声、無音の決
定を行なう。
102の処理ぱサイレントレベルで音声をクリツプし、
フレーム内全区間がサイレントレベル以下のフレームは
無音区間と決定し、以後の処理を行なわない。
このサイレントレベルとは理想的には零であるが、実際
には・・ムの影響やAD変換器のオフセツトのズレ等を
カツトするために、ある程度のレベル(例えば±204
8レベルQ整数型データとして±3)を設定する。10
3の処理は零交差数をカウントする処理である。
第2図でその処理を説明する。第2図は音声データの一
例を示すが、この例では、データ数22個に対して、零
交差数7となb1零交差率は7/22となる。無声区間
ではこの零交差率が多くなり、有声、無声、判定の一つ
の鍵を握つている。この率を求める時、フレーム長が長
いためにフレームの切れ目が無声と有声にまたがつてい
る場合もあり得る。第3図にその例を示すが、このフレ
ームのデータの場合、フレーム内の左側が無声区間、右
側が有声区間にまたがつていると考えられる。日本語に
限つて言えば、約70%が有声区間で残りの30%が無
声あるいは無音区間である。このようなフレームを有声
と無声のどちらの区間と判定するかは難しい。本発明で
は、このような場合には無声区間と判定して無声音を強
調し、無声子音の明瞭度の低下を防止する。そのために
、零交差率を求める時に、フレーム内を2分割し、フレ
ーム前半の零交差率とフレーム後半の零交差率の大きい
方をそのフレーム内の代表値として採用している。10
4は零交差率が無音区間と判定すべき閾値かどうかを判
定する処理である。
これは102の処理で取り切れなかつた・・ムやノイズ
の影響を避けて、無音区間と判定できる値(例えば1/
100)を使用する。105は確実に無声区間であると
判定できる零交差率(例えば1/3)以上の値をとるフ
レームを無声区間と決定する処理である。
この105の処理はもし有声区間であれば、その区間の
音声の基本周波数を求めるために自己相関関数を求める
訳であるが、その演算処理が長くかかることを考慮して
、その演算を少しでも省くために前処理として、零交差
率で無声区間を決定するようにしている。即ち、完全に
、無声、無音区間であれば、その区間の音声基本周波数
を求める必要がないため自己相関関数の演算は行なわな
い。106は105までに無音区間、無声区間と決定さ
れなかつた区間についてのみ行なわれる処理でフオルマ
ントの影響を軽減したり、音声信号が零に近い部分での
高周波成分が自己相関関数に与える影響をなくするため
の処理である。
その具体的方法を第4図で説明する。第4図は1フレー
ム内の音声信号を表わす。図の如くフレームを3分割し
、前1/3区間の絶対値の最大値401と、後1/3区
間の絶対値の最大値402の小さい方の値402のN%
(例えば30%)の値403でクリツプするという処理
を施す、この処理後107で自己相関関数φ(τ)を求
め、その値が極めて小さい時(例えば、土2048レベ
ルの整数型の300ポイントの自己相関関数の最大値が
5以下であつた時等)、その区間を無声区間と決定する
処理が108である。また109は、音声のピツチ周波
数探索区間内に於る自己相関関数の最大値φ巾と、音声
波形の遅れ時間零の自己相関関数の値φOとの比ψω)
=φ(T)/φO)を求める。第5図はx軸に第一次の
パーコール係数K1、y軸に109で求まつたψ(ト)
をとつたものである。一般的にψ(T)の値は、有声部
では周期性が強いので、大きい値をとり、K1は無声部
では小さな値をとることが知られている。110が、そ
のψ1とKlの組合せで有声区間、無声区間を判定する
処理である。
その処理の内容は第5図に示すように、A,bを定数と
してψ(T)+AXKlが閾値bを越える区間501で
は有声区間に、下回る区間502は無声区間に判定する
。ここでA,bは統計的に決定されるが、例えばa−=
0.5,b=0.6のように設定することができる。こ
の判定論理は従来の残差波形から求めた変形相関関数を
求めてK1と組合せる方式に比べて、演算時間をかなり
短くすることができる。
第6図は自己相関関数φ(τ)と、遅れ時間τの関係を
示すグラフの→1であるが、ピツチ周期探索区間内のピ
ーク値に対応した遅れ時間τ=T(第6図中601)が
、音声の基本周期であることは言うまでもない。
以上の説明から明らかなように、本発明によれば、零交
差率により前処理をした後音声波形の自己相関関数と、
別に求めてある第一次のパーコール係数K1を組合せる
ことにより、有声、無声、無音区間の高精度な検出が、
従来よりも短時間で可能になり、この1駆動音源成分を
使つて高い品質の合成音を得ることができる。
また、結果として、既存の音声分析合成装置の1駆動音
源信号分析部に容易に組込むことができる。
【図面の簡単な説明】 第1図は本発明の音声分析合成方式の音声区間判定方法
の処理概要フローチヤート、第2図は音声波形中の零交
差点を示す波形図、第3図は1フレーム内に無声、有声
区間の含まれる波形図、第4図は音声信号から、零レベ
ル付近の高周波成分と、フオルマントの影響を除く前処
理の説明図、第5図は最終的に無声、有声区間が決定さ
れる概念図、第6図はピツチ周期を求める方法の説明図
である。

Claims (1)

    【特許請求の範囲】
  1. 1 音声信号中のハム成分を取り除く第1のレベルのク
    リップを施した後、信号の零交差率を求め、その零交差
    率の値から、あらかじめ確実な無声区間と、無声区間を
    決定すると共に、それ以外の区間について、音声信号に
    その高周波成分とフオルマントの影響を少なくする第2
    のクリップ処理を施した後、自己相関関数φ(T)を求
    め、その最大値φ(T)と音声波形の遅れ時間零の自己
    相関関数の値φ(O)との比ψ(T)、及び第1次のパ
    ーコール係数K_1をa、bを定数とした式ψ(T)+
    a×K_1で組合せ、その値がある定められた閾値b以
    上になるか、以下になるかによつてその音声区間が有声
    区間か無声区間かを判定することを特徴とする音声分析
    合成方式の音声区間判定方法。
JP54157127A 1979-12-03 1979-12-03 音声分析合成方式の音声区間判定方法 Expired JPS5925238B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP54157127A JPS5925238B2 (ja) 1979-12-03 1979-12-03 音声分析合成方式の音声区間判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP54157127A JPS5925238B2 (ja) 1979-12-03 1979-12-03 音声分析合成方式の音声区間判定方法

Publications (2)

Publication Number Publication Date
JPS5678900A JPS5678900A (en) 1981-06-29
JPS5925238B2 true JPS5925238B2 (ja) 1984-06-15

Family

ID=15642794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54157127A Expired JPS5925238B2 (ja) 1979-12-03 1979-12-03 音声分析合成方式の音声区間判定方法

Country Status (1)

Country Link
JP (1) JPS5925238B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62169635U (ja) * 1986-04-17 1987-10-28
JPS62180811U (ja) * 1986-05-07 1987-11-17

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62169635U (ja) * 1986-04-17 1987-10-28
JPS62180811U (ja) * 1986-05-07 1987-11-17

Also Published As

Publication number Publication date
JPS5678900A (en) 1981-06-29

Similar Documents

Publication Publication Date Title
Yegnanarayana et al. Extraction of vocal-tract system characteristics from speech signals
JP4906230B2 (ja) オーディトリーイベントに基づく特徴付けを使ったオーディオ信号の時間調整方法
US8489404B2 (en) Method for detecting audio signal transient and time-scale modification based on same
JP2009511954A (ja) モノラルオーディオ信号からオーディオソースを分離するためのニューラル・ネットワーク識別器
JP2004528599A (ja) オーディトリーイベントに基づく特徴付けを使ったオーディオの比較
US8942977B2 (en) System and method for speech recognition using pitch-synchronous spectral parameters
JP3219868B2 (ja) 音声のピッチ周期抽出装置およびピッチ区間自動抽出装置
US20210201938A1 (en) Real-time pitch tracking by detection of glottal excitation epochs in speech signal using hilbert envelope
CN107507610B (zh) 一种基于元音基频信息的汉语声调识别方法
JPS5925238B2 (ja) 音声分析合成方式の音声区間判定方法
JPS5925237B2 (ja) 音声分析合成方式の音声区間判定方法
Thirumuru et al. Improved vowel region detection from a continuous speech using post processing of vowel onset points and vowel end-points
RU2174714C2 (ru) Способ выделения основного тона
US10354671B1 (en) System and method for the analysis and synthesis of periodic and non-periodic components of speech signals
JPH04100099A (ja) 音声検出装置
Ohtsuka et al. Aperiodicity control in ARX-based speech analysis-synthesis method
Shah et al. A novel filtering-based F 0 estimation algorithm with an application to voice conversion
KR100359988B1 (ko) 실시간 화속 변환 장치
JP2588963B2 (ja) 音声合成装置
US20060149539A1 (en) Method for separating a sound frame into sinusoidal components and residual noise
JPH0114599B2 (ja)
JP3571448B2 (ja) 音声信号のピッチ検出方法および装置
KR100211965B1 (ko) 유성음 구간에서 피치동기식 포먼트 추정방법
KR100446739B1 (ko) 지연 피치 추출장치
JPS58162999A (ja) 音声合成用駆動波抽出方法