JP2962066B2 - 音声分析装置 - Google Patents

音声分析装置

Info

Publication number
JP2962066B2
JP2962066B2 JP4255925A JP25592592A JP2962066B2 JP 2962066 B2 JP2962066 B2 JP 2962066B2 JP 4255925 A JP4255925 A JP 4255925A JP 25592592 A JP25592592 A JP 25592592A JP 2962066 B2 JP2962066 B2 JP 2962066B2
Authority
JP
Japan
Prior art keywords
value
autocorrelation function
voiced
correction
maxr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4255925A
Other languages
English (en)
Other versions
JPH0683390A (ja
Inventor
アユミ 深田
哲夫 西元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP4255925A priority Critical patent/JP2962066B2/ja
Publication of JPH0683390A publication Critical patent/JPH0683390A/ja
Application granted granted Critical
Publication of JP2962066B2 publication Critical patent/JP2962066B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】 この発明は、音声分析装置に関
し、特に有声音と無声音を判定するものに関し、詳しく
は有声音と無声音の判定を簡便にかつ素早く行えるよう
にしたものである。この発明に係る有声音と無声音の判
技術は、例えば、電子楽器等の楽音制御技術の分野に
おいて有声音と無声音の判定結果に応じて楽音制御を行
うために利用可能である。
【0002】
【従来の技術】有声音と無声音を判定する方法の1つと
して、変形自己相関関数re(n)を用いるものがあ
る。この方法は大別して次の4つのステップからなる。
ステップ1:線形予測により、分析対象である音声波形
信号の残差波形信号を求める。ステップ2:この残差波
形信号の自己相関関数(これを変形自己相関関数とい
う)を求める。ステップ3:この変形自己相関関数の初
期値re(0)とその後の最大極値re(T)との比re
(T)/re(0)を求める。ステップ4:求めた比の
値から、上記音声波形信号の有声/無声を判定する。一
例として、上記比の値が、0.18以下であれば無声音
と判定し、有声度判定値V=0,無声度判定値U=1と
する。また、上記比の値が、0.25以上であれば有声
音と判定し、有声度判定値V=1,無声度判定値U=0
とする。また、上記比の値が、0.18と0.25の間
の場合は、その値に応じて有声度判定値Vと無声度判定
値Uを適切に決定する(ただし、U+V=1)。
【0003】
【発明が解決しようとする課題】 このように変形自己
相関関数を使用した有声/無声判定法は、音声波形信号
におけるフォルマント成分の影響を受けにくいので、精
度のよい判定が期待できる。しかし、その反面、残差波
形を求めるための複雑な演算が必要であるため、演算装
置及びプログラムの構成が複雑になってしまうという欠
点がある。また、その分、演算時間が余計にかかるの
で、音声波形信号の入力から有声/無声判定結果の出力
までに時間がかかり、実時間で分析を行うことが困難で
あった。従って、任意の音声波形信号を入力してその有
声/無声判定結果に応じて実時間で楽音制御を行おうと
する場合に不向きであった。一方、分析対象である音声
波形信号の自己相関関数を直接求め、この自己相関関数
に基づき有声/無声判定を行うことも考えられている
が、それだけでは実用に耐えうる判定精度が出せないと
いう問題点があった。この発明は上述の点に鑑みてなさ
れたもので、簡単な構成で比較的精度のよい有声/無声
判定を行うことができるようにした、実時間分析に適し
た、音声分析装置を提供しようとするものである。
【0004】
【課題を解決するための手段】 この発明は、第1から
第7の処理を行う音声分析装置であって、第1の処理
(S4)は、フレーム音声波形信号を入力し、第2の処
理(S5)は、入力されたフレーム音声波形信号の自己
相関関数を計算し、第3の処理(S6)は、第2の処理
で計算した自己相関関数の初期サンプル値(R0)とそ
の後の最大極値(Rk)を抽出し、第4の処理(S7)
は、初期サンプル値(R0)に対する最大極値(Rk)の
比(MAXR)を計算し、第5の処理(S8,S16,
S51)は、第2の処理で計算した自己相関関数の変化
の大きさあるいは激しさを示す補正値(LPCT,LP
DSUM,ADSUM)を算出し、第6の処理(S9〜
S11,S17〜S19,S52〜S54)は、第5の
処理で出力した補正値(LPCT,LPDSUM,AD
SUM)に基づき第4の処理で計算した比(MAXR)
を補正して補正比を計算すると共に、この補正比に基づ
き有声/無声判定値(UV)を算出し、第7の処理(S
12〜S15)は、有声/無声判定値(UV)に基づき
有声/無声判定を行うことを特徴とするものである
【0005】
【作用】 第2の処理では、入力された音声波形信号の
自己相関関数が直接求められる。従って、変形自己相関
関数を求めるための演算が省略されており、演算がかな
り簡単化されている。第3及び第4の処理では、第2の
処理で求めた自己相関関数の初期値とその後の最大極値
との比(MAXR)を計算する。一般に、自己相関関数
において、初期値の後の最大極値は、音声波形信号のピ
ッチ周期に対応する位置に表われる。そこで、この自己
相関関数の初期値とその後の最大極値との比の値によ
り、該音声波形信号の周期性が判り、これに基づき有声
音と無声音の判定ができることになる。しかし、音声波
形信号の自己相関関数においては、基本波成分以外の成
分の影響が残るため、該比の値のみでは正確な有声/無
声判定が行えない。特に、無声音における雑音成分によ
るランダムな極値が比較的大きなレベルで生じてしまう
ので、該比の値のみによって有声/無声判定を行うのは
極めて困難である。このように、第3及び第4の処理
求めた比(MAXR)の値は、不十分なものである。
【0006】 この発明では、不十分な上記比の値を補
正するために第5乃至第7の処理を具備していることが
特徴である。特に、音声波形信号の自己相関関数におい
ては、雑音的成分による影響が残されるために、無声音
の自己相関関数の方が、有声音の自己相関関数に比べ
て、自己相関関数値の変化が大きい(若しくは激しい)
ことに着目したものである。すなわち、音声波形信号の
自己相関関数における関数波形の変化傾向は、有声度/
無声度に関係していることに着目したものである。そこ
で、第5の処理では、第2の処理で求めた自己相関関数
の変化の傾向を分析するための所定の演算を行い、この
演算結果に応じて補正値を発生するようにしたことを特
徴としている。すなわち、第5の処理では、第2の処理
で計算した自己相関関数の変化の大きさあるいは激しさ
を示す補正値(LPCT,LPDSUM,ADSUM)
を算出する。そして、第6の処理では、この補正値に応
じて前記比(MAXR)を補正して補正比を計算すると
共に、この補正比に基づき有声/無声判定値(UV)を
算出する。第7の処理では、この有声/無声判定値(U
V)に基づき有声/無声判定を行う。これにより、例え
ば、自己相関関数値が大きく変化する傾向にあるなら
ば、無声度が高いので、無声度を高める方向に前記比
(MAXR)の値を補正するようにすれば、比較的精度
のよい有声/無声判定を行うことができることになる。
しかも、変形自己相関関数を求めるための演算は省略さ
れるので、演算構成が簡単であり、これに伴い演算時間
も短縮される。従って、実時間分析にも適している。
【0007】 第5の処理における分析演算の手法は種
々考えられる。その分析演算の一実施態様は、前記第2
処理で求めた自己相関関数における極値の数をカウン
トすることからなっていてよい。極値の数が多ければ、
自己相関関数の波形変化の傾向が激しい(若しくは頻繁
である)ことを意味し、無声度が高いことになる。この
場合、カウントすべき極値として、極大値及び極小値の
両方をカウントするようしてよく、また、極大値及び極
小値のどちらか一方をカウントするようにしてもよい。
【0008】上記における極値の数のカウントの仕方の
一実施態様は、前記自己相関関数の各関数値において、
隣接する関数値同士の差をそれぞれ求め、該差の符号が
変化したときカウントを行なうようにしてよい。該差の
符号が正から負に変化したときは極大値を通過したとき
であり、該差の符号が負から正に変化したときは極小値
を通過したときであるので、その数をカウントすること
により、極値数をカウントできる。
【0009】 第5の処理における分析演算の別の実施
態様は、前記第2の処理で求めた自己相関関数における
極大値と極小値の差の絶対値を累算することからなって
いてよい。極大値と極小値の差の絶対値の累算値が大き
いほど、極大値と極小値の差が大きくまた極値の数も多
いことになり、従って、自己相関関数の振幅変化が大き
く、変化傾向が大きい(若しくは激しい)ことを意味
し、無声度が高いことになる。
【0010】 第5の処理における分析演算の更に別の
実施態様は、前記第2の処理で求めた自己相関関数にお
ける所定サンプル毎の関数値の差の絶対値を累算するこ
とからなっていてよい。所定サンプル毎の関数値の差の
絶対値の累算値が大きいほど、所定サンプル毎の関数値
の差が大きく、従って、自己相関関数の変化が急峻であ
り、変化傾向が大きい(若しくは激しい)ことを意味
し、無声度が高いことになる。この場合、自己相関関数
における隣接サンプル毎の関数値の差の絶対値を累算す
るようにしてもよいし、適当数のサンプル毎の関数値の
差の絶対値を累算するようにしてもよい。
【0011】 第6の処理における補正の一実施態様
は、前記補正値が所定値以上であるか否かに応じて異な
る補正式に従って補正を行うことであってもよい。これ
は、補正値が無声度を示している場合と有声度を示して
いる場合とで異なった態様の補正を行い、より一層精度
のよい有声/無声判定を行うために、有効である。
【0012】
【実施例】 以下、添付図面を参照してこの発明の一実
施例を詳細に説明しよう。図1は、この発明に係る音声
分析装置で採用する音声分析方法の一実施例の処理手順
を示すフロー図である。まず、アナログ音声波形信号を
マイクロフォン等によって外部から取り込む(ステップ
S1)。次に、取り込んだアナログ音声波形信号をロー
パスフィルタ処理する(ステップS2)。次に、ローパ
スフィルタ処理済みのアナログ音声波形信号をディジタ
ル信号に変換する(ステップS3)。
【0013】次のステップS4では、ディジタル変換し
た音声波形信号サンプルデータをメモリに記憶する。こ
の場合、1回の分析に必要な1フレーム分の波形サンプ
ルデータY(m+i)をメモリに記憶すればよい。ここ
で、mは任意の初期サンプルを示す番号であり、分析し
ようとするフレームの初期サンプル番号を示す。iは1
フレーム内の相対サンプル番号を示す変数であり、i=
0,1,2,…,Nである。例えば、1フレーム=N+
1サンプル=128サンプルの場合、i=0,1,2,
…,127である。以下では、便宜上、m=0として、
メモリに記憶した1フレーム分の波形サンプルデータ
を、Y0〜Y127で示す。次のステップS5では、ステッ
プS4で記憶した1フレーム分の波形サンプルデータY
0〜Y127を読出し、その自己相関関数Riを計算する。
自己相関関数の計算式の一例を示すと次のようである。
【0014】
【数1】 ここで、Riにおけるiは自己相関関数の次数を示す変
数であり、i=0,1,2,…,127である。Nは、
前述の通り、1フレームにおける最終サンプル番号であ
る。nは、iからNまで変化する変数であり、波形サン
プルデータYn(Y0〜Y127)のサンプル番号を特定す
る。従って、上記数1において、n=iのときは、Yn
=Yi,Yn-i=Y0,であり、n=N=127のとき
は、Yn=Y127,Yn-i=Y127-i,である。上記数1に
示すような自己相関関数の計算式に従って、iの各値
(0,1,2,…,127)に対応して、合計N+1=
128サンプルの自己相関関数値Riが求められる。求
めた自己相関関数値Riはメモリにストアされる。
【0015】ステップS6では、前ステップで求めた自
己相関関数値Riの中から初期値R0と該初期値R0を除
く最大極値Rkを抽出する(R0,Rkについては、例え
ば図6(e)を参照されたし)。ステップS7では、最
大極値Rkと初期値R0の比Rk/R0を求める。以下で
は、この比Rk/R0をMAXRで表わす。一般に、初期
値R0と最大極値Rkの間隔は、オリジナル音声波形信号
のピッチに対応していることが知られている。従って、
この比Rk/R0=MAXRは、オリジナル音声波形信号
の有声度を知るためには有効である。しかし、無声音に
おいては、ランダムな位置で最大極値Rkが生じるの
で、この比Rk/R0=MAXRは、オリジナル音声波形
信号の無声度を知るためには十分ではない。
【0016】数多くの実測を行った結果、上記比Rk/
R0=MAXRの値と有声度/無声度の関係は、図3の
ような傾向を示すことが判った。すなわち、有声音にお
いて高い値を示すのは勿論のこと、無声音においても比
較的高い値を示す。また、有声音と無声音の中間の過渡
的な音では比較的低い値を示す。従って、この比の値M
AXRのみでは、正確な有声/無声判定を行うことが困
難である。また、そのような実測の結果、上記比の値M
AXRに応じて下記数2のような仮定の関係式を適用す
ることにより、一応、有声度/無声度の判定の目安とす
ることができることが判った。なお、下記数2における
数値0.4及び0.8は、あくまでも経験値に過ぎないの
で、下記数2の仮定式を一般化して表現する場合は、こ
れらの数値0.4及び0.8を、条件に応じた適宜の定数
に置き換えるべきであることは勿論である。
【0017】
【数2】 MAXR≦0.4 が成立すれば、無声音 MAXR≧0.8 が成立すれば、有声音 0.4<MAXR<0.8 のときは、過渡状態 しかし、この数2のような関係式のみでは、上述のよう
に、比の値MAXR自体が不正確であるために、正確な
判定ができない。そこで、比の値MAXRの不正確さを
補うために、続くステップS8〜S15の処理を行い、
この比の値MAXRを補正し、これに基づき最終的な有
声/無声判定値UVを比較的高い確度で求めるようにし
ている。
【0018】ステップS8では、ステップS5で求めた
自己相関関数Riの変化の傾向を分析するための所定の
演算を行い、この演算結果に応じて補正値を発生する。
そのための分析演算の一例として、図1のステップS8
では、前ステップS5で求めた自己相関関数Riにおけ
る極値の数LPCT(この記号の意味は、Local PeakCo
untと理解されたい)をカウントするようにしている。
この場合、カウントすべき極値として、極大値及び極小
値の両方をカウントするようにしてよく、また、極大値
及び極小値のどちらか一方をカウントするようにしても
よい。なお、通常の定義の通り、極大とは関数波形の上
向きのピーク(山)、極小とは関数波形の下向きのピー
ク(谷)を指す。従って、極値すなわちピークの数が多
ければ、関数波形の振動の頻度が高いことになり、これ
は、自己相関関数の変化の傾向が大きいことを意味し、
従って、無声度が高いことを意味する。
【0019】一例として、所定のサンプリング周波数1
0kHzの下でサンプリングしたオリジナル音声波形デ
ータを上記のように1フレーム=128サンプルでその
自己相関関数Riを求め、極大値及び極小値の両方をカ
ウントする手法で、数多くの実測を行った結果、上記極
値の数LPCTは、図4のような傾向を示すことが判っ
た。すなわち、極値数LPCTは、無声音において大き
な値を示すことが理解できる。図3を参照すると、無声
音領域における前記比の値MAXRを適切に補正して、
補正後の比の値の関数が単調増加傾向を示すものとなれ
ば、これに基づき正確な有声/無声判定を行うことがで
きるようになるであろうことが理解できる。また、図4
を参照すると、極値数LPCTは無声音領域において大
きな値を示すので、これを使用すれば、無声音領域にお
いて不安定な前記比の値MAXRを適切に補正すること
ができるであろうことが予測できる。そこで、極値数L
PCTを使用して前記比の値MAXRを適切に補正し、
これに基づき正確な有声/無声判定を行うことを以下の
ように提案する。
【0020】そのような補正のための補正式は種々に設
定可能である。数多くの実測と試行錯誤の結果、一例と
して、次のような補正式と判定式を導入することが比較
的有効であることに帰納した。しかし、これに限定され
ないのは勿論である。 〔MAXRの補正式〕上記サンプリング条件及び極大値
と極小値の両方をカウントする条件下における数多くの
実測の結果、該条件下においては、一つの目安として、
極値数LPCTが「24」よりも小さいならば、補正の
必要がないことが判った。極値数LPCTがそれ以上の
場合は、無声音または過渡領域である可能性が高い。そ
こで、無声音または過渡領域の音の前記比の値MAXR
を下記数3のような補正式で補正することが比較的有効
であることに帰納した。なお、MAXR’は、補正後の
比の値を示す。
【0021】
【数3】(a)LPCTが24以上の場合のMAXRの
補正式: MAXR’=MAXR−√(LPCT−24)/32 (b)LPCTが24よりも小さい場合のMAXRの補
正式: MAXR’=MAXR (つまり補正せず) なお、上記数3における数値24及び32は、あくまで
も上記条件下での経験値に過ぎないので、これを一般化
して表現する場合は、これらの数値24及び32を、条
件に応じた適宜の定数に置き換えるべきであることは勿
論である。
【0022】〔UVの判定式〕最終的に得ようとする有
声/無声判定値UVは、上記数3によって補正された比
の値MAXR’を前記数2の関係式に適用することによ
り、下記数4の関係式に従い求められる。
【数4】UV=(MAXR'−0.4)/0.4 (ただし、MAXR'−0.4<0の場合は、UV=0と
し、MAXR'−0.4>0.4の場合は、UV=1とす
る。) 上記数4から理解できるように、上記数3によって補正
された比の値MAXR’が0.4以下であれば有声/無
声判定値UVは0であり、無声音であることを示す。ま
た、上記数3によって補正された比の値MAXR’が
0.8以上であれば有声/無声判定値UVは1であり、
有声音であることを示す。また、0.4<MAXR'<
0.8のときは、有声/無声判定値UVは0<UV<1
の範囲の小数をとり、有声/無声の過渡領域にあり、そ
の小数値に応じた有声度若しくは無声度を示すことにな
る。
【0023】図1に戻ると、ステップS9では、前ステ
ップS8で求めた極値数LPCTが24より小さいか
(つまりLPCT−24<0が成立するか)を調べる。
これは、前記数3の補正式a,bのうちどちらを適用す
べきかを判断するためである。ステップS9でYESと
判断した場合は、ステップS10に行く。ステップS1
0では、補正していない前記比の値MAXRを使用し
て、 UV=(MAXR−0.4)/0.4 なる演算を行う。これは、上記数3の補正式bと数4の
判定式を組合せた演算式に相当する。
【0024】ステップS9でNOと判断した場合は、ス
テップS11に行く。ステップS11では、前記比の値
MAXRを上記数3の補正式aにより補正して、 UV=[{MAXR−√(LPCT−24)/32}−
0.4]/0.4 なる演算を行う。これは、上記数3の補正式aと数4の
判定式を組合せた演算式に相当する。このように、ステ
ップS10又はS11により、上記数3の補正式と数4
の判定式を組合せた演算式が実行され、前記比の値MA
XRの補正が行われると共に、この補正値MAXR’に
基づく有声/無声判定演算が行われ、有声/無声判定値
UVが得られる。
【0025】続くステップS12〜S15では、上記数
4のただし書き条件に応じた処理が行われる。すなわ
ち、前ステップS10又はS11で求めた有声/無声判
定値UVが1より大きい場合(つまりMAXR'−0.4
>0.4の場合)、ステップS12でYESと判定し、
ステップ14に行き、有声/無声判定値UVを1に設定
する。また、前ステップS10又はS11で求めた有声
/無声判定値UVが0より小さい場合(つまりMAX
R'−0.4<0の場合)、ステップS14でYESと判
定し、ステップ15に行き、有声/無声判定値UVを0
に設定する。以上により、正確な有声/無声判定値UV
を得ることができる。
【0026】なお、以上は1フレーム分の分析について
のみ説明しているが、複数フレームの分析も同様にして
可能であることは勿論である。その場合、波形サンプル
データのフレーム分割に際しては、それぞれのフレーム
の初期サンプル番号mを任意に指定して、各フレームの
設定は任意に行ってよい。また、ステップS4で1フレ
ーム以上のサンプル数にわたるディジタル音声波形サン
プルデータをメモリに逐次記憶し、所望のフレームのデ
ィジタル音声波形サンプルデータを該メモリから読み出
してステップS5〜S15の処理を行なうようにしても
よい。
【0027】次に、図1のステップS8における極値数
カウント処理の一具体例について図2により説明する。
図2においては、図1のステップS5で求めた自己相関
関数Riの各関数値において、隣接する関数値同士の差
をそれぞれ求め、該差の符号が変化したとき極大値(上
向きのピーク)又は極小値(下向きのピーク)を通過し
たと判定し、その数をカウントするようにしている。ま
ず、ステップS20では、図1のステップS5で求めた
自己相関関数Riの初期値R0とその次の値R1との差R
1−R0を求め、これをレジスタd1にセットすると共
に、自己相関関数Riの次数iを指定する演算変数jを
1にセットし、かつ極値数LPCTのカウント値を0に
セットする。ステップS21では、演算変数jとj+1
によって指定される隣接する2つの次数の自己相関関数
値RjとRj+1の差を求め、これをレジスタd2にセット
する。
【0028】次のステップS22では、レジスタd1と
d2にそれぞれストアされた差の値の正/負を調べ、正
/負符号が変化したかどうかを判定する。すなわち、d
1≧0かつd2<0が成立するか、若しくはd1<0かつ
d2≧0が成立するかどうかを判定する。d1≧0かつd
2<0が成立するときは、隣接する関数値同士の差が正
から負に変化したこと、つまり極大値を通過したことを
意味する。d1<0かつd2≧0が成立するときは、隣接
する関数値同士の差が負から正に変化したこと、つまり
極小値を通過したことを意味する。どちらかの判定条件
が成立したならば、ステップS23に行き、極値数LP
CTのカウント値を1増加し、その後ステップS24に
行く。どちらの判定条件も成立しないならば、ステップ
S24にジャンプし、LPCTのカウントは行なわな
い。
【0029】ステップS24では、レジスタd2にスト
アされている差の値をレジスタd1に移し、演算変数j
を1増加する。次のステップS25では、演算変数jが
128になったか、つまり自己相関関数Riのすべての
次数i=0,1,2,…127に関して照合を終えたか
を調べる。NOであれば、ステップS21に戻り、増加
した次数j,j+1に関して、上述と同様のステップS
21からS24の処理を繰り返す。自己相関関数Riの
すべての次数iに関して照合を終えたとき、ステップS
25はYESとなり、図2の処理を終了する。このと
き、LPCTの内容は自己相関関数Riにおける極大値
と極小値の合計カウント数を示している。なお、極大値
と極小値の一方のみをカウントしたい場合は、ステップ
S22での判定条件を一方のみとすればよい。
【0030】次に、実測例について説明する。図5は、
男性音声によって「シャ(sha)」と発音した場合の
音声波形例を示している。図6は、図5の音声波形に基
づき求めたいくつかのフレームにおける自己相関関数を
示す。この例において、音声波形のサンプリング周波数
は10kHz、1フレームのサンプル数は128(従っ
て1フレームの時間長は12.8msec)としている。図5
は、測定開始から1817msec(ミリ秒)後から1919msec
後までの波形を示している。この部分は、概ね、無声音
の「s」から始まり、過渡状態を経て、有声音の「a」
に至るまでの波形変化を顕著に表わしている部分であ
り、無声、過渡、有声の3種の分析に適していると思わ
れるので、実測例として選定した。
【0031】図6の(a)は1810msecから1フレーム
分(便宜上第1フレーム:F1という)の音声波形の自
己相関関数Riを示す。(b)は1826msecから1フレ
ーム分(第2フレーム:F2という)の音声波形の自己
相関関数Riを示す。(c)は1834msecから1フレー
ム分(第3フレーム:F3という)の音声波形の自己相
関関数Riを示す。(d)は1842msecから1フレーム
分(第4フレーム:F4という)の音声波形の自己相関
関数Riを示す。(e)は1858msecから1フレーム分
(第5フレーム:F5という)の音声波形の自己相関関
数Riを示す。(f)は1874msecから1フレーム分
(第6フレーム:F6という)の音声波形の自己相関関
数Riを示す。図6a〜fに示す各フレームF1〜F6
毎の自己相関関数における最大極値Rkと初期値R0の比
Rk/R0=MAXRと、これら各自己相関関数について
上述のように演算した極値数LPCT、及びこれらを前
記数3及び数4の各式に適用して得られた判定結果UV
を下記表に示す。
【0032】
【表1】
【0033】図7は、女性音声によって「チ(ch
i)」と発音した場合の音声波形例を示している。図8
は、図7の音声波形に基づき求めたいくつかのフレーム
における自己相関関数を示す。この例においても、音声
波形のサンプリング周波数は10kHz、1フレームの
サンプル数は128(従って1フレームの時間長は12.8
msec)としている。図7は、測定開始から691msec後
から793msec後までの波形を示している。この部分は、
概ね、無声音の「c」から始まり、過渡状態を経て、有
声音の「i」に至るまでの波形変化を顕著に表わしてい
る部分であり、無声、過渡、有声の3種の分析に適して
いると思われるので、実測例として選定した。
【0034】図8の(a)は688msecから1フレーム分
(便宜上第1フレーム:F1という)の音声波形の自己
相関関数Riを示す。(b)は712msecから1フレーム
分(第2フレーム:F2という)の音声波形の自己相関
関数Riを示す。(c)は720msecから1フレーム分
(第3フレーム:F3という)の音声波形の自己相関関
数Riを示す。(d)は724msecから1フレーム分(第
4フレーム:F4という)の音声波形の自己相関関数R
iを示す。(e)は728msecから1フレーム分(第5フ
レーム:F5という)の音声波形の自己相関関数Riを
示す。(f)は760msecから1フレーム分(第6フレー
ム:F6という)の音声波形の自己相関関数Riを示
す。図8a〜fに示す各フレームF1〜F6毎の自己相
関関数における最大極値Rkと初期値R0の比Rk/R0=
MAXRと、これら各自己相関関数について上述のよう
に演算した極値数LPCT、及びこれらを前記数3及び
数4の各式に適用して得られた判定結果UVを下記表に
示す。
【0035】
【表2】
【0036】上記表1及び2から理解できることは、こ
の発明に従って補正を行なう前の比Rk/R0の値MAX
Rをそのまま適用して前記数2に従って有声/無声判定
を行なったとすると、明らかな無声音部分において過渡
状態との誤った判定がなされるであろうはずであったと
ころ(例えば表1のF1,F3や表2のF1,F2,F
4)、極値数LPCTに応じた補正により、これらがす
べて無声音として正しく判定されるようになっているこ
とである。
【0037】次に、この発明に従う音声分析方法の別の
実施例の処理手順について図9により説明する。図9に
おいて、ステップS1〜S7とS12〜S15は図1の
同一番号のステップS1〜S7とS12〜S15と同じ
処理であり、ステップS16〜S19が図1のステップ
S8〜S11に置き換えられている。ステップS7で前
述の比Rk/R0=MAXRを求めた後、ステップS16
の処理が行われる。ステップS16においては、ステッ
プS5で求めた自己相関関数Riの変化の傾向を分析す
るための所定の演算を行い、この演算結果に応じて補正
値を発生するが、そのための分析演算の仕方が図1のス
テップS8とは異なっている。このステップS16で
は、前ステップS5で求めた自己相関関数Riにおける
極大値と極小値の差の絶対値を累算し、その累算値LP
DSUM(この記号の意味は、Local Peak Differencia
l Sumと理解されたい。)を出力する。極大値と極小値
の差の絶対値とは、関数波形における上向きピーク
(山)と下向きピーク(谷)の間隔を示しており、この
値が大きいことは、関数波形の振幅変化が大きいことを
意味する。この極大値と極小値の差の絶対値の累算値が
大きいほど、極大値と極小値のひらきが大きくまた極値
の数も多いことになり、従って、自己相関関数の振幅変
化が大きく、変化傾向が大きい又は激しいことを意味
し、無声度が高いことを意味する。
【0038】一例として、所定のサンプリング周波数1
0kHzの下でサンプリングしたオリジナル音声波形デ
ータを上記のように1フレーム=128サンプルでその
自己相関関数Riを求め、数多くの実測を行った結果、
上記ローカルピーク差分累算値LPDSUMは、図11
のような傾向を示すことが判った。すなわち、該累算値
LPDSUMは、無声音において大きな値を示すことが
理解できる。なお、分析に際しては、サンプリングした
音声の音量の相違による分析ノイズを解消するために、
該累算値LPDSUMを正規化することが必要である。
以下の実例では、単純累算値を自己相関関数Riの初期
値R0によって除すことにより、正規化した累算値LP
DSUMを求めるようにしている。従って、ここにおい
て述べるローカルピーク差分累算値LPDSUMの数値
は、上記のように正規化した値である。
【0039】図11を参照すると、ローカルピーク差分
累算値LPDSUMは無声音領域において大きな値を示
すので、これを使用すれば、無声音領域において不安定
な前記比の値MAXRを適切に補正することができるで
あろうことが予測できる。そこで、ローカルピーク差分
累算値LPDSUMを使用して前記比の値MAXRを適
切に補正し、これに基づき正確な有声/無声判定を行う
ことを以下のように提案する。そのための該値LPDS
UMに応じた補正式は種々に設定可能である。数多くの
実測と試行錯誤の結果、一例として、LPDSUMに応
じた次のような補正式を導入することが比較的有効であ
ることに帰納した。しかし、これに限定されないのは勿
論である。上記サンプリング条件においては、一つの目
安として、累算値LPDSUMが「10」よりも小さい
ならば、補正の必要がないことが判った。累算値LPD
SUMがそれ以上の場合は、無声音または過渡領域であ
る可能性が高い。そこで、無声音または過渡領域の音の
前記比の値MAXRを下記数5のような補正式で補正す
ることが比較的有効であることに帰納した。なお、MA
XR’は、補正後の比の値を示す。
【0040】
【数5】(a)LPDSUMが10以上の場合のMAX
Rの補正式: MAXR’=MAXR−(LPDSUM−10)/64 (b)LPDSUMが10よりも小さい場合のMAXR
の補正式: MAXR’=MAXR (つまり補正せず) なお、上記数5における数値10及び64は、あくまで
も上記条件下での経験値に過ぎないので、これを一般化
して表現する場合は、これらの数値10及び64を、条
件に応じた適宜の定数に置き換えるべきであることは勿
論である。最終的に得ようとする有声/無声判定値UV
は、上記数5によって補正された比の値MAXR’を、
前述と同様に、前記数4の関係式に適用することにより
求められる。
【0041】図9に戻ると、ステップS17では、前ス
テップS16で求めた正規化されたローカルピーク差分
累算値LPDSUMが10より小さいか(つまりLPD
SUM−10<0が成立するか)を調べる。これは、前
記数5の補正式a,bのうちどちらを適用すべきかを判
断するためである。ステップS17でYESと判断した
場合は、ステップS18に行く。ステップS18では、
補正していない前記比の値MAXRを使用して、 UV=(MAXR−0.4)/0.4 なる演算を行う。これは、上記数5の補正式bと前記数
4の判定式を組合せた演算式に相当する。
【0042】ステップS17でNOと判断した場合は、
ステップS19に行く。ステップS19では、前記比の
値MAXRを上記数5の補正式aにより補正して、 UV=[{MAXR−(LPDSUM−10)/64}
−0.4]/0.4 なる演算を行う。これは、上記数5の補正式aと数4の
判定式を組合せた演算式に相当する。このように、ステ
ップS18又はS19により、上記数5の補正式と数4
の判定式を組合せた演算式が実行され、前記比の値MA
XRの補正が行われると共に、この補正値MAXR’に
基づく有声/無声判定演算が行われ、有声/無声判定値
UVが得られる。また、続くステップS12〜S15の
処理により、前述と同様に、この値UVが1より大又は
0より小のとき、それぞれ1又は0に設定する処理を行
なう。
【0043】次に、図9のステップS16におけるロー
カルピーク差分累算値LPDSUMを求める処理の一具
体例について図10により説明する。図10において
は、図9のステップS5で求めた自己相関関数Riの各
関数値において、隣接する関数値同士の差をそれぞれ求
め、該差の符号が変化したとき極大値又は極小値を通過
したと判定し、隣接する極大値と極小値の差を求め、該
差の絶対値を累算する処理を行う。まず、ステップS3
0では、図9のステップS5で求めた自己相関関数Ri
の初期値R0とその次の値R1との差R1−R0を求め、こ
れをレジスタdにセットする。次に、レジスタdの値が
0より小さいかを調べ(ステップS31)、YESなら
ばサインフラグSF1を「−1」にセットし、負である
ことを示す(ステップS32)。NOならばサインフラ
グSF1を「1」にセットし、正であることを示す(ス
テップS33)。
【0044】ステップS34では、自己相関関数Riの
次数iを指定する演算変数jを1にセットし、かつロー
カルピークナンバnを0にリセットする。ステップS3
5では、演算変数jとj+1によって指定される隣接す
る2つの次数の自己相関関数値RjとRj+1の差を求め、
これをレジスタdにセットする。次に、レジスタdにス
トアされた差の値が負であるかを調べ(ステップS3
6)、YESならばサインフラグSF2を「−1」にセ
ットし、負であることを示す(ステップS37)。NO
ならばサインフラグSF2を「1」にセットし、正であ
ることを示す(ステップS38)。
【0045】ステップS39では、第1のサインフラグ
SF1と第2のサインフラグSF2の値を比較し、不一
致であるかを調べる。第1のサインフラグSF1には、
先行する2つの隣接する関数値Rj-1とRjの差の符号が
セットされており、第2のサインフラグSF2には、後
続する2つの隣接する関数値RjとRj+1の差の符号がセ
ットされている。従って、隣接する関数値同士の差の符
号が変化したとき、すなわち、極大値を通過したとき又
は極小値を通過したとき、両フラグSF1,SF2は不
一致であり、ステップS39はYESとなる。ステップ
S39がYESならば、ステップS40に行き、ローカ
ルピークナンバnの現在値に対応するローカルピーク値
レジスタLP(n)に、変数jによって指定される次数の
自己相関関数値Rjをストアする。次のステップS41
では、ローカルピークナンバnの値を1増加する。
【0046】ステップS39がNOならば、またはステ
ップS41の後、ステップS42に行き、第2のサイン
フラグSF2の値を第1のサインフラグSF1にシフト
し、かつ、演算変数jを1増加する。ステップS43で
は、演算変数jが128になったか、つまり自己相関関
数Riのすべての次数i=0,1,2,…127に関し
て照合を終えたかを調べる。NOであれば、ステップS
35に戻り、増加した次数j,j+1に関して、上述と
同様のステップS35からS42の処理を繰り返す。自
己相関関数Riのすべての次数iに関して照合を終えた
とき、ステップS43はYESとなり、ステップS44
に行く。このとき、ローカルピークナンバnは、自己相
関関数Riにおけるピーク(極大値と極小値)の合計数
を示しており、n個のローカルピーク値レジスタLP
(0)〜LP(n-1)のそれぞれには、各ピークの値をストア
している。
【0047】ステップS44では、ローカルピーク差分
累算値LPDSUMを0にリセットする。ステップS4
5では、ローカルピークナンバnが1以下であるかを調
べる。NOであれば、ステップS46に行き、演算変数
jを1にセットする。次のステップS47では、演算変
数jに応じて、j−1番目のローカルピーク値レジスタ
LP(j-1)とj番目のローカルピーク値レジスタLP(j)
のピーク値(極大値と極小値)を読み出し、その差の絶
対値|LP(j)−LP(j-1)|を求め、これをLPDSU
Mの現在値に加算する。
【0048】次に、ステップS48では演算変数jを1
増加する。ステップS49では、演算変数jがローカル
ピークナンバnに一致したか、つまりすべてのピークに
関してステップS47の演算を行ったかを調べる。NO
であれば、ステップS47に戻り、増加した変数j,j
+1に関して、上述と同様のステップS47の演算を行
う。すべてのピークに関してステップS47の演算を完
了するとステップS49はYESとなり、ステップS5
0に行く。こうして、自己相関関数Riにおけるすべて
の極大値と極小値に関して、隣接する極大値と極小値同
士の差の絶対値が次々に累算され、その累算値LPDS
UMが求められる。ステップS50では、上記のように
して求めた累算値LPDSUMを自己相関関数Riの初
期値R0で除算し、正規化したローカルピーク差分累算
値LPDSUMを得る。
【0049】次に、図7,図8の実測例について上記第
2の実施例に従って分析した結果の一例を示す。図8の
a〜fに示す各フレームF1〜F6毎の自己相関関数に
おける最大極値Rkと初期値R0の比Rk/R0=MAXR
と、これら各自己相関関数について上述のように演算し
た正規化ローカルピーク差分累算値LPDSUM、及び
これらを前記数5及び数4の各式に適用して得られた判
定結果UVを示すと、次表のようである。
【0050】
【表3】
【0051】次に、この発明に従う音声分析方法の更に
別の実施例の処理手順について図12により説明する。
図12において、ステップS1〜S7とS12〜S15
は図1の同一番号のステップS1〜S7とS12〜S1
5と同じ処理であり、ステップS7で前述の比Rk/R0
=MAXRを求めた後、ステップS51の処理が行われ
る。
【0052】ステップS51においては、ステップS5
で求めた自己相関関数Riの変化の傾向を分析するため
の所定の演算を行い、この演算結果に応じて補正値を発
生するが、そのための分析演算の仕方が図1のステップ
S8及び図9のステップS16とは異なっている。この
ステップS51では、前ステップS5で求めた自己相関
関数Riにおける隣接するサンプル値同士の差の絶対値
を累算し、その累算値ADSUM(この記号の意味は、
Absolute Differencial Sumと理解されたい)を出力す
る。自己相関関数Riにおける隣接するサンプル値同士
の差が大きいほど、その部分での波形変化が急峻である
ことを意味する。従って、自己相関関数Riにおける隣
接するサンプル値同士の差の絶対値の累算値ADSUM
が大きいほど、自己相関関数全体における波形変化の傾
向が急峻であり、変化傾向が大きい又は激しいことを意
味し、無声度が高いことを意味する。
【0053】一例として、所定のサンプリング周波数1
0kHzの下でサンプリングしたオリジナル音声波形デ
ータを上記のように1フレーム=128サンプルでその
自己相関関数Riを求め、数多くの実測を行った結果、
上記アブソリュート差分累算値ADSUMは、図13の
ような傾向を示すことが判った。すなわち、該累算値A
DSUMは、無声音において最も大きな値を示し、過渡
部では急激に減少し、有声音ではやや増加することが理
解できる。なお、分析に際しては、サンプリングした音
声の音量の相違による分析ノイズを解消するために、前
述と同様に、該累算値ADSUMを正規化することが必
要である。以下の実例では、単純累算値を自己相関関数
Riの初期値R0によって除すことにより、正規化した
累算値ADSUMを求めるようにしている。従って、こ
こにおいて述べるアブソリュート差分累算値ADSUM
の数値は、上記のように正規化した値である。
【0054】図13を参照すると、累算値ADSUMは
無声音領域において大きな値を示すので、これを使用す
れば、無声音領域において不安定な前記比の値MAXR
を適切に補正することができるであろうことが予測でき
る。そこで、累算値ADSUMを使用して前記比の値M
AXRを適切に補正し、これに基づき正確な有声/無声
判定を行うことを以下のように提案する。そのための累
算値ADSUMに応じた補正式は種々に設定可能であ
る。数多くの実測と試行錯誤の結果、一例として、AD
SUMに応じた次のような補正式と判定式を導入するこ
とが比較的有効であることに帰納した。しかし、これに
限定されないのは勿論である。
【0055】上記サンプリング条件においては、一つの
目安として、上記正規化された累算値ADSUMが「1
2」よりも小さいならば、補正の必要がないことが判っ
た。累算値ADSUMがそれ以上の場合は、無声音また
は過渡領域である可能性が高い。そこで、無声音または
過渡領域の音の前記比の値MAXRを下記数6のような
補正式で補正することが比較的有効であることに帰納し
た。なお、MAXR’は、補正後の比の値を示す。
【0056】
【数6】(a)ADSUMが12以上の場合のMAXR
の補正式: MAXR’=MAXR−(ADSUM−12)/64 (b)ADSUMが12よりも小さい場合のMAXRの
補正式: MAXR’=MAXR (つまり補正せず) なお、上記数6における数値12及び64は、あくまで
も上記条件下での経験値に過ぎないので、これを一般化
して表現する場合は、これらの数値12及び64を、条
件に応じた適宜の定数に置き換えるべきであることは勿
論である。最終的に得ようとする有声/無声判定値UV
は、上記数2によって補正された比の値MAXR’を、
前述と同様に、前記数4の関係式に適用して求められ
る。
【0057】図12に戻ると、ステップS52では、前
ステップS51で求めた正規化されたアブソリュート差
分累算値ADSUMが12より小さいか(つまりADS
UM−12<0が成立するか)を調べる。これは、前記
数6の補正式a,bのうちどちらを適用すべきかを判断
するためである。ステップS52でYESと判断した場
合は、ステップS53に行く。ステップS53では、補
正していない前記比の値MAXRを使用して、 UV=(MAXR−0.4)/0.4 なる演算を行う。これは、上記数6の補正式bと前記数
4の判定式を組合せた演算式に相当する。
【0058】ステップS52でNOと判断した場合は、
ステップS54に行く。ステップS54では、前記比の
値MAXRを上記数6の補正式aにより補正して、 UV=[{MAXR−(ADSUM−12)/64}−
0.4]/0.4 なる演算を行う。これは、上記数6の補正式aと数4の
判定式を組合せた演算式に相当する。
【0059】このように、ステップS53又はS54に
より、上記数6の補正式と数4の判定式を組合せた演算
式が実行され、前記比の値MAXRの補正が行われると
共に、この補正値MAXR’に基づく有声/無声判定演
算が行われ、有声/無声判定値UVが得られる。また、
続くステップS12〜S15の処理により、前述と同様
に、この値UVが1より大又は0より小のとき、それぞ
れ1又は0に設定する処理を行なう。
【0060】次に、図7,図8の実測例について上記第
3の実施例に従って分析した結果の一例を示す。図8の
a〜fに示す各フレームF1〜F6毎の自己相関関数に
おける最大極値Rkと初期値R0の比Rk/R0=MAXR
と、これら各自己相関関数について上述のように演算し
た正規化アブソリュート差分累算値ADSUM、及びこ
れらを前記数6及び数4の各式に適用して得られた判定
結果UVを示すと、次表のようである。
【0061】
【表4】
【0062】なお、上述では、アブソリュート差分累算
値ADSUMを求めるにあたって、自己相関関数Riに
おける隣接するサンプル値同士の差の絶対値を累算する
ようにしているが、これに限らず、3サンプル毎あるい
は4サンプル毎など所定サンプル数(次数)毎の自己相
関関数値の差の絶対値を累算するようにしてもよい。
【0063】次に、上述の各実施例に係る方法を実施す
る音声分析システムを音源システムと共に一体的に具備
した電子楽器の一実施例を図14により説明する。図1
4において、中央処理ユニット(CPU)10,リード
オンリーメモリ(ROM)11,ランダムアクセスメモ
リ(RAM)12を含むマイクロコンピュータの制御に
より各種の処理が実行される。ROM11においては、
上記実施例に示されたような各処理手順を実現するため
のプログラムがストアされている。マイクロフォン13
によって外部から取り込んだアナログ音声信号がアンプ
14を介してA/D変換器15に与えられ、所定のサン
プリングクロックに従ってサンプリングされてディジタ
ル音声波形信号に変換される。このディジタル音声波形
信号は、RAM12にストアされる。ディジタル信号プ
ロセッサ(DSP)16はプログラムされた計算式を高
速で実行するものであり、自己相関関数Riの演算など
複雑な計算をこのDSP16によって行う。以上の構成
により、上記実施例に示されたような有声/無声分析の
ための各処理手順がマイクロコンピュータの制御に基づ
き実行される。分析の結果得られた有声/無声判定値U
Vは、CPU10やRAM12等にあるレジスタに適宜
ストアされ、楽音制御のために利用される。
【0064】パネルスイッチ部17は、楽音の音色、音
量、音高、効果等を設定、選択、制御するための各種の
スイッチを含むものであり、外部から音声信号を取り込
むことを指示するスイッチや分析の結果得られた有声/
無声判定値UVを楽音制御のために利用することを指示
するスイッチなど音声分析処理に関連する各種スイッチ
類を含んでいてよい。パネルスイッチ部17はインタフ
ェース18を介してマイクロコンピュータのバスに接続
されている。発生すべき音階音を指定するための複数の
鍵を具備した鍵盤部19も、インタフェース20を介し
てマイクロコンピュータのバスに接続されている。
【0065】鍵盤部19で指定された音階音に対応する
ディジタル楽音信号が、楽音信号発生回路21から発生
され、D/A変換器22でアナログ信号に変換されて、
サウンドシステム23から音響的に発音される。楽音信
号発生回路21における楽音信号発生方式は、PCM波
形メモリ方式やFM方式、AM方式など公知のどのよう
な方式を用いてもよい。
【0066】分析の結果得られた有声/無声判定値UV
は、どのような形態で楽音制御のために利用するように
してもよい。例えば、楽音信号発生回路21で発生する
楽音信号の音色を制御するために利用する場合、フィル
タの特性を制御したり、波形メモリから読み出す波形の
選択を制御したり、各種補間演算のパラメータを制御し
たりするために、有声/無声判定値UVを利用するよう
にしてよい。有声/無声判定値UVの利用形態はその他
種々あってよいが、ここでは特に詳しく述べない。
【0067】制御の形態としては、例えば、鍵盤部19
等で指定した楽音を発音中に、マイクロフォン13で適
宜の音声を入力し、実時間でその分析を行い、その分析
の結果得られた有声/無声判定値UVに応じて、発音中
の楽音を実時間で制御するようにすることが可能であ
る。その場合に、適当な1フレームだけの分析を行い、
その結果得られた有声/無声判定値UVに応じて楽音を
制御するようにしてもよい。あるいは、適当な複数フレ
ームについて実時間で分析を行い、それぞれの分析結果
に応じて変化する可能性のある有声/無声判定値UVに
応じて楽音を時間的に可変で制御するようにしてもよ
い。
【0068】上述の各実施例に係る方法を実施する音声
分析システムは単体の音声コントローラとして構成され
ていてもよい。図15はそのような音声コントローラ2
4の一実施例を示す。図15において、音声コントロー
ラ24は、外部から音声信号を取り込むためのマイクロ
フォン25と、アンプ26と、A/D変換器27と、音
声分析装置28と、MIDI変換器29とを含んでい
る。音声分析装置28は、上述の各実施例に係る方法を
実施する装置であり、上述のような音声分析プログラム
を搭載したマイクロコンピュータとDSPとによって構
成してもよいし、ディスクリート回路によって構成して
もよい。MIDI変換器29は、分析の結果得られた有
声/無声判定値UV及びその他必要なデータをMIDI
フォーマットに変換して出力する。MIDIフォーマッ
トの有声/無声判定値UV及びその他必要なデータは、
外部の電子楽器30に与えられ、該電子楽器30におい
て発生する楽音の制御のために使用される。
【0069】なお、上記各実施例において、分析の対象
である音声信号の入力の仕方は、マイクロフォンによっ
てサンプリングして入力する例に限らず、データ伝送ラ
インを介してディジタル音声波形データを入力するよう
にしてもよいし、あるいはメモリに記録済みのディジタ
ル音声波形データを適宜読み出すことにより入力するよ
うにしてもよい。
【0070】また、音声波形信号の自己相関関数の変化
の傾向の分析及び補正の仕方は、上記実施例に示された
ものに限らず、本明細書及び図面から理解及び予測でき
るすべての態様を含む。すなわち、音声波形信号から直
接求めた自己相関関数の初期値R0と最大極値Rkとの比
の値は、特に、無声音領域で不安定であり、無声音領域
での判定の改善が望まれるという発想と、該自己相関関
数の変化の傾向は無声音ほど変化が激しいので、この変
化の激しさを何らかの観点から数値化し、この数値に応
じて、特に無声音領域が区別できるように、該比の値を
補正するという発想により、この発明では、精度のよい
有声/無声判定が期待できるようになっているのであ
る。従って、そのような観点で、自己相関関数の変化の
激しさが計量化できる何らかのファクタを計量・分析す
る演算を行えばよいことになり、そのような計量化・分
析演算とそれに基づく補正演算に係るすべての実施態様
がこの発明の範囲に含まれる。
【0071】
【発明の効果】以上説明したように、この発明によれ
ば、音声波形信号の自己相関関数を直接求め、これに基
づきラフな有声/無声判定のための関数初期値とその後
の最大極値の比の値を求め、更に、この自己相関関数の
変化の傾向を分析するための所定の演算を行い、この演
算結果に応じて補正値を発生し、この補正値に応じて前
記比の値を補正し、これに基づき有声/無声判定を行う
ようにしたので、変形自己相関関数を求める場合に比べ
て演算を簡単化することができ、しかも補正により確度
の高い有声/無声判定を行うことができるようになる、
という優れた効果を奏する。従って、音声信号を実時間
で分析し、その分析結果に応じて実時間で楽音制御を行
うような場合に最適である。
【図面の簡単な説明】
【図1】 この発明に係る音声分析装置で採用する音声
分析方法の一実施例の処理手順を示すフロー図。
【図2】図1における極値数カウント処理ステップの一
具体例を示すフロー図。
【図3】音声波形信号の自己相関関数の初期値と最大極
値の比の値と有声度/無声度との関係の一例をおおまか
な傾向で示すグラフ。
【図4】音声波形信号の自己相関関数における極値数と
有声度/無声度との関係の一例をおおまかな傾向で示す
グラフ。
【図5】男性音声によって「シャ(sha)」と発音し
た場合の音声波形例を示す図。
【図6】図5の音声波形に基づき求めたいくつかのフレ
ームにおける自己相関関数を示す関数波形図。
【図7】女性音声によって「チ(chi)」と発音した
場合の音声波形例を示す図。
【図8】図7の音声波形に基づき求めたいくつかのフレ
ームにおける自己相関関数を示す関数波形図。
【図9】この発明に従う音声分析方法の別の実施例の処
理手順を示すフロー図。
【図10】図9におけるローカルピーク差分累算値を求
める処理ステップの一具体例を示すフロー図。
【図11】音声波形信号の自己相関関数におけるローカ
ルピーク差分累算値と有声度/無声度との関係の一例を
おおまかな傾向で示すグラフ。
【図12】この発明に従う音声分析方法の更に別の実施
例の処理手順を示すフロー図。
【図13】音声波形信号の自己相関関数におけるアブソ
リュート差分累算値と有声度/無声度との関係の一例を
おおまかな傾向で示すグラフ。
【図14】この発明に従う音声分析方法を実施する音声
分析システムを音源システムと共に一体的に具備した電
子楽器の一実施例を示すブロック図。
【図15】この発明に従う音声分析方法を実施する音声
分析システムを単体の音声コントローラとして構成した
一実施例を示すブロック図。
【符号の説明】
10…中央処理ユニット(CPU)、11…リードオン
リーメモリ(ROM)、12…ランダムアクセスメモリ
(RAM)、13…マイクロフォン、16…ディジタル
信号プロセッサ(DSP)、17…パネルスイッチ部、
19…鍵盤部、21…楽音信号発生回路、24…音声コ
ントローラ、28…音声分析装置。
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 9/08 G10L 9/00

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1から第7の処理を行う音声分析装置
    であって、 第1の処理(S4)は、フレーム音声波形信号を入力
    し、 第2の処理(S5)は、入力されたフレーム音声波形信
    号の自己相関関数を計算し、 第3の処理(S6)は、第2の処理で計算した自己相関
    関数の初期サンプル値(R0)とその後の最大極値(R
    k)を抽出し、 第4の処理(S7)は、初期サンプル値(R0)に対す
    る最大極値(Rk)の比(MAXR)を計算し、 第5の処理(S8,S16,S51)は、第2の処理で
    計算した自己相関関数の変化の大きさあるいは激しさを
    示す補正値(LPCT,LPDSUM,ADSUM)を
    算出し、 第6の処理(S9〜S11,S17〜S19,S52〜
    S54)は、第5の処理で出力した補正値(LPCT,
    LPDSUM,ADSUM)に基づき第4の処理で計算
    した比(MAXR)を補正して補正比を計算すると共
    に、この補正比に基づき有声/無声判定値(UV)を算
    出し、 第7の処理(S12〜S15)は、有声/無声判定値
    (UV)に基づき有声/無声判定を行う 音声分析装置
  2. 【請求項2】 第5の処理(S8)は、第2の処理で計
    算した自己相関関数の極値の数を計算することで補正値
    (LPCT)を算出する請求項1に記載の音声分析装
    置。
  3. 【請求項3】 第2の処理で計算した自己相関関数の隣
    接するサンプルの差が符号変化したときのカウント数を
    計算することで前記極値の数を計算する請求項2に記載
    の音声分析装置。
  4. 【請求項4】 第5の処理(S16)は、第2の処理で
    計算した自己相関関数の隣接する極大値と極小値の差の
    絶対値を累積することで補正値(LPDSUM)を算出
    する請求項1に記載の音声分析装置。
  5. 【請求項5】 第5の処理(S51)は、第2の処理で
    計算した自己相関関数の所定サンプル毎のサンプル値の
    差の絶対値を累積することで補正値(ADSUM)を算
    出する請求項1に記載の音声分析装置。
JP4255925A 1992-08-31 1992-08-31 音声分析装置 Expired - Fee Related JP2962066B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4255925A JP2962066B2 (ja) 1992-08-31 1992-08-31 音声分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4255925A JP2962066B2 (ja) 1992-08-31 1992-08-31 音声分析装置

Publications (2)

Publication Number Publication Date
JPH0683390A JPH0683390A (ja) 1994-03-25
JP2962066B2 true JP2962066B2 (ja) 1999-10-12

Family

ID=17285481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4255925A Expired - Fee Related JP2962066B2 (ja) 1992-08-31 1992-08-31 音声分析装置

Country Status (1)

Country Link
JP (1) JP2962066B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004534274A (ja) * 2001-03-23 2004-11-11 インスティチュート・フォー・インフォコム・リサーチ 内容ベースのマルチメディア情報検索で使用するためデジタル表示で音楽情報を表示する方法およびシステム

Also Published As

Publication number Publication date
JPH0683390A (ja) 1994-03-25

Similar Documents

Publication Publication Date Title
US7582824B2 (en) Tempo detection apparatus, chord-name detection apparatus, and programs therefor
JP4672613B2 (ja) テンポ検出装置及びテンポ検出用コンピュータプログラム
EP0648365B1 (en) Method and apparatus for generating vocal harmonies
JP2008516289A (ja) 音声信号の基礎となるメロディを抽出する方法および装置
JP4916947B2 (ja) リズム検出装置及びリズム検出用コンピュータ・プログラム
CN110534082B (zh) 基于音频输入的动态调适音调校正
JP2008516288A (ja) 音声信号の基礎となるメロディの抽出
Caetano et al. A source-filter model for musical instrument sound transformation
JP5188863B2 (ja) 電子楽器
JP5790496B2 (ja) 音響処理装置
US5577160A (en) Speech analysis apparatus for extracting glottal source parameters and formant parameters
JP2962066B2 (ja) 音声分析装置
JP3279204B2 (ja) 音信号分析装置及び演奏情報発生装置
US6750390B2 (en) Automatic performing apparatus and electronic instrument
JP2600384B2 (ja) 音声合成方法
JP2591894B2 (ja) 調律器
JP3001353B2 (ja) 自動採譜装置
CN110709922B (zh) 歌唱音生成装置及方法、记录介质
CN112750422B (zh) 一种歌声合成方法、装置及设备
JPH07199978A (ja) カラオケ装置
Szczerba et al. Pitch estimation enhancement employing neural network-based music prediction
JP2734526B2 (ja) ピッチ抽出装置
JP3358243B2 (ja) ディジタル信号処理方法
JP2004287350A (ja) 音声変換装置、音声効果付与装置、及びプログラム
JPH01219622A (ja) 自動採譜方法及び装置

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070806

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees