JP2962066B2

JP2962066B2 - 音声分析装置

Info

Publication number: JP2962066B2
Application number: JP4255925A
Authority: JP
Inventors: アユミ深田; 哲夫西元
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 1992-08-31
Filing date: 1992-08-31
Publication date: 1999-10-12
Anticipated expiration: 2014-10-12
Also published as: JPH0683390A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、音声分析装置に関
し、特に有声音と無声音を判定するものに関し、詳しく
は有声音と無声音の判定を簡便にかつ素早く行えるよう
にしたものである。この発明に係る有声音と無声音の判
定技術は、例えば、電子楽器等の楽音制御技術の分野に
おいて有声音と無声音の判定結果に応じて楽音制御を行
うために利用可能である。

【０００２】

【従来の技術】有声音と無声音を判定する方法の１つと
して、変形自己相関関数ｒe（ｎ）を用いるものがあ
る。この方法は大別して次の４つのステップからなる。
ステップ１：線形予測により、分析対象である音声波形
信号の残差波形信号を求める。ステップ２：この残差波
形信号の自己相関関数（これを変形自己相関関数とい
う）を求める。ステップ３：この変形自己相関関数の初
期値ｒe（０）とその後の最大極値ｒe（Ｔ）との比ｒe
（Ｔ）／ｒe（０）を求める。ステップ４：求めた比の
値から、上記音声波形信号の有声／無声を判定する。一
例として、上記比の値が、０．１８以下であれば無声音
と判定し、有声度判定値Ｖ＝０，無声度判定値Ｕ＝１と
する。また、上記比の値が、０．２５以上であれば有声
音と判定し、有声度判定値Ｖ＝１，無声度判定値Ｕ＝０
とする。また、上記比の値が、０．１８と０．２５の間
の場合は、その値に応じて有声度判定値Ｖと無声度判定
値Ｕを適切に決定する（ただし、Ｕ＋Ｖ＝１）。

【０００３】

【発明が解決しようとする課題】このように変形自己
相関関数を使用した有声／無声判定法は、音声波形信号
におけるフォルマント成分の影響を受けにくいので、精
度のよい判定が期待できる。しかし、その反面、残差波
形を求めるための複雑な演算が必要であるため、演算装
置及びプログラムの構成が複雑になってしまうという欠
点がある。また、その分、演算時間が余計にかかるの
で、音声波形信号の入力から有声／無声判定結果の出力
までに時間がかかり、実時間で分析を行うことが困難で
あった。従って、任意の音声波形信号を入力してその有
声／無声判定結果に応じて実時間で楽音制御を行おうと
する場合に不向きであった。一方、分析対象である音声
波形信号の自己相関関数を直接求め、この自己相関関数
に基づき有声／無声判定を行うことも考えられている
が、それだけでは実用に耐えうる判定精度が出せないと
いう問題点があった。この発明は上述の点に鑑みてなさ
れたもので、簡単な構成で比較的精度のよい有声／無声
判定を行うことができるようにした、実時間分析に適し
た、音声分析装置を提供しようとするものである。

【０００４】

【課題を解決するための手段】この発明は、第１から
第７の処理を行う音声分析装置であって、第１の処理
（Ｓ４）は、フレーム音声波形信号を入力し、第２の処
理（Ｓ５）は、入力されたフレーム音声波形信号の自己
相関関数を計算し、第３の処理（Ｓ６）は、第２の処理
で計算した自己相関関数の初期サンプル値（Ｒ0）とそ
の後の最大極値（Ｒk）を抽出し、第４の処理（Ｓ７）
は、初期サンプル値（Ｒ0）に対する最大極値（Ｒk）の
比（ＭＡＸＲ）を計算し、第５の処理（Ｓ８，Ｓ１６，
Ｓ５１）は、第２の処理で計算した自己相関関数の変化
の大きさあるいは激しさを示す補正値（ＬＰＣＴ，ＬＰ
ＤＳＵＭ，ＡＤＳＵＭ）を算出し、第６の処理（Ｓ９〜
Ｓ１１，Ｓ１７〜Ｓ１９，Ｓ５２〜Ｓ５４）は、第５の
処理で出力した補正値（ＬＰＣＴ，ＬＰＤＳＵＭ，ＡＤ
ＳＵＭ）に基づき第４の処理で計算した比（ＭＡＸＲ）
を補正して補正比を計算すると共に、この補正比に基づ
き有声／無声判定値（ＵＶ）を算出し、第７の処理（Ｓ
１２〜Ｓ１５）は、有声／無声判定値（ＵＶ）に基づき
有声／無声判定を行うことを特徴とするものである。

【０００５】

【作用】第２の処理では、入力された音声波形信号の
自己相関関数が直接求められる。従って、変形自己相関
関数を求めるための演算が省略されており、演算がかな
り簡単化されている。第３及び第４の処理では、第２の
処理で求めた自己相関関数の初期値とその後の最大極値
との比（ＭＡＸＲ）を計算する。一般に、自己相関関数
において、初期値の後の最大極値は、音声波形信号のピ
ッチ周期に対応する位置に表われる。そこで、この自己
相関関数の初期値とその後の最大極値との比の値によ
り、該音声波形信号の周期性が判り、これに基づき有声
音と無声音の判定ができることになる。しかし、音声波
形信号の自己相関関数においては、基本波成分以外の成
分の影響が残るため、該比の値のみでは正確な有声／無
声判定が行えない。特に、無声音における雑音成分によ
るランダムな極値が比較的大きなレベルで生じてしまう
ので、該比の値のみによって有声／無声判定を行うのは
極めて困難である。このように、第３及び第４の処理で
求めた比（ＭＡＸＲ）の値は、不十分なものである。

【０００６】この発明では、不十分な上記比の値を補
正するために第５乃至第７の処理を具備していることが
特徴である。特に、音声波形信号の自己相関関数におい
ては、雑音的成分による影響が残されるために、無声音
の自己相関関数の方が、有声音の自己相関関数に比べ
て、自己相関関数値の変化が大きい（若しくは激しい）
ことに着目したものである。すなわち、音声波形信号の
自己相関関数における関数波形の変化傾向は、有声度／
無声度に関係していることに着目したものである。そこ
で、第５の処理では、第２の処理で求めた自己相関関数
の変化の傾向を分析するための所定の演算を行い、この
演算結果に応じて補正値を発生するようにしたことを特
徴としている。すなわち、第５の処理では、第２の処理
で計算した自己相関関数の変化の大きさあるいは激しさ
を示す補正値（ＬＰＣＴ，ＬＰＤＳＵＭ，ＡＤＳＵＭ）
を算出する。そして、第６の処理では、この補正値に応
じて前記比（ＭＡＸＲ）を補正して補正比を計算すると
共に、この補正比に基づき有声／無声判定値（ＵＶ）を
算出する。第７の処理では、この有声／無声判定値（Ｕ
Ｖ）に基づき有声／無声判定を行う。これにより、例え
ば、自己相関関数値が大きく変化する傾向にあるなら
ば、無声度が高いので、無声度を高める方向に前記比
（ＭＡＸＲ）の値を補正するようにすれば、比較的精度
のよい有声／無声判定を行うことができることになる。
しかも、変形自己相関関数を求めるための演算は省略さ
れるので、演算構成が簡単であり、これに伴い演算時間
も短縮される。従って、実時間分析にも適している。

【０００７】第５の処理における分析演算の手法は種
々考えられる。その分析演算の一実施態様は、前記第２
の処理で求めた自己相関関数における極値の数をカウン
トすることからなっていてよい。極値の数が多ければ、
自己相関関数の波形変化の傾向が激しい（若しくは頻繁
である）ことを意味し、無声度が高いことになる。この
場合、カウントすべき極値として、極大値及び極小値の
両方をカウントするようしてよく、また、極大値及び極
小値のどちらか一方をカウントするようにしてもよい。

【０００８】上記における極値の数のカウントの仕方の
一実施態様は、前記自己相関関数の各関数値において、
隣接する関数値同士の差をそれぞれ求め、該差の符号が
変化したときカウントを行なうようにしてよい。該差の
符号が正から負に変化したときは極大値を通過したとき
であり、該差の符号が負から正に変化したときは極小値
を通過したときであるので、その数をカウントすること
により、極値数をカウントできる。

【０００９】第５の処理における分析演算の別の実施
態様は、前記第２の処理で求めた自己相関関数における
極大値と極小値の差の絶対値を累算することからなって
いてよい。極大値と極小値の差の絶対値の累算値が大き
いほど、極大値と極小値の差が大きくまた極値の数も多
いことになり、従って、自己相関関数の振幅変化が大き
く、変化傾向が大きい（若しくは激しい）ことを意味
し、無声度が高いことになる。

【００１０】第５の処理における分析演算の更に別の
実施態様は、前記第２の処理で求めた自己相関関数にお
ける所定サンプル毎の関数値の差の絶対値を累算するこ
とからなっていてよい。所定サンプル毎の関数値の差の
絶対値の累算値が大きいほど、所定サンプル毎の関数値
の差が大きく、従って、自己相関関数の変化が急峻であ
り、変化傾向が大きい（若しくは激しい）ことを意味
し、無声度が高いことになる。この場合、自己相関関数
における隣接サンプル毎の関数値の差の絶対値を累算す
るようにしてもよいし、適当数のサンプル毎の関数値の
差の絶対値を累算するようにしてもよい。

【００１１】第６の処理における補正の一実施態様
は、前記補正値が所定値以上であるか否かに応じて異な
る補正式に従って補正を行うことであってもよい。これ
は、補正値が無声度を示している場合と有声度を示して
いる場合とで異なった態様の補正を行い、より一層精度
のよい有声／無声判定を行うために、有効である。

【００１２】

【実施例】以下、添付図面を参照してこの発明の一実
施例を詳細に説明しよう。図１は、この発明に係る音声
分析装置で採用する音声分析方法の一実施例の処理手順
を示すフロー図である。まず、アナログ音声波形信号を
マイクロフォン等によって外部から取り込む（ステップ
Ｓ１）。次に、取り込んだアナログ音声波形信号をロー
パスフィルタ処理する（ステップＳ２）。次に、ローパ
スフィルタ処理済みのアナログ音声波形信号をディジタ
ル信号に変換する（ステップＳ３）。

【００１３】次のステップＳ４では、ディジタル変換し
た音声波形信号サンプルデータをメモリに記憶する。こ
の場合、１回の分析に必要な１フレーム分の波形サンプ
ルデータＹ（ｍ＋ｉ）をメモリに記憶すればよい。ここ
で、ｍは任意の初期サンプルを示す番号であり、分析し
ようとするフレームの初期サンプル番号を示す。ｉは１
フレーム内の相対サンプル番号を示す変数であり、ｉ＝
０，１，２，…，Ｎである。例えば、１フレーム＝Ｎ＋
１サンプル＝１２８サンプルの場合、ｉ＝０，１，２，
…，１２７である。以下では、便宜上、ｍ＝０として、
メモリに記憶した１フレーム分の波形サンプルデータ
を、Ｙ0〜Ｙ127で示す。次のステップＳ５では、ステッ
プＳ４で記憶した１フレーム分の波形サンプルデータＹ
0〜Ｙ127を読出し、その自己相関関数Ｒｉを計算する。
自己相関関数の計算式の一例を示すと次のようである。

【００１４】

【数１】ここで、Ｒｉにおけるｉは自己相関関数の次数を示す変
数であり、ｉ＝０，１，２，…，１２７である。Ｎは、
前述の通り、１フレームにおける最終サンプル番号であ
る。ｎは、ｉからＮまで変化する変数であり、波形サン
プルデータＹn（Ｙ0〜Ｙ127）のサンプル番号を特定す
る。従って、上記数１において、ｎ＝ｉのときは、Ｙn
＝Ｙi，Ｙn-i＝Ｙ0，であり、ｎ＝Ｎ＝１２７のとき
は、Ｙn＝Ｙ127，Ｙn-i＝Ｙ127-i，である。上記数１に
示すような自己相関関数の計算式に従って、ｉの各値
（０，１，２，…，１２７）に対応して、合計Ｎ＋１＝
１２８サンプルの自己相関関数値Ｒｉが求められる。求
めた自己相関関数値Ｒｉはメモリにストアされる。

【００１５】ステップＳ６では、前ステップで求めた自
己相関関数値Ｒiの中から初期値Ｒ0と該初期値Ｒ0を除
く最大極値Ｒkを抽出する（Ｒ0，Ｒkについては、例え
ば図６（ｅ）を参照されたし）。ステップＳ７では、最
大極値Ｒkと初期値Ｒ0の比Ｒk／Ｒ0を求める。以下で
は、この比Ｒk／Ｒ0をＭＡＸＲで表わす。一般に、初期
値Ｒ0と最大極値Ｒkの間隔は、オリジナル音声波形信号
のピッチに対応していることが知られている。従って、
この比Ｒk／Ｒ0＝ＭＡＸＲは、オリジナル音声波形信号
の有声度を知るためには有効である。しかし、無声音に
おいては、ランダムな位置で最大極値Ｒkが生じるの
で、この比Ｒk／Ｒ0＝ＭＡＸＲは、オリジナル音声波形
信号の無声度を知るためには十分ではない。

【００１６】数多くの実測を行った結果、上記比Ｒk／
Ｒ0＝ＭＡＸＲの値と有声度／無声度の関係は、図３の
ような傾向を示すことが判った。すなわち、有声音にお
いて高い値を示すのは勿論のこと、無声音においても比
較的高い値を示す。また、有声音と無声音の中間の過渡
的な音では比較的低い値を示す。従って、この比の値Ｍ
ＡＸＲのみでは、正確な有声／無声判定を行うことが困
難である。また、そのような実測の結果、上記比の値Ｍ
ＡＸＲに応じて下記数２のような仮定の関係式を適用す
ることにより、一応、有声度／無声度の判定の目安とす
ることができることが判った。なお、下記数２における
数値０.４及び０.８は、あくまでも経験値に過ぎないの
で、下記数２の仮定式を一般化して表現する場合は、こ
れらの数値０.４及び０.８を、条件に応じた適宜の定数
に置き換えるべきであることは勿論である。

【００１７】

【数２】ＭＡＸＲ≦０.４が成立すれば、無声音ＭＡＸＲ≧０.８が成立すれば、有声音０.４＜ＭＡＸＲ＜０.８のときは、過渡状態しかし、この数２のような関係式のみでは、上述のよう
に、比の値ＭＡＸＲ自体が不正確であるために、正確な
判定ができない。そこで、比の値ＭＡＸＲの不正確さを
補うために、続くステップＳ８〜Ｓ１５の処理を行い、
この比の値ＭＡＸＲを補正し、これに基づき最終的な有
声／無声判定値ＵＶを比較的高い確度で求めるようにし
ている。

【００１８】ステップＳ８では、ステップＳ５で求めた
自己相関関数Ｒｉの変化の傾向を分析するための所定の
演算を行い、この演算結果に応じて補正値を発生する。
そのための分析演算の一例として、図１のステップＳ８
では、前ステップＳ５で求めた自己相関関数Ｒｉにおけ
る極値の数ＬＰＣＴ（この記号の意味は、Local PeakCo
untと理解されたい）をカウントするようにしている。
この場合、カウントすべき極値として、極大値及び極小
値の両方をカウントするようにしてよく、また、極大値
及び極小値のどちらか一方をカウントするようにしても
よい。なお、通常の定義の通り、極大とは関数波形の上
向きのピーク（山）、極小とは関数波形の下向きのピー
ク（谷）を指す。従って、極値すなわちピークの数が多
ければ、関数波形の振動の頻度が高いことになり、これ
は、自己相関関数の変化の傾向が大きいことを意味し、
従って、無声度が高いことを意味する。

【００１９】一例として、所定のサンプリング周波数１
０ｋＨｚの下でサンプリングしたオリジナル音声波形デ
ータを上記のように１フレーム＝１２８サンプルでその
自己相関関数Ｒｉを求め、極大値及び極小値の両方をカ
ウントする手法で、数多くの実測を行った結果、上記極
値の数ＬＰＣＴは、図４のような傾向を示すことが判っ
た。すなわち、極値数ＬＰＣＴは、無声音において大き
な値を示すことが理解できる。図３を参照すると、無声
音領域における前記比の値ＭＡＸＲを適切に補正して、
補正後の比の値の関数が単調増加傾向を示すものとなれ
ば、これに基づき正確な有声／無声判定を行うことがで
きるようになるであろうことが理解できる。また、図４
を参照すると、極値数ＬＰＣＴは無声音領域において大
きな値を示すので、これを使用すれば、無声音領域にお
いて不安定な前記比の値ＭＡＸＲを適切に補正すること
ができるであろうことが予測できる。そこで、極値数Ｌ
ＰＣＴを使用して前記比の値ＭＡＸＲを適切に補正し、
これに基づき正確な有声／無声判定を行うことを以下の
ように提案する。

【００２０】そのような補正のための補正式は種々に設
定可能である。数多くの実測と試行錯誤の結果、一例と
して、次のような補正式と判定式を導入することが比較
的有効であることに帰納した。しかし、これに限定され
ないのは勿論である。〔ＭＡＸＲの補正式〕上記サンプリング条件及び極大値
と極小値の両方をカウントする条件下における数多くの
実測の結果、該条件下においては、一つの目安として、
極値数ＬＰＣＴが「２４」よりも小さいならば、補正の
必要がないことが判った。極値数ＬＰＣＴがそれ以上の
場合は、無声音または過渡領域である可能性が高い。そ
こで、無声音または過渡領域の音の前記比の値ＭＡＸＲ
を下記数３のような補正式で補正することが比較的有効
であることに帰納した。なお、ＭＡＸＲ’は、補正後の
比の値を示す。

【００２１】

【数３】（ａ）ＬＰＣＴが２４以上の場合のＭＡＸＲの
補正式：ＭＡＸＲ’＝ＭＡＸＲ−√（ＬＰＣＴ−２４）／３２（ｂ）ＬＰＣＴが２４よりも小さい場合のＭＡＸＲの補
正式：ＭＡＸＲ’＝ＭＡＸＲ（つまり補正せず）なお、上記数３における数値２４及び３２は、あくまで
も上記条件下での経験値に過ぎないので、これを一般化
して表現する場合は、これらの数値２４及び３２を、条
件に応じた適宜の定数に置き換えるべきであることは勿
論である。

【００２２】〔ＵＶの判定式〕最終的に得ようとする有
声／無声判定値ＵＶは、上記数３によって補正された比
の値ＭＡＸＲ’を前記数２の関係式に適用することによ
り、下記数４の関係式に従い求められる。

【数４】ＵＶ＝（ＭＡＸＲ'−０.４）／０.４（ただし、ＭＡＸＲ'−０.４＜０の場合は、ＵＶ＝０と
し、ＭＡＸＲ'−０.４＞０.４の場合は、ＵＶ＝１とす
る。）上記数４から理解できるように、上記数３によって補正
された比の値ＭＡＸＲ’が０.４以下であれば有声／無
声判定値ＵＶは０であり、無声音であることを示す。ま
た、上記数３によって補正された比の値ＭＡＸＲ’が
０.８以上であれば有声／無声判定値ＵＶは１であり、
有声音であることを示す。また、０.４＜ＭＡＸＲ'＜
０.８のときは、有声／無声判定値ＵＶは０＜ＵＶ＜１
の範囲の小数をとり、有声／無声の過渡領域にあり、そ
の小数値に応じた有声度若しくは無声度を示すことにな
る。

【００２３】図１に戻ると、ステップＳ９では、前ステ
ップＳ８で求めた極値数ＬＰＣＴが２４より小さいか
（つまりＬＰＣＴ−２４＜０が成立するか）を調べる。
これは、前記数３の補正式ａ，ｂのうちどちらを適用す
べきかを判断するためである。ステップＳ９でＹＥＳと
判断した場合は、ステップＳ１０に行く。ステップＳ１
０では、補正していない前記比の値ＭＡＸＲを使用し
て、ＵＶ＝（ＭＡＸＲ−０.４）／０.４なる演算を行う。これは、上記数３の補正式ｂと数４の
判定式を組合せた演算式に相当する。

【００２４】ステップＳ９でＮＯと判断した場合は、ス
テップＳ１１に行く。ステップＳ１１では、前記比の値
ＭＡＸＲを上記数３の補正式ａにより補正して、ＵＶ＝［｛ＭＡＸＲ−√(ＬＰＣＴ−２４)／３２｝−
０.４］／０.４なる演算を行う。これは、上記数３の補正式ａと数４の
判定式を組合せた演算式に相当する。このように、ステ
ップＳ１０又はＳ１１により、上記数３の補正式と数４
の判定式を組合せた演算式が実行され、前記比の値ＭＡ
ＸＲの補正が行われると共に、この補正値ＭＡＸＲ’に
基づく有声／無声判定演算が行われ、有声／無声判定値
ＵＶが得られる。

【００２５】続くステップＳ１２〜Ｓ１５では、上記数
４のただし書き条件に応じた処理が行われる。すなわ
ち、前ステップＳ１０又はＳ１１で求めた有声／無声判
定値ＵＶが１より大きい場合（つまりＭＡＸＲ'−０.４
＞０.４の場合）、ステップＳ１２でＹＥＳと判定し、
ステップ１４に行き、有声／無声判定値ＵＶを１に設定
する。また、前ステップＳ１０又はＳ１１で求めた有声
／無声判定値ＵＶが０より小さい場合（つまりＭＡＸ
Ｒ'−０.４＜０の場合）、ステップＳ１４でＹＥＳと判
定し、ステップ１５に行き、有声／無声判定値ＵＶを０
に設定する。以上により、正確な有声／無声判定値ＵＶ
を得ることができる。

【００２６】なお、以上は１フレーム分の分析について
のみ説明しているが、複数フレームの分析も同様にして
可能であることは勿論である。その場合、波形サンプル
データのフレーム分割に際しては、それぞれのフレーム
の初期サンプル番号ｍを任意に指定して、各フレームの
設定は任意に行ってよい。また、ステップＳ４で１フレ
ーム以上のサンプル数にわたるディジタル音声波形サン
プルデータをメモリに逐次記憶し、所望のフレームのデ
ィジタル音声波形サンプルデータを該メモリから読み出
してステップＳ５〜Ｓ１５の処理を行なうようにしても
よい。

【００２７】次に、図１のステップＳ８における極値数
カウント処理の一具体例について図２により説明する。
図２においては、図１のステップＳ５で求めた自己相関
関数Ｒｉの各関数値において、隣接する関数値同士の差
をそれぞれ求め、該差の符号が変化したとき極大値（上
向きのピーク）又は極小値（下向きのピーク）を通過し
たと判定し、その数をカウントするようにしている。ま
ず、ステップＳ２０では、図１のステップＳ５で求めた
自己相関関数Ｒｉの初期値Ｒ0とその次の値Ｒ1との差Ｒ
1−Ｒ0を求め、これをレジスタｄ1にセットすると共
に、自己相関関数Ｒｉの次数ｉを指定する演算変数ｊを
１にセットし、かつ極値数ＬＰＣＴのカウント値を０に
セットする。ステップＳ２１では、演算変数ｊとｊ＋１
によって指定される隣接する２つの次数の自己相関関数
値ＲjとＲj+1の差を求め、これをレジスタｄ2にセット
する。

【００２８】次のステップＳ２２では、レジスタｄ1と
ｄ2にそれぞれストアされた差の値の正／負を調べ、正
／負符号が変化したかどうかを判定する。すなわち、ｄ
1≧０かつｄ2＜０が成立するか、若しくはｄ1＜０かつ
ｄ2≧０が成立するかどうかを判定する。ｄ1≧０かつｄ
2＜０が成立するときは、隣接する関数値同士の差が正
から負に変化したこと、つまり極大値を通過したことを
意味する。ｄ1＜０かつｄ2≧０が成立するときは、隣接
する関数値同士の差が負から正に変化したこと、つまり
極小値を通過したことを意味する。どちらかの判定条件
が成立したならば、ステップＳ２３に行き、極値数ＬＰ
ＣＴのカウント値を１増加し、その後ステップＳ２４に
行く。どちらの判定条件も成立しないならば、ステップ
Ｓ２４にジャンプし、ＬＰＣＴのカウントは行なわな
い。

【００２９】ステップＳ２４では、レジスタｄ2にスト
アされている差の値をレジスタｄ1に移し、演算変数ｊ
を１増加する。次のステップＳ２５では、演算変数ｊが
１２８になったか、つまり自己相関関数Ｒｉのすべての
次数ｉ＝０，１，２，…１２７に関して照合を終えたか
を調べる。ＮＯであれば、ステップＳ２１に戻り、増加
した次数ｊ，ｊ＋１に関して、上述と同様のステップＳ
２１からＳ２４の処理を繰り返す。自己相関関数Ｒｉの
すべての次数ｉに関して照合を終えたとき、ステップＳ
２５はＹＥＳとなり、図２の処理を終了する。このと
き、ＬＰＣＴの内容は自己相関関数Ｒｉにおける極大値
と極小値の合計カウント数を示している。なお、極大値
と極小値の一方のみをカウントしたい場合は、ステップ
Ｓ２２での判定条件を一方のみとすればよい。

【００３０】次に、実測例について説明する。図５は、
男性音声によって「シャ（ｓｈａ）」と発音した場合の
音声波形例を示している。図６は、図５の音声波形に基
づき求めたいくつかのフレームにおける自己相関関数を
示す。この例において、音声波形のサンプリング周波数
は１０ｋＨｚ、１フレームのサンプル数は１２８（従っ
て１フレームの時間長は12.8ｍsec）としている。図５
は、測定開始から1817ｍsec（ミリ秒）後から1919ｍsec
後までの波形を示している。この部分は、概ね、無声音
の「ｓ」から始まり、過渡状態を経て、有声音の「ａ」
に至るまでの波形変化を顕著に表わしている部分であ
り、無声、過渡、有声の３種の分析に適していると思わ
れるので、実測例として選定した。

【００３１】図６の（ａ）は1810ｍsecから１フレーム
分（便宜上第１フレーム：Ｆ１という）の音声波形の自
己相関関数Ｒｉを示す。（ｂ）は1826ｍsecから１フレ
ーム分（第２フレーム：Ｆ２という）の音声波形の自己
相関関数Ｒｉを示す。（ｃ）は1834ｍsecから１フレー
ム分（第３フレーム：Ｆ３という）の音声波形の自己相
関関数Ｒｉを示す。（ｄ）は1842ｍsecから１フレーム
分（第４フレーム：Ｆ４という）の音声波形の自己相関
関数Ｒｉを示す。（ｅ）は1858ｍsecから１フレーム分
（第５フレーム：Ｆ５という）の音声波形の自己相関関
数Ｒｉを示す。（ｆ）は1874ｍsecから１フレーム分
（第６フレーム：Ｆ６という）の音声波形の自己相関関
数Ｒｉを示す。図６ａ〜ｆに示す各フレームＦ１〜Ｆ６
毎の自己相関関数における最大極値Ｒkと初期値Ｒ0の比
Ｒk／Ｒ0＝ＭＡＸＲと、これら各自己相関関数について
上述のように演算した極値数ＬＰＣＴ、及びこれらを前
記数３及び数４の各式に適用して得られた判定結果ＵＶ
を下記表に示す。

【００３２】

【表１】

【００３３】図７は、女性音声によって「チ（ｃｈ
ｉ）」と発音した場合の音声波形例を示している。図８
は、図７の音声波形に基づき求めたいくつかのフレーム
における自己相関関数を示す。この例においても、音声
波形のサンプリング周波数は１０ｋＨｚ、１フレームの
サンプル数は１２８（従って１フレームの時間長は12.8
ｍsec）としている。図７は、測定開始から691ｍsec後
から793ｍsec後までの波形を示している。この部分は、
概ね、無声音の「ｃ」から始まり、過渡状態を経て、有
声音の「ｉ」に至るまでの波形変化を顕著に表わしてい
る部分であり、無声、過渡、有声の３種の分析に適して
いると思われるので、実測例として選定した。

【００３４】図８の（ａ）は688ｍsecから１フレーム分
（便宜上第１フレーム：Ｆ１という）の音声波形の自己
相関関数Ｒｉを示す。（ｂ）は712ｍsecから１フレーム
分（第２フレーム：Ｆ２という）の音声波形の自己相関
関数Ｒｉを示す。（ｃ）は720ｍsecから１フレーム分
（第３フレーム：Ｆ３という）の音声波形の自己相関関
数Ｒｉを示す。（ｄ）は724ｍsecから１フレーム分（第
４フレーム：Ｆ４という）の音声波形の自己相関関数Ｒ
ｉを示す。（ｅ）は728ｍsecから１フレーム分（第５フ
レーム：Ｆ５という）の音声波形の自己相関関数Ｒｉを
示す。（ｆ）は760ｍsecから１フレーム分（第６フレー
ム：Ｆ６という）の音声波形の自己相関関数Ｒｉを示
す。図８ａ〜ｆに示す各フレームＦ１〜Ｆ６毎の自己相
関関数における最大極値Ｒkと初期値Ｒ0の比Ｒk／Ｒ0＝
ＭＡＸＲと、これら各自己相関関数について上述のよう
に演算した極値数ＬＰＣＴ、及びこれらを前記数３及び
数４の各式に適用して得られた判定結果ＵＶを下記表に
示す。

【００３５】

【表２】

【００３６】上記表１及び２から理解できることは、こ
の発明に従って補正を行なう前の比Ｒk／Ｒ0の値ＭＡＸ
Ｒをそのまま適用して前記数２に従って有声／無声判定
を行なったとすると、明らかな無声音部分において過渡
状態との誤った判定がなされるであろうはずであったと
ころ（例えば表１のＦ１，Ｆ３や表２のＦ１，Ｆ２，Ｆ
４）、極値数ＬＰＣＴに応じた補正により、これらがす
べて無声音として正しく判定されるようになっているこ
とである。

【００３７】次に、この発明に従う音声分析方法の別の
実施例の処理手順について図９により説明する。図９に
おいて、ステップＳ１〜Ｓ７とＳ１２〜Ｓ１５は図１の
同一番号のステップＳ１〜Ｓ７とＳ１２〜Ｓ１５と同じ
処理であり、ステップＳ１６〜Ｓ１９が図１のステップ
Ｓ８〜Ｓ１１に置き換えられている。ステップＳ７で前
述の比Ｒk／Ｒ0＝ＭＡＸＲを求めた後、ステップＳ１６
の処理が行われる。ステップＳ１６においては、ステッ
プＳ５で求めた自己相関関数Ｒｉの変化の傾向を分析す
るための所定の演算を行い、この演算結果に応じて補正
値を発生するが、そのための分析演算の仕方が図１のス
テップＳ８とは異なっている。このステップＳ１６で
は、前ステップＳ５で求めた自己相関関数Ｒｉにおける
極大値と極小値の差の絶対値を累算し、その累算値ＬＰ
ＤＳＵＭ（この記号の意味は、Local Peak Differencia
l Sumと理解されたい。）を出力する。極大値と極小値
の差の絶対値とは、関数波形における上向きピーク
（山）と下向きピーク（谷）の間隔を示しており、この
値が大きいことは、関数波形の振幅変化が大きいことを
意味する。この極大値と極小値の差の絶対値の累算値が
大きいほど、極大値と極小値のひらきが大きくまた極値
の数も多いことになり、従って、自己相関関数の振幅変
化が大きく、変化傾向が大きい又は激しいことを意味
し、無声度が高いことを意味する。

【００３８】一例として、所定のサンプリング周波数１
０ｋＨｚの下でサンプリングしたオリジナル音声波形デ
ータを上記のように１フレーム＝１２８サンプルでその
自己相関関数Ｒｉを求め、数多くの実測を行った結果、
上記ローカルピーク差分累算値ＬＰＤＳＵＭは、図１１
のような傾向を示すことが判った。すなわち、該累算値
ＬＰＤＳＵＭは、無声音において大きな値を示すことが
理解できる。なお、分析に際しては、サンプリングした
音声の音量の相違による分析ノイズを解消するために、
該累算値ＬＰＤＳＵＭを正規化することが必要である。
以下の実例では、単純累算値を自己相関関数Ｒｉの初期
値Ｒ0によって除すことにより、正規化した累算値ＬＰ
ＤＳＵＭを求めるようにしている。従って、ここにおい
て述べるローカルピーク差分累算値ＬＰＤＳＵＭの数値
は、上記のように正規化した値である。

【００３９】図１１を参照すると、ローカルピーク差分
累算値ＬＰＤＳＵＭは無声音領域において大きな値を示
すので、これを使用すれば、無声音領域において不安定
な前記比の値ＭＡＸＲを適切に補正することができるで
あろうことが予測できる。そこで、ローカルピーク差分
累算値ＬＰＤＳＵＭを使用して前記比の値ＭＡＸＲを適
切に補正し、これに基づき正確な有声／無声判定を行う
ことを以下のように提案する。そのための該値ＬＰＤＳ
ＵＭに応じた補正式は種々に設定可能である。数多くの
実測と試行錯誤の結果、一例として、ＬＰＤＳＵＭに応
じた次のような補正式を導入することが比較的有効であ
ることに帰納した。しかし、これに限定されないのは勿
論である。上記サンプリング条件においては、一つの目
安として、累算値ＬＰＤＳＵＭが「１０」よりも小さい
ならば、補正の必要がないことが判った。累算値ＬＰＤ
ＳＵＭがそれ以上の場合は、無声音または過渡領域であ
る可能性が高い。そこで、無声音または過渡領域の音の
前記比の値ＭＡＸＲを下記数５のような補正式で補正す
ることが比較的有効であることに帰納した。なお、ＭＡ
ＸＲ’は、補正後の比の値を示す。

【００４０】

【数５】（ａ）ＬＰＤＳＵＭが１０以上の場合のＭＡＸ
Ｒの補正式：ＭＡＸＲ’＝ＭＡＸＲ−（ＬＰＤＳＵＭ−１０）／６４（ｂ）ＬＰＤＳＵＭが１０よりも小さい場合のＭＡＸＲ
の補正式：ＭＡＸＲ’＝ＭＡＸＲ（つまり補正せず）なお、上記数５における数値１０及び６４は、あくまで
も上記条件下での経験値に過ぎないので、これを一般化
して表現する場合は、これらの数値１０及び６４を、条
件に応じた適宜の定数に置き換えるべきであることは勿
論である。最終的に得ようとする有声／無声判定値ＵＶ
は、上記数５によって補正された比の値ＭＡＸＲ’を、
前述と同様に、前記数４の関係式に適用することにより
求められる。

【００４１】図９に戻ると、ステップＳ１７では、前ス
テップＳ１６で求めた正規化されたローカルピーク差分
累算値ＬＰＤＳＵＭが１０より小さいか（つまりＬＰＤ
ＳＵＭ−１０＜０が成立するか）を調べる。これは、前
記数５の補正式ａ，ｂのうちどちらを適用すべきかを判
断するためである。ステップＳ１７でＹＥＳと判断した
場合は、ステップＳ１８に行く。ステップＳ１８では、
補正していない前記比の値ＭＡＸＲを使用して、ＵＶ＝（ＭＡＸＲ−０.４）／０.４なる演算を行う。これは、上記数５の補正式ｂと前記数
４の判定式を組合せた演算式に相当する。

【００４２】ステップＳ１７でＮＯと判断した場合は、
ステップＳ１９に行く。ステップＳ１９では、前記比の
値ＭＡＸＲを上記数５の補正式ａにより補正して、ＵＶ＝［｛ＭＡＸＲ−(ＬＰＤＳＵＭ−１０）／６４｝
−０.４］／０.４なる演算を行う。これは、上記数５の補正式ａと数４の
判定式を組合せた演算式に相当する。このように、ステ
ップＳ１８又はＳ１９により、上記数５の補正式と数４
の判定式を組合せた演算式が実行され、前記比の値ＭＡ
ＸＲの補正が行われると共に、この補正値ＭＡＸＲ’に
基づく有声／無声判定演算が行われ、有声／無声判定値
ＵＶが得られる。また、続くステップＳ１２〜Ｓ１５の
処理により、前述と同様に、この値ＵＶが１より大又は
０より小のとき、それぞれ１又は０に設定する処理を行
なう。

【００４３】次に、図９のステップＳ１６におけるロー
カルピーク差分累算値ＬＰＤＳＵＭを求める処理の一具
体例について図１０により説明する。図１０において
は、図９のステップＳ５で求めた自己相関関数Ｒｉの各
関数値において、隣接する関数値同士の差をそれぞれ求
め、該差の符号が変化したとき極大値又は極小値を通過
したと判定し、隣接する極大値と極小値の差を求め、該
差の絶対値を累算する処理を行う。まず、ステップＳ３
０では、図９のステップＳ５で求めた自己相関関数Ｒｉ
の初期値Ｒ0とその次の値Ｒ1との差Ｒ1−Ｒ0を求め、こ
れをレジスタｄにセットする。次に、レジスタｄの値が
０より小さいかを調べ（ステップＳ３１）、ＹＥＳなら
ばサインフラグＳＦ１を「−１」にセットし、負である
ことを示す（ステップＳ３２）。ＮＯならばサインフラ
グＳＦ１を「１」にセットし、正であることを示す（ス
テップＳ３３）。

【００４４】ステップＳ３４では、自己相関関数Ｒｉの
次数ｉを指定する演算変数ｊを１にセットし、かつロー
カルピークナンバｎを０にリセットする。ステップＳ３
５では、演算変数ｊとｊ＋１によって指定される隣接す
る２つの次数の自己相関関数値ＲjとＲj+1の差を求め、
これをレジスタｄにセットする。次に、レジスタｄにス
トアされた差の値が負であるかを調べ（ステップＳ３
６）、ＹＥＳならばサインフラグＳＦ２を「−１」にセ
ットし、負であることを示す（ステップＳ３７）。ＮＯ
ならばサインフラグＳＦ２を「１」にセットし、正であ
ることを示す（ステップＳ３８）。

【００４５】ステップＳ３９では、第１のサインフラグ
ＳＦ１と第２のサインフラグＳＦ２の値を比較し、不一
致であるかを調べる。第１のサインフラグＳＦ１には、
先行する２つの隣接する関数値Ｒj-1とＲjの差の符号が
セットされており、第２のサインフラグＳＦ２には、後
続する２つの隣接する関数値ＲjとＲj+1の差の符号がセ
ットされている。従って、隣接する関数値同士の差の符
号が変化したとき、すなわち、極大値を通過したとき又
は極小値を通過したとき、両フラグＳＦ１，ＳＦ２は不
一致であり、ステップＳ３９はＹＥＳとなる。ステップ
Ｓ３９がＹＥＳならば、ステップＳ４０に行き、ローカ
ルピークナンバｎの現在値に対応するローカルピーク値
レジスタＬＰ(n)に、変数ｊによって指定される次数の
自己相関関数値Ｒjをストアする。次のステップＳ４１
では、ローカルピークナンバｎの値を１増加する。

【００４６】ステップＳ３９がＮＯならば、またはステ
ップＳ４１の後、ステップＳ４２に行き、第２のサイン
フラグＳＦ２の値を第１のサインフラグＳＦ１にシフト
し、かつ、演算変数ｊを１増加する。ステップＳ４３で
は、演算変数ｊが１２８になったか、つまり自己相関関
数Ｒｉのすべての次数ｉ＝０，１，２，…１２７に関し
て照合を終えたかを調べる。ＮＯであれば、ステップＳ
３５に戻り、増加した次数ｊ，ｊ＋１に関して、上述と
同様のステップＳ３５からＳ４２の処理を繰り返す。自
己相関関数Ｒｉのすべての次数ｉに関して照合を終えた
とき、ステップＳ４３はＹＥＳとなり、ステップＳ４４
に行く。このとき、ローカルピークナンバｎは、自己相
関関数Ｒｉにおけるピーク（極大値と極小値）の合計数
を示しており、ｎ個のローカルピーク値レジスタＬＰ
(0)〜ＬＰ(n-1)のそれぞれには、各ピークの値をストア
している。

【００４７】ステップＳ４４では、ローカルピーク差分
累算値ＬＰＤＳＵＭを０にリセットする。ステップＳ４
５では、ローカルピークナンバｎが１以下であるかを調
べる。ＮＯであれば、ステップＳ４６に行き、演算変数
ｊを１にセットする。次のステップＳ４７では、演算変
数ｊに応じて、ｊ−１番目のローカルピーク値レジスタ
ＬＰ(j-1)とｊ番目のローカルピーク値レジスタＬＰ(j)
のピーク値（極大値と極小値）を読み出し、その差の絶
対値｜ＬＰ(j)−ＬＰ(j-1)｜を求め、これをＬＰＤＳＵ
Ｍの現在値に加算する。

【００４８】次に、ステップＳ４８では演算変数ｊを１
増加する。ステップＳ４９では、演算変数ｊがローカル
ピークナンバｎに一致したか、つまりすべてのピークに
関してステップＳ４７の演算を行ったかを調べる。ＮＯ
であれば、ステップＳ４７に戻り、増加した変数ｊ，ｊ
＋１に関して、上述と同様のステップＳ４７の演算を行
う。すべてのピークに関してステップＳ４７の演算を完
了するとステップＳ４９はＹＥＳとなり、ステップＳ５
０に行く。こうして、自己相関関数Ｒｉにおけるすべて
の極大値と極小値に関して、隣接する極大値と極小値同
士の差の絶対値が次々に累算され、その累算値ＬＰＤＳ
ＵＭが求められる。ステップＳ５０では、上記のように
して求めた累算値ＬＰＤＳＵＭを自己相関関数Ｒｉの初
期値Ｒ0で除算し、正規化したローカルピーク差分累算
値ＬＰＤＳＵＭを得る。

【００４９】次に、図７，図８の実測例について上記第
２の実施例に従って分析した結果の一例を示す。図８の
ａ〜ｆに示す各フレームＦ１〜Ｆ６毎の自己相関関数に
おける最大極値Ｒkと初期値Ｒ0の比Ｒk／Ｒ0＝ＭＡＸＲ
と、これら各自己相関関数について上述のように演算し
た正規化ローカルピーク差分累算値ＬＰＤＳＵＭ、及び
これらを前記数５及び数４の各式に適用して得られた判
定結果ＵＶを示すと、次表のようである。

【００５０】

【表３】

【００５１】次に、この発明に従う音声分析方法の更に
別の実施例の処理手順について図１２により説明する。
図１２において、ステップＳ１〜Ｓ７とＳ１２〜Ｓ１５
は図１の同一番号のステップＳ１〜Ｓ７とＳ１２〜Ｓ１
５と同じ処理であり、ステップＳ７で前述の比Ｒk／Ｒ0
＝ＭＡＸＲを求めた後、ステップＳ５１の処理が行われ
る。

【００５２】ステップＳ５１においては、ステップＳ５
で求めた自己相関関数Ｒｉの変化の傾向を分析するため
の所定の演算を行い、この演算結果に応じて補正値を発
生するが、そのための分析演算の仕方が図１のステップ
Ｓ８及び図９のステップＳ１６とは異なっている。この
ステップＳ５１では、前ステップＳ５で求めた自己相関
関数Ｒｉにおける隣接するサンプル値同士の差の絶対値
を累算し、その累算値ＡＤＳＵＭ（この記号の意味は、
Absolute Differencial Sumと理解されたい）を出力す
る。自己相関関数Ｒｉにおける隣接するサンプル値同士
の差が大きいほど、その部分での波形変化が急峻である
ことを意味する。従って、自己相関関数Ｒｉにおける隣
接するサンプル値同士の差の絶対値の累算値ＡＤＳＵＭ
が大きいほど、自己相関関数全体における波形変化の傾
向が急峻であり、変化傾向が大きい又は激しいことを意
味し、無声度が高いことを意味する。

【００５３】一例として、所定のサンプリング周波数１
０ｋＨｚの下でサンプリングしたオリジナル音声波形デ
ータを上記のように１フレーム＝１２８サンプルでその
自己相関関数Ｒｉを求め、数多くの実測を行った結果、
上記アブソリュート差分累算値ＡＤＳＵＭは、図１３の
ような傾向を示すことが判った。すなわち、該累算値Ａ
ＤＳＵＭは、無声音において最も大きな値を示し、過渡
部では急激に減少し、有声音ではやや増加することが理
解できる。なお、分析に際しては、サンプリングした音
声の音量の相違による分析ノイズを解消するために、前
述と同様に、該累算値ＡＤＳＵＭを正規化することが必
要である。以下の実例では、単純累算値を自己相関関数
Ｒｉの初期値Ｒ0によって除すことにより、正規化した
累算値ＡＤＳＵＭを求めるようにしている。従って、こ
こにおいて述べるアブソリュート差分累算値ＡＤＳＵＭ
の数値は、上記のように正規化した値である。

【００５４】図１３を参照すると、累算値ＡＤＳＵＭは
無声音領域において大きな値を示すので、これを使用す
れば、無声音領域において不安定な前記比の値ＭＡＸＲ
を適切に補正することができるであろうことが予測でき
る。そこで、累算値ＡＤＳＵＭを使用して前記比の値Ｍ
ＡＸＲを適切に補正し、これに基づき正確な有声／無声
判定を行うことを以下のように提案する。そのための累
算値ＡＤＳＵＭに応じた補正式は種々に設定可能であ
る。数多くの実測と試行錯誤の結果、一例として、ＡＤ
ＳＵＭに応じた次のような補正式と判定式を導入するこ
とが比較的有効であることに帰納した。しかし、これに
限定されないのは勿論である。

【００５５】上記サンプリング条件においては、一つの
目安として、上記正規化された累算値ＡＤＳＵＭが「１
２」よりも小さいならば、補正の必要がないことが判っ
た。累算値ＡＤＳＵＭがそれ以上の場合は、無声音また
は過渡領域である可能性が高い。そこで、無声音または
過渡領域の音の前記比の値ＭＡＸＲを下記数６のような
補正式で補正することが比較的有効であることに帰納し
た。なお、ＭＡＸＲ’は、補正後の比の値を示す。

【００５６】

【数６】（ａ）ＡＤＳＵＭが１２以上の場合のＭＡＸＲ
の補正式：ＭＡＸＲ’＝ＭＡＸＲ−（ＡＤＳＵＭ−１２）／６４（ｂ）ＡＤＳＵＭが１２よりも小さい場合のＭＡＸＲの
補正式：ＭＡＸＲ’＝ＭＡＸＲ（つまり補正せず）なお、上記数６における数値１２及び６４は、あくまで
も上記条件下での経験値に過ぎないので、これを一般化
して表現する場合は、これらの数値１２及び６４を、条
件に応じた適宜の定数に置き換えるべきであることは勿
論である。最終的に得ようとする有声／無声判定値ＵＶ
は、上記数２によって補正された比の値ＭＡＸＲ’を、
前述と同様に、前記数４の関係式に適用して求められ
る。

【００５７】図１２に戻ると、ステップＳ５２では、前
ステップＳ５１で求めた正規化されたアブソリュート差
分累算値ＡＤＳＵＭが１２より小さいか（つまりＡＤＳ
ＵＭ−１２＜０が成立するか）を調べる。これは、前記
数６の補正式ａ，ｂのうちどちらを適用すべきかを判断
するためである。ステップＳ５２でＹＥＳと判断した場
合は、ステップＳ５３に行く。ステップＳ５３では、補
正していない前記比の値ＭＡＸＲを使用して、ＵＶ＝（ＭＡＸＲ−０.４）／０.４なる演算を行う。これは、上記数６の補正式ｂと前記数
４の判定式を組合せた演算式に相当する。

【００５８】ステップＳ５２でＮＯと判断した場合は、
ステップＳ５４に行く。ステップＳ５４では、前記比の
値ＭＡＸＲを上記数６の補正式ａにより補正して、ＵＶ＝［｛ＭＡＸＲ−(ＡＤＳＵＭ−１２）／６４｝−
０.４］／０.４なる演算を行う。これは、上記数６の補正式ａと数４の
判定式を組合せた演算式に相当する。

【００５９】このように、ステップＳ５３又はＳ５４に
より、上記数６の補正式と数４の判定式を組合せた演算
式が実行され、前記比の値ＭＡＸＲの補正が行われると
共に、この補正値ＭＡＸＲ’に基づく有声／無声判定演
算が行われ、有声／無声判定値ＵＶが得られる。また、
続くステップＳ１２〜Ｓ１５の処理により、前述と同様
に、この値ＵＶが１より大又は０より小のとき、それぞ
れ１又は０に設定する処理を行なう。

【００６０】次に、図７，図８の実測例について上記第
３の実施例に従って分析した結果の一例を示す。図８の
ａ〜ｆに示す各フレームＦ１〜Ｆ６毎の自己相関関数に
おける最大極値Ｒkと初期値Ｒ0の比Ｒk／Ｒ0＝ＭＡＸＲ
と、これら各自己相関関数について上述のように演算し
た正規化アブソリュート差分累算値ＡＤＳＵＭ、及びこ
れらを前記数６及び数４の各式に適用して得られた判定
結果ＵＶを示すと、次表のようである。

【００６１】

【表４】

【００６２】なお、上述では、アブソリュート差分累算
値ＡＤＳＵＭを求めるにあたって、自己相関関数Ｒｉに
おける隣接するサンプル値同士の差の絶対値を累算する
ようにしているが、これに限らず、３サンプル毎あるい
は４サンプル毎など所定サンプル数（次数）毎の自己相
関関数値の差の絶対値を累算するようにしてもよい。

【００６３】次に、上述の各実施例に係る方法を実施す
る音声分析システムを音源システムと共に一体的に具備
した電子楽器の一実施例を図１４により説明する。図１
４において、中央処理ユニット（ＣＰＵ）１０，リード
オンリーメモリ（ＲＯＭ）１１，ランダムアクセスメモ
リ（ＲＡＭ）１２を含むマイクロコンピュータの制御に
より各種の処理が実行される。ＲＯＭ１１においては、
上記実施例に示されたような各処理手順を実現するため
のプログラムがストアされている。マイクロフォン１３
によって外部から取り込んだアナログ音声信号がアンプ
１４を介してＡ／Ｄ変換器１５に与えられ、所定のサン
プリングクロックに従ってサンプリングされてディジタ
ル音声波形信号に変換される。このディジタル音声波形
信号は、ＲＡＭ１２にストアされる。ディジタル信号プ
ロセッサ（ＤＳＰ）１６はプログラムされた計算式を高
速で実行するものであり、自己相関関数Ｒｉの演算など
複雑な計算をこのＤＳＰ１６によって行う。以上の構成
により、上記実施例に示されたような有声／無声分析の
ための各処理手順がマイクロコンピュータの制御に基づ
き実行される。分析の結果得られた有声／無声判定値Ｕ
Ｖは、ＣＰＵ１０やＲＡＭ１２等にあるレジスタに適宜
ストアされ、楽音制御のために利用される。

【００６４】パネルスイッチ部１７は、楽音の音色、音
量、音高、効果等を設定、選択、制御するための各種の
スイッチを含むものであり、外部から音声信号を取り込
むことを指示するスイッチや分析の結果得られた有声／
無声判定値ＵＶを楽音制御のために利用することを指示
するスイッチなど音声分析処理に関連する各種スイッチ
類を含んでいてよい。パネルスイッチ部１７はインタフ
ェース１８を介してマイクロコンピュータのバスに接続
されている。発生すべき音階音を指定するための複数の
鍵を具備した鍵盤部１９も、インタフェース２０を介し
てマイクロコンピュータのバスに接続されている。

【００６５】鍵盤部１９で指定された音階音に対応する
ディジタル楽音信号が、楽音信号発生回路２１から発生
され、Ｄ／Ａ変換器２２でアナログ信号に変換されて、
サウンドシステム２３から音響的に発音される。楽音信
号発生回路２１における楽音信号発生方式は、ＰＣＭ波
形メモリ方式やＦＭ方式、ＡＭ方式など公知のどのよう
な方式を用いてもよい。

【００６６】分析の結果得られた有声／無声判定値ＵＶ
は、どのような形態で楽音制御のために利用するように
してもよい。例えば、楽音信号発生回路２１で発生する
楽音信号の音色を制御するために利用する場合、フィル
タの特性を制御したり、波形メモリから読み出す波形の
選択を制御したり、各種補間演算のパラメータを制御し
たりするために、有声／無声判定値ＵＶを利用するよう
にしてよい。有声／無声判定値ＵＶの利用形態はその他
種々あってよいが、ここでは特に詳しく述べない。

【００６７】制御の形態としては、例えば、鍵盤部１９
等で指定した楽音を発音中に、マイクロフォン１３で適
宜の音声を入力し、実時間でその分析を行い、その分析
の結果得られた有声／無声判定値ＵＶに応じて、発音中
の楽音を実時間で制御するようにすることが可能であ
る。その場合に、適当な１フレームだけの分析を行い、
その結果得られた有声／無声判定値ＵＶに応じて楽音を
制御するようにしてもよい。あるいは、適当な複数フレ
ームについて実時間で分析を行い、それぞれの分析結果
に応じて変化する可能性のある有声／無声判定値ＵＶに
応じて楽音を時間的に可変で制御するようにしてもよ
い。

【００６８】上述の各実施例に係る方法を実施する音声
分析システムは単体の音声コントローラとして構成され
ていてもよい。図１５はそのような音声コントローラ２
４の一実施例を示す。図１５において、音声コントロー
ラ２４は、外部から音声信号を取り込むためのマイクロ
フォン２５と、アンプ２６と、Ａ／Ｄ変換器２７と、音
声分析装置２８と、ＭＩＤＩ変換器２９とを含んでい
る。音声分析装置２８は、上述の各実施例に係る方法を
実施する装置であり、上述のような音声分析プログラム
を搭載したマイクロコンピュータとＤＳＰとによって構
成してもよいし、ディスクリート回路によって構成して
もよい。ＭＩＤＩ変換器２９は、分析の結果得られた有
声／無声判定値ＵＶ及びその他必要なデータをＭＩＤＩ
フォーマットに変換して出力する。ＭＩＤＩフォーマッ
トの有声／無声判定値ＵＶ及びその他必要なデータは、
外部の電子楽器３０に与えられ、該電子楽器３０におい
て発生する楽音の制御のために使用される。

【００６９】なお、上記各実施例において、分析の対象
である音声信号の入力の仕方は、マイクロフォンによっ
てサンプリングして入力する例に限らず、データ伝送ラ
インを介してディジタル音声波形データを入力するよう
にしてもよいし、あるいはメモリに記録済みのディジタ
ル音声波形データを適宜読み出すことにより入力するよ
うにしてもよい。

【００７０】また、音声波形信号の自己相関関数の変化
の傾向の分析及び補正の仕方は、上記実施例に示された
ものに限らず、本明細書及び図面から理解及び予測でき
るすべての態様を含む。すなわち、音声波形信号から直
接求めた自己相関関数の初期値Ｒ0と最大極値Ｒkとの比
の値は、特に、無声音領域で不安定であり、無声音領域
での判定の改善が望まれるという発想と、該自己相関関
数の変化の傾向は無声音ほど変化が激しいので、この変
化の激しさを何らかの観点から数値化し、この数値に応
じて、特に無声音領域が区別できるように、該比の値を
補正するという発想により、この発明では、精度のよい
有声／無声判定が期待できるようになっているのであ
る。従って、そのような観点で、自己相関関数の変化の
激しさが計量化できる何らかのファクタを計量・分析す
る演算を行えばよいことになり、そのような計量化・分
析演算とそれに基づく補正演算に係るすべての実施態様
がこの発明の範囲に含まれる。

【００７１】

【発明の効果】以上説明したように、この発明によれ
ば、音声波形信号の自己相関関数を直接求め、これに基
づきラフな有声／無声判定のための関数初期値とその後
の最大極値の比の値を求め、更に、この自己相関関数の
変化の傾向を分析するための所定の演算を行い、この演
算結果に応じて補正値を発生し、この補正値に応じて前
記比の値を補正し、これに基づき有声／無声判定を行う
ようにしたので、変形自己相関関数を求める場合に比べ
て演算を簡単化することができ、しかも補正により確度
の高い有声／無声判定を行うことができるようになる、
という優れた効果を奏する。従って、音声信号を実時間
で分析し、その分析結果に応じて実時間で楽音制御を行
うような場合に最適である。

【図面の簡単な説明】

【図１】この発明に係る音声分析装置で採用する音声
分析方法の一実施例の処理手順を示すフロー図。

【図２】図１における極値数カウント処理ステップの一
具体例を示すフロー図。

【図３】音声波形信号の自己相関関数の初期値と最大極
値の比の値と有声度／無声度との関係の一例をおおまか
な傾向で示すグラフ。

【図４】音声波形信号の自己相関関数における極値数と
有声度／無声度との関係の一例をおおまかな傾向で示す
グラフ。

【図５】男性音声によって「シャ（ｓｈａ）」と発音し
た場合の音声波形例を示す図。

【図６】図５の音声波形に基づき求めたいくつかのフレ
ームにおける自己相関関数を示す関数波形図。

【図７】女性音声によって「チ（ｃｈｉ）」と発音した
場合の音声波形例を示す図。

【図８】図７の音声波形に基づき求めたいくつかのフレ
ームにおける自己相関関数を示す関数波形図。

【図９】この発明に従う音声分析方法の別の実施例の処
理手順を示すフロー図。

【図１０】図９におけるローカルピーク差分累算値を求
める処理ステップの一具体例を示すフロー図。

【図１１】音声波形信号の自己相関関数におけるローカ
ルピーク差分累算値と有声度／無声度との関係の一例を
おおまかな傾向で示すグラフ。

【図１２】この発明に従う音声分析方法の更に別の実施
例の処理手順を示すフロー図。

【図１３】音声波形信号の自己相関関数におけるアブソ
リュート差分累算値と有声度／無声度との関係の一例を
おおまかな傾向で示すグラフ。

【図１４】この発明に従う音声分析方法を実施する音声
分析システムを音源システムと共に一体的に具備した電
子楽器の一実施例を示すブロック図。

【図１５】この発明に従う音声分析方法を実施する音声
分析システムを単体の音声コントローラとして構成した
一実施例を示すブロック図。

【符号の説明】

１０…中央処理ユニット（ＣＰＵ）、１１…リードオン
リーメモリ（ＲＯＭ）、１２…ランダムアクセスメモリ
（ＲＡＭ）、１３…マイクロフォン、１６…ディジタル
信号プロセッサ（ＤＳＰ）、１７…パネルスイッチ部、
１９…鍵盤部、２１…楽音信号発生回路、２４…音声コ
ントローラ、２８…音声分析装置。

フロントページの続き (58)調査した分野(Int.Cl.⁶，ＤＢ名) G10L 9/08 G10L 9/00

Claims

(57)【特許請求の範囲】

【請求項１】第１から第７の処理を行う音声分析装置
であって、第１の処理（Ｓ４）は、フレーム音声波形信号を入力
し、第２の処理（Ｓ５）は、入力されたフレーム音声波形信
号の自己相関関数を計算し、第３の処理（Ｓ６）は、第２の処理で計算した自己相関
関数の初期サンプル値（Ｒ0）とその後の最大極値（Ｒ
k）を抽出し、第４の処理（Ｓ７）は、初期サンプル値（Ｒ0）に対す
る最大極値（Ｒk）の比（ＭＡＸＲ）を計算し、第５の処理（Ｓ８，Ｓ１６，Ｓ５１）は、第２の処理で
計算した自己相関関数の変化の大きさあるいは激しさを
示す補正値（ＬＰＣＴ，ＬＰＤＳＵＭ，ＡＤＳＵＭ）を
算出し、第６の処理（Ｓ９〜Ｓ１１，Ｓ１７〜Ｓ１９，Ｓ５２〜
Ｓ５４）は、第５の処理で出力した補正値（ＬＰＣＴ，
ＬＰＤＳＵＭ，ＡＤＳＵＭ）に基づき第４の処理で計算
した比（ＭＡＸＲ）を補正して補正比を計算すると共
に、この補正比に基づき有声／無声判定値（ＵＶ）を算
出し、第７の処理（Ｓ１２〜Ｓ１５）は、有声／無声判定値
（ＵＶ）に基づき有声／無声判定を行う音声分析装置。
【請求項２】第５の処理（Ｓ８）は、第２の処理で計
算した自己相関関数の極値の数を計算することで補正値
（ＬＰＣＴ）を算出する請求項１に記載の音声分析装
置。
【請求項３】第２の処理で計算した自己相関関数の隣
接するサンプルの差が符号変化したときのカウント数を
計算することで前記極値の数を計算する請求項２に記載
の音声分析装置。
【請求項４】第５の処理（Ｓ１６）は、第２の処理で
計算した自己相関関数の隣接する極大値と極小値の差の
絶対値を累積することで補正値（ＬＰＤＳＵＭ）を算出
する請求項１に記載の音声分析装置。
【請求項５】第５の処理（Ｓ５１）は、第２の処理で
計算した自己相関関数の所定サンプル毎のサンプル値の
差の絶対値を累積することで補正値（ＡＤＳＵＭ）を算
出する請求項１に記載の音声分析装置。