JPS597120B2

JPS597120B2 - 音声分析装置

Info

Publication number: JPS597120B2
Application number: JP53145084A
Authority: JP
Inventors: 哲田口
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1978-11-24
Filing date: 1978-11-24
Publication date: 1984-02-16
Also published as: CA1127765A; US4282405A; JPS5570900A

Description

【発明の詳細な説明】５本発明は音声の自己相関係数列の最大値を検索する
ことによりピッチ周期を計測する、特に有声音立上り部
分において優れたピッチ抽出特性を有する音声分析装置
に係る。

音声のピッチ周期情報及び有声無声判別情報は、０音
声分析合成系等において極めて重要な情報であり、これ
らの情報の分析結果が合成側における合成音声の音質に
多大な影響を与える。

音声のピッチ周期を精密に計測する方法として、音声波
形の自己相関係数列を計測し、前記自己相フ関係数列
の最大値（以下ρＭＡＸと云う）を検索しρＭＡＸに対
応する自己相関係数の遅れ時間をピッチ周期とする方法
が知られている。

又、前記ρＭＡＸは有声無声判別における有力なパラメ
ータとして使用されて（・る。フ従来、音声の自己相
関係数を計測する場合に゜よ、次式が広く用いられてい
る。

ゞ −１Ｎ−１ Σ Ｘｉ２）・（ Σ ｘｌ２＋τ）ｉ■ ０ｉ＝０Ｘｉは第ｉ番目の標本化音声、Ｘｉ＋τはＸｉからτだ
け遅れた標本化音声である。

音声のピツチ周期のほとんどは２ｍＳＥＣから１８ｍＳ
ＥＣ程度の範囲に分布することが知られている。上記の
式においてＮは最大ピツチ周期（例えば１８ｍＳＥＣ）
程度に相当するサンプル数に設定されることが多い。従
つてＸ。とＸｉ＋τとの最大時間間隔は例えば３６ｍＳ
ＥＣ程度となる。従来の音声の自己相関係数を計測する
方法によるピツチ抽出方法は有声音定常部等の比較的に
長時間にわたり音声波形の周期性が保障され得る場合に
は極めて安定にピツチ周期を計測し得る。

しかしながら従来の音声の自己相関係数を計測する方法
は、無声音部から有声音部への渡り区間、もしくは前記
渡り区間直後の有声音の立上り部分においては音声波形
の周期性が弱く、ピツチ周期の計測結果が不精密となる
ことが多い。本発明の目的は、無声音部から有声音部へ
の渡り区間、もしくは前記渡り区間直後の有声音の立上
り部分等において、正確にピツチ周期を計測し得るピツ
チ抽出装置を提供することにある。

本発明は、少なくとも時間的に前向きに計測される自己
相関係数列と時間的に後向きに計測される自己相関係数
列とのどちらの自己相関係数列をも計測する手段を有し
、更に前記２つの自己相関係数列のうちのどちらの自己
相関係数列をピツチ周期の計測を行なうためのパラメー
タとして用いるかを判断するために、音声の電力増加率
が一定値以上であるか否かを判別する手段、もしくは前
記２つの自己相関係数列から別々に計測される２つのρ
ＭＡＸの大小関係を比較する手段を有している。本発明
の特徴は時間的に前向きに計測される自己相関係数列と
時間的に後向きに計測される自己相関係数列との２つの
自己相関係数列を用いてピツチ抽出を行なうことにある
。

次に本発明の実施例を図面を参照して詳細に説明する。

第１図は第１の実施例を詳細に説明するためのプロツク
図である。

波形入力端子１０１を介して標本化音声波形列が電力増
加率計測器１０２と一時記憶１０３とべ供給される。電
力増加率計測器１０２は音声の電力増加率を計測し、前
記電力増加率が予め設定された値以上である場合には自
己相関係数計測制御信号を例えば１にし、前記電力増加
率が予め設定された値未満である場合には自己相関係数
計測制御信号を例えばＯにする。更に電力増加率計測器
１０２は前記自己相関係数計測制御信号を制御信号伝送
路１０４を介して自己相関係数計測器１０６へ供給する
。次に他のプロツク図を参照して電力増加率計測器１０
２を更に詳細に説明する。

第２図は電力増加率計測器１０２を更に詳細に説明する
ためのプロツク図である。第２図に於いて、一点鎖線２
０１で囲まれた部分は電力増加率計測器１０２の構成範
囲を示す。波形入力端子１０１を介して標本化音声波形
列が一時記憶器２０２へ供給される。

一時記憶器２０２は前記標本化音声波形列を一時的に記
憶し、フレーム周期信号発生器２０３から供給されるフ
レーム信号により前記標本化音声波形列を電力計測器２
０４へ出力する。電力計測器２０４は一時記憶器２０２
から供給されるフレーム周期毎に切出される標本化音声
信号の電力を計測し計測結果を電力記憶器２０５と電力
増加率判別器２０６とへ前記計測結果を出力する。電力
記憶器２０５は電力計測器２０４により計測された電力
値を一時的に記憶し、フレーム周期信号発生器２０３か
ら供給されるフレーム信号により前記計測値を電力増加
率判別器２０６へ出力する。電力増加率判別器２０６は
電力計測器２０４から供給される現在のフレームの電力
値（以下電力１と云う）と電力記憶器２０５から供給さ
れる直前のフレームの電力値（以下電力２と云う）とか
ら自己相関係数計測制御信号Ｓｃを次式により決定する
。

但しａは零又は正の定数である。更に電力増加率判別器
２０６は決定された自己相関係数計測制御信号を制御信
号伝送路１０４へ出力する。再び第１図に戻つて第１の
実施例の説明を継続する。

一時記憶器１０３は波形入力端子１０１を介して供給さ
れる標本化音声波形列を一時的に記憶し、前記標本化音
声波形列を周期的に切出し、更に前記切出された標本化
音声波形列を波形伝送路１０５へ出力する。自己相関係
数計測器１０６は制御信号伝送路１０４を介して供給さ
れる自己相関係数計測制御信号がＯである場合には、波
形を用いて計測する。但しτは遅れ時間、ＸＮ−１−１
は第Ｎ−１−１番目の標本化音声、ＸＮ−１−１−τは
ＸＮ−，−１からτだけ進んだ標本化音声である。更に
自己相関係数計測器１０６は計測した自己相関係数列を
最大値検索器１０７へ出力する。最大値検索器１０７は
自己相関係数計測器１０６より供給された自己相関係数
列より最大値ρＭＡＸを検索し、前記ρＭＡＸをρＭＡ
Ｘ端子１０９へ出力する。更に最大値検索器１０７は前
記ρＭＡＸに対応する遅れ時間Ｔをピツチ同期としてピ
ツチ周期出力端子１０８へ出力する。なお、第１の実施
例はρＭＡＸ出力端子１０９を削除しても構成し得る。

次に第１の実施例における自己相関係数計測器１０６に
より計測される自己相関係数列の性質について波形図を
参照しながら詳細に説明する。

第３図は音声波形の一例であり、無声音と有声音との過
渡的な状態における模形化された音声波形図である。第
３図に於いて３０１は音声波形、３０２は直前の分析フ
レーム、３０３は現在の分析フレームである。

今、直前の分析フレーム３０２における平均電力に対し
、現在の分析フレーム３０３における平均電力の増加率
が予じめ設定された増加率を越えていると仮定する。現
在の分析フレーム３０３に於いては自己相関係数は時間
的に後向きに計測され、その計測結果は例えば第４図ａ
中の４０１になる。現在の分析フレーム３０３に於いて
仮に自己相関係数を時間的に前向きに計測すると、※伝
送路１０５を介して供給される標本化音声波形列から時
間的に前向きに自己相関係数ρ（τ）を例えば次式を用
いて計測する。

値しτは遅れ時間、Ｘｉは第ｉ番目の標本化音声、Ｘｉ
＋τはＸｉからτだけ遅れた標本化音声である。又、自
己相関係数計測器１０６は前記自己相関係数計測制御信
号が１である場合には波形伝送路１０５を介して供給さ
れる標本化音声波形列から時間的に後向きに自己相関係
数ρ（τ）を例えば次式し、前記切出された波形列を第
１自己相関計測器６０３と第２自己相関計測器６０４と
へ出力する。

第１自己相関計測器６０３は切出された波形列から時間
的に前向きに自己相関係図を計測し、更に前記自己相関
係数の最大値ρＭＡＸｌを検索し、前記ρＭＡＸｌに対
応する遅れ時間をピツチ周期候補１と決定する。更に第
１自己相関計測器６０３は前記ρＭＡＸｌをρＭＡＸｌ
伝送路６０５へ、前記ピツチ周期候補１をピツチ周期候
補１伝送路６０６へ出力する。第２自己相関計測器６０
４は一時記憶器６０２により切出された波形列から時間
的に後向きに自己相関係数を計測し、前記第１自己相関
計測器６０３と同様の動作により自己相関係数の最大値
ρＭＡＸ２をρＭＡＸ２伝送路６０７へ、ピツチ周期候
補２をピツチ周期候補２伝送路６０８へ出力する。

比較器６０９はρＭＡＸｌ伝送路６０５を介して供給さ
れるρＭＡＸｌとρＭＡＸ２伝送路６０７を介して供給
される。

ρＭＡＸ２との大小関係を比較し、ρＭＡＸｌ〉ρＭＡ
Ｘ２ならばρＭＡＸ＝ρＭＡＸｌと決定し）ρＭＡＸｌ
くρＭＡＸ２ならばρＭＡＸ一ρＭＡＸ２と決定し、前
記決定されたρＭＡＸをρＭＡＸ出力端子６１３へ出力
する。更に比較器６０９はρＭＡＸｌ〉ρＭＡＸ２なら
ば切換信号を０ＦＦとし、ρＭＡＸｌくρＭＡＸ２なら
ば切換信号を０Ｎと決定し、前記切換信号を切換信号伝
送路６１０へ出力する。切換器６１１は切換信号伝送路
６１０を介して供給される切換信号が０ＦＦであればピ
ツチ周期候補１伝送路６０６をピツチ周期出力端子６１
２へ接続し、前記切換信号が０Ｎであればピツチ周期候
補２伝送路６０８をピッチ周期出力端子６１２へ接続す
る。この第３の実施例は例えば第３図における３０３の
入力波形列に対し第１の発明と同様に、より明確にピツ
チ周期を抽出し得ることは明らかである。

なお第３の発明はρＭＡＸ出力端子６１３を削除しても
構成し得る。第７図は第４の実施例を詳細に説明するた
めのプロツク図である。

第７図において７０１は第３の発明によるピツチ抽出装
置全体であり、６１３はρＭＡＸ出力端子である。波形
入力端子６０１を介して標本化音声波形列がピツチ抽出
装置７０１へ供給される。ピツチ抽出装置７０１は供給
された標本化音声波形列から自己相関係数の最大値ρＭ
ＡＸを計測し、計測結果をρＭＡＸ出力端子６１３を介
して有声無声判別器７０２へ出力する。有声無声判別器
７０２は前記ρＭＡＸから有声か無声かを決定し、決定
結果を有声無声判別信号出力端子７０３へ出力する。尚
、上述した無声音部から有声音部への渡り区間、もしく
は前記渡り区間直後の有声音の立上り部分等において、
ρＭＡＸを適宜に前向きもしくは後向きに計測しピツチ
周期を計測し、あるいは更に前記ρＭＡＸを用いて有声
無声を判別することにより、従来の方法と比較して、ピ
ツチ周期計測精度もしくは有声無声判別率が大きく改善
されることが確認されている。

例えば英語を母国語とする男声話者が発声した英語文章
による本発明者の実測データによれば、音声の電力増加
率が０．６ｄＢ／ＭＳＥＣ以上の場合にはρＭＡＸを時
間的に後向きに０．６ｄＢ／ＭＳＥＣ未満の場合にはρ
ＭＡＸを時間的に前向きに計測しピツチ周期を計測し、
更に前記ρＭＡＸを用いて有声無声を判別すると、無声
音部から有声音部への渡り区間および前記渡り区間直後
の有声音の立上り部分におけるピツチ周期計測誤りと有
声無声判別誤りとが、従来の方法と比較して、それぞれ
５５％から１９％へ（ピツチ周期の場合）、２０％から
１．５％へ（有声無声判別の場合）減少することが確認
された。また、音声の電力増加率が０ｄＢ／ＭＳＥＣ以
上の場合、つまり音声の電力が増加中の場合には、ρＭ
ＡＸを時間的に後向きに、０ｄＢ／ＭＳＥＣ未満の場合
、つまり音声の電力が減少中の場合にはρＭＡＸを時間
的に前向きに計測しピツチ周期を計測し、更に前記ρＭ
ＡＸを用いて有声無声を判別すると、上記電力増加率の
しきい値を０．６ｄＢ／ＭＳＥＣとしたときとほぼ用等
の効果があることが別途確認された。

なお電力が増加中の場合には時間的に後向きに計測され
たρＭＡＸは時間的に前向きに計測されたρＭＡＸより
殆んどの場合に大きな値を示し、電力が減少中の場合に
は時間的に前向きに計測されたρＭＡＸは時間的に後向
きに計測されたρＭＡＸより殆んどの場合に大きな値を
示すことが経験的に知られている。以上述べた様に本発
明は特に無声音と有声音との過渡部等に於いて正確にピ
ツチ周期を抽出し得るという第１の効果があり、前記過
渡部をより有声に有利に判別する。通常有声音と無声音
との混合波形は、有声音として取扱う場合には無声音と
して取扱かう場合と比較して音声分析合成等において良
好な合成音が得られる。従つて本発明は例えば音声分析
合成等に適用することにより、より良好な合成音声を得
ることができるという第２の効果がある。

【図面の簡単な説明】

第１図、第５図、第６図および第７図は本発明の実施例
を示すプロツク図、第２図は電力増加率計測器のプロツ
ク図、第３図および第４図Ａ，ｂは本発明の実施例を説
明するための波形図である。１０２・・・・・・電力増加率計測器、１０３，２０２
，６０２・・・・・・一時記憶器、１０４・・・・・・
制御信号伝送路、１０５・・・・・・波形伝送路、１０
６・・・・・伯己相関係数計測器、１０７・・・・・・
最大値検索器、１０８・・・・・・ピツチ周期出力端子
、１０９・・・・・・ρＭＡＸ出力端子、２０３・・・
・・・フレーム周期信号発生器、２０４・・・・・・電
力計測器、２０５・・・・・・電力記憶器、２０６・・
・・・・電力増加率判別器、３０１・・・・・・音声波
形、３０２・・・・・・直前の分析フレーム、３０３・
・・・・・現在の分析フレーム、４０１・・・・・・時
間的に後向きに計測された自己相関係数列、４０２・・
・・・・時間的に前向きに計測された自己相関係数列、
５０１，７０１・・・・・・ピツチ抽出装置、５０２，
７０２・・・・・・有声無声判別器、６０３・・・・・
・第１自己相関計測器、６０４・・・・・・第２自己相
関計測器、６０９・・・・・・比較器、６１１・・・・
・・切換器。

Claims

【特許請求の範囲】１音声波形を所定の時間間隔でサンプリングする手段
と、このサンプリングされた音声波形の電力を計測する
手段と、この計測された電力の増加率を計測する手段と
、前記サンプリングされた音声波形から自己相関係数列
を時間的に前向きに計測する第１の計測手段と、前記サ
ンプリングされた音声波形から自己相関係数列を時間的
に後向きに計測する第２の計測手段と、前記電力の増加
率が予め定めた値以上であるときには前記第２の計測手
段の出力を、前記電力の増加率が予め定めた値以下であ
るときには前記第１の計測手段の出力を取り出す手段と
、この手段の出力から得られる自己相関係数列の最大値
となる遅れ時間からピッチ周期を計測する手段を備えて
成ることを特徴とする音声分析装置。２音声波形を所定の時間間隔でサンプリングするサン
プリング手段と、このサンプリングされた音声波形から
自己相関係数列を時間的に前向きに計測する第１の計測
手段と、前記サンプリングされた音声波形から自己相関
係数列を時間的に後向きに計測する第２の計測手段と、
前記第１の計測手段から前記係数列の最大値を検索し、
この最大値に対応する遅れ時間を第１のピッチ周期候補
として出力する第１のピッチ周期出力手段と、前記第２
の計測手段から前記係数列の最大値を検索し、この最大
値に対応する遅れ時間を第２のピッチ周期候補として出
力する第２のピッチ周期出力手段と、前記第１のピッチ
周期候補と第２のピッチ周期候補を比較し大きい方のピ
ッチ周期候補をピッチ周期として出力する手段を備えて
成ることを特徴とする音声分析装置。