JPH0636154B2 - 音声コ−ド変換器 - Google Patents

音声コ−ド変換器

Info

Publication number
JPH0636154B2
JPH0636154B2 JP61148415A JP14841586A JPH0636154B2 JP H0636154 B2 JPH0636154 B2 JP H0636154B2 JP 61148415 A JP61148415 A JP 61148415A JP 14841586 A JP14841586 A JP 14841586A JP H0636154 B2 JPH0636154 B2 JP H0636154B2
Authority
JP
Japan
Prior art keywords
pitch
extraction
voice
extracting
extracting means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61148415A
Other languages
English (en)
Other versions
JPS635400A (ja
Inventor
寛治 国澤
博 糸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP61148415A priority Critical patent/JPH0636154B2/ja
Publication of JPS635400A publication Critical patent/JPS635400A/ja
Publication of JPH0636154B2 publication Critical patent/JPH0636154B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [技術分野] 本発明は、音声のみまたは音声と文字列からその音声の
圧縮コードを作成する音声コード変換器に関するもので
ある。
[背景技術] 従来、この種の音声コード変換器Aとしては、第8図に
示すように、音声のみまたは音声と文字系列を入力と
し、その文字系列と音声中に含まれる韻律情報を自動的
にコード化し、そのコードをバーコード化したり、メモ
リに格納するようにしたものがあり、コード音声変換器
Bでは、バーコードあるいはメモリからそのコードの読
み取って音声合成器により、随時音声合成を行って原音
声を再生するようになっている。
ところで、上記音声コード変換器Aのコード作成方法と
しては、発明者等が提案している方法(特願昭60−1
38517号)がある。第9図はこの方法を用いた音声
コード変換器Aを示しており、入力される音声または音
声と文字列からその音声の各母音が何であるかを同定で
きるようなセグメンテーションを行うセグメンテーショ
ン手段1と、音韻長を抽出する音韻長抽出手段2と、母
音の重心ピッチを抽出する重心ピッチ抽出手段3と、抽
出された音韻長、重心ピッチおよび文字列データとに基
いて圧縮コードを生成するコード化手段4とで形成され
ており、第10図はコード変換手順を示すフローチャー
トを示している。
この方法は、全体として原音声の再現度をなるべく落と
さずに情報量(コード長)を極端に少なくすることがで
きるようにしたものであり、そのために文字列のみから
音声合成を行う規則合成技術を利用している。なお、規
則合成においては、文字列から韻律情報を自動的に生成
するようになっているが、この方法では、韻律情報を原
音声から抽出することで圧縮率の非常に高い情報を得る
ようにしている。この場合、韻律情報として最も重要な
ものは、イントネーション、アクセントであり、日本語
の場合にはこれらに対してピッチ周波数が支配的要因と
なっている。
ここに、音声合成時のピッチ周波数の与える方法として
は、各母音の重心位置のピッチ(点ピッチ)を与え、そ
の他の点についてはそれらを直線補間したものとして各
点のピッチを与える方法(「文音声合成における音調規
則」電子通信学会論文誌’80/9 Vol.J63−D
NO.9 P715〜721)が良く用いられるが、そのために
は、圧縮コードの作成時に各母音の重心のピッチを求め
ることが必要となる。その他の方法として臨界制動モデ
ルを用いる方法(「複文の基本周波数パターンの分析と
合成」日本音響学会音声研究会資料 S82-40(October 2
5,1982))があるが、この方法においては、かなり高い品
質が得られるが、1点のピッチを求めるためには一般に
かなりの時間を要するなどのことを考えると、各母音の
重心のピッチからピッチパターンを指数関数近似する方
法が有効であると考えられるが、この方法を用いる場合
でも、圧縮コードを作成する第1段階として各母音の重
心のピッチを求めることになる。
ところで、ピッチを求めることは古くて新しいテーマで
あり、ピッチ抽出法としては波形処理、相関処理、スペ
クトル処理などの各種方法があるが、決定的な方法はま
だ確立されていない。また、自己相関法、波形相関法、
ケプストラム法などはピッチ抽出精度は高いものの、自
己相関やフーリエ変換の計算が必要であり、ピッチ抽出
に時間を要し、一般に精度の高いピッチ抽出法は複雑な
計算を要するものである。
通常の音声の分析合成系では、各点(音声を10〜20
msec毎に分割した各区間)に対するピッチを求める必要
があるが、発明者等が提案している音声コード変換方法
では、各母音の重心のみのピッチを求めるようにしてい
るので、通常の場合よりも以下の点で有利と考えられ
る。
[1]各母音の重心位置、音節長などの韻律情報に関す
るパラメータを抽出するために音声のセグメンテーショ
ンが必要であり、そのためにピッチを求める点の音韻
(母音)が何であるかがピッチを求める際に分かってい
る。
[2]ピッチを求める点が母音の重心であるので、一般
に定常的で安定な波形に対してピッチを求めれば良い。
しかしながら、このような従来例においては、母音の重
心ピッチを求める際、高い抽出精度が得られると考えら
れている自己相関法によるピッチ抽出手段を用いていた
ので、演算量が多くなって音声を入力してから圧縮コー
ドが作成されるまでに要する時間が長くなってかかり、
人間の許容範囲を越えてしまうという問題があった。一
方、演算時間を短くするために抽出精度が低いと考えら
れているピークピッキング法などによるピッチ抽出手段
を用いれば、原音声に忠実な合成音が得られないという
問題があり、また、高速演算処置装置を用いれば、コス
トが高くなって実用的でなくなるという問題があった。
[発明の目的] 本発明は上記の点に鑑みて為されたものであり、その目
的とするところは、各母音の重心ピッチを求める際に、
精度を落とすことなく演算処理を簡略化することがで
き、コストが安く実用的な音声コード変換器を提供する
ことにある。
[発明の開示] (実施例1) 第1図は本発明一実施例を示すもので、入力される音声
または音声と文字列からその音声の各母音が何であるか
を同定できるようなセグメンテーションを行うセグメン
テーション手段1と、音韻長を抽出する音韻長抽出手段
2と、母音の重心ピッチを抽出する重心ピッチ抽出手段
3と、抽出された音韻長および重心ピッチと文字列とに
基いて圧縮コードを生成するコード化手段4とよりなる
従来例と同様の音声コード変換器において、ピークピッ
キング法による第1のピッチ抽出手段5と、自己相関法
による第2のピッチ抽出手段6と、両抽出手段5,6を
制御する抽出制御手段7とで重心ピッチ抽出手段3を構
成し、母音/i/と/u/に対しては第1のピッチ抽出手段5
を用いて重心ピッチ抽出を行うとともに、母音/a/、/e/、
/o/に対しては第2のピッチ抽出手段6を用いて重心ピ
ッチ抽出を行うように抽出制御手段7を形成したもので
ある。
以下、実施例の動作について説明する。いま、この種の
音声コード変換器Aにおけるピッチ抽出は母音の重心に
対して行うようになっており、各母音/a/、/i/、/u/、/e/、
/o/の波形は第2図に示すようになっている。ここに、
これらの波形を見ると、/i/と/u/については、適当なロ
ーパスフィルタ(例えば1/(1-aZ-1)の特性を有するフ
ィルタ)を通して波形を滑らかにすれば、ピークピッキ
ング法でも正確なピッチが求められると考えられる。そ
こで、実施例においては、第3図のフローチャートに示
すように、ローパスフィルタリングされた信号の母音が
何であるかをセグメンテーション手段1にて同定し、/i
/または/u/である場合には、ピークピッキング法を用い
た第1のピッチ抽出手段5によってピッチ抽出を行って
いる。なお、第2図に示すように、/i/と/u/の1ピッチ
分は大きな山と、少し小さな山とで構成されていると考
えられ、小さな山をピークとして捕らえてしまうことも
あり得ると思われるが、1ピッチ分に相当する2つの大
きな山をピークとして捕らえた場合にはその中点(小さ
な山の中に含まれている)の値は2つのピークと同符号
になり、大きな山と小さな山を1ピッチ分に相当するピ
ークとして捕らえた場合にはその中点の値は2つのピー
クと異符号となるので、このことを利用して正確にピッ
チが求められる。第4図(a)(b)は上記動作を示す動作説
明図であり、同図(a)は(t1+t2)/2の値が第1のピーク
と同符号の場合、同図(b)は異符号の場合を示してお
り、第5図はピッチ抽出手順を示すフローチャートであ
る。
また、ローパスフィルタを通して波形を滑らかにする
と、余分なピークがなくなるので、ピークピッキングが
容易になるが、山がなだらかになるために捕らえたピー
クの位置がピッチ抽出のために妥当な点とはならない場
合がある。これに対して実施例では、以下の対策がとら
れている。すなわち、第6図に示すように、見つけたピ
ーク点(t1,y1)の前後を見てそのピーク値y1に適当な比
率αを乗じた値αy1をしきい値として設定し、そのしき
い値以上である部分の左端(t11,αy1)と右端(t12,αy1)
を求め、その中点(t11+t12)/2を改めてピーク点と考
えてピッチを求めるようにしている。
一方、母音がセグメンテーション手段1にて/a/、/e/、/o
/であると同定された場合には、ピークピッキング法で
は抽出精度が低くなって誤ったピッチが得られる可能性
が少し高いと考えられるので、抽出制御手段7は、自己
相関法を用いた第2のピッチ抽出手段6にて重心ピッチ
の抽出を行うようになっている。この自己相関法による
ピッチ抽出は、求める点が母音の重心であり、定常的に
安定した波形と考えた場合には、高い精度でピッチ抽出
が行えることになる。
以上のように、本実施例においては、ピークピッキング
法による第1のピッチ抽出手段5と、自己相関法による
第2のピッチ抽出手段6と、両抽出手段5,6を制御す
る抽出制御手段7とで重心ピッチ抽出手段3を構成し、
母音/i/と/u/に対しては第1のピッチ抽出手段5を用い
て重心ピッチ抽出を行うとともに、母音/a/、/e/、/o/に
対しては第2のピッチ抽出手段6を用いて重心ピッチ抽
出を行うように抽出制御手段7を形成したので、各母音
の重心ピッチを求める際に、必要な場合(/a/,/e/,/o/
の場合)にのみ抽出精度の高い第2のピッチ抽出手段6
を動作させているので、常時第2のピッチ抽出手段6を
動作させた場合に比較して精度を落とすことなく演算処
理を簡略化することができ、しかも、高速演算装置を用
いる必要がなく、コストが安く実用的な音声コード変換
器を提供することができるようになっている。
(実施例2) 第7図は併合発明の動作を示すフローチャートであり、
実施例1と同様の音声コード変換器Aにおいて、母音の
ピッチ抽出を行う際に、第1図のピッチ抽出手段5を動
作させてピークピッキング法によりピッチを求めるとと
もに、そのピッチ値に対する自己相関を求め、その相関
値が所定値よりも小さいときに第2のピッチ抽出手段6
を動作させて自己相関法により再度ピッチを求めるよう
に抽出制御手段7を形成したものである。
いま、実施例にあっては、母音の重心ピッチを抽出する
場合において、まず最初にローパスフィルタリングが行
われた音声信号を第1のピッチ抽出手段に入力してピー
クピッキング法によるピッチ抽出を行う。この方法によ
るピッチ抽出では、誤りを起こしている場合があると考
えられるので、誤りが発生しているかどうかの評価を行
う必要があり、実施例では評価のための関数として正規
化した自己相関 (X[n]:ローパスフィルタリングされた音声波形) を用い、この相関値Rが所定値Rth(例えば0.8)よ
りも大きい場合には、抽出されたピッチ値は信頼性の高
い値であると見なし、相関値Rが所定値Rthよりも小さ
い場合には信頼性の低いピッチ値であると見なして、低
い場合には第2のピッチ抽出手段6を動作させて再度ピ
ッチ抽出を行い、より信頼性の高いピッチ値を得るよう
にしている。なお、波形が安定している母音の重心でピ
ッチ抽出を行っているので、自己相関法によるピッチ抽
出で十分高精度のピッチ値が得られていると考えられる
が、さらに高い抽出精度が得られる変形相関法を用いて
も良いことは言うまでもない。
以上のように、本実施例は、実施例1ではピークピッキ
ング法によるピッチ抽出を行っていなかった母音/a/,/e
/,/o/についても、波形が安定している母音の重心にお
けるピッチ抽出の場合には、殆どの場合においてピッチ
が確実に求められる(実験によって確認されている)こ
とに着目して、まず最初にピークピッキング法によって
ピッチ抽出を行い、その抽出結果の信頼性を自己相関に
より判定して、信頼性が低いと考えられる場合にのみ自
己相関法による高精度のピッチ抽出を行わせるようにし
たものであり、必要な場合(相関値Rが所定値Rthより
も小さい場合)にのみ抽出精度の高い第2のピッチ抽出
手段6を動作させているので、抽出精度を落とすことな
く演算処理を簡略化することができ、しかも高速演算装
置を用いる必要がなく、コストを安くできるようになっ
ている。
[発明の効果] 上述のように特定発明は、入力された音声または音声と
文字列からその音声の各母音が何であるかを同定できる
ようなセグメンテーションを行うセグメンテーション手
段と、音韻長を抽出する音韻長抽出手段と、母音の重心
ピッチを抽出する重心ピッチ抽出手段と、抽出された音
韻長および重心ピッチと文字列とに基いて圧縮コードを
生成するコード化手段とによりなる音声コード変換器に
おいて、ピークピッキング法による第1のピッチ抽出手
段と、自己相関法による第2のピッチ抽出手段と、両抽
出手段を制御する抽出制御手段とで重心ピッチ抽出手段
を構成し、母音/i/と/u/に対しては第1のピッチ抽出手
段を用いて重心ピッチ抽出を行うとともに、母音/a/、/e
/、/o/に対しては第2のピッチ抽出手段を用いて重心ピ
ッチ抽出を行うように抽出制御手段を形成したものであ
り、また、併合発明は、母音のピッチ抽出を行う際に、
第1のピッチ抽出手段を動作させてピークピッキング法
によりピッチを求めるとともに、そのピッチ値に対する
自己相関を求め、その相関値が所定値よりも小さいとき
に第2のピッチ抽出手段を動作させて自己相関法により
再度ピッチを求めるように抽出制御手段を形成したもの
であり、音声の各区間について全体のピッチを求めるも
のではなく、母音の重心のみのピッチを求めることを前
提構成としており、この前提構成を採用することによっ
て、抽出精度は低いが演算時間の短いピークピッキング
法を一部に適用できるようにし、かつピークピッキング
法では抽出精度の不十分な場合にのみ抽出精度の高い自
己相関法を適用するようにしてある。ここで、自己相関
法は演算量が比較的多いとう欠点を有してしるが、母音
の重心ピッチのみを求めるという前提構成で演算時間が
短縮されており、しかも本願各発明では、自己相関法を
適用する必要がない場合には演算量の少ないピークピッ
キング法を適用することで、演算時間を一層短縮するこ
とができるという効果を奏するのである。結局、本願の
各発明では上記構成を採用していることで、対象とする
音声のコード化にあたって、自己相関法のみを採用する
場合に比較して精度を落とすことなく大幅に演算量を低
減することができ、高速演算装置を用いずに、コード変
換時間を実用に耐える程度の長さとし、コストが安く実
用的な音声コード変換器を提供できるという効果があ
る。
【図面の簡単な説明】
第1図は本発明一実施例の概略構成を示すブロック図、
第2図乃至第6図は同上の動作説明図、第7図は他の実
施例の動作説明図、第8図は従来例の概略構成を示すブ
ロック図、第9図および第10図は同上の動作説明図で
ある。 1はセグメンテーション手段、2は音韻長抽出手段、3
は重心ピッチ抽出手段、4はコード化手段、5,6はピ
ッチ抽出手段、7は抽出制御手段である。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力される音声または音声と文字列からそ
    の音声の各母音が何であるかを同定できるようなセグメ
    ンテーションを行うセグメンテーション手段と、音韻長
    を抽出する音韻長抽出手段と、母音の重心ピッチを抽出
    する重心ピッチ抽出手段と、抽出された音韻長および重
    心ピッチと文字列とに基いて圧縮コードを生成するコー
    ド化手段とよりなる音声コード変換器において、ピーク
    ピッキング法による第1のピッチ抽出手段と、自己相関
    法による第2のピッチ抽出手段と、両抽出手段を制御す
    る抽出制御手段とで重心ピッチ抽出手段を構成し、母音
    /i/と/u/に対しては第1のピッチ抽出手段を用いて重心
    ピッチ抽出を行うとともに、母音/a/、/e/、/o/に対して
    は第2のピッチ抽出手段を用いて重心ピッチ抽出を行う
    ように抽出制御手段を形成したことを特徴とする音声コ
    ード変換器。
  2. 【請求項2】入力される音声または音声と文字列からそ
    の音声の各母音が何であるかを同定できるようなセグメ
    ンテーションを行うセグメンテーション手段と、音韻長
    を抽出する音韻長抽出手段と、母音の重心ピッチを抽出
    する重心ピッチ抽出手段と、抽出された音韻長および重
    心ピッチと文字列とに基いて圧縮コードを生成するコー
    ド化手段とよりなる音声コード変換器において、ピーク
    ピッキング法による第1のピッチ抽出手段と、自己相関
    法による第2のピッチ抽出手段と、両抽出手段を制御す
    る抽出制御手段とで重心ピッチ抽出手段を構成し、母音
    のピッチ抽出を行う際に、第1のピッチ抽出手段を動作
    させてピークピッキング法によりピッチを求めるととも
    に、そのピッチ値に対する自己相関を求め、その相関値
    が所定値よりも小さいときに第2のピッチ抽出手段を動
    作させて自己相関法により再度ピッチを求めるように抽
    出制御手段を形成したことを特徴とする音声コード変換
    器。
JP61148415A 1986-06-25 1986-06-25 音声コ−ド変換器 Expired - Lifetime JPH0636154B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61148415A JPH0636154B2 (ja) 1986-06-25 1986-06-25 音声コ−ド変換器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61148415A JPH0636154B2 (ja) 1986-06-25 1986-06-25 音声コ−ド変換器

Publications (2)

Publication Number Publication Date
JPS635400A JPS635400A (ja) 1988-01-11
JPH0636154B2 true JPH0636154B2 (ja) 1994-05-11

Family

ID=15452280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61148415A Expired - Lifetime JPH0636154B2 (ja) 1986-06-25 1986-06-25 音声コ−ド変換器

Country Status (1)

Country Link
JP (1) JPH0636154B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60194499A (ja) * 1984-02-22 1985-10-02 エヌ・ベー・フイリツプス・フルーイランペンフアブリケン 音声分析方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60194499A (ja) * 1984-02-22 1985-10-02 エヌ・ベー・フイリツプス・フルーイランペンフアブリケン 音声分析方式

Also Published As

Publication number Publication date
JPS635400A (ja) 1988-01-11

Similar Documents

Publication Publication Date Title
US5293448A (en) Speech analysis-synthesis method and apparatus therefor
US5933805A (en) Retaining prosody during speech analysis for later playback
US5940797A (en) Speech synthesis method utilizing auxiliary information, medium recorded thereon the method and apparatus utilizing the method
JP4202090B2 (ja) スムージングフィルタを用いた音声合成システム及びその方法並びにスムージングフィルタ特性制御装置及びその方法
US5220629A (en) Speech synthesis apparatus and method
US4709390A (en) Speech message code modifying arrangement
CA1085960A (en) Speech recognition system
JP3093113B2 (ja) 音声合成方法及びシステム
CA1326912C (en) Speech coding system
JP3354252B2 (ja) 音声認識装置
CA2026640C (en) Speech analysis-synthesis method and apparatus therefor
JPH0636154B2 (ja) 音声コ−ド変換器
JPS6050600A (ja) 規則合成方式
JPH0640276B2 (ja) 音声コ−ド変換器
JPH0950295A (ja) 音声合成方法およびそのための装置
JPH0430040B2 (ja)
Chollet et al. On the generation and use of a segment dictionary for speech coding, synthesis and recognition
JP2785628B2 (ja) ピッチパタン生成装置
JP2900454B2 (ja) 音声合成装置の音節データ作成方式
JPH11282494A (ja) 音声合成装置および記憶媒体
JPH0358100A (ja) 規則型音声合成装置
JP2737122B2 (ja) 音声辞書作成装置
Lea et al. Algorithms for acoustic prosodic analysis
JP3133347B2 (ja) 韻律制御装置
JPH05232991A (ja) 音声合成方法