JPH0141998B2 - - Google Patents

Info

Publication number
JPH0141998B2
JPH0141998B2 JP56214570A JP21457081A JPH0141998B2 JP H0141998 B2 JPH0141998 B2 JP H0141998B2 JP 56214570 A JP56214570 A JP 56214570A JP 21457081 A JP21457081 A JP 21457081A JP H0141998 B2 JPH0141998 B2 JP H0141998B2
Authority
JP
Japan
Prior art keywords
speech
analysis
synthesis
conditions
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56214570A
Other languages
English (en)
Other versions
JPS58111999A (ja
Inventor
Tooru Kanamori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56214570A priority Critical patent/JPS58111999A/ja
Publication of JPS58111999A publication Critical patent/JPS58111999A/ja
Publication of JPH0141998B2 publication Critical patent/JPH0141998B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は、音声分析合成方式に関し、特に合成
音声の品質を改善するための、可変な分析条件あ
るいは合成条件をもち、最適な条件を自動的に選
択するように制御する構成を有する音声分析合成
方式に関する。
(2) 技術の背景 一般にボコーダ方式では、入力原音声波形と出
力合成音声波形とは一致しない。すなわち、分析
と合成とは完全な逆変換関係になつていない。ま
た、PARCOR、LSPなどの線形予測方式では、
全極型モデルにより近似を行なうため、このモデ
ルがあてはまらない鼻音や、女性の音声などで基
本周波数が高く、その周波数が第1フオルマント
周波数に一致した場合などに、バンド幅の狭小な
極が抽出される場合があり、このような場合に
は、合成音声は、その振幅が非常に大きくなつた
り、あるいは聞き辛い異音を含むものとなつたり
することがある。
また、分析の際、時間窓により原音声を切り出
して分析する方式では、分析時間窓と原音声波形
との位相関係により、分析が良好にできない場合
もある。
更に、有声/無声の判別を行なう方式では、判
別誤りが発生することがあり、この場合にも異音
が発生することが多く、また、ピツチ周波数を抽
出する場合にも、抽出誤りは、必ずといつてよい
程発生する。
(3) 従来技術と問題点 従来は、上述したような場合において合成音声
の品質向上を図るためには、合成と試聴とを繰り
返しながら、手作業によつてあるいはオフライン
処理によつて、部分的な修正を分析結果に加える
という方法をとつていた。このため、修正作業の
ために膨大な時間と労力とが費されていた。
(4) 発明の目的 本発明は、合成音声の品質を改善する効果的で
自動的な手段を提供することを目的とする。
(5) 発明の構成 本発明は、音声分析合成器の合成音を原音声と
比較し、合成音が原音声に近くなるように自動的
に分析手段、あるいは合成手段を修正する。たと
えば、合成音の振幅が過大となつた場合には、合
成音が原音声と近くなる方向、すなわち振幅が小
さくなる方向に、分析手段あるいは合成手段が修
正される。
本発明は、その構成として、音声を分析し、情
報圧縮を行ない、パラメータ化して、そのパラメ
ータから音声を合成する音声分析合成方式におい
て、分析条件を変更できる音声分析手段と、合成
条件を変更できる音声合成手段と、合成音声と原
音声とを合成音声の再分析によりパラメータ上で
比較する手段とを備え、比較の結果により、合成
音声が原音声に近づくように上記分析手段の分析
条件および音声合成手段の合成条件を自動的に修
正することを特徴としている。
(6) 発明の実施例 以下に、実施例にしたがつて本発明を説明す
る。
本発明における合成音と原音との比較方法、お
よびその比較結果による分析手段あるいは合成手
段の修正方法には、非常に多くの種類のものが適
用可能である。PARCOR/LSP方式における分
析手段および合成手段の可変要素の例を、次に示
す。
a 偏自己相関係抽出の分析窓長 b 偏自己相関係数抽出の分析窓位置 c ピツチ抽出の分析窓長 d ピツチ抽出の分析窓位置 e 分析合成の次数 f 分析合成の繰り返し周期 g スペクトル平滑帯域幅 h 有声/無声判別の閾値 i 振幅の倍率(時間的変化) この中で、合成音の振幅が過大となつたときに
分析部において振幅の倍率を制御し、合成音の品
質を向上させるようにした実施例を第1図に示
す。
第1図において、1は原音の分析部で、2はス
ペクトル情報抽出部、3は音源状報抽出部、4は
振幅制御部、5は合成部、6は原音の振幅抽出
部、7は合成音の振幅抽出部である。
この実施例では、原音と合成音との振幅が、分
析部1における音源情報抽出部3から独立した振
幅抽出部6と7とで、それぞれA,Bとして抽出
され、比較部8で比較される。比較部8における
比較結果は、比率A/Bとして、分析部1内の振
幅制御部4に与えられる。振幅制御部4は、音源
情報中の振幅情報に、このA/Bの比率を乗じて
やることにより、合成音の振幅を、原音の振幅A
に一致させることができる。これにより、分析不
良や量子化誤差等による振幅の異常な増大を抑制
することが可能となる。
なお、上述した例は、1回の分析合成により、
最適な分析条件を設定することができたが、複数
回の繰り返しで最適条件が得られるようにしても
よい。また、振幅の修正は、合成部5の合成条件
に対して行なつてもよい。
他の実施例として、原音声と合成音声との一致
性を判定する指標として、スペクトル距離を使用
した方式を第2図に示す。
第2図において、9は原音声の分析部、10は
合成部、11,12はそれぞれ原音声と合成音声
のスペクトル計算部、13はスペクトル距離計算
部、14は距離比較判定部、15は分析条件選択
部、16は合成条件選択部、17はパラメータ・
合成条件記憶部、を示す。
スペクトル計算部11,12は、原音声または
合成音声のスペクトルを、たとえばDFT(離散フ
ーリエ変換)等を用いて計算する。
距離計算部13は、原音声と合成音声とのスペ
クトル間距離を、たとえば対数スペクトルのユー
クリツド距離により求める。また、帯域ごとのパ
ワー差の2乗和を求める方法や、ケプストラム距
離を求める方法をとることもできる。
距離比較判定部14は、過去の試行の中で最も
距離が小さいものを判定記憶し、その回の試行結
果の距離が過去一番小さいものであつた場合、パ
ラメータ・合成条件記憶部17に対して、その回
のパラメータと合成条件とを記憶させるための信
号を発する。また、距離が予め定められた一定値
以下になつた場合に、試行をやめる。
分析条件選択部15および合成条件選択部16
は、予め定められた分析、合成の条件を毎回の試
行ごとに変更する。たとえは、分析条件として、
パラメータ抽出のための時間窓長の変更、あるい
はスペクトル平滑化のための平滑帯域幅(特開昭
51−806参照)の変更を行なうことができる。ま
た、合成条件としては、フイルタ演算における内
部損失の変更が行なわれる。これらを、予め定め
られた範囲内で、かつ予め定められた、たとえは
すべての組み合わせを順次行なうなどの手順にし
たがつて変化させ、同一原音声に対する分析合成
の試行を、繰り返し試行させるようにする。
パラメータ・合成条件記憶部17は、複数回の
試行の中で、距離が最も小さいと判定された時点
での分析結果のパラメータと、合成条件とを記憶
し、必要に応じて出力する。
以上の構成を用いて、同一原音声に対して、分
析、合成の条件を変更しながら試行を繰り返すこ
とにより、原音声と合成音声とのスペクトル距離
が一定値以下の、またはすべての組み合わせの中
で最も距離が小さくなる、パラメータおよび合成
条件を得ることができる。
(7) 発明の効果 以上述べたように、本発明によれば、合成音声
の品質は、原音声と合成音声との中の共通の因子
同士での比較結果に基づいて行なわれる分析ある
いは合成条件の最適化処理により、良好にかつ能
率的に改善されることができる。
【図面の簡単な説明】
第1図は本発明の1実施例の構成図、第2図は
本発明の他の実施例の構成図である。 図中、1は分析部、2はスペクトル情報抽出
部、3は音源情報抽出部、4は振幅制御部、5は
合成部、6,7は振幅抽出部、8は比較部、を示
す。

Claims (1)

  1. 【特許請求の範囲】 1 音声を分析し、情報圧縮を行ない、パラメー
    タ化して、そのパラメータから音声を合成する音
    声分析合成方式において、分析条件を変更できる
    音声分析手段と、合成条件を変更できる音声合成
    手段と、合成音声と原音声とを合成音声の再分析
    によりパラメータ上で比較する手段とを備え、比
    較の結果により、合成音声が原音声に近づくよう
    に上記分析手段の分析条件および音声合成手段の
    合成条件を自動的に修正することを特徴とする音
    声分析合成方式。 2 音声分析手段の分析条件におけるパラメータ
    抽出の時間窓長あるいはスペクトル平滑化のため
    の平滑帯域幅を変更できるようにし、また音声合
    成手段の合成条件におけるフイルタ演算の内部損
    失を変更できるようにしたことを特徴とする特許
    請求の範囲第1項記載の音声分析合成方式。
JP56214570A 1981-12-25 1981-12-25 音声分析合成方式 Granted JPS58111999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56214570A JPS58111999A (ja) 1981-12-25 1981-12-25 音声分析合成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56214570A JPS58111999A (ja) 1981-12-25 1981-12-25 音声分析合成方式

Publications (2)

Publication Number Publication Date
JPS58111999A JPS58111999A (ja) 1983-07-04
JPH0141998B2 true JPH0141998B2 (ja) 1989-09-08

Family

ID=16657897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56214570A Granted JPS58111999A (ja) 1981-12-25 1981-12-25 音声分析合成方式

Country Status (1)

Country Link
JP (1) JPS58111999A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60195595A (ja) * 1984-03-19 1985-10-04 三洋電機株式会社 実時間音声分析合成装置
JPS6186800A (ja) * 1984-10-03 1986-05-02 三洋電機株式会社 実時間音声分析方式

Also Published As

Publication number Publication date
JPS58111999A (ja) 1983-07-04

Similar Documents

Publication Publication Date Title
JP4624552B2 (ja) 狭帯域言語信号からの広帯域言語合成
AU656787B2 (en) Auditory model for parametrization of speech
US5455888A (en) Speech bandwidth extension method and apparatus
US6349277B1 (en) Method and system for analyzing voices
Childers et al. Voice conversion: Factors responsible for quality
KR101264486B1 (ko) 오디오 신호 스펙트럼의 복수개의 로컬 무게 중심 주파수들을 결정하는 장치 및 방법
US20070208566A1 (en) Voice Signal Conversation Method And System
JPH05210399A (ja) ディジタル音声コーダ
US20130311189A1 (en) Voice processing apparatus
US5884251A (en) Voice coding and decoding method and device therefor
JPH0638199B2 (ja) 音声認識装置
JP3219868B2 (ja) 音声のピッチ周期抽出装置およびピッチ区間自動抽出装置
US5577160A (en) Speech analysis apparatus for extracting glottal source parameters and formant parameters
Morise et al. Low-Dimensional Representation of Spectral Envelope Without Deterioration for Full-Band Speech Analysis/Synthesis System.
JPH09244694A (ja) 声質変換方法
Wang et al. Robust voicing estimation with dynamic time warping
JPH0141998B2 (ja)
Holmes Copy synthesis of female speech using the JSRU parallel formant synthesiser.
JPH1097274A (ja) 話者認識方法及び装置
Gutierrez-Arriola et al. Voice conversion based on parameter transformation.
JP3398968B2 (ja) 音声分析合成方法
Vogten et al. The Formator: a speech analysis-synthesis system based on formant extraction from linear prediction coefficients
JPH07261798A (ja) 音声分析合成装置
JPS6152480B2 (ja)
JPS5912199B2 (ja) 音声パラメ−タの修正方式