JPH02232700A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH02232700A JPH02232700A JP1052871A JP5287189A JPH02232700A JP H02232700 A JPH02232700 A JP H02232700A JP 1052871 A JP1052871 A JP 1052871A JP 5287189 A JP5287189 A JP 5287189A JP H02232700 A JPH02232700 A JP H02232700A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- residual signal
- voice
- signal
- fundamental period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002194 synthesizing effect Effects 0.000 title abstract 2
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 17
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 239000000284 extract Substances 0.000 claims abstract description 5
- 230000003595 spectral effect Effects 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 abstract description 8
- 230000011218 segmentation Effects 0.000 abstract 3
- 230000002542 deteriorative effect Effects 0.000 abstract 2
- 239000000203 mixture Substances 0.000 abstract 1
- 230000004048 modification Effects 0.000 abstract 1
- 238000012986 modification Methods 0.000 abstract 1
- 230000003252 repetitive effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000003323 beak Anatomy 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、音声信号の基本周期を任意に変更する必要
のある音声合成装置において、合成音声の品質劣化を最
小にするように基本周期を自由に変化できる音声合成装
置に関するものである.(従来の技術) 線形予測分析で得られる残差信号を駆動音源信号とする
残差駆動型音声分析合成技術を用いて、この種の装置を
実現するためには、基本周期に同期した残差信号の切り
出しを行う必要がある。従来、この残差信号の切り出し
処理は、残差信号のピーク近傍から1基本周期に相当す
る区間の信号を適当に切り出すことにより行われていた
.(発明が解決しようとする課題) しかし、このようにして切り出した残差信号を用いて音
声の基本周期を変更した場合、必ずしも切り出し位置と
切り出し窓長が最適になっているとは限らず、合成音声
の品質が大きぐ劣化する場合があった(例えば特公昭5
9−014752号公報、音声合成方式参照). この発明の目的は、前述したような従来技術で行ってい
た残差信号の切り出しを合成時のスペクトル歪が最少と
なるように繰り返し演算によって実現し、基本周期変更
時に生ずる合成音声の品質劣化を軽減する音声合成装置
を提供するものである. (課題を解決するための手段) この発明にかかる音声合成装置は、音声の線形予測分析
を行って入力音声のスペクトル包結情報と残差信号を抽
出する線形予測分析回路と、抽出された残差信号波形の
ピークを検出する残差信号ピーク検出回路と、検出され
たピークを基準点として残差信号を切り出す残差信号切
り出し回路と、その切り出された残差信号を用いて基本
周期が所定の周期に変更された音源信号を生成する基本
周期変更回路と、その音源信号を用いて音声を合成する
音声合成回路と、もとの入力音声と合成音声のスペクト
ル歪を計算するスペクトル歪計算回路と、基本周期を変
更した場合に生ずる合成時のスペクトル包絡歪を最小に
するように残差信号を切り出す位置と窓長を制御する残
差信号切り出し制御回路とからなる。
のある音声合成装置において、合成音声の品質劣化を最
小にするように基本周期を自由に変化できる音声合成装
置に関するものである.(従来の技術) 線形予測分析で得られる残差信号を駆動音源信号とする
残差駆動型音声分析合成技術を用いて、この種の装置を
実現するためには、基本周期に同期した残差信号の切り
出しを行う必要がある。従来、この残差信号の切り出し
処理は、残差信号のピーク近傍から1基本周期に相当す
る区間の信号を適当に切り出すことにより行われていた
.(発明が解決しようとする課題) しかし、このようにして切り出した残差信号を用いて音
声の基本周期を変更した場合、必ずしも切り出し位置と
切り出し窓長が最適になっているとは限らず、合成音声
の品質が大きぐ劣化する場合があった(例えば特公昭5
9−014752号公報、音声合成方式参照). この発明の目的は、前述したような従来技術で行ってい
た残差信号の切り出しを合成時のスペクトル歪が最少と
なるように繰り返し演算によって実現し、基本周期変更
時に生ずる合成音声の品質劣化を軽減する音声合成装置
を提供するものである. (課題を解決するための手段) この発明にかかる音声合成装置は、音声の線形予測分析
を行って入力音声のスペクトル包結情報と残差信号を抽
出する線形予測分析回路と、抽出された残差信号波形の
ピークを検出する残差信号ピーク検出回路と、検出され
たピークを基準点として残差信号を切り出す残差信号切
り出し回路と、その切り出された残差信号を用いて基本
周期が所定の周期に変更された音源信号を生成する基本
周期変更回路と、その音源信号を用いて音声を合成する
音声合成回路と、もとの入力音声と合成音声のスペクト
ル歪を計算するスペクトル歪計算回路と、基本周期を変
更した場合に生ずる合成時のスペクトル包絡歪を最小に
するように残差信号を切り出す位置と窓長を制御する残
差信号切り出し制御回路とからなる。
第1図はこの発明の一実施例の構成を示すブロック図で
ある.第2図に残差信号波形の切り出し窓と切り出し位
置の関係を示す。
ある.第2図に残差信号波形の切り出し窓と切り出し位
置の関係を示す。
第1図において、1は音声入力端子、2は線形予測分析
回路で、入力された音声信号のスペクトル包絡特性と残
差信号を抽出する.3は残差信号ピーク検出回路で、残
差信号のピーク位置を決定するものである.4は残差信
号切り出し回路で、切り出し窓と切り出し位置を切り出
す.5は残差信号切り出し制御回路、6は基本周期変更
回路で、基本周期Tmに従って並べかえを行う.7は音
声合成回路で、合成音を作成する.8はスペクトル歪計
算回路、9は合成音出力端子である。
回路で、入力された音声信号のスペクトル包絡特性と残
差信号を抽出する.3は残差信号ピーク検出回路で、残
差信号のピーク位置を決定するものである.4は残差信
号切り出し回路で、切り出し窓と切り出し位置を切り出
す.5は残差信号切り出し制御回路、6は基本周期変更
回路で、基本周期Tmに従って並べかえを行う.7は音
声合成回路で、合成音を作成する.8はスペクトル歪計
算回路、9は合成音出力端子である。
第1図の実施例の動作は次のようである.音声信号は線
形予測分析回路2にょクて音声のスペクトル包絡情報と
残差信号を抽出する。残差信号の一部分を第2図に示す
.10.11.12・・・・・・はビークを示し、CW
は切り出し窓.cpは切り出し位置を示す.次にピーク
位置検出回路3によって得られた残差信号のピーク10
.11.12・・・・・・の位置を決定する.残差信号
切り出し回路4では残差信号を、ピーク位置を中心に第
2図に示すような切り出し窓Cwと切り出し位置Cpに
より切り出し、基本周期変更回路6によって新たな基本
周期Tmに従って並べかえる。音声合成回路7では、こ
の新しい残差信号系列と線形予測分析回路2で抽出され
たスペクトル包絡情報を用いて合成音を得る.次にこの
基本周期Tmを変更した合成音と入力音声信号のスペク
トル分析を行い、両者のスペクトル包絡歪をスペクトル
歪計算回路8で計算する。そして第1図に示すように、
残差信号の切り出しからスペクトル歪の計算までの過程
を、切り出し窓Cwと切り出し位置Cpを変化して順次
繰り返し、スペクトル歪が最も小さい条件の合成音を最
終出力とする。このとき、最適な切り出し位置Cpと窓
長をもった駆動音源信号が得られる.スペクトル包絡歪
は、例えば人間の聴覚特性と比較的対応が良いとされて
いる、LPCケブストラム距離尺度などが使える。
形予測分析回路2にょクて音声のスペクトル包絡情報と
残差信号を抽出する。残差信号の一部分を第2図に示す
.10.11.12・・・・・・はビークを示し、CW
は切り出し窓.cpは切り出し位置を示す.次にピーク
位置検出回路3によって得られた残差信号のピーク10
.11.12・・・・・・の位置を決定する.残差信号
切り出し回路4では残差信号を、ピーク位置を中心に第
2図に示すような切り出し窓Cwと切り出し位置Cpに
より切り出し、基本周期変更回路6によって新たな基本
周期Tmに従って並べかえる。音声合成回路7では、こ
の新しい残差信号系列と線形予測分析回路2で抽出され
たスペクトル包絡情報を用いて合成音を得る.次にこの
基本周期Tmを変更した合成音と入力音声信号のスペク
トル分析を行い、両者のスペクトル包絡歪をスペクトル
歪計算回路8で計算する。そして第1図に示すように、
残差信号の切り出しからスペクトル歪の計算までの過程
を、切り出し窓Cwと切り出し位置Cpを変化して順次
繰り返し、スペクトル歪が最も小さい条件の合成音を最
終出力とする。このとき、最適な切り出し位置Cpと窓
長をもった駆動音源信号が得られる.スペクトル包絡歪
は、例えば人間の聴覚特性と比較的対応が良いとされて
いる、LPCケブストラム距離尺度などが使える。
なお、この装置の音声合成回路7とスペクトル歪計算回
路8に波形修正回路を付加することによって、切り出し
窓Cwと切り出し位置Cpの決定だけではなく、出力合
成音声のスペクトル包絡特性をさらに入力音声のスペク
トル包絡特性に近づけることも可能であり、この時には
、さらに高品質の合成音が期待できる. ′s3図に、この発明の効果を調べるために行った実験
結果の一例を示す。
路8に波形修正回路を付加することによって、切り出し
窓Cwと切り出し位置Cpの決定だけではなく、出力合
成音声のスペクトル包絡特性をさらに入力音声のスペク
トル包絡特性に近づけることも可能であり、この時には
、さらに高品質の合成音が期待できる. ′s3図に、この発明の効果を調べるために行った実験
結果の一例を示す。
この例は、本装置を用いて単語のアクセント型を変更し
た合成音声の品質を主観評価法の1つであるオピニオン
試験法によって調べた結果である(ケース1).単語の
アクセント型は、例えば「賞品」を「商品」に変更する
。比較のために残差信号の切り出しを固定にし、常にピ
ークの位置から1周期分を切り出す方法(ケース2)に
よって同様なアクセント型の変更を行った場合の結果を
並べて示した.縦軸は平均オビニ才ン値(MOS)が等
しくなる時は信号対振幅相関雑音比(MOS等価Q値)
を示す.したがって、この値が大きくなるほど合成音の
品質が良いことを示している。同実験桔果からケース1
の合成音はケース2に比較するとQ値で約9dBの向上
が認められ、この発明の効果が大きいことを示している
。
た合成音声の品質を主観評価法の1つであるオピニオン
試験法によって調べた結果である(ケース1).単語の
アクセント型は、例えば「賞品」を「商品」に変更する
。比較のために残差信号の切り出しを固定にし、常にピ
ークの位置から1周期分を切り出す方法(ケース2)に
よって同様なアクセント型の変更を行った場合の結果を
並べて示した.縦軸は平均オビニ才ン値(MOS)が等
しくなる時は信号対振幅相関雑音比(MOS等価Q値)
を示す.したがって、この値が大きくなるほど合成音の
品質が良いことを示している。同実験桔果からケース1
の合成音はケース2に比較するとQ値で約9dBの向上
が認められ、この発明の効果が大きいことを示している
。
この発明は、合成音の品質を劣化することなく音声の基
本周期を変更できる利点があるため、イントネーション
や声質を自由に制御できる高品質音声合成系への適用が
可能である. (発明の効果) この発明は以上説明したように、残差信号の切り出しを
、合成時のスペクトル歪が最小となるように繰り返し演
算によって行うので、基本周期変更時に生ずる合成音声
の品質劣化を著しく軽減できる利点がある.
本周期を変更できる利点があるため、イントネーション
や声質を自由に制御できる高品質音声合成系への適用が
可能である. (発明の効果) この発明は以上説明したように、残差信号の切り出しを
、合成時のスペクトル歪が最小となるように繰り返し演
算によって行うので、基本周期変更時に生ずる合成音声
の品質劣化を著しく軽減できる利点がある.
第1図はこの発明の一実施例を示す構成図、第2図は残
差信号波形の切り出し窓と切り出し位置の関係を説明す
るための図、第3図はこの発明の効果を調べるために行
った主観評価実験結果の一例を示す図である. 図中、1は音声入力端子、2は線形予測分析回路、3は
残差信号ピーク検出回路、4は残差信号切り出し回路、
5は残差信号切り出し制御回路、6は基本周期変更回路
、7は音声合成回路、8はスペクトル歪計算回路、9は
合成音出力端子、10〜12は残差信号のピーク、Cp
は切り出し位置、CWは切り出し窓である. 第2図 第1図 第3図
差信号波形の切り出し窓と切り出し位置の関係を説明す
るための図、第3図はこの発明の効果を調べるために行
った主観評価実験結果の一例を示す図である. 図中、1は音声入力端子、2は線形予測分析回路、3は
残差信号ピーク検出回路、4は残差信号切り出し回路、
5は残差信号切り出し制御回路、6は基本周期変更回路
、7は音声合成回路、8はスペクトル歪計算回路、9は
合成音出力端子、10〜12は残差信号のピーク、Cp
は切り出し位置、CWは切り出し窓である. 第2図 第1図 第3図
Claims (1)
- 音声の線形予測分析を行つて入力音声のスペクトル包
絡情報と残差信号を抽出する線形予測分析回路と、抽出
された残差信号波形のピークを検出する残差信号ピーク
検出回路と、検出されたピークを基準点として残差信号
を切り出す残差信号切り出し回路と、その切り出された
残差信号を用いて基本周期が所定の周期に変更された音
源信号を生成する基本周期変更回路と、その音源信号を
用いて音声を合成する音声合成回路と、もとの入力音声
と合成音声のスペクトル歪を計算するスペクトル歪計算
回路と、基本周期を変更した場合に生ずる合成時のスペ
クトル包絡歪を最小にするように残差信号を切り出す位
置と窓長を制御する残差信号切り出し制御回路とを具備
することを特徴とする音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1052871A JP2588963B2 (ja) | 1989-03-07 | 1989-03-07 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1052871A JP2588963B2 (ja) | 1989-03-07 | 1989-03-07 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02232700A true JPH02232700A (ja) | 1990-09-14 |
JP2588963B2 JP2588963B2 (ja) | 1997-03-12 |
Family
ID=12926942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1052871A Expired - Lifetime JP2588963B2 (ja) | 1989-03-07 | 1989-03-07 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2588963B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998006091A1 (fr) * | 1996-08-02 | 1998-02-12 | Matsushita Electric Industrial Co., Ltd. | Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications |
JP2008026565A (ja) * | 2006-07-20 | 2008-02-07 | Fujitsu Ltd | ピッチ変換方法及び装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56129000A (en) * | 1980-03-14 | 1981-10-08 | Hitachi Ltd | Wind hanging calculator |
JPS5888798A (ja) * | 1981-11-20 | 1983-05-26 | 松下電器産業株式会社 | 音声合成方式 |
JPS60123900A (ja) * | 1983-12-09 | 1985-07-02 | 株式会社日立製作所 | 法則音声合成装置 |
-
1989
- 1989-03-07 JP JP1052871A patent/JP2588963B2/ja not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56129000A (en) * | 1980-03-14 | 1981-10-08 | Hitachi Ltd | Wind hanging calculator |
JPS5888798A (ja) * | 1981-11-20 | 1983-05-26 | 松下電器産業株式会社 | 音声合成方式 |
JPS60123900A (ja) * | 1983-12-09 | 1985-07-02 | 株式会社日立製作所 | 法則音声合成装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998006091A1 (fr) * | 1996-08-02 | 1998-02-12 | Matsushita Electric Industrial Co., Ltd. | Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications |
US6226604B1 (en) | 1996-08-02 | 2001-05-01 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
US6421638B2 (en) | 1996-08-02 | 2002-07-16 | Matsushita Electric Industrial Co., Ltd. | Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device |
US6549885B2 (en) | 1996-08-02 | 2003-04-15 | Matsushita Electric Industrial Co., Ltd. | Celp type voice encoding device and celp type voice encoding method |
US6687666B2 (en) | 1996-08-02 | 2004-02-03 | Matsushita Electric Industrial Co., Ltd. | Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device |
JP2008026565A (ja) * | 2006-07-20 | 2008-02-07 | Fujitsu Ltd | ピッチ変換方法及び装置 |
JP4757130B2 (ja) * | 2006-07-20 | 2011-08-24 | 富士通株式会社 | ピッチ変換方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2588963B2 (ja) | 1997-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1380029B1 (en) | Time-scale modification of signals applying techniques specific to determined signal types | |
EP1829424B1 (en) | Temporal envelope shaping of decorrelated signals | |
US8612237B2 (en) | Method and apparatus for determining audio spatial quality | |
AU2006233504A1 (en) | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing | |
JP2001100773A5 (ja) | ||
US20080215344A1 (en) | Method and apparatus for expanding bandwidth of voice signal | |
CA2222582A1 (en) | Speech synthesizer having an acoustic element database | |
EP1426926B1 (en) | Apparatus and method for changing the playback rate of recorded speech | |
KR20050086762A (ko) | 정현파 오디오 코딩 | |
JPH0431898A (ja) | 音声雑音分離装置 | |
SE470577B (sv) | Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud | |
US5452398A (en) | Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change | |
JPH02232700A (ja) | 音声合成装置 | |
US4845753A (en) | Pitch detecting device | |
CA2026640C (en) | Speech analysis-synthesis method and apparatus therefor | |
JP2841797B2 (ja) | 音声分析・合成装置 | |
JPS5925237B2 (ja) | 音声分析合成方式の音声区間判定方法 | |
JP2650355B2 (ja) | 音声分析合成装置 | |
RU2400831C1 (ru) | Способ выделения сегментов квазистационарности при анализе речевого сигнала в вокодерах с линейным предсказанием | |
KR100359988B1 (ko) | 실시간 화속 변환 장치 | |
JPH0235994B2 (ja) | ||
US20040234078A1 (en) | Method for automatically testing output audio signals | |
JP2003316380A (ja) | 会話を含む音の信号処理を行う前の段階の処理におけるノイズリダクションシステム | |
JPS5925238B2 (ja) | 音声分析合成方式の音声区間判定方法 | |
JP3263136B2 (ja) | 信号のピッチ同期位置抽出方式及び信号合成方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071205 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081205 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091205 Year of fee payment: 13 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091205 Year of fee payment: 13 |