JPS63147200A - 音声パラメ−タ修正方式 - Google Patents
音声パラメ−タ修正方式Info
- Publication number
- JPS63147200A JPS63147200A JP61293516A JP29351686A JPS63147200A JP S63147200 A JPS63147200 A JP S63147200A JP 61293516 A JP61293516 A JP 61293516A JP 29351686 A JP29351686 A JP 29351686A JP S63147200 A JPS63147200 A JP S63147200A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- parameters
- speaker
- audio
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 title claims description 27
- 238000003786 synthesis reaction Methods 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 17
- 230000005856 abnormality Effects 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Landscapes
- Details Of Television Systems (AREA)
- Stereo-Broadcasting Methods (AREA)
- Selective Calling Equipment (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
本発明は音声合成において、話者であるアナランサの発
声ミス、分析時のエラー等による音質の劣化に対処する
ため音声パラメータの修正を行うに際し、個人差の少い
ピンチ、振幅、時間長等の音声パラメータについては修
正を行う者により音声パラメータを修正してアナランサ
の音声合成を得るようにしたものであり、熟練者でなく
ても容易に音声合成の修正が行えるようにしたものであ
る。
声ミス、分析時のエラー等による音質の劣化に対処する
ため音声パラメータの修正を行うに際し、個人差の少い
ピンチ、振幅、時間長等の音声パラメータについては修
正を行う者により音声パラメータを修正してアナランサ
の音声合成を得るようにしたものであり、熟練者でなく
ても容易に音声合成の修正が行えるようにしたものであ
る。
本発明は分析合成形の音声処理装置における音声パラメ
ータ修正方式に関する。
ータ修正方式に関する。
〔従来の技術及び発明が解決しようとする問題点〕音声
合成は、例えば電話による銀行の貯金残高の照会や、住
宅情報などの問い合せに対する回答を、予め蓄えられた
音声パラメータに基づいて合成した音声により行なう音
声応答システム等に用いられている。一般に音声合成は
合成形と編集形の2種に大別され、前者は音声生成モデ
ルにもとづいて回路的に処理するものであり、さらに合
成形は分析合成形と法則合成形に分類され、前者は単語
や文節単位の音声から声道の音響伝達特性と駆動音源特
性を抽出して記憶しておき、これにより音声合成器を制
御して文音声を合成するものである。そして分析合成形
の一つとして音声信号を統計的に処理するパーコール(
PARCOR)方式が代表的に用いられている。
合成は、例えば電話による銀行の貯金残高の照会や、住
宅情報などの問い合せに対する回答を、予め蓄えられた
音声パラメータに基づいて合成した音声により行なう音
声応答システム等に用いられている。一般に音声合成は
合成形と編集形の2種に大別され、前者は音声生成モデ
ルにもとづいて回路的に処理するものであり、さらに合
成形は分析合成形と法則合成形に分類され、前者は単語
や文節単位の音声から声道の音響伝達特性と駆動音源特
性を抽出して記憶しておき、これにより音声合成器を制
御して文音声を合成するものである。そして分析合成形
の一つとして音声信号を統計的に処理するパーコール(
PARCOR)方式が代表的に用いられている。
第3図は従来の合成用音声パラメータ作成システムの構
成図である。1は磁気テープ等の話者の声を収録する装
置、2は音声分析部、3は音声パラメータ修正部、4は
音声パラメータ蓄積部、5は音声合成部、6はスピーカ
である。このような構成におJ、sで、第4図に従来の
合成用音声パラメータの処理の流れを示す。第4図に示
すように、アナランサなどが発声した音声を読み込み(
ステップ41)、この音声のピッチ、振幅、時間長、K
パラメータ等を分析しくステップ42)、その話者につ
いての分析結果を音声パラメータとして蓄積部へ蓄積し
くステップ43)、再生するときに音声合成(ステップ
44)した後試聴しくステップ45)、音声が良好か否
か判断しくステップ46)、異常がある場合には音声パ
ラメータの修正(ステップ48)を直接当該話者を再び
呼んできて行いステップ44に戻り修正後の試聴を繰り
返していた。即ち、再発声してもらった声と置き換える
か熟練者が見当をつ1すて値を手で修正、試聴を何度も
繰り返すことにより自然な音声に近づけていた。
成図である。1は磁気テープ等の話者の声を収録する装
置、2は音声分析部、3は音声パラメータ修正部、4は
音声パラメータ蓄積部、5は音声合成部、6はスピーカ
である。このような構成におJ、sで、第4図に従来の
合成用音声パラメータの処理の流れを示す。第4図に示
すように、アナランサなどが発声した音声を読み込み(
ステップ41)、この音声のピッチ、振幅、時間長、K
パラメータ等を分析しくステップ42)、その話者につ
いての分析結果を音声パラメータとして蓄積部へ蓄積し
くステップ43)、再生するときに音声合成(ステップ
44)した後試聴しくステップ45)、音声が良好か否
か判断しくステップ46)、異常がある場合には音声パ
ラメータの修正(ステップ48)を直接当該話者を再び
呼んできて行いステップ44に戻り修正後の試聴を繰り
返していた。即ち、再発声してもらった声と置き換える
か熟練者が見当をつ1すて値を手で修正、試聴を何度も
繰り返すことにより自然な音声に近づけていた。
このような手順で明らかなように、音声に異常がある場
合は音声パラメータを再び直接当該話者を呼んできて再
発声させた声と置き換えるが見当をつけ、パラメータの
値を修正、試聴を繰り返すという効率が悪く、負担の大
きい作業を必要としていた。この場合、修正する者は多
くの熟練を必要とし、また合成される音が不自然になる
ことも多い。
合は音声パラメータを再び直接当該話者を呼んできて再
発声させた声と置き換えるが見当をつけ、パラメータの
値を修正、試聴を繰り返すという効率が悪く、負担の大
きい作業を必要としていた。この場合、修正する者は多
くの熟練を必要とし、また合成される音が不自然になる
ことも多い。
〔問題点を解決するための手段および作用〕本発明は上
述した問題点を解消した音声処理装置における音声パラ
メータ修正方式を提供することにあり、その手段は、ア
ナランサ等の話者の音声を分析して得られる音声パラメ
ータを格納する音声パラメータ蓄積部と、前記話者によ
る音声合成に異常があるときに修正を行う者によって得
られる音声パラメータを格納する修正用音声パラメータ
蓄積部と、前記音声パラメータ蓄積部の所定の音声パラ
メータを修正する音声パラメータ修正部を備え、前記話
者の音声合成に異常があるときは個人差の少い所定の音
声パラメータについて前記修正を行う者の音声パラメー
タに置き換えて修正を行うことを特徴とする。
述した問題点を解消した音声処理装置における音声パラ
メータ修正方式を提供することにあり、その手段は、ア
ナランサ等の話者の音声を分析して得られる音声パラメ
ータを格納する音声パラメータ蓄積部と、前記話者によ
る音声合成に異常があるときに修正を行う者によって得
られる音声パラメータを格納する修正用音声パラメータ
蓄積部と、前記音声パラメータ蓄積部の所定の音声パラ
メータを修正する音声パラメータ修正部を備え、前記話
者の音声合成に異常があるときは個人差の少い所定の音
声パラメータについて前記修正を行う者の音声パラメー
タに置き換えて修正を行うことを特徴とする。
第1図は本発明に係る音声パラメータ修正方式の構成図
である。第1図において、1は例えば磁気テープ等の話
者の声を収録する装置、2はパーコール方式による音声
分析部、3は音声パラメータ修正部、4は音声パラメー
タ蓄積部、5は音声合成部、6はスピーカ、7は修正用
音声パラメータ蓄積部、そして8はマイクロホンである
。図からも明らかなように、本発明においては新たに修
正用音声パラメータ蓄積部7とマイクロホン8が備えら
れる。これは、後述するように、マイクロホン8を通し
て修正する者が発声した音声を分析して得られるピッチ
、振幅、時間長等の音声パラメータを格納するためのも
のである。
である。第1図において、1は例えば磁気テープ等の話
者の声を収録する装置、2はパーコール方式による音声
分析部、3は音声パラメータ修正部、4は音声パラメー
タ蓄積部、5は音声合成部、6はスピーカ、7は修正用
音声パラメータ蓄積部、そして8はマイクロホンである
。図からも明らかなように、本発明においては新たに修
正用音声パラメータ蓄積部7とマイクロホン8が備えら
れる。これは、後述するように、マイクロホン8を通し
て修正する者が発声した音声を分析して得られるピッチ
、振幅、時間長等の音声パラメータを格納するためのも
のである。
このような構成において、第2図に本方式による処理の
流れを示す。図からも明らかように、従来の第4図に示
すステップ48に代えて本方式ではステップ27〜29
が設けられる。即ち、アナランサが発声した音声を分析
して求めた音声パラメータにより合成した音声が異常な
場合、パーコール方式で用いる個人差が少なく性別が同
じならば発声者の違いの影響が大きくない音声パラメー
タ、゛即ち、ピッチパラメータ、振幅パラメータ、時間
長等に着目し、修正を行う者が発声した音声を分析して
求めた音声パラメータと当該話者の音声パラメータとの
間には差が少ないとみて、異常部分を修正者の音声パラ
メータに置き換えるようにしたものである。従って、最
初の手順により音声合成(ステップ24)された音声を
試聴(ステップ25)したところ異常があった場合(ス
テップ26゜No) 、修正を行う者はマイクロホン8
を通して修正用音声を発声しくステップ26)、これを
音声分析しくステップ28)、ピッチ、振幅、時間長等
の音声パラメータの修正を行い(ステップ29)、ステ
ップ24にフィードバックしてもとの音声合成を修正す
るものである。従来は異常があった場合にはステップ4
8 (第4図)の如く音声パラメータの直接当該話者に
よる修正、試聴という試行錯誤を繰り返していたために
修正に時間を要していた。本発明による方式では修正用
音声パラメータ蓄積部7を別個に設は上記手順によって
熟練者でなくても容易に音声パラメータを修正すること
ができる。
流れを示す。図からも明らかように、従来の第4図に示
すステップ48に代えて本方式ではステップ27〜29
が設けられる。即ち、アナランサが発声した音声を分析
して求めた音声パラメータにより合成した音声が異常な
場合、パーコール方式で用いる個人差が少なく性別が同
じならば発声者の違いの影響が大きくない音声パラメー
タ、゛即ち、ピッチパラメータ、振幅パラメータ、時間
長等に着目し、修正を行う者が発声した音声を分析して
求めた音声パラメータと当該話者の音声パラメータとの
間には差が少ないとみて、異常部分を修正者の音声パラ
メータに置き換えるようにしたものである。従って、最
初の手順により音声合成(ステップ24)された音声を
試聴(ステップ25)したところ異常があった場合(ス
テップ26゜No) 、修正を行う者はマイクロホン8
を通して修正用音声を発声しくステップ26)、これを
音声分析しくステップ28)、ピッチ、振幅、時間長等
の音声パラメータの修正を行い(ステップ29)、ステ
ップ24にフィードバックしてもとの音声合成を修正す
るものである。従来は異常があった場合にはステップ4
8 (第4図)の如く音声パラメータの直接当該話者に
よる修正、試聴という試行錯誤を繰り返していたために
修正に時間を要していた。本発明による方式では修正用
音声パラメータ蓄積部7を別個に設は上記手順によって
熟練者でなくても容易に音声パラメータを修正すること
ができる。
尚、パーコール方式は人間の音声に近い合成音が得られ
る点で多く用いられる手法であり、この場合、個人差の
大きい音色を示すにパラメータは用いず、同じ性別なら
ば個人差の少ない音の高さを示すピッチパラメータと、
音の大きさを示す振幅パラメータと、音の長さを示す時
間長を修正することによりもとのアナランサの音色を生
かして容易に異常を修正することができる。
る点で多く用いられる手法であり、この場合、個人差の
大きい音色を示すにパラメータは用いず、同じ性別なら
ば個人差の少ない音の高さを示すピッチパラメータと、
音の大きさを示す振幅パラメータと、音の長さを示す時
間長を修正することによりもとのアナランサの音色を生
かして容易に異常を修正することができる。
以上説明したように本発明によれば音声パラメータを当
該話者により直接修正し、試聴するという手間かはふけ
、当該話者でなくともまた熟練者でなくとも容易に音声
パラメータを修正することができる。また、個人差の少
いパラメータの修正なので当該話者の音色を生かせる利
点もある。
該話者により直接修正し、試聴するという手間かはふけ
、当該話者でなくともまた熟練者でなくとも容易に音声
パラメータを修正することができる。また、個人差の少
いパラメータの修正なので当該話者の音色を生かせる利
点もある。
第1図は本発明に係る音声パラメータ作成方式第2図は
第1図装置の処理フローチャート、第3図は従来の構成
図、および 第4図は第3図装置の処理フローチャートである。 (符号の説明) 1・・・磁気テープ、 2・・・音声分析部、3・・
・音声パラメータ修正部、 4・・・音声パラメータ蓄積部、 5・・・音声合成部、 6・・・スピーカ、7・・・
修正用音声パラメータ蓄積部・8・・・マイクロホン。
第1図装置の処理フローチャート、第3図は従来の構成
図、および 第4図は第3図装置の処理フローチャートである。 (符号の説明) 1・・・磁気テープ、 2・・・音声分析部、3・・
・音声パラメータ修正部、 4・・・音声パラメータ蓄積部、 5・・・音声合成部、 6・・・スピーカ、7・・・
修正用音声パラメータ蓄積部・8・・・マイクロホン。
Claims (1)
- 1、分析合成形の音声処理装置における音声パラメータ
修正方式において、話者の音声を分析して得られる音声
パラメータを格納する音声パラメータ蓄積部と、前記話
者による音声合成に異常があるときに修正を行う者によ
って得られる音声パラメータを格納する修正用音声パラ
メータ蓄積部と、前記音声パラメータ蓄積部の所定の音
声パラメータを修正する音声パラメータ修正部を備え、
前記話者の音声合成に異常があるときは個人差の少い所
定の音声パラメータについて前記修正を行う者の音声パ
ラメータに置き換えて修正を行うことを特徴とする音声
パラメータ修正方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61293516A JPS63147200A (ja) | 1986-12-11 | 1986-12-11 | 音声パラメ−タ修正方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61293516A JPS63147200A (ja) | 1986-12-11 | 1986-12-11 | 音声パラメ−タ修正方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63147200A true JPS63147200A (ja) | 1988-06-20 |
Family
ID=17795748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61293516A Pending JPS63147200A (ja) | 1986-12-11 | 1986-12-11 | 音声パラメ−タ修正方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63147200A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006126556A (ja) * | 2004-10-29 | 2006-05-18 | Nippon Telegr & Teleph Corp <Ntt> | 音声波形データベース構築方法、この方法を実施する装置およびプログラム |
JP2010224418A (ja) * | 2009-03-25 | 2010-10-07 | Kddi Corp | 音声合成装置、方法およびプログラム |
-
1986
- 1986-12-11 JP JP61293516A patent/JPS63147200A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006126556A (ja) * | 2004-10-29 | 2006-05-18 | Nippon Telegr & Teleph Corp <Ntt> | 音声波形データベース構築方法、この方法を実施する装置およびプログラム |
JP4630038B2 (ja) * | 2004-10-29 | 2011-02-09 | 日本電信電話株式会社 | 音声波形データベース構築方法、この方法を実施する装置およびプログラム |
JP2010224418A (ja) * | 2009-03-25 | 2010-10-07 | Kddi Corp | 音声合成装置、方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004525412A (ja) | 合成された音声の了解度を改善するためのランタイム合成装置適合方法およびシステム | |
KR20000028660A (ko) | 스피치 애플리케이션의 언어 모델 갱신 방법 | |
US20050080626A1 (en) | Voice output device and method | |
US8990092B2 (en) | Voice recognition device | |
JP4564416B2 (ja) | 音声合成装置および音声合成プログラム | |
Buron | Generation of a 1000-word vocabulary for a pulse-excited vocoder operating as an audio response unit | |
JPS63147200A (ja) | 音声パラメ−タ修正方式 | |
JPS63149699A (ja) | 音声入出力装置 | |
US20040054524A1 (en) | Speech transformation system and apparatus | |
KR100383061B1 (ko) | 디지털 오디오와 그의 캡션 데이터를 이용한 학습방법 | |
JP2734028B2 (ja) | 音声収録装置 | |
JP3197975B2 (ja) | ピッチ制御方法及び装置 | |
US7130799B1 (en) | Speech synthesis method | |
JP3241582B2 (ja) | 韻律制御装置及び方法 | |
JP2001005482A (ja) | 音声認識方法及び装置 | |
JP2809769B2 (ja) | 音声合成装置 | |
JP3289511B2 (ja) | 音声合成用音源データ作成方法 | |
JP4669988B2 (ja) | 言語学習装置 | |
JPS613241A (ja) | 音声確認方式 | |
JP3285145B2 (ja) | 録音音声データベース検証方法 | |
Morita et al. | Timbre and Height Differences in Self-perceived Own Voices | |
JPS6143797A (ja) | 音声編集出力方式 | |
JPS59107391A (ja) | 発声法訓練装置 | |
JPH01187595A (ja) | 音声再生方法 | |
JPS60225198A (ja) | 規則による音声合成装置 |