JPS63147200A

JPS63147200A - 音声パラメ−タ修正方式

Info

Publication number: JPS63147200A
Application number: JP61293516A
Authority: JP
Inventors: 加世田　光子
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1986-12-11
Filing date: 1986-12-11
Publication date: 1988-06-20

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概　要〕本発明は音声合成において、話者であるアナランサの発
声ミス、分析時のエラー等による音質の劣化に対処する
ため音声パラメータの修正を行うに際し、個人差の少い
ピンチ、振幅、時間長等の音声パラメータについては修
正を行う者により音声パラメータを修正してアナランサ
の音声合成を得るようにしたものであり、熟練者でなく
ても容易に音声合成の修正が行えるようにしたものであ
る。

〔産業上の利用分野〕

本発明は分析合成形の音声処理装置における音声パラメ
ータ修正方式に関する。

〔従来の技術及び発明が解決しようとする問題点〕音声
合成は、例えば電話による銀行の貯金残高の照会や、住
宅情報などの問い合せに対する回答を、予め蓄えられた
音声パラメータに基づいて合成した音声により行なう音
声応答システム等に用いられている。一般に音声合成は
合成形と編集形の２種に大別され、前者は音声生成モデ
ルにもとづいて回路的に処理するものであり、さらに合
成形は分析合成形と法則合成形に分類され、前者は単語
や文節単位の音声から声道の音響伝達特性と駆動音源特
性を抽出して記憶しておき、これにより音声合成器を制
御して文音声を合成するものである。そして分析合成形
の一つとして音声信号を統計的に処理するパーコール（
ＰＡＲＣＯＲ）方式が代表的に用いられている。

第３図は従来の合成用音声パラメータ作成システムの構
成図である。１は磁気テープ等の話者の声を収録する装
置、２は音声分析部、３は音声パラメータ修正部、４は
音声パラメータ蓄積部、５は音声合成部、６はスピーカ
である。このような構成におＪ、ｓで、第４図に従来の
合成用音声パラメータの処理の流れを示す。第４図に示
すように、アナランサなどが発声した音声を読み込み（
ステップ４１）、この音声のピッチ、振幅、時間長、Ｋ
パラメータ等を分析しくステップ４２）、その話者につ
いての分析結果を音声パラメータとして蓄積部へ蓄積し
くステップ４３）、再生するときに音声合成（ステップ
４４）した後試聴しくステップ４５）、音声が良好か否
か判断しくステップ４６）、異常がある場合には音声パ
ラメータの修正（ステップ４８）を直接当該話者を再び
呼んできて行いステップ４４に戻り修正後の試聴を繰り
返していた。即ち、再発声してもらった声と置き換える
か熟練者が見当をつ１すて値を手で修正、試聴を何度も
繰り返すことにより自然な音声に近づけていた。

このような手順で明らかなように、音声に異常がある場
合は音声パラメータを再び直接当該話者を呼んできて再
発声させた声と置き換えるが見当をつけ、パラメータの
値を修正、試聴を繰り返すという効率が悪く、負担の大
きい作業を必要としていた。この場合、修正する者は多
くの熟練を必要とし、また合成される音が不自然になる
ことも多い。

〔問題点を解決するための手段および作用〕本発明は上
述した問題点を解消した音声処理装置における音声パラ
メータ修正方式を提供することにあり、その手段は、ア
ナランサ等の話者の音声を分析して得られる音声パラメ
ータを格納する音声パラメータ蓄積部と、前記話者によ
る音声合成に異常があるときに修正を行う者によって得
られる音声パラメータを格納する修正用音声パラメータ
蓄積部と、前記音声パラメータ蓄積部の所定の音声パラ
メータを修正する音声パラメータ修正部を備え、前記話
者の音声合成に異常があるときは個人差の少い所定の音
声パラメータについて前記修正を行う者の音声パラメー
タに置き換えて修正を行うことを特徴とする。

〔実施例〕

第１図は本発明に係る音声パラメータ修正方式の構成図
である。第１図において、１は例えば磁気テープ等の話
者の声を収録する装置、２はパーコール方式による音声
分析部、３は音声パラメータ修正部、４は音声パラメー
タ蓄積部、５は音声合成部、６はスピーカ、７は修正用
音声パラメータ蓄積部、そして８はマイクロホンである
。図からも明らかなように、本発明においては新たに修
正用音声パラメータ蓄積部７とマイクロホン８が備えら
れる。これは、後述するように、マイクロホン８を通し
て修正する者が発声した音声を分析して得られるピッチ
、振幅、時間長等の音声パラメータを格納するためのも
のである。

このような構成において、第２図に本方式による処理の
流れを示す。図からも明らかように、従来の第４図に示
すステップ４８に代えて本方式ではステップ２７〜２９
が設けられる。即ち、アナランサが発声した音声を分析
して求めた音声パラメータにより合成した音声が異常な
場合、パーコール方式で用いる個人差が少なく性別が同
じならば発声者の違いの影響が大きくない音声パラメー
タ、゛即ち、ピッチパラメータ、振幅パラメータ、時間
長等に着目し、修正を行う者が発声した音声を分析して
求めた音声パラメータと当該話者の音声パラメータとの
間には差が少ないとみて、異常部分を修正者の音声パラ
メータに置き換えるようにしたものである。従って、最
初の手順により音声合成（ステップ２４）された音声を
試聴（ステップ２５）したところ異常があった場合（ス
テップ２６゜Ｎｏ）　、修正を行う者はマイクロホン８
を通して修正用音声を発声しくステップ２６）、これを
音声分析しくステップ２８）、ピッチ、振幅、時間長等
の音声パラメータの修正を行い（ステップ２９）、ステ
ップ２４にフィードバックしてもとの音声合成を修正す
るものである。従来は異常があった場合にはステップ４
８　（第４図）の如く音声パラメータの直接当該話者に
よる修正、試聴という試行錯誤を繰り返していたために
修正に時間を要していた。本発明による方式では修正用
音声パラメータ蓄積部７を別個に設は上記手順によって
熟練者でなくても容易に音声パラメータを修正すること
ができる。

尚、パーコール方式は人間の音声に近い合成音が得られ
る点で多く用いられる手法であり、この場合、個人差の
大きい音色を示すにパラメータは用いず、同じ性別なら
ば個人差の少ない音の高さを示すピッチパラメータと、
音の大きさを示す振幅パラメータと、音の長さを示す時
間長を修正することによりもとのアナランサの音色を生
かして容易に異常を修正することができる。

〔発明の効果〕

以上説明したように本発明によれば音声パラメータを当
該話者により直接修正し、試聴するという手間かはふけ
、当該話者でなくともまた熟練者でなくとも容易に音声
パラメータを修正することができる。また、個人差の少
いパラメータの修正なので当該話者の音色を生かせる利
点もある。

【図面の簡単な説明】

第１図は本発明に係る音声パラメータ作成方式第２図は
第１図装置の処理フローチャート、第３図は従来の構成
図、および第４図は第３図装置の処理フローチャートである。（符号の説明）１・・・磁気テープ、　　２・・・音声分析部、３・・
・音声パラメータ修正部、４・・・音声パラメータ蓄積部、５・・・音声合成部、　　６・・・スピーカ、７・・・
修正用音声パラメータ蓄積部・８・・・マイクロホン。

Claims

【特許請求の範囲】

１、分析合成形の音声処理装置における音声パラメータ
修正方式において、話者の音声を分析して得られる音声
パラメータを格納する音声パラメータ蓄積部と、前記話
者による音声合成に異常があるときに修正を行う者によ
って得られる音声パラメータを格納する修正用音声パラ
メータ蓄積部と、前記音声パラメータ蓄積部の所定の音
声パラメータを修正する音声パラメータ修正部を備え、
前記話者の音声合成に異常があるときは個人差の少い所
定の音声パラメータについて前記修正を行う者の音声パ
ラメータに置き換えて修正を行うことを特徴とする音声
パラメータ修正方式。