JP3354363B2 - 音声変換装置 - Google Patents

音声変換装置

Info

Publication number
JP3354363B2
JP3354363B2 JP30917695A JP30917695A JP3354363B2 JP 3354363 B2 JP3354363 B2 JP 3354363B2 JP 30917695 A JP30917695 A JP 30917695A JP 30917695 A JP30917695 A JP 30917695A JP 3354363 B2 JP3354363 B2 JP 3354363B2
Authority
JP
Japan
Prior art keywords
voice
speech
speaker
conversion
conversion coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30917695A
Other languages
English (en)
Other versions
JPH09146597A (ja
Inventor
宏樹 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP30917695A priority Critical patent/JP3354363B2/ja
Publication of JPH09146597A publication Critical patent/JPH09146597A/ja
Application granted granted Critical
Publication of JP3354363B2 publication Critical patent/JP3354363B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、たとえば、第1
の話者の音声を第2の話者の音声に変換する音声変換装
置に関する。
【0002】
【従来の技術】第1の話者の入力音声から音声合成パラ
メータを抽出し、抽出された音声合成パラメータを変換
係数を用いて変換し、変換された音声合成パラメータか
ら音声を合成することにより入力音声を第2の話者の音
声に変換する音声変換装置が知られている。
【0003】
【発明が解決しようとする課題】この発明は、第1の話
者の入力音声から、第1の話者と第2の話者との中間の
出力音声を得ることができる音声変換装置を提供するこ
とを目的とする。
【0004】この発明は、第1の話者の入力音声に基づ
いて、第1の話者の音声から第2の話者の音声に徐々に
変化していく出力音声を得ることができる音声変換装置
を提供することを目的とする。
【0005】
【課題を解決するための手段】この発明の音声変換装置
は、第1の話者の入力音声から音声合成パラメータを抽
出し、抽出された音声合成パラメータを変換係数を用い
て変換し、変換された音声合成パラメータから音声を合
成することにより入力音声を第2の話者の音声に変換す
る音声変換装置において、合成音声が第1の話者の音声
から第2の話者の音声に徐々に接近していくように、変
換係数を徐々に変化させていく変換係数制御手段、入力
音声から音声合成パラメータを抽出する音声分析手段、
音声分析手段によって抽出された音声合成パラメータ
を、変換係数制御手段によって生成された変換係数を用
いて変換する音声合成パラメータ変換手段、および音声
合成パラメータ変換手段によって得られた音声合成パラ
メータに基づいて音声を合成する音声合成手段を備えて
いることを特徴とする。
【0006】
【0007】
【0008】
【0009】変換係数の時間に対する変化の割合を設定
するための設定手段を設けておくことが好ましい。この
場合には、変換係数制御手段は、設定手段によって設定
された変化の割合で、変換係数を変化させる。
【0010】この発明による第2の音声変換装置では、
第1の話者の入力音声に基づいて、第1の話者の音声か
ら第2の話者の音声に徐々に変化していく出力音声が得
られる。
【0011】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。
【0012】図1は、音声変換装置の構成を示してい
る。音声変換装置は、入力音声を分析して音声合成パラ
メータを生成する音声分析部1、音声合成パラメータを
変換係数Wを用いて変換する音声合成パラメータ変換部
2、変換された音声合成パラメータから音声を合成する
音声合成部3、変換係数Wを制御するための変換係数制
御部4および音声変換モードの設定、その他の設定を行
なうための操作部5を備えている。
【0013】音声変換モードには、話者Aの音声を話者
Bの音声に変換する第1モード、話者Aの音声を話者A
と話者Bの中間の音声に変換する第2モード、および話
者Aの音声を話者Aの音声から話者Bの音声に徐々に変
換していく第3モードがある。
【0014】(1)第1モードの説明 まず、第1モードが設定されている場合の動作について
説明する。
【0015】話者Aの音声が入力音声として、音声分析
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
(フォルマント周波数と、その帯域幅とを表すパラメー
タ)Fa=(f1,f2,…fn)が抽出される。
【0016】音声合成パラメータ変換部2では、変換係
数Wを用い、数式1に基づいて、フォルマントパラメー
タFa=(f1,f2,…fn)をFb=(f1' ,f
2',…fn' )に変換する。第1モードが設定されて
いる場合には、変換係数Wとしては、話者Aに対するフ
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wが用いら
れる。
【0017】
【数1】
【0018】つまり、入力音声波形のフォルマントパラ
メータFa=(f1,f2,…fn)が、話者Bに対す
るフォルマントパラメータFb=(f1’,f2’,…
fn’)に変換される。話者Aに対するフォルマントパ
ラメータFaを話者Bに対するフォルマントパラメータ
Fbに変換するための変換係数wは、話者Aの音声のフ
ォルマントパラメータと話者Bの音声のフォルマントパ
ラメータとを複数サンプリングしておき、これらのサン
プルと数式1とを用いて求められている。
【0019】音声合成部3では、音声合成パラメータ変
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。こ
れにより、話者Bに対する音声が得られる。
【0020】(2)第2モードの説明 第2モードが設定されている場合の動作について説明す
る。
【0021】話者Aの音声が入力音声として、音声分析
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
Fa=(f1,f2,…fn)が抽出される。
【0022】変換係数制御部4では、話者Aに対するフ
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wから、話
者Aと話者Bとの中間の音声を得るための変換係数Wを
生成する。
【0023】話者Aと話者Bとの中間の音声を得るため
の変換係数Wは、次の数式2に基づいて求められる。
【0024】
【数2】
【0025】ここで、xの値(0≦x≦1)は、操作部
5によって指定される。xの値が大きいほど出力音声は
話者Aに近くなり、xの値が小さいほど(yの値が大き
いほど)出力音声は話者Bに近くなる。
【0026】音声合成パラメータ変換部2では、変換係
数制御部4によって生成された変換係数W(=x・w+
y)を用いて、数式1によりフォルマントパラメータF
a=(f1,f2,…fn)をFb=(f1’,f
2’,…fn’)に変換する。
【0027】つまり、数式1に基づいて、入力音声波形
のフォルマントパラメータFa=(f1,f2,…f
n)が、話者Aと話者Bとの中間の音声に対するフォル
マントパラメータFb=(f1’,f2’,…fn’)
に変換される。
【0028】音声合成部3では、音声合成パラメータ変
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。こ
れにより、話者Aと話者Bとの中間の音声が得られる。
【0029】(3)第3モードの説明 第3モードが設定されている場合の動作について説明す
る。
【0030】話者Aの音声が入力音声として、音声分析
部1に入力される。音声分析部1では、入力音声を分析
し、音声合成パラメータを生成する。この例では、音声
分析部1では、入力音声波形のフォルマントパラメータ
Fa=(f1,f2,…fn)が抽出される。
【0031】変換係数制御部4では、話者Aに対するフ
ォルマントパラメータFaを話者Bに対するフォルマン
トパラメータFbに変換するための変換係数wから、話
者Aと話者Bとの中間の音声を得るための変換係数Wを
上記数式2に基づいて生成する。
【0032】第3モードが設定されている場合には、変
換係数制御部4では、数式2の変換係数W中のxを0か
ら1に徐々に変化させる。単位時間に対するxの変化
量、すなわちxの変化率は、操作部5によって指定され
る。
【0033】音声合成パラメータ変換部2では、変換係
数制御部4によって生成された変換係数W(=x・w+
y)を用いて、数式1によりフォルマントパラメータF
a=(f1,f2,…fn)をFb=(f1’,f
2’,…fn’)に変換する。変換係数W(=x・w+
y)中のxが0から1に徐々に変化するので、数式1に
より得られるフォルマントパラメータFb=(f1’,
f2’,…fn’)も、話者Aの音声に対応するものか
ら、話者Bの音声に対応するものに徐々に変化する。
【0034】音声合成部3では、音声合成パラメータ変
換部2によって得られたフォルマントパラメータFb=
(f1’,f2’,…fn’)から音声を合成する。し
たがって、合成された音声は、話者Aの音声から話者B
の音声に徐々に変化していく。
【0035】上記実施の形態では、音声合成パラメータ
としてフォルマントパラメータ(フォルマント周波数と
その帯域幅とを表すパラメータ)が用いられているが、
音声合成パラメータとして線スペクトル対( LSP: li
ne spectral pair) 、パーコール(PARCOR:part
ial auto correlation) 、ケプストラム(Cepstrum)や調
音パラメータ等を用いてもよい。
【0036】
【発明の効果】この発明によれば、第1の話者の入力音
声から、第1の話者と第2の話者との中間の出力音声を
得ることができる。
【0037】この発明によれば、第1の話者の入力音声
に基づいて、第1の話者の音声から第2の話者の音声に
徐々に変化していく出力音声を得ることができる。
【図面の簡単な説明】
【図1】音声変換装置の概略構成を示す構成図である。
【符号の説明】
1 音声分析部 2 音声合成パラメータ変換部 3 音声合成部 4 変換係数制御部 5 操作部

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1の話者の入力音声から音声合成パラ
    メータを抽出し、抽出された音声合成パラメータを変換
    係数を用いて変換し、変換された音声合成パラメータか
    ら音声を合成することにより入力音声を第2の話者の音
    声に変換する音声変換装置において、 合成音声が第1の話者の音声から第2の話者の音声に徐
    々に接近していくように、変換係数を徐々に変化させて
    いく変換係数制御手段、 入力音声から音声合成パラメータを抽出する音声分析手
    段、 音声分析手段によって抽出された音声合成パラメータ
    を、変換係数制御手段によって生成された変換係数を用
    いて変換する音声合成パラメータ変換手段、および音声
    合成パラメータ変換手段によって得られた音声合成パラ
    メータに基づいて音声を合成する音声合成手段、 を備えていることを特徴とする音声変換装置。
  2. 【請求項2】 変換係数の時間に対する変化の割合を設
    定するための設定手段が設けられており、変換係数制御
    手段は、設定手段によって設定された変化の割合で、変
    換係数を変化させていくものである請求項1に記載の音
    声変換装置。
JP30917695A 1995-11-28 1995-11-28 音声変換装置 Expired - Fee Related JP3354363B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30917695A JP3354363B2 (ja) 1995-11-28 1995-11-28 音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30917695A JP3354363B2 (ja) 1995-11-28 1995-11-28 音声変換装置

Publications (2)

Publication Number Publication Date
JPH09146597A JPH09146597A (ja) 1997-06-06
JP3354363B2 true JP3354363B2 (ja) 2002-12-09

Family

ID=17989854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30917695A Expired - Fee Related JP3354363B2 (ja) 1995-11-28 1995-11-28 音声変換装置

Country Status (1)

Country Link
JP (1) JP3354363B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4720974B2 (ja) * 2004-12-21 2011-07-13 株式会社国際電気通信基礎技術研究所 音声発生装置およびそのためのコンピュータプログラム
EP2017832A4 (en) 2005-12-02 2009-10-21 Asahi Chemical Ind VOICE QUALITY CONVERSION SYSTEM

Also Published As

Publication number Publication date
JPH09146597A (ja) 1997-06-06

Similar Documents

Publication Publication Date Title
JP2763322B2 (ja) 音声処理方法
JP4624552B2 (ja) 狭帯域言語信号からの広帯域言語合成
JP6024191B2 (ja) 音声合成装置および音声合成方法
EP2555188B1 (en) Bandwidth extension apparatuses and methods
JP4170217B2 (ja) ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム
EP1701336B1 (en) Sound processing apparatus and method, and program therefor
CN109416911B (zh) 声音合成装置及声音合成方法
JPH11327595A (ja) スペクトロ―テンポラル自己相関を用いたピッチ決定装置及び方法
JP2002082685A (ja) 音声帯域拡張装置及び音声帯域拡張方法
US6513007B1 (en) Generating synthesized voice and instrumental sound
JP3354363B2 (ja) 音声変換装置
JPH03136100A (ja) 音声処理方法及び装置
US5864796A (en) Speech synthesis with equal interval line spectral pair frequency interpolation
JPH04358200A (ja) 音声合成装置
WO2007135786A1 (ja) 帯域外信号生成装置及び周波数帯域拡張装置
JP4757971B2 (ja) ハーモニー音付加装置
JP2001117600A (ja) 音声信号処理装置および音声信号処理方法
JP2003271200A (ja) 音声合成方法および音声合成装置
JP3414150B2 (ja) コーラス効果付与装置
JP3317458B2 (ja) 音声合成方法
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JP3125951B2 (ja) フォルマント制御方法
JP2000242287A (ja) 発声補助装置およびプログラム記録媒体
JP2001312300A (ja) 音声合成装置
JP3302075B2 (ja) 合成パラメータ変換方法および装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070927

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees