JPWO2007063827A1 - 声質変換システム - Google Patents
声質変換システム Download PDFInfo
- Publication number
- JPWO2007063827A1 JPWO2007063827A1 JP2007547942A JP2007547942A JPWO2007063827A1 JP WO2007063827 A1 JPWO2007063827 A1 JP WO2007063827A1 JP 2007547942 A JP2007547942 A JP 2007547942A JP 2007547942 A JP2007547942 A JP 2007547942A JP WO2007063827 A1 JPWO2007063827 A1 JP WO2007063827A1
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speaker
- conversion
- target
- conversion function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 691
- 230000006870 function Effects 0.000 claims abstract description 440
- 238000003860 storage Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 9
- 230000002194 synthesizing effect Effects 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 description 110
- 101150011264 setB gene Proteins 0.000 description 21
- 238000012545 processing Methods 0.000 description 20
- 101100149325 Escherichia coli (strain K12) setC gene Proteins 0.000 description 13
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- 238000007796 conventional method Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 238000001831 conversion spectrum Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 101150049349 setA gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
- G10L2021/0135—Voice conversion or morphing
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Electrically Operated Instructional Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
10 サーバ
101 中間変換関数生成部
102 目標変換関数生成部
20 携帯端末
21 声質変換部
211 中間声質変換部
212 目標声質変換部
(サーバの機能構成)
次に、サーバ10の構成機能について説明する。図2に示すように、サーバ10は、中間変換関数生成部101と、目標変換関数生成部102とを備えている。これらの機能は、サーバ10に搭載されているCPUが記憶装置に記憶されているプログラムに従って処理を実行することにより実現される。
ただし、w( )は周波数の変換を表す関数である。元話者から中間話者への周波数の変換をw1( )、中間話者から目標話者への周波数の変換をw2( )、元話者のスペクトルをs(f)、中間話者のスペクトルをs’(f)、目標話者のスペクトルをs’’(f)とすると、
s’(f)=s(w1(f))
s’’(f)=s’(w2(f))
となる。例えば、図4に示すように、
w1(f)=f/2
w2(f)=2f+5
とし、w1(f)とw2(f)との合成関数をw’(f)とすると、
w’(f)=2(f/2)+5=f+5
となる。この結果、
s’’(f)=s(w’(f))
と表すことができる。このことから、変換関数Fと変換関数Gとを合成することにより元話者の音声を目標話者の音声に変換するための関数の生成が可能であることが判る。
次に携帯端末20の機能構成について説明する。携帯端末20は、例えば、携帯電話機が該当する。なお、携帯電話機以外にも、マイクロフォンが接続されたパーソナルコンピュータであってもよい。図5には、携帯端末20の機能構成を示す。なお、この機能構成は、携帯端末20に搭載されているCPUが不揮発性メモリに記憶されているプログラムに従って処理を実行することにより実現される。同図に示すように、携帯端末20は声質変換部21を備えている。声質変換方法としては、例えば、声質変換部21は、スペクトル系列を変換することによって声質を変換する。或いは、声質変換部21は、スペクトル系列の変換と音源信号との両方の変換を行うことによって声質変換を行う。スペクトル系列としては、ケプストラム係数あるいはLSP(Line Spectral Pair;線形スペクトル対)係数などを用いることができる。スペクトル系列のみならず音源信号に対しても声質変換を行うことで、より目標話者に近づいた音声を得ることが可能である。
次に、図7を参照して、サーバ10における変換関数Gy(i)の学習及び蓄積処理を説明する。
次に、図8を参照して、携帯端末20における元話者x用の変換関数F(x)の取得手順について説明する。
次に、図9を参照して、携帯端末20が声質変換を行う際の処理手順について説明する。なお、携帯端末20の不揮発性メモリには、元話者Aの音声を中間話者の音声に変換するための変換関数F(A)と、中間話者の音声を目標話者yの音声に変換するための変換関数Gとが、サーバ10からダウンロードされて記憶されているものとする。
次に、図10〜16を参照して、変換関数生成処理及び声質変換処理の各種処理パターンについて説明する。
まず、変換関数学習方式が変換後特徴量変換方式である場合について説明する。
(1)図10には、学習に使用するために収録された中間話者の音声が1セット(setA)である場合の学習過程及び変換過程を示す。
(2)図11には、中間話者の音声がTTS又は人により発声された複数セット分(setA,setB)の音声である場合の学習過程及び変換過程を示す。
(3)図12には、学習に使用される元話者の音声の一部がTTS又は人により発声された複数セット分(setA,setB,setC)の音声であり、中間話者の音声が1セット分(setA)の音声である場合の学習過程及び変換過程を示す。
(4)図13には、学習に使用される元話者の音声の一部が、TTS又は人により発声された複数セット分(setA,setB)の音声であり、中間話者の音声がTTS又は人により発声された複数セット分(setA,setC,setD)の音声である場合の学習過程及び変換過程を示す。
次に、変換関数学習方式が変換前特徴量変換方式である場合について説明する。上述した変換後特徴量変換方式では、実際の声質変換処理の手順を考慮して変換関数Gを生成した。これに対して、変換前特徴量変換方式では、変換関数Fと変換関数Gとを独立に学習する。この方式では、学習工程は減少するが、変換後の声質の精度が若干低下することとなる。
(1)図14には、学習用の中間話者の音声が1セット分(setA)の音声である場合の学習過程及び変換過程を示す。
(2)図15には、中間話者の音声がTTS又は人により発声された複数セット分(setA,setB,setC,setD)の音声である場合の学習過程及び変換過程を示す。
(3)図16には、元話者の音声の一部がTTS又は人により発声された複数セット分(ここでは、setA,setB)の音声であり、中間話者の音声がTTS又は人により発声された複数セット分(ここでは、setA,setC,setD)の音声である場合の学習過程及び変換過程を示す。
次に、従来法及び本願手法における声質変換の精度を客観的に評価するために実施した実験手順及び実験結果について説明する。
(1)上述した実施の形態では、声質変換クライアントサーバシステム1を構成する装置のうち、サーバ10が中間変換関数生成部101及び目標変換関数生成部102を備え、携帯端末20が中間声質変換部211及び目標声質変換部212を備えているとして説明した。しかし、これに限定されることはなく、声質変換クライアントサーバシステム1の装置構成、及び、声質変換クライアントサーバシステム1を構成する装置における中間変換関数生成部101、目標変換関数生成部102、中間声質変換部211、及び、目標声質変換部212の配置はいかなる配置であっても構わない。
1)送信側の携帯電話機でLSP(Line Spectral Pair)係数を変換した後(図19(a)参照)、受信側の携帯電話機でデコードする(図19(c)参照)。
2)送信側の携帯電話機でLSP係数及び音源信号を変換した後(図19(b)参照)、受信側の携帯電話機でデコードする(図19(c)参照)。
3)送信側の携帯電話機でエンコードした後(図20(a)参照)、受信側の携帯電話機でLSP係数を変換した後デコードする(図20(b)参照)。
4)送信側の携帯電話機でエンコードした後(図20(a)参照)、受信側の携帯電話機でLSP係数及び音源信号を変換した後、デコードする(図20(c)参照)。
(4)上述した実施の形態においては、音声合成装置としてTTSを用いたが、入力された音声内容を、所定の声質に変換して出力する装置を用いても良い。
(5)上述した実施の形態においては、中間話者の音声への変換を介する2段階の声質変換について説明している。しかし、これに限定されることはなく、複数の中間話者の音声への変換を介する多段階の声質変換であってもよい。
Claims (13)
- 元話者の音声を目標話者の音声に変換する声質変換システムにおいて、
元話者の音声を、中間話者の音声への変換を介して、目標話者の音声に変換する声質変換手段を備えることを特徴とする声質変換システム。 - 1つ以上の元話者各々の音声を1つ以上の目標話者各々の音声に変換するための関数を学習する声質変換学習システムにおいて、
前記元話者の音声を、前記1つ以上の元話者各々に対し共通に設けられた1つの中間話者の音声へ変換するための中間変換関数を学習し生成する中間変換関数生成手段と、
前記中間話者の音声を前記目標話者の音声に変換するための目標変換関数を学習し生成する目標変換関数生成手段と
を備えることを特徴とする声質変換学習システム。 - 前記目標変換関数生成手段は、
前記元話者の音声が前記中間変換関数によって変換された後の音声を前記目標話者の音声に変換するための関数を、前記目標変換関数として生成することを特徴とする
請求項2に記載の声質変換学習システム。 - 前記学習に用いられる中間話者の音声は、任意の音声内容を所定の声質で出力する音声合成装置から出力される音声であることを特徴とする
請求項2又は3に記載の声質変換学習システム。 - 前記学習に用いられる元話者の音声は、任意の音声内容を所定の声質で出力する音声合成装置から出力される音声であることを特徴とする
請求項2から4の何れか1項に記載の声質変換学習システム。 - 前記中間変換関数生成手段により生成された中間変換関数と、前記目標変換関数生成手段により生成された目標変換関数とを合成することにより、前記元話者の音声を前記目標話者の音声に変換するための関数を生成する変換関数合成手段をさらに備えることを特徴とする
請求項2から5の何れか1項に記載の声質変換学習システム。 - 請求項2から6の何れか1項に記載の声質変換学習システムにより生成された関数を用いて、前記元話者の音声を前記目標話者の音声に変換する声質変換手段を備えることを特徴とする声質変換システム。
- 前記声質変換手段は、
前記中間変換関数を用いて、前記元話者の音声から前記中間話者の音声を生成する中間声質変換手段と、
前記目標変換関数を用いて、前記中間声質変換手段により生成された前記中間話者の音声から前記目標話者の音声を生成する目標声質変換手段とを備えることを特徴とする
請求項7に記載の声質変換システム。 - 前記声質変換手段は、
前記中間変換関数と前記目標変換関数とが合成された関数を用いて、前記元話者の音声を前記目標話者の音声に変換することを特徴とする
請求項7に記載の声質変換システム。 - 前記声質変換手段は、音声の特徴量であるスペクトル系列を変換することを特徴とする
請求項7から9の何れか1項に記載の声質変換システム。 - クライアントコンピュータとサーバコンピュータとがネットワークを介して接続され、1つ以上のユーザ各々の音声を1つ以上の目標話者各々の音声に変換する声質変換クライアントサーバシステムにおいて、
前記クライアントコンピュータは、
前記ユーザの音声を取得するユーザ音声取得手段と、
前記ユーザ音声取得手段により取得した前記ユーザの音声を前記サーバコンピュータへ送信するユーザ音声送信手段と、
前記ユーザの音声を前記1つ以上のユーザ各々に共通に設けられた1つの中間話者の音声へ変換するための中間変換関数を前記サーバコンピュータから受信する中間変換関数受信手段と、
前記中間話者の音声を前記目標話者の音声へ変換するための目標変換関数を、前記サーバコンピュータから受信する目標変換関数受信手段と備え、
前記サーバコンピュータは、
前記クライアントコンピュータから前記ユーザの音声を受信するユーザ音声受信手段と、
前記中間話者の音声を予め記憶する中間話者音声記憶手段と、
前記ユーザの音声を前記中間話者の音声へ変換するための中間変換関数を生成する中間変換関数生成手段と、
前記目標話者の音声を予め記憶する目標話者音声記憶手段と、
前記中間話者の音声を前記目標話者の音声へ変換するための目標変換関数を生成する目標変換関数生成手段と、
前記中間変換関数を前記クライアントコンピュータへ送信する中間変換関数送信手段と、
前記目標変換関数を前記クライアントコンピュータへ送信する目標変換関数送信手段とを備え、
更に前記クライアントコンピュータは、
前記中間変換関数を用いて、前記ユーザの音声から前記中間話者の音声を生成する中間声質変換手段と、
前記目標変換関数を用いて、当該中間話者の音声から前記目標話者の音声を生成する目標変換手段と
を備えることを特徴とする声質変換クライアントサーバシステム。 - コンピュータに、
1つ以上の元話者各々の音声を1つの中間話者の音声に変換するための中間変換関数各々を生成する中間変換関数生成ステップと、
1つの中間話者の音声を1つ以上の目標話者各々の音声に変換するための目標変換関数各々を生成する目標変換関数生成ステップと
の少なくとも一方のステップを実行させるためのプログラム。 - コンピュータに、
元話者の音声を中間話者の音声に変換するための中間変換関数、及び、前記中間話者の音声を目標話者の音声に変換するための目標変換関数を取得する変換関数取得ステップと、
前記変換関数取得ステップにおいて取得された中間変換関数を用いて、前記元話者の音声から前記中間話者の音声を生成する中間声質変換ステップと、
前記変換関数取得ステップにおいて取得された目標変換関数を用いて、前記中間声質変換ステップにおいて生成された前記中間話者の音声から前記目標話者の音声を生成する目標声質変換ステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007547942A JP4928465B2 (ja) | 2005-12-02 | 2006-11-28 | 声質変換システム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005349754 | 2005-12-02 | ||
JP2005349754 | 2005-12-02 | ||
JP2007547942A JP4928465B2 (ja) | 2005-12-02 | 2006-11-28 | 声質変換システム |
PCT/JP2006/323667 WO2007063827A1 (ja) | 2005-12-02 | 2006-11-28 | 声質変換システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007063827A1 true JPWO2007063827A1 (ja) | 2009-05-07 |
JP4928465B2 JP4928465B2 (ja) | 2012-05-09 |
Family
ID=38092160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007547942A Expired - Fee Related JP4928465B2 (ja) | 2005-12-02 | 2006-11-28 | 声質変換システム |
Country Status (6)
Country | Link |
---|---|
US (1) | US8099282B2 (ja) |
EP (1) | EP2017832A4 (ja) |
JP (1) | JP4928465B2 (ja) |
KR (1) | KR101015522B1 (ja) |
CN (1) | CN101351841B (ja) |
WO (1) | WO2007063827A1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4817250B2 (ja) * | 2006-08-31 | 2011-11-16 | 国立大学法人 奈良先端科学技術大学院大学 | 声質変換モデル生成装置及び声質変換システム |
US8751239B2 (en) * | 2007-10-04 | 2014-06-10 | Core Wireless Licensing, S.a.r.l. | Method, apparatus and computer program product for providing text independent voice conversion |
US8131550B2 (en) * | 2007-10-04 | 2012-03-06 | Nokia Corporation | Method, apparatus and computer program product for providing improved voice conversion |
EP2104096B1 (en) * | 2008-03-20 | 2020-05-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal |
JP5038995B2 (ja) * | 2008-08-25 | 2012-10-03 | 株式会社東芝 | 声質変換装置及び方法、音声合成装置及び方法 |
US9058818B2 (en) * | 2009-10-22 | 2015-06-16 | Broadcom Corporation | User attribute derivation and update for network/peer assisted speech coding |
US9798653B1 (en) * | 2010-05-05 | 2017-10-24 | Nuance Communications, Inc. | Methods, apparatus and data structure for cross-language speech adaptation |
JP5961950B2 (ja) * | 2010-09-15 | 2016-08-03 | ヤマハ株式会社 | 音声処理装置 |
CN103856390B (zh) * | 2012-12-04 | 2017-05-17 | 腾讯科技(深圳)有限公司 | 即时通讯方法及系统、通讯信息处理方法、终端 |
US9613620B2 (en) | 2014-07-03 | 2017-04-04 | Google Inc. | Methods and systems for voice conversion |
JP6543820B2 (ja) * | 2015-06-04 | 2019-07-17 | 国立大学法人電気通信大学 | 声質変換方法および声質変換装置 |
CN111201565A (zh) * | 2017-05-24 | 2020-05-26 | 调节股份有限公司 | 用于声对声转换的系统和方法 |
JP6773634B2 (ja) * | 2017-12-15 | 2020-10-21 | 日本電信電話株式会社 | 音声変換装置、音声変換方法及びプログラム |
US20190362737A1 (en) * | 2018-05-25 | 2019-11-28 | i2x GmbH | Modifying voice data of a conversation to achieve a desired outcome |
TW202009924A (zh) * | 2018-08-16 | 2020-03-01 | 國立臺灣科技大學 | 音色可選之人聲播放系統、其播放方法及電腦可讀取記錄媒體 |
CN109377986B (zh) * | 2018-11-29 | 2022-02-01 | 四川长虹电器股份有限公司 | 一种非平行语料语音个性化转换方法 |
CN110085254A (zh) * | 2019-04-22 | 2019-08-02 | 南京邮电大学 | 基于beta-VAE和i-vector的多对多语音转换方法 |
CN110071938B (zh) * | 2019-05-05 | 2021-12-03 | 广州虎牙信息科技有限公司 | 虚拟形象互动方法、装置、电子设备及可读存储介质 |
US11854562B2 (en) * | 2019-05-14 | 2023-12-26 | International Business Machines Corporation | High-quality non-parallel many-to-many voice conversion |
US11538485B2 (en) | 2019-08-14 | 2022-12-27 | Modulate, Inc. | Generation and detection of watermark for real-time voice conversion |
CN116670754A (zh) | 2020-10-08 | 2023-08-29 | 调节公司 | 用于内容审核的多阶段自适应系统 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993018505A1 (en) * | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
FI96247C (fi) * | 1993-02-12 | 1996-05-27 | Nokia Telecommunications Oy | Menetelmä puheen muuntamiseksi |
JP3282693B2 (ja) * | 1993-10-01 | 2002-05-20 | 日本電信電話株式会社 | 声質変換方法 |
JP3354363B2 (ja) | 1995-11-28 | 2002-12-09 | 三洋電機株式会社 | 音声変換装置 |
US6336092B1 (en) * | 1997-04-28 | 2002-01-01 | Ivl Technologies Ltd | Targeted vocal transformation |
JPH1185194A (ja) | 1997-09-04 | 1999-03-30 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 声質変換音声合成装置 |
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
IL140082A0 (en) * | 2000-12-04 | 2002-02-10 | Sisbit Trade And Dev Ltd | Improved speech transformation system and apparatus |
JP3754613B2 (ja) * | 2000-12-15 | 2006-03-15 | シャープ株式会社 | 話者特徴推定装置および話者特徴推定方法、クラスタモデル作成装置、音声認識装置、音声合成装置、並びに、プログラム記録媒体 |
JP3703394B2 (ja) | 2001-01-16 | 2005-10-05 | シャープ株式会社 | 声質変換装置および声質変換方法およびプログラム記憶媒体 |
US7050979B2 (en) * | 2001-01-24 | 2006-05-23 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for converting a spoken language to a second language |
JP2002244689A (ja) * | 2001-02-22 | 2002-08-30 | Rikogaku Shinkokai | 平均声の合成方法及び平均声からの任意話者音声の合成方法 |
CN1156819C (zh) * | 2001-04-06 | 2004-07-07 | 国际商业机器公司 | 由文本生成个性化语音的方法 |
JP2003157100A (ja) * | 2001-11-22 | 2003-05-30 | Nippon Telegr & Teleph Corp <Ntt> | 音声通信方法及び装置、並びに音声通信プログラム |
US7275032B2 (en) * | 2003-04-25 | 2007-09-25 | Bvoice Corporation | Telephone call handling center where operators utilize synthesized voices generated or modified to exhibit or omit prescribed speech characteristics |
JP4829477B2 (ja) | 2004-03-18 | 2011-12-07 | 日本電気株式会社 | 声質変換装置および声質変換方法ならびに声質変換プログラム |
FR2868587A1 (fr) * | 2004-03-31 | 2005-10-07 | France Telecom | Procede et systeme de conversion rapides d'un signal vocal |
US8666746B2 (en) * | 2004-05-13 | 2014-03-04 | At&T Intellectual Property Ii, L.P. | System and method for generating customized text-to-speech voices |
EP1846918B1 (fr) | 2005-01-31 | 2009-02-25 | France Télécom | Procede d'estimation d'une fonction de conversion de voix |
US20080161057A1 (en) * | 2005-04-15 | 2008-07-03 | Nokia Corporation | Voice conversion in ring tones and other features for a communication device |
-
2006
- 2006-11-28 WO PCT/JP2006/323667 patent/WO2007063827A1/ja active Application Filing
- 2006-11-28 CN CN2006800453611A patent/CN101351841B/zh not_active Expired - Fee Related
- 2006-11-28 KR KR1020087012959A patent/KR101015522B1/ko not_active IP Right Cessation
- 2006-11-28 JP JP2007547942A patent/JP4928465B2/ja not_active Expired - Fee Related
- 2006-11-28 EP EP06833471A patent/EP2017832A4/en not_active Withdrawn
- 2006-11-28 US US12/085,922 patent/US8099282B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101351841B (zh) | 2011-11-16 |
US20100198600A1 (en) | 2010-08-05 |
JP4928465B2 (ja) | 2012-05-09 |
EP2017832A4 (en) | 2009-10-21 |
US8099282B2 (en) | 2012-01-17 |
EP2017832A1 (en) | 2009-01-21 |
WO2007063827A1 (ja) | 2007-06-07 |
CN101351841A (zh) | 2009-01-21 |
KR101015522B1 (ko) | 2011-02-16 |
KR20080070725A (ko) | 2008-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4928465B2 (ja) | 声質変換システム | |
US9430467B2 (en) | Mobile speech-to-speech interpretation system | |
CN111899719A (zh) | 用于生成音频的方法、装置、设备和介质 | |
US7966186B2 (en) | System and method for blending synthetic voices | |
JPWO2008149547A1 (ja) | 声質編集装置および声質編集方法 | |
JPH10260692A (ja) | 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム | |
WO2020145353A1 (ja) | コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法 | |
JP4829477B2 (ja) | 声質変換装置および声質変換方法ならびに声質変換プログラム | |
CN101901598A (zh) | 一种哼唱合成方法和系统 | |
US20070129946A1 (en) | High quality speech reconstruction for a dialog method and system | |
CN114999443A (zh) | 语音生成方法及装置、存储介质、电子设备 | |
KR20190046305A (ko) | 음성데이터 마켓 시스템 및 음성데이터 마켓 시스템으로 음성을 제공하는 방법 | |
JP2001034280A (ja) | 電子メール受信装置および電子メールシステム | |
JP6864322B2 (ja) | 音声処理装置、音声処理プログラムおよび音声処理方法 | |
KR102639322B1 (ko) | 실시간 음색 및 운율 스타일 복제 가능한 음성합성 시스템 및 방법 | |
KR20220154655A (ko) | 가족 관계에 기초하여 음성 데이터를 생성하는 장치, 방법 및 컴퓨터 프로그램 | |
JP7339151B2 (ja) | 音声合成装置、音声合成プログラム及び音声合成方法 | |
JP6003352B2 (ja) | データ生成装置、及びデータ生成方法 | |
JP2018205768A (ja) | 発話リズム変換装置、方法及びプログラム | |
KR102418465B1 (ko) | 동화 낭독 서비스를 제공하는 서버, 방법 및 컴퓨터 프로그램 | |
Zaim | Two channel adaptive speech enhancement | |
KR20110021439A (ko) | 음성 스트림 변환 장치 및 방법 | |
CN114882868A (zh) | 语音合成、情绪迁移、交互方法、存储介质、程序产品 | |
CN117636842A (zh) | 基于韵律情感迁移的语音合成系统及方法 | |
WO2014203329A1 (ja) | 音声応答装置および応答音声生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090611 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120210 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4928465 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |