JP4510631B2 - 音声波形の連結を用いる音声合成 - Google Patents
音声波形の連結を用いる音声合成 Download PDFInfo
- Publication number
- JP4510631B2 JP4510631B2 JP2004537379A JP2004537379A JP4510631B2 JP 4510631 B2 JP4510631 B2 JP 4510631B2 JP 2004537379 A JP2004537379 A JP 2004537379A JP 2004537379 A JP2004537379 A JP 2004537379A JP 4510631 B2 JP4510631 B2 JP 4510631B2
- Authority
- JP
- Japan
- Prior art keywords
- interval
- fade
- audio unit
- signal
- intervals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000015572 biosynthetic process Effects 0.000 title description 10
- 238000003786 synthesis reaction Methods 0.000 title description 10
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 17
- 239000012634 fragment Substances 0.000 description 6
- 230000007704 transition Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
- Machine Translation (AREA)
- Mobile Radio Communication Systems (AREA)
- Stereophonic System (AREA)
- Telephonic Communication Services (AREA)
- Stereo-Broadcasting Methods (AREA)
Description
w[n]=0.5−0.5・cos{(π・(n+0.5))/m} , 0≦n<m
がそれである。ここで、mは平滑範囲内の周期の全数である。
w[n]=sin{(0.5・π・(n+0.5))/m} , 0≦n<m
が用いられる。
w[n]=0.5−0.5・cos{(π・(n+0.5))/m} , 0≦n<m
が適用される。ここで、mは平滑範囲内の周期の全数である。対応する二乗コサイン関数が図(d)に、二乗コサイン関数316として示されている。エンド及びフェイドアウトインターバル300及び302に対しては、二乗コサイン関数318を提供するために、対応するウインドウ関数が用いられる。図(e)に示されているように重畳され、加え合わせされるインターバル、すなわちインターバル300/308及びインターバル302/306の時間幅は両者を同じ長さにするためにスケールが見直されている。要求される二音節の次の重畳が単語“young”の合成を提供する。
Claims (14)
- 少なくとも第1音声ユニット及び第2音声ユニットを有する音声信号の合成方法であって、
エンドインターバルを有する第1音声ユニット信号を用意するステップと、
フロントインターバルを有する第2音声ユニット信号を用意するステップと、
前記第1音声ユニット信号の終わりに前記エンドインターバルの周期の少なくとも数個を逆順で付加してフェイドアウトインターバルを用意するステップと、
前記第2音声ユニット信号の始まりに前記フロントインターバルの周期の少なくとも数個を逆順で付加してフェイドインインターバルを用意するステップと、
前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを重畳するステップと、
を備える、音声信号の合成方法。 - 前記エンド及びフロントインターバルがほぼ一定の周期を持っている、請求項1に記載の方法。
- 前記エンド及びフロントインターバルがマーカによって識別される、請求項1又は2に記載の方法。
- 前記エンドインターバルの最後の周期及び前記フロントインターバルの最初の周期は付加されない、請求項1ないし3のいずれか1項に記載の方法。
- 前記エンド及びフェイドアウトインターバルの少なくとも一方をフェイドアウトウインドウでウインドウイングするステップをさらに備える、請求項1ないし4のいずれか1項に記載の方法。
- 前記フェイドアウトウインドウとして二乗コサイン関数が用いられる、請求項5に記載の方法。
- 発声インターバルに対し、mを平滑範囲内の周期の全数として、ウインドウ関数、
w[n]=0.5−0.5・cos{(π・(n+0.5))/m},0≦n<m
が用いられる、請求項6に記載の方法。 - 非発声インターバルに対するフェイドアウトウインドウとしてサインウインドウが用いられる、請求項5に記載の方法。
- mを平滑範囲内の周期の全数として、ウインドウ関数、
w[n]=sin{(0.5・π・(n+0.5))/m},0≦n<m
が用いられる、請求項8に記載の方法。 - 前記第1及び第2音声が二音節、三音節、及びそれ以上の多音節の少なくとも1つ、特に単語である、請求項1ないし9のいずれか1項に記載の方法。
- 前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを適応させるステップをさらに備える、請求項1ないし10のいずれか1項に記載の方法。
- 音声信号が重畳及び加え合わせ操作によって合成される、請求項1ないし11のいずれか1項に記載の方法。
- 少なくとも第1音声ユニット及び第2音声ユニットを有する音声信号を合成するためのプログラムを備えたコンピュータ可読ディジタル記憶メディアであって、
当該プログラムは、コンピュータにより実行されると、
エンドインターバルを有する第1音声ユニット信号を用意するステップと、
フロントインターバルを有する第2音声ユニット信号を用意するステップと、
前記第1音声ユニット信号の終わりに前記エンドインターバルの周期の少なくとも数個を逆順で付加してフェイドアウトインターバルを用意するステップと、
前記第2音声ユニット信号の始まりに前記フロントインターバルの周期の少なくとも数個を逆順で付加してフェイドインインターバルを用意するステップと、
前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを重畳するステップと、
を実行するように構成されている、
コンピュータ可読ディジタル記憶メディア。 - 少なくとも第1音声ユニット及び第2音声ユニットを有する音声信号を合成するためのコンピュータシステム、特にテキスト/音声変換システムであって、
エンドインターバルを有する第1音声ユニット信号を保存する手段と、
フロントインターバルを有する第2音声ユニット信号を保存する手段と、
前記第1音声ユニット信号の終わりに前記エンドインターバルの周期の少なくとも数個を逆順で付加してフェイドアウトインターバルを用意する手段と、
前記第2音声ユニット信号の始まりに前記フロントインターバルの周期の少なくとも数個を逆順で付加してフェイドインインターバルを用意する手段と、
前記エンド及びフェイドインインターバルと前記フェイドアウト及びフロントインターバルとを重畳する手段と、
を備えた、コンピュータシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02078872 | 2002-09-17 | ||
PCT/IB2003/003624 WO2004027756A1 (en) | 2002-09-17 | 2003-08-08 | Speech synthesis using concatenation of speech waveforms |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005539267A JP2005539267A (ja) | 2005-12-22 |
JP4510631B2 true JP4510631B2 (ja) | 2010-07-28 |
Family
ID=32010992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004537379A Expired - Lifetime JP4510631B2 (ja) | 2002-09-17 | 2003-08-08 | 音声波形の連結を用いる音声合成 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7529672B2 (ja) |
EP (1) | EP1543500B1 (ja) |
JP (1) | JP4510631B2 (ja) |
CN (1) | CN100388357C (ja) |
AT (1) | ATE318440T1 (ja) |
AU (1) | AU2003255914A1 (ja) |
DE (1) | DE60303688T2 (ja) |
WO (1) | WO2004027756A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003250410A1 (en) * | 2002-09-17 | 2004-04-08 | Koninklijke Philips Electronics N.V. | Method of synthesis for a steady sound signal |
US20070106513A1 (en) * | 2005-11-10 | 2007-05-10 | Boillot Marc A | Method for facilitating text to speech synthesis using a differential vocoder |
JP6047922B2 (ja) * | 2011-06-01 | 2016-12-21 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
US10382143B1 (en) * | 2018-08-21 | 2019-08-13 | AC Global Risk, Inc. | Method for increasing tone marker signal detection reliability, and system therefor |
US10790829B2 (en) * | 2018-09-27 | 2020-09-29 | Intel Corporation | Logic circuits with simultaneous dual function capability |
CN109686358B (zh) * | 2018-12-24 | 2021-11-09 | 广州九四智能科技有限公司 | 高保真的智能客服语音合成方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2636163B1 (fr) | 1988-09-02 | 1991-07-05 | Hamon Christian | Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde |
US5220629A (en) | 1989-11-06 | 1993-06-15 | Canon Kabushiki Kaisha | Speech synthesis apparatus and method |
JP3089715B2 (ja) * | 1991-07-24 | 2000-09-18 | 松下電器産業株式会社 | 音声合成装置 |
DE69228211T2 (de) | 1991-08-09 | 1999-07-08 | Koninklijke Philips Electronics N.V., Eindhoven | Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals |
IT1266943B1 (it) | 1994-09-29 | 1997-01-21 | Cselt Centro Studi Lab Telecom | Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda. |
AU707489B2 (en) * | 1995-04-12 | 1999-07-08 | British Telecommunications Public Limited Company | Waveform speech synthesis |
JP2000181452A (ja) * | 1998-10-06 | 2000-06-30 | Roland Corp | 波形再生装置 |
DE69925932T2 (de) * | 1998-11-13 | 2006-05-11 | Lernout & Hauspie Speech Products N.V. | Sprachsynthese durch verkettung von sprachwellenformen |
US6202049B1 (en) * | 1999-03-09 | 2001-03-13 | Matsushita Electric Industrial Co., Ltd. | Identification of unit overlap regions for concatenative speech synthesis system |
DE60127274T2 (de) * | 2000-09-15 | 2007-12-20 | Lernout & Hauspie Speech Products N.V. | Schnelle wellenformsynchronisation für die verkettung und zeitskalenmodifikation von sprachsignalen |
JP4067762B2 (ja) * | 2000-12-28 | 2008-03-26 | ヤマハ株式会社 | 歌唱合成装置 |
-
2003
- 2003-08-08 AT AT03797416T patent/ATE318440T1/de not_active IP Right Cessation
- 2003-08-08 EP EP03797416A patent/EP1543500B1/en not_active Expired - Lifetime
- 2003-08-08 WO PCT/IB2003/003624 patent/WO2004027756A1/en active IP Right Grant
- 2003-08-08 JP JP2004537379A patent/JP4510631B2/ja not_active Expired - Lifetime
- 2003-08-08 CN CNB038220024A patent/CN100388357C/zh not_active Expired - Fee Related
- 2003-08-08 US US10/527,951 patent/US7529672B2/en active Active
- 2003-08-08 DE DE60303688T patent/DE60303688T2/de not_active Expired - Lifetime
- 2003-08-08 AU AU2003255914A patent/AU2003255914A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CN1682275A (zh) | 2005-10-12 |
US7529672B2 (en) | 2009-05-05 |
DE60303688T2 (de) | 2006-10-19 |
WO2004027756A1 (en) | 2004-04-01 |
CN100388357C (zh) | 2008-05-14 |
EP1543500B1 (en) | 2006-02-22 |
EP1543500A1 (en) | 2005-06-22 |
DE60303688D1 (de) | 2006-04-27 |
JP2005539267A (ja) | 2005-12-22 |
AU2003255914A1 (en) | 2004-04-08 |
US20060059000A1 (en) | 2006-03-16 |
ATE318440T1 (de) | 2006-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20040073428A1 (en) | Apparatus, methods, and programming for speech synthesis via bit manipulations of compressed database | |
US20100324906A1 (en) | Method of synthesizing of an unvoiced speech signal | |
JPS62160495A (ja) | 音声合成装置 | |
HU176776B (en) | Method and apparatus for synthetizing speech | |
US6601030B2 (en) | Method and system for recorded word concatenation | |
JP3732793B2 (ja) | 音声合成方法、音声合成装置及び記録媒体 | |
JP4510631B2 (ja) | 音声波形の連結を用いる音声合成 | |
JP5175422B2 (ja) | 音声合成における時間幅を制御する方法 | |
JP4490818B2 (ja) | 定常音響信号のための合成方法 | |
JP5360489B2 (ja) | 音素符号変換装置および音声合成装置 | |
EP0912975B1 (en) | A method for synthesising voiceless consonants | |
JP2005523478A (ja) | 音声を合成する方法 | |
JPH0642158B2 (ja) | 音声合成装置 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JP2002244693A (ja) | 音声合成装置および音声合成方法 | |
JP4305022B2 (ja) | データ作成装置、プログラム及び楽音合成装置 | |
JP5481957B2 (ja) | 音声合成装置 | |
JP2001166787A (ja) | 音声合成装置および自然言語処理方法 | |
JPH09244680A (ja) | 韻律制御装置及び方法 | |
US20060074675A1 (en) | Method of synthesizing creaky voice | |
JPS63131195A (ja) | 音声合成装置 | |
JPS6228800A (ja) | 規則音声合成用駆動信号生成方法 | |
JPS63208099A (ja) | 音声合成装置 | |
JPH03296100A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060807 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20070509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100406 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100430 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4510631 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |