KR20020076144A - 음성합성방법, 음성합성장치 및 기록매체 - Google Patents
음성합성방법, 음성합성장치 및 기록매체 Download PDFInfo
- Publication number
- KR20020076144A KR20020076144A KR1020020016033A KR20020016033A KR20020076144A KR 20020076144 A KR20020076144 A KR 20020076144A KR 1020020016033 A KR1020020016033 A KR 1020020016033A KR 20020016033 A KR20020016033 A KR 20020016033A KR 20020076144 A KR20020076144 A KR 20020076144A
- Authority
- KR
- South Korea
- Prior art keywords
- formant
- pitch
- window function
- waveform
- parameter
- Prior art date
Links
- 238000001308 synthesis method Methods 0.000 title claims abstract description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 238000000034 method Methods 0.000 claims description 19
- 238000009499 grossing Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 11
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 74
- 238000001228 spectrum Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 10
- 239000012634 fragment Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
Description
Claims (18)
- 포르만트 주파수, 포르만트 위상 및 창함수를 나타내는 다수의 포르만트 파라미터를 기억수단에 기억하는 단계와,피치패턴, 음운계속시간 길이 및 음운기호열에 따라 상기 포르만트 파라미터로부터 소정의 포르만트 파라미터를 선택하는 단계,선택된 포르만트 파라미터에 대응하는 포르만트 주파수 및 포르만트 위상에 기초하여 복수의 정현파를 생성하는 단계,복수의 포르만트 파형을 생성하기 위해 복수의 정현파를 선택된 포르만트 파라미터에 대응하는 창함수에 각각 승산하는 단계,복수의 피치파형을 생성하기 위해 포르만트 파형을 가산하는 단계 및,음성신호를 생성하기 위해 피치주기에 따라 피치파형을 중첩하는 단계를 구비하여 이루어진 것을 특징으로 하는 음성합성방법.
- 제1항에 있어서, 상기 포르만트 파형 y(t)가 다음 식에 의해 표시되는 것을 특징으로 하는 음성합성방법.y(t) = w(t)*sin(ωt+φ)(여기서, ω는 포르만트 주파수, φ는 포르만트 위상, w(t)는 창함수이다.)
- 제1항에 있어서, 창함수를 생성하기 위해 가중계수를 기억수단에 기억하는단계와 가중계수에 의해 가중된 기저함수를 가산하는 단계를 포함하는 것을 특징으로 하는 음성합성방법.
- 제1항에 있어서, 피치주기에 따라 적어도 하나의 포르만트 파형의 전력, 적어도 하나의 창함수의 형상, 적어도 하나의 창함수의 위치 및 적어도 하나의 포르만트 주파수중의 적어도 하나를 변화시키는 단계를 포함하는 것을 특징으로 하는 음성합성방법.
- 제4항에 있어서, 적어도 하나의 포르만트 파형의 전력, 적어도 하나의 창함수의 형상, 적어도 하나의 창함수의 위치 및 적어도 하나의 포르만트 주파수중의 적어도 하나가 음운마다, 프레임마다 또는 포르만트 번호마다 변화되는 것을 특징으로 하는 음성합성방법.
- 제1항에 있어서, 적어도 하나의 선행 또는 후속의 음운의 종류에 따라 적어도 하나의 포르만트 파형의 전력, 적어도 하나의 창함수의 형상, 적어도 하나의 창함수의 위치 및 적어도 하나의 포르만트 주파수중의 적어도 하나를 변화시키는 단계를 포함하는 것을 특징으로 하는 음성합성방법.
- 제1항에 있어서, 주어진 성질(聲質)의 정보에 따라 적어도 하나의 포르만트 파형의 전력, 적어도 하나의 창함수의 형상, 적어도 하나의 창함수의 위치 및 적어도 하나의 포르만트 주파수중의 적어도 하나를 변화시키는 단계를 포함하는 것을 특징으로 하는 음성합성방법.
- 제1항에 있어서, 적어도 하나의 선행의 피치파형 또는 후속의 피치파형의 대응하는 적어도 하나의 포르만트 파형의 전력, 적어도 하나의 포르만트 주파수, 적어도 하나의 창함수의 형상, 적어도 하나의 정현파의 위상 및 적어도 하나의 창함수의 위치중의 적어도 하나에 따라 적어도 하나의 포르만트 파형의 전력, 적어도 하나의 포르만트 주파수, 적어도 하나의 창함수의 형상, 적어도 하나의 정현파의 위상 및 적어도 하나의 창함수의 위치중의 적어도 하나를 변화시키는 단계를 포함하는 것을 특징으로 하는 음성합성방법.
- 제1항에 있어서, 적어도 하나의 선행의 피치파형 또는 후속의 피치파형의 대응하는 포르만트의 존재(presence)에 따라 적어도 하나의 포르만트 파형의 전력, 적어도 하나의 포르만트 주파수, 적어도 하나의 창함수의 형상, 적어도 하나의 정현파의 위상 및 적어도 하나의 창함수의 위치중의 적어도 하나를 변화시키는 단계를 포함하는 것을 특징으로 하는 음성합성방법.
- 제1항에 있어서, 포르만트 주파수, 포르만트 위상 및 창함수를 선택적으로 평활화하는 단계를 포함하는 것을 특징으로 하는 음성합성방법.
- 피치패턴, 음운계속시간 길이 및 음운기호열을 공급받는 것으로,상기 피치패턴 및 음운계속시간 길이를 참조하여 피치마크를 생성하는 수단(33)과,상기 피치패턴, 음운계속시간 길이 및 음운기호열을 참조하여 상기 피치마크에 대응하는 피치파형을 생성하는 수단(34),유성음성신호를 생성하기 위해 피치마크로 나타낸 위치에 피치파형을 중첩하는 수단(35),무성음성을 생성하는 수단(32) 및,합성음성을 생성하기 위해 유성음성과 무성음성을 가산하는 수단을 구비하여 구성되고,상기 피치파형을 생성하는 수단이,복수의 포르만트 파라미터를 합성유닛의 단위로 기억하는 수단(41)과,상기 피치패턴, 음운계속시간 길이 및 음운기호열을 참조하여 상기 기억수단으로부터 피치마크에 대응하는 1프레임의 포르만트 파라미터를 선택하는 수단(42),독출한 포르만트 파라미터의 포르만트 주파수 및 포르만트 위상에 따라 복수의 정현파를 생성하는 수단(43∼45),복수의 포르만트 파형을 생성하기 위해 복수의 정현파를 선택된 포르만트 파라미터의 창함수에 각각 승산하는 수단 및,복수의 피치파형을 생성하기 위해 포르만트 파형을 가산하는 수단을 포함하고 있는 것을 특징으로 하는 음성합성장치.
- 제11항에 있어서, 상기 기억수단(41)이 창함수를 기억하는 것을 특징으로 하는 음성합성장치.
- 제11항에 있어서, 상기 기억수단(51)이 창함수의 가중계수를 기억하고,상기 가중계수에 의해 가중된 기저함수를 가산함으로써 창함수를 생성하는 수단(56)을 구비하는 것을 특징으로 하는 음성합성장치.
- 제11항에 있어서, 피치주기에 따라 선택된 포르만트 파라미터를 변형하는 수단(67)을 포함하는 것을 특징으로 하는 음성합성장치.
- 제14항에 있어서, 상기 변형수단(67)이 선택된 포르만트 파라미터를 음운마다, 프레임마다 또는 포르만트 번호마다 변형하는 것을 특징으로 하는 음성합성장치.
- 제11항에 있어서, 선행의 음운 또는 후속의 음운의 정보에 따라 선택된 포르만트 파라미터를 변형하는 수단(67)을 포함하는 것을 특징으로 하는 음성합성장치.
- 제11항에 있어서, 주어진 성질에 따라 선택된 포르만트 파라미터를 변형하는 수단(67)을 포함하는 것을 특징으로 하는 음성합성장치.
- 제11항에 있어서, 시간적으로 변화하는 선택된 포르만트 파라미터를 평활화하는 수단(77)을 포함하는 것을 특징으로 하는 음성합성장치.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001087041 | 2001-03-26 | ||
JPJP-P-2001-00087041 | 2001-03-26 | ||
JPJP-P-2002-00077096 | 2002-03-19 | ||
JP2002077096A JP3732793B2 (ja) | 2001-03-26 | 2002-03-19 | 音声合成方法、音声合成装置及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020076144A true KR20020076144A (ko) | 2002-10-09 |
KR100457414B1 KR100457414B1 (ko) | 2004-11-16 |
Family
ID=26612017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2002-0016033A KR100457414B1 (ko) | 2001-03-26 | 2002-03-25 | 음성합성방법, 음성합성장치 및 기록매체 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1246163B1 (ko) |
JP (1) | JP3732793B2 (ko) |
KR (1) | KR100457414B1 (ko) |
CN (1) | CN1185619C (ko) |
DE (1) | DE60205421T2 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003254398A1 (en) * | 2002-09-10 | 2004-04-30 | Leslie Doherty | Phoneme to speech converter |
JP2004294816A (ja) * | 2003-03-27 | 2004-10-21 | Yamaha Corp | 携帯端末装置 |
JP4214842B2 (ja) | 2003-06-13 | 2009-01-28 | ソニー株式会社 | 音声合成装置及び音声合成方法 |
JP2005004105A (ja) * | 2003-06-13 | 2005-01-06 | Sony Corp | 信号生成装置及び信号生成方法 |
JP2005234337A (ja) * | 2004-02-20 | 2005-09-02 | Yamaha Corp | 音声合成装置、音声合成方法、及び音声合成プログラム |
JP4469883B2 (ja) | 2007-08-17 | 2010-06-02 | 株式会社東芝 | 音声合成方法及びその装置 |
JP5275102B2 (ja) * | 2009-03-25 | 2013-08-28 | 株式会社東芝 | 音声合成装置及び音声合成方法 |
JP5631915B2 (ja) * | 2012-03-29 | 2014-11-26 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラムならびに学習装置 |
CN107924678B (zh) * | 2015-09-16 | 2021-12-17 | 株式会社东芝 | 语音合成装置、语音合成方法及存储介质 |
JP6728843B2 (ja) * | 2016-03-24 | 2020-07-22 | カシオ計算機株式会社 | 電子楽器、楽音発生装置、楽音発生方法及びプログラム |
CN108257613B (zh) * | 2017-12-05 | 2021-12-10 | 北京小唱科技有限公司 | 修正音频内容音高偏差的方法及装置 |
CN108597527B (zh) * | 2018-04-19 | 2020-01-24 | 北京微播视界科技有限公司 | 多声道音频处理方法、装置、计算机可读存储介质和终端 |
CN110189743B (zh) * | 2019-05-06 | 2024-03-08 | 平安科技(深圳)有限公司 | 波形拼接中的拼接点平滑方法、装置及存储介质 |
-
2002
- 2002-03-19 JP JP2002077096A patent/JP3732793B2/ja not_active Expired - Fee Related
- 2002-03-25 KR KR10-2002-0016033A patent/KR100457414B1/ko not_active IP Right Cessation
- 2002-03-26 EP EP02252159A patent/EP1246163B1/en not_active Expired - Lifetime
- 2002-03-26 CN CNB021080496A patent/CN1185619C/zh not_active Expired - Fee Related
- 2002-03-26 DE DE60205421T patent/DE60205421T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE60205421T2 (de) | 2006-04-20 |
CN1185619C (zh) | 2005-01-19 |
JP2002358090A (ja) | 2002-12-13 |
EP1246163A2 (en) | 2002-10-02 |
KR100457414B1 (ko) | 2004-11-16 |
CN1378199A (zh) | 2002-11-06 |
JP3732793B2 (ja) | 2006-01-11 |
EP1246163A3 (en) | 2003-08-13 |
DE60205421D1 (de) | 2005-09-15 |
EP1246163B1 (en) | 2005-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR940002854B1 (ko) | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 | |
JP4705203B2 (ja) | 声質変換装置、音高変換装置および声質変換方法 | |
JP3985814B2 (ja) | 歌唱合成装置 | |
JP6791258B2 (ja) | 音声合成方法、音声合成装置およびプログラム | |
EP1701336B1 (en) | Sound processing apparatus and method, and program therefor | |
JP2009047837A (ja) | 音声合成方法及びその装置 | |
KR100457414B1 (ko) | 음성합성방법, 음성합성장치 및 기록매체 | |
Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
US7251601B2 (en) | Speech synthesis method and speech synthesizer | |
JP2018077283A (ja) | 音声合成方法 | |
US20090326951A1 (en) | Speech synthesizing apparatus and method thereof | |
Agiomyrgiannakis et al. | ARX-LF-based source-filter methods for voice modification and transformation | |
Meron et al. | Synthesis of vibrato singing | |
JP6834370B2 (ja) | 音声合成方法 | |
JP3727885B2 (ja) | 音声素片生成方法と装置及びプログラム、並びに音声合成方法と装置 | |
JP2000010597A (ja) | 音声変換装置及び音声変換方法 | |
JP4468506B2 (ja) | 音声データ作成装置および声質変換方法 | |
JP6683103B2 (ja) | 音声合成方法 | |
JP3059751B2 (ja) | 残差駆動型音声合成装置 | |
JP6822075B2 (ja) | 音声合成方法 | |
JPH0836397A (ja) | 音声合成装置 | |
JP2002244693A (ja) | 音声合成装置および音声合成方法 | |
Min et al. | A hybrid approach to synthesize high quality Cantonese speech | |
JPH0553595A (ja) | 音声合成装置 | |
JPH07152396A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20020325 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20031211 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20040823 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20041105 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20041108 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20071029 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20081027 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20091028 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20101028 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20110920 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20110920 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20121023 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20121023 Start annual number: 9 End annual number: 9 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |