TWI307876B - A method of synthesis for a ateady sound signal - Google Patents
A method of synthesis for a ateady sound signal Download PDFInfo
- Publication number
- TWI307876B TWI307876B TW092125245A TW92125245A TWI307876B TW I307876 B TWI307876 B TW I307876B TW 092125245 A TW092125245 A TW 092125245A TW 92125245 A TW92125245 A TW 92125245A TW I307876 B TWI307876 B TW I307876B
- Authority
- TW
- Taiwan
- Prior art keywords
- spacing
- sound signal
- sound
- signal
- fundamental frequency
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000015572 biosynthetic process Effects 0.000 title claims description 10
- 238000003786 synthesis reaction Methods 0.000 title claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 9
- 238000001228 spectrum Methods 0.000 claims description 7
- 230000000737 periodic effect Effects 0.000 claims description 5
- 238000000926 separation method Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 230000000630 rising effect Effects 0.000 claims description 2
- 241000282376 Panthera tigris Species 0.000 claims 1
- 239000002131 composite material Substances 0.000 description 9
- 238000012546 transfer Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 102100028572 Disabled homolog 2 Human genes 0.000 description 1
- 101000866272 Homo sapiens Double C2-like domain-containing protein alpha Proteins 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 229940035637 spectrum-4 Drugs 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
- G10L13/07—Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Electrophonic Musical Instruments (AREA)
- Auxiliary Devices For Music (AREA)
- Stereophonic System (AREA)
Description
1307876 玫、發明說明: 5成之領域有關,更特定言之但 合成之領域有關。 【發明所屬之技術領域】 本發明與語音或音樂的合成 不限於’與文字至語音 【先前技術】 speech; TTS)合成系統之功能係採
―文字至語音(text-to-用一既定語言中的一普超 素(雙音素)、三音素(三連音素)或更多音素之群組,而且 可採用無意義字元藉由分割所想要的穩定頻譜區域之音素 群組而決定。在一串接基合成中,二鄰近音素之間的轉移 之父談對於保證合成語音之品質至關重要。選擇多音素作 為基本子單元,二鄰近音素之間的轉移係保持在該等記錄 子單元中,而該串接係在類似音素之間實現。 但是在合成之前’必須修改該等音素之持續時間及間距 以便完成包含該等音素的新字元之節律約束。必須進行此 處理以避免產生一單調聲音合成語音。在一 TTS系統中,一 節律模组實行此功能。為了允許修改該等記錄子單元中的 持續時間及間距,許多串接基TTS系統使用時域間距同 步重叠新增(time-domain pitch-synchronous overlap-add ; 〇 \87\8746b DOC 2 1307876 TD-PS〇LA)(參考由 E. Moulines 及 F. Charpentier於 199〇 年 提出的「採用雙音素之文字至語音合成用之間距同步波形 處理技術」,語音通信,第9卷,頁號453至467)合成模式。 當要合成的信號係需要具有一延長持續時間時,此係藉由 重複已從原始信號獲得的間距鈴而達到。圖丨說明此重複處 理。時間軸100屬於該原始信號之時域。該原始信號具有一 長度T,在該時間軸1〇〇上橫越零與了之間的時間間隔。此外 ,該原始信號具有一基頻f,其對應於—週期p;間距铃係 利用視窗102對該原始信號開視窗而從該原始信號獲得。在 於此考慮的範例中,該等視窗係藉由時間軸1〇〇之時域内的 週期P隔開。採用此方法,間距鈐位置丨係決定在時間軸1〇〇 上。時間軸104屬於要合成的信號之時域。要合成的信號係 需要具有一持續時間yT,其中7可以為任一數字。其次,數 個間距鈴位置j係決定在該時間軸104上。如在該時間軸100 上一樣,該等間距鈴位置j係藉由對應於該原始信號之基頻 f的週期p隔開。為了增加該原始信號之持續時間,從該原 始信號獲得的原始間距鈴之每個係重複一數量y次。此導致 在時間軸104之時域内的數個間隔106、108、…,其中該等 門Pw 106 1 、…之每個係由相同間距鈴之重複組成。例 如該間隔106包括從該間距鈐位置i=i獲得的間距鈴之重複 ,該等間距鈴位置i係從間距鈐位置〕·(卜丨,k=丨)至〗(卜丨,卜幻 f的原始信號獲得。此意味著間隔1〇6包含從該原始信號之 日守間軸1 〇〇上的間距鈐位置i=丨獲得的間距鈴之一數量y次 重複。同樣地,下一間隔108包含從該原始信號之間距鈐位 O:\87\87466 DOC2 1307876 置i = 2獲得的間距鈐之一數量y次重複。因此,合成信號係 由間距鈐重複之串接序列組成。 此類PSOLA方法之一共同缺點為一極限持續時間操縱將 序列之間的音頻轉移引入該信號中。特定言之,此當該原 始聲音為如具有一雜訊及一週期性成分之有聲摩擦音的一 混合聲音時為一問題。間距鈴之重複在雜訊成分中引進週 期性’其致使該合成信號聲音不自然。 【發明内容】 因此本發明之目的係提供合成一聲音信號之一改良方法 ,特定言之,係用於極限持續時間修改(例如用於歌聲 本發明提供根據一原始信號合成一聲音信號之一方法, 以便操縱該原始信號之持續時間。特定言之,本發明致動 該原始信號之極限持續時間及間距修改, 此對於歌聲之合成尤為有用,其中可出現 至100次的順序之極限持續時間操縱。 實際上,本發明係基於以下觀察:因為自重複間距龄之 -鏈至下—鏈的轉移為音頻轉移,所以先前技術PS0L“ =在持續時間操縱後將假象引人—合成信號m之, 先月j技術PSOLA類型方法係用於⑮限持續時間操縱時 ,所經歷的影響有害於包含-雜訊及-週期性成分的混合 聲音。 依據本發明,從該原始信號隨機選擇間距鈴,用於要名 成的信號之等需要的間距鈴位置之每個。採用此方法,; ㈣免該等雜《分中的週期性之引人而絲持該原始卷 O:\87\87466.DOC 2 1307876 ::自然性。依據本發明之-較佳具體實施例,該原始聲 曰為具有-雜訊及—週期性成分之一有聲摩擦音。將本發 明應用於此類有聲摩擦音尤為有益。 依據本發明之一更佳且择眘 八體貫靶例,一上升餘弦係用以對 Γ 采摩擦音開視窗。將—正弦視窗用於無聲聲音間隔,該視
_具有在功率範圍内的總信號包絡約保持恒定之優L 週期性信號不同’當新增二個雜訊樣品時,總數可小於該等 一樣品之任—個的絕對數值。此係因為該等信號(大部分) 不同步,該正弦視窗調整此影響而並移除該包絡調變。 依據本發明之—更佳具體實施例,該原始聲音具有週期 ,該等週期頻譜相同而且具有基本相同的資訊内容。此類 有聲週期係藉由一第-分類器分類,而此類無聲週期係藉 一第二分類器之方式分類。 士依據本發明之—更佳具體實施例,該原始信號之分類資 舌fl係健存在一電腦系丨l 电®糸、,先.(例如一文字至語音系統中。分類為 頻譜相同的有聲或無聲穩定週期之原始信號的間隔,係依 據本發明而處理, u此一上升餘弦視窗係用於有聲間隔, 而一正弦視窗係用於無聲間隔。 【實施方式】 圖2顯示根據—用私 '、D L说a成一信號之一範例。時間軸 200。兒士月4原始jg號之時域。該原始信號具有一持續時間τ 在t門軸200上^越零與τ之間的時間。該原始信號具有 一基頻f’其對心―週期Ρ°該週期Ρ決定在時間軸200上 的位置…用以利用視窗2〇2對該原始信號開視窗。在於此 0 \87\87466.DOC 2 1307876 以便使用 考慮的範例中,該原始信號為一有聲思人聲立 依據以下公式的一餘弦視窗。 μ[π] = 0.5 — 0.5 * cos 〇^n <m π·(π + 〇·5)' 在上述關係式中,m為該視窗之長度,而打為運作指數 當該原始信號為-無聲聲音信號時,最好使用以下視窗 <m h{/i] = sin 時間軸204說明要合成的信號之時域。要合成的信號係需 要具有一持續時間yT,其中y可以為任—數字,例如尸4或 y=6或y=20或y=50或y=100。 週期p亦決定在時間軸204上的間距鈐位置j。如在時間軸 200上一樣,該等間距鈴位置係藉由週期p而隔開。隨機選 擇在該時間軸200之時域内的一間距鈴丨之—位置,用於該 等需要的間距鈐位置j之每個。在於此考慮的範例中,具有 一數量6個間距鈴,其係藉由對時間軸2〇〇之時域内的原始 信號開視窗而獲得。產生1與6之間的一亂數,以選擇該等 獲得的間距鈴之一 ’用於一間距鈴位置j。採用此方法,隨 機選擇間距鈴位置i= 1至i=6上的可用間距鈴。重複此處理, 用於時間軸204上所有需要的間距鈐位置。例如藉由產生i 與6之間的一亂數而選擇一間距鈴,用於該需要的間距鈐位 置j = 1。在於此考慮的範例中,獲得該數字6以便選擇從時 間軸200上的間距鈴位置i = 6所獲得的間距鈴,用於該時間 抽204上該需要的間距铃位置j = 1。同樣地,產生一亂數, 用於該需要的間距鈴位置j=2。在此範例中,該亂數為4以 0.\87\87466.DOC 2 -10- 1307876 便選擇時間軸200上的間距鈐位置i=4處的間距鈴,用於該 需要的間距鈐位置j = 2。針對時間軸2〇4上所有需要的間距 鈐位置j = l至尸z實行此處理。因為係從該原始信號之時域隨 機選擇該等間距鈴,所以可避免間隔1〇6、1〇8、.··(參考圖 1)。因此沒有此類假象係引入該合成信號,而且即使對於 極限持續時間操縱,該合成信號也可自然發聲。 圖3顯示說明此方法的一流程圖。在步驟3〇〇中,提供一 原始聲音之一記錄。在步驟3〇2中,混合聲音間隔係識別並 分類為該原始聲音記錄中的有聲或無聲間隔。此可藉由一 專家人工兀成或利用一電腦程式完成,該電腦程式分析該 原始信號及/或其用於穩定週期的頻譜。該第一分析最好係 利用一程式實行,而一專家檢視—程式之輸出。在步驟304 :’間距龄係藉開視窗從該原始聲音信號獲得。開視窗係 藉與《亥原始聲音#號之基頻同步定位的視窗實行,即該等 視窗之分開距離為該原始聲音信號之時域内的原始聲音信 號之週期P。在步驟306中,決定用於合成該信號所需要的 間距鈴之等間距鈴位置]。再—次地,該等f要的間距铃位 置j之分開距離為該週期p。<者該等間距铃位置]之距離可 為另-週期q’該週期對應於要合成的信號之—較高或較低 需要的基頻。採用此方法’可修改該持續時間及該頻率。 在步驟308中,隨機選擇間距鈴,用於分類為混合聲音間隔 的聲音間隔内之需要的間距鈴位幻之每個。對於其他聲音 間.隔’可使用或可不使用—先前技術ps〇L^型方法。在 步驟310中,該等間距铃係重疊並新增在要合成的信號之時 O:\87\87460.DOC 2 -11 - 1307876 域内的間距鈴位置j上。 . 圖4顯示一原始聲音信號4〇〇之一範例,該信號為/z/至/z/ 轉移之一雙音素。圖4還顯示該聲音信號400之頻譜4〇2。 聲音信號404係藉由隨機選擇從該聲音信號4〇〇獲得的間 距鈴而從依據本發明的聲音信號4〇〇獲得,用於該合成聲音 信號404之時域内需要的間距鈴位置。在於此考慮的範例中 ’該合成聲音信號404比該原始聲音信號400長y=5倍。圖4 還顯示該聲音信號404之頻譜406。從該聲音信號4〇4及其頻 譜406可明顯看出,該原始聲音信號4〇〇之特性係保持在該 合成信號中,而且並沒有引進假象。因此,該聲音信號4〇4 發聲與該聲音信號4〇〇 —樣,但是時間要長5倍。 圖5顯示一電腦系統(例如一文字至語音合成系統)之一 方塊圖。電腦系統500包括用以儲存一原始聲音信號之一模 組502。模組504提供服務,以進入並儲存聲音分類資訊, 用於儲存在模組502中的原始聲音信號。例如在該原始聲音 k號中,穩疋有聲週期係採用一「Γ」加以標記,而穩定無 聲週期係採用一「s」加以標記。模组5〇6提供服務,以對 模組502之原始聲音信號開視窗,以便獲得間距鈐。根據該 聲音分類,一上升餘弦或一正弦視窗係分別用於穩定有聲 週期或穩疋無聲週期。模組508提供服務,以決定要合成的 信號之時域内需要的間距鈴位置』。為了決定該等需要的間 距鈴位幻’利用輸人參數「長度y」。該輸人參數長度⑼ 定用於該原始信號之持續時間的操縱因數。此外,可以提 供-動態變化間距作為—額外輪人參數,以修改除該時間 0 \87\87466.DOC 2 -12- 1307876 以外或取代該持續時間的基頻。 - 模組5 10提供服務,以從該原始聲音信號獲得的間距鈐組 選擇間距鈴。模組5 10係與偽亂數產生器5 12耦合。一偽亂 數係藉由偽亂數產生器5 12產生,用於要合成的信號之時域 内需要的間距鈐位置之每個。利用該等亂數,藉由模組5 1 〇 從該組間距鈴選擇間距鈐,以便提供一隨機選擇間距鈴, 用於要合成的信號之時域内需要的間距鈴之每個。模組5 14 提供服務’以對要合成的信號之時域内選擇的間距鈴實行 一重疊及新增操作。採用此方法,可獲得具有該需要的持 續時間之合成信號。 應注意本發明可應用於穩定區域。例如一穩定區域可以 為一母音或如/z/—樣的一雜訊有聲聲音。因此,本發明並 不受限於「混合」聲音。 此外’應注意該合成信號不必具有與原始信號相同的門 距(基頻)。在某些應用中,需要改變該間距以(例如)合成歌 聲。為了達到該合成信號中的基頻之此改變,該合成作號 中的週期位置將比該原始信號置於相互更近或更遠處。U 則’此不會改變合成程序。 此外應注意本發明並不受限於一視窗之某—選擇。。 用其他視窗(例如三角形視窗)而非上升餘弦或正弦視办。 【圖式簡單說明】 明之較佳具體實 以上已藉由參考附圖更詳細地解說本發 施例,其中: 圖1說明—先前技術PSOLA類型方法 Ο \87\87466.DOC 2 -13 - 1307876 圖2說明依據本發明之一具體實施例合成一聲音信號的 一範例, 圖3為說明本發明之一方法的一具體實施例之一流程圖, 圖4顯示一原始信號及該合成信號之一範例,及 圖5為一電腦系統之一較佳具體實施例的一方塊圖。 【圖式代表符號說明】 100 時間軸 102 視窗 104 時間軸 106 間隔 108 間隔 200 時間軸 202 視窗 204 時間軸 400 原始聲音信號 402 頻譜 404 合成聲音信號 406 頻譜 500 電腦糸統 502 模組 504 模組 506 模組 508 模組 510 模組 -14- 1307876 512 偽亂數產生器 514 模組 O:\87\87466 DOC 2
Claims (1)
- I利中請案 中文申請專利範圍替換本(96年7月) 拾、申請專利範圍: 1· 一種根據一第二聲音信號合成一第—聲音信號之方法, »亥第一聲音彳§號具有一需要的第一基頻而該第二聲音信 號具有一第二基頻,該方法包括以下步驟: -決定在該第一聲音信號之時域内需要的間距鈴位置, 料間距鈴位置之分開距離為該第-基頻之-週期, 藉由在°亥第-聲音信號之時域内的間距鈴位置上對該第二聲音信號開視窗而提供間距龄’該等間距铃位置 之分開距離為該第二基頻之一週期, -從該等提供的間距鈴隨機選擇1㈣ 需要的間距鈴位置, 於各该專 -對該等選擇的間距鈐實行一 丁 董宜及新增極此 . 該第一信號。 4a輛作,以合成 2. 如申請專利範圍第1項之方法,其中該第二眷立 括一雜訊及週期性成分的—混合聲音 卓S仏號為包3. 如申請專利範圍第142 曰 π <万法,該第_ 有聲摩擦音聲音信號。 —卓胃信號為一 4. 如申請專利範圍第丨項之方 , 硪第二鉴A > 聲音信號,且因此一上升餘 曰^唬為一有聲 開視窗。 以對該第二聲音信號 5. 如申請專利範圍第丨項之方法,該第一士 聲音信號,且因此一正弦視"一聲音信號為一無聲 ΘΗ -tV '、用以對該篦- 開視®。 第—聲音信號 )正替換 6.如申請專利範圍第〗項之 相同週期,該等頻譜 Θ第—聲音信號具有頻譜 7 ^αψ^Μ. Μ - « ., 週4具有基本相同的資訊内容。 々甲„月專利鞄圍第】項之方 二基頻係實質上相同。 “而要的第—基頻及該第 8. 一種電腦可讀取媒體, 第…":其儲存-電腦程式,用以根據-第…U合成一第—聲音 具有-需要的第一基頻而“ 5虎 4Ε _ ^ 、而4第一聲音信號具有一第二基頻^電腦程式係調適以實行以下步驟: \在。第聲日^號之該時域内需要的間距鈐位置 二該等間距鈴位置之分開距離為該第—基頻之一週期, 猎由在5玄第二聲音信號之該時域内的間距鈴位置上對 該第二聲音信號開視窗而提供間距鈴,該等間距鈴位 置之分開距離為該第二基頻之一週期, 從該等提供的間距鈐隨機選擇一間距鈴,用於各該等 需要的間距鈴位置,對該等選擇的間距铃實行一重疊及新增操作,以合成 該第一信號。 9. -種電腦系統,特定言之為文字至語音合成系統,用以 根據帛一聲曰號合成一第―聲音信號,該第—聲音 k唬具有一需要的第—基頻而該第二聲音信號具有一第 二基頻’該電腦系統包括: -決定構件,用以決定在該第一聲音信號之該時域内需 要的間距鈴位置,該等間距鈐位置之分開距離為該第 一基頻之一週期, 提供構件’用以藉由在該第二聲音信號之該時 距鈴位置上對該第二聲音作號 ' 4 唬開視窗而提供間距鈐,該 寺間距鈐位置之分開距離為該第二基頻之—週期, 選擇構件,用以從該等提供的間距鈐隨機選擇一間距 鈴,用於各該等需要的間距鈐位置, 實行構件,用以對料選擇的間距鈐實行—重疊及新 增細作以合成該第一信號。 ’1〇.如申請專利範圍第9項之電腦系統,進一步包括用以儲存 聲音分類資料之構件,用以儲存聲音分類資料之該等構 件係調適以儲存指示一間隔的資料,該間隔包含一原始 聲音信號内的該第二聲音信號。(更)正替換頁 第092125245號專利申請案 中文圖式替換頁(97年9月)0.00 0.05 afs (s) 自 -1.0 10 0.5 丄 m田+ 00 振 -P5 J.—l-l-sl.—t—1 IGJd. Z- 丨Z 來00 0.25 0.00 0.05 plo£5 s4»vs(s) P20to4rt-s(s)办04 -4 -
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02078848 | 2002-09-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200425059A TW200425059A (en) | 2004-11-16 |
TWI307876B true TWI307876B (en) | 2009-03-21 |
Family
ID=32010977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW092125245A TWI307876B (en) | 2002-09-17 | 2003-09-12 | A method of synthesis for a ateady sound signal |
Country Status (11)
Country | Link |
---|---|
US (1) | US7558727B2 (zh) |
EP (1) | EP1543497B1 (zh) |
JP (1) | JP4490818B2 (zh) |
KR (1) | KR101016978B1 (zh) |
CN (1) | CN100343893C (zh) |
AT (1) | ATE329346T1 (zh) |
AU (1) | AU2003250410A1 (zh) |
DE (1) | DE60305944T2 (zh) |
ES (1) | ES2266908T3 (zh) |
TW (1) | TWI307876B (zh) |
WO (1) | WO2004027753A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004027754A1 (en) * | 2002-09-17 | 2004-04-01 | Koninklijke Philips Electronics N.V. | A method of synthesizing of an unvoiced speech signal |
JP5141688B2 (ja) | 2007-09-06 | 2013-02-13 | 富士通株式会社 | 音信号生成方法、音信号生成装置及びコンピュータプログラム |
US9640172B2 (en) * | 2012-03-02 | 2017-05-02 | Yamaha Corporation | Sound synthesizing apparatus and method, sound processing apparatus, by arranging plural waveforms on two successive processing periods |
CN103295574B (zh) * | 2012-03-02 | 2018-09-18 | 上海果壳电子有限公司 | 唱歌语音转换设备及其方法 |
CN103295577B (zh) * | 2013-05-27 | 2015-09-02 | 深圳广晟信源技术有限公司 | 用于音频信号编码的分析窗切换方法和装置 |
WO2017046887A1 (ja) * | 2015-09-16 | 2017-03-23 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラム、音声合成モデル学習装置、音声合成モデル学習方法及び音声合成モデル学習プログラム |
CN108831437B (zh) * | 2018-06-15 | 2020-09-01 | 百度在线网络技术(北京)有限公司 | 一种歌声生成方法、装置、终端和存储介质 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4344148A (en) * | 1977-06-17 | 1982-08-10 | Texas Instruments Incorporated | System using digital filter for waveform or speech synthesis |
FR2636163B1 (fr) | 1988-09-02 | 1991-07-05 | Hamon Christian | Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde |
DE69228211T2 (de) * | 1991-08-09 | 1999-07-08 | Koninklijke Philips Electronics N.V., Eindhoven | Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals |
US5357048A (en) * | 1992-10-08 | 1994-10-18 | Sgroi John J | MIDI sound designer with randomizer function |
IT1266943B1 (it) | 1994-09-29 | 1997-01-21 | Cselt Centro Studi Lab Telecom | Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda. |
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
JPH09198089A (ja) * | 1996-01-19 | 1997-07-31 | Matsushita Electric Ind Co Ltd | 再生速度変換装置 |
US6170073B1 (en) * | 1996-03-29 | 2001-01-02 | Nokia Mobile Phones (Uk) Limited | Method and apparatus for error detection in digital communications |
JP4040126B2 (ja) * | 1996-09-20 | 2008-01-30 | ソニー株式会社 | 音声復号化方法および装置 |
JPH10149199A (ja) * | 1996-11-19 | 1998-06-02 | Sony Corp | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 |
US6336092B1 (en) * | 1997-04-28 | 2002-01-01 | Ivl Technologies Ltd | Targeted vocal transformation |
US6026356A (en) * | 1997-07-03 | 2000-02-15 | Nortel Networks Corporation | Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
JP3576840B2 (ja) * | 1997-11-28 | 2004-10-13 | 松下電器産業株式会社 | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 |
JP2001513225A (ja) * | 1997-12-19 | 2001-08-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 伸長オーディオ信号からの周期性の除去 |
US6253171B1 (en) * | 1999-02-23 | 2001-06-26 | Comsat Corporation | Method of determining the voicing probability of speech signals |
US6829577B1 (en) * | 2000-11-03 | 2004-12-07 | International Business Machines Corporation | Generating non-stationary additive noise for addition to synthesized speech |
JP2002244693A (ja) * | 2001-02-16 | 2002-08-30 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
US7251601B2 (en) * | 2001-03-26 | 2007-07-31 | Kabushiki Kaisha Toshiba | Speech synthesis method and speech synthesizer |
US20030182106A1 (en) * | 2002-03-13 | 2003-09-25 | Spectral Design | Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal |
EP1543503B1 (en) * | 2002-09-17 | 2007-01-24 | Koninklijke Philips Electronics N.V. | Method for controlling duration in speech synthesis |
US7529672B2 (en) * | 2002-09-17 | 2009-05-05 | Koninklijke Philips Electronics N.V. | Speech synthesis using concatenation of speech waveforms |
WO2004027754A1 (en) * | 2002-09-17 | 2004-04-01 | Koninklijke Philips Electronics N.V. | A method of synthesizing of an unvoiced speech signal |
-
2003
- 2003-08-05 DE DE60305944T patent/DE60305944T2/de not_active Expired - Lifetime
- 2003-08-05 ES ES03797393T patent/ES2266908T3/es not_active Expired - Lifetime
- 2003-08-05 JP JP2004537354A patent/JP4490818B2/ja not_active Expired - Lifetime
- 2003-08-05 AU AU2003250410A patent/AU2003250410A1/en not_active Abandoned
- 2003-08-05 WO PCT/IB2003/003381 patent/WO2004027753A1/en active IP Right Grant
- 2003-08-05 AT AT03797393T patent/ATE329346T1/de not_active IP Right Cessation
- 2003-08-05 US US10/527,945 patent/US7558727B2/en active Active
- 2003-08-05 CN CNB038220288A patent/CN100343893C/zh not_active Expired - Fee Related
- 2003-08-05 KR KR1020057004512A patent/KR101016978B1/ko active IP Right Grant
- 2003-08-05 EP EP03797393A patent/EP1543497B1/en not_active Expired - Lifetime
- 2003-09-12 TW TW092125245A patent/TWI307876B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
DE60305944T2 (de) | 2007-02-01 |
CN1682278A (zh) | 2005-10-12 |
KR101016978B1 (ko) | 2011-02-25 |
EP1543497B1 (en) | 2006-06-07 |
ES2266908T3 (es) | 2007-03-01 |
EP1543497A1 (en) | 2005-06-22 |
US20060178873A1 (en) | 2006-08-10 |
AU2003250410A1 (en) | 2004-04-08 |
CN100343893C (zh) | 2007-10-17 |
US7558727B2 (en) | 2009-07-07 |
TW200425059A (en) | 2004-11-16 |
KR20050057372A (ko) | 2005-06-16 |
JP2005539262A (ja) | 2005-12-22 |
JP4490818B2 (ja) | 2010-06-30 |
WO2004027753A1 (en) | 2004-04-01 |
DE60305944D1 (de) | 2006-07-20 |
ATE329346T1 (de) | 2006-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8326613B2 (en) | Method of synthesizing of an unvoiced speech signal | |
Macon et al. | A singing voice synthesis system based on sinusoidal modeling | |
JP2006501509A (ja) | 個人適応音声セグメントを備える音声合成装置 | |
Macon et al. | Concatenation-based midi-to-singing voice synthesis | |
US20040102975A1 (en) | Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect | |
TWI307876B (en) | A method of synthesis for a ateady sound signal | |
JP2000075883A (ja) | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 | |
JP5175422B2 (ja) | 音声合成における時間幅を制御する方法 | |
JP4510631B2 (ja) | 音声波形の連結を用いる音声合成 | |
CN1647152A (zh) | 合成语音的方法 | |
JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
Bonada et al. | Sample-based singing voice synthesizer using spectral models and source-filter decomposition | |
WO2023182291A1 (ja) | 音声合成装置、音声合成方法及びプログラム | |
Thippareddy et al. | Prosody transplantation using unit-selection: Principles and early results | |
JP6822075B2 (ja) | 音声合成方法 | |
JPS5914752B2 (ja) | 音声合成方式 | |
Bonada et al. | Improvements to a sample-concatenation based singing voice synthesizer | |
Butler et al. | Articulatory constraints on vocal tract area functions and their acoustic implications | |
May et al. | Speech synthesis using allophones | |
Goudie et al. | Implementation of a prosody scheme in a constructive synthesis environment | |
Sorace | The dialogue terminal | |
Yea et al. | Formant synthesis: Technique to account for source/tract interaction | |
Randolph et al. | Synthesis of continuous speech by concatenation of isolated words | |
Blaauw et al. | Improvements to a Sample-Concatenation Based Singing Voice Synthesizer | |
JP2001092480A (ja) | 音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MK4A | Expiration of patent term of an invention patent |