TWI240914B - Tone generator of wave table type with voice synthesis capability - Google Patents
Tone generator of wave table type with voice synthesis capability Download PDFInfo
- Publication number
- TWI240914B TWI240914B TW093102192A TW93102192A TWI240914B TW I240914 B TWI240914 B TW I240914B TW 093102192 A TW093102192 A TW 093102192A TW 93102192 A TW93102192 A TW 93102192A TW I240914 B TWI240914 B TW I240914B
- Authority
- TW
- Taiwan
- Prior art keywords
- waveform
- phoneme
- waveform data
- speech
- sound
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 146
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 138
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 28
- 238000013500 data storage Methods 0.000 claims description 56
- 239000000463 material Substances 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 11
- 238000000034 method Methods 0.000 claims 11
- 230000002238 attenuated effect Effects 0.000 claims 5
- 241000251468 Actinopterygii Species 0.000 claims 1
- 241000239290 Araneae Species 0.000 claims 1
- 206010061218 Inflammation Diseases 0.000 claims 1
- 239000008280 blood Substances 0.000 claims 1
- 210000004369 blood Anatomy 0.000 claims 1
- 230000035622 drinking Effects 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 claims 1
- 239000000284 extract Substances 0.000 claims 1
- 230000004054 inflammatory process Effects 0.000 claims 1
- 230000003442 weekly effect Effects 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 67
- 238000010586 diagram Methods 0.000 description 11
- 238000012423 maintenance Methods 0.000 description 11
- 238000009825 accumulation Methods 0.000 description 8
- 230000001186 cumulative effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 239000011257 shell material Substances 0.000 description 5
- 210000001260 vocal cord Anatomy 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 5
- 101100268671 Caenorhabditis elegans acc-4 gene Proteins 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000023308 Acca Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical class OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 241001247287 Pentalinon luteum Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02M—APPARATUS FOR CONVERSION BETWEEN AC AND AC, BETWEEN AC AND DC, OR BETWEEN DC AND DC, AND FOR USE WITH MAINS OR SIMILAR POWER SUPPLY SYSTEMS; CONVERSION OF DC OR AC INPUT POWER INTO SURGE OUTPUT POWER; CONTROL OR REGULATION THEREOF
- H02M1/00—Details of apparatus for conversion
- H02M1/12—Arrangements for reducing harmonics from ac input or output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
- G10H7/08—Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform
- G10H7/10—Instruments in which the tones are synthesised from a data store, e.g. computer organs by calculating functions or polynomial approximations to evaluate amplitudes at successive sample points of a tone waveform using coefficients or parameters stored in a memory, e.g. Fourier coefficients
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02M—APPARATUS FOR CONVERSION BETWEEN AC AND AC, BETWEEN AC AND DC, OR BETWEEN DC AND DC, AND FOR USE WITH MAINS OR SIMILAR POWER SUPPLY SYSTEMS; CONVERSION OF DC OR AC INPUT POWER INTO SURGE OUTPUT POWER; CONTROL OR REGULATION THEREOF
- H02M7/00—Conversion of ac power input into dc power output; Conversion of dc power input into ac power output
- H02M7/42—Conversion of dc power input into ac power output without possibility of reversal
- H02M7/44—Conversion of dc power input into ac power output without possibility of reversal by static converters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/471—General musical sound synthesis principles, i.e. sound category-independent synthesis methods
- G10H2250/481—Formant synthesis, i.e. simulating the human speech production mechanism by exciting formant resonators, e.g. mimicking vocal tract filtering as in LPC synthesis vocoders, wherein musical instruments may be used as excitation signal to the time-varying filter estimated from a singer's speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Power Engineering (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Electrophonic Musical Instruments (AREA)
Description
1240914 玫、發明說明: 【發明所屬之技術領域】 本發明與具有語音合成能力之聲音來源裝置有關,其不 僅月b產生音樂音調而且能合成語音。本發明亦與能合成多 们有4居音素從而產生一合成語音之語音合成裝置有關。 【先前技術】 由於傳統的聲音來源裝置不具有產生語音功能,故為了 在一傳統的聲音來源裝置中實施語音合成能力,需要將一 單獨的語音合成裝置併入聲音來源裝置中。舉例言之,先 別技術的語音合成裝置基於—原理操作,即認為具有自數 個*秒至數十個毫秒之較短持續時間之語音係處於一穩定 狀態以將該語音表示成數個正弦波之和。已熟知語音合成 裝置在每-音高週期中重置正弦波產生器之相位用於產生 正弦波以形成一語音化聲音,或左 次卩思機初始化正弦波產生器 之相位以展寬語音頻譜以便形一 战未語音化聲音(例如參 見專利文件1)。 第58-53351號(特許公 專利文件1係日本已審專利公告案 開第 56-051795號)。 二:?語音合成襄置併入聲音來源裝置中不僅會增加 :“絲置的硬體尺寸’而且會提高語音合成裝置的價 祖立 成衣置僅能合成低品質的不真實 治曰0 【發明内容】 因而本發明之一目的係提供一 種具有語音合成能力 之聲
O:\87\87930.DOC 1240914 音來源裝置,其能合成高 的語音合成裝置。 小而要併入一早獨 本發明之另一目的你& 合成裝置。 k供—能合成高&質語音之語音 古ΪΙ達到Γ上目的’依據本發明之―第―方面,一種具 ffl ,t <d? 9末源袭置包含複數個音調形成部分 用於依據一波形表聲音來源模式或-語音合成模式之指定 輸出所需音調或話音素,"“兮h 輪式之才曰疋 .^ t ^ 4 ”從而该荨音調形成部分以該波形
表聲音來源模式產味A U五立 生曰调並以該語音合成模式產生用於合 成〜。曰之活音素。該等音調形成部分之每—個包含一波 形形狀指定區段’其從複數個波形形狀中指定所需之一波 形形狀;一波形資料儲存區盆 /、儲存對應於該等複數個 波形形狀之波形資料;一波形資 疫沿貝科頊取區段,其以該波形 表尸耳曰來源模式操作用於產生以與欲產生音調之音程對應 之一速率改變之一可轡你从 交位址且猎由該可變位址自波形資 料儲存區段讀取對應於由波形形狀指定區段所指定之波形 形狀之波形資料,並以該語音合成模式操作用於產生以與 欲產生話音素之中心頻率對應之—速率改變之一可變位 址,且藉由該可變位址自波形資料館存區段讀取對應於由 波形形狀指定區段所指定之波形形狀之波形資料;及一包 絡應用區段’其以該波形表聲音來源模式操作用於產生盥 -指令同步增強以開始產生該音調並與另一指令同步衰減 以終止產生該音調之-包絡信號’且將所產生的包絡信號 應用於由波形資料讀取區段自波形資料儲存區段所讀取之
O:\87\87930.DOC 1240914 波形資料,並以該語咅入A捃 …一… 成拉式操作用於產生在與欲合成 吕口曰之一曰鬲週期對應之每一 > 可序期間快速衷減並在該衰 減之後快速增強之一包炊作垆,r ^ 匕,、,〇彳°5虎,且將所產生的包絡信號應 用於由波形貧料讀取區段自浊 目波形貪料儲存區段所讀取之波 形資料。 、% <狄 此外在本發明之第一方面φ, ^ ^十 $万面中,-種具有語音合成能力之 尸:曰來源裝置包含複數個音調形成部分用於依據一波形表 聲音來源模式或-語音合成模式之指定波形表輸出所需音 調或話音素,⑼而該等音調形成部分以該波形表聲音來源 '式產生音調’並以該語音合成模式產生用於合成一語音 曰素忒等曰凋形成部分之每一個包含一波形形狀指 定區Ί從複數個波料狀巾指定所需之—波形形狀; 一波形資料儲存區段,其儲存對應於該等複數個波形形狀 之波形資料,·一波形資料讀取區段,其以該波形表聲音來 源模式操作用於產生以與欲產生音調之音程對應之一速率 改支之可蜒位址,且藉由該可變位址自波形資料儲存區 奴項取對應於由波形形狀指定區段所指定之波形形狀之波 形貝料,並以該語音合成模式操作用於產生以與欲產生話 曰素之中心頻率對應之一速率改變之一可變位址,且藉由 忒可變位址自波形資料儲存區段讀取對應於由波形形狀指 疋區段所指定之波形形狀之波形資料;一包絡應用區段, 其產生與一指令同步增強以開始產生該音調或合成該語音 並與另一指令同步衰減以終止產生該音調或合成該語音之 一包絡信號,且將所產生的包絡信號應用於由波形資料讀
O:\87\87930.DOC 1240914 取區段自波形資料儲存區段 新斤俨甘一 奴所-取之波形資料;及-雜訊 1二二音合成模式操作用於將-雜訊新增到 /、有包絡應用區段所應用之包絡信號之波形資料中。 依據本發明之第一方 來矣辣立十、Μ 、 5亥專多個音調形成部分可以波 形成:::”原杈式產生音調,同時由多個音調形成部分所 ::話音素可以語音合成模式合成以產生一合成語 I二=於多個音調形成部分通常可用於音樂音調的 :“成,故語音合成能力可實施於聲音來源裝置 中而不需要將單獨的扭立 此外,…:: 成裝置併入聲音來源裝置中。 二Γ 式,雜訊新增區段可將雜訊新增到 活曰素中,從而合成高品質的真實語音。 在本發明之一篦-古 個話音素形成部分,每曰2成裳置包含複數 φ η θ素形成部分形成具有所需 之“素中心頻率及所需之一話音素位準之_舌 =成:分,該合成部分將由複數個話音二 形成之稷數個話音素混合用於產生一钮立H 音素形成部分之每一個勺人 π曰°该專複數個話 對應於-預定波:二Γ皮形資料储存區段,其儲存 段,里產在播 形資料’·一波形資料讀取區 :、一以,、應於該話音素中心頻率之-速率改變之一 :址以便精由所產生之位址讀取波形資料儲 ::波卿從而形成該話音素;及-雜訊新增區π 所J:Γ;曰到由波形資料讀取區段自波形資料儲存區段 所碩取之波形資料中。 r L千又 較佳地,話音素形成部分進—步包含—包絡應心段,
O:\87\87930.DOC 1240914 其產生與一指令同步增強 同步衰減以終止產生該語 號應用於由波形資料讀取 之波形資料中或具有由雜 資料中。 以開始產生該語音且與另一指令 音之一包絡信號,並將該包絡信 區段自波形資料儲存區段所讀取 訊新增區段所新增之雜訊之波形 不〜风口P分進—―少巴言一乘沒 波形資料與對應於話音素位準之位準資料相乘。 辛=:t成部分混合該等複數個話音素,每-個話, 素/、有戶“的話音素中心頻率及所需的話音辛位準,並自 該等複數個話音素形成#八 ” 、自 語音化聲音之語音 母—個輸出以便產生具有未 較佳地’波形資料儲存區段儲存正弦波形資料。 =雜訊新增區段包含用於產生一白雜訊之一雜訊 =用於限制該白雜訊之頻帶之—據波器。 月之第二方面,雜訊新增區段係提供於複數個 部分(每一個話音素形成部分形成具有所需之 曰素中心頻率及所需之一 ★立 每一個中,從而將複數個話音切日成^準中之一話音素)之 個話音素合成以產生-合成_^所形成的複數 訊新增到複數㈣音素巾,因而==增區段將雜 高品質的真實語音。 —吾音合成裝置可合成 個Ϊ 之一第三方面中,-種語音合成裝置包含複數 一未:^分,其用於依據-語音化聲音合成模式或 1化聲音合成模式之指定以語音化聲音話音素或未
O:\87\87930.DOC 1240914 語音化聲音話音素 v^式來形成具有所需話音素中心頻率 之活音素;及一人忐却 、 八 、口 U刀,其混合由複數個話音素形成部 刀、、/ :禝數個語音化聲音話音素以產生-語音化聲音 :立;由複數個治音素形成部分所形成之複數個未語音化 、I以產生一未語音化聲音。複數個話音素形成部 、 波形貝料儲存區段,其儲存對應於一預 定波形形狀之波形杳粗· 貝枓,一波形貨料讀取區段,其產生以 對應於以音素之話音素中心頻率之—速率改變之一位 址並回應於所產生的位址而讀取波形資料儲存區段中所 儲存:波形資料;及一包絡應用區段,其以該語音化聲音 ,才、式操作用於產生在與語音化聲音之—音高週期對應 之二時序期間快速衰減並在該衰減之後快速增強之一包 、口 U i將所產生的包絡信號應用於由波形資料讀取區 段自波形資料儲存區段所讀取之波形資料,並以該未語音 化聲音合成模式操作用於產生與_指令同步增強以開始產 生省未化茸音並與另一指令同步衰減以終止產生該未 曰化聲曰之&絡^ 5虎,且將所產生的包絡信號應用於 由波形資料讀取區段自波形資料儲存區段所讀取之波形資 料。 較佳地’話音素形成部分之每—個進一步包含一雜訊新 增區段’其以未語音化聲音合成模式操作用於將一雜訊新 增到由波形資料讀取區段自波形資料儲存區段所讀取之波 形資料中。 此外在本發明之第三方面中,一種語音合成裝置包含複 O:\S7\87930.DOC -12- 1240914 數個話音素形点立β ^ ^刀,其用於依據一語音化聲音合成模式 或未% 3化聲音合成模式之指定以語音化聲音話音素戋 未語音化聲音話音素之形式來形成具有話音素中心頻率1 話音素;及一人点邱八 、 口成邛刀,其混合由複數個話音素形成部分 所^成之複數個語音化聲音話音素以產生一語音化聲音, 由複數個話音素形成部分所形成之複數個未語音化 耳日口舌日,以產生一未語音化聲音。該等複數個話音素形 成‘刀之母_個包含一波形資料儲存區段,其儲存對應於 複數個波形形狀之波形資料;一波形形狀指定區段,:以 該語音化聲音合成模式操作用於自複數個波形形狀中指定 斤而之;皮科狀,並以未語音化聲音合成模式操作用於 指定-預定波形形狀;一波形資料讀取區段,其產生以與 話音素中心頻率對應之一 #査 連率改變之一位址並回應於所產 生位址而自波形資料儲左Ρ 貝t十U存區段讀取對應於由波形形狀指定 區段所指定波形形狀之波形資 >貝枓,及一包絡應用區段,其
以该3吾音化聲音合成握★彡品A 攻杈式刼作用於產生在與語音化聲音之 一音高週期對應之每一時庠ΰ f序期間快速衣減並在該衰減之後 快速增強之一包絡信號,且將 _ 且將所產生的包絡信號應用於由 波形負料續取區段自波形杳斗立 反小貝枓儲存區段所讀取之波形資 料’並以該未語音化聲去人士 曰化耳曰口成模式操作用於產生與一指令 同步增強以開始產生該未★丑立 /禾口口 g化聲音並與另一指令同步衰 減以終止產生該未語音化聲立 曰π耳曰之一包絡信號,且將所產生 的包絡信號應用於由波形資料# 心貝#項取區段自波形資料儲存區 段所讀取之波形資料。 O:\87\87930.DOC -13- 1240914 較佳地,話音素形成部分之 声卩$ 甘 1U進—步包含一雜訊新 私EU又,其以未語 增到由n 成祆式知作用於將一雜訊新 心到由波形貢料讀取區段 形資料中。 U貝科储存區段所讀取之波 依據本發明之笛— 的往音… 多個話音素形成部分形成所需 聲音。in 口成一 ^音化或未語音化 聲音話音:循環之包絡信號新增到用於形成語音化 辛一立料中。因此,可賦予語音化聲音話音 常a间感,從而合成高品質的直實注立% ^ 新增到用於形成未注立P立日。進一步將雜訊 人成古口併沾古0 θ每日活音素之波形資料中,從而 口成回口口貝的真實語音。 在本發明之_第 個話t f ρ Α 種語音合成裝置包含複數 口。古曰裳形成部分,每一立 之一話音素令心頻率之形成部分形成具有所需 部分將由… ^ 0素,及一合成部分,該合成 I刀將由後數個話音夸 合以產生一▲、所形成之複數個話音素混 波情二曰 個話音素形成部分之每-個包含- /反形形狀指定區段,苴 波形形狀;一波形:”;自硬數個波形形狀中指定所需之- 1 ;4料11段,其儲存對應於複數個波 $形狀之波形資料;— 於話立去士 波形爽料讀取區段,其產生以對應 的位址而自波形資料儲之一位址並回應於所產生 之波形資料w取對應於所指定波形形狀 ι、、°應用區段,其產生在與該語音之一 曰鬲週期對應之每—拄 、J間快速哀減並在該衰減之後快
O:\87\87930.DOC -14- 1240914
包絡㈣,且將所產生的包絡信號應用於由波 开》貝枓言買取區段自減#咨M y貝枓储存區段所讀取之波形資料 中0 、 複^地’合成部分將由複數個話音素形成部分所形成之 稷=音素混合用於以語音化聲音之形式產生該語音。 本土月之第四方面’多個話音素形成部分之每一個 ’一具有所需之-話音素中心頻率及所需之一話音素位準 之:話音素1而將所形成之多個話音素合成以產生一合 、曰#著將日〶循環之包絡信號新增到用於形成該等 :音素之_資料中,以便可賦予該等話音素-音高感, 枚而口成冋品質的真實語音。此外’由於音高循環之包絡 信號係新增到用於形成語音化聲音話音素之波形資料中, 故可賦予語音化聲音話音素一音高感。 【實施方式】 v圖1係依據本發明之一具體實施例顯示亦充當一聲音來 源裝置之一語音合成裝置之結構之方塊圖。 圖1所示語音合成裝置1係由以下部分組成:-波形資料 儲存器,其儲存關於複數個波形形狀之波形資料;九個波 形表語音(wavef0rm table v〇ice; WT v〇ice)部分 i〇m 10c、10d、10e、1〇f、1〇g、1〇h及 i〇i,每一個部分具有至 少-自波形資料儲存器讀取預定波形資料之讀取區段;及 混合區段11 ’其用於混合自WT語音部分10a至l〇i所輸出之 波形貪料。混合區段u輸出所產生之一音樂聲音或合成語 音。在此情形中,向…丁語音部分1〇a至1〇i供應作為各種參
O:\87\87930.DOC -15- 1240914 數之音调參數及语音參數,且當指示音調/語音產生之語音 模式旗標(HV—MODE)指示產生音樂聲音(Hvm〇DE=0)時,選 擇音調參數並將其使用於WT語音部分10a至i〇i中。接著WT 語音部分10a至10i基於所選取的音調參數產生關於多個音 条音调之波形資料並輸出波形資料。一旦接收到波形資 料’混合區段11最多能輸出九個音調之聲音。
另一方面,當指示音調/語音產生之語音模式旗標(hvmode) 指示產生有聲聲音(HVMODEM)時,選擇語音參數並將其 使用於WT語音部分l〇a至l〇i中。接著貿丁語音部分1〇a至i〇i 基於語音參數產生波形資料用於形成一語音化聲音音高信 號、語音化聲音話音素或未語音化聲音話音素並輸出波形 資料。一旦接收到波形資料,混合區段丨丨就合成用於形成 語音化聲音話音素或未語音化聲音話音素之波形資料以輸 出語音。應明白,「HVMODE」中的「HV」代表人類語音, 且「U/V」係指示未語音化聲音/語音化聲音之一指示旗標。 當供應HVMODE=l且U/V=0時,WT語音部分i〇b至1〇丨輸出 用於形成語音化聲音話音素之波形資料。已向其供廉 HVMODE=l且U/V=0之WT語音部分l〇a輸出一語音化聲音 音冋# 5虎以疋義〗吾音化聲音之音南週期而不需要使用任何 波形資料。來自WT語音部分l〇a之語音化聲音音高信號係 供應給WT語音部分10b至10i,從而在語音化聲音音高作麥 之每一循環期間將重置用於形成語音化聲音話音素之波形 釦料之相位。此外’對應於语音化音而信號之循環獲得每 一語音化聲音話音素之包絡形狀。因而,可賦予語音化聲 O:\87\87930.DOC -16- 1240914 音話音素一音高感。 另方面當供應hvmode=i且U/V=l時,WT語音部分 10b至I0i輸出用於形成未語音化聲音話音素之波形資料。
在此情形中’未使用已向其供應HVM0DE=1且U/V=l之WT 語音部分10a之輸出。因而,當設定hvM〇de=1時,WT語 音部分10b至i〇i可輸出八個語音化或未語音化聲音話音素 之隶大值。 、以下5兒明語音之一般概念。儘管任何語音係由聲帶振動 產生,但即使發出不同字元之聲音,聲帶振動頻率大約保 持相同。n由嘴張開不同尺寸或不同形狀的喉腔或聲道所 產生之共振及向聲帶振動附加摩擦或爆破音產生各種有聲 聲音。在此類有聲聲音中,其中頻譜係集中於特定頻帶中 之多個稱作話音素之部分存在於一頻率軸上。話音素之中 心頻率或最大振幅之頻率係稱作話音素中心頻率。有聲聲 音中話音素之數目及每-話音素之中心頻率、振幅與頻寬 係定義有聲聲音特徵之因數,且很大程度上取決於說話者 之性別、身體屬性、年齡等。另一方面,對於每一種類的 字元而言,特徵話音素之組合係固定的且與語音型式無 關。將話音素型式廣泛地分類成具有音高感且用於合成注 音化聲音之語音化話音素,及不具有音高感且用於I成2 語音化聲音之未語音化話音素。語音化聲音係聲帶振動時 所產生之-聲音,其包括it音、半it音及濁辅音例如b、^ m、r 4。未語音化聲音係聲帶不振動時所產生之一爽立 其對應於清輔音例如h、k、s等。 曰 O:\87\87930.DOC -17- 1240914 依據本發明,當在具有圖1所示結構且亦充當聲音來源裝 置之語音合成裝置中產生音樂音調時,設定hvmode=o且 WT語音部分10a至l〇i產生複數個音調,即最多能產生九個 音調之聲音。 一旦合成語音,WT語音部分10b至l〇i就形成對應於欲以 HVMODE=l之模式合成之語音化聲音或未語音化聲音之語 音化聲音話音素或未語音化聲音話音素。在此情形中,欲 合成之语音係八個話音素之最大值之一組合。例如,對欲 合成之語音進行語音化時,向WT語音部分i〇b至i〇i供應 U/V=0,從而WT語音部分1〇b至1〇i將分別基於所供應的語 曰參數形成語音化聲音話音素。此時,向WT語音部分i 供應u/v=〇,從而冒丁語音部分10a將基於所供應的語音參數 產生一語音化聲音音高信號。向WT^f音部分10b至10i供應 語音化聲音音高信號,從而在語音化聲音音高信號之每一 循環期間將重置用於形成欲輸出之每一語音化聲音話音素 之波形資料之相位。此外,對應於語音化音高信號之循環 獲得每一語音化聲音話音素之包絡形狀。因而,WT語音部 分1 Ob至1 〇i形成具有一音高感之語音化聲音話音素。 另方面,對欲合成之語音進行未語音化時,向WT語音 部分10b至:UH供應1^^1〇1^=1且11~=1,從而|丁語音部分 〇b至1 〇i將刀別基於所供應的語音參數形成未語音化聲音 蛞曰素卩返後將說明,在未語音化聲音合成之情形中,將 雜訊新增到未語音化聲音話音素中從而合成高品質、真實 的有聲聲音。應明白,WT語音部分10a之輸出未用於未語
O:\87\87930.DOC *18- 1240914 音化聲音之合成。 語音合成裝置1中的WT語音部分10a至l〇i具有相同的結 構。以下將作為WT語音部分10來說明該結構。圖2係顯示 WT語音部分1 〇之結構之示意性方塊圖。在此圖式及以下圖 式中,符號「WT」、「VOICED SOUND FORMANT」及 「UNVOICED SOUND FORMANT」分別指示該等參數係用 於產生一音樂音調、一語音化聲音話音素及一未語音化聲 音話音素。 、在圖2中’ 一相位貧料產生器(相位產生器(Phase Generator ; PG)) 20產生對應於欲產生音調或語音化聲音音高信號之音 高、語音化聲音話音素之中心頻率及未語音化聲音話音素 之中心頻率中任一者之相位資料。向PG 20供應關於語音模 式旗標(HVMODE)及未語音化/語音化聲音指示旗標(u/v) 之旗標資訊,及作為音調參數之音調八度資訊區塊(WT)與 音調頻率資訊FNUM (WT)。亦作為語音參數向pg 20供應關 於語音化聲音音南信號之八度資訊區塊(語音化聲音音高) 及關於語音化聲音音高信號之頻率資訊FNUM(語音化聲音 音高)或關於語音化聲音話音素之八度資訊區塊(語音化聲 音話音素)、關於語音化聲音話音素之頻率資訊FNUM(語音 化聲音話音素)、關於未語音化聲音話音素之八度資訊區塊 (未語音化聲音話音素)及關於未語音化聲音話音素之頻率 資訊FNUM(未語音化聲音話音素)。在pG 2〇中,所供應的 各種參數係依據旗標資訊及與欲產生音調之間之音程或語 音化聲音音南彳§號、语音化聲音話音素之中心頻率與未語 O:\87\87930.DOC -19- 1240914 音化聲音話音素之中心頻率中任一者對應之相位資料而選 擇。 — 圖3顯示PG 20之詳細結構。在圖3中,一選擇器30依據U/V 旗標之狀態選擇關於語音化聲音話音素之語音化聲音音高 信號與頻率資訊FNUM或關於未語音化聲音話音素之頻率 資訊FNUM並將其輸出至一選擇器31。選擇器31依據 ilVMODE旗標之狀態選擇關於音樂音調之頻率資訊FNUM (WT)或自選擇器30所輸出與語音相關之頻率資訊FNUM, 並將其輸出至一偏移器34使得自選擇器3 1所輸出之頻率資 訊FNUM將在偏移器34中進行設定。此外,一選擇器32依據 U/V旗標之狀態選擇關於語音化聲音話音素之語音化聲音 音高信號與八度資訊區塊或關於未語音化聲音話音素之八 度資訊區塊,並將其輸出至一選擇器33。選擇器33依據 HVMODE旗標之狀態選擇音調八度資訊區塊(WT)或自選 擇器32所輸出與語音相關之八度資訊區塊,並將其作為偏 移資訊輸出至偏移器34使得偏移器34中所設定的頻率資訊 FNUM將依據八度資訊區塊偏移。因而,已新增一八度效應 從而將產生欲產生音調之間之音程或語音化聲音音高信 號、語音化聲音話音素之中心頻率及未語音化聲音話音素 之中心頻率中之一者之相位資料係自PG 20作為PG輸出而 輸出。 返回圖2,來自PG 20之PG輸出係輸入至一位址產生器 (address generator ; ADG) 21中,其中作為PG輸出之相位資 料經累積以產生一讀取位址用於自一波形資料儲存器(波 O:\87\87930.DOC -20- 1240914 形表)22讀取具有所需波形形狀之波形資料。作為音調參數 白ADG 21供應一開始位址sa (WT)、一迴路點LP (WT)與一 結束點EP (WT)並供應關於語音模式旗標(HVMODE)與未 語音化/語音化聲音指示旗標(U/V)之旗標資訊。亦作為語音 參數向ADG 21供應一波形選擇(wavef〇rm seiect ; ws)信號 用於選擇適於形成語音化聲音話音素之一波形,及一音鍵 開啟信號以通知聲音產生(通常用於音樂聲音與有聲聲音) 開始。 、在音樂聲音產生情形中,設定hvmode=o且在音鍵開啟 信號開始時刻自ADG 21輸出開始位址SA (WT)以開始自波 形貧料儲存器22中由開始位址SA (WT)所指示之一位置讀 取波形資料。接著來自?(}2〇之相位資料經累積使得到達結 束點EP (WT)之讀取位址將以對應於音調之間之音程之一 速率改變。自ADG 21逐一輸出讀取位址之已改變之值。因 而,到達波形資料儲存器22中由結束點EP (WT)所指示位置 之波形資料之樣本係以與音調之間之音程對應之速率逐一 碩取出來。接著,與迴路點Lp(WT)對應之讀取位址之另一 值係自ADG 21輸出,且來自PG 2〇之相位資料經進一步累 積使彳于到達結束點EP (WT)之讀取位址將以與音調之間之 音程對應之速率改變。自ADG21逐一輸出讀取位址之已改 變之值。因而,自波形資料儲存器22中由迴路點Lp(WT)所 4曰示位置至波形資料儲存器22中由結束點ep (WT)所指示位 置之波形資料之樣本係以與音調之間之音程對應之速率逐 一讀取出來。自迴路點LP (WT)至結束點Ep (WT)之讀取位
O:\87\87930.DOC -21 - 1240914 址係反覆地產生直到由音鍵開啟信號終止聲音產生。因 而,所需的波形資料可從聲音產生開始以與音調之間之音 程對應之速率自波形資料儲存器22讀取直到由音鍵開啟信 號所指示之聲音產生終止。 ,在語音合成情形中mVM〇DE=i且波形資料之讀取 係在音鍵開啟信號開始時刻自波形資料儲存器22中由一開 始位址(由一 ws(語音化聲音話音素)信號指定)或一預定開 始位址(對於未語音化聲音話音素而言)所指示之一位置開 始。接著來自P G 2 0之相位資料經累積使得位於一固定範圍 内之讀取位址將以與語音化聲音話音素或未語音化聲音話 音素之中心頻率對應之一速率改變。自ADG2i逐一輸出讀 取位址之已改變之值。因而,波形資料之樣本係以與語音 化奪a遘音素或未語音化聲音話音素之中心頻率對應之速 率自波形資料儲存器22逐一讀取。在冒丁語音部分1〇&中, 由於已設定成,來自PG 20之相位資料之累積值將在語音化 聲音音咼之每一循環期間達到一預定值(恆定值),故累計值 每次達到該恆定值時會輪出語音化聲音音高信號(脈衝信 號)。 、亨4顯示ADG 21之詳細結構。在圖4中,來自pG 2〇之相 位資料係輸入至一累積器(accumulator ; ACC) 41中,其中 在每一時脈循環對相位資料進行累積,從而將產生讀取位 址之增加值。讀取位址之增加值係透過一選擇器46供應給 加法裔47,其中新增一開始位址以產生讀取位址。接著 自ADG 21作為ADG輸出而輸出讀取位址。 O:\87\87930.DOC -22- 1240914 以下說明設定HVMODE = 〇時ADG 21中用於產生音樂聲 音之操作。當設定HVMODE二〇時,由於已關閉AND閘極, 故僅藉由自一 OR閘極所輸出之音鍵開啟信號將Acc 4丨重 置為初始值以開始以與欲產生音調之間之音程對應之一速 率累積來自PG 20之相位資料。在每一時脈循環期間進行累 積’且將累積值b輸出至選擇器46與減法器43。 由於設定HVMODE = 0,故用於將資料生供應給減法器杓 之一選擇器42選擇結束點EP (WT)作為資料达並將其輸出至 減法器43。因而,將減法器43中所計算的相減所得值(a_b) 輸出,且藉由自相減所得值(a_b)移除最高有效位元(Mom Si辟ificant Bit ; MSB)所獲得之一振幅值|a—…係供應給一加 法器45。當相減所得值(a_b)為負時,將為「丨」之信號 作為-選擇信號供應給選擇器46並作為—負載信號供應給 ACC 41。由於當相減所得值(a_b)為負時Μ§Β信號變為「1」, 故選擇器46繼續向加法器47輸出累積值13直到累積值超過 結束點EP(WT)。由於設^HVMqd㈣,因而用於將相加資 料供應給加法H47之-選擇㈣選擇開始位址SA (wt)並 將其輸出至加法器47。因而,已新增開始位址sa(wt)之累 積㈣係作為ADG輸出而輸出。由於當相位資料在每一時脈 循環期間累積時累積值!^以相位資料之速率改變,故作為 ADG輸出之讀取位址亦依據相位資料改變。 # 篇累積值b超過結束點EP (WT)時,由於msb信號變為 「1」,故選擇器46開始輸出自加法器45所輸出之資料c。由 於設定刪〇购,故資制已在加法器C中新增振幅值
O:\87\87930.DOC -23- 1240914 |a-b|之一計算值,其中振幅值丨a—b丨係藉由自相減所得值 私除MSB而獲得。因而,來自加法器47之ADG輸出係已由 振幅值|a-b|校正迴路點Lp(WT)之一讀取位址。此外,由於 唬變為「丨」,故負載信號係供應給ACC 41使得資料^ 將載入ACC 41中。因而,由於MSB信號返回「〇」,故自Acc 41所輸出之貝料b係自選擇器46輸出。由於將資料。新增到 相位貝料中時累積值b係在每一時脈循環期間自ACC 41輸 出,故ADG輸出以與大約來自迴路點LP(WT)讀取位址之相 位資料之速率對應之速率改變。
以下將芩考一曲線圖說明此情形中的ADG輸出。圖5顯示 孩ADG輸出。如圖所示,當應用音鍵開啟信號時,輸出開 始位址SA (WT),且讀取位址增加同時以與相位資料速率對 應之速率改變。因而當讀取位址自開始位址8八增加至結束 點(EP)時,其返回開始位址SA(WT)加迴路點(LP)之值,且 攸此時起繼續產生讀取位址直到其自開始位址SA (WT)加 k路2 (LP)之值增加至結束點(Ep)。在此週期期間,讀取位 止以14相位資料速率對應之速率改變。因而當聲音產生藉 由音鍵開啟信號終止時,ADG輸出亦終止。經由讀取位址 作為ADG輸出自波形資料儲存器22所讀取之波形資料具有 與相位資料頻率對應之一頻率。由於經由讀取位址自波形 貧料儲存器22所讀取之波形資料之種類係可選擇的,故(例 如)可為WT語音部分10a至10i之每一個選擇開始位址SA (WT)使得…丁語音部分1〇a至i〇i之每一個產生一不同音色 之音調。
O:\87\87930.DOC -24- 1240914 以下說明ADG 21之操作,# wt語音部分^在 HVM〇DE=1且U/V=〇條株τ方江 保件下產生語音化聲音音高信號時, ADG 21為其充當一位 址產生為。當設定HVMODE=l且 U/㈣時,開啟AND閘極,但是由於未向资語音部分i〇a 供應語音化聲音音高作缺 ,,_ , ^ 5虎’故僅音鍵開啟信號係自OR閘極 輸出。因而,依據欲產生之語音化聲音音高信號藉由音鍵 開啟信號將ACC 41重置為初始值以開始累積自PG 20所供 應之相位貝料。在每一時脈循環期間進行累積且向選擇器 46與減法& 43輸出累積值b。由於設⑼㈣,故用於 將 > 料生供應給減法5| 4 ]夕、竖抑/1、 乂成為43之選擇!g 42選擇一預定恆定值作 為資料祕將其輸出至減法器43。因而,將減法器43中所計 异的相減所得值㈣輸出,且藉由自相減所得值㈣移除 MSB所獲得之—振幅值丨㈣系供應給加法器μ。 此外,相減所得值㈣之MSB信號係作為選擇信號供應 給選擇器46並作為負載信號供應給似41。若相減所得值 ㈣)為負1當累積值已達到㈣值時,刪信號變為 」為1」之MSB信號係作為負載信號供應給ACc 4 j 且資料e係載人至ACC41。由於設定ΗνΜ〇Μ=ι,故資料。 係在加法益45中藉由將振幅值|a_b|(藉由自相減所得值(& 料MSB而獲得)新增到由選擇器料所選取之「〇」中所計 算因而,當ACC41在下一時脈循環中將相位資料新 增到貧料c中時,MSB作骑微i「Λ 1口 h為〇」。因而MSB信號係基於 ir 2:所供1應之語音化聲音音高參數以與相位資料循環 、'之一循環產生’即在語音化聲音音高之每一循環期間
O:\87\87930.DOC -25- 1240914 產生一次。已向其供應HVMODE=l且U/V=0之WT語音部分 10a作為語音北耷音音高信號輸出MSB信號。如圖7曲線圖 所示,語音化聲音音高信號係具有一語音化聲音音高週期 之一脈衝信號。在此情形中,WT語音部分1〇a輸出AD(}輸 出,但是ADG輸出未用作讀取位址。 、以下說明設定HVMODE= 1且U/V=0時用於產生語音化聲 音話音素之ADG 21之操作。當設定hvm〇de==1&u/v==〇 時,由於AND閘極係藉由閘極Ν〇τ之作用開啟,故依據欲 產生之語音化聲音話音素之中心頻率藉由語音化聲音音高 信號及自OR閘極所輸出之音鍵開啟信號將Acc Ο重置為 初始值以開始累積自PG 2〇所供應之相位資料。如圖7所示 由於自WT語音部分i 〇a所輸出之語音化聲音音高信號係在 and閘極處得到供應,故ACC41在每—時脈循環期間進行 累積’並將累積值b輸出至選擇器46與減法㈣。由於設定 HVM〇DE=1,故用於將資料祕應給減法器43之選擇器又42 選擇預定怪定值作為資料祕將其輸出至減法器43。將資料 成定為怪定值,原因係波形資料中用於形成話音素之數量 係固定^。因而,將減法㈣中所計算的相減所得值㈣ 輸出且精由自相減所得值(a_b)移除刪所獲 la-b|係供應給加法器45。 派怕值 得值㈣之MSB信號係作為選擇信號供應 作為負載信號供應給批41。#相減所得值 出號變為…,故選擇器— 別,、積值b直到累積值b超過恆定值。由於設定
O:\87\87930.DOC -26- 1240914 MODE 1目而用於將相加資料供應給加法器47之選擇 器5〇選擇選擇器49之輸出並將其輸出至加法ϋ47。此外, 由於設定u/v=o,故自一開始位址產生器48所輸出之所選取 用於形成語音化聲音話音素之波形資料之—開始位址SA (WSM系輸出至選擇器49。設計開始位址產生器仙在波形 貝枓儲存器22上輸出開始位址从,從而將依據所輸入之一 波形選擇(WS)信號選擇波形資料以選擇適於形成語音化聲 音話音素之一波形。因而,加法器47將累積㈣新增到開始 位址SMws)中並將其作為ADG輸出而輸出。累積值b係藉 士在每-時脈循環期間累積相位資料而獲得且其以與相位 資料速率對應之速率改變。因而,用於
t形成=音化聲音話音素之娜輸出讀取之讀取位HI 兵相位資料速率對應之速率改變。 V因而當累積繼續並達到恒定值時,相減所得值(a· MSB信號分別變為負與…並供應給選擇器耗。因而,選 擇器46輸出資心。由於設定ΗνΜ〇Μ = ι,故資料c係在加 法器45中藉由將振幅值卜bl(藉自自相減所得值(a-b)移除 MSB而獲得)新增到由選擇器料所選取之「〇」中所計算之 值。因而,來自加法器45之ADG輸出變為振幅值Ml: :位址。此外,MSB信號係作為負載信號供應給ACC 4 i且 貝料c係載入至ACC41。因而在下一時脈循環期間將相位資 料新增到資料e中時,由於繼信號返回、,故選擇器Μ 輸出自ACC 41所輸出之資料b。由於Acc 41在每一時脈循 壤期間執行相位資料之累積’故在每一時脈循環期間伽
O:\87\87930.DOC -27- 1240914 輸出自開始位址从(ws)以與相位資料逮率對應之速率改 變。因而,當伽輸出增加^值,其返回開始位址从 (ws)。因而ADG輸出重複自開始位址sa (ws)改變之讀取 位址直到ADG輸出增加恆定值。由於此情形中的相位資料 係基於語音化聲音話音素之中心頻率,故讀取位址以與語 音化聲音話音素之中心頻率對應之速率改變。此外,由於 ACC 係藉由自资語音部分他所輸出之語音化聲音音高 信號重置為初始值’故在語音化聲音音高之每一循環期間 重置ADG輸出,從而將一音高感賦予具有自波形資料(使用 A D G信號作為讀取位址自波形資料儲存器2 2讀取)所形成 之一預定中心頻率之語音化聲音話音素。 此情形中的ADG輸出如圖6中的曲線圖所示。如圖所示, 當應用音鍵開啟信號時,與選擇用於形成語音化聲音話音 素之波形資料之ws信號對應之開始位址SA (ws)得以輸 出。讀取位址藉由ACC41之作用增加同時以與語音化聲音 話音素之中心頻率對應之速率改變。因而當讀取位址自開 始位址SA (WS)增加恆定值時,其返回開始位址SA (ws), 並從此時起反覆地產生自開始位址SA (ws)改變為已增加 恆定值之值之讀取位址。所選取的波形資料係由adg輸出 自波形資料儲存器22讀取以形成具有來自所讀取波形資料 之預定中心頻率之語音化聲音話音素。因而當聲音產生藉 由音鍵開啟信號終止時,ADG輸出亦終止。由於經由開始位 址SA (WS)(即藉由WS (語音化聲音話音素)信號)自波形資 料儲存器22所讀取之波形資料係可選擇的,故所形成的語音 O:\87\87930.DOC -28- 1240914 化聲音話音素可改變。在圖6中未顯示藉由自w丁語音部分 i〇a所輸出之語音化聲音音高將ACC 41重置為初始值。 以下說明設定HVMODE=l且U/V二1時用於產生未語音化 聲音話音素之ADG 21之操作。當設sHvm〇〇e引且u/vy 時,由於AND閘極係藉由閘極>^〇 丁之作用關閉,故依據欲 產生之未語音化聲音話音素之中心頻率僅藉由自OR間極 所輸出之音鍵開啟信號將ACC 41重置為初始值以開始累積 自PG 20所供應之相位資料。在每一時脈循環期間進行累 積,且向選擇器46與減法器43輸出累積值b。由於設定 HVM〇DE==1,故用於將資料生供應給減法器43之選擇器42 選擇預定恆定值作為資料达並將其輸出至減法器“。將資 ^設定為惶定值,原因係波形資料中用於形成話音素之數 里係固:的。因而,將減法器43中所計算的相減所得值㈣ 輸出且猎由自相減所得值㈣移除所獲得之振幅值 |a-b|係供應給加法器45。 此外’相減所得值(a_b)之msb信號係作為選擇信號供鹿 給選擇器46並作為負載信號供應給ACC41。當相減所得: ㈣為負時,由於MSB信號變為「1」,故選擇器46向加法 器47輸出累積值b直到累積值b超過恆定值。由於設定 HVMODE-1,因而用於將相加資料供應給加法器π之選 ""5〇選,選擇器49之輸出並將其輸出至加法器47。此外, 由於設定U/V=1’故預定(固定)正弦波相關波形資料之開始 ㈣係輪出至選擇㈣。原因係正弦波係適於开; 成未°。曰化聲音話音素。因而,加法器47將累積值]3新增到
O:\87\87930.DOC -29- 1240914 ㈣位址从(正弦)中並將其作為adg輸出而輸出。累積㈣
係藉由在每-r時脈循環里日R 循衣J間累積相位資料而獲得,且其以 與未語音化聲音話音素之中心頻率對應之速率改變。因 而,雜形資料作為用於形成未語音化聲音話音素之剔 輸出項取之讀取位址亦以與未狂立 〇不曰化聲音話音素之中心頻 率對應之速率改變。 '口而$累積值b超過恆定值時,由於msb信號變為「工」, 故選擇器46開始輸出自加法器45所輸出之資料c。由於設定 刪㈤㈣,故資料c係在加法器Μ藉由將振幅值 I b| (藉由自相減所仔值(a_b)移除而獲得)新增到由選 擇器44所選取之「〇中 斤口十开之值。因而,來自加法器45 DG輸出係、振巾田值卜b|之讀取位址。此外,msb信號係 作為負載信號供應給ACC 41且資料c係載入至ACC 41。因 而在下-時脈循裱期間將相位資料新增到資料c中時,由於 職信號返回「〇」,故選擇器46輪出自ACC41所輸出之資 料b由於ACC 4 1在每—時脈循環期間執行相位資料之累 積’故在每一時脈循環期間伽輸出自開始位址从(正弦) 以與相位資料速率對應之速率改變。因而,當adg輸出增 加恆定值時,其返回開始位址SA(正弦)。因而adg輸出重 複自開始位址SA(正弦)改變之讀取位址直到adg輸出增加 恒定值。由於此情形中的相位資料係基於語音化聲音話音 素之中心頻率,故讀取位址以與未語音化聲音話音素之中 心頻率對應之速率改變。對應的波形資料係藉由ADG信號 作為讀取位址自波形杳粗紗六口口 〆貝枓儲存為22讀取以形成具有預定中
O:\87\87930.DOC -30- 1240914 心頻率之未語音化聲音話音素。 此情形中的ADG輸出如圖8中的曲線圖所示。如圖所示, 當應用音鍵開啟信號時,用於形成未語音化聲音話音素之 正弦波相關波形資料之開始位址SA(正弦)得以輸出:讀取 位址藉由ACC 41之作用增加同時以與未語音化聲音話音素 之中心頻率對應之速率改變。因而#讀取位址自開始位址 SA(正弦)增加Μ值時,其返回開始位址sa(正弦)並從此 時起反覆地產生自開始位址SA(正弦)改變為已增加恆定值 之值之讀取位址。所選取的正弦波相關波形資料係由碰 輸出自波形資料儲存器22讀取以自所讀取波形資料形成具 :預定中心頻率之未語音化聲音話音素。因而當聲音產生 藉由音鍵開啟信號終止時,ADG輸出亦終止。 立獨14顯示波形資料儲存器22中所儲存用於形成語音化聲 曰舌a素或未^ θ化聲音話音素之複數個波形形狀之範 例0 圖14顯示關於32種波形形狀之波形資料係儲存於波形資 料儲存1122中之情形m「G」為ws(語音化聲音話音 素)信號時,將號石馬為〇之一正弦波讀取出來。替代地,例 如右6又疋—「16」4ws(語音化聲音話音素)信號,則將號碼 :16之一三角波讀取出來。此外,將開始位址SA(正弦)設 =為波形資料儲存器22上號碼⑽之正弦波之開始位址。此 等3 2種波形資料之金+ 3 … 竹之數ϊ係固定的,且上述恆定值對應於資 料數量。因而,卷Μ 欠 田32種波形-貝枓中任一者藉由八0〇輸出自 ADG 21讀取出央蛀 ^ ^ , 3:5果時,反覆地將關於所選取波形形狀之波形
〇A87\8793〇.D〇C -31 - 1240914 資料讀取出來直到終止聲音產生。 返回圖2,自波形資料儲存器22所讀取之波形資料係供應 給一乘法器23,其中波形資料係與一包絡產生器(envel〇p generator ; EG)24所產生之一包絡信號相乘。向eg 24供應 關於語音模式旗標(HVM0DE)與未語音化/語音化聲音指示 旗標(U/V)之旗標資訊,及作為音調參數之一起奏速率 (attack rate ; AR)(WT)、一衰減速率(decay rate ; DR)(WT)、 一維持速率(sustain rate ; SR)(WT)、一釋放速率(reiease rate ; RR)(WT)及一維持位準(sustain level ; SL)(WT)。亦向 ADG 21供應音鍵開啟彳§號以通知通常用於音樂聲音與有 聲聲音之聲音產生開始。 圖9係顯示此類包絡產生器(EG) 24之詳細結構之方塊圖。 如圖9所示一旦產生音樂聲音,就在EG 24中設定 HVMODE=0。在此條件下,選擇器60選擇起奏速率ar (WT) 並將其輸出至選擇器61。選擇器63選擇衰減速率dr (WT) 並將其輸出至選擇器61。選擇器64選擇釋放速率rr (wt) 並將其輸出至選擇器61。亦將維持速率SR (WT)輸入選擇器 61中。選擇器61係由一狀態控制器66控制以為起奏、衰減、 維持及釋放之每一狀態選擇並輸出一包絡參數。向狀態控 制為66供應維持位準SL (WT)信號以及音鍵開啟信號與關 於語音模式旗標(HVMODE)之資訊。亦向狀態控制器%供 應δ吾音化聲音音焉#號及關於未語音化/語音化聲音指示 旗標(U/V)之旗標資訊,但是未使用此等資料。基於狀態自 遥擇器61所輸出之包絡參數係猎由一累積器(a C C) 6 5累積 O:\87\87930.DOC -32- 1240914 以產生一包絡。該包絡不僅作為郎輪出而輪出’而且供庫 給狀恶控制器66。狀態控制器66可從E 〜 能如丸a ^ Φ之位準判斷狀 恶。在音鍵開啟信號開始時刻,ACC65開始累積。 此’丨月形中的EG輸出如圖1 〇中曲線圖所 ^ . 控制祕與ACC65之音鍵開啟二=== 聲音產生之開始並通知選擇器61輸出 開 時間作為狀態參數用於起奏之艇夹、φ玄 開始 (奏之起奏速率AR (WT)參數。此 起奏速率AR (WT)參數係在每—時脈循環期間在Acc⑽ 進行累積且如圖10中从所指示EG輸出急劇上升。接著當 EG輸出之位準達到例如〇dB時,^ ^ 了狀心ί工制态66判斷狀態已 為农減並通知選擇器61輸出衰減速率DR (WT)來數。此 衷減速率DR (WT)參數係在每—時脈循環期間在ACC叫 進行累積,且如圖10中⑽所示EG輸出急劇下降。 '當EG輸出繼續下落且即輸出之位準達到維持位準SL 時’狀態控制器㈣測到此點且判斷狀態已轉為維 、亚通知選擇益61輪出維持速率SR(WT)參數。維持速率 > (WT)參數之輸出係在每—時脈循環期間在ACC Μ處進 累積且如圖10中SR所示即輸出平緩地下降。狀態控制 器66繼續保持維持狀態直到音鍵開啟狀態停用。接著當判 斷音鍵開啟信號停用且終止聲音產生時,狀態控制器⑽ 知選擇器64輸出釋放速率rr(Wt)參數。釋放速率rr(wt) 多數之輸出係在每_時脈循環期間在AN &處進行累積, 且如圖1G中RR所示EG輸出急劇下降以終止聲音產生。 I一旦產生語音就產生語音化聲音話音素之情形下,如
O:\87\87930.DOC -33 - 1240914 圖9所示在EG 24中設定HVMODE: 下’遥擇為6Ό為初始狀態選擇一快速增強速率並將其輸出 至選擇器61。選擇器63回應於υ/ν=0之設定為在選擇器62 處所選取之中間狀態選擇一恆定值,並將其輸出至選擇器 1遥擇器64為結束狀態選擇一快速衰減速率並將其輸出 至選擇器61。亦將維持速率SR(WT)輸入選擇器“中,但是 未使用此參數。選擇器61係由狀態控制器66控制以為初 始中間及結束狀態之每一者選擇並輸出一包絡參數。向 狀態控制器66供應音鍵開啟信號、自w丁語音部分—所輸 出之語音化聲音音高信號及關於語音模式旗標(hvm咖) 2未語音化/語音化聲音指示旗標(u/v)之旗標資訊。亦向狀 態控制器66供應維持位準SL(WT)信號,但是在此情形中未 使用該信號。依據狀態自選擇器61所輸出之包絡參數係在 每一時脈循環期間由似65進行累積以產生一包絡。該包 =不僅作為EG輸出而輸出,而且供應給狀態控制器^。狀 恶控制器66可從EG輸出之位维刻齡处处 位革判斷狀悲。在音鍵開啟信號 開始時刻,ACC 65開始累積。 中的EG輸出如_中曲線圖所示。當供應給狀態 控制态66與ACC 65之音鍵^ γ ^ & 判斷Μ…之曰鍵開啟仏5虎啟動時,狀態控制器6 6 列斷聲音產生之開始並 柏故、"A 通知選擇杰61為初始狀態輸出快速 ===強速率參數係在每一時脈循環期間 隹AIL 65處進仃累積,且如 著當EG輸出之位準達到 $出突然上升。接 狀態已轉為中間狀態並通知選㈣準為中狀態控制器66判斷 、擇益61為中間狀態輸出恆定
O:\87\87930.DOC -34- 1240914 值:數恆疋值參數係在每一時脈循環期間在㈤處進 仃累積且如圖n所示EG輪出平緩地下降。 ”此處當圖7所示語音化聲音音高信號係輸入至狀態控制 _時,狀態控制器66控制選擇器61以選擇並向歡65輸 ^夬速下落速率參數。快速下落速率參數係在每―時脈循 衣』間在ACC 65處進行累積,且如圖u所示eg輸出急劇上 ^接著當EG輸出之位準達到敎最低位準時,狀態控制 益66控制邊擇益61以再次選擇快速增強速率並將其輸出至 C 65决速增強速率參數係在每—時脈循環期間在 65處進行累積且EG輸出突然上升。接著當即輸出之位準達 到預定位準時,狀態控制器66判斷狀態已轉為中間狀態並 通知選擇器61為中間狀態輸出恆定值參數。從此時起操作 序列重複進行。由於包絡具有語音化聲音音高循環,故可 賦予在乘法器23中與包絡相乘之波形資料一音高感。 此外’當判斷音鍵開啟信號停用且終止聲音產生時,狀 態控制器66控制選擇器61以選擇快速下落速率參數並將其 輸出至ACC 65。快速下落速率參數係在每一時脈循環期間 在ACC 65處進行累積且eg輸出急劇下降以終止聲音產生。 在一旦產生語音就產生未語音化聲音話音素之情形下, 如圖9斯示在EG 24中設定HVMODE=l且U/V=l。在此條件 下,選擇器60為初始狀態選擇快速增強速率並將其輸出至 選擇器61。選擇器63回應於U/V=l之設定為在選擇器62處所 選取之中間狀態選擇「0」並將其輸出至選擇器61。選擇器 64為結束狀態選擇快速衰減速率並將其輸出至選擇器61。 O:\87\87930.DOC -35- 1240914 亦將維持速率SR (WT)輸入選擇器61中,但是未使用此參 數。選擇器6—1係由狀態控制器66控制以為初始、中間及結 束狀態之每-者選擇並輸出一包絡參數。向狀態控制器^ 供應音鍵開啟信號及關於語音模式旗標(hvm〇de)與未語 2化/語音化聲音指示旗標(u/v)之旗標資訊。亦向狀態控制 杰66供應自WT語音部分1 (^所輸出之語音化聲音音高信號 及維持位準SL (WT)信號,但是在此情形中未使用此等信 諕。依據狀態自選擇器61所輸出之包絡參數係在每一時脈 循環期間由ACC 65進行累積以產生一包絡。該包絡不僅作 為eg輸出而輸出,而且供應給狀態控制器66。狀態控制器 66可從EG輸出之位準判斷狀態。在音鍵開啟信號開始時 刻’ ACC 65開始累積。 此情形巾的EG輸出如齋12中曲線圖所*。當供應給狀態 控制器66與ACC65之音鍵開啟信號啟動時,狀態控制器μ 判斷聲音產生之開始並通知選擇器61為初始狀態輸出快速 增強速率參數。,决$增強速率參數係在#一時脈循環期間 在ACC65處進行累積,且如圖12所示EG輸出突然上升。接 著=eg輸出之位準達到一預定位準時,狀態控制器66判斷 狀態已轉為中間狀態,並通知選擇器61為中間狀態輸出「〇」 參數。因而,如圖12所示來自似65之郎輸出保持該值。 此處當音鍵開啟信號停用且狀態控制器66判斷聲音產生終 止時,狀態控制器66控制選擇器61以選擇快速下落速率參 數並將其輸出至ACC65。快速下落速率參數係在Acc_ 進行累積,且如圖12所示EG輸出急劇下降以終止聲音產
O:\87\87930.DOC -36· 1240914 生。 儘管圖10至12所示EG輸出形成線性移動之一包絡,但亦 可產生一曲線包絡。此外,用於使波形資料與eg 24之輸出 相乘之乘法23可放置在一加法器25(隨後將說明)下游。 返回圖2,在乘法器23中與包絡相乘之波形資料係供應給 加法為25,其中由一雜訊產生器26所產生之雜訊係新增到 波形資料中。例如該雜訊為白雜訊。在此情形中,向雜訊 產生器26供應關於語音模式旗標(hvm〇de)與未語音化/語 音化聲音指示旗標(U/V)之旗標資訊使得僅當設定 hvmode=i且u/v=l時產生雜訊用於產生未語音化聲音話 音素。因’加法器25僅向已與包絡相乘之波形資料新增 雜訊用於形成未語音化聲音話音素並,輸出具有雜訊之波 形資料。 Θ "、’員示雜°孔產生器26之詳細結構。如圖13所示,雜訊 產生器26中自一白雜訊產生器7〇所產生之白雜訊已透過四 級低通濾波器(LPF i、LPF 2、LPF 3與咖 4) 71、72、73 與74進行頻帶限制。接著一乘法器乃調整低通遽波器μ輸 出之雜訊位準並將其輸入至一選擇器76。選擇器%依據一 AND閘極77之輸出進行—選#,該and間極在設定 HVMODE= 1且U/V= i時將自乘法器75所輸出之雜訊輸出至 選擇器76用於產生未語音化聲音話音素。若將ΗνΜ〇〇Ε=ι 或U/V=l設定為「〇」用於產生語音化聲音話音素,則選擇 1§76將依據AND閘極77之輸出輸出「〇」而非雜訊。因而, 加法器25僅向已與包絡相乘之波形資料新增雜訊用於形成
O:\87\87930.DOC -37- 1240914 未語音化聲音話音素,並輸出具有雜訊之波形資料。 低通遽波㈣至74具有相同的結構,且作為所有低通濟 代表在圖13中顯示低通濾波器71之結構。在低通滅 波㈣中,自白雜訊產生器7〇所輸入之白雜訊係透過 遲電路70a延遲—樣本週期、在—係數乘法器—預 定係數相乘並輸人至—加法器·。此外,所輸 係在一係數乘法器7〜中與-預定健相乘、輸人至加法号 並新增到係數乘法器咖之輸出中。加法器之輸出係 低通濾、波器之輸出。在此結構中,例如可透過四級低通濟 ^ 71至74對白雜訊進行頻帶限制以使刺激耳朵之有聲成 Γ咸弱。此外,在乘法器75中對雜訊位準進行調整並非必 需,從而可省略。 :返回圖2,自加法器25所輸出之波形資料係供應給一乘法 =’其中對波形資料之輸出位準進行調整。向乘法器η 仏應關於語音模式旗標(HVMqde)與未語音化/語音化聲立 指示旗標(U/V)之旗標資訊、指示—音樂音調之輸出位^ -位準(WT)、指示語音化聲音話音素之輸出位準之—位準 (:音化聲音話音素)及指示未語音化聲音話音素之輸出位 之位準(未語音化聲音話音素)。接著當設定議⑽㈣ :於產生音樂聲音時’乘法器27將波形資料與位準(wt)相 乘以調整關於音樂音調之波形資料之輸出位準。另—方 ^當設定HVMO刚且U/V=〇用於產生語音化聲音話音 々乘法器27將波形資料與位準(語音化聲音話音素)相乘 以調整用於形成語音化聲音話音素之波形資料之輸出位
O:\87\87930.DOC -38· 1240914 準,從而語音化聲音話音素之位準將變為一預定位準。此 外,當設定HVMODE=l且U/V=l用於產生未語音化聲音話 音素時,乘法器27將波形資料與位準(未語音化聲音話音素) 相乘以調整用於形成未語音化聲音話音素之波形資料之輸 出位準,從而未語音化聲音話音素之位準將變為一預定位 準。
在本發明以上說明中,儘管亦充當聲音來源裝置之語音 合成裝置係由具有九個波形資料儲存部分之WT語音部分 組成,但本發明並非限於此結構。WT語音部分可具有少於 九個的儲存部分或多於九個的儲存部分。若WT語音部分具 有多於九個的儲存部分,則欲同時發聲之音調數目與欲合 成之話音素數目都會增加,從而合成各種的語音。
此外,依據本發明,亦充當聲音來源裝置之語音合成裝 置使得,當由語音模式旗標(HVMODE)指定音樂聲音時, 多個WT語音部分用作音調形成部分;當由語音模式旗標 (HVMODE)指定有聲聲音時,多個WT語音部分用作話音素 形成部分。此外,若將語音模式旗標(HVMODE)固定為有 聲聲音,則語音合成裝置可用作一專用的語音合成裝置。 如上所述,依據本發明之第一方面,該等多個音調形成 部分可以波形表聲音來源模式產生音調,同時由多個音調 形成部分所形成之多個話音素可以語音合成模式合成以產 生一合成語音。因而,由於多個音調形成部分通常可用於 音樂音調的產生及語音合成,故語音合成能力可實施於聲 音來源裝置中而不需要將單獨的語音合成裝置併入聲音來 O:\87\87930.DOC -39- 1240914 源裝置中。此外,採用語音合成 风姨式,雜訊新增區段可將 雜訊新增到話音素中,從而合成 、 口风回質的真實語音。 如上所述,依據本發明之第二 八+α 万面’作為波形表語音部 刀之稷數個話音素形成部分(每— 立本士 μ * Μ仏烕具有所需之一話 曰素中心頻率及所需之一話音辛 ^ 畜位準之一話音素)具有一 雜訊新增區段,從而將複數個話 、 #私^ n a I形成部分中所形成的 ^個“素合成以產生—合成語音。由於話音素係藉由 扣曰合成装置中的雜訊新增區段 ” 成-高品質的真實語音。在此情形广而形成’故可合 开)忐去1立* 7中將雜汛新增到用於 V成未一 θ化聲音話音素 實語音,較為合適。 “貝科中以合成高品質的真 如上所述’依據本發明之二 分之多個1立I 弟一方面,作為波形表語音部 之夕個桮日素形成部分形成所+ & 1 A 立烊立本^ Ο ^所而的語音化或未語音化聲 印活曰素,從而將所形成 音辛、、日人以人+ 夕1U θ化或未語音化聲音話 曰常此合以合成一語音 琿之飞未叩曰化聲音。接著將音高循 {之匕、、、口 k波新增到用於 料中。t卜,π _、 小成…3化聲音話音素之波形資 可賦予語音化聲音話音辛一立古 成高品質的真實語音。進—…f "感,… 音化聲mm $纟將雜訊新增到詩形成未語 音。 、甲攸而合成咼品質的真實語 如上所述’依據本發明 分之多個話音素形成 — ,々為波形表語音部 喜 ^ ϋ刀之母一個形成具有所需之一古舌立 素中心頻率及所需之1 “之居曰 形成之多個話音素合成二之-話音素,從而將所 ^ 產生合成語音。接著將音高循
O:\87\87930.DOC 1240914 環之包絡信號新增到用於形成該等話 ㈡厅、心/反形貧料φ 以便可賦予料話音素_音高感 +中 <立山Μ ^ 口成咼品質的直實 …此外’由於音高循環之包絡信號係新增到用於开; §吾音化聲音話音素之波形資料中’故可賦予語 : 音素一音高感。 年曰4 此外,依據本發明,基於音調參數自多個波形表注 分所輸出之波形資料可進行混合以產生複數個音調,^ 基於語音參數自多個波形表語音部分所輸“於形成钮立 化聲音話音素或未語音化聲音話音素之波形資料可進:: 成以產生-合成語音。允許多個波形表語音部分通常用: 音樂聲音的產生及有聲聲音的產生,目而允許本發明之語 音合成裝置亦充當聲音來源裝置。 【圖式簡單說明】 圖1係依據本發明之一具體實施例顯示亦充當一聲音來 源裝置之一語音合成裝置之結構之方塊圖。 圖2係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中一WT語音部分之結構之示意性方塊 圖0 圖3係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中一相位資料產生器之詳細結構之方塊 圖0 圖4係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中一位址產生器之詳細結構之方塊圖。 圖5係依據本發明之具體實施例顯示亦充當聲音來源裝 O:\87\87930.DOC -41 - 1240914 置之語音合成裝置 線圖。 中位址產生器之ADG輪出 之一範例之曲 音來源裝 一範例之 Ί依據本發明之具體實施例顯示亦充當聲 之σ成裝置中位址產生器之Adg輪出之 曲線圖。 源依據本發明之具體實施例顯示來自亦充當聲音來 二之:音合成裝置中之位址產生器之—語音化聲音音 阿^唬之波形之曲線圖。 圖,康本發明之具體實施例顯示亦充當聲音來源裝 日合成裝置中位址產生器之ADG輪出之另一範例之 曲線圖。 圖9係依據本發明之具體實施例顯示亦充當聲立 置之語音合成裝置中一包絡產生器之詳細結構之;塊圖、; 圖10係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中包絡產生器之EG輸出之一範例之曲 線圖。 圖11係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中包絡產生器之EG輸出之另一範例之 曲線圖。 圖12係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中包絡產生器之EG輸出之另一範例之 曲線圖。 圖13係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中一雜訊產生器之詳細結構之方塊圖。 O:\87\87930.DOC -42- 1240914 圖14係依據本發明之具體實施例顯示亦充當聲音來源裝 置之語音合成裝置中之一波形資料儲存器中所儲存用於形 成語音化聲音話音素或未語音化聲音話音素之波形資料之 複數個波形形狀之範例之曲線圖。 【圖式代表符號說明】 1 語音合成裝置 10、 10a、 •10b 波形表語音部分 10c 、10d 、lOe 波形表語音部分 10f 、l〇g 、lOh 、 lOi 波形表語音部分 11 混合區段 20 相位貨料產生 21 位址產生器 22 波形資料儲存器 23、 27 > 75 乘法器 24 包絡產生器 25、 45、 47 加法器 26 雜訊產生器 30、 3卜 32、33 選擇器 34 偏移器 41、 65 累積器 42、 46、 49 選擇器 43 減法器 48 開始位址產生器 50、 60 > 61 、 63 、 64 選擇器 O:\87\87930.DOC -43 - 1240914 66 狀態控制器 70 - 白雜訊產生器 70a 延遲電路 70b 、 70c 係數乘法器 70d 加法器 71 、 72 ' 73 、 74 低通濾波器 76 選擇器 77 AND閘極 HVMODE 語音模式旗標 u/v 未語音化/語音化聲音指示旗標 SA 開始位址 LP 迴路點 EP 結束點 WS 波形選擇 AR 起奏速率 DR 衰減速率 SR 維持速率 RR 釋放速率 SL 維持位準 O:\87\87930.DOC - 44 -
Claims (1)
1240914 拾、申請專利範園: 1 · 一種具右—^ ;曰合成能力之聲音來源裝置,包含複數個 二二二、部分,用於依據一波形表聲音來源模式或一語 ,合成模式之指定輸出所需音調或話音素,從而該等: 5周形成部分以該波形表聲音來源模式產生該等音調,並 =語音合成模式產生詩合成—語音之話音素,其中 該等音調形成部分各包含: -波形形狀指定區段’自複數個波形形狀中指定所需 之一波形形狀; 一波形謂儲存區段,儲存對應於該等複數個波形形 狀之波形資料; 一波形資料讀取區段’以該波形表聲音來源模式操作 用於產生以與該欲產生音調之一音程對應之一速率改變 之一可變位址並藉由該可變位址自該波形資料儲存區段 讀取與由該波形形狀指定區段所指定之波形形狀對應之 該波形資料,且以該語音合成模式操作用於產生以與該 欲產生話音素之一中心頻率對應之一速率改變之一可變 位址,並藉由該可變位址自該波形資料儲存區段讀取與 由該波形形狀指定區段所指定之波形形狀對應之波形資 料;及 一包絡應用區段,以該波形表聲音來源模式操作用於 產生與一指令同步增強以開始產生該音調且與另一指令 同步衰減以終止產生該音調之一包絡信號,並將所產生 之包絡彳5说應用於由δ玄波形資料讀取區段自該波形資料 O:\87\87930.DOC 1240914 储存區段所讀取之波形資料,且以該語音合成模式操作 用於產生在與该欲合成语音之一音南週期對應之各時序 期間快速衰減並在該衰減之後快速增強之一包絡信號, 並將所產生之包絡#號應用於由該波形資料讀取區段自 該波形資料儲存區段所讀取之波形資料。 2. 一種具有一語音合成能力之聲音來源裝置,包含複數個 音調形成部分用於依據一波形表聲音來源模式或一語音 合成模式之指定輸出所需音調或話音素,從而該等音調 形成部分以該波形表聲音來源模式產生該等音調,並以 4 曰合成模式產生用於合成一語音之話音素,其中古亥 等音調形成部分各包含·· 一波形形狀指定區段,自複數個波形形狀中指定所需 之一波形形狀; 一波形資料儲存區段,儲存對應於該等複數個波形形 狀之波形資料; 一波形資料讀取區段,以該波形表聲音來源模式操作 用於產生以與該欲產生音調之一音程對應之—速率改變 之:可變位址’並藉由該可變位址自該波形資料儲存區 段讀取與由該波形形狀指^區段所指定之波形形狀對應 之該波形資料,且其以該語音合成模式操作用於產生以 與該欲產生話音素之—中心頻率對應之一㈣改變之一 可變位址’並藉由該可變位址自該波形資料儲存=段讀 取與由該波形形狀指定區段所指定之波形形狀對應之波 形資料; ^ O:\87\87930.DOC -2 - 1240914 -包絡應用區段,產生與一指令同步增強以開始產生 該音調或合成該語音’並與另—指令同步衰減以終止產 生該音調或合成該語音之一包絡信號,且其將所產生之 包絡信號應用於由該波形資料讀取區段自該波形資料儲 存區段所讀取之波形資料;及 -雜訊新增區段,以該語音合成模式操作用於將一雜 訊新增到具有由該包絡應用區段所應用之包絡信號之該 波形資料中。 σ ;U μ 3· 一種語音合成裝置,包含: 複數個話音素形成部分,該等話音素形成部分各形成 具有所需之一話音素中心頻率與所需之一話音素位準之 一話音素;及 一合成部分,混合由該等複數個話音素形成部分所形 成之複數個話音素用於產生一語音,其中 5亥專複數個話音素形成部分各包含: 一波形貢料儲存區段,儲存與一預定波形形狀對應之 波形資料; 〜 一波形貢料讀取區段,產生以與該話音素中心頻率對 應之一速率改變之一位址,以便藉由所產生之位址讀取 該波形資料儲存區段中所儲存之波形資料從而形成該話 音素;及 一雜汛新增區段,將一雜訊新增到由該波形資料讀取 區段自該波形資料儲存區段所讀取之波形資料中。 4.如申巧專利範圍第3項之語音合成裝置,其中該話音素形 O:\87\87930.DOC 1240914 成部分進一步包含一包絡應用區段,產生與一指令同步 支曰強以開始產生該語音且與另一指令同步衰減以終止產 °曰之包絡信號,並將該包絡信號應用於由該波 資料4取區段自該波形資料儲存區段所讀取之波形資 料中或具有由該雜訊新增區段所新增之雜訊之波形資料 中。 5·如2請專利範圍第3項之語音合成裝置,其中該話音素形 成卩刀進一步包含一乘法區段,將該波形資料與對應於 該話音素位準之位準資料相乘。 6· ^請專利_第5項之語音合成裝置,其中該合成部分 立亥等複數個話音素’該等話音素各具有所需之該話 曰素中〜頻率及所需之該話音素位準,ϋ自該等複數個 話音素形成部分各輸出以便產生具有-未語音化聲音之 語音。 斗曰心 如申請專利範圍第3項之語音合成裝 儲存區段儲存正弦波形資料V 8_如申請專利範圍第立 罘貝之^ 9合成裝置,其中該雜訊新 品又匕3用於產生一白雜訊之一雜訊產生器及 該白雜訊之一頻帶之一渡波器。 、限 9. 一種語音合成裝置,包含: /复數個話音素形成部分,用於依據-語音化聲音人 模式或一未語音化聲音人成 曰己 立 成板式之指定以語音化聲音 曰素或未語音化聲音%立去 曰儿耳a居a素之形式形成具有 中心頻率之話音素;及 Ά O:\87\87930.DOC 1240914 一合成部分,混合由該等複數個話音素形成部分所形 成之複數個語音化聲音話音素以產生一語音化聲音,並 混合由該等複數個話音素形成部分所形成之複數個未語 音化聲音話音素以產生一未語音化聲音,其中 該等複數個話音素形成部分各包含: 一波形資料儲存區段,儲存與一預定波形形狀對應之 波形資料; 一波形資料讀取區段,產生以與該話音素之話音素中 二頻率對應之—速率改變之—位址,並回應於所產生之 該位址而讀取該波形資料儲存區段中所儲存之波形資料 一匕絡應耗段’以該語音化聲音合成模式操作用於 生:與該語音化聲音之一音高週期對應之各時序期間 决速哀減並在該衰減之後快速增強之—包絡信號,並將 所產生之包絡信號應用於由該波形資料讀取區段自該波 Γ身料健存區段所讀取之波形資料,且以該未語音化聲 :二成模式操作用於產生與一指令同步增強以開始產生 .化茸音,並與-指令同步衰減以終止產生該未 音之—包絡信號,並將所產生之包絡信號應用 ::波形資料讀取區段自該波形資料儲存區段所讀取 之波形資料。 s夂 ίο. ::1:=範圍第9項之語音合成褒置,其中該等話音素 广步包含一雜訊新增區段,以該未語音化 耳曰&成拉式操作用於將—雜蘭增到由該波形資料讀 O:\87\87930.DOC 1240914 11 取區丰又自该波形f料儲存區段所讀取之波形資料中。 一種語音合成裝置,包含: 複數個話音素形成部分,用於依據一語音化聲音合 模式或-未語音化聲音合成模式之指定,以語音化聲音 居音素或未語音化聲音話音素之形式形成具有話音素中 心頻率之話音素;及 一合成部 >,混合由言亥等複數個話音素形成部分所形 成之複數個語音化聲音話音素以產生一語音化聲音,並 混合由該等複數個話音素形成部分所形成之複數個未語 曰化聲音話音素以產生一未語音化聲音,其中 該等複數個話音素形成部分各包含: 波形資料儲存區段,儲存與複數個波形形狀對應之 波形資料; 一波形形狀指定區段,以該語音化聲音合成模式操作 用於自β等複數個波形形狀中指定所需之—波形形狀, 並以該未語音化聲音合成模式操作用於指定一預定 形狀; y 一波形貧料讀取區段’產生以與該話音素中心頻率對 應之-速率改變之—位址,並回應於所產生之位址,而 ^=波形資料儲存區段讀取與由該波形形狀指定區段所 才曰疋之波形形狀對應之波形資料;及 -包絡應用區段,以該語音化聲音合成模式,操作用 於產生在與該語音化聲音之一音高週期對應之各時序期 間快速衰減並在該衰減之後快速增強之—包絡信號,並 O:\87\87930.DOC 1240914 將所產生之該包絡信號應用於由該波形資料讀取區段自 该波形資料儲存區段所讀取之波形資料,且以該未語音 化萆曰a成模式操作用於產生與一指令同步增強以開始 產生該未語音化聲音,並與一指令同步衰減以終止產生 該未語音化聲音之一包絡信號,並將所產生之該包絡信 號應用於由該波形資料讀取區段自該波形資料儲存區段 所讀取之波形資料。 12’如中請專利範圍第u項之語音合成裝置,其中該等話音 :形成部分各進一步包含一雜訊新增區段,其以該未語 音化聲音合成模式操作用於將一雜訊新增到由該波形資 料讀取區段自該波形資料儲存區段所讀取之波形資料 中。 13 一種語音合成裝置,包含: 複數個洁音素形成部分,該等話音素形成部分各形成 具有二需之—話音素中心頻率之-話音素·,及 口成。卩刀’混合由該等複數個話音素形成部分所形 成^複數個話音素以產生一語音,其中 。亥等複數個話音素形成部分各包含: 波开^ ^狀指定區段,自複數個波形形狀中指定所需 之一波形形狀; 一波形資料#六^ & 、了减#區& ’儲存與該等複數個波形形狀對 應之波形資料; 一波形資料蛛&广π 喝取區奴,產生以與該話音素中心頻率對 應之一速率改辦 、交之一位址並回應於所產生之位址而自該 O:\87\87930.DOC 1240914 波形資料儲存區段讀取與所指定之波形形狀對應之 資料;及_ -包絡應用區段,產生在與該語音之一音高週期對應 之=時序期間快速衰減且在該衰減之後快速增強之一= 絡信號,並將所產生之包絡信號應用於由該波形資料讀 取區k自该波形資料儲存區段所讀取之波形資料。 14. 15. 如申睛專利範圍第13項之語音合成裝置,其中該合成部 分混合由該等複數個話音素形成部分所形成之複數個話 音素用於以一語音化聲音之形式產生該語音。 一種控制一聲音來源裝置之方法,該裝置具有一語音合 成能力且包含複數個音調形成部分用於依據一波形表聲 音來源模式或一語音合成模式之指定輸出所需音調或話 曰素,仗而该等音調形成部分以該波形表聲音來源模式 產生該等音調,並以該語音合成模式產生用於合成一語 曰之该等活音素,其中該方法藉由以下步驟控制該等音 調形成各部分: 自複數個波形形狀中指定所需之一波形形狀; 在一 €憶體中儲存與該等複數個波形形狀對應之波形 資料; 以4波形表聲音|源模式產生以與該欲產纟音調之一 音私對應之一速率改變之一可變位址,並藉由該可變位 址自呑亥記憶體讀取與所指定之波形形狀對應之波形資料; 以該語音合成模式產生以與該欲產生話音素之一中心 頻率對應之—速率改變之-可變位址,並藉由該可變位 O:\87\87930.DOC 1240914 自忒a诚體讀取與所指定之波形形狀對應之波形資料; 以該波形表聲音來源模式產生與一指♦同步增強以開 ° / S凋並與另一指令同步衰減以終止產生該音調 Lσ乜旒,並將所產生之包絡信號應用於所讀取之 波形資料;及 以該語音合成模式產生在與該欲合成語音之一音高週 』對應之各日寸序期間快速衰減並在該衰減之後快速增強 匕、、。乜就,並將所產生之包絡信號應用於所讀取之 波形資料。 16.- 一種控制^一聲音炎:里> 士 1 木源凌置之方法,該裝置具有一語音合 成此力且匕3複數個音調形成部分用於依據一波形表聲 音來源模式或-語音合成模式之指定輸出所需音調或話 曰素,從而忒等音調形成部分以該波形表聲音來源模式 產生a等曰w周並m吾音合成模式產生用於合成一語 曰之舌曰素其中5亥方法藉由以下步驟控制該等音調形 成各部分: 自複數個波形形狀中指定所需之一波形形狀; 在一 a k體中儲存與該等複數個波形形狀對應之波形 資料; 以孩波形表卑音來源模式產生以與該欲產生音調之一 音程對應之-速率改變之一可變位址,並藉由該可變位址 自該記憶體頃取與所指定之波形形狀對應之波形資料; 以該浯音合成模式產生以與該欲產生話音素之一中心 頻率對應之一速率改變之一可變位址,並藉由該可變位址 O:\87\87930.DOC -9- 1240914 自忒z彳思體頌取與所指定之波形形狀對應之波形資料; 立產生與一指令同步增強以開始產生該音調或合成該語 2並舁另一指令同步衰減以終止產生該音調或合成該語 上之匕、各“唬,並將所產生之包絡信號應用於所讀取 該波形資料;及 以該語音合成模式將一雜訊新增到具有所應用之包絡 信號之波形資料中。 :種控制一語音合成裝置之方法,該裝置包含複數個話 :素:成部分’該等話音素形成部分各形成具有所需之 $曰素中心頻率之—話音素,及—合成部分,混合由 該等複數個話音素形成部分所形成之複數個話音素用於 產生一語音,JL中兮古土 4丄 ”甲邊方法猎由以下步驟控制該等複數個 話音素形成各部分: °己憶體中儲存與一預定波形形狀對應之波形資料; 產生以鱼^与Γ 士羊立, /、Μ活曰素中心頻率對應之一速率改變之一位 、便藉由所產生之位址讀取該記憶體中所儲存之波 形資料從而形成該話音素;及 :雜Λ新增至自該記憶體所讀取之波形資料中。 18.=制一語音合成裝置之方法,該裝置包含複數個話 二二:成邛分,用於依據-語音化聲音合成模式或-未 :二Γ音合成模式之指定以語音化聲音話音素或未語 :立:曰話音素之形式形成具有所需話音素中心頻率之 所,及σ成α卩分,混合由該等複數個話音素形成 ^刀%成之複數個語音化聲音話音素以產生—語音化 O:\87\87930.DOC -10- 1240914 聲音,並混合由該等複數個話音素形成部分所形成之複 數個未語音化聲音話音素以產生—未語音化聲音,其尹 該方法藉由以下步驟控制兮楚, 匕制5亥專稷數個話音素形成各部 分· 在一 3己t思體中儲存血一 ^ 'rf> TX^ rry 、預疋波形形狀對應之波形資料; /生以與該話音素之話音素中心頻率對應之-速率改 =位址’並回應於所產生之該位址而自該記 取该波形資料; ^該語音化聲音合成模式產生在與該語音化聲音之一 期對應之各時序期間快速衰減並在該衰減之後快 t二:一包絡信號,並將所產生之包絡信號應用於自 4圮fe體所讀取之波形資料,·及 =語音化聲音合成模式產生與—指令同步增強以 ^ 絲語音化聲音,並與—指令同步衰減以終止 信號應用於』 匕、、,口 “號,並將所產生之包絡 19. 〜Μ ;自该記憶體所讀取之波形資料。 =控制—語音合成裝置之方法,該裝置包含複數個話 語立介Μ立人、 扣曰化尸耳音合成模式或一未 曰 耳9 3成模式之指定,以往立务A立』立主 語音化聲音…… 聲音話音素或未 音曰” v式形成具有話音素中心頻率之話 :所开,成—合成部分’混合由該等複數個話音素形成部 音,並、、曰:硬數個語音化聲音話音素以產生-語音化聲 :未語=1:等複數個話音素形成部分所形成之複數 "茸音話音素以產生一未語音化聲音,其中該 O:\87\87930.DOC 1240914 方法藉由以下步驟控制該等複數個話音素形成各部分: 在一記僚體中儲存與複數個波形形狀對應之波形資料; 以該語音化聲音合成模式自該等複數個波形形狀中指 定所需之一波形形狀; 以該未語音化聲音合成模式指定一預定波形形狀; 產生以與該話音素中心頻率對應之一速率改變之一位 止並回應於所產生之位址而自該記憶體讀取與所指定 之波形形狀對應之波形資料; 以該語音化聲音合成模式產生在與該語音化聲音之一 音高週期對狀各時序期間快速衰減並在該衰減之後快 速增強之一包絡信號,並將所產生之包絡信號應用於自 该記憶體所讀取之波形資料;及 20. 以該未語音化聲音合成模式產生與一指令同步增強以 開始產生該未語音化聲音,並與—指令同步衰減以終止 產生》亥未s吾音化聲音之_包絡信號,並將所產生之包絡 °u ^用於自忒s己憶體所讀取之波形資料。 立 ,n &日兮成裝置之方法,該裝置包含複數1 一素开V成部分,該等話音素形成部分各形成具有所, =音素中心頻率之—話音素,及—合成部分,混: 4複數個話音素形成部分所形成之複數個話音素 生一語音,直中兮 # '、 音素形成各部分: 数 在复數個波形形狀中指定所需之—波形形狀; 尤U體中儲存與該等複數個波形形狀對應之 O:\87\87930.DOC -12- 1240914 資料; 產生以與該話音素中心頻率對應之一速率改變之一位 址’並回應於所產生之位址而自該記憶體讀取與所指定 之波形形狀對應之波形資料;及 產生在與該語音之一音高週期對應之各時序期間快速 衰減並在該衰減之後快速增強之一包絡信號,並將所產 生之包絡信號應用於自該記憶體所讀取之波形資料。 21· —種使用於一聲音來源裝置中之電腦程式,該裝置具有 一語音合成能力且包含複數個音調形成部分用於依據一 =形表聲音來源模式或一語音合成模式之指定輸出所需 曰凋或活音素,從而該等音調形成部分以該波形表聲音 來源扠式產生該等音調並以該語音合成模式產生用於合 成一語音之話音素,該電腦程式係可由該聲音來源裝置 執行用於藉由以下步驟控制該等音調形成各部分·· 自複數個波形形狀中指定所需之一波形形狀; 在-記憶體中儲存與該等複數個波形形狀對應之波形 立以4波形表聲音來源模式產生以與該欲產纟音調之一 音程對應之—速率改變之—可變位址,並藉由該可變位 址自該記憶體讀取與所指定之波形形狀對應之波形資料; 以5亥5吾音合成模式產生以與該欲產生話音素之一中心 頻率對應之一速率改變之一可變位址,並藉由該可變位 自4 °己隐體喟取與所指定之波形形狀對應之波形資料; 以該波形表聲音來源模式產生與一指令同步增強以開 O:\87\87930.DOC -13- 1240914 始產生忒曰调並與另一指令同步衰減以終止產生該音調 H絡”’並將所產生之包絡信號應料所讀取之 該波形資料;及 、 以該語音合成模式產生在與該欲合成語音之一音高週 期^應之^時序期間快速衰減並在該衰減之後快速增強 L就並將所產生之包絡信號應用於所讀取該 波形資料。 、 22 .二種使用於一聲音來源裝置中之電腦程式,該裝置具有 -曰口成靶力且包含複數個音調形成部分,用於依據 :波形表聲音來源模式或—語音合成模式之指定輸出所 需音調或話音素,從而兮辇立 μ 4 «凋形成部分以該波形表聲 音來源模式產生該等音調並以該語音合成模式產生用於 合成一語音之該等話音素,該電腦程式係、可由該聲音來 源裝置執行用於藉由以下步驟控制該等音調形成各部 分: 自複數個波形形狀中指定所需之-波形形狀; 在=己隐體中儲存與該等複數個波形形狀對應之波形 資料; 以該波形表聲音來彡周指^ 4 $ 早曰木源杈式產生以與該欲產生音調之一 音程對應之-速率改變之一可變位址,並藉由該可變位 址自該記憶體讀取與所指定之波形形狀對應之波形資料; 以該語音合成模式產生以與該欲產生話音素之一、中心 頻率對應之一速率改轡夕一 wL ^ 文之可變位址,並藉由該可變位 址自該記憶體讀取盥所沪中+、士二,…& 一所扣疋之波形形狀對應之波形資料; O:\87\87930.DOC -14- 1240914 生與一指令同步增強以開始產生該音調或合成該語 曰並14另一指令同步衰減以終止產生該音調或合成該語 音之一包絡信號,並將所產生之包絡信號應用於所讀取 該波形資料;及 以該語音合成模式將一雜訊新增到具有所應用之包絡 1吕號之波形資料中。 3·種使用於~語音合成裝置中之電腦程式,該裝置包含 複數们蛞曰素形成部分,該等話音素形成部分各形成具 :所:之一話音素中心頻率之-話音素,及-合成部 分,混合由該等複數個話音素形成部分所形成之該等複 數個居日素用於產生—語音,該電腦程式係可由該語音 j成裒置執行用於藉由以下步驟控制該等音調形成各部 在一心it體中儲存與m形形狀對應之波形資料; 產生以與該話音素中心頻率對應之一速率改變之一位 址以便糟由所產生之位址讀取該記憶體中所儲存之 資料從而形成該話音素;及 夕 24. 將雜λ新增到自該記憶體所讀取之波形資料中。 -種使用於一語音合成裝置中之電腦程式,該裝置勺人 複數個話音素形成部分’用於依據—語音化聲音合2 式或一未語音化聲音合成模式之指定以語音化聲果 素或未語音化聲音話音素之形式形成具有所需話::: ’”員率之居曰素’及一合成部分,混合由該等複 音素形成部分所形成之複數個語音音 固話 O:\87\87930.DOC -15- 1240914 -語音化聲音,並混合由該等複數個話音素形成部分所 形成之複數個未語音化聲音話音素以產生一未語音化聲 音,該電腦程式係可由該語音合成裝置執行用於藉由= 下步驟控制該等音調形成各部分: 產生以與該話音素之話音素中心頻率對應之一速率改 變之-位址並回應於所產生之位址而自該記憶體讀取該 波形資料; 以該語音化聲音合成模式產生在與該語音化聲音之一 音高週期對應之各時序期間快速衰減,並在該衰:之後 快速增強之-包絡信號,並將所產生之該包絡信號應用 於自該記憶體所讀取之波形資料;及 以該未語音化聲音合成模式產生與一指令同步增強, 以開始產生該未語音化聲音並與—指令同步衰減,曰以終 止產生該未語音化聲音之—包絡信號,並將所產生之包 絡信號應用於自該記憶體所讀取之波形資料。 25. 一種使用於—語音合成裝置中之電腦程式,該裝置包含 複數個話音素形成部分,用於依據—語音化聲音人成模 式或-未語音化聲音合成模式之指定以語音化聲音姑音 素或未:音化聲音話音素之形式形成具有話音素中心頻 率之活曰素’及—合成部分’混合由該等複數個話音素 2成部分所形成之複數個語音化聲音話音素以產生〆语 曰化聲音’並混合由該等複數個話音素形成部分所衫成 Γ複數個未語音化聲音話音素以產生—未語音化聲普, 汶电細私式係可由該語音合成裝置執行用於藉由以下少 O:\87\87930.DOC -16 - 1240914 驟控制該等音調形成各部分·· 以妓π曰-化聲音合成模式自該等複數個波形形狀中指 定所需之一波形形狀; 以该未π g化聲音合成模式指定一預定波形形狀,· 產生以舆該話音素中心頻率對應之一速率改變之一位 址’亚回應於所產生之位址而自該記憶體讀取與所指定 之波形形狀對應之波形資料; 乂 "亥""曰化聲音合成模式產生在與該語音化聲音之一 音高週期對應之各時序期間快速衰減並在該衰減之後快 速〜強之-包絡信號,並將所產生之包絡信號應用於自 該記憶體所讀取之波形資料;及 以該未語音化聲音合成模式產生與一指令同步增強, 以開始產生該未語音化聲音並與—指令同步衰減以終止 產生該未語音化聲音之—包絡信號,並將所產生之包絡 #號應用於自該記憶體所讀取之波形資料。 26. 一種使用於—語音合成裝置中之電腦程式,該裝置包含 複數個話音素形成部分,該等話音素形成部分各形成呈 :所需之一話音素中心頻率之一話音素,&一合成部 \混合由該等複數個話音素形成部分所形成之複數個 蛞曰素以產生一語音,該電腦程式係可由該語音合成裝 置執行用於藉由以下步驟控制該等音調形成各部分〆 從複數個波形形狀中指定所需之一波形形狀; 一在一記憶體中儲存與該等複數個波形形狀對應之波形 O:\87\87930.DOC -17- 1240914 產生以與該話音素中心頻率對應之—速率改變 ',並回應於所產生之位址而自該記憶體讀取與所指定 之该波形形狀對應之波形資料;及 產生在與該語音之一音高週期對應之各時序期間快速 衰減並在該衰減之後快速增強之一包絡信號,並將所產 生之包絡信號應用於自該記憶體所讀取之波形資料。 O:\87\87930.DOC -18-
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003021681A JP3915703B2 (ja) | 2003-01-30 | 2003-01-30 | 音声合成装置 |
JP2003021682A JP3797333B2 (ja) | 2003-01-30 | 2003-01-30 | 音声合成機能を有する音源装置 |
JP2003021683A JP3915704B2 (ja) | 2003-01-30 | 2003-01-30 | 音声合成装置 |
JP2003021680A JP2004233621A (ja) | 2003-01-30 | 2003-01-30 | 音声合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200421260A TW200421260A (en) | 2004-10-16 |
TWI240914B true TWI240914B (en) | 2005-10-01 |
Family
ID=32660055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW093102192A TWI240914B (en) | 2003-01-30 | 2004-01-30 | Tone generator of wave table type with voice synthesis capability |
Country Status (5)
Country | Link |
---|---|
US (1) | US7424430B2 (zh) |
EP (1) | EP1443493A1 (zh) |
KR (1) | KR100602979B1 (zh) |
CN (2) | CN100561574C (zh) |
TW (1) | TWI240914B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4178319B2 (ja) * | 2002-09-13 | 2008-11-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理におけるフェーズ・アライメント |
US7424430B2 (en) * | 2003-01-30 | 2008-09-09 | Yamaha Corporation | Tone generator of wave table type with voice synthesis capability |
US20050114136A1 (en) * | 2003-11-26 | 2005-05-26 | Hamalainen Matti S. | Manipulating wavetable data for wavetable based sound synthesis |
TWI252468B (en) * | 2004-02-13 | 2006-04-01 | Mediatek Inc | Wavetable synthesis system with memory management according to data importance and method of the same |
KR100598209B1 (ko) * | 2004-10-27 | 2006-07-07 | 엘지전자 주식회사 | Midi 재생 장치 및 방법 |
US7470849B2 (en) * | 2005-10-04 | 2008-12-30 | Via Telecom Co., Ltd. | Waveform generation for FM synthesis |
US7847177B2 (en) * | 2008-07-24 | 2010-12-07 | Freescale Semiconductor, Inc. | Digital complex tone generator and corresponding methods |
US8798288B2 (en) * | 2008-11-26 | 2014-08-05 | Panasonic Corporation | Voice output device |
EP2416311B1 (en) * | 2010-08-03 | 2014-07-16 | Yamaha Corporation | Tone generation apparatus |
US8818806B2 (en) * | 2010-11-30 | 2014-08-26 | JVC Kenwood Corporation | Speech processing apparatus and speech processing method |
CN104704560B (zh) * | 2012-09-04 | 2018-06-05 | 纽昂斯通讯公司 | 共振峰依赖的语音信号增强 |
CN109671422B (zh) * | 2019-01-09 | 2022-06-17 | 浙江工业大学 | 一种获取纯净语音的录音方法 |
US11183201B2 (en) | 2019-06-10 | 2021-11-23 | John Alexander Angland | System and method for transferring a voice from one body of recordings to other recordings |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5853351B2 (ja) | 1979-10-03 | 1983-11-29 | 日本電信電話株式会社 | 音声合成装置 |
US4833963A (en) * | 1986-03-24 | 1989-05-30 | Kurzweil Music Systems, Inc. | Electronic musical instrument using addition of independent partials with digital data bit truncation |
JP2564641B2 (ja) * | 1989-01-31 | 1996-12-18 | キヤノン株式会社 | 音声合成装置 |
JP2745865B2 (ja) | 1990-12-15 | 1998-04-28 | ヤマハ株式会社 | 楽音合成装置 |
JP2606006B2 (ja) | 1991-05-24 | 1997-04-30 | ヤマハ株式会社 | ノイズ音発生装置 |
US5744741A (en) * | 1995-01-13 | 1998-04-28 | Yamaha Corporation | Digital signal processing device for sound signal processing |
JP2812229B2 (ja) | 1995-01-13 | 1998-10-22 | ヤマハ株式会社 | 音声及び楽音合成装置 |
CN1108602C (zh) * | 1995-03-28 | 2003-05-14 | 华邦电子股份有限公司 | 具有音乐旋律的语音合成器 |
US5703311A (en) * | 1995-08-03 | 1997-12-30 | Yamaha Corporation | Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques |
JP4132109B2 (ja) * | 1995-10-26 | 2008-08-13 | ソニー株式会社 | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 |
US6610917B2 (en) * | 1998-05-15 | 2003-08-26 | Lester F. Ludwig | Activity indication, external source, and processing loop provisions for driven vibrating-element environments |
US6689947B2 (en) * | 1998-05-15 | 2004-02-10 | Lester Frank Ludwig | Real-time floor controller for control of music, signal processing, mixing, video, lighting, and other systems |
US6993480B1 (en) * | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
WO2001057485A1 (en) * | 2000-02-04 | 2001-08-09 | X-Rite, Incorporated | Handheld color measurement instrument |
JP3587167B2 (ja) * | 2000-02-24 | 2004-11-10 | ヤマハ株式会社 | 電子楽器 |
US6865533B2 (en) * | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
US7424430B2 (en) * | 2003-01-30 | 2008-09-09 | Yamaha Corporation | Tone generator of wave table type with voice synthesis capability |
-
2004
- 2004-01-26 US US10/765,379 patent/US7424430B2/en not_active Expired - Fee Related
- 2004-01-28 EP EP04001856A patent/EP1443493A1/en not_active Withdrawn
- 2004-01-29 KR KR1020040005697A patent/KR100602979B1/ko not_active IP Right Cessation
- 2004-01-30 TW TW093102192A patent/TWI240914B/zh not_active IP Right Cessation
- 2004-01-30 CN CNB2004100053293A patent/CN100561574C/zh not_active Expired - Fee Related
- 2004-01-30 CN CNU2004200023397U patent/CN2706830Y/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR20040070049A (ko) | 2004-08-06 |
US20040158470A1 (en) | 2004-08-12 |
TW200421260A (en) | 2004-10-16 |
CN100561574C (zh) | 2009-11-18 |
US7424430B2 (en) | 2008-09-09 |
CN2706830Y (zh) | 2005-06-29 |
KR100602979B1 (ko) | 2006-07-20 |
EP1443493A1 (en) | 2004-08-04 |
CN1519815A (zh) | 2004-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12033644B2 (en) | Automatic conversion of speech into song, rap or other audible expression having target meter or rhythm | |
TWI240914B (en) | Tone generator of wave table type with voice synthesis capability | |
JP6791258B2 (ja) | 音声合成方法、音声合成装置およびプログラム | |
US8916762B2 (en) | Tone synthesizing data generation apparatus and method | |
CN107430849B (zh) | 声音控制装置、声音控制方法和存储声音控制程序的计算机可读记录介质 | |
JP2018077283A (ja) | 音声合成方法 | |
JP4844623B2 (ja) | 合唱合成装置、合唱合成方法およびプログラム | |
JP4304934B2 (ja) | 合唱合成装置、合唱合成方法およびプログラム | |
JP2007140548A (ja) | 似顔絵出力装置およびカラオケ装置 | |
JP2013238662A (ja) | 音声合成装置 | |
JP6011039B2 (ja) | 音声合成装置および音声合成方法 | |
TW201027514A (en) | Singing synthesis systems and related synthesis methods | |
JP4433734B2 (ja) | 音声分析合成装置、音声分析装置、及びプログラム | |
JPH1115489A (ja) | 歌唱音合成装置 | |
JP4300764B2 (ja) | 歌唱音声を合成する方法および装置 | |
JP5573529B2 (ja) | 音声処理装置およびプログラム | |
JP6834370B2 (ja) | 音声合成方法 | |
JP2018077280A (ja) | 音声合成方法 | |
JP3797333B2 (ja) | 音声合成機能を有する音源装置 | |
JP2010002937A (ja) | 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム | |
JP3915703B2 (ja) | 音声合成装置 | |
JP6822075B2 (ja) | 音声合成方法 | |
JP2003288095A (ja) | 音声合成装置、音声合成方法並びに音声合成用プログラム及びこのプログラムを記録したコンピュータで読み取り可能な記録媒体 | |
Ternström et al. | Monteverdi’s vespers. A case study in music synthesis | |
JP2004233624A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |