TW200535235A - Voice operation device, method and recording medium for recording voice operation program - Google Patents
Voice operation device, method and recording medium for recording voice operation program Download PDFInfo
- Publication number
- TW200535235A TW200535235A TW094104941A TW94104941A TW200535235A TW 200535235 A TW200535235 A TW 200535235A TW 094104941 A TW094104941 A TW 094104941A TW 94104941 A TW94104941 A TW 94104941A TW 200535235 A TW200535235 A TW 200535235A
- Authority
- TW
- Taiwan
- Prior art keywords
- information
- sound
- phonological
- mentioned
- formant
- Prior art date
Links
Classifications
-
- E—FIXED CONSTRUCTIONS
- E02—HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
- E02D—FOUNDATIONS; EXCAVATIONS; EMBANKMENTS; UNDERGROUND OR UNDERWATER STRUCTURES
- E02D29/00—Independent underground or underwater structures; Retaining walls
- E02D29/02—Retaining or protecting walls
- E02D29/025—Retaining or protecting walls made up of similar modular elements stacked without mortar
-
- E—FIXED CONSTRUCTIONS
- E02—HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
- E02D—FOUNDATIONS; EXCAVATIONS; EMBANKMENTS; UNDERGROUND OR UNDERWATER STRUCTURES
- E02D29/00—Independent underground or underwater structures; Retaining walls
- E02D29/02—Retaining or protecting walls
- E02D29/0258—Retaining or protecting walls characterised by constructional features
- E02D29/0266—Retaining or protecting walls characterised by constructional features made up of preformed elements
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01G—HORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
- A01G9/00—Cultivation in receptacles, forcing-frames or greenhouses; Edging for beds, lawn or the like
- A01G9/02—Receptacles, e.g. flower-pots or boxes; Glasses for cultivating flowers
- A01G9/022—Pots for vertical horticulture
- A01G9/025—Containers and elements for greening walls
-
- E—FIXED CONSTRUCTIONS
- E02—HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
- E02D—FOUNDATIONS; EXCAVATIONS; EMBANKMENTS; UNDERGROUND OR UNDERWATER STRUCTURES
- E02D2600/00—Miscellaneous
- E02D2600/20—Miscellaneous comprising details of connection between elements
Landscapes
- Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Paleontology (AREA)
- Civil Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Structural Engineering (AREA)
- Document Processing Apparatus (AREA)
- Telephonic Communication Services (AREA)
- Electrophonic Musical Instruments (AREA)
Description
200535235 九、發明說明·· 【發明所屬之技術領域】 本發明關於由被輸入之正文貧訊產生合成聲音的聲音人 成裝置、聲音合成方法、及記憶有聲音合成程式之記憶媒 體。 【先前技術】 圖17係顯示由被輸入之正文資訊產生合成聲音之先前的 聲音合成裝置100之構造之圖。 輸入部110在由未圖示之操作部等收到「二沁u6」等 正文資訊時,會將此正文資訊供應至正文解析部120。正文 解析部120對收到之正文資訊,使用單字辭典等進行單字解 析、文法解析等,產生可顯示「:」、〜」、「(:」、「色」 、打」等音貝律單位之各音韻的音韻資訊、及顯示出各音韻 之長度、高度、強度的韻律資訊,供應至聲音合成部二〇 。聲音合成部13〇依據正文解析部120所供應之各音韻資气 ,由音韻資料庫14〇取得音韻單位之聲音資料(以下稱音: H聲音合《13〇依韻律資訊對取得之各立二 貧料適當地加工、連接等而產生合成聲音^ 猶:成聲音。使用者可藉由聽取由聲音合成裝= 之口成兔音,確認輸入之正文資訊之内容e 別 立然而一,上述音韻資料庫僅登錄特定配音人(例如,男性配 二的:文種音韻資料。因此,例如將年輕女性等偏好使用之 某些正文資訊(「超...的」及.·寺偏好使用之 述特定配音人之音質的合成聲文貝5fl)以具上 時’存在有使用者 95457.doc 1 200535235 會查覺到音質與聲音内容之間不協調等之問題。 :了解決上述問題,已有提案有一種技術,其係將複數 曰韻資料(例如:男性、女性、小孩、老人的各音韻資料 )預先登錄於音韻資料庫,依被輸入之正文 =最適當之音韻資料,利用選擇之音韻資料產生合成ί 曰(例如,參照專利文獻1)。 〔專利文獻1〕特開ο-3^37號公報(第3至 【發明内容】 惟文獻1揭示之技術,的確可得到適當的合成聲音, 料庫。ΓΓΓ,必須將複數種音韻資料登錄於音韻資 在記憶體或CPU等之硬體資源受到很大限制 可押2=機等無法安裝這種複數種音韻資料,結果, 式終端機等存在有無法產生各種音質之合成聲音等問 上述說明之情事而完成者,其目的在於 徒仏種聲音合成裝置、聲音合成方法、及記 成程式之記憶媒體,1在硬體資 心耳曰σ ,亦能產生各種音質源—大限制的環境下 為了解決上述問題,本發明之聲音合 有:取得手段’其係由被輸入聲’徵為具 取得指定合成聲音之音韻的音韻;=置之正文資訊, 音,音質的音質指定資訊;及指定該合成聲 個顯示各音韻之音韻資訊; 手丰又’其係記憶複數種音韻資料加工資訊,該 95457.doc 200535235 資訊係用於變更上述各音韻之音質 料之加工内容者; 、 且顯示音韻資 第-抽出手段,其係由上述第, 音:指定資訊所示之音韻對應之音韻資料出與上述 第二抽出手段,其係由上 τ定資訊所示…對應之音—:資==與上述 述抽出之音領資*彡/ 貝貧料加工資訊加工上 扎子出之曰曰貝貝科,產生上述合成聲音。 依如此之構造’第一抽出手段所抽出之 第二抽出手段抽出之音韻資料:貝料會被依 產生八杰舞立 #丄 貝°凡進订加工,藉此, 。成耳日1由對此音㈣料加工 條件(例如音韻之共振峰之變更内容 二^加工 (例如m舌者之音韻資料)得到各種音質之立。 如以上說明,依本發明,即使耳曰 夕瑗户ΠΓ女处女 无體貝源文到很大限制 之衣扰下,亦此產生各種音質之合成聲音。 【實施方式】 以下,-面參照圖式一面說明本發明之實施方式。 A.本實施方式 圖1係顯不本貫施方式之聲音人杰 耳曰口成凌置100之功能構造之 圖。此外’在本實施方式中,想定安裝於行動電話、 PHS(PersonalHandyph_System;個人手持電話系統卜 PDA(P⑽η指gltal Assistance ;個人數位助理)等硬體資 源受到很大限制之可攜式終端機的情況,惟不限於此,亦 適用於各種電子裝置。 95457.doc 200535235 輸入部2!0將經由未圖示之操作部輸入之正文資訊供應 至正文解析部220。圖2係例示正文資訊之圖。 正文本文資訊為顯示應作為合成聲音輸出之正文内容 •(例如。(毛以」)的資訊。此外,圖2所示的雖為僅以 、平假名表示之正文本文資訊,惟並不限於平假名,以漢字 羅馬字、片f又名等之各種正文及各種記號表#I# $。 音質資料編號(音質指定資訊)係為了分別識別後述之複 _ 數個音質參數(音音員資料加工資訊)的獨一編號(圖2中為κι 至Kn)。本實施方式中,藉由適當地選擇及利用此音質參數 ’可由特定配音人(本實施方式乃以「男性配音」為例)的工 種之音韻資料,得到各種音質之合成聲音(詳細後述)。 音調資訊(音調指定資訊)係為了對合成聲音賦予音調(換 吕之,指定合成聲音之音調)的資訊,由指定「c(D〇)」至 「B(Si)」等之音調的資訊所構成(參照圖2)。 正文解析部220解析由輸入部21〇傳來之正文資訊,將解 φ 析結果分別傳給音韻資料取得部230、音質變更部25〇、及 聲音信號生產部270。具體而言,圖2所示之正文資訊被供 應時,正文解析部22〇將「二沁各打」之正文本文資訊分 解成「二」、「沁」、「ic」、「冬」、「打」之韻律單位的音韻 。此外,韻律(m〇ra)表示讀聲之單位,基本上指由i個子音 及1個母音所構成者。 正文解析部(取得手段)220如此般地將正文本文資訊分 解成韻律單位之音韻後,產生指定此等合成聲音之各音韻 的音韻資訊(音韻指定資訊),依序傳給音韻資料取得部 95457.doc 200535235 。再者,正文解析部220由正文資訊分別取得音質資料編號 (例如K3)、音調資訊(例如c(D〇)),_方面將取得之音質資 料編號供給音f變更部25(),另―方面將取得之音調資訊供 給聲音信號產生部270。 音韻資料取得部(第一抽出手段)23〇乃以正文解析部22〇 專來之曰0員資δί1作為檢索鍵而檢索音韻資料庫,藉此取 :與音韻資訊所示之音韻對應之音韻資料。圖3係例示音韻 貧料庫240之登錄内容之圖。如圖3所示,音韻資料庫(第一 記憶手段)240中’除了登錄有顯示1個男性配音之韻律單位 之各音韌(「矣」、「、、」、…、「么」等)的-連串音韻1至m 之外,亦登錄有該—連串之音韻資料之數目(以下稱為登錄 音韻資料數)等。 圖4係例示顯示某一音韻(例如「:」等)的音韻資料之構 造之圖,圖5係說明音韻資料所含之各音框f訊之圖。此外 三圖5的⑷顯示上述男性配音在發出某-音韻(例如「c」 等)時之聲音波形vw與各音框叩之關係,圖5之B、圖5之; 及圖5之D分別顯示第一音框FR1、第二音框fr2、第〇音 框FRn的共振峰分析結果。 :^所示’音韻資料由第—音框資訊至第η音框資訊所 構成。各音框資訊包含·笙 , .弟一共振峰資訊至第k共振峰資訊 …、猎〃振♦刀析對應之各框架fr(參照圖5)而得到者 ;及有聲暨無聲判別旗號(例如:,,”=有聲、,,0,,==”) ’其係顯:各音框FR之聲音為有聲或無聲者。 各曰忙貝輯包合之第—共振峰資訊至第^共振聲資訊 95457.doc -10- 200535235 2由kit對應之共振峰的共振♦頻率f及共振峰位準A的一 入所構成(參照圖5之B至圖5之〇)。例如,第 =第-聽峰資訊至第k絲峰:#訊分別由㈣,ai^ (,A12) ...、(Flk,Aik)的共振峰頻率及共振峰位準之 =構成(參照圖5之B),··.,框㈣訊包含之第一共振 貝汛至第1"共振峰資訊分別由(Fnl,Anl)、(Fn2, An2)、 、(Fnk,Ank)的共振蜂頻率及共振峰位準之對所構成(來昭 圖5之D) 〇 '…、 音韻貧料取得部230依正文解析部220傳來之各音韻資訊 (表不「:」、「么」、「(:」、「各」、「打」等之各音韻資訊) ,取得對應之各音韻資料後,將此等資料傳至音質變更部 250 〇 ' 音質變更部250變更藉音韻資料取得部23〇取得之各音韻 資料所示之音韻的音質。詳細而言,音質變更部(第二抽出 手段)250首先以正文解析部220傳來之音質資料編號作為 φ 檢索鍵來檢索音質資料庫(第二記憶手段)260,取得對應之 音質參數。接著,音質變更部250依取得之音質來數進行上 述各音韻之音質的變更。 圖6係例示音質資料庫260之登錄内容之圖。 如圖6所示,音質資料庫(第二記憶手段)26〇中記憶有: 複數種之音質參數1至L,其係變更上述各音韻之音質上必 要之資訊,顯示音韻資料之加工内容;及登錄數資訊,其 係顯示該音質參數之數目。 圖7係音質參數之構造之一例之圖。 95457.doc -11 - 200535235 士圖斤不’音質芩數(音韻資料加工資訊)包含:音質資 料扁说〃係為了特定該音質參數者;性別變更旗號,直 係顯f是否變更合成聲音之性別者;及第-至第k共振峰變 .更貢訊’其係顯示第-至第k共振峰之變更内容者。在此, •例如在上述性別變更旗號被設定成”丨”的情況中,將以音質 2:250進行變更合成聲音之性別的處理(以 : = 另-方面,在上述性別變更旗號被設定成"。: •=二:不進行上述性別變更處理(詳細後述)。此外, 此貝二^ 於設U有男性配音之1種音韻資料,因 旗號被設定m兄巾,合成 =男性變更成女性。另一方面,性別變更旗號被設 =成的十月況中,合成聲音之特徵會保持為男性而不做變 另一方面’各共振峰 ,苴係為了 w 艾旯貝Λ包各·基本波形選擇資訊 么、、、&擇後述之各共振峰之基本波形(正弦波等)者· 頻率變更資訊,其係顯示各共振峰頻率之變更内」 二共振.位準變更資訊,其係顯示共振峰谷 之變更内容者。 手之各位準 I共振聲頻率變 含有顯示共振峰㈣峰位準變更資訊分別包 π… 頻率之偏移量、共振速度、共振位準之次 汛以及顯示共振峰位 依位旱之貝 的資訊。此外,有 里振速度、及共振位準 共振速度、及:頻率及共振蜂位準之偏移量、 /、振位準的詳細内容將後述。 圖8係顯示藉立拼料 貝文更。P 250實施之音質變更處理之流程 95457.doc 200535235 音質變更部(產生手段)250在由正文解析部220收到音質 資料編號後,將以該音質資料編號作為檢索鍵來檢索音質 資料庫260,取得對應之音質參數(工序S1)。接著,音質變 更部250參照在取得之音質參數中所含之性別變更旗號,判 斷是否變更合成聲音之性別(即,是否實施性別變更處理) (工序2)。音質變更部250在例如性別變更旗號被設定成„〇,, _ 而判斷無需進行性別變更時,將跳過工序S3而進行工序S4 ’另一方面,在例如性別變更旗號被設定成”丨”而判斷需進 行性別變更時,進入工序S3而實施性別變更處理。 圖9係例示5己憶於$己憶手段(省略圖示)内之性別處理用 的映射函數mf之圖,圖1〇及圖u係顯示男性及女性分別發 出同一音韻(例如「态」)時之分析結果之圖。此外,圖9所 不映射函數mf的橫軸為輸入頻率(被輸入至音質變更部25〇 令二振峰頻率),縱軸為輸出頻率(由音質變更部〇輸出的 _ 頒率麦更後之共振峰頻率),fmax為可輸入之共振峰頻率之 最大值。此外,圖10及圖11所示之分析圖表gl、g2之橫軸 為頻率,縱軸為位準。 =較圖10及圖11所示之分析圖表gl、g2可知··男性音韻 2弟一共振峰頻率fml至第四共振峰頻率加4比女性音韻之 一 ^振峰頻率ffl至第四共振峰頻率ff4低。據此,本實施 μ —〜如圖9所示般地,藉由使用位於比直線111(輸入頻 ” 出〃員率,苓照虛線部分)上側之映射函數mf(參照實 線部分),验s^ 、,、男性特徵之音韻變更為具女性特徵之音韻。 95457.doc -13- 200535235 路贿:而。,音吳變更部250把被輸入之音韻資料之各共振 峰=率以圖9所示之映射函⑽向頻率高之方向偏移。藉此 去=之男性音韻的各共振峰頻率會被變更成具女性特徵 y外’在輸人的為女性音韻之共振峰頻率的情況中, 二述相反地,卿於比直線nl下側之映射函數μ 簽a圖9中以單點破折線所示之部分)即可。 士曰貝雙更部250在實施上述性別變更處理而進入工序μ 時丄乃依各共振峰頻率變更資訊所示之各共振峰頻率之偏 移",偏移各共振峰頻率。並且,音質變更部250為共振已 偏移之各共振峰頻率,將實施頻率共振處理(工序叫。 圖12係例示記憶手段(省略圖示)中記憶之被用於頻率共 振處理的共振表TA之圖,圖13係例示由該共振表Μ讀出之 共振值及時間之關係之圖。此外,本實施方式中,基於方 更乃心定以同一共振表來共振上述共振峰頻率的情況, 惟亦可對各共振波頻率使用共振值等相異之共。 一共振表TA為依時序排列登錄共振值之表。音質變更部⑽ -方面依各共振夸頻率變更資訊所示之共振峰頻率之丘振 速度來控制被登錄於共振表TA之共振值之讀出速度 振值跳讀數),_方面實施對讀出之各共振值乘上各共振峰 頻率變更資訊所示之共振峰頻率之共振位準的頻率共振處 理。错此’可得到如圖14所示之以共振速度sp、共振位準lv 使共振缘頻率fm共振的波形。此外,在本實施方式中,為 了減少共振峰頻率之共振位準的運算量,例示了利用上述 共振表TA之態樣,惟亦可不利用共振表TA而利用指定之函 95457.doc 14 200535235 數來算出共振峰頻率之共振位準。 音質變更部250在實施頻率妓 々u加々 、千,、搌處理後,進入工序6,依 各共振峰頻率變更資邙 _ ^ A. Ji ^ 、σ不之各共振峄位準之偏移量,偏 私各共振峰位準。並且,立片 ., 曰貝變更部250為了共振已偏移之 各,、振峰位準,實施位 L L +,、振處理(工序S7)後,結束處理 〇此外’有關於被利用於位準妓 半,、振處理之共振表以及利用 該共振表來共振各共振峰
+之脣况中之動作,由於與說 u上述各共振峰頻率之情況大致相同,因此,割愛而 省略不提。此外,㈣共振峰位準之發振,雖然可使用與 共振峰頻率之共振相同之共振表來進行共振,惟亦可以與 共振峰頻率之共振不同之共振表來進行共振。 、音質變更部(產生手段)25G在依取得之音f參數(音韻資 料力Λ…而更各音韻之音質(即’加工音韻資料)後, 將各共振峰之基本波形選擇資訊、各共振峰頻率、及各共 振峰位準供給聲音信號產生部270。 /聲音信號產生部270在收到音質變更部25〇傳來之基本波 形選擇資訊後,由波形資料庫取得此基本波形選擇資訊 所不之波形資料。此外’此基本波形選擇資訊所示之基本 波形亦可於纟共振峰㈣,例如亦可將低頻 < 共振峰的基 本波形設成正弦波,並將顯示個性之高頻之共振峰的基本 波形設成正弦波以外之波形(例如矩形波或鋸齒波等)。當然 ’亦可不利用複數種的基本波形而僅利用單一之基本波形 (例如正弦波)。 聲音信號產生部(產生手段)270在如上述般地選擇各波 95457.doc 15 200535235 形資料後,利用選擇之各波形資料、各共振峰頻率、各共 振峰位準來產生各共振峰的共振峰波形。接著,聲音信號 產生部(產生手段)270加算各共振峰波形,產生合成聲音信 號。更進一步地,聲音信號產生部27〇實施對產生之合成聲 音信號賦予正文解析部220傳來之音調資訊(音調指定資訊) 所示之音調的處理(以下稱音調賦予處理)。 圖1 5係為了說明音調賦予處理之圖。此外,圖1 $中,為
了使說明易於了解,乃例示對正弦波之合成聲音信號賦予 音調時之情況。 聲音信號產生部270依正文解析部220傳送之音調資訊來 計算出圖15所示之時間包絡線tp之週期。在此,合成聲音 之音调依存於時間包絡線tp之週期,時間包絡線印之週期愈 長音調愈低,並且,時間包絡線tp之週期愈短音調愈高: 聲音信號產生部270在如上述般地運算出時間包絡線印之 週期後’冑由以運算出之時間包絡線⑦之週期反覆進行時 間包絡線tP與合成聲音信號之相乘運算,得到賦予指定音 調之合成聲音信號。 曰 圖16係例示被施以音質變更處理及音調賦予處理的特定 ^鱗之共振蜂波形之圖。如圖16所示,^變更相關之 處理(例如共料頻率及共振峰料之共振處理等)可以立 框週期(音框單位)來控制。聲音信號產生部(產生手段)27日〇 般地得到被賦予指定音調之合成聲音信號後,將 之::5成聲音對外部輸出。藉此,使用者可藉由具期望 曰貝的合成聲音來確認輸入聲音合成裳置刚之正文本 95457.doc -16- 200535235 文(「c沁(::务打」等)的内容。 如上述之說明,依本實施方式之聲音合成裝置,由於在 音質變更部實施以共振峰為單位之各種音質變更處理,因 此,即使被記憶之音韻資料僅物(即,僅有特定配音之 音韻育料)’亦可獲致各種音質之聲音合成。 以上說明之本實施方式中’例示了被輸入至聲音合成I 内之正文貝汛含有音調資訊的情況(參照圖2),然而, 亦會有該正文資訊内未含音調資訊的情況。亦可設想到上 述情況而在音韻資料庫内預先登錄替代音調資訊(參照圖3 之括弧内容),在正文資訊去冬立 貝孔未3曰调資訊時,以此替代音調 貝讯所不之音調(例如c(Do)等)作為合成聲音之音調來利 用此外,除了替代音調資訊,亦可將圖4所示之各音框之 共振峰資訊之數目(共振較目資訊;參照圖3之括弧 預先登錄於音韻資料庫240。 此外,以上說明之聲音合成裝置1〇〇之諸功能可藉由 CPU(或DSP)執行記憶於_等之記憶體内之程序來實現 ^此,相關之程式亦可記錄於CD_R0M等之記錄媒體來 發仃,亦可經由網際網路等之通信網路來發行。 再者’上述中,聲音變更處理乃依據由正文資訊取得之 音質資料編號來進行,“,亦可由被輸人之正文資訊自 動抽出關鍵子,利用抽出之關鍵字參照預先設置於電子參 置内之具有每一音質之關鍵字的資料庫,自動判定適於該 正文資訊之音質。 〆 【圖式簡單說明】 95457.doc 200535235 圖1係顯示本實施方式之聲音合成裝置之功能構造 塊圖。 万 圖2係例示同實施方式之正文資訊之圖。 圖3係例示同實施方式之音韻資料庫的登錄内容之圖。 圖4係例示同實施方式之音韻資料之構造之圖。 圖5係說明同實施方式之音韻資料所含之各音框 圖。 貝成之 圖6係例示同實施方式之音質資料庫之登錄内容之圖。 圖7係顯示同實施方式之音質參數之構造之-例之^ I 圖8係顯示同實施方式之音質變更處理之流程圖。 圖9係例示同實施方式之映射函數之圖。 圖係顯示同實施方式之男性之音韻的分析結果 圖Η係顯示同實施方式之女性之音韻的分析結。 圖12係例示同實施方式之共振表之圖。 圖13係例示由同實施方# ± 之關係之圖。 Ί、振表-出之共振值與時間 圖⑷系為了說明同實施方式之共振峰頻率共振之圖。 圖15係為了說明同實施方式之音調賦予處理之圖。 示被_同實施方式之音質變更處理及音調賦 予处理後的特定共振峰之共振峰波形之圖。 圖17係顯示以往之聲音合成褒置之功能構造之圖。 【主要元件符號說明】 100聲音合成裝置 21 〇輸入部 95457.doc -18- 220 200535235 230 240 250 260 270 280 正文解析部 音韻資料取得部 音韻資料庫 音質變更部 音質資料庫 聲音信號產生部 波形資料庫。
95457.doc 19
Claims (1)
- 200535235 十 1. 申請專利範圍: 音合成裝置,其特徵為具有: 取係由被輸入聲音合成裳置之正文資訊, 疋口成聲音之音韻的音 聲:之音質的音質指定資訊…及指定該合成 料弟—記憶手段,其係記憶複數個顯示各音韻之音韻資 第一记憶手段,其係記、 該音邶次如 傲双禋曰韌貧料加工資訊, 明貝料加工資訊係用於變 訊且顯示音韻資…,更上述各音韻之音質之資 曰硝貝枓之加工内容者; 第一抽出手段,其係由上述第一 述音韻。己隐手段,抽出與上 〜“疋貢訊所示之音韻對應之音韻資料. 音手段,其係由上述第二記憶手段,抽出與上述 彦曰=訊所示之音質對應之音韻資料加工資訊;及 段,其係依上述抽出之音韻資料 欠> 工卜ιΐι 、λ+加工負訊,加 出之音韻資料,產生上述合成聲音。 2.如請求項1之聲音合成裝置,其中 曰 上述各音韻資料包含顯示音韻之共振峰的共振峰資訊; 〜上述音韻資料加4訊包含顯示上述共振峰之變更内 容的共振峰變更資訊; 上述產生手段藉由依上述共振峰變更資訊變更上述共 振峰貢訊,並加上依變更後之各共振峰資訊產生之各信 號波形,產生上述合成聲音。 3·如請求項2之聲音合成裝置,其中 95457.doc 200535235 成 上述共振峰資訊由共振蜂 頻率及共振峰位準 之對所構 上述,、振峰變更資訊包含· ^匕3 ·共振峰頻率變 係顯示上述共振峰頻率 、 ^ 貝羊之虻更内容’·及共振峰位準變更 貝讯,其係顯示上述共振峰位準之變更内容; 上述產生手段藉由將上 振峰頻率及各共振峰位準 資訊及上述共振峰位準變 更後之各共振峰資訊。述音韻資料所示的音韻之各共 之各個依上述共振峰頻率變更 更貧訊加以變更,得到上述變 4·如請求項2或3之聲音合成裝置,其中 4Γ得除了由上述正文資訊取得上述音韻指定 貝η上述音負指定資訊之外,亦取得指定上述合成聲 曰之音调的音調指定資訊; ,上述產生手段藉由對加上依上述變更後之各共振峰資 訊產生之各信號波形之合成信號波形賦予上述音調指定 資訊所示之音調,得到上述合成聲音。 曰 5·如請求们之聲音合成裳置,其中上述正文資訊包含上述 音質指^資訊;上述取得手段由上述正文資訊取得上述 音質指定資訊。 6·如請求項丨之聲音合成裝置,其中上述取得手段由上述正 文資訊抽出關鍵字,依抽出之關鍵字來判定適合上述正 文貧訊之音質,藉此取得上述音質指定資訊。 7_ 一種聲音合成方法,其特徵為具有: 取知工序,其係由被輸入聲音合成裝置之正文資訊, 95457.doc 200535235 取得指定合成聲音之音韻的音韻指定資訊及指 聲音之音質的音質指定資訊; 〇成 第一抽出工序,其係由記憶複數個顯示各音韻之〜 資料的第一記憶手段,抽出與上述音韻指定資訊所 音韻對應之音韻資料; 不之 第二抽出工序,其係由記憶有複數_示音韻 工内容之用於變更上述各音韻之音質之音韻資料加= :的第二記憶手段’抽出與上述音質指定資訊所示之: 質對應之音韻資料加工資訊;及 < 曰 工 8. 產生工序’其係依上述抽出之音韻資料加工 上述抽出之音韻資料,產生上述合成聲音。 11 π -種可電腦讀取之記憶媒體’其記憶有聲音合 該聲音合成程式係用於使具記憶有顯示各音韻之2: :的苐-記憶手段及記憶有複數種用 : 音質之資訊且顯示音韻資料之加工内容之音韻Ϊ;:: 資訊㈣:記料段之電腦起仙作為:^科加工 取得手段,其係由被輸入上述電腦之正文 指定合成磬立夕立& ΑΑ立* 、 取传 df日㈣音韻指定資訊及指^該合成聲音 之曰貝的音質指定資訊; —第-抽出手段,其係由記憶複數個顯示 貧料的第—$愔车❿ 4丄, 只之曰明 立㈣庙 手#又’抽出與上述音韻指定資訊所示之 曰s貝對應之音韻資料; 工二手段’其係由記憶有複數種顯示音韻資料加 且用於變更上述各音韻之音質之資訊之音韻資料 95457.doc 200535235加工資訊的第二記憶手段,抽出與上述音質指定資訊所 示之音質對應之音韻資料加工資訊;及 產生手段,其係依上述抽出之音韻資料加工資訊加工 上述抽出之音韻資料,產生上述合成聲音。 95457.doc
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004044852A JP2005234337A (ja) | 2004-02-20 | 2004-02-20 | 音声合成装置、音声合成方法、及び音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200535235A true TW200535235A (en) | 2005-11-01 |
TWI300551B TWI300551B (zh) | 2008-09-01 |
Family
ID=35007713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW094104941A TW200535235A (en) | 2004-02-20 | 2005-02-18 | Voice operation device, method and recording medium for recording voice operation program |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP2005234337A (zh) |
KR (1) | KR100759172B1 (zh) |
CN (1) | CN100337104C (zh) |
TW (1) | TW200535235A (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2500471B (en) * | 2010-07-20 | 2018-06-13 | Aist | System and method for singing synthesis capable of reflecting voice timbre changes |
JP6724932B2 (ja) * | 2018-01-11 | 2020-07-15 | ヤマハ株式会社 | 音声合成方法、音声合成システムおよびプログラム |
WO2020145353A1 (ja) * | 2019-01-10 | 2020-07-16 | グリー株式会社 | コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3633963B2 (ja) * | 1994-09-14 | 2005-03-30 | 株式会社河合楽器製作所 | 楽音生成装置及び楽音生成方法 |
US5744741A (en) * | 1995-01-13 | 1998-04-28 | Yamaha Corporation | Digital signal processing device for sound signal processing |
JPH1078952A (ja) * | 1996-07-29 | 1998-03-24 | Internatl Business Mach Corp <Ibm> | 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置 |
CN1113330C (zh) * | 1997-08-15 | 2003-07-02 | 英业达股份有限公司 | 语音合成中的语音规整方法 |
US6823309B1 (en) * | 1999-03-25 | 2004-11-23 | Matsushita Electric Industrial Co., Ltd. | Speech synthesizing system and method for modifying prosody based on match to database |
JP2000339137A (ja) * | 1999-05-31 | 2000-12-08 | Sanyo Electric Co Ltd | 電子メール受信システム |
JP2002268699A (ja) * | 2001-03-09 | 2002-09-20 | Sony Corp | 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体 |
JP3732793B2 (ja) * | 2001-03-26 | 2006-01-11 | 株式会社東芝 | 音声合成方法、音声合成装置及び記録媒体 |
JP2003031936A (ja) * | 2001-07-19 | 2003-01-31 | Murata Mach Ltd | プリント基板 |
JP2003295882A (ja) * | 2002-04-02 | 2003-10-15 | Canon Inc | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム |
DE04735990T1 (de) * | 2003-06-05 | 2006-10-05 | Kabushiki Kaisha Kenwood, Hachiouji | Sprachsynthesevorrichtung, sprachsyntheseverfahren und programm |
KR20050041749A (ko) * | 2003-10-31 | 2005-05-04 | 한국전자통신연구원 | 방송 음성 데이터를 이용한 영역 및 화자 의존 음성 합성장치, 음성 합성용 데이터베이스 구축방법 및 음성 합성서비스 시스템 |
-
2004
- 2004-02-20 JP JP2004044852A patent/JP2005234337A/ja active Pending
-
2005
- 2005-02-18 TW TW094104941A patent/TW200535235A/zh not_active IP Right Cessation
- 2005-02-21 CN CNB2005100074542A patent/CN100337104C/zh not_active Expired - Fee Related
- 2005-02-21 KR KR1020050014045A patent/KR100759172B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN1658281A (zh) | 2005-08-24 |
KR100759172B1 (ko) | 2007-09-14 |
CN100337104C (zh) | 2007-09-12 |
JP2005234337A (ja) | 2005-09-02 |
TWI300551B (zh) | 2008-09-01 |
KR20060043023A (ko) | 2006-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1463419A (zh) | 同步文本/可视信息与音频重放 | |
Milne et al. | Testing a spectral model of tonal affinity with microtonal melodies and inharmonic spectra | |
Tsunoo et al. | Beyond timbral statistics: Improving music classification using percussive patterns and bass lines | |
Yin et al. | Modeling F0 trajectories in hierarchically structured deep neural networks | |
JP2006293026A (ja) | 音声合成装置,音声合成方法およびコンピュータプログラム | |
Mirbeygi et al. | Speech and music separation approaches-a survey | |
TW200535235A (en) | Voice operation device, method and recording medium for recording voice operation program | |
Van Do et al. | Non-uniform unit selection in Vietnamese speech synthesis | |
TWI360108B (en) | Method for synthesizing speech | |
TWI271702B (en) | Device, method and program for pitch pattern generation | |
Yang et al. | A fast high-fidelity source-filter vocoder with lightweight neural modules | |
CN114842859A (zh) | 一种基于in和mi的语音转换方法、系统、终端及存储介质 | |
CN113241054A (zh) | 语音平滑处理模型生成方法、语音平滑处理方法及装置 | |
Cohen | The influence of nonharmonic partials on tone perception | |
Roberts et al. | A time-scale modification dataset with subjective quality labels | |
JP5402141B2 (ja) | メロディ作成装置、メロディ作成プログラムおよびメロディ作成方法 | |
Friberg et al. | Recognition of the main melody in a polyphonic symbolic score using perceptual knowledge | |
Schwabe et al. | Dual task monophonic singing transcription | |
Martins | A computational framework for sound segregation in music signals | |
Sridhar et al. | Fundamental frequency estimation of carnatic music songs based on the principle of mutation | |
CN106859660A (zh) | 一种闭合式言语测听词表的设计方法与应用 | |
CN115457923B (zh) | 一种歌声合成方法、装置、设备及存储介质 | |
CN116645957B (zh) | 乐曲生成方法、装置、终端、存储介质及程序产品 | |
Wilk et al. | Music interpolation considering nonharmonic tones | |
Bohak et al. | Transcription of polyphonic vocal music with a repetitive melodic structure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |