TW200535235A - Voice operation device, method and recording medium for recording voice operation program - Google Patents

Voice operation device, method and recording medium for recording voice operation program Download PDF

Info

Publication number
TW200535235A
TW200535235A TW094104941A TW94104941A TW200535235A TW 200535235 A TW200535235 A TW 200535235A TW 094104941 A TW094104941 A TW 094104941A TW 94104941 A TW94104941 A TW 94104941A TW 200535235 A TW200535235 A TW 200535235A
Authority
TW
Taiwan
Prior art keywords
information
sound
phonological
mentioned
formant
Prior art date
Application number
TW094104941A
Other languages
English (en)
Other versions
TWI300551B (zh
Inventor
Takehiko Kawahara
Hideki Kenmochi
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of TW200535235A publication Critical patent/TW200535235A/zh
Application granted granted Critical
Publication of TWI300551B publication Critical patent/TWI300551B/zh

Links

Classifications

    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02DFOUNDATIONS; EXCAVATIONS; EMBANKMENTS; UNDERGROUND OR UNDERWATER STRUCTURES
    • E02D29/00Independent underground or underwater structures; Retaining walls
    • E02D29/02Retaining or protecting walls
    • E02D29/025Retaining or protecting walls made up of similar modular elements stacked without mortar
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02DFOUNDATIONS; EXCAVATIONS; EMBANKMENTS; UNDERGROUND OR UNDERWATER STRUCTURES
    • E02D29/00Independent underground or underwater structures; Retaining walls
    • E02D29/02Retaining or protecting walls
    • E02D29/0258Retaining or protecting walls characterised by constructional features
    • E02D29/0266Retaining or protecting walls characterised by constructional features made up of preformed elements
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G9/00Cultivation in receptacles, forcing-frames or greenhouses; Edging for beds, lawn or the like
    • A01G9/02Receptacles, e.g. flower-pots or boxes; Glasses for cultivating flowers
    • A01G9/022Pots for vertical horticulture
    • A01G9/025Containers and elements for greening walls
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02DFOUNDATIONS; EXCAVATIONS; EMBANKMENTS; UNDERGROUND OR UNDERWATER STRUCTURES
    • E02D2600/00Miscellaneous
    • E02D2600/20Miscellaneous comprising details of connection between elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Mining & Mineral Resources (AREA)
  • Paleontology (AREA)
  • Civil Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Structural Engineering (AREA)
  • Document Processing Apparatus (AREA)
  • Telephonic Communication Services (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

200535235 九、發明說明·· 【發明所屬之技術領域】 本發明關於由被輸入之正文貧訊產生合成聲音的聲音人 成裝置、聲音合成方法、及記憶有聲音合成程式之記憶媒 體。 【先前技術】 圖17係顯示由被輸入之正文資訊產生合成聲音之先前的 聲音合成裝置100之構造之圖。 輸入部110在由未圖示之操作部等收到「二沁u6」等 正文資訊時,會將此正文資訊供應至正文解析部120。正文 解析部120對收到之正文資訊,使用單字辭典等進行單字解 析、文法解析等,產生可顯示「:」、〜」、「(:」、「色」 、打」等音貝律單位之各音韻的音韻資訊、及顯示出各音韻 之長度、高度、強度的韻律資訊,供應至聲音合成部二〇 。聲音合成部13〇依據正文解析部120所供應之各音韻資气 ,由音韻資料庫14〇取得音韻單位之聲音資料(以下稱音: H聲音合《13〇依韻律資訊對取得之各立二 貧料適當地加工、連接等而產生合成聲音^ 猶:成聲音。使用者可藉由聽取由聲音合成裝= 之口成兔音,確認輸入之正文資訊之内容e 別 立然而一,上述音韻資料庫僅登錄特定配音人(例如,男性配 二的:文種音韻資料。因此,例如將年輕女性等偏好使用之 某些正文資訊(「超...的」及.·寺偏好使用之 述特定配音人之音質的合成聲文貝5fl)以具上 時’存在有使用者 95457.doc 1 200535235 會查覺到音質與聲音内容之間不協調等之問題。 :了解決上述問題,已有提案有一種技術,其係將複數 曰韻資料(例如:男性、女性、小孩、老人的各音韻資料 )預先登錄於音韻資料庫,依被輸入之正文 =最適當之音韻資料,利用選擇之音韻資料產生合成ί 曰(例如,參照專利文獻1)。 〔專利文獻1〕特開ο-3^37號公報(第3至 【發明内容】 惟文獻1揭示之技術,的確可得到適當的合成聲音, 料庫。ΓΓΓ,必須將複數種音韻資料登錄於音韻資 在記憶體或CPU等之硬體資源受到很大限制 可押2=機等無法安裝這種複數種音韻資料,結果, 式終端機等存在有無法產生各種音質之合成聲音等問 上述說明之情事而完成者,其目的在於 徒仏種聲音合成裝置、聲音合成方法、及記 成程式之記憶媒體,1在硬體資 心耳曰σ ,亦能產生各種音質源—大限制的環境下 為了解決上述問題,本發明之聲音合 有:取得手段’其係由被輸入聲’徵為具 取得指定合成聲音之音韻的音韻;=置之正文資訊, 音,音質的音質指定資訊;及指定該合成聲 個顯示各音韻之音韻資訊; 手丰又’其係記憶複數種音韻資料加工資訊,該 95457.doc 200535235 資訊係用於變更上述各音韻之音質 料之加工内容者; 、 且顯示音韻資 第-抽出手段,其係由上述第, 音:指定資訊所示之音韻對應之音韻資料出與上述 第二抽出手段,其係由上 τ定資訊所示…對應之音—:資==與上述 述抽出之音領資*彡/ 貝貧料加工資訊加工上 扎子出之曰曰貝貝科,產生上述合成聲音。 依如此之構造’第一抽出手段所抽出之 第二抽出手段抽出之音韻資料:貝料會被依 產生八杰舞立 #丄 貝°凡進订加工,藉此, 。成耳日1由對此音㈣料加工 條件(例如音韻之共振峰之變更内容 二^加工 (例如m舌者之音韻資料)得到各種音質之立。 如以上說明,依本發明,即使耳曰 夕瑗户ΠΓ女处女 无體貝源文到很大限制 之衣扰下,亦此產生各種音質之合成聲音。 【實施方式】 以下,-面參照圖式一面說明本發明之實施方式。 A.本實施方式 圖1係顯不本貫施方式之聲音人杰 耳曰口成凌置100之功能構造之 圖。此外’在本實施方式中,想定安裝於行動電話、 PHS(PersonalHandyph_System;個人手持電話系統卜 PDA(P⑽η指gltal Assistance ;個人數位助理)等硬體資 源受到很大限制之可攜式終端機的情況,惟不限於此,亦 適用於各種電子裝置。 95457.doc 200535235 輸入部2!0將經由未圖示之操作部輸入之正文資訊供應 至正文解析部220。圖2係例示正文資訊之圖。 正文本文資訊為顯示應作為合成聲音輸出之正文内容 •(例如。(毛以」)的資訊。此外,圖2所示的雖為僅以 、平假名表示之正文本文資訊,惟並不限於平假名,以漢字 羅馬字、片f又名等之各種正文及各種記號表#I# $。 音質資料編號(音質指定資訊)係為了分別識別後述之複 _ 數個音質參數(音音員資料加工資訊)的獨一編號(圖2中為κι 至Kn)。本實施方式中,藉由適當地選擇及利用此音質參數 ’可由特定配音人(本實施方式乃以「男性配音」為例)的工 種之音韻資料,得到各種音質之合成聲音(詳細後述)。 音調資訊(音調指定資訊)係為了對合成聲音賦予音調(換 吕之,指定合成聲音之音調)的資訊,由指定「c(D〇)」至 「B(Si)」等之音調的資訊所構成(參照圖2)。 正文解析部220解析由輸入部21〇傳來之正文資訊,將解 φ 析結果分別傳給音韻資料取得部230、音質變更部25〇、及 聲音信號生產部270。具體而言,圖2所示之正文資訊被供 應時,正文解析部22〇將「二沁各打」之正文本文資訊分 解成「二」、「沁」、「ic」、「冬」、「打」之韻律單位的音韻 。此外,韻律(m〇ra)表示讀聲之單位,基本上指由i個子音 及1個母音所構成者。 正文解析部(取得手段)220如此般地將正文本文資訊分 解成韻律單位之音韻後,產生指定此等合成聲音之各音韻 的音韻資訊(音韻指定資訊),依序傳給音韻資料取得部 95457.doc 200535235 。再者,正文解析部220由正文資訊分別取得音質資料編號 (例如K3)、音調資訊(例如c(D〇)),_方面將取得之音質資 料編號供給音f變更部25(),另―方面將取得之音調資訊供 給聲音信號產生部270。 音韻資料取得部(第一抽出手段)23〇乃以正文解析部22〇 專來之曰0員資δί1作為檢索鍵而檢索音韻資料庫,藉此取 :與音韻資訊所示之音韻對應之音韻資料。圖3係例示音韻 貧料庫240之登錄内容之圖。如圖3所示,音韻資料庫(第一 記憶手段)240中’除了登錄有顯示1個男性配音之韻律單位 之各音韌(「矣」、「、、」、…、「么」等)的-連串音韻1至m 之外,亦登錄有該—連串之音韻資料之數目(以下稱為登錄 音韻資料數)等。 圖4係例示顯示某一音韻(例如「:」等)的音韻資料之構 造之圖,圖5係說明音韻資料所含之各音框f訊之圖。此外 三圖5的⑷顯示上述男性配音在發出某-音韻(例如「c」 等)時之聲音波形vw與各音框叩之關係,圖5之B、圖5之; 及圖5之D分別顯示第一音框FR1、第二音框fr2、第〇音 框FRn的共振峰分析結果。 :^所示’音韻資料由第—音框資訊至第η音框資訊所 構成。各音框資訊包含·笙 , .弟一共振峰資訊至第k共振峰資訊 …、猎〃振♦刀析對應之各框架fr(參照圖5)而得到者 ;及有聲暨無聲判別旗號(例如:,,”=有聲、,,0,,==”) ’其係顯:各音框FR之聲音為有聲或無聲者。 各曰忙貝輯包合之第—共振峰資訊至第^共振聲資訊 95457.doc -10- 200535235 2由kit對應之共振峰的共振♦頻率f及共振峰位準A的一 入所構成(參照圖5之B至圖5之〇)。例如,第 =第-聽峰資訊至第k絲峰:#訊分別由㈣,ai^ (,A12) ...、(Flk,Aik)的共振峰頻率及共振峰位準之 =構成(參照圖5之B),··.,框㈣訊包含之第一共振 貝汛至第1"共振峰資訊分別由(Fnl,Anl)、(Fn2, An2)、 、(Fnk,Ank)的共振蜂頻率及共振峰位準之對所構成(來昭 圖5之D) 〇 '…、 音韻貧料取得部230依正文解析部220傳來之各音韻資訊 (表不「:」、「么」、「(:」、「各」、「打」等之各音韻資訊) ,取得對應之各音韻資料後,將此等資料傳至音質變更部 250 〇 ' 音質變更部250變更藉音韻資料取得部23〇取得之各音韻 資料所示之音韻的音質。詳細而言,音質變更部(第二抽出 手段)250首先以正文解析部220傳來之音質資料編號作為 φ 檢索鍵來檢索音質資料庫(第二記憶手段)260,取得對應之 音質參數。接著,音質變更部250依取得之音質來數進行上 述各音韻之音質的變更。 圖6係例示音質資料庫260之登錄内容之圖。 如圖6所示,音質資料庫(第二記憶手段)26〇中記憶有: 複數種之音質參數1至L,其係變更上述各音韻之音質上必 要之資訊,顯示音韻資料之加工内容;及登錄數資訊,其 係顯示該音質參數之數目。 圖7係音質參數之構造之一例之圖。 95457.doc -11 - 200535235 士圖斤不’音質芩數(音韻資料加工資訊)包含:音質資 料扁说〃係為了特定該音質參數者;性別變更旗號,直 係顯f是否變更合成聲音之性別者;及第-至第k共振峰變 .更貢訊’其係顯示第-至第k共振峰之變更内容者。在此, •例如在上述性別變更旗號被設定成”丨”的情況中,將以音質 2:250進行變更合成聲音之性別的處理(以 : = 另-方面,在上述性別變更旗號被設定成"。: •=二:不進行上述性別變更處理(詳細後述)。此外, 此貝二^ 於設U有男性配音之1種音韻資料,因 旗號被設定m兄巾,合成 =男性變更成女性。另一方面,性別變更旗號被設 =成的十月況中,合成聲音之特徵會保持為男性而不做變 另一方面’各共振峰 ,苴係為了 w 艾旯貝Λ包各·基本波形選擇資訊 么、、、&擇後述之各共振峰之基本波形(正弦波等)者· 頻率變更資訊,其係顯示各共振峰頻率之變更内」 二共振.位準變更資訊,其係顯示共振峰谷 之變更内容者。 手之各位準 I共振聲頻率變 含有顯示共振峰㈣峰位準變更資訊分別包 π… 頻率之偏移量、共振速度、共振位準之次 汛以及顯示共振峰位 依位旱之貝 的資訊。此外,有 里振速度、及共振位準 共振速度、及:頻率及共振蜂位準之偏移量、 /、振位準的詳細内容將後述。 圖8係顯示藉立拼料 貝文更。P 250實施之音質變更處理之流程 95457.doc 200535235 音質變更部(產生手段)250在由正文解析部220收到音質 資料編號後,將以該音質資料編號作為檢索鍵來檢索音質 資料庫260,取得對應之音質參數(工序S1)。接著,音質變 更部250參照在取得之音質參數中所含之性別變更旗號,判 斷是否變更合成聲音之性別(即,是否實施性別變更處理) (工序2)。音質變更部250在例如性別變更旗號被設定成„〇,, _ 而判斷無需進行性別變更時,將跳過工序S3而進行工序S4 ’另一方面,在例如性別變更旗號被設定成”丨”而判斷需進 行性別變更時,進入工序S3而實施性別變更處理。 圖9係例示5己憶於$己憶手段(省略圖示)内之性別處理用 的映射函數mf之圖,圖1〇及圖u係顯示男性及女性分別發 出同一音韻(例如「态」)時之分析結果之圖。此外,圖9所 不映射函數mf的橫軸為輸入頻率(被輸入至音質變更部25〇 令二振峰頻率),縱軸為輸出頻率(由音質變更部〇輸出的 _ 頒率麦更後之共振峰頻率),fmax為可輸入之共振峰頻率之 最大值。此外,圖10及圖11所示之分析圖表gl、g2之橫軸 為頻率,縱軸為位準。 =較圖10及圖11所示之分析圖表gl、g2可知··男性音韻 2弟一共振峰頻率fml至第四共振峰頻率加4比女性音韻之 一 ^振峰頻率ffl至第四共振峰頻率ff4低。據此,本實施 μ —〜如圖9所示般地,藉由使用位於比直線111(輸入頻 ” 出〃員率,苓照虛線部分)上側之映射函數mf(參照實 線部分),验s^ 、,、男性特徵之音韻變更為具女性特徵之音韻。 95457.doc -13- 200535235 路贿:而。,音吳變更部250把被輸入之音韻資料之各共振 峰=率以圖9所示之映射函⑽向頻率高之方向偏移。藉此 去=之男性音韻的各共振峰頻率會被變更成具女性特徵 y外’在輸人的為女性音韻之共振峰頻率的情況中, 二述相反地,卿於比直線nl下側之映射函數μ 簽a圖9中以單點破折線所示之部分)即可。 士曰貝雙更部250在實施上述性別變更處理而進入工序μ 時丄乃依各共振峰頻率變更資訊所示之各共振峰頻率之偏 移",偏移各共振峰頻率。並且,音質變更部250為共振已 偏移之各共振峰頻率,將實施頻率共振處理(工序叫。 圖12係例示記憶手段(省略圖示)中記憶之被用於頻率共 振處理的共振表TA之圖,圖13係例示由該共振表Μ讀出之 共振值及時間之關係之圖。此外,本實施方式中,基於方 更乃心定以同一共振表來共振上述共振峰頻率的情況, 惟亦可對各共振波頻率使用共振值等相異之共。 一共振表TA為依時序排列登錄共振值之表。音質變更部⑽ -方面依各共振夸頻率變更資訊所示之共振峰頻率之丘振 速度來控制被登錄於共振表TA之共振值之讀出速度 振值跳讀數),_方面實施對讀出之各共振值乘上各共振峰 頻率變更資訊所示之共振峰頻率之共振位準的頻率共振處 理。错此’可得到如圖14所示之以共振速度sp、共振位準lv 使共振缘頻率fm共振的波形。此外,在本實施方式中,為 了減少共振峰頻率之共振位準的運算量,例示了利用上述 共振表TA之態樣,惟亦可不利用共振表TA而利用指定之函 95457.doc 14 200535235 數來算出共振峰頻率之共振位準。 音質變更部250在實施頻率妓 々u加々 、千,、搌處理後,進入工序6,依 各共振峰頻率變更資邙 _ ^ A. Ji ^ 、σ不之各共振峄位準之偏移量,偏 私各共振峰位準。並且,立片 ., 曰貝變更部250為了共振已偏移之 各,、振峰位準,實施位 L L +,、振處理(工序S7)後,結束處理 〇此外’有關於被利用於位準妓 半,、振處理之共振表以及利用 該共振表來共振各共振峰
+之脣况中之動作,由於與說 u上述各共振峰頻率之情況大致相同,因此,割愛而 省略不提。此外,㈣共振峰位準之發振,雖然可使用與 共振峰頻率之共振相同之共振表來進行共振,惟亦可以與 共振峰頻率之共振不同之共振表來進行共振。 、音質變更部(產生手段)25G在依取得之音f參數(音韻資 料力Λ…而更各音韻之音質(即’加工音韻資料)後, 將各共振峰之基本波形選擇資訊、各共振峰頻率、及各共 振峰位準供給聲音信號產生部270。 /聲音信號產生部270在收到音質變更部25〇傳來之基本波 形選擇資訊後,由波形資料庫取得此基本波形選擇資訊 所不之波形資料。此外’此基本波形選擇資訊所示之基本 波形亦可於纟共振峰㈣,例如亦可將低頻 < 共振峰的基 本波形設成正弦波,並將顯示個性之高頻之共振峰的基本 波形設成正弦波以外之波形(例如矩形波或鋸齒波等)。當然 ’亦可不利用複數種的基本波形而僅利用單一之基本波形 (例如正弦波)。 聲音信號產生部(產生手段)270在如上述般地選擇各波 95457.doc 15 200535235 形資料後,利用選擇之各波形資料、各共振峰頻率、各共 振峰位準來產生各共振峰的共振峰波形。接著,聲音信號 產生部(產生手段)270加算各共振峰波形,產生合成聲音信 號。更進一步地,聲音信號產生部27〇實施對產生之合成聲 音信號賦予正文解析部220傳來之音調資訊(音調指定資訊) 所示之音調的處理(以下稱音調賦予處理)。 圖1 5係為了說明音調賦予處理之圖。此外,圖1 $中,為
了使說明易於了解,乃例示對正弦波之合成聲音信號賦予 音調時之情況。 聲音信號產生部270依正文解析部220傳送之音調資訊來 計算出圖15所示之時間包絡線tp之週期。在此,合成聲音 之音调依存於時間包絡線tp之週期,時間包絡線印之週期愈 長音調愈低,並且,時間包絡線tp之週期愈短音調愈高: 聲音信號產生部270在如上述般地運算出時間包絡線印之 週期後’冑由以運算出之時間包絡線⑦之週期反覆進行時 間包絡線tP與合成聲音信號之相乘運算,得到賦予指定音 調之合成聲音信號。 曰 圖16係例示被施以音質變更處理及音調賦予處理的特定 ^鱗之共振蜂波形之圖。如圖16所示,^變更相關之 處理(例如共料頻率及共振峰料之共振處理等)可以立 框週期(音框單位)來控制。聲音信號產生部(產生手段)27日〇 般地得到被賦予指定音調之合成聲音信號後,將 之::5成聲音對外部輸出。藉此,使用者可藉由具期望 曰貝的合成聲音來確認輸入聲音合成裳置刚之正文本 95457.doc -16- 200535235 文(「c沁(::务打」等)的内容。 如上述之說明,依本實施方式之聲音合成裝置,由於在 音質變更部實施以共振峰為單位之各種音質變更處理,因 此,即使被記憶之音韻資料僅物(即,僅有特定配音之 音韻育料)’亦可獲致各種音質之聲音合成。 以上說明之本實施方式中’例示了被輸入至聲音合成I 内之正文貝汛含有音調資訊的情況(參照圖2),然而, 亦會有該正文資訊内未含音調資訊的情況。亦可設想到上 述情況而在音韻資料庫内預先登錄替代音調資訊(參照圖3 之括弧内容),在正文資訊去冬立 貝孔未3曰调資訊時,以此替代音調 貝讯所不之音調(例如c(Do)等)作為合成聲音之音調來利 用此外,除了替代音調資訊,亦可將圖4所示之各音框之 共振峰資訊之數目(共振較目資訊;參照圖3之括弧 預先登錄於音韻資料庫240。 此外,以上說明之聲音合成裝置1〇〇之諸功能可藉由 CPU(或DSP)執行記憶於_等之記憶體内之程序來實現 ^此,相關之程式亦可記錄於CD_R0M等之記錄媒體來 發仃,亦可經由網際網路等之通信網路來發行。 再者’上述中,聲音變更處理乃依據由正文資訊取得之 音質資料編號來進行,“,亦可由被輸人之正文資訊自 動抽出關鍵子,利用抽出之關鍵字參照預先設置於電子參 置内之具有每一音質之關鍵字的資料庫,自動判定適於該 正文資訊之音質。 〆 【圖式簡單說明】 95457.doc 200535235 圖1係顯示本實施方式之聲音合成裝置之功能構造 塊圖。 万 圖2係例示同實施方式之正文資訊之圖。 圖3係例示同實施方式之音韻資料庫的登錄内容之圖。 圖4係例示同實施方式之音韻資料之構造之圖。 圖5係說明同實施方式之音韻資料所含之各音框 圖。 貝成之 圖6係例示同實施方式之音質資料庫之登錄内容之圖。 圖7係顯示同實施方式之音質參數之構造之-例之^ I 圖8係顯示同實施方式之音質變更處理之流程圖。 圖9係例示同實施方式之映射函數之圖。 圖係顯示同實施方式之男性之音韻的分析結果 圖Η係顯示同實施方式之女性之音韻的分析結。 圖12係例示同實施方式之共振表之圖。 圖13係例示由同實施方# ± 之關係之圖。 Ί、振表-出之共振值與時間 圖⑷系為了說明同實施方式之共振峰頻率共振之圖。 圖15係為了說明同實施方式之音調賦予處理之圖。 示被_同實施方式之音質變更處理及音調賦 予处理後的特定共振峰之共振峰波形之圖。 圖17係顯示以往之聲音合成褒置之功能構造之圖。 【主要元件符號說明】 100聲音合成裝置 21 〇輸入部 95457.doc -18- 220 200535235 230 240 250 260 270 280 正文解析部 音韻資料取得部 音韻資料庫 音質變更部 音質資料庫 聲音信號產生部 波形資料庫。
95457.doc 19

Claims (1)

  1. 200535235 十 1. 申請專利範圍: 音合成裝置,其特徵為具有: 取係由被輸入聲音合成裳置之正文資訊, 疋口成聲音之音韻的音 聲:之音質的音質指定資訊…及指定該合成 料弟—記憶手段,其係記憶複數個顯示各音韻之音韻資 第一记憶手段,其係記、 該音邶次如 傲双禋曰韌貧料加工資訊, 明貝料加工資訊係用於變 訊且顯示音韻資…,更上述各音韻之音質之資 曰硝貝枓之加工内容者; 第一抽出手段,其係由上述第一 述音韻。己隐手段,抽出與上 〜“疋貢訊所示之音韻對應之音韻資料. 音手段,其係由上述第二記憶手段,抽出與上述 彦曰=訊所示之音質對應之音韻資料加工資訊;及 段,其係依上述抽出之音韻資料 欠> 工卜ιΐι 、λ+加工負訊,加 出之音韻資料,產生上述合成聲音。 2.如請求項1之聲音合成裝置,其中 曰 上述各音韻資料包含顯示音韻之共振峰的共振峰資訊; 〜上述音韻資料加4訊包含顯示上述共振峰之變更内 容的共振峰變更資訊; 上述產生手段藉由依上述共振峰變更資訊變更上述共 振峰貢訊,並加上依變更後之各共振峰資訊產生之各信 號波形,產生上述合成聲音。 3·如請求項2之聲音合成裝置,其中 95457.doc 200535235 成 上述共振峰資訊由共振蜂 頻率及共振峰位準 之對所構 上述,、振峰變更資訊包含· ^匕3 ·共振峰頻率變 係顯示上述共振峰頻率 、 ^ 貝羊之虻更内容’·及共振峰位準變更 貝讯,其係顯示上述共振峰位準之變更内容; 上述產生手段藉由將上 振峰頻率及各共振峰位準 資訊及上述共振峰位準變 更後之各共振峰資訊。
    述音韻資料所示的音韻之各共 之各個依上述共振峰頻率變更 更貧訊加以變更,得到上述變 4·如請求項2或3之聲音合成裝置,其中 4Γ得除了由上述正文資訊取得上述音韻指定 貝η上述音負指定資訊之外,亦取得指定上述合成聲 曰之音调的音調指定資訊; ,上述產生手段藉由對加上依上述變更後之各共振峰資 訊產生之各信號波形之合成信號波形賦予上述音調指定 資訊所示之音調,得到上述合成聲音。 曰 5·如請求们之聲音合成裳置,其中上述正文資訊包含上述 音質指^資訊;上述取得手段由上述正文資訊取得上述 音質指定資訊。 6·如請求項丨之聲音合成裝置,其中上述取得手段由上述正 文資訊抽出關鍵字,依抽出之關鍵字來判定適合上述正 文貧訊之音質,藉此取得上述音質指定資訊。 7_ 一種聲音合成方法,其特徵為具有: 取知工序,其係由被輸入聲音合成裝置之正文資訊, 95457.doc 200535235 取得指定合成聲音之音韻的音韻指定資訊及指 聲音之音質的音質指定資訊; 〇成 第一抽出工序,其係由記憶複數個顯示各音韻之〜 資料的第一記憶手段,抽出與上述音韻指定資訊所 音韻對應之音韻資料; 不之 第二抽出工序,其係由記憶有複數_示音韻 工内容之用於變更上述各音韻之音質之音韻資料加= :的第二記憶手段’抽出與上述音質指定資訊所示之: 質對應之音韻資料加工資訊;及 < 曰 工 8. 產生工序’其係依上述抽出之音韻資料加工 上述抽出之音韻資料,產生上述合成聲音。 11 π -種可電腦讀取之記憶媒體’其記憶有聲音合 該聲音合成程式係用於使具記憶有顯示各音韻之2: :的苐-記憶手段及記憶有複數種用 : 音質之資訊且顯示音韻資料之加工内容之音韻Ϊ;:: 資訊㈣:記料段之電腦起仙作為:^科加工 取得手段,其係由被輸入上述電腦之正文 指定合成磬立夕立& ΑΑ立* 、 取传 df日㈣音韻指定資訊及指^該合成聲音 之曰貝的音質指定資訊; —第-抽出手段,其係由記憶複數個顯示 貧料的第—$愔车❿ 4丄, 只之曰明 立㈣庙 手#又’抽出與上述音韻指定資訊所示之 曰s貝對應之音韻資料; 工二手段’其係由記憶有複數種顯示音韻資料加 且用於變更上述各音韻之音質之資訊之音韻資料 95457.doc 200535235
    加工資訊的第二記憶手段,抽出與上述音質指定資訊所 示之音質對應之音韻資料加工資訊;及 產生手段,其係依上述抽出之音韻資料加工資訊加工 上述抽出之音韻資料,產生上述合成聲音。 95457.doc
TW094104941A 2004-02-20 2005-02-18 Voice operation device, method and recording medium for recording voice operation program TW200535235A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004044852A JP2005234337A (ja) 2004-02-20 2004-02-20 音声合成装置、音声合成方法、及び音声合成プログラム

Publications (2)

Publication Number Publication Date
TW200535235A true TW200535235A (en) 2005-11-01
TWI300551B TWI300551B (zh) 2008-09-01

Family

ID=35007713

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094104941A TW200535235A (en) 2004-02-20 2005-02-18 Voice operation device, method and recording medium for recording voice operation program

Country Status (4)

Country Link
JP (1) JP2005234337A (zh)
KR (1) KR100759172B1 (zh)
CN (1) CN100337104C (zh)
TW (1) TW200535235A (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2500471B (en) * 2010-07-20 2018-06-13 Aist System and method for singing synthesis capable of reflecting voice timbre changes
JP6724932B2 (ja) * 2018-01-11 2020-07-15 ヤマハ株式会社 音声合成方法、音声合成システムおよびプログラム
WO2020145353A1 (ja) * 2019-01-10 2020-07-16 グリー株式会社 コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3633963B2 (ja) * 1994-09-14 2005-03-30 株式会社河合楽器製作所 楽音生成装置及び楽音生成方法
US5744741A (en) * 1995-01-13 1998-04-28 Yamaha Corporation Digital signal processing device for sound signal processing
JPH1078952A (ja) * 1996-07-29 1998-03-24 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置
CN1113330C (zh) * 1997-08-15 2003-07-02 英业达股份有限公司 语音合成中的语音规整方法
US6823309B1 (en) * 1999-03-25 2004-11-23 Matsushita Electric Industrial Co., Ltd. Speech synthesizing system and method for modifying prosody based on match to database
JP2000339137A (ja) * 1999-05-31 2000-12-08 Sanyo Electric Co Ltd 電子メール受信システム
JP2002268699A (ja) * 2001-03-09 2002-09-20 Sony Corp 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体
JP3732793B2 (ja) * 2001-03-26 2006-01-11 株式会社東芝 音声合成方法、音声合成装置及び記録媒体
JP2003031936A (ja) * 2001-07-19 2003-01-31 Murata Mach Ltd プリント基板
JP2003295882A (ja) * 2002-04-02 2003-10-15 Canon Inc 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム
DE04735990T1 (de) * 2003-06-05 2006-10-05 Kabushiki Kaisha Kenwood, Hachiouji Sprachsynthesevorrichtung, sprachsyntheseverfahren und programm
KR20050041749A (ko) * 2003-10-31 2005-05-04 한국전자통신연구원 방송 음성 데이터를 이용한 영역 및 화자 의존 음성 합성장치, 음성 합성용 데이터베이스 구축방법 및 음성 합성서비스 시스템

Also Published As

Publication number Publication date
CN1658281A (zh) 2005-08-24
KR100759172B1 (ko) 2007-09-14
CN100337104C (zh) 2007-09-12
JP2005234337A (ja) 2005-09-02
TWI300551B (zh) 2008-09-01
KR20060043023A (ko) 2006-05-15

Similar Documents

Publication Publication Date Title
CN1463419A (zh) 同步文本/可视信息与音频重放
Milne et al. Testing a spectral model of tonal affinity with microtonal melodies and inharmonic spectra
Tsunoo et al. Beyond timbral statistics: Improving music classification using percussive patterns and bass lines
Yin et al. Modeling F0 trajectories in hierarchically structured deep neural networks
JP2006293026A (ja) 音声合成装置,音声合成方法およびコンピュータプログラム
Mirbeygi et al. Speech and music separation approaches-a survey
TW200535235A (en) Voice operation device, method and recording medium for recording voice operation program
Van Do et al. Non-uniform unit selection in Vietnamese speech synthesis
TWI360108B (en) Method for synthesizing speech
TWI271702B (en) Device, method and program for pitch pattern generation
Yang et al. A fast high-fidelity source-filter vocoder with lightweight neural modules
CN114842859A (zh) 一种基于in和mi的语音转换方法、系统、终端及存储介质
CN113241054A (zh) 语音平滑处理模型生成方法、语音平滑处理方法及装置
Cohen The influence of nonharmonic partials on tone perception
Roberts et al. A time-scale modification dataset with subjective quality labels
JP5402141B2 (ja) メロディ作成装置、メロディ作成プログラムおよびメロディ作成方法
Friberg et al. Recognition of the main melody in a polyphonic symbolic score using perceptual knowledge
Schwabe et al. Dual task monophonic singing transcription
Martins A computational framework for sound segregation in music signals
Sridhar et al. Fundamental frequency estimation of carnatic music songs based on the principle of mutation
CN106859660A (zh) 一种闭合式言语测听词表的设计方法与应用
CN115457923B (zh) 一种歌声合成方法、装置、设备及存储介质
CN116645957B (zh) 乐曲生成方法、装置、终端、存储介质及程序产品
Wilk et al. Music interpolation considering nonharmonic tones
Bohak et al. Transcription of polyphonic vocal music with a repetitive melodic structure

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees