TW523734B - Speech synthesizing method, dictionary organizing method for speech synthesis, speech synthesis apparatus, and computer-readable medium recording speech synthesis program - Google Patents
Speech synthesizing method, dictionary organizing method for speech synthesis, speech synthesis apparatus, and computer-readable medium recording speech synthesis program Download PDFInfo
- Publication number
- TW523734B TW523734B TW089113028A TW89113028A TW523734B TW 523734 B TW523734 B TW 523734B TW 089113028 A TW089113028 A TW 089113028A TW 89113028 A TW89113028 A TW 89113028A TW 523734 B TW523734 B TW 523734B
- Authority
- TW
- Taiwan
- Prior art keywords
- dictionary
- monolingual
- sound
- prosody
- waveform
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002194 synthesizing effect Effects 0.000 title claims abstract description 27
- 230000015572 biosynthetic process Effects 0.000 title claims description 95
- 238000003786 synthesis reaction Methods 0.000 title claims description 91
- 230000008569 process Effects 0.000 claims abstract description 27
- 230000000875 corresponding effect Effects 0.000 claims description 67
- 230000009466 transformation Effects 0.000 claims description 29
- 238000001308 synthesis method Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 239000000463 material Substances 0.000 claims description 11
- 230000033764 rhythmic process Effects 0.000 claims description 9
- 230000001020 rhythmical effect Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 230000002079 cooperative effect Effects 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 3
- 239000008280 blood Substances 0.000 claims description 2
- 210000004369 blood Anatomy 0.000 claims description 2
- 230000000694 effects Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims 1
- 239000008186 active pharmaceutical agent Substances 0.000 claims 1
- 210000004556 brain Anatomy 0.000 claims 1
- 230000008859 change Effects 0.000 claims 1
- 238000010411 cooking Methods 0.000 claims 1
- 230000002996 emotional effect Effects 0.000 claims 1
- 238000009472 formulation Methods 0.000 claims 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims 1
- 239000010931 gold Substances 0.000 claims 1
- 229910052737 gold Inorganic materials 0.000 claims 1
- 238000009434 installation Methods 0.000 claims 1
- 235000012054 meals Nutrition 0.000 claims 1
- 230000000877 morphologic effect Effects 0.000 claims 1
- 239000011257 shell material Substances 0.000 claims 1
- 230000008451 emotion Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 230000001944 accentuation Effects 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000029052 metamorphosis Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/60—Methods for processing data by generating or executing the game program
- A63F2300/6063—Methods for processing data by generating or executing the game program for sound processing
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
523734 五、發明説明( 本發明係有關於—稽
成方法、用於聲音合成^於電視遊戲等之聲音^ 、及記錄有聲音合成程之典構築方法、聲音合成裝I 近年來,伴隨著電:報=可讀:媒體。 (A™)之聲音導引 以不、銀行自動櫃員機 、欠覆輪出整立印自 及,以及改善各種電器 θ。心之服務的普 φ ^ ^ 〇口之人機介面等,使由; 出聲音訊息之需求—直在增加中。 使由機械輪 I:知之聲音輸出法中有—種是將預先 “ 或文早以真人發音,並將 、 口巧 -flH ffi η* , . # 、亲及記錄於記憶裝置t 而要時使其原音重現,將之輸出之方法(以下,^中, 記錄再生法)。又,有— 下稱之為 種所明之聲音合成法 b 對應於記憶裝置中構成聲立1自 成法疋先將 娜取卓日訊息之各種語詞 料加以憶,再組合,根據咅 、曰資 合該聲音資料。 “j入之文子列(文句)組 *藉前述記錄再生法’固可輸出高品質之聲音^ Ί,相反地,則有無法輸出已決定在先之台詞或SI :外之聲音訊息’以及需要與欲輸出之台詞或文 成比例之容量的記憶裝置等問題。 Ϊ —另-方面’藉聲音合成法,固可輸出任意輸 字列’即,可輸出對應於任意語詞之聲音訊息,且, 而要之記憶容量,相較於前述記錄再生法,亦可大所 少。然而,該法則有一問題,即可能依文字列之別:減 成殘留有不自然之感的聲音訊息。 ’形 又,在近來的電視遊戲中,隨著遊樂器主機性能之 公斧, 表紙張尺度適用中國國家標準(CNS、\4規格 曾強及記錄媒體記憶容量之擴增等,可輸出與BGM或 :效一起於遊戲中登場之角色所發出之聲音訊息的機 種亦在不斷的增加中。 此時,人們乃強列希珍 忠…、布望電視迦戲之類具高度娛樂性 者’可依角色別輸出不同音質之聲音訊息,以及輸出可 反映發話時之感情、狀況的聲音訊息。進而,並希望遊 Φ 戲者針對遊戲者角色所任意輸人及設定之名字(稱呼: ’可由遊戲中角色發聲叫出。 若欲以前述記錄# ±法實現符合該$冑I之聲音 訊息的輸出,則有必要就遊戲者任意輸入、設定之遊: 者角色的名字(稱呼)等高達數千乃至數萬之所有語詞 的聲音加以收錄’以便再生。因此,收錄所需之時間或 費用及所需記憶裝置之容量勢將甚為龐大,實際上是不 可能實施的。 另外’藉聲音合成法’固可使任意輸入、設定之遊 戲者角色的名字較容易發聲。然而,因習知之聲音合成 方法僅以作成明瞭自,然之聲音訊息為目標,所以要依發 話者之個性或發話時之感情、狀況合成聲音訊息、亦即 要依遊戲中角色之別輪出各種不同音質之聲音訊息、或 要輸出可反映遊戲中角色之感情、狀況的聲音訊息,是 完全不可能的。 本發明之目的係在於提供—種可作成依發話者之 個性或者發話B夺之感情、狀況或各種發話内容,而適合 於如電視遊戲等具高度蜈樂性用途的聲音合成方法、 本紙張尺度適/t]中國國家標準(CNS ' A4規袼 523734 A7 B7 五、發明説明 於聲音合成之辭典構築方法、聲音合成裝置及記錄有聲 音合成程式之電腦可讀取媒體。 為達成前述目的,本發明乃於使用單語辭典、韻律 辭典及波形辭典以作成聲音訊息之聲音合成方法中提 供以下之特徵,即··設定多數用以處理聲音合成之作業 單位(以下,稱之為作業),並使每一作業在發話者或 者發話時之感情、狀況或發話内容中至少有丨種不相同 ,並,至少構築與各作業相對應之韻律辭典及波形辭典 ,而於應合成之文字列與指定之作業一起輸入時,可使 用與所指定之作業相對應之單語辭典、韻律辭典及波形 辭典進行聲音合成之處理。 根據本·發明,由於係將聲音合成處理分為多數發話 者或者發話時之多數感情、狀況或多數發話内容的作業 ,並依作業別構築辭典以進行聲音合成處理,所以可輕 易作成對應於發話者之個性或者發話時之感情、狀況或 發話内容的聲音訊息。 經濟部智慧財產局S工消費合作社印製 又’則述多數作業之每一辭典可就各作t進行下列 步驟而構築者,即:作成對應於作業之單語辭典,並由 單語辭典中之所有單語選出可作為範本之文字列,以作 成收錄聲音底稿,再根據收錄聲音底稿收錄發話者之聲 音,並以此收錄之聲音構築韻律辭典及波形辭典。 又,刖述多數作業之每一辭典亦可就各作業進行下 列步驟而構築者,即:作成對應於作業之單語辭典及單 語變形規則,根據對應於作業之單語變形規則,將對應 本纸張尺度適用中國國家標準(CNS ) A4規格 -6 - /34 A7 、五、發明説明(4 ) ' ---*—— 於作業之單語辭典中所包含之所有單語作變形處理,並 *經變形處理之單語辭典中的所有單語選出可作為範 : ^之文字列,而作成收錄聲音底稿’再根據收錄聲音底 • 收錄丨D舌者之聲音,並由該收錄之聲音,構築韻律 辭典及波形辭典。 又,則述多數作業之每一辭典亦可就各作業進行下 „ 列步驟而構築者,即:作成對應於作業之單語變形規則 J二根據對應於作業之單語變形規則,將單語辭典中所包 S之所有單5吾作變形處理,並由經變形處理之單語辭典 :的所有單語選出可作為範本之文字列,而作成收錄聲 曰底稿,再根據收錄聲音底稿,收錄發話者之聲音,並 由該收錄之聲音,構築韻律辭典及波形辭典。 ^ 士立根據本發明,不但可簡單地作成對應於作業之收錄 聲音底稿,且可根據該底稿將聲音收錄以構築各辭典, 同時並可藉文字列變形處理之進行,而輕易作成包含有 痛| 夕樣内令表現之聲音訊息,不只是增加辭典之容量而已 又,使用該等辭典之聲音合成方法則可藉以下步 進行之,即:依與應合成之文字列一起輸入之指定作 轉換單語辭典、韻律辭典及波形辭典,且,使用轉換 之單π辭典、韻律辭典及波形辭典,將對應於應合成 文子列的聲音訊息作合成處理。 此時,當各辭典為將多數至少包含有1個單字之 語與其重音型態一 #收錄之單語辭典、將用u顯示相 本、?氏ir、尺度適用中國國家標隼 (CNS ' :\4規袼 7公釐 523734 A7 B7 五、發明説明(5 ) -- 於该單語辭典所收錄單語之韻律的韻律範本資料中具 代表性者加以收錄之韻律辭典、及以收錄聲音作為合成 單位之聲音資料而加以收錄之波形辭典時,聲音合成處 理可藉下列步驟進行之,即:由單語辭典判定應合成文 字列之重音型態,且,依應合成文字列及重音型態,由 韻律辭典中選擇韻律範本資料,再依選擇之韻律範本資 料,由波形辭典中選擇對應於應合成文字列之各文字的 波形資料,並將該選擇之波形資料相互加以連結。 又,使用該等辭典之另一聲音合成方法則係藉以下 步驟而行之,即:依與應合成之文字列一起輸入之指定 作業轉換單語辭典、韻律辭典與波形辭典及單語變形規 則,且,根據單語變形規則,將應合成之文字列作變形 處理,並使用轉換後之單語辭典、韻律辭典及波形辭典 ,將對應於變形處理後之文字列的聲音訊息作合成處理 〇 經濟部智慧財產局消費合作社印製 再者’另外-種使用該等辭典之聲音合成方法係藉 以下步驟而行之,即:依與應合成之文字列一起輸入之 指定作業轉換韻律辭典與波形辭典及單語變形規則,且 ,根據單語變形規則,將應合成之文字列作變形處理, 並使用單語辭典、轉換後之韻律辭典及波形辭典,將對 應於變形處理後之文字列的聲音訊息作合成處理。 而此時,當各辭典為將多數至少包含有丨個單字之 單語與其重音型態-^收錄之單語辭典、將用U顯示相 對於該單語辭典所收錄單語之韻律的韻律範本資料 本紙張尺度適用中國國家標準(CNS ) A4規格(210 x 297公楚 I— 經濟部智慧財產&肖工消費合作社印製 五、發明説明(6 ) 收錄之韻律辭典、及以收錄聲音作為合 指料而加以收錄之波形辭典,且單語變形 規則為收錄文字列< ^ ^ ^ t 、 一』之支形規則者時,聲音合成處理可夢 下列步驟進行之,即:由單 曰 由早^辭典或單語變形規則 應合成文字列之重音型態,且,依應合成文字列及重: 心’由μ辭典中選出韻律範本資料,再依選出之韻 律範本資料,由波形辭典中選出對應於應合成文字列之 各文子的波形貝料’並將該選出之波形資料相互加 結。 又,使用前$辭典《聲音纟成裝置係具有—可依與 應合成之文字列一起輸入之指定作業轉換單語辭典、韻 律辭典及波形辭典之裝置,及一可使用轉換後之單語辭 典、喊律辭典及波形辭典將對應於應合成之文字列的聲 音訊息作合成處理之裝置而構成者。 又,使用前述辭典之另一聲音合成裝置係具有一可 依與應合成之文字列一起輸入之指定作業轉換單語辭 典、韻律辭典與波形辭典及單語變形規則之裝置,一可 根據單語變形規則,將應合成之文字列作變形處理之裝 置,及一可使用轉換後之單語辭典、韻律辭典及波形辭 典’將對應於變形處理後之文字列的聲音訊息作合成處 理之裝置而構成者。 再者,另外一種使用前述辭典之聲音合成裝置係具 有一可依與應合成之文字列一起輸入之指定作業轉換 韻律辭典與波形辭典及單語變形規則之裝置,一可根據 本纸張尺度適用中國國家標準(CNS ) Α4規格( 丨10X 297公釐) 批衣------1Τ------0 f請先閱讀背面之注意事項再填寫本頁) 523734 A7 B7 五、發明説明(, 單語變形規則將應合成之文字列作變形處理之裝置,及 一可使用單語辭典、轉換後之韻律辭典及波形辭典將對 應於變形處理後之文字列的聲音訊息作合成處理之裝 置而構成者。 又,如前所述之聲音合成裝置可藉一媒體實現之, 該媒體記錄有可由電腦讀取之聲音合成程式,當電腦由 該媒體讀出該程式時,可以電腦作為單語辭典、韻律辭 典及波形辭典,以及作為轉換裝置、聲音合成處理裝置 ,而產生作用,而,該單語辭典、韻律辭典及波形辭典 則係分別對應於多數用以處理聲音合成之作業,且該多 數用以處理聲音合成之作業並於發話者或者發話時之 感情、狀況或發話内容中至少有丨種不相同者,該轉換 裝置係可依與應合成《文字% 一起輸入之指$作業轉 換單語辭典、韻律辭典及波形辭典者,又,該聲音合成 處理裝置並係可使用轉換後之單語辭典、韻律辭典及波 形辭典將對應於應合成之文字列的聲音訊息作合 理者。 經濟部智¾財產局員工消費合作社印製 又,如前所述之聲音合成裝置亦可藉記錄有如下聲 音合成程式之電腦可讀取媒體實現之。即,當電腦由該 媒體讀出該程式時,可以電腦作為單語辭典、韻律辭典 與波形辭典及單語變形㈣,以及作為轉換裝置、變形 處理裝置、聲音合成處理裝置,而產生作用者,而,爷 單語辭典、韻律辭典與波形辭典及單語變形規則則係二 別對應於多數用以處理聲音合成之作業,且該多數用以 卜紙張尺度適用中國國家標準 (〇阳)六4規格(210、,:297公釐 -10 523734
•經濟部智慈財產场只工消費合作社印製
處理聲音合成之作業並於發話者或者發話時之感情、狀 況或發話内容中至少W種不相同者,該轉換裝置係可 依與應合成之文字列一起輸入之指定作業,轉換單語辭 :、韻律辭典及波形辭典者,該變形處理裝置係可根據 早語變形規則,將應合成之文字列作變形處理者,又, 該聲音合成處理裝置並係可制轉換後之單語辭典、韻 律辭典及波形辭典,將對應於應合成之文字列的聲音訊 息作合成處理者。 θ 又,如前所述之聲音合成裝置亦可藉記錄有如下聲 音合成程式之電腦可讀取媒體而實現之。即,當電腦由 该媒體讀出該程式時,可以電腦作為單語辭典、韻律辭 典與波形辭典及單語變形規則,以及作為轉換裝置、變 形?理裝置、聲音合成處理裝置,而產生作用者,而, 泫早語辭典、韻律辭典與波形辭典及單語變形規則則係 分別對應於多數用以處理聲音合成之作業,且該多數用 =處理聲音合成之作業並係於發話者或者發話時之感 情、、狀況中有任一種不相同者,該轉換裝置係可依與應 合成之文字列一起輸入之指定作業,轉換韻律辭典與波 形辭典及單語變形規則者,該變形處理裝置係可根據單 ^變形規則,將應合成之文字列作變形處理者,又,該 聲音合成處理裝置並係可使用單語辭典、轉換後之韻律 辭典及波形辭典,將對應於變形處理後之文字列的聲音 訊息作合成處理。 本發明之前述目的及其他目的、特徵和優點將可 CNS ) Λ4規格(2!〇χ297公靡)
本纸張尺度適用中國國家標準( -11-
以下之說明及% Μ门、 斤附圖式而更為明瞭。 (圖式之簡單說明) 第1圖係顯+士& 。 X明中聲音合成方法全體之流程圈 第2圖係作業之說明圖。 第3圖係_具體作業之例示圖。 第4圖係顯示本 .^ ^ 七月中用於聲音合成之辭典構築2 法的流程圖。 第5圖係一單語變形規則之例示圖。 第6圖係-選出之文字列之例示圖。 第7圖係一根據單語辭典、單語變形規則、文字歹 選出:則,,作成聲音收錄底稿為止之情形的例示圖 弟8圖係顯示本發明中聲音合成方法之流程圖。 第9圖係本發明中聲音合成裝置之機能方塊圖。 (實施例) 經濟部智慈时產总;肖工冶費合作社印製 第1圖係-顯示本發明聲音合成方法之流程圖,赴 處所顯示《聲音合成方法係較廣義者,包含如何構築用 於聲音合成之辭典的全體流程。 首先,設定多數用以處理聲音合成之作業,並使每 一作業在發話者或者發話時之感情、狀況或發話内容中 至少有1種不同者(si)。而該作業依聲音合成之目的以 人工操作進行之。 本紙張又度適用中國國家標準(CNS ) A4規格ί 2丨0X 297公釐) -12- W34 A7 B7 五、發明説明(10 第2圖係用以說明前述作業者,圖中,A1、A2、A3 係表示多數不同之發話者,B1、B2、B3係表示多數不 同之感情、狀況’^。則係表示多數不同之發 話内容。且’在此所謂之發話内容並不是指單一之語詞 ’而是指對對方打招呼之語詞或高興時所發出之語詞等 具一定定義之語詞的集合。 在第2圖中,發話者A丨於感情、狀況為B 1時所進行 發話内容ci之發話事件(Α1·Β1-(:1)即形成^固作業, 而發話者A1於感情、狀況為…時所進行發話内容以之 發《舌事件(A1-B2-C1 )則形成另丨個作業。同樣地,發 話者A2於感情、狀況為扪時所進行發話内容q之發話 事件(A2-B1-C2 )、發話者A2於感情、狀況為B2時所進 行發話内容C3之發話事件(A2_B2-C3)及發話者人3於 感情、狀況為B3時所進行發話内容C2之發話事件( A3-B3-C2)亦皆分別形成丨個自之作業。 此時,並非要經常設定包含所有多數發話者或者多 數發話時之感情、狀況或多數發話内容之作業。換言之 ’亦有就發話者A1而言固然設定了感情、狀況B1、B2 、B3,且就感情、狀況Β1、Β2、β3而言,又分別設定 了發话内容C 1、C2、C3,而總計設定了 9種作業,但就 發話者A2則僅設定感情、狀況B丨、b2,而就其感情、 狀況B 1僅設定發話内容C 1、C2,就感情、狀況B2則僅 設定發話内容C3,而總計僅設定了 3種作業之情況,即 ’要没定何種作業係依聲音合成之目的而任意決定。 束紙張尺度it ,¾巾目國家標準( (讀先閱讀背面之注意事項再填寫本頁) ’裝. 訂 -13 · yZ3734 五、發明説明(u 毛活者或者發話時之感情、狀 内容雖皆以多數來說明, 飞I 4 夕数;况月,然而依聲音合成之目的, 將其设疋成其中任丨個或任2個 丨至爪疋於1種的作章。 第3圖係顯示一具體作筆, ^ 者在此即為將電視遊 戲中之避戲中角色的簦立士 έ 月已w θ sfL息加以合成時的例子,特別 是指發活内容僅限於對遊戲者角色呼叫的例子。 在第3圖中’就名為「喜卡里」(曰文人名)之發話 者(遊戲中角色)設定了「 叼千岈曰通之稱呼 「成為 咼中生後普通之稱呼、「成為古由 ^ 、心梆吁」成為咼中生後講電話時之普通 稱呼」、「告白及重逄時感動至極之稱呼」4個感情、狀 況’並將該等感情、狀況分別設定為作業!、2、3、4 。又,就名為「阿卡内」(曰文人名)之發話者設定「 普通之稱呼」、「講電話時之普通稱啤」、「告白及放學時 親以稱呼」3個感情、狀況,並將該等感情、狀況分 別设定為作業5、6、7。 且’對各作業之訊息則舉後述就每一作業施以單語 變形處理的例子。又’圖中之「恰恩」'「窟恩」則為曰 文之敬稱。 空後,就如此設定而成之多數作業中的每—作業構 築聲曰合成所需之辭典’即’單語辭典、韻律辭典及波 形辭典(s2 )。 〇n在此’單語辭典係指,將多數至少包含1種文字之 單語與其重音型態一起收錄者,若以第3圖所說明之作 業為例則為’將多數用以表示預想可能被輸入之遊戲者 (!#先閲讀If面之注意事項再填寫本頁) 、-口 本紙張尺度適; I國家標準 CNS Λ4規格 -14- 523734 Α7 Β7 五 、發明説明(12
II 智 U ♦ W 时 > Kh ;'ή (Λ 枝 业色的名子之早語與其重音型態一起收錄者。又韻律爵 、係指,將用以顯示相對於單語辭典所收錄單往 的韻律範本資料中具代表性 1 則係指,以收錄聲音作為人成嚴付^而波形辭與 车曰作為合成早位之聲音資料(音素片 )而加以收錄者。 ’、 又,若對單語辭典施以後 僅鉢#本+ rV、比 芡述灸早—欠形處理,則可 使“舌者或感情、狀況不同之作業共通 發話内容限定於〗種時,作案尤其疋右將 T 作業亦可僅為1個。 然後’由圖中未示之齡 泌 , 輸入機構或遊戲系統,將庫合 成之文字列與指定作業一鉈 · 相對靡^ 01^ (輸入4,使用與所指定‘作業 子應之早h辭典、韻律辭业 處理(s3 )。 一及波形辭典進行聲音合成 /第4圖係顯示本發明中 法的流程。 用於聲日合成之辭典構築方 首先:以人工操作作成對應於前述設定之多數發話 者或者發話時之咸情、壯 )。此時,If /兄或發話内容之單語辭典(s21 時並依所需作成單語變形規則(s22)。 在此之單語變形規則 辭血之覃4 _掩♦ 係私規疋用於將收錄於單語 听/、之早浯k換處理為對應 fa] ^ ^ ^ % ;發活者或感情、狀況之不 N 1乍業的早語之規則者。 ^ 、十、 此,糟此變換處理,可如前 述,將1個單語辭典假想成 之不同竹酱^ I 、應於發活者或感情、狀況 不同作業的多數單語辭典而加以處理。 第5圖係顯示一單語轡犯 於以筮^V規則之例子,在此乃對應 、乂第3圖說明之r作章5 菜」的變形規則,即,顯示由名 扯衣------、玎------^____ (讀先閱讀背面之注意事項再4寫衣f ) ....... 1- — ·
-15- 523734 13 經 濟 部 智 慧 /1 作 社 印 A7 B7 五、發明説明( 字(遊戲者角色之名字)作成2個短音之暱稱以作為對 遊戲者角色之稱呼時的規則例。 接著’由前述作成之單語辭典或單語辭典及單語變 形規則’選出對應於某作業之單語辭典或單語辭典及單 語變形規則(S23 )。此時,若有單語變形規則,則進行 單語變形處理(S24 )。 單語變形處理係藉根據對應於某一作業之單語變 形規則對包含對應於該作業之單語辭典的所有單語作 變形處理而進行者。 若就第3圖及第5圖之例而言,將收錄於單語辭典之 遊戲者角色的名字逐一挑出,若為2個短音以上之普通 名字,就在對應於頭2個短音之文字後加上「窟恩」(曰 文敬稱)’又,若為1個短音之名字,則在對應於該短音 又文:後加上「一」(長音)及「窟恩」(曰文敬稱), =,若=其他特殊之名字,則進行長音化、促音化及撥 :化等交形以作成暱稱,且進一步在作成暱稱時則將重 曰改為碩向型等對重音施以變形處理。 尹齡1<吏·,由收錄於前述單語辭典之所有單語或對此單 :::以單語變形處理之所有單語,根據文字列選出 、出文字列以作成聲音收錄底稿(s25)。 t字列選出規則係指規定由收錄於單語辭典之所 :或對此單語辭典施以單語變形處理之所有單語 、可成為範本之文字列的規則者。如,由乡& # # 前述遊Λ去i 由夕數收錄 "角色名字之單語辭典選出可成為範本之文 (讀先閱讀背面之注意事項再填寫本頁)
-16 - -r , ιψ -r , ιψ Ψ 經濟部智慧时工消費,ΐ>,!ΐ社印我 〜 1 ) 1個至6個短音之^ 字,2)依各短音數別至少 曰之/ 纽.$ 知用1個不相同重音型態之^ σσ ••專。根據此規則所iP Ψ + 第6圖表示之。 斤、出之之文字列,其跡 然而’單語辭典所包含 ^ ^ ^ ^ ^ ^早#在作成辭典時若將潑
話内容定義得愈狹窄,則苴开彡萨收A ^ 〇σ 、形恕將愈受限制,且類似廣 大之皁語亦將愈多,而當單士 ^ ^ , 田早5吾辭典中含有大量相似度大 之早語時,則預先賦予各單狂矣—* 土 °。表不其重要度及出現機率 (頻率)之資訊,並使利 :欠^ 以-貝訊所構成之選出基準盘 則述短音數或指定重音型能 ,^ ^ η I4 一起包含於文字列選出 規則中,藉此乃可提高聲音此样念#丄 9收錄底稿中在實際合成聲音 日守輸入以作為應合成文字 — 于幻之文子列或與其相似之文 子列所含的機率’進而乃可提高實際聲音合成之品質。 接著,根據對應於如前述所作成之作業的聲音收錄 底稿’將發話者之聲音加以必执/ 乂收錄(s26 )。此係將對應於 作業之發話者(配音員等)招集於錄音室,以麥克風收 錄按照底稿所發出之聲音並將之收錄於錄音機等之普 通程序。 最後,由收錄之聲音構築韻律辭典及波形辭典(s2: )。又,關於依此收錄聲音而構築辭典之詳細處理,由 於並非本案發明之對象,使用一般周知之演算法或處理 方法即可,故於此略過,不予贅言。 依以上處理方式就所有作業別反覆進行(s28 )。且 ’如前述,藉單語變形處理,將1個單語辭典假想成 本纸張尺度適 CNS : A4現格 -17- 523734 A7 B7 V15 五、發明説明 (讀先閱讀背面之注意事項再填寫本頁) 應於發話者或感情、狀況之不相同作業的多數單語辭典 而加以處理時,則單語辭典維持不變,僅選擇對應於不 相同作業之單語變形規則進行之。又,s24〜s27之處理 並不須均按作業別依序進行,亦可同時並列進行。 第7圖係顯示下述情形之—例者,該情形係根據對 應於指定作業之單語變形規則將對應於該作業之單語 辭典所收錄之單語加以變形處理,再根據文字列選出規 則選取之,至作成對應於選“定作業之聲音收錄底稿 為止。 在此之單語變形規則係指對應於以第3圖說明之 「作業2」的變形規則’即,於名字(遊戲者角色之名 字)後加上「窟恩」(日文敬稱)以作成對遊戲者角色 之牙冉呼日可的規則。又,女玄,ρρ . 又子列選出規則為:丨)變形後 為3個至8個短音以内,2)依所有短音別至少採用】 個不相同之重音型態的單語,3)以出現頻率高之語詞 為優先’ 4)預先指定收錄於底稿之文字列個數(超過 指定個數時選出即告終了)。 經濟部智.¾¾產钓ΰ VI3吒合作社印絜 在本例中’「阿基有希窟恩」(曰文人名)及「木黄 有希屈心」(曰文人名)雖同具6個短音且同為中高型 之重音型態(圖中以實線標示),但由於「阿基有希」 之出現機率較高’所以選擇「阿基有希君」(日文人幻 並於底稿輸出。又,由於「沙會莫恩扎布漏烏窟恩」(日 文人名)為10個短音,所以並未於底稿輸出。 又’至目刖所述用於聲音合成之辭典構築方法,因 外、免7^尺度適用中國國家標準(CNS : ^4.¾格.〜二 -18- 經濟部智慧財邊局· 523734 五、發明説明(16 包含以人工操作之作成辭典或聲音收錄等現場作業 無法以裝置或程式來實現所有之步驟,然而就單語 步驟及文字列選出步驟而言’則可藉根據各自之規則: 進行處理的裝置或程式來加以實現。 第8圖係-顯示本發明聲音合成方法之流程圖,此 處所顯示之聲音合成方法係較狹義者,係使用如前述所 作成之作業的每1語辭典、韻律辭典及波形辭 行實際之聲音合成者。 首先,藉圖中未示之輸入裝置及遊戲系統等,將應 合成之文字列及指定作業輸入時,將根據該指定作業轉 換單語辭典、韻律辭典及波形辭典,又,於構筚辭血之 步驟進行單語變形處理時,則將更進一步轉換單語變形 規則(s31 )。 然後,於構築辭典之步驟進行單語變形規則時,則 根據前述已轉換之單語變形規則,實行對前述應合成之 文字列的單浯紜形處理(s32 )。且此處使用之單語變形 規則基本上依舊使用構築辭典之步驟所用之規則。 接著,由單語辭典或單語變形規則判定應合成文字 列之重音型態(S33)。具體上係將應合成之文字列及收 錄於早:吾辭典之單語加以比較,若為同一單語就採用其 重曰’不然就由同_短音數之單語中,採用具有類 似文子列之單語的重音型態。又,不為同一個單語時, 亦:由f、合成之文字列及可於相同短音數顯示之所有 尘〜、中,藉操作者(進行遊戲之遊戲者)等圖中未 太纸張尺度適 規格 f讀先閱讀背面之注意事項再填寫本頁} .裝 威------------ -19- 、發明説明(17 , 示之輸入裝置任意選擇之。 又,此時’在前述單語變形處理階 典構築說明之重音進行## τ 乂則述辭 ▲ 垔曰進仃d處理時,係採用根據 語變形規則之重音型態。 迷早 然後,依應、合成之文字列及重音型態 出韻律範本資料(s34),再依 典選 形辭典選出對應於應合成文 科由波 T <合又子的波 “35〕,並將該選出之波形資料相互成签 音合成資料。 ^ Q作成聲 之又’, S34〜36之詳細處理,由於並非本案發明 °直接使用一般周知之演算法或處理方法,故 予以省略,不多加贅言。 ,第9圖係本發明中聲音合成裝置之機能方塊圖,圖 中’⑴1、11-2 ••…U-n係作業1、作業2 ··.·.作業n用 辭/、 12-1、12_2…·· i2-n係作業1、作業2 ••…作業^ 經 濟 部 智 慧 1 局 I η 用麦形規則,1 3係辭典、變形規則轉換裝置,丨4係單 语變形裝置,15係重音型態判定裝置,16係韻律範本 選擇裝置,!7係波形選擇裝置,18係波形連結裝置。 作業1〜作業n用辭典丨丨-丨〜丨丨^各為作業丨〜作業乃 用之單浯辭典、韻律辭典及波形辭典(其記憶部)。又, 作業1〜作業n用變形規則P — 各為作業丨〜作業 n之單語變形規則(其記憶部)。 辭典、變形規則轉換機構〗3係依應合成之文字列 與輸入之指定作業,將使用之作業丨〜作業n用辭典的 太紙痕尺度迺用中國國家標準(r>v;s、Λ>4規格 -20-
其中之一及作業!〜作業n用變形規則12]〜12 中之-進行轉換選擇以供給各部。 ’、 早扣’文形機構14係根據前述選出之單語 將應…字列加以變形處理。重音型態判 15係由月以選擇之單語辭典或單語變形規則判定應合 成之文字列的重音型態。 & σ 杳貝律範本選擇¥ 1 < 、置6係依應合成文字列及重音型 心、由刚述選出之韻律辭血 裝置! 7係依選出之:二:…本 > 料。波形選擇 — 之頭律犯本資料選擇對應於應合成文 字的波形資料。波形連結裝置18係將該選 之;:身料相互加以設連結以作成聲音合成資料。 古、本說明書所記載之實施例係就本案發明予以舉例 二明而已,並非對本案發明加以設限。而本案發明之範 係則依所附之申請專利範圍界定之,大凡涵蓋於該等 申請專利範圍定義中之所有變形例均應包含在本發明 之範圍中。 裝 訂 線 (讀先閱讀背面之注意事項再填寫本頁} *經濟部智慧吋產砭.4二消費<0作社吓製 \【主要之元件標號】 si···作業之設定 s2···對應於作業之 構築辭典 s3···以對應於作業 之辭典進行聲音合 成 s21··.依作業作成單 語辭典 s22.··依作業作成單 語變形規則 s23···選擇每一作業 之單語辭典及單語 木紙張又度適用士 國國家標準:CNS ),以圯格 公釐 -21 - 523734 Α7 Β7 經濟部皆¾¾^¾¾ 二 ^
* 土 口丨 < '了 '广-T 五、發明説明(19 ) 變形規則 s24···進行單語變形 處理 s25...選出文字列 s26…收錄聲音 s27...由收錄聲音構 築辭典 s28···依以上處理方 式就所有作業別反 覆進行 s31...依作業轉換辭 典及變形規則 s32...單語變形 s33...判定重音型態 s34...選擇韻律範本 s35···選擇波形(音 素片) s36··.連結波形(音素片) 1 1-1 〜1 1-n.··作業 1 用辭典〜作業η用辭 典 12-1 〜12-η...作業 1 用變形規則〜作業η 用變形規則 13.. .辭典、變形規則 轉換裝置 14.. .單語變形裝 置 15.. .重音型態判定 裝置 16.. .韻律範本選擇 裝置 17.. .波形選擇裝置 18.. .波形連結裝置 i 遂 .玎 舞 (讀先閱讀背面之注意事項再填寫本頁) 土紙張尺度適用+國國家標準(CNS : ..、4規格 -22-
Claims (1)
- 523734 經 濟 部 智 慧 財 產 局 員 工 消 費 合 社 印 製 A8 B8 C8 D8 申請專利範圍 1 · 一種聲音合成方法,係使用單語辭典、韻律辭典及 波形辭典,而作成聲音訊息者,其特徵在於: 該聲音合成方法係設定多數用以處理聲音合成之作 業’並使每一作業在發話者或者發話時之感情、狀 況或發話内容中至少有1種不相同;並, 至少構築與各作業相對應之韻律辭典及波形辭典; 而於應合成之文字列與指定之作業一起輸入時,可 使用與所指定之作業相對應之單語辭典、韻律辭典 及波形辭典進行聲音合成之處理者。 2· —種用於聲音合成之辭典的構築方法,係用以構築 分別對應於多數用以處理聲音合成之作業的單語辭 典、韻律辭典及波形辭典,且該多數用以處理聲音 合成之作業並於發話者或者發話時之感情、狀況或 發話内容中至少有丨種不相同者;該用於聲音合成之 辭典的構築方法係:作成對應於作業之單語辭典; 並由單語辭典中之所有單語選出可作為範本之文字 列’以作成收錄聲音底稿; 再根據收錄聲音底稿收錄發話者之聲音; 並以此收錄之聲音構築韻律辭典及波形辭典; 如此,就各作業進行前述步驟者。 3. -種用於聲音合成之辭典的構築方法,係用以構築 分別對應於多數用以處理聲音合成之作業的單詞辭 典典、韻律辭典及波形辭典’且該多數用以處理聲 音合成之作f並於發話者或者發話時之感情、狀況 Ϊ紙張尺度刺中關家鮮(CNS)A4規格⑽χ 2巧^ (請先閱讀背面之注意事項再本頁) 訂: --線· -23· 或發話内容中至少古7 # +处 種不相同者;該用於聲音合成 之辭典的構築方法係·· 作成對應於作筆之置 >、之早^辭典及單語變形規則; 根據對應於作業之置1 /、 β°鲛形規則,將對應於作業之 早…中所包含之所有單語作變形處理; 由經變形處理之單語辭 τ的所有早語選出可作為 ε之文字列,而作成收 根據收錄聲音底稿,收錄發話者之聲音; 由該收錄之聲音,構筚韻 曰 再杀明痒辭典及波形辭典;如此 ,就各作業進行前述步驟者。/ 種用於合成聲音之辭並 οσ 昕,、的構築方法,係用以構築 早語辭典及分別對心多數用以處理聲音合成之作 業的韻律辭典及波形辭典,且該多數用以處理聲音 合成之作業並係於發話者或者發料之感情、狀= 中有任-種不相同者;該用於聲音合成之 築方法係: 構 作成對應於作業之單語變形規則; 根據對應於作業之單語變形規則,將單語辭典中包 含之所有單語作變形處理; 匕 々由經變形處理之單語辭#中的所有單語選出可作為 範本之文字列,而作成收錄聲音底稿; 根據收錄聲音底稿,收錄發話者之聲音; 由孩經收錄之聲音構築韻律辭典及波形辭典; 如此’就各作業進行前述步驟者。 523734 申請專利範圍 經濟部智慧財產局員工消費合作社印製 5·理=二合成方法’係使用分別對應於多數用以處 並:5成之作業的單語辭典、韻律辭典及波形辭 ,、以進行聲音之合成,且該多數用以處理聲音合成 =業於發話者或者發話時之感情、狀況或發話内 谷至)有1種不同者;該聲音合成方法係: 依與應合成之文字列一起輸入之指定作業轉換單 辭典、韻律辭典及波形辭典轉換;及 使用轉換後之單語辭典、韻律辭典及波形辭典, 對應於應合成之文字列的聲音訊息作合成處理。ν 6·如申請專利範圍第5項之聲音合成方法,當各辭典 將多數至少包含有1個單字之單語與其重音型態 (收錄之單^辭典、將用以顯示相對於該單語辭 所收錄單語之韻律的韻律範本資料中具代表性者 以收錄之韻律辭典、及以收錄聲音作為合成單位 聲音資料而加以收錄之波形辭典時,該處理聲音 成之方法係依以下步驟進行者: 由單語辭典判定應合成文字列之重音型態; 依應合成文字列及重音型態,由韻律辭典中選擇 律範本資料; 依選擇之韻律範本資料,由波形辭典中選擇對應 應合成文字列之各文字的波形資料;及 將該選擇之波形資料相互加以連結者。 7· —種聲音合成方法,係使用分別對應於多數用… 理聲音合成之作業的單語辭典、韻律辭典與波形 語 將 為 典 加 之 合 韻 於 以處 辭 (請先閱讀背面之注意事項再本頁) . -線_ 本紙張尺度適用中國國家標準(CNtS)A4規格(210 X 297公釐) -25- 523734 濟 部 智 慧 財 局 I 六、申請專利範圍 典及單語變形規則以進行聲音之合成,且該多數用 以處理聲音合成之作業於發話者或者發話時之感情 狀况或發話内容中至少有1種不相同者;該聲音合 成之方法係: σ 依y應η成之文字列一起輸入之指定作業轉換將單 語辭典、韻律辭典與波形辭典及單語變形規則; 根據單^形規則,將應合成之文字列作變形處理 使用轉換後之單語辭典、韻律辭典及波形辭典,將 對應於變形處理後之文字列的聲音訊息作合成處理 8·如申請專利範圍第7項之聲音合成方法,當 將多數至少包含有1個罝宏十^马 /匕3有1個早子之早語與其重音型態一 (收錄之早语辭典、將用以顯示相對於該單語辭血 所收錄單語之韻律的韻律範本資料中具代表性者力: ::錄之韻律辭典、及以收錄聲音作為合成單位之 :::料:加以收錄之波形辭典,且單語變形規則 方^文子列之變形規則者時,該處理聲音合成 万法係依以下步驟進行者: 2單語辭典或單語變形規則判定應合成文字列之 音型態; 〜< 依應合成文字列及重音型態, 律範本資料; 由明律辭典中選出 之韻律範本資料’由波形辭典中選出對應 本紙(210 X 297 公爱) 之 重 韻 於 I 523734 A8 B8 C8 D8 經濟部智慧財產局員工消費合作社印製 六、申請專利範圍 應合成文字列之各文字的波形資料;及 將該選出之波形資料相互加以連結。、 9 · 種聲音合成方法’係使用單語辭典、分別對應於 多數用以處理聲音合成之作業的韻律辭典與波形辭 典及單語變形規則,且該多數用以處理聲音合成之 作業並係於發話者或者發話時之感情、狀況中有任 一種不相同者;該聲音合成方法係: 依與應合成之文字列一起輸入之指定作業轉換韻律 辭典與波形辭典及單語變形規則; 根據單語變形規則,將應合成之文字列作變形處理 :及 使用單語辭典、轉換後之韻律辭典及波形辭典,將 對應於變形處理後之文字列的聲音m息作合成處理 0 10·如申請專利範圍第9項之聲音合成方法,當各辭典 為將多數至少包含有丨個單字之單語與其重音型、 一起收錄之單語辭典、將用以顯示相對於該&語 典所收錄單語之韻律的韻律範本資料中具代表性 加財錄之韻律辭典、及以收錄聲音作為合成單 之聲音資料而加以收錄之波形辭典, 、 i旱语變形 則為收錄文字列之變形規則者時, τ 邊處理聲音合 之方法係依以下步驟進行者: 由單語辭典或單語變形規則判定應合成文字 音型態; 1 木紙張尺度中關家鮮(c^4規格⑽χ挪公餐 態 者 位 規 成 之重 (請先閱讀背面之注意事項再本頁) .線. -27- 、申睛專利範圍 依應合成文子列及重音型態,由韻律辭典中選出韻 律範本資料; 依選出之韻律範本資料,由波形辭典中選出對應於 應合成文字列之各文字的波形資料;及 將該選擇之波形資料相互加以連結。v 11 ·種聲音合成裝置,係使用分別對應於多數用以處 理聲音合成之作業的單語辭典、韻律辭典及波形辭 典,且該多數用以處理聲音合成之作業並於發話者 或者發話時之感情、狀況或發話内容中至少有丨種不 相同者;該聲音合成裝置包含有·· 一轉換裝置,係可依與應合成之文字列一起輸入之 指定作業,轉換單語辭典、韻律辭典及波形辭典之 者;及 ' 一聲音合成處理裝置,係可使用轉換後之單語辭典 、韻律辭典及波形辭典,將對應於應合成之文字列 的聲音訊息作合成處理者。 12·如申請專利範圍第11項之聲音合成裝置,當各辭典 為將多數至少包含有丨個單字之單語與其重音型態 (收錄之單4辭典、將用以顯示相對於該單語辭 典所收錄單語之韻律的韻律範本資料中具代表性者 加=錄之韻律辭典、及以收錄聲音作為合成單位 之聲音資料而加以收錄之波形辭典時,該聲音合成 處理裝置係包含有: 重曰型恕判定裝置,係可由單語辭典判定應合成 523734經 濟 部 智 慧 財 產 局 員 工 消 費 合 作 社 印 製 人于乃n首型態者; 曰貝律乾本貝料選擇裝置’係可依應合成文字列万 重音型態,而由韻律辭典中選出韻律範本資料之力 法; 波形貝料選擇裝置,係可依選出之韻律範本資剩 ’而由波形辭典中選出對應於應合成文字列之各文 字的波形資料者;及 一波形資料連結裝置,係可將該選出之波形資料相 互加以連結者。 η.-種聲音合成裝置,係使时;情應於多數用以處 聲曰。成之作業的單語辭典、韻律辭典與波形辭 典及單語變形規則,且該多數用以處理聲音合成之 作業並於發話者或者發料之感情、狀況或發話内 容中至少有1種不相同者;該聲音合成裝置係包含有 -轉換裝置,係可依與應合成之文字列一起輸入之 指定作業轉換韻律辭典與波形辭典&單語變形規則 者; -變形處理裝置,係、可根據單語變形規則,將應合 成之文字列作變形處理者;及 -聲音合成處理裝置,係可使用單語辭典、轉換後 之韻律辭典及波形辭典,將對應於變形處理後之文 字列的聲音訊息作合成處理者。/ 如申請專利範圍第13項之聲音合成裝置,當各辭典 ----r 1^--------^---- (請先閱讀背面之注意事項再本頁) •I n n ϋ 訂· · 線· 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -29- ♦ 經濟部智慧財產局員工消費合作社印製 523734 A8 B8 C8 ——_____D8 六、申請專利範圍 為將多數至少包含有1個單字之單語與其重音型離 一起收錄之單語辭典'將用以顯示相對於該:語^ 典所收錄單語之韻律的韻律範本資料中具代表性者 加以收錄之韻律辭典、及以收錄聲音作為合成單位 之聲音資料而加以收錄之波形辭典,且單語變形規 則為收錄文字列之變形規則者時,該聲音合成方法 係包含有: 一重音型態判定裝置,係可由單語辭典或單語變形 規則判定應合成文字列之重音型態者; 一韻律範本資料選擇裝置,係可依應合成文字列及 重音型悲’由韻律辭典中選出韻律範本資料者; 一波形資料選擇裝置,係可依選出之韻律範本資料 ,由波形辭典中選出對應於應合成文字列之各文字 的波形資料者;及 一波形資料連結裝置,係可將該選擇之波形資料相 互加以連結者。 1 5· —種聲音合成裝置’係使用單語辭典、分別對應於 多數用以處理聲音合成之作業的韻律辭典與波形辭 典及單語變形規則,且該多數用以處理聲音合成之 作業並係於發話者或者發話時之感情、狀況中有任 一種不相同者;該聲音合成裝置係包含有: 一轉換裝置,係可依與應合成之文字列一起輸入之 指定作業轉換韻律辭典與波形辭典及單語變形規則 者; 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公髮 --------------裝--------訂---------線 (請先閱讀背面之注意事項再填寫本頁) -30- >23734 經濟部智慧財產局員工消費合作社印制π AS B8 CS ---DS __申請專利範圍 —變形處理裝置,係可根據單語變形規則,將應合 成之文字列作變形處理者;及 —聲音合成處理裝置,係可使用單語辭典、轉換後 =韻律辭典及波形辭典,將對應於變形處理後之文 予列的聲音訊息作合成處理者。y 16.如申請專利範圍第15項之聲音合成裝置,當各辭典 為將多數至少包含有i個單字之單語與其重音型態 —起收錄之單語辭典、將用以顯示相對於該單語辭 典所收錄單語之韻律的韻律範本資料中具代表性者 加以收錄之韻律辭典、及以收錄聲音作為合成單位 之名S >料而加以收錄之波形辭典,且單語變形規 則為收錄文字列之變形規則者時,該聲音合成裝置 係包含有: 一重音型態判定裝置,係可由單語辭典或單語變形 規則判定應合成文字列之重音型態者; 一韻律範本資料選擇裝置,係可依應合成文字列及 重音型態,由韻律辭典中選出韻律範本資料之方法 一波形資料選擇裝置,係可依選出之韻律範本資料 ,由波形辭典中選出對應於應合成文字列之各文字 的波形資料者;及 一波形資料連結裝置,係可將該選出之波形資料相 互加以連結之方法。 17 · —種記錄有聲音合成程式之電腦可讀取媒體,其特 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -31 一 (請先閱讀背面之注意事項再本頁) 裝 •線· :於:當電腦由該媒體讀出該程式時,可以電腦 為早語辭典、韻律辭典及波形辭典,以及作為轉 換裝置:聲音合成處理裝置,而產生作用者; =該單語辭典、韻律辭典及波形辭典係分別對應 Γ數用以處理聲音合成之作業,且該多數用以處 理聲音合成之作業並於發話者或者發話時之感情、 狀況或發話内容中至少有1種不相同者; =轉換裝置係、可依與應合成之文字列起輸入之指 疋作業’轉換單語辭典、韻律辭典及波形辭典者; 而’該聲音合成處理裝置係可使用轉換後之單語辭 典、韻律辭典及波形辭典’將對應於應合成之文字 列的聲音訊息作合成處理者。V 如申請專利範圍第17項之記錄有聲音合成程式之 電,可讀取媒體,當各辭典為將多數至少包含有^ 個早子之单語盘盆舌立剂能 . 早具重θ型態一起收錄之單語辭並、 將用以顯示相對於該單語辭典所㈣單語之韻律的 韻律範本資料中具代表性者加以收錄之韻律辭典、 及以收錄聲音作為合成單位之聲音資料而加以收錄 之波形辭典時,該聲音合成處理裝置係包含有: 一重音型態判定裝置,係可由單語辭典或單語變形 規則判定應合成文字列之重音型態者; 一韻㈣料範本選擇裝置,係可依應合成文字列及 重音型態,由韻律辭典中選出韻律範本資料者; 一波形資料選擇裝置,係可依選出之韻律範本資料 523734 C8 -- --~」8 —____ 六、申請專利範圍 ,由波形辭典中選出對應於應合成文字列之各文字 的波形資料者;及 -波形資料連結裝置,係可將該選出之波形資料相 互加以連結者。V 19. 一種記錄有聲音合成程式之電腦可讀取媒體,其特 徵在於:當電腦由該媒體讀出該程式時,可以電腦 作為單《口辭典、韻律辭典與波形辭典及單語變規則 ,以及作為轉換裝置、變形處理裂置、聲音合成處 理裝置,而產生作用者; 即,該單語辭典、韻律辭典與波形辭典及單語變形 規則係分別對應於多數用以處理聲音合成之作業, 且該多數里聲音合成之作業並於發話者或者 發活時之感情、狀況或發話内容中至少有丨種不相同 者; 該轉換裝置係可依與應合成之文字列一起輸入之指 定作業’轉換單語辭典、韻律辭典與波形辭典及單 語變形規則者; 經濟部智慧財產局員工消費合作社印製 (請先閱讀背面之注意事項再本頁) -I線- 該變形處理裝置係可根據單語變形規則,將應合成 之文字列作變形處理者; 而歧聲9合成處理裝置係可使用轉換後之單語辭 典、韻律辭典及波形辭典,將對應於應合成之文字 列的聲音訊息作合成處理者。v 20·如申請專利範圍第19項之記錄有聲音合成程式之 電腦可讀取媒體,當各辭典為將多數至少包含有1 ^氏張尺度適用中關家標準^^規格⑵Q χ 297 ------ -33- 523734申請專利範圍 II 經 濟 部 智 慧 財 產 局 消 費 合 社 印 個單字之單语與其重音型態—起收錄之單語辭典、 將用㈣示相對於該單語辭典所收錄單語之韻律的 韻律乾本貧料中具代表性者加以收錄之韻律辭典、 及以收錄聲音作為合成單位之聲音資料而加以㈣ 之波形辭典,且單語變形規則為收錄文字列之變形 規則者時,該聲音合成處理裝置係包含有: " -重音型態判定裝置,係可由單語辭典或單語變形 規則判定應合成文字列之重音型態者; -韻律,本資料選擇裝置’係可依應合成文字列 重音型態’由韻律辭典中選出韻律範本資料者; -波形資料選擇裝置’係可依選出之韻律範本資 ,由波料對應於應合成 的波形資料者;及 -波形資料連結裝置,係可將該選出之波形資料 互加以連結者。 γ 21\一種記錄有聲音合成程式之電腦可讀取媒體,其特 徵在:·當電腦由該媒體讀出該程式時,可以電 作為早語辭典、韻律辭典與波形辭典及單語變形巩 則’以及作為轉㈣置、變料理裝置 處理裝置’而產生作用者; σ成 即,該單語辭典、韻律辭典與波形辭典及單語 規則係分別對庫於V客金&田 A 丁應於夕數用以處理聲音合成之作 且該多數用以處理聲音合成之作業並係於發話 W時之二狀況”任,相同者; 本紙張尺度·中目目i鮮格1 及 料 字 腦 變形 業, 者或 --------------^--------訂---------線 (請先閱讀背面之注意事項再填寫本頁) 523734 A8 B8 C8 D8 申請專利範圍 互加以連結者 (請先閲讀背面之注意事項再填寫本頁) 裝— 、可| •線丨 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) -36-
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11205945A JP2001034282A (ja) | 1999-07-21 | 1999-07-21 | 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW523734B true TW523734B (en) | 2003-03-11 |
Family
ID=16515324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW089113028A TW523734B (en) | 1999-07-21 | 2000-06-30 | Speech synthesizing method, dictionary organizing method for speech synthesis, speech synthesis apparatus, and computer-readable medium recording speech synthesis program |
Country Status (7)
Country | Link |
---|---|
US (1) | US6826530B1 (zh) |
EP (1) | EP1071073A3 (zh) |
JP (1) | JP2001034282A (zh) |
KR (1) | KR100522889B1 (zh) |
CN (1) | CN1117344C (zh) |
HK (1) | HK1034129A1 (zh) |
TW (1) | TW523734B (zh) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002282543A (ja) * | 2000-12-28 | 2002-10-02 | Sony Computer Entertainment Inc | オブジェクトの音声処理プログラム、オブジェクトの音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体、プログラム実行装置、及びオブジェクトの音声処理方法 |
JP2002268699A (ja) * | 2001-03-09 | 2002-09-20 | Sony Corp | 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体 |
GB2380847A (en) * | 2001-10-10 | 2003-04-16 | Ncr Int Inc | Self-service terminal having a personality controller |
DE60215296T2 (de) * | 2002-03-15 | 2007-04-05 | Sony France S.A. | Verfahren und Vorrichtung zum Sprachsyntheseprogramm, Aufzeichnungsmedium, Verfahren und Vorrichtung zur Erzeugung einer Zwangsinformation und Robotereinrichtung |
CN1813285B (zh) * | 2003-06-05 | 2010-06-16 | 株式会社建伍 | 语音合成设备和方法 |
US8065157B2 (en) | 2005-05-30 | 2011-11-22 | Kyocera Corporation | Audio output apparatus, document reading method, and mobile terminal |
KR100644814B1 (ko) * | 2005-11-08 | 2006-11-14 | 한국전자통신연구원 | 발화 스타일 조절을 위한 운율모델 생성 방법 및 이를이용한 대화체 음성합성 장치 및 방법 |
US20070150281A1 (en) * | 2005-12-22 | 2007-06-28 | Hoff Todd M | Method and system for utilizing emotion to search content |
JP2007264466A (ja) | 2006-03-29 | 2007-10-11 | Canon Inc | 音声合成装置 |
KR100789223B1 (ko) * | 2006-06-02 | 2008-01-02 | 박상철 | 문자열 대응 사운드 발생 시스템 |
GB2443027B (en) | 2006-10-19 | 2009-04-01 | Sony Comp Entertainment Europe | Apparatus and method of audio processing |
KR100859532B1 (ko) * | 2006-11-06 | 2008-09-24 | 한국전자통신연구원 | 대응 문형 패턴 기반 자동통역 방법 및 장치 |
GB2447263B (en) * | 2007-03-05 | 2011-10-05 | Cereproc Ltd | Emotional speech synthesis |
JP5198046B2 (ja) | 2007-12-07 | 2013-05-15 | 株式会社東芝 | 音声処理装置及びそのプログラム |
CN101727904B (zh) * | 2008-10-31 | 2013-04-24 | 国际商业机器公司 | 语音翻译方法和装置 |
US8321225B1 (en) | 2008-11-14 | 2012-11-27 | Google Inc. | Generating prosodic contours for synthesized speech |
US8498866B2 (en) * | 2009-01-15 | 2013-07-30 | K-Nfb Reading Technology, Inc. | Systems and methods for multiple language document narration |
US10375534B2 (en) | 2010-12-22 | 2019-08-06 | Seyyer, Inc. | Video transmission and sharing over ultra-low bitrate wireless communication channel |
KR101203188B1 (ko) | 2011-04-14 | 2012-11-22 | 한국과학기술원 | 개인 운율 모델에 기반하여 감정 음성을 합성하기 위한 방법 및 장치 및 기록 매체 |
EP2705515A4 (en) * | 2011-05-06 | 2015-04-29 | Seyyer Inc | GENERATING VIDEO BASED ON TEXT |
JP2013072903A (ja) * | 2011-09-26 | 2013-04-22 | Toshiba Corp | 合成辞書作成装置および合成辞書作成方法 |
GB2501067B (en) | 2012-03-30 | 2014-12-03 | Toshiba Kk | A text to speech system |
US9368104B2 (en) * | 2012-04-30 | 2016-06-14 | Src, Inc. | System and method for synthesizing human speech using multiple speakers and context |
US9311913B2 (en) * | 2013-02-05 | 2016-04-12 | Nuance Communications, Inc. | Accuracy of text-to-speech synthesis |
GB2516965B (en) | 2013-08-08 | 2018-01-31 | Toshiba Res Europe Limited | Synthetic audiovisual storyteller |
KR102222122B1 (ko) * | 2014-01-21 | 2021-03-03 | 엘지전자 주식회사 | 감성음성 합성장치, 감성음성 합성장치의 동작방법, 및 이를 포함하는 이동 단말기 |
US10803850B2 (en) * | 2014-09-08 | 2020-10-13 | Microsoft Technology Licensing, Llc | Voice generation with predetermined emotion type |
JP2018155774A (ja) * | 2017-03-15 | 2018-10-04 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
US11443646B2 (en) | 2017-12-22 | 2022-09-13 | Fathom Technologies, LLC | E-Reader interface system with audio and highlighting synchronization for digital books |
US10671251B2 (en) | 2017-12-22 | 2020-06-02 | Arbordale Publishing, LLC | Interactive eReader interface generation based on synchronization of textual and audial descriptors |
CN113920983A (zh) * | 2021-10-25 | 2022-01-11 | 网易(杭州)网络有限公司 | 数据处理方法、装置、存储介质和电子装置 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4692941A (en) * | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
FR2636163B1 (fr) * | 1988-09-02 | 1991-07-05 | Hamon Christian | Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde |
JPH04350699A (ja) * | 1991-05-28 | 1992-12-04 | Sharp Corp | テキスト音声合成装置 |
US5384893A (en) * | 1992-09-23 | 1995-01-24 | Emerson & Stern Associates, Inc. | Method and apparatus for speech synthesis based on prosodic analysis |
SE500277C2 (sv) * | 1993-05-10 | 1994-05-24 | Televerket | Anordning för att öka talförståelsen vid översätttning av tal från ett första språk till ett andra språk |
US5860064A (en) * | 1993-05-13 | 1999-01-12 | Apple Computer, Inc. | Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system |
JP3397406B2 (ja) * | 1993-11-15 | 2003-04-14 | ソニー株式会社 | 音声合成装置及び音声合成方法 |
JP2770747B2 (ja) * | 1994-08-18 | 1998-07-02 | 日本電気株式会社 | 音声合成装置 |
JPH08328590A (ja) * | 1995-05-29 | 1996-12-13 | Sanyo Electric Co Ltd | 音声合成装置 |
JPH09171396A (ja) * | 1995-10-18 | 1997-06-30 | Baisera:Kk | 音声発生システム |
US5913193A (en) * | 1996-04-30 | 1999-06-15 | Microsoft Corporation | Method and system of runtime acoustic unit selection for speech synthesis |
JPH1097290A (ja) * | 1996-09-24 | 1998-04-14 | Sanyo Electric Co Ltd | 音声合成装置 |
JPH10153998A (ja) * | 1996-09-24 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置 |
US5905972A (en) | 1996-09-30 | 1999-05-18 | Microsoft Corporation | Prosodic databases holding fundamental frequency templates for use in speech synthesis |
US5966691A (en) * | 1997-04-29 | 1999-10-12 | Matsushita Electric Industrial Co., Ltd. | Message assembler using pseudo randomly chosen words in finite state slots |
JP3667950B2 (ja) * | 1997-09-16 | 2005-07-06 | 株式会社東芝 | ピッチパターン生成方法 |
JPH11231885A (ja) * | 1998-02-19 | 1999-08-27 | Fujitsu Ten Ltd | 音声合成装置 |
US6101470A (en) * | 1998-05-26 | 2000-08-08 | International Business Machines Corporation | Methods for generating pitch and duration contours in a text to speech system |
EP1138038B1 (en) * | 1998-11-13 | 2005-06-22 | Lernout & Hauspie Speech Products N.V. | Speech synthesis using concatenation of speech waveforms |
JP2000155594A (ja) * | 1998-11-19 | 2000-06-06 | Fujitsu Ten Ltd | 音声案内装置 |
US6144939A (en) * | 1998-11-25 | 2000-11-07 | Matsushita Electric Industrial Co., Ltd. | Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains |
JP2000206982A (ja) * | 1999-01-12 | 2000-07-28 | Toshiba Corp | 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体 |
US6202049B1 (en) * | 1999-03-09 | 2001-03-13 | Matsushita Electric Industrial Co., Ltd. | Identification of unit overlap regions for concatenative speech synthesis system |
US6185533B1 (en) * | 1999-03-15 | 2001-02-06 | Matsushita Electric Industrial Co., Ltd. | Generation and synthesis of prosody templates |
US6697780B1 (en) * | 1999-04-30 | 2004-02-24 | At&T Corp. | Method and apparatus for rapid acoustic unit selection from a large speech corpus |
US6505152B1 (en) * | 1999-09-03 | 2003-01-07 | Microsoft Corporation | Method and apparatus for using formant models in speech systems |
GB2376394B (en) * | 2001-06-04 | 2005-10-26 | Hewlett Packard Co | Speech synthesis apparatus and selection method |
-
1999
- 1999-07-21 JP JP11205945A patent/JP2001034282A/ja active Pending
-
2000
- 2000-06-30 TW TW089113028A patent/TW523734B/zh not_active IP Right Cessation
- 2000-07-19 KR KR10-2000-0041301A patent/KR100522889B1/ko not_active IP Right Cessation
- 2000-07-19 EP EP00115589A patent/EP1071073A3/en not_active Withdrawn
- 2000-07-21 CN CN00120198A patent/CN1117344C/zh not_active Expired - Fee Related
- 2000-07-21 US US09/621,544 patent/US6826530B1/en not_active Expired - Fee Related
-
2001
- 2001-06-29 HK HK01104509A patent/HK1034129A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN1282017A (zh) | 2001-01-31 |
CN1117344C (zh) | 2003-08-06 |
EP1071073A3 (en) | 2001-02-14 |
KR100522889B1 (ko) | 2005-10-19 |
HK1034129A1 (en) | 2001-11-09 |
US6826530B1 (en) | 2004-11-30 |
JP2001034282A (ja) | 2001-02-09 |
EP1071073A2 (en) | 2001-01-24 |
KR20010021104A (ko) | 2001-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW523734B (en) | Speech synthesizing method, dictionary organizing method for speech synthesis, speech synthesis apparatus, and computer-readable medium recording speech synthesis program | |
JP4363590B2 (ja) | 音声合成 | |
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
CN101156196A (zh) | 混合语音合成器、方法和使用 | |
JP7069386B1 (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
KR20110131768A (ko) | 발음기관 애니메이션 생성 장치 및 방법 | |
JPH08123455A (ja) | 音声合成方法及びシステム | |
CN110459201B (zh) | 一种产生新音色的语音合成方法 | |
Aida–Zade et al. | The main principles of text-to-speech synthesis system | |
JPH0950286A (ja) | 音声合成装置及びこれに使用する記録媒体 | |
JP2894447B2 (ja) | 複合音声単位を用いた音声合成装置 | |
CN113421544B (zh) | 歌声合成方法、装置、计算机设备及存储介质 | |
JP5471138B2 (ja) | 音素符号変換装置および音声合成装置 | |
Madaminjonov | Formation of a Speech Database in the Karakalpak Language for Speech Synthesis Systems | |
Mamatov et al. | Formation of a Speech Database in the Karakalpak Language for Speech Synthesis Systems | |
Khudoyberdiev | The Algorithms of Tajik Speech Synthesis by Syllable | |
CN113178185A (zh) | 基于转音音符处理方法的歌唱合成方法及系统 | |
Narvani et al. | Study of Text-to-Speech (TTS) Conversion for Indic Languages | |
Narvani et al. | Text-to-Speech Conversion Using Concatenative Approach for Gujarati Language | |
Kambali et al. | Real Time Voice Cloning System | |
KR20220125005A (ko) | 화자 적합성이 향상된 음성합성 모델 생성방법 | |
JP2023121372A (ja) | データ処理装置、データ処理方法及びプログラム | |
Kaur et al. | Generation of Expressive Speech for Punjabi | |
JP2003084788A (ja) | 音声合成方法および音声合成装置ならびに音声合成処理プログラムを記録した記録媒体 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |