TW523733B - Speech synthesizing method, speech synthesis apparatus and computer-readable medium recording speech synthesis program - Google Patents

Speech synthesizing method, speech synthesis apparatus and computer-readable medium recording speech synthesis program Download PDF

Info

Publication number
TW523733B
TW523733B TW089113027A TW89113027A TW523733B TW 523733 B TW523733 B TW 523733B TW 089113027 A TW089113027 A TW 089113027A TW 89113027 A TW89113027 A TW 89113027A TW 523733 B TW523733 B TW 523733B
Authority
TW
Taiwan
Prior art keywords
pattern data
prosody
data
character string
text
Prior art date
Application number
TW089113027A
Other languages
English (en)
Inventor
Osamu Kasai
Toshiyuki Mizoguchi
Original Assignee
Konami Co Ltd
Konami Comp Entertainment
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konami Co Ltd, Konami Comp Entertainment filed Critical Konami Co Ltd
Application granted granted Critical
Publication of TW523733B publication Critical patent/TW523733B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/60Methods for processing data by generating or executing the game program
    • A63F2300/6063Methods for processing data by generating or executing the game program for sound processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

^ / ^ / A7
經濟部智慧財產局工消費合作社印:裝
本紙張尺度適巧中國國家標準(CNS 【發明之領域】 本發明係有關於一種聲音合成方法、聲音合成裝置及 s己錄有聲音合成程式之電腦可讀取媒體之改良。 【習知技術之說明】 设今由機械輸出各種聲音訊息(人語)之方法,有一 預先記憶與構成聲音訊息之各種單詞對應之合成單位的聲 音資料,再依照任意輸入之文字列(原文)而將該聲音資 料組合後輸出者,即所謂的聲音合成法。 此等聲音合成法通常係先將與日常所使用之各種單詞 (文字列)對應之發音記號等音韻情報及重音、語調、振 幅=韻律情報收錄於辭典中。其次,構造成可解析輸入之 文Γ列右辭典中有收錄同一文字列,則根據該資訊將合 成早位之聲音資料組合後輪出,若辭典中未收錄同一文字 歹!則由輸入之文字列依預先制定的規則而作成該等資 訊,再依之將合成單位之聲音資料組合後輸出。 然而,該習知之聲音合成法則具有一問題,即遇到辭 典中未登錄輸入之文字列時,將未必能作成與實際的聲音 訊息對應的資訊’尤其是韻律資訊’結果將形成不自然或 語意與印象迥異的聲音。 【發明之概要】 本發明之目的在提供-種可高度吸收任意輸入之文字 列與辭典所收錄之文字列間之差異而可合成自然聲音之聲 音合成方法、聲音合成裝置及記錄有聲音合成程式之電腦 可讀取媒體。 A4規格 '公優
-4- 奶733 經濟部智慧时產¾¾工消費合作社印製 五、發明説明(2 ) 為達成上述目的,本發明乃提出—種聲音合成方法, 该方法係詩製作與輸人之文字列相對應之聲音訊息資奉 者,該方法使用三種辭典,包含··—單詞辭典,係同時收 錄有許多至少含有1個文字之文字列與其重音型態者:一韻 律辭典,係收錄有用以顯示與該單詞辭典所收錄之文字列 之韻律資訊的韻律模式請中具代表性的韻律模式 、;&波$辭典,係收錄有以收錄之聲音作為人 成單位之聲音波形資料者^,先決定輸人之文字列㈣ $型態,再根據輸人之文字列與重音型態而自該韻律辭典 中選出韻律料賴,當㈣出之韻律模式㈣的文字列 ”輸入之文子列不_致時’則使該韻律模式資料之韻律資 T配合輸入之文字列而變形之,然後根據韻律模式資料而 =形辭典中選出與輸入文字列中之各文字相對應的波 7貝料,再將選出之波形資料加以連結。 藉由本發明,即使辭典未登錄輸入之文字列,亦可利 …玄文子列相近之韻律模式資料,並使該韻律資訊配合 輸入之文字列而轡形夕 ^ , 成自然的聲音。而依此選出波形資料,所以能合 在本發明中,藉下列程序可進行韻律模式資料之選 q先使用仪錄有内含文字列、短音數、重音型態及音 I::之♦律椒式資料的韻律辭典,先作成輸人文字列之 曰:貝Λ ’然後將與輸人文字列之短音數及重音型態一致 之韻律模式資料自該韻律辭典中抽出,而以之為 資料,再就各候選韻律模式資料之音節資訊與輸入文字列 裝------、玎! (謂先閱讀背面之注意事項、再填寫本頁) 線 I I f I · .1 -I 1- - 1 II - ti- -I · -5- A7 、 B7 經濟部智慧財產局a(工消費合作社印製 發明説明( =節資訊相比較’而分別作成韻律復 各候選韻律模式資料之文進而《 適的韻律模式資料。 資訊而選擇以 音二律模式資料中’若有-與輸入文字心 h王-致時’則以之為最合適之韻 :::入文字列之音素完全-致時,則以候選韻律模:, =料人文字列之音素—致之音素數最多者為最合= =式責料’當有多個候選者具有最多-致之音素类 以其中連續且—致之音素數最多者為最合適之韻揮 …枓。藉此,乃可選出含有與輸入文字列相同位置之 t目同曰素’即,可直接利用之音素(下面以復原音素稱之 取多且連續之韻律模式資料,而能合成更自㈣聲音。 次又,韻律模式資料之變形則藉由當該選出之韻律模式 資:之文字列與輸入文字列不一致時,就該韻律模式資料 中每個不&之文字,由事S針對所有將使用於聲音合成 之文子所求出之平均音節長及該韻律模式資料中之音節 長求取其變形後之音節長,而可使選出之韻律模式資料 之韻律資訊配合輸入文字列而變形之,進而能合成自秋的 聲音。 另,波形資料之選擇則藉由在構成輸入文字列之各音 素中,就復原音素自波形辭典中選出韻律模式資料中相當 音素之波形資料,而其他音素則由對應之音素中,自波形 辭典遠出與韻律模式資料頻率最相近之音素的波形資料, 而可選出與變形後之韻律模式資料最相近之波形資料,進 (讀先閱讀背面之注意事項再填寫本頁) 訂 本紙浪尺度適用中國國家標準(CNS ) A4規格(2丨Ο X 297公麓) -6- A7 \ 發明説明( B7 而能合成與語意相近又自然的聲音。 又,為達成上述目的,本發明乃提出 置,該裝置係用於製作盥於A夕合+ μ 卓曰。成裝 表作與輪入之文字列相對應之聲音1自 :…,包含有…單詞辭典,係同時收錄有二;、 KM子之文字列與其重音型g者一韻律辭典,传 =有用以顯示與該單簡典所收錄之文0 胃 律貧訊的韻律模式資料中具代表性的韻律模式資料者· =辭典,係收錄有以收錄之聲音作為合 开:資料者;-重音型態決定裝置,係用以決定輪人^字 ==型態者;一韻律模式選擇震置,係可根據輸入之 + 型態而自”律辭典中選出韻律模式資料 考,一韻律變形裝置,俜可 ^ 於该選出之韻律模式資料的文 子列與輸入之文字列不一致時 資1舶人^ 使該日貝律杈式資料之韻律 貝汛配合輸入之文字列而變形者 舻诚如&1 波形選擇裝置,係可 根據日貝律模式資料而自該波 厅一甲選出與輸入文字列中 之各文字相對應的波形資料者; 一 m Vi u - 波形連結裝置,係 將k出之波形資料加以連結者。 經濟部智慧財產局Μ工消費合作社印製 又’如上所述之聲音合成梦罢一 人 成裝置亦可稭一種記錄有聲音 口成耘式之電腦可讀取媒體而得 于以貫現,该記錄有聲音合 战%式之電腦可讀取媒體於 腦路姑 靖亥程式後,可使該電 月包發揮下列裝置之功能,該等 Μ置包含:-單詞辭典,係 冋時收錄有許多至少含有i個文 又子之文子列與其重音型態 韻律辭典’係收錄有用以顯示與該單詞辭典所收錄 子列相對狀韻律:纽的韻_式資料中具代表性的 本紙張尺度適用cns )八4規格(
、發明説明( 音貝律模式資料者;一波形辭典,係收錄有以收錄之聲音作 為合成單位之聲音波形資料者;一重音型態決定裝置,係 用以決定輸入之文字列的重音型態者;一韻律模式選擇裝 置,係可根據輸入之文字列與重音型態而自該韻律辭典中 選出韻律模式資料者;一韻律變形裝置,係可於該選出之 韻律模式資料的文字列與輸入之文字列不一致時,使該韻 律拉式貧料之韻律資訊配合輸入之文字列而變形者;一波 形選擇裝置,係可根據韻律模式資料而自該波形辭典中選 出與輸入文字列中之各文字相對應的波形資料者;及,一 波形連結裝置,係用以將選出之波形資料加以連結者。 本發明之上述目的與其他之目的、特徵和優點,將可 由以下之說明與附圖清楚了解。 【圖式之簡單說明】 第1圖為顯示本發明之聲音合成方法之整體流程圖。 第2圖顯示韻律辭典之一例。 第3圖為顯示韻律模式選擇處理細節之流程圖。 第4圖顯示具體的韻律模式選擇處理之樣態。 第5圖為顯示韻律變形處理細節之流程圖。 第6圖顯示具體的韻律變形樣態之一例。 第7圖為顯示波形選擇處理細節之流程圖。 第8圖顯示具體的波形選擇處理樣態之一例。 第9圖顯示具體的波形選擇處理樣態之一例。 第丨〇圖為顯示波形連結處理細節之流程圖。 第11圖為本發明之聲音合成裝置之機能方塊圖。 本纸張尺度適用中晒家標準(CNS丨 2f先閱讀背面之注意事項再填寫本頁) % 、-=口 經濟部智慧產^7工消費合作社印製 -8· W3733
經濟部智慧財產局Μ工消費合作社印製 L奉發明之較佳實施樣態】 第1圖顯不本發明^«馨立人# , —知β之耷e合成方法之整體流程。 、首,’由μ圖示之輸人方法或遊戲系統等輸入欲名 成之文字列後’根據單詞辭典等以決定其重音型態(⑴ 此處之單詞辭典係同時收錄有許多至少含有i個文字之夕 字列與其重音型態者’舉例言之,可同時收錄有許多代肩 可能輸入之遊戲者角色名字(但,此處則在實際的名字之 後加上了「窟恩」〈即曰文之敬稱『君』之發音”之單 詞與其重音型態。 具體的決定方式料比較輸人文字列與單詞辭典所收 錄=單詞,若有相同之單詞則採用其重音型態,若無相同 之單詞,則在相同短音數之單詞中採用含有近似文字列之 單詞的重音型態。 進而,亦可設計成在無相同之單詞時,操作者(遊戲 者)等可由與輸入文字列相同短音數之單詞之所有可能的 重音型態中,經未予圖示之輸入方法任意加以選擇、決定 合適者。 …、後’根據輸入文字列與重音型態而由韻律辭典中選 出曰貝律拉式貝# ( s2 )。此處之韻律辭典係收錄有用以顯 矿…亥單韻典所收錄之單詞相對照之韻律資訊的韻律模 式資料中具代表性的韻律模式資料者。 、 人,s選出之韻律模式資料之文字列與輸入文字列 不致時,則使該韻律模式資料之韻律資訊配合輸入文字 列而變形之。 本紙張尺度適用中國國家標準(CNS ) Λ4規格(21〇-
-9- 523733 A7 五、發明説明( 接著’根據變形後之韻律模式資料(又,由於 曰貝律杈式資料之文字 、、 于幻”翰入文子列一致時將不 此使變形後之韻律模式資 〃因 律模式資料。)由波㈣並=包3有未經變形之韻 寸波形辭典中選出與輸入文 對應之波形資料(s4 ) ,, 各文-r 技^ 、()。此處之波形辭典係指收錄有以收 錄之聲音料合成單位 _有以收 則收靜右以羽a 反形貝科者,本實施樣態中 素:一知的vcv音素方式儲存之聲音波形資料(音 聲音該等選出之波形資料連結(s5)而作成合成 以下詳述韻律模式選擇處理之相關細節。 第^圖顯示韻律辭典之一例,其收錄有眾多包含文字 盘單,… 及曰即資訊之韻律模式資料,即, ::術所收錄之眾多文字列相對照之許多且代表性的 韻律模式資料。此處之立伙次… 夕八代表f生的 盆炎立 曰即資訊係由下列二者所構成者, 其成者 於c、v、N,、。,τ 專成文子列之各文字是相當 W 及#(。:子音+母音;V:母音,·Ν,·· 濟 部 智 慧 財 產 局 Μ X 消 費 合 作 社 印 製 曰’ Q ·促音;L :長音;# ··無聲音)之何種者另一 用以表示構成文字列〜 〈阿〉··〗]〈伊 ;表J用心虎之第幾號“ 5,ΚΑ〈卡〉者二〉:4’〇〈喔〉: (但,第2圖中 韻律辭典巾每—份韻律 各音素之頻率、音#、一際上皆具備其構造中 曰即長等洋細資訊,但圖中已予以
297公釐) ^纸張尺度適;( -10-
省略。 經濟部智慧財產局8工消費合作社印製 第3圖為韻律模式選擇處理之詳細流程圖,第4圖顯开 具體的韻律模式選擇處理樣態之—例,以下將詳細說明之< 首先,作成輸入文字列之音節資訊(s2〇l)。且體來 說’其係將以平假名表記之文字列藉前述之ASJ表記法化 為羅馬拼音(以羅馬字母表記之表音文字化),並作成上 述由音節種類及音節號碼所構成之音節資訊。舉例言之, 如第4圖所示,文字列為「卡沙伊窟恩」時,可將之化成羅 馬拼音如「kaSaikun,」,進而作成由音節種類「ccvCN, 及音節號碼…⑴^^所構成之音節資訊。 其-人,作成與輸入文字列對應之VCV音素列(s202 )=藉vcv音素單位檢視復原音素個數。舉例言之,上述之 「卡沙伊窟恩」將變成「kaasaaiikuun」。 另方面,僅由韻律辭典所收錄之韻律模式資料中抽 出與輪入文字列之重音型態及短音數-致者,並以之為候 選韻律模式資料(_。舉例言之,在第2、第4圖Γ的 :子則為「卡馬伊窟恩」、「沙沙伊窟恩」、「西沙伊窟 然後,逐-比較各候選韻律模式資料之音節資訊血輪 入文字列之音節資訊,而作成韻律復原資訊(s2〇4)。且 體而言,係將候選韻律模式資料與輸入文字列之 : 逐字比較’若子音及母音皆—致則令為「u」,子^ ^母音-致時則令為「G1」,子音—致而母音不^料 ’、’、10」’子音及母音皆不同時則令為「〇〇」,授以該 (請先閱讀背面之注意事項再填寫本頁) m II I- i 1 - - · ------批衣· 、--口 線 ^張尺度適M4規洛 -11- 五 、發明説明(
資訊後進而以VCV單位加以區隔。 舉例0之在第2、第4圖的例子中’比較資訊中之「卡 馬伊窟恩」為「1101111111」,「沙沙伊窟恩」為「01 11 11 11 llj ’「西沙伊窟恩」則為「00 11 η 11 11」, 而音貝律復原資訊中之「卡馬伊窟恩」4「11 101 ill ill
Ul」’「沙沙伊窟恩」為「01111 111 111 111」,「西 沙伊窟恩」則為「00 oil ill ill 1U」。 接著由、各候選韻律模式資料中選出其中之一 一士曰)檢查其音素與輸入文字列之音素以VCV單位表 丁:疋否5夂’即’檢查上述之韻律復原資訊是否為「1 1」 5 u」(s206 )。於此,若音素完全一致,則以之為最 合適的韻律模式資料(s207)。 彳面’右其中含有不完全一致之音素,則比較以 單位表示時—致之音素數1,比較上述之韻律復原 ^ llj或「U1」之個數(初期值為0) ( s208 ), :為取大值’貝|丨以該模式為候選最適合韻律模式資料 :209 )。進而,再比較以vcv單位表示時一致的音素之 連、、:個數,即,比較上述之韻律復原資訊中「n」S「⑴」 :續個數(初期值為0) (s21〇),若為最大值,則以該 、式為候選最適合韻律模式資料(s2u)。 f 、所有的候選韻律模式資料反覆進行以上之處理 二,,當有音素完全-致者或-致的音素數最多者, 辛二個候選者具有最多_致之音素數時,則以_致之音 ’、1個數最多者為最適合的韻律模式資料。
國家檩準(CNS (讀先閱讀背面之注意事項再填寫本頁) 訂 經濟部智慧財產局Μ工消費合作社印製 本紙張尺度適用中國 -12-
、發明説明(10) 經 濟 部 智 慧 財 產 局 工 消 費 合 作 社 印 製 以上述第2、第4圖之例言之,文字列並無與輸入文字 歹J相同之杈式,而一致之音素數在「卡馬伊窟恩」為4,「沙 沙伊窟恩」為4,「西沙伊窟恩」為3,但一致之音素連續 個數在卡馬伊窟恩」為3,「沙沙伊窟恩」Μ為4,因此 λ /y沙伊窟恩」為最適合的韻律模式資料。 以下詳述韻律變形處理之相關細節。 第5圖為韻律變形處理之詳細流程圖,第6圖顯示具體 的音貝律變形樣態之一例,以下將詳細說明之ς 一首先,由以如上之程序選出之韻律模式資料及輸入文 子列之首字開始逐一選出1個文字(S301),此時,文字若 一致(S3〇2),則依此反覆選擇下個文字(S303 )。當文 =不致時,則以如下之程序求出與韻律模式資料中的文 子^應之變形後的音節長,χ,應實際需要可求出變形後 曰畺以改寫韻律模式資料(s304、s305 )。 之榼式 > 料中之音節長為χ,與模式資料之文字相對應 平均曰即長為X’,變形後之音節長為y,與變形後之文字 相對應之平均音節長為,時,可由以下公式求得變形後之 音節長。 y,’x (χ/χ,) 又平均音節長係預先就各文字逐一求出並列為記錄者。 辱"圖”、、員示例,该例中之輸入文字列為「沙卡伊窟 :, t出之韻律模式資料則為「卡沙伊窟恩」,當使 音貝律模式資料中之文字「卡」配合輸人文
而變形拄 — ^ ^ y J 、,右文字「卡」之平均音節長為「2而文字 二】0 X 297公t ---------扯衣------1T------^ (讀先閱讀背面之注意事項再填寫本頁) -13- ^733 A7 五、發明説明(11 ) ^」之平均音節長為Γ 25」,則變形後「沙」之音節長 為: 「沙」之音節長==「沙」之平均x (「卡」之音節長/ 「卡」之平均) "25x ( 20/22 ) 与23 同樣地,使韻律模式資料中之文字「沙」配合輸入文 字列中之文字「卡」而變形時,變形後「卡」之音節長則 為: 「卡」之音節長=「卡」之平均x (「沙」之音節長/ 「沙」之平均) ^22χ ( 30/25 ) 与26 又,就音量而言亦可以與計算音節長同樣之算式求取並變 形之,或亦可直接使用韻律模式資料中之值。 就韻律模式中全部的文字反覆進#以上處理後,再轉 換成音素(vcv)資訊(s306 ),並作成各音素之連結資 訊(s307) 〇 田上述之輸入文字列為「沙卡伊窟恩」,而選出 之韻律模式為「卡沙伊窟恩」時,因「伊」、「窟」、「恩」 等3文子其位置及音素_致’故為可直接利用之音素(復原 音素)。 以下詳述波形選擇處理之相關細節。 第7圖為顯示波形選擇處理細節之流程圖,以下將詳細 本紙張尺度適用中國國家標準(CNS ) A4規格 (讀先閱讀背面之注意事項再填寫本頁} 經濟部智慧財羞^員工消費合作社印製
In til n^—
I 1 - I -14- 523733 A7 B7 五、發明説明(12 ) 經 濟 部 智 慧 財 產 消 費 合 社 印 製 說明之。 首先,由構成輸入文字列之音素之首開始逐一選出i 個音素(s401),若其為上述之復原音素(s4〇2),則由 波形辭典選出以如上之程序選出並予以變形之韻律模式資 料中之相當音素的波形資料(s4〇3)。 又,其若非復原音素,則將具有波形辭典中相同區隔 記號之音素選出以為候選者(s4〇4),並算出與變形後之 韻律模式中之相當音素間頻率之差(s4〇5)。此時,就包 含2個V(1間之音素則將重音型態亦考慮在内,逐_算出各 個V區間之頻率差之和。對全部的候選者反覆進行如上之 权序(S406 )後,由波形辭典中選出差(或差之和)最小 之候選音素的波形資料(s407 )。另,此時,補助性 地參照候選音素之音量,並崎騎極小值者等處理。 對構成輸入文字列之所有音素反覆進行以上之處理 (s408 ) 〇 第8、第9圖顯示具體的波形選擇處理樣態之一例,此 處顯示了構成輸人文字列「沙卡伊窟恩」〇^音素「 -心1"11111」巾’非復原音素「〜、「aka」^別變 ^之韻律模式資料中相當音素之鮮及音量值,以及候 音素之頻率及音量值。 具體而言’在第8圖中係顯示了變形後之韻律模式 中音素「sa」之頻率「450」及音量值「1〇〇〇」,以i 之3個候選音素「sa·001」、「-〇〇2」、「sa_〇〇3 率「物」、「500」、「400」及音量值「_」、「⑻〇 sa 資料 此處 之頻 i衣 訂 線 (請先閱讀背面之注意事項再填寫本頁) 45· 經濟部智慧財產局8工消費合作社印製 523733 A7 ~_____ B7__ 五、發明説明(13 ) — 「950」。此時,頻率為「440」而最接近之候選音素r sa_〇〇 i」 將被選擇。 又,第9圖中則顯示了變形後之韻律模式資料中音素 「aka」之V區間1之頻率「450」及音量值「1〇〇〇」與v區 間2之頻率「400」及音量值「800」,以及此處之2個候選 音素「aka-001」「aka-002」之V區間1之頻率「4〇〇」、「460」 及音量值「1000」、「800」,與V區間2之頻率「450」、 「410」及音量值「800」「1〇〇〇」。此時,v區間1與V區 間2各別之頻率差之和(以候選音素raka_〇〇1」而言,為 | 450 — 400 | + I 400 — 450 I = 100,而以候選音素 「aka-002」而言,為 | 450— 460 | + | 400— 410 | =20) 最小之候選音素「aka-002」將被選擇。 第10圖為顯示波形連結處理細節之流程圖,以下將詳 細說明之。 首先,由以如上之程序選出之音素波形資料之首開始 逐一選出1波形資料(s501 )’並設定其候選連結位置 (s5〇2),此時,若連結可復原(s5〇3),則根據復原連 結資訊加以連結(s504)。 另,若連結無法復原,則可先判定其音節長(s5〇5 ), 依之而循各種連結方法(母音區間連結、長音連結、無聲 化音節連結、促音連結、撥音連結)加以連結(s506 )。 對所有音素之波形資料反覆進行以上之處理(s5〇7) 而作成合成聲音資料。 第Η圖為本發明之聲音合成裝置之機能方塊圖,圖
本,.我張尺度適知中國國家標準(as )八4規格(2|〇 X 2Q7^tT (讀先閱讀背面之注意事項再填寫本頁}
-16- 523733 五、發明説明( ’早㈣典,12為韻律辭典,13為波形辭並, 重音型態決^裝置,15為韻律模式選擇裝置,16為立員" 形裝置’ η為波形選擇裝置,18為波形連結裝置。θ -單詞辭典11同時收錄有眾多至少含有丄個文字 列與其重音型態…韻律辭典_收錄有許多包含文字 列、短音數、重音型態及音節資% 即貝讯之韻律模式資料,及盘 該單詞辭典丨丨所收錄之眾多 >、 乂子歹J相對應之具代表性的韻 律模式資料。另,波形辭典13則收 則收錄有以收錄之聲音作為 合成早位之聲音波形資料。 重音型態決定裝置14係用以進行下列處理,即,比較 由輸入裝置或遊戲系統等輸人之文字列與單詞辭典^所收 錄之單詞,·若有相同之單詞, J則以其重音型態為該文字列 之重音型態’若無相同之單詞,則在相同短音數之單詞中, 二含有近似文字狀單詞的重音型態為該文字狀重音型 態0 f詩先閱讀背面之注意事項再填寫本頁) -裝·
、1T
經濟部智慧財產局員工消費合作社印製 ㈣棋式選擇裝置15則係、用以進行下列處理,即, 作成輸人文字狀音節資訊’然後將與輸人文字列之兔 數及重音型態-致之韻律模式資料自該韻律辭典Μ 出’而以之為候選韻律資料,再就各候選韻律模式資取 音節資訊與輸人文字列之音節資訊相比較’而分別作成 律復原資訊’進而根據各候選韻律模式㈣之文字列及 律復原資訊而選擇最合適的韻律模式資料。 韻律變形裝置16係用以進行以下處理,即,當該選 之韻律模式資料之文字_輸人文字⑽—致時 本紙張尺度適用中國國家標準(CNS ) A4規格-' 線 -17-

Claims (1)

  1. 申明專利乾圍 經濟部智慧財產局員工消費合作社印製 h —種聲音合成方 應之聲音訊息資料者\用於製作與輸入之文字列相對 -單詞辭/ 法係❹三種辭典,包含: 字列與其重時者收錄有許多至少含有1個文字之文 ==:錄有用以顯示與該單詞辭典所收錄之 的韻律模式:;料:律:訊的韻律模式資料中具代表性 收錄有以收錄之聲音作為合成單位之聲 字列1^立輸入^文字列的重音型態,再根據輸入之 音型態而自該韻律辭典中選出韻律模式 y、、一 Z、出之4律模式資料的文字列與輸入之文字 不二致時,較該韻律模m财資減合輸入〜 :歹丨而4之’然後根據韻律模式資料而自該波形辭 選出”輸入文字列中之各文字相對應的波形資 ;斗’再將選出之波形資料加以連結者。 2·如申請專利範圍第i項之聲音合成方法,該方法係使 用收錄有内含文字列、短音數、重音型態及音節資訊 =律模式資料的韻律辭典,先作成輸人文字列之音 節貝爪,然後將與輸入文字列之短音數及重音型態一 致之明律核式貢料自該韻律辭典中抽出,而以之為候 選韻律資料,再就各候選韻律模式資料之音節資訊與 輸入文字列之音節資訊相比較,而分別作成韻律復原 二貝λ進而根據各候選韻律模式資料之文字列及韻律 請 先 閱 讀 背 面 之 注 意 事 項 再 I 文 資 列 之 訂 線 297公釐) •19- 圍 '申請專利範 3.如申过袁夭丨擇取5適的韻律模式資料。 申-專利範圍第2項之聲 =模式資料中’若有—與輸人文字列之= 八:字I”之為最合適之韻律模式資料,若 文子列之音素完全 …、~與4 中與輸入文字列之音素—致之模物 之韻律模式資料’當有多個候選二為最合3 素數時,則以其中連搞日^ 八取夕一致之省 適之韻律料轉狀音餘心者為最合 二申吻專利範圍第〗項之聲音合 韻律模式資料之文字列與輸入文字列 1選出之 就該韻律模式資料中\則將 所有將使用於聲音合成之^ 文子由事先針對 該韻律模式資料中之立r ^所求出之平均音節長及 “申請專利範圍…之長聲 於人合—, 、苯9 口成方法,其係在構成 2子歹1之各音素中’就與韻律模式資料位置及音 經濟部智慧財產局員工消費合作社印製 素一致者_,自波形辭典中選出韻律模式資料中相當音 素之波七貝料,至於其他音素,則由對應之音素中, 自波形辭典選出與韻律模式資料頻率最相近之音素的 波形資料。、 種牮曰口成裝置’係用於製作與輸入之文字列相對 應之聲音訊息資料者,包含有: 一早詞辭典’係同時收錄有許多至少含有1個文字之文 字列與其重音型態者;
    -20- 523733 §S8
    請 先 閱 讀 背 面 之 注 意 事 項 再
    -21-
    經濟部智慧財產局員工消費合作社印製 據各候選韻律模式資 〜曰貝律復原資訊,進而相 擇最合適的韻律模式資料者文子列及韻律復原資訊而ϋ 8·如申請專利範圍第7項之聲音合 _式_,若有一與輪:之!=選 致時’則以之為最合適之二 入文字列之音素完全— 纟無一與輸 中與輸人文㈣之▲ ,、1 μ仙律模式資料 之韻律模式資料二二ΓΓ音素數最多者為最合適 妄叙士 Θ有夕個候選者具有最多一致之立 素數b,則以其中連續且_致之曰 適之韻律模式資料。 曰” ^為最合 9·^ = =圍”項之聲音合成以,其係具有一 爻“’係當该選出之韻律模4資料之文字列 ;、輸入文字列不一致時,用以就該韻律模式資料中每 不;:致之文字丄由事先針對所有將使用於聲音合成 $文子所求出之平均音節長及該韻律模式資料中之音 節長,求取其變形後之音節長者。 曰 1〇·如申請專利範圍第6項之聲音合成裝置,其係具有一 波形選擇裝置’係可在構成輸人文字列之各音素中, 就與韻律模式資料位置及音素一致者,自波形辭典中 選出韻律模式資料中相當音素之波形資料,至於其他 音=則由對應之音素中,自波形辭典選出與韻律模 式資料頻率最相近之音素的波形資料者。 U· 一種記錄有聲音合成程叙電料讀取㈣,係於電 本紙張Τ關家標準(冗 S)A4 規格(210 x 297 公釐)
    -22- /、申5月專利範圍 經濟部智慧財產局員工消費合作社印製
    ¥中國國家標準(CNS)A4規格(210 腦讀取該程式後, 者,該等裝置包含:下列裝置之功能 單#司辭典,係同時收 字列與其重音型態者;、、……、有1個文字之文 係收錄有用以顯示與該單詞辭典所收錄之 的:=:”訊的_式資料…表性 收錄有以收錄之聲音作為合成單位之聲 ::型態決定裝置’係用以決定輸入之文字列的重音 模式選《置’係可根據輸入之文字列與重音型 L而自該韻律辭典中選出韻律模式資料者· 一韻律變形裝置,係可於該選出之韻律模«料的文字 =與輸入之文字列不_致時’使該韻律模式資料之韻律 負汛配合輸入之文字列而變形者,· 一波形選擇裝置’係可根據韻律模式資料而自該波形辭 =出與輸入文字列中之各文字相對應的波形資料 =波形連結裝置,係、用以將選出之波形資料加以連結 如申請專利範圍第U項之記錄有聲音合成程式之電腦 可讀取媒體’其係可使電腦發揮下列裝置之功能者, 該等裝置包含: X 297公釐) 523733 六、申清專利乾圍 Φ 明律辭典,係收錄有内含文字列、短音數、重音型雖 及音節資訊之韻律模式資料者; 〜 ;明律权式選擇裝置,係可先作成輸人文字列之音節資 ^ =將與輪人文字狀短音數及重音型態_致之韻 式貝料自該韻律辭典中抽出,而以之為候選韻律 料再就各候選韻律模式資料之音節資訊與輸入文字 =節資訊相比較,而分別作成韻律復原資訊,進而 ^ 大貝枓之文子列及韻律復原資訊而 擇取a適的韻律模式資料者。 13.如申請專利範圍第12項之記錄有聲 =讀取_,其中之候選韻律模„料中,二二 二文:列之音素完全一致時’則以之為最合適之韻 士Μ式貝料’若無_與輸人文字列之音素 時,則以候選立|德扠4欠 、王致 鼓夕立.式資料中與輪入文字列之音素一 個位曰、數取多者為最合適之韻律模式資料,專有 個候選者具有最多—致之立 田有 _致之音素數最多者為最二、 以其中連續 14…“ 最合適之韻律模式資料。 •可 Μ範圍第U項之記錄有聲音合成程式之電 。貝媒體,其係可使電腦發揮韻律 能,而該韻律變^置之 之文字列與輸入文字列不^選出之韻律模式資却 資料中每個不一致之文ΓΓ1以就該韻律⑸ 聲音合成之文字所:::平:::::所有將使用 料中之音節長,“㈣==韻律模式 資 列 根 選 腦 多 且 :m 功 料 本紙張尺度剌巾關家鮮^ x 297公釐) 523733 AS BB C8 DS 申請專利範圍 15 ·如申请專利範圍第11項之§己錄有聲音合成程式之電腦 可讀取媒體,其係具有一波形選擇裝置,係可在構成 輸入文字列之各音素中’就與韻律模式資料位置及音 素-致者,自波形辭典中選出韻律模式資料中相當音 素之波形資料,至於其他音素,則由對應之音素中, 自波形辭典選出與韻律模式資料頻率最相近之音素的 波形資料者。 (請先閱讀背面之注意事項再本頁) .線· 經濟部智慧財產局員工消費合作社印制π 本紙張尺度細+關家鮮(CNS)A4規格⑵G ρ—^ ____ -25-
TW089113027A 1999-07-23 2000-06-30 Speech synthesizing method, speech synthesis apparatus and computer-readable medium recording speech synthesis program TW523733B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20860699A JP3361291B2 (ja) 1999-07-23 1999-07-23 音声合成方法、音声合成装置及び音声合成プログラムを記録したコンピュータ読み取り可能な媒体

Publications (1)

Publication Number Publication Date
TW523733B true TW523733B (en) 2003-03-11

Family

ID=16559004

Family Applications (1)

Application Number Title Priority Date Filing Date
TW089113027A TW523733B (en) 1999-07-23 2000-06-30 Speech synthesizing method, speech synthesis apparatus and computer-readable medium recording speech synthesis program

Country Status (8)

Country Link
US (1) US6778962B1 (zh)
EP (1) EP1071074B1 (zh)
JP (1) JP3361291B2 (zh)
KR (1) KR100403293B1 (zh)
CN (1) CN1108603C (zh)
DE (1) DE60035001T2 (zh)
HK (1) HK1034130A1 (zh)
TW (1) TW523733B (zh)

Families Citing this family (180)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US20040030555A1 (en) * 2002-08-12 2004-02-12 Oregon Health & Science University System and method for concatenating acoustic contours for speech synthesis
US7047193B1 (en) * 2002-09-13 2006-05-16 Apple Computer, Inc. Unsupervised data-driven pronunciation modeling
US7353164B1 (en) 2002-09-13 2008-04-01 Apple Inc. Representation of orthography in a continuous vector space
CN1813285B (zh) * 2003-06-05 2010-06-16 株式会社建伍 语音合成设备和方法
US20050144003A1 (en) * 2003-12-08 2005-06-30 Nokia Corporation Multi-lingual speech synthesis
JP2006309162A (ja) * 2005-03-29 2006-11-09 Toshiba Corp ピッチパターン生成方法、ピッチパターン生成装置及びプログラム
JP2007024960A (ja) * 2005-07-12 2007-02-01 Internatl Business Mach Corp <Ibm> システム、プログラムおよび制御方法
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US7912718B1 (en) 2006-08-31 2011-03-22 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US8510113B1 (en) 2006-08-31 2013-08-13 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US8510112B1 (en) * 2006-08-31 2013-08-13 At&T Intellectual Property Ii, L.P. Method and system for enhancing a speech database
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7996222B2 (en) * 2006-09-29 2011-08-09 Nokia Corporation Prosody conversion
JP5119700B2 (ja) * 2007-03-20 2013-01-16 富士通株式会社 韻律修正装置、韻律修正方法、および、韻律修正プログラム
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
KR100934288B1 (ko) * 2007-07-18 2009-12-29 현덕 한글을 이용한 음원 생성 방법 및 장치
US8583438B2 (en) * 2007-09-20 2013-11-12 Microsoft Corporation Unnatural prosody detection in speech synthesis
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20100125459A1 (en) * 2008-11-18 2010-05-20 Nuance Communications, Inc. Stochastic phoneme and accent generation using accent class
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
RU2421827C2 (ru) * 2009-08-07 2011-06-20 Общество с ограниченной ответственностью "Центр речевых технологий" Способ синтеза речи
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9798653B1 (en) * 2010-05-05 2017-10-24 Nuance Communications, Inc. Methods, apparatus and data structure for cross-language speech adaptation
US8401856B2 (en) * 2010-05-17 2013-03-19 Avaya Inc. Automatic normalization of spoken syllable duration
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
JP2013003470A (ja) * 2011-06-20 2013-01-07 Toshiba Corp 音声処理装置、音声処理方法および音声処理方法により作成されたフィルタ
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US10019994B2 (en) 2012-06-08 2018-07-10 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9570066B2 (en) * 2012-07-16 2017-02-14 General Motors Llc Sender-responsive text-to-speech processing
JP2014038282A (ja) * 2012-08-20 2014-02-27 Toshiba Corp 韻律編集装置、方法およびプログラム
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
KR20240132105A (ko) 2013-02-07 2024-09-02 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN112230878B (zh) 2013-03-15 2024-09-27 苹果公司 对中断进行上下文相关处理
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
CN105190607B (zh) 2013-03-15 2018-11-30 苹果公司 通过智能数字助理的用户培训
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101772152B1 (ko) 2013-06-09 2017-08-28 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
EP3008964B1 (en) 2013-06-13 2019-09-25 Apple Inc. System and method for emergency calls initiated by voice command
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
CN110797019B (zh) 2014-05-30 2023-08-29 苹果公司 多命令单一话语输入方法
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
JP6567372B2 (ja) * 2015-09-15 2019-08-28 株式会社東芝 編集支援装置、編集支援方法及びプログラム
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN111862954B (zh) * 2020-05-29 2024-03-01 北京捷通华声科技股份有限公司 一种语音识别模型的获取方法及装置
CN112002302B (zh) * 2020-07-27 2024-05-10 北京捷通华声科技股份有限公司 一种语音合成方法和装置
CN115346513A (zh) * 2021-04-27 2022-11-15 暗物智能科技(广州)有限公司 一种语音合成方法、装置、电子设备及存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1082230A (zh) * 1992-08-08 1994-02-16 凌阳科技股份有限公司 声音合成的程序字控制器
US5384893A (en) * 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
JP3397406B2 (ja) * 1993-11-15 2003-04-14 ソニー株式会社 音声合成装置及び音声合成方法
JPH07319497A (ja) * 1994-05-23 1995-12-08 N T T Data Tsushin Kk 音声合成装置
GB2292235A (en) * 1994-08-06 1996-02-14 Ibm Word syllabification.
JPH09171396A (ja) * 1995-10-18 1997-06-30 Baisera:Kk 音声発生システム
KR970060042A (ko) * 1996-01-05 1997-08-12 구자홍 음성합성방법
US6317713B1 (en) * 1996-03-25 2001-11-13 Arcadia, Inc. Speech synthesis based on cricothyroid and cricoid modeling
US6029131A (en) * 1996-06-28 2000-02-22 Digital Equipment Corporation Post processing timing of rhythm in synthetic speech
JPH1039895A (ja) * 1996-07-25 1998-02-13 Matsushita Electric Ind Co Ltd 音声合成方法および装置
JP3242331B2 (ja) 1996-09-20 2001-12-25 松下電器産業株式会社 Vcv波形接続音声のピッチ変換方法及び音声合成装置
JPH10153998A (ja) * 1996-09-24 1998-06-09 Nippon Telegr & Teleph Corp <Ntt> 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
US5905972A (en) * 1996-09-30 1999-05-18 Microsoft Corporation Prosodic databases holding fundamental frequency templates for use in speech synthesis
US6226614B1 (en) * 1997-05-21 2001-05-01 Nippon Telegraph And Telephone Corporation Method and apparatus for editing/creating synthetic speech message and recording medium with the method recorded thereon
JP3587048B2 (ja) * 1998-03-02 2004-11-10 株式会社日立製作所 韻律制御方法及び音声合成装置
JP3180764B2 (ja) * 1998-06-05 2001-06-25 日本電気株式会社 音声合成装置
AU772874B2 (en) * 1998-11-13 2004-05-13 Scansoft, Inc. Speech synthesis using concatenation of speech waveforms
US6260016B1 (en) * 1998-11-25 2001-07-10 Matsushita Electric Industrial Co., Ltd. Speech synthesis employing prosody templates
US6144939A (en) * 1998-11-25 2000-11-07 Matsushita Electric Industrial Co., Ltd. Formant-based speech synthesizer employing demi-syllable concatenation with independent cross fade in the filter parameter and source domains
EP1045372A3 (en) * 1999-04-16 2001-08-29 Matsushita Electric Industrial Co., Ltd. Speech sound communication system
JP2000305582A (ja) * 1999-04-23 2000-11-02 Oki Electric Ind Co Ltd 音声合成装置
JP2000305585A (ja) * 1999-04-23 2000-11-02 Oki Electric Ind Co Ltd 音声合成装置

Also Published As

Publication number Publication date
HK1034130A1 (en) 2001-10-12
CN1108603C (zh) 2003-05-14
JP2001034283A (ja) 2001-02-09
KR100403293B1 (ko) 2003-10-30
US6778962B1 (en) 2004-08-17
DE60035001D1 (de) 2007-07-12
EP1071074A2 (en) 2001-01-24
JP3361291B2 (ja) 2003-01-07
CN1282018A (zh) 2001-01-31
EP1071074A3 (en) 2001-02-14
EP1071074B1 (en) 2007-05-30
DE60035001T2 (de) 2008-02-07
KR20010021106A (ko) 2001-03-15

Similar Documents

Publication Publication Date Title
TW523733B (en) Speech synthesizing method, speech synthesis apparatus and computer-readable medium recording speech synthesis program
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
JP2000206982A (ja) 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
Kayte et al. Di-phone-based concatenative speech synthesis systems for marathi language
Bettayeb et al. Speech synthesis system for the holy quran recitation.
Browman Rules for demisyllable synthesis using LINGUA, a language interpreter
El-Imam et al. Text-to-speech conversion of standard Malay
Nolan The rise and fall of the British School of intonation analysis
Aida–Zade et al. The main principles of text-to-speech synthesis system
Al-Ani Stress variation of the construct phrase in Arabic: A spectrographic analysis
Gakuru et al. Development of a Kiswahili text to speech system.
Esser Rhythm in speech, prose and verse: a linguistic description
Mittrapiyanuruk et al. Improving naturalness of Thai text-to-speech synthesis by prosodic rule.
KR102517024B1 (ko) 리듬과 운율을 가진 언어에 대한 운율표시장치 및 그 표시방법
Bunnell et al. Advances in computer speech synthesis and implications for assistive technology
Thorsen Suprasegmental transcription
JPS61166600A (ja) 音声合成装置
Orhan et al. The framework of the Turkish Syllable-based concatenative text-to-speech system with exceptional case handling
JP3397406B2 (ja) 音声合成装置及び音声合成方法
COLEMAN The Secret History of Prosodic and Autosegmental Phonology
Aparna et al. Text to speech synthesis of Hindi language using polysyllable units
JPH0229797A (ja) テキスト音声変換装置
Al-Wabil et al. Arabic text-to-speech synthesis: A preliminary evaluation
Nitisaroj Effects of stress and speaking rate on duration and tone in Thai
Isard SSML: A Markup Language for Speech Synthesis

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees