TW201118854A

TW201118854A - Method and apparatus for builiding phonetic variation models and speech recognition

Info

Publication number: TW201118854A
Application number: TW098138964A
Authority: TW
Inventors: Huan-Chung Li; Chung-Hsien Wu; Han-Ping Shen; Chun-Kai Wang; Chia-Hsin Hsieh
Original assignee: Inst Information Industry
Priority date: 2009-11-17
Filing date: 2009-11-17
Publication date: 2011-06-01
Also published as: TWI391915B; US8478591B2; US20110119051A1

Description

201118854 六、發明說明· 【發明所屬之技術領域】本發明係關於語音變異模型建立之技術領域，更係關於應用該语音變異模型以進行語音辨識之技術領域。【先前技術】一種語言往往隨著地域、使用者之背景而存在各種不同之腔調。除此之外’某語言在受其他語言的影響下往往又會產生新的腔調。舉例而言，華語被闊南語影響而有「台灣國語」（閩南語式華語’或簡稱「台灣腔」）、英文被中文影響而有「中式英語」等。這些相對某標準注二不標準的腔調即所謂的「語音變異」。然而，由於語音賴裝置通常無法對不標等的語音進行辨識，因此這些語音變異皆會使語音辨識裝置的辨識率劇降。雖然某些習知的語音辨識裝置亦會建立「語音變里模型」而對不標準的語音進行辨識.，但「語音變異模型:的建立必需依靠對這些不標準的腔調進行廣泛而大量的收集始得以完成，相當耗費人力和時間，並且，有限的非標準語音語料僅能t)l丨練及建立.出有限的語音變異模型，進而迭成整體語音辨識率不佳。單-語言本身即可能具有各種= 音變異，遑論全球近7000種語言又會彼此交錯影響，要收集所有的變異語料幾乎不可行。 θ 因此，如何設計出一種語音變異模型建立方法或裝置，使其能在少量收集非標準語音語料的情況下達成理想語音辨識率，實乃一重要課題。 IDEAS98015/0213-A42241，TW/Final/ 4 201118854 【發明内容】本發明接也語料資料庫，::種語音變異模型建立裝置，包括一語音該語言之複藥彻X、己錄浯5之至少一標準語音模型以及以驗證.出該馨兆非標準語音語料；一語音變異驗證器，甩之複數個語音錄標準語音語斜與該至少—標準語音模型間等語音變異^異j 一語音變異轉換計算器，用以依據該換函式所需之一居音變異轉換函式’產生該語音變異轉據該語音變異魅數；以及一語音變異模型產生器，用以依模型，產生至，換函式及其係數、以及該至少-標準語音本發明4:語音變異模型。 &置，用以輪語音辨識系統，包括：-語音輸入建立裝置，用以浯音；一種本發明前述之語音變異模型置，用以依據鼓ft至）一语音變異模变；一語音辨識裂立裝置所產生之乂標準°。θ模型及該語音變異模型建本發明另接视日變異模型，對該語音進行辨識。異模型建立才種^3變異模型建立方法。該語音變以及該語言之福二挺.提供一語言之至少一標準語音模型語音語料與讀至小語m驗證出該等非標準依據該等語音“準語音模型間之複數個語音變里. 變異轉換函式所需變㈣換函式’產生該語音及其係數1及該至少一標準二：語::異轉換函式變異模型。早”杈型，產生至少一語音本發明另提供一種語音辨識方法。該纽括：經由—語音輸人裝置輸人—語音；經由i發明前= IDEAS98015/0213-A42241 -TW/Final/ . ^ 201118854 方法產生至少-語音變異模型；以及依據該至少音模型及所產生之至卜語音變異模型，對該語音進= 識。藉由執行本發明之方法，可減少非標準語音語料的收集’解決未㈣非標準語音贿即無㈣練出語型的問題，並且能夠以鑑別方法來觸並剔除；^ 變異模型，進而提升語音辨識裝置❹統的整體語音^ 率【實施方式】下文為介紹本發明之最佳實施例。各實施例用以說明本發明之原理’但非用㈣縣發明。本發明之範.圍當以後附之權利要求項為準。第1圖係為習知語音辨識裝置示意圓。語音辨識裝置 100包括前處理模組110、聲學模型.比對模组12〇、辨^士果解碼模組13G、聲學模型訓練模組·、語音辭典資科^ 150及語法規則資料庫16〇。前處理模組11〇對輸入之語音進行初步的處理之後，將處理過之語音輸出至聲學模型比對模組12〇。聲學模型比對模組谓接著將該處理過的語音與聲學翻辑模組14G訓練出的聲學模型進行比對，其中’舉例而言，上述聲學模型可為某語言之標準語音模型，或是非標準語音模型（即變異語音模型）。最後，辨識結果解碼模組130參照語音辭典資料庫15〇及語法規則資料庫160而對聲學模型比對模組12〇比對之結果進行語意辨識，進而產生最終辨識結果。舉例而言，該辨識結果解碼模組130所產生的最終辨識結果為一段可被理解的字 IDEAS98015/0213-A42241-TW/Finai/ 201118854 ο 2來說，若語音辨識裝置·在輸人語音之後以完辨識’可經由-前處理一對輸行之二程圖=理理模組u°所執 ς9Λ0 處理私序200包括：接收語音類比訊 ^ S202、语音取樣s2〇4、往立切蛊丨幻08、预強蜩S210 曰切割S206、端點偵測調S210、乘上漢明窗S212、相關係數求取S216、Lpc來备七、〇頂㈣⑵4自幻20、輸出語音特徵防2等=取切8、求取倒頻譜係數劲―m 2 4步驟，用以在前處理程序S200 仃後棘A語音特徵以供該聲聲學模型比對之用。比對模組1.2〇進订聲學模型訓練模組14()可提供 1〇進行聲學模型比對所需之比對基礎。；3 = 型訓練模组140所執行之+驟^ 第3圖為聲學杈 300 #衽.你立步,L程圖。聲學模型訓練流程模紐:ΓΓ302(包括收集標準或非標準之語 «枓）、模鈕初始化S304、利算相似度S3G6、判、MVlterbl)演算法計之結果為是，則進人最後步步驟讓果為否，則重新評估S308。就辨H聲學模型别2 ;若結語音單元都錢立_敲;;，其所有的立，舉例而言，可使用隱藏式馬？夫型二聲學模型之建一_，由於其非本發::重夫肤，蓉與婼剂夕^ 幻°。曰進行比對之基礎，因而盆：隹建日辨識中佔有舉足輕重的地位，而其中收集語音語料S302又县後 IDEAS980l5/0213-A42241-TW/Fmal/ 立聲學模型之基本考 ^ / i- 201118854 驟。而本發明之主要目的，係為了減輕收集過多 =語料所產生之負擔，提供一種系統化自動擴增語音變 /、杈型之裝置及方法，其實施方式說明如後。、第4圖為依照本發明一實施例之語音變異模型建立方法的流程圖。本發明之語音變異模型建立方法4 步驟S402，提供—語言之至少—標準語音㈣ S4〇4 ’提供該語言之複數個非標準語音語料；驗證出該轉鮮語音語料與該至少—標準語音模’ 複數個語音變異；步騾S408,依據該等語音變異以二组產生該語音變異轉換函式所需之係數# 乂驟S41G，依據該語音變異轉換函式及其係數、二=語音模型，產生至少一語音變異模型;以及;驟以將所產生的該等語音變異模型中鑑別度低纽音變異模型予㈣除。為使上述發明易於理解文將〜一實施例作更詳盡的說明。、从以建立華語.的語音變異模型之作說明。在此實中，按照上述㈣S402提供「標準華語」之語音模型，」中該標準語音難包括「標準華語」t所有語音單元之^ 學模型。之後，按照上述步驟S404提供複數個之「.台灣 -」（閩南語式華語)語音語料。值得注意的是，本發明目的即在於減少非鮮語音語料之收集量，因此，此不而麵:供所有「台灣國語」的語音語料。 " 之後，本實施例進入步驟S406。此步驟可驗證出該等有限的「台灣國語」語料與「標準華語」發明模型間複數個語音變異。簡單地說，驗證，係指去「聽取」一語音之 IDEAS98015/0213-A42241 -TW/Final/ 201118854 語音是否標準。詳細地說，驗證的方法可藉由比較一待驗證語料與另一標準語料在聲學模型相似度關係而判斷該待驗證語料是否相對該標準語料發生變異。一般而言，語言可分類為複數種語音特徵，且標準語音模型及非標準語音語料皆可分別對應該等語音特徵其中之一，因此本發明可利用對應至該標準語音模型的語音特徵而對各個非標準語音語料進行驗證。上述語音特徵可應用國際語音字母 (International Phonetic Alphabet，IPA)，如下表 1 所示，但本發明不必以此為限： «表1»

語音類別中英文對照有聲破裂音(Voiced plosive) B、D、G 無聲破裂音(Unvoiced plosive) P、T、K 摩擦音（Fricatives) F、S、SH、H、X、V、 ΤΗ、DH 塞擦音（Affricatives) Ζ、ΖΗ、C、CH、J、Q、 CH、JH 鼻音(Nasals) Μ、N、NG 流音(Liquids) R、L 滑音（Glides) W、Y 前部母音（Front vowels) I、ER、V、El、IH、 EH、AE IDEAS98015/0213-A42241 -TW/Final/ 9 201118854

中央母音（Central vowels) ENG、AN、ANG、ΕΝ、 AH、UH 後部圓唇母音（Back rounded vowels) 〇後部非圓唇母音(Back A、U、OU、AI、AO、 unrounded vowels) E、EE、OY、AW 舉例而言，驗證的方法包括直接去計算該等非標準語音語料（「台灣國語」語料)與該標準語音模型（「標準華語」浯音模型）在語音特徵參數上之差距，其中該語音特徵參數可以是「梅爾修頻譜參數」（MFCC, Mel-frequency cepstral coefficient ) ’而差距可以利用「歐氏距離」伽也和姐 distance)或「馬氏距離」（Mahalanobis Distance)作為判斷基準。更詳鈿地說，步驟406可藉由驗證s.enone(音素解碼二態的聚類結果稱為“senone，，)模型而找出待驗證語料中語音變異之senone，公式如下：户一-(七i〇g^ Ac_)-i〇g洲夂一公式⑴ s (χ I ^ - m 〇d ) = ^~.Σ s (χ \ λ η) Λ = 1 公式(2) 其中’當PVerification(x)<閥值’則χ為可能語音變異。 PVedficati〇n(x)為senonex語音正確之信心值；g為辨識記分函式；χ為以senone為單位之語音資料；Ac〇rrect為。之正確語音模型，·又anti_model 4與χ正確語音模型最相x 的語音模型集；N為所取與x正確語音模型最相似 = 模型集之模型數量。值得注意的是，在另一實施例中 IDEAS98015/0213-A42241-IW/FinaV 10 锻 201118854 作為比較基準的語音模型不限於「例而言，如第5圖所示，若一實示準語音模型」等。舉準語音模型X0(例如：標準華語、)施例中在取得該語言之標數個其他周邊語音模型Xl〜X4(m外又另取得該語言之複東腔、湖南腔等），則步驟S4% :北京腔、上海腔、廣準語音紗X，（台灣腔）分別步驗證出該等非標語)與該等周邊語音模型間χι'〜;=ί音模型颂標準華腔、湖南腔)之複數個語音變異。⑦腔、上海腔、廣東之後，本實施例進入步驟S4〇8，依據步驟概變異轉換函式以產生該語音變異轉換函 η::, U ctA D) :¾疋非線性關係（例如 y=axA2+bx+e )，並迴歸或是碰演算法計算轉換函式。正常發音之模型參數輸入轉換函式Y=AX+R，可獲得發音變異之模型的參數。半，γμ)=ρ(χ，γ 剔=Σ\ίκ,Α(^) 9 ν? Μ 以及；舉例而言，步驟S408可使用EM演算法而取得該語音變異轉換函式，其公式如下：

. . __ U 公式(3) $Ά) = 6々,|Ά(χ,) 他丨 A，,+R;，I：7y) ^ bA$ = N{TLt^pzxj) 公式(4-1 〜3) 其中，7Γ為初始機率；a為狀態轉移機率；b為狀態觀測機率；q為狀態變數；J為狀態指標；t為時間指標了 £為變異數。EM演算法中包括E步驟及M步驟，其中E步驟中Q函式之求取如下所示： IDEASQSOl^is-towiSv^^l O , A ) log ^(O ,q\ λ') [ 201118854 〇(λ'\λ) = I 〇,A)l〇gP(Osir I λ') 公式(5) •j· gj, \ο^Ρ{0^\λ') = \ο%π^ + Σ \ogaqt_xqt + Σ \〇gbqt (〇r)公式（6) 0 = {X,Y} = {x1,y1,...>xr5y7,} 公式（7) 此外’ M步驟中最大化Q函式之求取如下所示： λr = arg max Q {λ'\λ) λ ' 典巧(〇 Σ^ι(〇 /=1 π,. Μ •Η ΣΓ=送沿狀_d〇rΑ/彳奶)χ,ν \ί=1 八 μ Y.rAMy, -Α/χ,) R ·: Σ^〇) /=1 τ:Σ。⑺(y，- ΑΛ-H - α/χ,-r ./=1 31 J J ’ ~τ ----ί>ω 公式（8) 公式（9) 公式（10) 公式(11) 公式（12) 公式（13) 公式（14) 公式（15) 之後，本實施例進入步驟S41〇，依據該語音變異轉換函式以及步驟S408取得之係數、以及該至少一標準語音模型’產生至少一語音變異模型（在本實施例中，即「台灣國語」）。之後，本實施例進入步驟S412,將所產生的該等語音變異核型中鑑別度低的語音變異模料以剔除。詳細地 IDEAS98015/0213-A42241 -TW/Final/ 12 201118854 說¥步驟S41 〇所產生語音變里變異模型之間的混淆程产為古睥、：中之-與其他語音鑑別性〜m H時’判斷該語音變異模型之音語料亦可依據提供該複數非標準語識，當語音變異模独進行語音辨判斷該語音變===結=錯誤率為高時，本發明另可Μ # 為卜’為了進行鑑別，中分佈之㈣^產生複數個語音變異模型在機率空間距離’ §其中—語音變異模型與其他注 Ϊ之==時，判斷該語音變異模型之鑑別性:低:、或兹立變^^據對應該語言之複數聲學模型和所產生靠近模型之間的關係，驗證該最靠近語音變異模型之鑑恥是否為低。 w近… ^上賴實施财僅以單„_(華一最佳實施例中，本發明變里㈣士、、+ 個語言執行上述語音 " 法，進而產生複數個跨語今扭立轡里槿舉例而言，在一眚竑加士刀双推廣到極致。言（例如：^ ’可域域㈣提供複數個語等汪。、日語)之鮮語音模型、並提供該純準語音語式華語、日式英語中至少一者）、驗證出該等非料與該標準語音模型間（在此實施例為：華語 2數個語音變異、依據該等語音變異以及複數個語音變 ”轉換函式產生該語音變異轉換函式所需之係數、並該語音變異轉換函式及其係數以及該㈣準語音模 IDEAS98015/0213-Α42241 -TW/Final/ 13 [. 5 201118854 此實施例為：墓士丑^ ^ ,,, 莘5吾、英語、日語）產生複數個語音變異槿划 (例如：中式裳.往山，、、t 華祖武央；σ、中式曰語、英式華語、英式曰語、日式 βσ日式英語）。本發明所屬技術領域中具有通常可依據本發H神自行.減。識者本發明之語音變異模型建立方法已於前文介此外，其你& w ψ 土於則述方法，本發明另提供一種語音辨識方法，第6圖即依據本發明—實施例之語音辨識方法流程圖。本發月之5§音辨識方法包括：執行前述之語音變異模型建立方而建立至少—語音變異模型、於步S610中經由立。。S輪入裴置輸入一語音、於步驟s62〇中依據該標準語曰模型與該等語音變異模型對該語音進行辨識、以及於步驟S630中計算各語音變異模型下對該語音進行辨識而產 =之各辨識結果的可能性機率值。在取得各辨識結果的可 =值之後’可取射可能性機率值最高者作為辨識一 ^述發明不限於單一語言之各種腔調，亦可對多種語二之多種腔調進行辨識。本發明之方法包括提供複數個語 =’，分別為該複數個語言分別產生對應之複數個語音變異扠型，以及，依據該複數種語言之至少一標準語音模型及其所建立之至少一語音變異模型，對該語音進行多語言之語音辨識。藉由使用本發明的方法，吾人在曰常生活中失雜多種語言、腔調的說話習慣亦不妨礙本發明對語音辨識之效果，熟悉本技藝人士可依據本發明之精神自行推廣應用領域’本文將不再贅述。 ^ 除了上述s吾音變異模型建立方法、語音辨識方法之 IDEAS98015/0213-A42241 -TW/Final/ 14 201118854 外，本發明又提供-種語音變異模型建立裳置之語音變異模型建立裝置之方塊圖: 別用二—r:變異模型建立裝置7°°的各個元件係分 s= 語音變異模型建立方法之各個步驟 ::1別敘述如下：語音變異模型建立裝置· 匕括$曰料資料庫702、一語音變異驗證器7〇6、一語音變異轉換計算器7G8 一語音變異模型產生器71〇以及一語音變異模型鑑別器712。其中該語音語料資料庫722

用以紀錄一語言之至少一標準語音模型722以及該語言之複數個非標準語音語料724(對應步驟S4〇2、S4〇4);該語音變異驗證器706用以驗證出該等非標準語音語料與該至少一標準語音模型間之複數個語音變異（對應步驟S4〇6); 該語音變異轉換計算器708用以依據該等語音變異以及一語音變異轉換函式，產生該語音變異轉換函式所需之係數 (對應步驟S408);該語音變異模型產生器410用以依據該語音變異轉換函式及其係數、以及該至少一標準語音模型’產生至少一語音變異模型（對應步驟S410)。該語音變異模型鑑別器710用以將所產生的該等語音變異模型中鑑別度低的語音變異模型予以剔除（對應步驟S412)。本發明之語音變異模型建立裝置700的詳細實施方式、所利用之演算法皆可參照前述關於語音變異模梨建立方法之實施例’本文不再贅述。同樣地，本發明之語音變異模蜜建立裝置700不限於單一語言之多種腔調，其亦可運用於多種語言及多種腔調之上。舉例而言’當語音變異模型建立裝置7⑻中之該語 κ IDEAS98015/0213-A42241-TW/Finay 201118854 二^料貝料庫702紀錄了複數個語言(例如華語、英語及日 =注立變異模型產生11 71G可用以產生複數個跨語 ^純型（例如··中式英語、中式日語、英式華語、央式曰語、曰式華語、曰式英語）。 β本ί明ί語音變異模型建立裝置已於前文介紹完畢。第8圖述裝置，本發明另提供一種語音辨識系統， ρ依據本發明一實施例之語音辨識系統示意發明之語音辨識系統8〇〇包括一語音輸入農置^ 述之語音變異模型建立裝置·、—語音辨識裝置如削 =識結果可能性計算器83〇。該語音變異模型建立：置700，如同前述，可用以建立至少一裝該語音輪入裝置81〇在轸^ "模型，當衣亙δ.川在輸入一浯音之後，該語 82〇即可依據該至少_標準語音模型及 =裝置立裝置所產生之至少一語音變異模型，對型建識。之後，该辨識結果可能性計算器83〇可用以仃辨音變異模型下對該語音進行辨識而產生之二十^語能性機率值，在取得各辨識結果的可能性機率2；^的可取其中可能性機率值最高者作為辨識結果而輪出之谈’可此外’本發明另提供一種電腦程式產品，里一電子，備，該電子設備讀取該電腦程式產品時執錯存於音變異模型建立方法。由於該電腦程式產品所仃〜語已於前文說明，故在此不再贅述。仃之方法藉由使用本發明之裝置或方法，語音辨識大幅提升，以下提供一實驗證明之。本實驗目的此皆可施本發明與實施先前技術在語音辨識率上之差異比較實 ffiEAS98015/0213-A42241 -TW/Final/ 16 "。本發明 201118854 包含下列四組實施方案：方案1:僅在實施如本發明「語音變里模型之步驟S402後，即對待測語音進行辨識。由於方法_ 行本發明方法之其他步驟難〜S412，故執在此=案中’步驟S4〇2中之標準語音模型係取自=° 國計算語言學學會台灣口音英語資料庫」，民語的學生π說英語共955句。待測語音為如^ ^英清楚之英語聲音檔；。3、錄製

方案L實施本發明之步驟S4〇2、S4〇4而不姑驟S406〜S412,之後對相同於方案1的待測語音進行辨1步方案2屬於習知技術。在此方案中，步驟S4〇2如同5 而步驟S404從集的非標準語音語料係同樣取自基民b 計算語言學學會台灣σ音英語資料庫」，内 ^ 語的學生口說英語220句；卜土^央方案.3 :實施本發明之步驟S4〇2、S4〇4而不驟S406〜S412’之後對相同於方案！的待測語音進行辨識。方案3屬於習知技術。在此方案中，步驟以〇2如同方案1 而步驟S4G4從集的非標準語音語料係同樣取自「中華民’ 計算語言學學會台灣σ音英語f料庫」内容為非主修英努的學生口說英語660句； / 'π 方案4:實施本發明之所有步驟S4〇2〜S4i2之後對相同於方案1的待測語音進行辨識。在此方案中，步驟以⑽ 如同方案1 ’而步驟S404收集的非標準語音語料係同樣取自「中華民國計算語言學學會台灣口音英語資料庫」，内容為非主修英語的學生口說英語22〇句。 roEAS98015/0213-A42241 -TW/Final/ Γ 201118854 ----- 39

產生語音變異模型之數$ |辨識率

表2 中「產生作用，但除方案4的姐土、、」類同本發明步驟S410之音變異轉換函式」產日，1異模型係依照本發明使用「語由於方案1未收集任柯餘皆依照習如技術產生。其中，變異模型，使得其對不音語料’故無法產生語音準語音語料220句後H—般習知技術’其在收集非標率約鄉。方案3產生:=音變異模型共39個，辨識但由於方案3相對方案2案2數量之變音變異模型， =雖_ 之，，準:::: 二驟⑷2而使用本發明之幾別方法，故相對貫:宰本2發= 除了 U個鑑別度較低之語音變異模型，並且，由於實施^ 發驟：非S:的緣故’使得方案*在僅收 =之一音語㈣情況下減達成相同的辨識率’並相對方案2有較高的辨識率。由上述提供的4 數據可知，經由執行本發明「語音變異模型建立方^驗可減少非標準語音語料的收集，解決未收集非二 IDEAS98015/0213-A42241 -TW/FinaV 丁日邊 1〇 201118854 料即無法訓練出語音變異模型的問題，並且能夠以鑑別方法來判斷並剔除無用的語音變異模型，進而提昇語音辨識裝置或系統的整體語音辨識率。本發明雖以較佳實施例揭露如上，然其並非用以限定本發明的範圍，任何熟習此項技藝者，在不脫離本發明之精神和範圍内，當可做些許的更動與潤飾，因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。 Φ 【圖式簡單說明】第1圖為語音辨識裝置示意圖；第2圖為前處理模組所執行之步驟流程圖；第3圖為聲學模型訓練模組所執行之步驟流程圖；第4圖為依照本發明一實施例之語音變異模型建立方法的流程圖；第5圖為步驟S406中驗證出語音變異的示意圖；第6圖即依據本發明一實施例之語音辨識方法流程圖； φ 第7圖為依據本發明一實施例之語音變異模型建立裝置之方塊圖；第8圖即依據本發明一實施例之語音辨識系統示意圖。【主要元件符號說明】 100〜語音辨識裝置； 110〜前處理模組； 120〜聲學模型比對模組； 130〜辨識結果解碼模組； IDEAS98015/0213-A42241 -TW/Final/ 19 201118854 140〜聲學模型訓練模組； 150〜語音辭典資料庫； 160〜語法規則資料庫； χ〇〜標準語音模型； XI〜周邊語音模型； X2〜周邊語音模型；又3~周邊語音模型； X4〜周邊語音模型； X’〜非標準語音語料； 700〜語音變異模型建立裝置； 702〜語音語料資料庫； 706〜語音變異驗證器； 708〜語音變異轉換計算器； 710〜語音變異模型產生器； 712〜語音變異模型鑑別器； 722〜標準語音模型； 724〜非標準語音語料； 800〜語音辨識系統； 810〜語音輸入裝置； 700〜語音變異模型建立裝置； 820〜語音辨識裝置； 830〜辨識結果可能性計算器。 E)EAS98015/0213-A42241 -TW/Final/ 20

Claims

2〇Πΐ8854 七、申請專利範圍：一種語音變異模型建立裝置，包括. 一語音語料資料庫，用少— 音語料與該至2標準語錢型语音變異轉換計算器，異以及-語音變異轉換函式，產變j語音變需之係數；以及 4變異轉換函式所一語音變異模型產生恶轉換函式及其係數、以及該至少-標異少一語音變異模型。 °。曰叙1 ’產生至 2. 如申請專利範圍第〗項所逑之類為複數種語音概，且縣少該語言係分語音語料係分別對應該二 3. 如申請專利範圍第2項所述之裝置，異驗證器係驗證對應同-語音特徵之音變與該標準語音模型間之該複數個語音變/ 語料 =【係依據該語音特徵之語音變異及對; 之曰憂異轉換函式，產生該語音變里 4 寺徵數；以及’該語音變異模型產生器依據對應需之係 c換函式及其係數、以及該語音準π曰模型’產生該至少一語音變異模型。 ^ 4·如申請專利範圍第i項所述之裂置，其中，該語立错 n)EAS98015/0213-A42241-TW/Final/ 21 珥欠 • T r· 201118854 異轉換計算器，更變異轉換函.式，等語音變異以及-語音 5如魏該⑺θ變異轉換函式之係數。如U利範圍第1項所述之裝置，更包括：从一語音變異模型鑑別器，用以將所產生的該耸 "ΎΓ型巾鐘财低㈣音變賤鮮關除。μ 相範㈣_5韻述之裝置異模=別器係依據當該等所產生語音變異模型；；： :=語音變異模型之間的混潰程度為高時，判= 扣曰變異模型之鑑別性為低。里專利範圍第5項所述之裝置，其中，該語音變 ;=別·據提供該複數非標準語音語料、且使用 =等所產生語音變異_料行語請識，當其中—狂立型該語音變^ 8.如申請專利範圍第5項所述之裝置， ===據其所產生複數個語音變異模型= 異模型之距離為小時7斷！;^音變變^模型與其他語音變 9如由& W , 日㈣模型之鑑別性為低。 .如申印專利範圍第5項所述之裝置異模型鑑別器係依據對應該語言之複語音變異模型中最靠逬模型之間的關係== 音變異模型之鑑別性衫為低。 …^罪近 10.如申請專利範圍第2項所述之變異驗證器係經由計算該等非標準㈣音模型在其對應語音特徵之參數上之-“=:= IDEAS98015/0213-Α42241 -TW/Final/ n % ”丘 Λ 緣寻 201118854 it °。：:::該標準語音模型間之該等語音變異。特徵炎數卿iG項所述之裝置，其中該“ 離。數係為-梅爾倒頻譜參數、-歐氏距離或-馬：語料範圍第1項所述之裝置，其中該語音語音變異㈣器更2語言之複數個周邊語音模型，而該

別與該標準語音模;非標準_ 變異。該4周邊浯音模型間之複數個語音準:音語料係分複準語音語:與=:=等：:，_ =之參數上之-差距，=二=: :=標準語音模型間、該等周邊語音模型間之複 14.如申請專利範圍第1 變異轉換計算器係使用一 EM 換函式所需之係數。項所述之裝置，其中該語音 / 臾算法而產生該語音變異轉 15.如申請專利範圍第丨項所述之裝置，其中該纽音語料資料庫更紀錄了複數個語言其個別之至少一標準 X;: 杈型及其對應之複數個非標準語音語料，·該語音變異驗證器更包含用以分別驗證出各語言之複數個語音變異.笋立變異轉換計#器更包含分麟各語言產生對應的語音變= IDEAS98015/0213-A42241 -TW/Final/ 23 I < 201118854 轉換函式所需之係數；以及該語音變異語言分別產生對應之複數個語音變異用以分別為該複數個語言厶κ丨丨姦从犯二、生态更匕3 模型。 16· -種語音辨識系統，包括：一語音輪入裝置，用以輸入一語音；變異模型建立裝置；:申”專·®第1項所述之語音 :及f::!異模型建立襄置所產生之至少: ^對該语音進行辨識。 Π.如申請專利範圍第包括： "辨識裝置’用以域該至少—標準語音模語音變異模 16碩所述之語音辨識系統，更模型下對^缺計算11，以計算各語音變盈率值。”進订辨識而產生之各辨識結果的可能性機二迷之語音辨識系統，其 =，語音變異模裝= 生盗更用以分別為該複數個狂士八、、至產音變異模型，·以及，該語“生對應之複數個語語言之至少-標準語音模型及^^用以依據該複數種模型，對該語音進行多語言之語音辨^至少一語音變異 19. 一種語音變異模型提供-語言之二包括以下步驟：複數個非標準語音語料；丁 > °。3杈型以及該語言之 IDEAS98015/0213-A42241 -TW/Final/ 201118854 翻間之準語音語料與該至少_ 標準語音依據該等語音變異以及一逆立生該語音變異轉換函式所需之係數^及，、轉換函式，產依據該語音變異轉換函式及一=語音模型.，產生至少-語音變異模：該至少 20· *申請專利範圍第㈣所述之方法，满刀類為複數種語音特徵，且該立、W言 ·=個非標準語音語料係分別對應該複=心== 步二述之方法，其+該方法與該標準語音模型間之複數語音語料之語音變異及對應該語音發立依據該語音特徵語音特函式所需之係數;以及，依據對應該二=準:!:轉換函式及其係數'以及該語音特徵至夕標杨音模型，產生至少— 更勺請專利範圍第19項所述之方法，其中該方法複二：ί:4語音變異以及-語音變異轉換函式，產生複數、，且該浯a變異轉換函式之係數。 t如申請專利範圍第19項所述之方法，其中該方法更U括.將所產生的該等語音變異模型予以剔除。没低的。。音更包m 12 3 _述之m中該方法等所產生語音變異 IDEAS98015/0213-A42241-TW/Finaiy ,、今 25 *-二-j 201118854 他語音變異模型之模型之鑑別性為低。、此/王又為高時，判斷該語音變異更二項Μ之方法’其中該方法產⑼立ί 該複數非標準語音語料、且使詩算所刑夕^ '異模型以進行語音辨識，當1中一注立里描型之辨識結果的錯誤率為古拉^田八中。口《變異模別性為低。 ‘·、、呵、，判斷該語音變異模型之鑑更包項所述之方法’其中該方法分佈之距離：當其中語：變異模型在機率空間中之距離為小時，判斷與其他語音變異模型 27...如申請專利範圍第幻項所逃之方法，其中更匕括.依據對應該語言之〜法異模型中最靠近模型之間二語音變模型之❹】性以輕。I錄錢語音變異在Λ8· *申請專利範圍第加項所述之方法，1中节方> 係經由計算該等非標準 -中該方法應語音特徵之參數上之一】準語音模型在其對語料與該標準語音模二=二=#出該等非標準語音特徵所述，方法’其中該語音離。㈣_°日參數、-歐氏距離或-馬氏距 30.如申請專利範圍第19項所述之方法，其中更包括：提供該語言之複數_邊語音模型，1 尊非標準語音語料分職該標準語音模型、 IDEAS98015/0213-Α42241 -TW/Final/ ^ 寻周遺 5口曰 26 201118854 模型間之複數個語音變異。語言準語音模型及該等周邊」語音語料與該標上之-差距，語音3,間、：等周邊語音模型間之複心田如申请專利範圍第19項所述之方法，其中兮* :用—现演算法以產生該語音變異轉換函式所 *申請專利範園第19項所述之方法，匕括.提供複數個語言其個別之至少-桿準达立^决：音變異；分別為各語言產生對應；:複式所需之係數；以及，分別為該複數個語古分別j換函之複數個語音變異模型。 σ刀別產生對應 34. —種語音辨識方法，包括：經由一語音輸入器輸入一語音. ―語音變=，:r範，9項所述之方法產生至少音變異模型及所產生之至少1 3.5 .如申請專利範圍第3 包括：幻4销叙料賴方法，更 IDEAS98015/0213-A42241'TW/Final/ 27 201118854 計算各語音變異模型下對該語音進行辨識而產生之各辨識結果的可能性機率值。 36. 如申請專利範圍第34項所述之語音辨識方法，其中該方法更包括：提供複數個語言，分別為該複數個語言分別產生對應之複數個語音變異模型；以及，依據該複數種語言之至少一標準語音模型及其所建立之至少一語音變異模型，對該語音進行多語言之語音辨識。 37. —種電腦程式產品，係儲存於一電子設備，該電子設備讀取該電腦程.式產品時執行一語音變異模型建立方法，其包括：提供一語言之至少一標準語音模型以及該語言之複數個非標準語音語料；驗證出該等非標準語音語料與該至少一標準語音模型間之複數個語音變異；依據該等語音變異以及一語音變異轉換函式，產生該語音變異轉換函式所需之係數；以及依據該語音變異轉換函式及其係數、以及該至少一標準語音模型，產生至少一語音變異模型。 IDEAS98015/0213-A42241 -TW/Final/ 28