TW508564B - Method and system for phonetic recognition - Google Patents
Method and system for phonetic recognition Download PDFInfo
- Publication number
- TW508564B TW508564B TW89109312A TW89109312A TW508564B TW 508564 B TW508564 B TW 508564B TW 89109312 A TW89109312 A TW 89109312A TW 89109312 A TW89109312 A TW 89109312A TW 508564 B TW508564 B TW 508564B
- Authority
- TW
- Taiwan
- Prior art keywords
- speech
- sound
- waveform
- consonants
- speech recognition
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 111
- 230000008569 process Effects 0.000 claims description 38
- 230000008859 change Effects 0.000 claims description 36
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 230000003252 repetitive effect Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 6
- 208000027418 Wounds and injury Diseases 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 4
- 230000006378 damage Effects 0.000 claims description 4
- 208000014674 injury Diseases 0.000 claims description 4
- 239000002360 explosive Substances 0.000 claims 4
- 239000000463 material Substances 0.000 claims 4
- 239000000470 constituent Substances 0.000 claims 3
- 239000011257 shell material Substances 0.000 claims 2
- 238000005422 blasting Methods 0.000 claims 1
- 230000009172 bursting Effects 0.000 claims 1
- 230000008774 maternal effect Effects 0.000 claims 1
- 210000002784 stomach Anatomy 0.000 claims 1
- 230000002996 emotional effect Effects 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 71
- 238000010586 diagram Methods 0.000 description 19
- 230000002079 cooperative effect Effects 0.000 description 15
- 238000005070 sampling Methods 0.000 description 14
- 230000006397 emotional response Effects 0.000 description 13
- 230000008451 emotion Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 5
- 238000009434 installation Methods 0.000 description 3
- 239000007858 starting material Substances 0.000 description 2
- 208000027534 Emotional disease Diseases 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
Description
508564 A7 B7 五、發明說明(1 ) 發明镅斑: 本發明係有關於一種以分析語音波形$進行語音辨識 的方法及系統,更詳而言之,係有關於一種語音辨識方法 及系統,在無須事先建立個人專屬之語音與文字的對應資 料庫情形下,利用辨識語音原則,以通用的語音與文字 應資料庫,將語音音包區分為子音、風聲、以及母音部份' 並取出首頻以及尾頻’而辨識出語音所對應的文字、=個 人語音的音色、以及語音的音調。 本發明中所稱之音包表示吾人說話時的每一音節,一 個音節可能包括子音部分、母音部分,以及本發明人㈣ 風聲之部刀,如附圖之第了⑻圖所示為音節中頻率特高之 爆擦音之部分,本發明中所稱之辨識語音原則為利用經過 如第7(a)®、f 7(b)圖所示之頻率特性圖分別顯示每一音 包(亦即音節)之特色之方法。 關於本發明中所稱之辨識語音原則,以下將作詳盡之 說明。 發明背睪· 於一般習知的情況下,一般的語音辨識方法及系統, ㈣j用取樣方式,對每個人的語音音包所對應之h ^彡 進行分段取樣,將每段之磬音娓士 曰樣本的“音頻率、振幅波形、 消 裝 i 以及波形載波的不同特性,預先儲存於資料庫甲,待資料 庫令已存有使用者個人之語音頻率、振幅波形以及波形 載波資料後,使用者才可進行個人語音比對、辨識工作。 均是在發聲者使用語音辨識方法及系統前,預先建立起個 _本紙張尺度適用中國國家標準(CNS)A4規格(21G χ撕公 1 15915 508564 經濟部智慧財產局員工消費合作社印製 2 A7 五、發明說明(2 / 人專屬的語音文字對應資料庫,此資料庫將包含大量的钱 音與文字的對應資料,無法以一種利用辨識語音原則以^ 通用的語音文字對應資料庫來進行語音辨識。 習知技術的缺點在於,在進行語音辨識時,對於不同 使用者而言,即便是每個人所發出的語音所代表的文字均 相同,但是由於地域性的不同口音、每個人所發出的語音 頻率、振幅波形、以及波形載波的特性不同,所以每個1 用者自己所建立的語音文字對應資料庫將有所不同。每個 人在進行同一文字的語音辨識之前,必須先行利用取樣方 式,對同一文字之各人語音音包所對應的聲音波形進行分 段取樣,將每段之聲音樣本的語音頻率、振幅波形、以及 波形載波的不同特性,預先儲存於資料庫中。亦即,必須 先行建立每個人之語音與文字之對應資料庫,才可再進行 文字語音的辨識工作,而無法以一種辨識語音原則的型 式,以通用的語音文字對應資料庫來辨識每個人所發出的 同一文字的語音。 、 例如,每個人所發出之語音所代表的文字均為[巴] 字,但是由於地域性的不同口音、每個人所發出的語音之 頻率、振幅波形、以及波形載波的特性不同,所以每個人 所發出的[巴]字語音音包所對應的波形將不相同。每個人 在進行識別[巴]字語音之前,必須先行利用取樣方式,對 自己之[巴]字語音音包所對應之聲音波形進行分段取樣, 將每#又之聲音樣本的語音頻率、振幅波形、以及波形載坡 的不同特性,預先儲存於資料庫中。亦即,每個人必須預 15915 ---I I I I ----I II I ^---- ----- (請先閱讀背面之注意事項再填寫本頁} A7 五、發明說明(3 ) 建立個人之[巴]字語音文字對應資料廉,才^丨 音進行辨識,I法在個人二應貝枓庫才可對[巴]字語 對靡次M由…、在個人未建立起專屬的[巴]字語音文字 用的:的情形下,無法利用一種辨識語音原則以及 :的語音文字對應資料庫,而辨識個人所發出的[巴]字語 :。由於無法利用一種辨識語音原則以及通用的 =應資料庫來進行語音辨識,所以習知的語音辨識方法: ί統在進行語音辨識時’所建立起的個人專屬語音文字對 裝 :、、貝料庫將極為龐大,而使得語音辨識工作將更為困難, 2且S知的語音辨識方法及系統,無法分辨出每個人語 s色以及無法判斷出發聲者的情緒表現。 综觀習知之語音辨識方法及系統,料事先建立各個 不同使用者的語音以及所對應的文字資料庫,待資料庫建 立後,再進行語音與資料庫的比對、辨識工作,而不是利 用辨識》。音原則以及通用的語音文字對 音辨識。若使用者是第-次進行語音辨識,由於二 起其專屬之個人語音與文字的對應資料庫,因而此使用者 將無法進行語音辨識工作。再則,由於各種地域性的口音 問題,必須建立起不同的語音與文字的對應資料庫,所以 整個語音辨識系統的語音與文字的對應資料庫將極為龐 大,而增加了利用語音文字對應資料庫來進行語音比對、 辨識的困難度。必須針對各個使用者而建立其專屬之語音 與文字對應資料庫,而無法以一種通則性的語音辨識原則 以及通用的語音文字對應資料庫來進行語音辨識,並且亦 無法分辨出每個人語音的音色、以及無法判斷出發聲者的 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 χ 297公釐) 15915 五⑽明/.) (請先閱讀背面之注意事項再填寫本頁) 所以如何以-種語音音辨識方法及系統,在使用者無 、先建立個人專屬的語音文字對應資料庫,並可適用於 不同使用者以及不同地域性σ音的情形下,以—種通則性 ^ 吾音辨識原則以及通用的語音文字對應f料庫來進行語 :辨識,於任何使用者之環境’能對使用者所發出的語音 予2辨識而得出此語音所對應代表的文字為何,並能分辨 出母個人語音的音色、以及判斷出發聲者的情緒表現能 庙用通則性的語音辨識原則以及通用的語音文字對應資料 ’以-種新㈣語音辨識方法及系統,來辨識每個使用 所發出之語音以及語音所代表的音色、情緒反應,乃是 待解決的問題。 經濟部智慧財產局員工消費合作社印製 為了解決上述習知語音辨識方法及系統之必須預先建 立各個使用者之專屬的語音文字對應資料庫後,方能對使 2者所發出之語音進行辨識的條件下,我們採用了一種語 :辨識方法及系統,在無須事先建立每個人專屬之個人語 音與文字的對應資料庫情形下,應用辨識語音原則,以通 用的語音文字對應資料庫,來分析、判別語音所對應之表 徵波形的物理特性,而能判斷出語音所對應的文字、每個 人語音的音色、以及語音的音調。本發明之語音辨識方法 及系統,無須預先建立專屬於各個人之語音與文字的對應 資料庫,而是應用辨識語音原則,以通用的語音文字對應 資料庫來辨識語音,在無論是否為第一次進行語音辨識的 情形下,讓任何人所發出的語音皆能被辨識出來 15915 經濟部智慧財產局員工消費合作社印製 508564 A7 _________ _ B7 五、發明說明(5) 發明概述虞目的: 本發之主要目的便是在於提供一種語音辨識的方法及 系統,讓使用者可在無須事先建立其專屬的語音文字對應 資料庫的情況下,應用辨識語音原則以及通用的語音文字 對應資料庫,根據使用者所發出的語音,而得以辨識出所 發出之語音為何。 本發明之另一目的便是在於提供一種語音辨識的方法 及系統,讓使用者可在無須事先建立其專屬的語音文字對 應資料庫的情況下,應用辨識語音原則以及通用的語音文 字對應資料庫,將使用者所發出的語音音包區分為子音、 風聲、以及母音部份,而得以辨識出使用者所發出的語音 所對應的文字為何。 本發明之又一目的便是在於提供一種語音辨識的方法 及系統,讓使用者可在無須事先建立其專屬的語音文字對 應資料庫的情況下,應用辨識語音原則以及通用的語音文 字對應資料庫,將使用者所發出的語音音包區分為子音、 風聲、以及母音部份,並對整個語音音包進行處理而取出 首頻、以及取出尾頻,配合母音部份之頻率以及波形振幅 外廓變化情形,而得以辨識出使用者所發出的語音所對應 的文子、以及分辨出具有聲調變化的語音聲調。 本發明之又一目的便是在於提供一種語音辨識的方法 及系統,讓使用者可在無須事先建立其專屬的語音文字對 應負料庫的情況下,應用辨識語音原則以及通用的語音文 字對應資料庫,將使用者所發出的語音音包區分為子 —丨丨丨丨丨丨丨丨— 裝i丨丨丨—丨丨訂·丨丨丨! · (請先閱讀背面之注咅?事項再填寫本頁) 本紙張尺度翻巾關家鮮(CNS)A4規格(210 X 297公釐) 5 15915 經濟部智慧財產局員工消費合作社印製 A7 〜------L —__ 五、發明說明(6 ) 風聲、以及母音部份’並對整個語音音包進行處理而取出 首頻以及取出尾頻’配合母音部份之頻率以及波形振幅 外廓變化情形,而得以辨識出使用者所發出的語音所對應 的中文文子、以及分辨出中文語音中的四聲變化所對應的 中文文字。 本發明之再一目的便是在於提供一種語音辨識的方法 及系統,讓使用者可在無須事先建立其專屬的語音文字對 ,資料庫的情況下,應用辨識語音原則以及通用的語音文 子對應資料庫,對整個語音音包的載波以及其上的調變鑛 齒波邊緣,做分析處理而可得到語音之音色特徵,而辨識 出發聲者的音色。 本發明之再一目的便是在於提供一種語音辨識的方法 及系統,讓使用者可在無須事先建立其專屬的語音文字對 應 > 料庫的情況下,應用辨識語音原則以及通用的語音文 子對應資料庫,對整個語音音包的音量變化進行分析處理 而可得出說話者的情緒反應。 根據以上所述的目的,本發明提供了一種新穎之語音 辨識方法及系統,在無須事先建立每個人專屬之個人語音 與文字的對應資料庫情形下,應用辨識語音原則,以通用 的語音文字對應資料庫,來分析、判別語音所對應之表徵 波形的物理特性,而能判斷出語音所對應的文字、每個人 語音的音色、以及語音的音調。語音辨識系統應用語音辨 識原則,而將語音音包區分為子音、風聲、以及母音部份, 並對整個语音音包進行處理而取出首頻、以及尾頻,對子 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 15915 .----------裝·-------訂---------· (請先閱讀背面之注意事項再填寫本頁) A7 A7 經濟部智慧財產局員工消費合作社印製 五、發明^明Γ 7、 音、風V、以及母音部份分別進行辨識、處理、以及組合。 將子音以及母音予以組合後,應用辨識語音原則,對由子 音與母音所構成的語音以及通用的語音文字對應資料庫進 行比對,以得到發聲者發出之語音所對應的文字為何。應 用辨識語音原m,對整個語音I包的載波以及其上的調變 鑛齒波邊緣,做分析處理而可得到語音的音色特徵。應用 辨識語音原則對整個語音音包的音量變化、音調高低進行 分析、處理’而得出說話者的情緒反應,此情緒反應與語 曰音包的音量變化、音調高低有關。除了能利用子音以及 母音的組合,而辨識出語音所對應的文字外,尚能利用首 頻、尾頻的運算判斷法則’配合母音部份之頻率以及波形 振幅外廓變化情形,辨識出中文語音中的四聲變化。以子 音以及母音的組合’加上中文語音中的四聲變化,而得以 正確地辨識出中文發音所對應的中文字。亦即,此語音辨 識方法及系、统除了可辨識出&四聲變化的語音所對應的文 字之外’例如無四聲變化的西方文字語言,尚可辨識出具 有四聲變化的中文語音所對應出的中文字。本發明之語音 辨識方法及系統’使肖者可在無須事先建立其專屬的語音 文字對應資料庫的情況下,應用辨識語音 所對應的表徵波形物理特性,而能辨識出語音所對應^文 字、每個人語音的音色、以及語音的音調。 本發明之語音辨識系統含有語音轉換處理模組、語音 辨識原則資料庫、語音辨識處理模組、以及通用的語音文 字對應資料庫》語音辨識原則資料庫中包含辨識語音原 [紙張尺度適用中關家標準(CNS)A4規格(210 X 297公釐) ----^---------------- (請先閲讀背面之注意事項再填寫本頁) 川 〇:) 04 Α7 經濟部智慧財產局員工消費合作社印製 五、發明說明(8 ) ' —^ Z,此些語音辨識原則用來對語音音包進行處理,將語音 9包區分為子音、風聲、以及母音部份,並取出語音音包 的首頻、以及尾頻,利用語音辨識原則對子音、風聲、以 及母音部份分別進行辨識,以判斷出子音以及母音為何, 邊音辨識原則並以首頻、尾頻的運算判斷法則,配合母音 部份之頻率以及波形振幅外廓變化情形,而辨識出中文^ 曰中的四聲變化,語音辨識原則並可將辨識出的子音、母 曰部份’亦或子音、母音部份、以及四聲變化予以組合, 並將所得出的語音組合與語音文字對應資料庫進行比對, 以得出語音所對應的·文字為何。通用的語音文字對應資料 庫則包含語音所對應的文字資料庫,語音由子音、母音, 亦或由子音、母音、以及四聲變化所組合而成。語音轉換 處理模組是用以將使用者所發出的語音轉變為所對應之物 理表徵波形訊號,並將此訊號輸入到語音辨識模組以供做 語音辨識處理。語音辨識處理模組則根據語音辨識原則資 料庫中的辨識語音原則,而對此波形訊號進行處理,將語 音音包區分為子音、風聲、以及母音部份,並將對語音音 包進行處理而取出首頻、以及尾頻,語音辨識處理模組並 根據辨識語音原則,對語音音包進行子音、風聲、以及母 音部份分別進行辨識、處理、以及組合,語音辨識處理模 組將辨識出的子音、母音部份,亦或子音、母音部份、以 及四聲變化予以組合,並將所得出的語音組合與語音文字| 對應資料庫進行比對,以得出語音所對應的文字為何。於 進行發聲者音色判別時,語音辨識處理模組根據語音辨識 rm先閱讀背面之注意事項再填寫本頁> 裝--------訂----
I H ϋ ϋ I i. 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公爱) 8 15915 A7 五、發明說明(
庫“辨識語音原則’將對整個語音音包的載波 立色特徽的調變鑛齒波邊緣’做分析處理而可得到語音的 :時…==每個人的音色。於進行發聲者情緒判I 整::ί:’對整個語音音包的音量變化進行分析處理,I! 扣曰㈢包的音量變化與音調有關並代表說話者的情 緒而可得出說話者的情緒反應。 , 立棘2行語音辨識過程時,首先,將使用者所發出的語^ 日轉變為所對應之物理表徵波形訊號。接著,再經由語立— 經濟部智慧財產局員工消費合作社印製 辨識原則對語音所對應之波形訊號的表徵波形物理特性進 γ刀析,以取出此波形的各項特徵參數出來,將語音音包 區刀為子音、風聲、以及母音部份,並對整個語音音包進 行處理而取出首頻、以及取出尾頻。進而,利用語音辨識 原則以子音、風聲、以及母音的物理特徵參數,來對此 波形的各項特徵參數進行比對、辨識,而將語音音包所對 應的波形區分為子音、風聲、以及母音部份。待將波形區 分為子音、風聲、以及母音部份後,針對子音、風聲、以 及母《所具有的波形特徵進行判斷,而得出子音部份所對 應的文字子音為何,以及母音部份所對應的文字母音為 tr進而,利用5吾音辨識原則而組合所辨識出的文字子音 以及文字母音,並將組合後,由文字子音以及文字母音所 構成的組合語音與通用的語音文字對應資料庫進行比對, 而得出發聲者發出的語音所對應的文字。對於辨識中文語 音而言,除了分辨並得出語音之子音部份所對應的文字子 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公營) --'^_ 9 15915 508564 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(1〇) 音為何,以及母音部份所對應的文字母音為何之外, 要去判別中文字所特有的四聲發音變化。所以,在此,將 利用首頻、尾頻的判斷法則,配合母音部份之頻率以及波 形振幅外廓變化情形,而分辨出中文語音中的四聲變化 待得出四聲變化後,配合之前所得到的中文文字子音以及 母音,利用語音辨識原則而組合所辨識出的文字子音、文 字母音、以及四聲變化情形,並將組合後之語音與^用的 浯音文字對應資料庫進行比對,而得出發聲者發出之具四 聲變化的中文語音所對應的中文字為何。所以利用本發明 之語音辨識方法時,除了可辨識出無四聲變化的語音所對 應的文子之外,還可辨識出具有四聲變化的中文語音所對 應出的中文字。於進行發聲者音色判別時,將對整個語音 音包的載波以及其上的調變鋸齒波邊緣,做分析處理而可 得到語音的音色特徵,而辨識出每個人的音色。於進行發 聲者情緒判斷時,對整個語音音包的音量變化進行分析處 理’整個語音音包的音量變化與音調有關並代表說話者的 情緒’而可得出說話者的情緒反應。在無須預先建立每個 人專屬的語音辨識資料庫的型態下,應用辨識語音原則, 以通用的語音文字對應資料庫,來分析、判別語音所對應 之表徵波形的物理特性,而能判斷出語音所對應的文字、 每個人語音的音色、以及語音的音調。 圖示筋诚: 為讓本發明之上述和其它目的,特徵,優點能更明顯易 懂’將舉一較隹實施例,並配合所附圖示,詳細說明本發 本、,、氏張尺度適用中國國家標準(CNS)A4規格(21G χ 297公釐) 15915 lull — — — — — - III — — — — ^* — 111111— (請先閲讀背面之注音?事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(U) —- 明之實施例,所附圖式之内容簡述如下: 第1圖為-系統方塊圖,其中顯示應用本發明之語音辨 識方法及系统的系統基本組織架構之方塊模組圖;曰 第2圖為表示第i圖之語音辨識系 抓J堞作流程圖,复 中顯示應用本發明之語音辨識系統進行語音辨識方法’: 對語音進行辨識之工作原理的流程程序; 4 第3圖為表示第丨圖之語音辨識系統的運作流程圖其 中顯示應用本發明之語音辨識系統進行語音辨識方法,2 進仃語音辨識、音色、以及發音情緒判斷處理之工作原理 的流程程序; ^ 第4圖為一運作流程圖,用以更詳細地解釋於第3圖中 之對語音進行辨識之工作原理的流程程序; 第5圖為一運作流程圖,用以更詳細地解釋於第3圖中 之對語音進行語音辨識、音色、以及發音情緒判斷處理之 工作原理的流程程序; 第6圖為一運作流程圖,用以更詳細地解釋於第4圖中 之辨識出使用者所發出之中文語音所對應的文字之工作原 理的流程程序; 第7(a)圖為一示意圖,用以解釋語音波形的組成特性結 構; 第7(b)圖為一示意圖,用以解釋子音、風聲、以及母音 部份; 第7(e)圖為一示意圖,用以解釋於第7(b)圖中子音區 的爆發音的波形特性; I--I---------------訂--------- (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公釐) 11 15915 A7
五、發明說明(12) 經濟部智慧財產局員工消費合作社印製 的4:(=:意圖,解釋於第7帽…區 第8圖為一示意圖,用以 ^ ^ 鮮釋於第7(b)圖中之語音波形 之母音部份的組成特性結構;
第9圖為^一示棄_,田,、》A 之母音部份的組成特徵參數;釋於第7(b)圖中之語音波形 第10圖為一示意圖,為關 χ 為關於中文四聲聲調變化的聲調 頸率統計;以及 第11圖為一示意圖,用 乂說明[巴]字的子音以及母音 ,的波形’並應用辨識語音原則進行識別。 例詳細說明: 第1圖為一系統方塊圖,其中顯示應用本發明之語音 辨識方法及系統的系統基本組織架構之方塊模組圖。如圖 中所示,本發明之語音辨識系統1含有語音轉換處理模組 2、語音辨識原則資料庫3、語音辨識處理模組4、以及通 用的語音文字對應資料庫5。語音轉換處理模組2可為將 語音轉換成為電子訊號的電子裝置,語音辨識處理模組4 可為電腦主機,而語音辨識原則資料庫3、以及通用的語 音文字對應資料庫5’則可儲存於電腦之記憶裝置内。 語音辨識原則資料庫3中包含辨識語音原則,此些辨 識語音原則包含區分語音音包為子音、風聲、以及母音部 份的規則、取出語音音包首頻以及尾頻的規則、辨識子音、 風聲、以及母音的規則、辨識四聲變化的規則、組合子音 與母音的規則、組合子音母音與四聲變化的規則、辨識語 ------—----裝------—訂-----— (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 12 15915 508564 Α7
五、發明說明(13) 音音包音色的規則、以及辨識語音音包音量變化的規則。 此些語音辨識原則用來對語音音包進行處理,將語音音包 區分為子音、風聲 '以及母音部#,並取出語音音包的首 頻以及尾頻,利用語音辨識原則對子音、風聲、以及母 音部份分別進行辨識,以判斷出子音以及母音為何,語音 辨識原則並以首頻、尾頻的運算判斷法則,配合母音部份 之頻率以Α波形㈣外廓變化情%,而㈣自巾文語音中 的四聲變化,語音辨識原則並可將辨識出的子音、母音部 伤’亦或子音、母音部份、以及四聲變化予以組合,並將 所得出的語音組合與語音文字對應f料庫5進行比對,以 得出語音所對應的文字為何。
請 先 閲 讀 背 面 之 注 意 事 項 再 填Γ 寫裝 本. 頁I 經 'Μ 部 智 慧 財 產 局 員 工 消 費 合 作 社 印 製 通用的語音文字對應資料庫5則包含語音所對應的文 予資料庫’語音由子音、母音,,亦或由子音、母音、以及 四聲變化所組合而成,語音具有相對應的文字,語音與文 字互相對應,組合語音而得出所發出的語音所代表的文 字。 、焐音轉換處理模組2是用以將使用者所發出的語音轉 變為所對應之物理表徵波形訊號,並將此訊號輸入到語音 辨識模組4以供做語音辨識處理。 語音辨識處理模組4則根據語音辨識原則資料庫3中 的辨識語音原則,而對此波形訊號進行處理,將語音音包 區分為子音、風聲、以及母音部份,並將對語音音包進行 處理而取出首頻、以及尾頻,語音辨識處理模組4並根據 辨識語音原則,對語音音包進行子音、風聲、以及母音部 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 13 15915
訂 a I I
I i A7 A7 經濟部智慧財產局員工消費合作社印製 五、發明說明(!4) 份分別進行辨識、 、 將辨識出的子音、1立、以及組合’語音辨識處理模組4 四聲變化予以紐人、 日母音部份、以及 m ^ σ,並將所得出的語音組合蛊 文予對應資料庫5進行比對,以得對:用的-音 何。 ® σ曰所對應的文字為 於進行發聲者音色 ,银立 語音辨識原則資料座W 曰辨識處理模組4根據 音包的載波以及且卜_識語音原則’將對整個語音 得到語音的音色特衩的調變鋸齒波邊緣’做分析處理而可 聲去特徵,而辨識出每個人的音色。於進行發 資料1^斷時,語音辨識處理模組4根據語音辨識原則 八中的辨識語音原則’對整個語音音包的音量變化 析&理’整個語音音包的音量變化與音調有關並代 表說話者的情緒’而可得出說話者的情緒反應。 宜卜圖為表示第1圖之語音辨識系統的運作流程圖, " 示應用本發明之語音辨識系統進行語音辨識方法, 乂對扣曰進行辨識、處理之工作原理的流程程序。如圖中 所不於步驟11,語音轉換處理模組2接收語音,將使用 者所發出的語音轉變為所對應之物理表徵波形訊號,並將 此Λ號輪入到語音辨識模組4以供做語音辨識處理,並進 到步驟12。 於步驟12,語音辨識原則資料庫3、語音辨識處理模 組4、以及通用的語音文字對應資料庫5將配合運作,語 音辨識處理模組4將則根據語音辨識原則資料庫3中的辨 識語音原則,而對自語音轉換處理模組2而輸入的波形訊 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐 15915 -—----tr--------- (請先閱讀背面之注意事項再填寫本頁) 508564 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(15) 號進行處理,將語音音包區分為 厂_、風聲、以及母音部 伤,並將對語音音包進行處理而 進到步驟13。 取出百頻、以及尾頻,並 於步驟13,語音辨識處理模組4並根據辨識語音原 則’對語音音包進杆早立 涵藤 進仃子曰麟、以及母音部份分別進行 辨識、處理、以及組人,扭音 及組〇叩曰辨識處理模組4將辨識出的 子音、母音部份,亦或子音、母音部份以及四聲變化予 以組合,並進到步驟i 4。 於步驟14,語音辨識處理模組4並將所得出的語音組 合與通用的語音文字對應資料庫5進行比對,以得出語音 所對應的文字為何,將結束此語音辨識過程。 第3圖為表示第!圖之語音辨識系統的運作流程圖, 其中顯示應用本發明之語音辨識系統進行語音辨識方法, 以進行語音辨識、音色、以及發音情緒判斷處理之工作原 理的流程程序。如圖巾所示’於步驟21,語音轉換處理模 組2接收語音,將使用者所發出的語音轉變為所對應之物 理表徵波形訊號,並將此訊號輸入到語音辨識模組4以供 做語音辨識處理,並進到步驟22。 於步驟22,語音辨識原m資料4 3、言吾音辨識處理模 組4、以及通用的語音文字對應資料庫5將配合運作語 音辨識處理模組4將則根據語音辨識原則資料庫3中的辨 識語音原則,而對自語音轉換處理模組2而輪入的波形訊 號進行處理,將語音音包區分為子音、風聲、以及母音部 份,並將對語音音包進行處理而取出首頻、以及尾頻,並 ——------裝--------訂 (請先閱讀背面之注咅?事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 15 15915
進到步驟23。 於步驟23,語音辨識處理模組4並根據辨識語音原 則’對语音音包進行子音、風聲、以及母音部份分別進行 識處理α及組合,語音辨識處理模、级4蔣辨識出的 子曰、母音部份’亦、或子音、母音部份、以及四聲變化予 以組合,並進到步驟24。 -於步驟24,語音辨識處理模組4並將所得出的語音組 合與通用的語音文字對應資料庫5進行比對,以得出語音 所對應的文字為何,並進到步驟2 5。 於步驟25,進行發聲者音色判別時,語音辨識處理模 組4根據語音辨識原則資料庫3中的辨識語音原則,將對 整個語音I包的冑波以及其上的調變鋸齒波邊緣,做分析 處理而可得到語音的音色特徵,而辨識出每個人的音色; 於進行發聲者情緒判斷時,語音辨識處理模組4根據語音 辨識原則資料庫3中的辨識語音原則,對整個語音音包的 曰量變化進行分析處理,整個語音音包的音量變化與音調 有關並代表說話者的情緒,而可得出說話者的情緒反應, 並將結束此語音辨識過程。 第4圖為一運作流程圖,用以更詳細地解釋於第2圖 中之對語音進行辨識之工作原理的流程程序。如圖中所 不’於步驟3 1,語音轉換處理模組2是用以將使用者所發 出的語音轉變為所對應之物理表徵波形訊號,並將此訊號 輸入到語音辨識模組4以供做語音辨識處理,並進到步驟 32 〇 -----I----I ^ · ---I---^--------^90 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(cns)A4規格(21〇 X 297公釐) 16 15915 508564 Α7 Β7 經濟部智慧財產局員工消費合作社印製 五、發明說明(17) 於步驟32,語音辨識模組4收到由語音轉換處理模组 2而來的波形訊號,根據語音辨識原則資料庫3中的辨識 m曰原則’經由为析、利用語音音包的表徵波形物理特性, 取出此波形的各項特徵參數出來,並進到步驟33。 於步驟33,依此波形的各項特徵參數,來辨識出子 音、風聲、以及母音的特徵,而對此波形訊號之語音音包 進行處理,將語音音包區分為子音、風聲、以及母音部份, 並將對語音音包進行處理而取出首頻、以及尾頻,並進到 步驟34。 於步驟34,待將波形區分為子音、風聲以及母音部 份後,語音辨識處理模組4並根據辨識語音原則,對語音 音包進行子音、風聲、以及母音部份分別進行辨識針對 子音、風聲、以及母音所具有的波形特徵進行判斷分析, 而得出子音部份所對應的文字子音為何,以及母音部份所 對應的文字母音為何,並進到步驟35。 於步驟35,組合所辨識出的文字子音以及文字母音, 語音辨識處理模組4將辨識出的子音、母音部份予以組 合,並進到步驟3 6。 於步驟36,語音辨識處理模組4並將所得出㈣音組 。與通用的語音文字對應資料庫5進行㈣,以得出語音 所對應的文字為何,結束此語音辨識過程。 第5圖為-運作流程圖,用以更詳細地解釋於第3圖 中之對語音進行語音辨識、音色、以及發音情緒判斷處理 之工作原理的流程程序。如圖中所示,於步驟Η,語音轉 K紙張尺度適用中國國家標準(CNS)A4規格(21() χ 297公釐)---------- 17 15915 (請先閱讀背面之注意事項再填寫本頁} 裝 • I Mmmmm -------
I n 1 I I 2 508564 A7
請 先 閱 讀 背 面 之 注 項屬 再_ 填, I裝 頁i 訂 漏 15915
18 A7 五、發明說明(19) 於步驟47 ,進行發聲者音色判別時,語音辨識處理模 、、4根據音辨識原則資料庫3中的辨識語音原則,將對 整個語音音包的載波以及其上的調變蘇齒波邊緣,做分析 處理而可得到語音的音色特徵,而辨識出每個人的音色; 於進行發聲者情緒判斷時,語音辨識處理模組4根據語音 I識原則資料庫3中的辨識語音原則,對整個語音音‘的 音量變化進行分析處理,整個語音音包的音量變化與音調 有關並代表說話者的情緒,而可得出說話者的情緒反應, 並將結束此語音辨識過程。 第6圖為一運作流程圖,用以更詳細地解釋於第*圖 中之辨識出使用者所發出之中文語音所對應的文字之工作 原理的流程程序。如圖中所示,於步驟5丨,語音轉換處理 模組2是用以將使用者所發出的語音轉變為所對應之物理 表徵波形訊號,並將此訊號輸入到語音辨識模組4以供做 #音辨識處理,並進到步驟52。 於步驟52,語音辨識模組4收到由語音轉換處理模組 2而來的波形訊號,根據語音辨識原則資料庫3中的辨識 語音原則’經由分析、利用語音音包的表徵波形物理特性, 取出此波形的各項特徵參數出來,並進到步驟53。 於步驟53,依此波形的各項特徵參數,來辨識出子 音、風聲、以及母音的特徵,而對此波形訊號之語音音包 進行處理,將語音音包區分為子音、風聲、以及母音部份, 並將對語音音包進行處理而取出首頻、以及尾頻,並進到 步驟54。 〈請先閱讀背面之注意事項再填寫本頁)
^ -I I I I ^ I I n I 1 I I I I 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 19 15915 五、發明說明(2〇) :步驟54,待將波形區分為子音、風聲、以及母音部 後 曰辨識處理模组4並根據辨識語音原則,對語音 :進行子音、風聲、以及母音部份分別進行辨識,針對 子:、風聲、以及母音所具有的波形特徵進行判斷、分析, 得出子曰部份所對應的文字子音為何,以及母音部份所 對應的文字母音為何,並進到步驟55。 裝 、;步驟55,浯音辨識處理模組4利用語音辨識原則資 ;斗庫3中的辨識語音原則,進行首頻、尾頻的運算判斷法 則,配合母音部份之頻率以及波形振幅外廊變化情形,辨 識出中文語音中的四聲變化,並進到步驟56。 於步驟56,組合所辨識出的文字子音、文字母音、以 及中文語音四聲變化,語音辨識處理模組4將辨識出的子 音、母音部份、以及中文語音四聲變化予以組合 步驟57。 § 於步驟57’語音辨識處理模組4並將所得出的語音組 通用的語音文字對應f料庫5進行比對,以得出語音 所對應的中文文字為何,結束此語音辨識過程。 、第7(a)圖為—不意圖,用以解釋語音波形的語音音包 組成特性結構。如圖中所 ^ '、,波形訊號之語音音包可分為 員 工 消 Γ緊後段’風聲和子音區都位於前段的區域 二::在風聲和子音區之後的即是母音區’而風聲的頻 曰:母音高出許多。在語音音包的前m區域内’ 曰、 早即可得到首頻,而在語音音包的 农後1/4區域内,任取幾^立 固曰包的平均頻率即可得到尾 氏張尺度適时關冢鮮(CNS)A4 20 15915
I 508564 五、發明說明(21) 圖中亦顯示出語音音包的載波以及其上的調變錯齒波 邊緣’以及語音音包的振幅音量變化。 立第7(b)圖為一示意圖,用以解釋子音、風聲、以及母 音部份。如圖中所示,一般的語音波形可分 、、 ㈢部份a、 風聲部份b、以及母音部份 一般的子音部份a ’可由子音波形而分成漸近音、爆 ^音、擠壓音、以及爆發音。漸近音之特徵為子音波形之 前後音僅量有增減,例如,中文之注音符號的厂丁、日、 A;爆擦音之特冑為子音波形之一段餘音冑,將冑為母音 波形’亦即,爆擦音子音波形之一段餘音後將連接一母音 波形,例如,中文之注音符號的门、匸、,、为、Η、· 擠壓音之特徵為子音波形為較慢之爆發音,例如,中文之 注音符號的虫、而爆發音之特徵為子音波形具有二個 至數個立即放大之波峰’例如,中文之注音符號的勺、女、
I 勺、六、《、5、〈。風聲部份μ頻率比子音和母音高 出許多。母音部份〇為緊接於子音後之波形區域。 經濟部智慧財產局員工消費合作社印製 第7(c)圖為一示意圖,用以解釋於第7(b)圖中子音區 的爆發音的波形特性。爆發音之特徵為子音波形具有^ 至數個立即放大之波峰,例如,中文之注音符號的、女、 幻、古、《、5、< 。 第7(d)圖為一示意圖,用以解釋於第7(b)圖中子音區 的爆擦音的波形特性。爆擦音之特徵為子音波形之一段2 音後’將變為母音波形,亦即’爆擦音子音波形之一段餘 音後將連接一母音波形,例如,中文之注音符號的门C、' 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公愛 21 15915 A7 A7 經濟部智慧財產局員工消費合作社印製
22 五、發明說明( 云、为、Η 。 第8圖為一示意圖’用以解釋於第·圖中之語音波 形之母音部份的組成特性結構。如同中所示之,在母音部 ^中所重複出現的音包波形區域,稱之為母音包,即圖 立的母曰包c°母音包〇為母音剛開始形成時所產生的母 曰小音包,而母音包1 5 q目丨丨达 至3則為母音開始重複時所產生的 母音小音包,而對於之徭沾#立& 傻的母曰包(例如4)則依此類推。在 此’所謂的切割音包’就是將母音波形分割出q/i/2/3等 等的獨立母音小音包,即母音包。 第9圖為一示意圖,用以解釋於第7(b)圖中之語音波 形之母音部份的組成特徵參數。如圖中所示之’根據分啤 出的母音包可找出特徵參數,例如’轉折數、波數、以及 斜,率。在此’所謂的轉折數,為圖中波形有方框的部份, 而方框中的轉折處稱之為轉折點。至於波數則為母音包中 波形通過X方向零軸的次數,以圖為例波形共有四個過 零即波數為4。斜率則為圖中之卜號方框和&號方框 之間的斜率或取樣個數。而得到以上三個母音包參數後, 以規則來辨識出母音。例如,丫為波數 > =斜率若不符合 此It況則為r,或丫為波數〉=6,轉折數<1(),若不符合此 情況則^一。廿為轉折數>波數;或廿為波數=3,轉折數 <13右不符合此情況則為一。一為轉折數〉波數;或一為 波數4 5’轉折數>3倍波數。乙為波數=3,轉折數〈6。 乂為波數=2,轉折數<5若不符合此情況則為一;或波數 =1,轉折數<7,若不符合此愔況.目,丨良 15915 I----------裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 508564 A7 五、發明說明(23) 於判斷四聲變化時,在語 術龜加* A h τ 曰曰包的前1/4區域内,任 取邊個目包的平均頻率即可得到首頻, 立 後1/4區域内,任取幾個音包 叩曰日匕、瑕 C請先閱讀背面之注意事項再填寫本頁} 的千均頻率即可得到尾頻。 所謂”相差幾點,,的「點是 J疋私取樣的點數,與頻率有 =,例如以麵2為取樣頻率,則相當於每m刪秒會 ! 一個取樣點’即於1秒取樣時間内有11K個取樣點,而 右以5〇ΚΗζ為取樣頻率,則相當於每ι/5_秒會有一個 取樣點’即於1秒取樣時間内有观個取樣點,亦即於i 秒的時間内,取樣點的數目即為頻率數字。 待取出首頻以及尾頻後,利用判斷規則· 1·當首頻以及尾頻相差四點’將可判得語音聲 發音之一聲; 2.當首頻以及尾頻相差五點,並且首頻高於尾頻時將可 判得語音聲調為中文字發音之一聲,亦或二聲; 經濟部智慧財產局員工消費合作社印製 3·當尾頻高於首_,且尾頻減去首頻之值大於首頻的一半 時,將可判得語音聲調為中文字發音之四聲;以及 ^將用首頻以及尾頻來分辨中文字發音之三聲以及四聲; 右女生所發出之語音聲調的首頻小於38點時,則將所判得 的聲調歸為四聲;若女生所發出之語音聲調的首頻大於6〇 點時,則將所判得的聲調歸為三聲;若男生所發出之語音 聲調的首頻小於80點時,則將所判得的聲調歸為四聲;以 及,若男生所發出之語音聲調的首頻大於92點時,則將所 判得的聲調歸為三聲。 於判別音色時,對整個語音音包的載波以及其上的調 本紙張尺度適用中國國家標準(CNS)A4規格(21G X 297公羞) 15915 23 508564 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(24) 變錯齒波邊緣,做分析處理而可得到語音的音色特徵。語 音音包的載波為語音波形的鋸齒狀邊緣,每個人所發出的 語音所對應之波形的語音音包上的載波之頻率以及振幅變 化均不相同,應用辨識語音原則對整個語音音包做分析處 理而可得到語音的音色特徵。 於判別情緒反應時’對語音音包的振幅進行分析,對 語音音包的音量變化、音調高低進行分析、處理,而得出 說話者的情緒反應,此情緒反應與語音音包的音量變化、 音調高低有關。 第10圖為一示意圖,為關於中文四聲聲調變化的聲調 頻率統計。如圖所示,例如,當發聲聲調頻率介於259ilz 至344Hz之間時,所發聲調為一聲,·而當發聲聲調頻率介 於182Hz至196Hz之間時,所發聲調為二聲;當發聲聲調 頻率介於220Hz至225Hz之間時,所發聲調為三聲;以及, 當發聲聲調頻率介於176Hz至206Hz之間時,所發聲調為 四聲。 第11圖為一示意圖,用以說明[巴]字的子音以及母音 部份的波形,並應用辨識語音原則進行識別。如圖所示, 子音部份為爆發音勹,母音包中波數為六,斜率為五,波 數 >斜率,故母音為丫。因此組合子音、以及母音可得勺 丫音。再配合聲調檢查,即可分辨出[勹丫]、[勹丫/]、[勺 丫 V]、以及[勹丫\]。 綜合以上的實施例以及方法,我們可以得到本發明之— 種語音辨識方法及系統,在無須事先建立每個人專屬之個 ----------I — Aw - ------—訂· — 丨—丨丨- (請先閱讀背面之注咅?事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 24 15915 508564 A7 五、f明說明(25) 人語音與文字的對應資料庫情 障元下,應用辨識語音原則, 以通用的語音文字對應資料庫, 渾朿分析、判別語音所對應 之表徵波形的物理特性,語音 (請先閱讀背面之注意事項再填寫本頁)
㈢辨識系統應用語音辨識原 則,而將語音音包區分為早A 曰、風聲、以及母音部份,並 經濟部智慧財產局員工消費合作社印製 對整個語音音包進行處理而取出首頻、以及尾頻,對子音、 風聲、以及母音部份分別進行辨識、處理、以及組合。將 子音以及母音予以組合後,應用辨識語音原則,對由子音 與母音所構成的語音以及通用的語音文字對應資料庫進行 比對,以得到發聲者發出之語音所對應的文字為何。應用 辨識語音原則,對整個語音音包的載波以及其上的調變鋸 齒波邊緣,做分析處理而可得到語音的音色特徵。應用辨 識居音原則對整個語音音包的音量變化、音調高低進行分 析、處理,而得出說話者的情緒反應,此情緒反應與語音 曰包的S里變化、音調高低有關。除了能利用子音以及母 音的組合,而辨識出語音所對應的文字外,尚能利用首頻、 尾頻的運算判斷法則,配合母音部份之頻率以及波形振幅 外廓變化情形,辨識出中文語音中的四聲變化。以子音以 及母音的組合,加上中文語音中的四聲變化,而得以正確 地辨識出中文發音所對應的中文字。亦即,此語音辨識方 法及系統除了可辨識出無四聲變化的語音所對應的文字之 外,尚可辨識出具有四聲變化的中文語音所對應出的中文 字。’係將一般人所發出來的語音,利用語音的表徵波形 物理特性,而將語音區分為子音以及母音部份,再分別對 子音以及母音進行辨識、處理、以及組合,而能辨識出人
本紙張尺度週用中國國家標準(CNS)A4WT21〇x297公IT 25 15915 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(26) 所發出的語音所對應的文字。對於具有四聲變化的中文語 曰而0 ’經由判斷語音中的母音部份之波形振幅外廓變化 隋开而分辨出中文語音中的四聲變化,不但可辨識出中 文阳曰’並可分辨出同一中文語音的不同四聲變化,而得 以正確地辨識出中文發音所對應的中文字為何。亦即,除 了可辨識出無四聲變化的語音所對應的文字之外,還可辨 識出具有四聲變化的中文語音所對應出的中文字。此語音 辨識方法及系統的優點有; L使用者可在無須事先建立其專屬的語音文字對應資料庫 的情況下’應用辨識語音原則以及通用的語音文字對應資 料庫’根據使用者所發出的語音,而得以辨識出所發出之 语音為何。 2·將使用者所發出的語音音包區分為子音、風聲、以及母 曰部份’並對整個語音音包進行處理而取出首頻、以及取 出尾頻’配合母音部份之頻率以及波形振幅外廓變化情 形’而得以辨識出使用者所發出的語音所對應的文字、以 及分辨出具有聲調變化的語音聲調,辨識出使用者所發出 的語音所對應的中文文字、以及分辨出中文語音中的四聲 變化所對應的中文文字。 3·對整個語音音包的載波以及其上的調變鋸齒波邊緣,做 刀析處理而可得到語音之音色特徵,而辨識出發聲者的音 色’對整個語音音包的音量變化進行分析處理而可得出說 話者的情緒反應。 以上所述僅為本發明之較佳實施例而已,並非用以 ·,----------1·裝----------—訂---------· (請先閱讀背面之注音?事項再填寫本頁) 本紐尺度翻中關家標準_(CNS)A4規‘⑽χ 297公|__)_ 26 15915 508564 A7 _B7 五、發明說明(27) 定本發明之範圍;凡其它未脫離本發明所揭示之精神下所 完成之等效改變或修飾,均應包含在下述之專利範圍内。 [元件符號說明] 1 語音辨識系統 2 語音轉換處理模組 3 語音辨識原則資料庫 4 語音辨識處理模組 5 語音文字對應資料庫 (請先閱讀背面之注音?事項再填寫本頁) 裝-----—訂--------- 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 27 15915
Claims (1)
- i08564 H3 1 第8 9 1 ο 9 3 12號專利申請案 申請專利範圍修正本 I 一種語音辨識方法,在盤項 (91年7月31曰) 次在無須事先建立每 語音與文字的對應資料庫情形 _之個人 及通用的語音文字Si #^ ,用辨識語音原則以 w… 4庫,來辨識語音,此-立辨 識方法包含以下程序; 日此扣曰辨 (1)使用者所發出的語音經由 形; 处理而變成語音波 ⑺將語音波形之語音音包分為不 (3 )對語音音包的不同部份分料以辨= (4) 將辨識出的子音以及母音進行 音所對應的文字為何;以及 、'口 ’以判斷出語 (5) 將結束此語音辨識過程。 ::如申請專利範圍第1項之語音辨識方 波形之語音音包分為不同部份步驟,_;立、中將語音 音包分為子音、風聲、以及母音部份曰波形之語音 •如申請專利範圍第2項之語音辨讅古、+ 叫乃法,其中,蔣纽立 波开)之語音音包分為子音、風聲 、曰 工立加八 及母音部份步驟, 子音部份之波形可為漸近音,爆摻立 立 ^日,擠壓音,或爆發 曰,母曰邛份含有重複出現的音包 认你七 夜形區域,風聲部份 的頻率比子音.以及母音部份高出許多。 |4·如申請專利範圍第2項之語音辨 I %乃法,其中,將語音 波形之語音音包分為子音、風聲、 乂及母音部份步驟, 子音部份之波形可為漸近音,爆捧立 $曰,擠壓音,或爆發 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297~^y 1 1S91S 年月日m 補充音’母音部份含有重複出現的音包波形區域,母音部份 的組成特徵參數包含轉折數、波數、以及斜率,風聲部 份的頻率比子音以及母音部份高出許多。 6. 如申請專利範圍第2、3或4項之語音辨識方法,其中, 對語音音包的不同部份分別予以辨識步驟,將對母音部 份含有重複出現的音包波形區域進行切割,對語音波形 之子音部份以及母音部份予以辨識。 一種語音辨識方法,在無須事先建立每個人專屬之個人 語音與文字料應資料庫情料,制辨㈣音原則以 及通用的浯音文字對應資料庫,來辨識語音,此語音辨 識方法包含以下程序; (1) 將使用者所發出的語音訊號轉變為所對應的表 徵波形,將語音訊號先經由處理而變成語音波形; (2) 經由分析、利用語音的表徵波形物理特性,取出 此波形的各項特徵參數,· (3) 依此波形的各項特徵參數,來辨識出子音、風 聲、以及母音的特徵,而將語音所對應的波形區分為子 音、風聲、以及母音部份; 經濟部中央標準局員工福利委員會印製 (4) 待將波形區分為子音、風聲、以及母音部份後, 針對子音以及母音所具有的波形特徵進行判斷、分析, 而得出子音部份所對應的文字子音為何,以及母音部份 所對應的文字母音為何,· (5) 組合所辨識出的文字子音以及文字母音,並得出 組合之語音所代表對應的文字為何;以及 (6) 結束此語音辨識過程。 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公爱) 15915 7·如申請專利範圍第6項之語音辨識方 祕求 叫乃凌,其中,將語音 ::之語音音包分為子音、風聲、以及母音部份步驟, :曰部份之波形可為漸近音,爆擦纟,擠壓音,或爆發 二^音部份含有重複出現的音包波料域,風聲料 的頻率比子音以及母音部份高出許多。 8. 如申請專利範圍第6項之語音辨識方法,其中,將狂立 ::之語音音包分為子音、風聲、以及母音部份步;: I曰部份之波形可為漸近音,爆擦音,擠壓音,或爆發 曰,母音部份含有重複出現的音包波形區域,母音部份 的組成特徵參數包含轉折數 '波數、以及斜率,風聲部 份的頻率比子音以及母音部份高出許多。 9. 如申請專利範圍第6、7或8項之語音辨識方法,其中, 針對子音以及母音所具有的波形特徵進行判斷、分析, 將對母音部份含有重複出現的音包波形區域進行切 割0 10.—種語音辨識方法,在無須事先建立每個人專屬之個人 語音與文字的對應資料庫情形下,利用辨識語音原則以 及通用的語音文字對應資料庫,來辨識語音,此語音辨 識方法包含以下程序; (1) 使用者所發出的語音經由處理而變成語音波 形; ° (2) 將語音波形之語音音包分為不同部份, 音包選取首頻以及尾頻; ι個 (3) 對語音音包的不同部份分別予以辨識,並利用首 頻、尾頻的運算判斷法則,辨識出語音中的聲調變化; 本紙張尺度適用中國國家標準(CNS) Α4規格(21〇 χ 297公釐) 15915 H3 (4) 將辨識出的子音、母音、以芬鼓 芬㈢以及聲調變化進行組 合,以判斷出語音所對應的文字為何;以及 (5) 將結束此語音辨識過程。 如申請專利範圍第1〇項之語音辨識方法,其中,將語 ::形之語音音包分為不同部份步驟,將語音波形之語 曰音包分為子音、風聲、以及母音部份。 12·如申請專利範圍第u項之語音辨識方法’其中,將語 音波形之語音音包分為子音、風聲、以及母音部份步 驟,子音部份之波形可為漸近音,爆擦音,擠壓音,或 爆發音’母音部份含有重複出現的音包波形區域,風聲 部份的頻率比子音以及母音部份高出許多。 13·如申請專利範圍第n項之語音辨識方法,其中,將語 曰波开7之浯音音包分為子音、風聲、以及母音部份步 驟,子音部份之波形可為漸近音,爆擦音,擠壓音,或 爆發音,母音部份含有重複出現的音包波形區域,母音 部伤的組成特徵參數包含轉折數、波數、以及斜率,風 聲部份的頻率比子音以及母音部份高出許多。 經濟部中央標準局員工福利委員會印製 14. 如申請專利範圍第11、12或13項之語音辨識方法,其 中’對語音音包的不同部份分別予以辨識並利用首頻、 尾頻的運算判斷法則,辨識出語音中的聲調變化的步 驟,將對母音部份含有重複出現的音包波形區域進行切 割’對語音波形之子音部份以及母音部份予以辨識。 15. 如申請專利範圍第丨丨項之語音辨識方法,其中,將語 音波形之語音音包分為不同部份,並對整個音包選取首 頻以及尾頻步驟,對整個語音音包的前1/4選取平均頻 本紙張尺度適用中國國家標準(CNS) A4規格(21〇χ 297公釐) 4 15915經濟部中央標準局員工福利委員會印製 =:頻、並對整個語音音包的後1/4選取平均頻率 16 專:f圍第15項之語音辨識方法,其中,將語 驟/二浯音音包分為子音、風聲、以及母音部份步 3發19部份之波形可為漸近音,爆擦音,㈣音,或 ^曰,母音部份含有重複出現的音包 ^ 部份的艇盅π日匕波形&域,風聲 的頻率比子音以及母音部份高出許多。 17:申請專利範圍第15項之語音辨識方法,其中,將# 音波形之語音音包分為子音、風聲、以及母音部份/ 驟,子音部份之波形可為漸近音,爆擦音,擠壓音/或 爆發音,母音部份含有重複出現的音包波形區域,母音 f伤的組成特徵參數包含轉折數、波數、以及斜率,風 聲4伤的頻率比子音以及母音部份高出許多。 18.如申請專利範圍第15、16或17項之語音辨識方法,其 中,對語音音包的不同部份分別予以辨識並利用首頻/、、 尾頻的運算判斷法則,辨識出語音中的聲調變化的步 驟’將對母音部份含有重複出現的音包波形區域進行切 剔,對語音波形之子音部份以及母音部份予以辨識。 19· 一種語音辨識方法,在無須事先建立每個人專屬之個人 語音與文字的對應資料庫情形下,利用辨識語音原則以 及通用的語音文字對應資料庫,來辨識語音,此語音辨 識方法包含以下程序; (1) 將使用者所發出的語音訊號轉變為所對應的表 徵波形,將語音訊號先經由處理而變成語音波形; (2) 經由分析、利用語音的表徵波形物理特性,取出 本紙張尺度適用中國國家標準(CNS) A4規格(210 x 297公釐) 159155 Η3 此波形的各項特徵參數,並對整個音包選取首頻以及尾 頻; (3) 依此波开^的各項特徵參數,來辨識出子音、風 聲、以及母纟的特冑,語音所對應的波形區分為子 音、風聲、以及母音部份; (4) 待將波形區分為子音、風聲、以及母音部份後, 針對子音以及母音所具有的波形特徵進行判斷、分析, 而得出子曰部伤所對應的文字子音為何,以及母音部份 所對應的文子母音為何,並利用首頻、尾頻的運算判斷 法則’辨識出語音中的聲調變化; ⑺將辨識出的子音、母音、以及聲調變化進行組 合’以判斷出語音所對應的文字為何;以及 (6)結束此語音辨識過程。 20.如申請專利範圍第19項之語音辨識方法,其中,將語 音波形之語音音包分為子音、風聲、以及母音部份步 驟,子音部份之波形可為漸近音,爆擦音,擠壓音,或 爆發音,母音部份含有重複出現的音包波形區域,風聲 部份的頻率比子音以及母音部份高出許多。 經濟部中央標準局員工福利委員會印製 21·如申請專利範圍第19項之語音辨識方法,其中,將费 音波形之語音音包分為子音、風聲、以及母音部份步 驟,子音部份之波形可為漸近音,爆擦吾,擠壓音7广或 爆發音’母音部份含有重複出現的音包波形區域7母音 部份的組成特徵參數包含轉折數、波數、以及斜率,^ 聲部份的頻率比子音以及母音部份高出許多。 22·如申請專利範圍第19、2〇或21項之語音辨識方 本紙張尺度_中_家標^T^NS) Α4規袼(210 X 297公釐) 6 H3 二::::以及母音所具有的波形特徵進行判斷、分 割。母日部份含有重複出現的音包波形區域進行切 23=申請專利範圍第19項之語音辨識方法,其中,經由 2、利用語音的表徵波形物理特性,取出此波形的各 =徵參數,並對整個音包選取首頻以及尾頻步驟 音音包的前1/4選取平均頻率做為首頻、並對整 曰音包的後1/4選取平均頻率做為尾頻。 24·如申請專利範圍第19項之語音辨識方法,其中,依此 波形的各項特徵參數,來辨識出子音、風聲、、以及:立 的特徵,而將語音所對應的波形區分為子音、風聲、二 $母音部份步驟,子音部份之波形可為漸近音,爆择 :,擠壓音’或爆發音’母音部份含有重複出現的Υ包 :形區域,風聲部份的頻率比子音以及母音部份高出許 h·如申請專利範圍第19項之語音辨識方法,其中,依 波形的各項特徵參數,來辨識出子音、風聲、以及母立 的特徵,而將語音所對應的波形區分為子音、風聲曰 及母音部份步驟,子音部份之波形可為漸近音,爆^ 音’擠壓音,或爆發音’母音部份含有重複出現的音T、 波形區域’母音部份的組成特徵參數包含轉折數'波 數、以及斜率’風聲部份的頻率比子音以及母音 出許多。 Μ ^ 26.如申請專利範圍第23、24或25項之語音辨識方法,農 中,對浯音音包的不同部份分別予以辨識並利用首頻 15915 ❿ 經濟部中央標準局員工福利委員會印製本紙張尺度·+ _家鮮(2iJ7297公爱f 5085^; H3 =:算:斷法則,辨識出語音中的聲調變 2將對母音部份含有重複出現的音包波形區域進行切 』,對語音波形之子音部份以及母音部份予以 27.如申請專利範圍第10、11、12、13 1ς S 。 沒立她堪 15或16項所述之 ^曰辨識方法,乃應用於辨識中文語音 认=請專利範圍第17、19、2()或21^所述之語音 方法’乃應用於辨識中文語音。 5 29·如申請專利範圍第23、24或25 法,乃應用於辨識中文語音。、以之語曰辨識方 =㈣系統,在無須事先建立每個人專屬之 為音與文字的對應資料庫愔 及立 利用辨識語音原則以 及通用的浯音文字對應資料庫, 識系統包含; 果辨識語音,此語音辨 人語音辨識原則資料庫,此語音辨識原則資料庫中包 =識語音原則,此些語音辨識原則用來對語音音包進 將語音音包區分為子音、風聲、以及母音部份, 日、風聲、以及母音部份分別進行辨識,以判斷 出子Γ及母音為何,並將辨識出的子音、母音部份予 以組合’並將所得出的語音組合與語音文字對應資料庫 進订比對,以得出語音所對應的文字為何. 庫二音八t字立對應資料庫,此通用的語音文字對應資料 庫則包含語音所對應的文字資料庫,語音由子音、母立 :ΓΓ=音具有相對應的文字,語音與文字“ ί應,、.且“曰而得出所發出的語音所代表的文字,· 換處二,此語音轉換處理模組是用以將 度適用中國國家標準 8 15915H3 、斤發出的居音轉變為所對應之物理表徵波形訊 〜、、將此訊號輸人到語音辨識模組以供做語音辨識處 理;以及 立胃辨識處理模組,此語音辨識處理模組則根據語 、辨識原貝〗貝料庫中的辨識語音原則,*對此波形訊號 進订處理,將語音音包區&為子音、風_、以及母音部 、二9辨識處理模組並根據辨識語音原則,對語音音 包進行子音、鱗、以及母音部份分別進行辨識、處理、 =及組合,語音辨識處理模組將辨識出的子音、母音部 伤予以、、且合,亚將所得出的語音組合與通用的語音文字 ,對應『料庫進打比對,以得出語音所對應的文字為何。 几2語音辨識系統,在無須事先建立每個人專屬之個人 語音與文字的對應資料庫情形下,利用辨識語音原則以 及通用的語音文字對應資料庫,來辨識語音,此語音辨 識系統包含; . 語音辨識原則資料庫,此語音辨識原則資料庫中包 含辨識語音原則,此些語音辨識原則用來對語音音包進 行處理曰音包區分為子音、風聲、以及母音部份, 經濟部中央標準局員工福利委員會印製 並取出語音音包的首頻、以及尾頻,利用語音辨識原則 對子音、風聲、以及母音部份分別進行辨識,以判斷出 子音以及母音為何,語音辨識原則並以首頻、尾頻的運 算判斷法則’配合母音部份之頻率以及波形振幅外廊變 化情形,而辨識出中文語音中的四聲變化,語音辨識原 則並可將辨識出的子音、母音部份,亦或子音、母音邛 份、以及四聲變化予以組合,並將所得出的語音组合鱼 本紙張尺度適用中國國家標準(CNS) A4規格(21G x 297&爱了 15915 508564 語音文字對應資料庫進行比對,以得出語音所對應的文 字為何; 語音文字對應資料庫,此通用的語音文字對應資料 庫則包含語音所對應的文字資料庫,語音由子音、母 音,亦或由子音、母音、以及四聲變化所組合而成,語 音具有相對應的文字,語音與文字互相對應,組合語音 而得出所發出的語音所代表的文字; 語音轉換處理模組,此語音轉換處理模組是用以將 使用者所發出的語音轉變為所對應之物理表徵波形訊 號,並將此訊號輸入到語音辨識模組以供做語音辨識處 理;以及 經濟部中央標準局員工福利委員會印製 語音辨識處理模組,此語音辨識處理模組則根據語 音辨識原則資料庫中的辨識語音原則,而對此波形訊號 進行處理,將語音音包區分為子音、風聲、以及母音部 份,並將對語音音包進行處理而取出首頻、以及尾頻, 語音辨識處理模組並根據辨識語音原則,對語音音包進 行子音、風聲、以及母音部份分別進行辨識、處理、以 及組合,語音辨識處理模組將辨識出的子音、母音部 份,亦或子音、母音部份、以及四聲變化予以組合,並 將所得出的語音組合與通用的語音文字對應資料庫進 行比對,以得出語音所對應的文字為何。 32.—種語音辨識系統,在無須事先建立每個人專屬之個人 語音與文字的對應資料庫情形下,利用辨識語音原則以 及通用的語音文字對應資料庫,來辨識語音,此語音辨 識系統包含; 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) 10 15915 語音辨識原則資料庫,此語音辨識原則資料庫中包 含辨識語音原則,此些辨識語音原則包含區分語音音包 為子曰風聲、以及母音部份的規則、取出語音音包首 頻以及尾頻的規則、辨識子音、風聲、以及母音的規則、 辨識四聲邊化的規則、組合子音與母音的規則、組合子 音母音與四聲變化的規則、辨識語音音包音色的規則、 以及辨識語音音包音量變化的規則,此些語音辨識原則 用來對語音音包進行表理,將語音音包區分為子音、風 聲、以及母音部份,並取出語音音包的首頻、以及尾頻, 利用語音辨識原則對子音、風聲、以及母音部份分別進 行辨識,以判斷出子音以及母音為何,語音辨識原則並 以首頻、尾頻的運算判斷法則,配合母音部份之頻率以 及波形振幅外廓變化情形,而辨識出中文語音中的四聲 變化’語音辨識原則並可將辨識出的子音、母音部份, 亦或子音、母音部份、以及四聲變化予以組合,並將所 得出的語音組合與語音文字對應資料庫進行比對,以得 出語音所對應的文字為何; 經濟部中央標準局員工福利委員會印製 語音文字對應資料庫,此通用的語音文字對應資料 庫則包含語音所對應的文字資料庫,語音由子音、母 音,亦或由子音、母音、以及四聲變化所組合而成,語 音具有相對應的文字,語音與文字互相對應,組合語音 而得出所發出的語音所代表的文字; 語音轉換處理模組,此語音轉換處理模組是用以將 使用者所發出的語音轉變為所對應之物理表徵波形訊 號,並將此訊號輸入到語音辨識模組以供做語音辨識處 本紙張尺度適(cii3_A4規格(210 x 297公釐)------- 15915 50856蜇 Ο ί* - • i厂 H3 理;以及 語音辨識處理模組,此語音 音辨識原則資料庫中的㈣處理模組則根料 二:’將語音音包區分為子音、風聲、以及母音部 :4=語音音包進行處理而取出首頻、以及尾頻, 識處理模組並根據辨識語音原則,對語音音包進 二子二、風聲、以及母音部份分別進行辨識、處理、以 、、、且口,語音辨識處理模組將辨識出的子音、母音部 份’亦或子音、母音部份、以及四聲變化二人曰:並 將所得出的語音組合與、 ^ ^ ; σ 9文子對應資料庫進 订比對,以付出語音所對應的文字為何。 t申=範圍第3°、31或32項之語音辨識系統,其 T 該浯音辨識處理模組為電腦主機。 如申請專利範圍第30、31或32項之語音辨識李統,立 中=語音辨識處理模組為電腦主機,且語音辨識原則 — 貝料庫、以及語音文字對應資料庫儲存於電腦之記憶裝 置内。 經濟部中央標準局員工福利娄員會印製本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 15915 12
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW89109312A TW508564B (en) | 2000-05-16 | 2000-05-16 | Method and system for phonetic recognition |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW89109312A TW508564B (en) | 2000-05-16 | 2000-05-16 | Method and system for phonetic recognition |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW508564B true TW508564B (en) | 2002-11-01 |
Family
ID=27656818
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW89109312A TW508564B (en) | 2000-05-16 | 2000-05-16 | Method and system for phonetic recognition |
Country Status (1)
| Country | Link |
|---|---|
| TW (1) | TW508564B (zh) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7917361B2 (en) | 2004-09-17 | 2011-03-29 | Agency For Science, Technology And Research | Spoken language identification system and methods for training and operating same |
| US8380520B2 (en) | 2009-07-30 | 2013-02-19 | Industrial Technology Research Institute | Food processor with recognition ability of emotion-related information and emotional signals |
| US8407058B2 (en) | 2008-10-28 | 2013-03-26 | Industrial Technology Research Institute | Food processor with phonetic recognition ability |
| TWI408675B (zh) * | 2009-12-22 | 2013-09-11 | Ind Tech Res Inst | 結合語意辨識功能之食品製造裝置 |
| US9190051B2 (en) | 2011-05-10 | 2015-11-17 | National Chiao Tung University | Chinese speech recognition system and method |
| CN108470476A (zh) * | 2018-05-15 | 2018-08-31 | 黄淮学院 | 一种英语发音匹配纠正系统 |
-
2000
- 2000-05-16 TW TW89109312A patent/TW508564B/zh not_active IP Right Cessation
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7917361B2 (en) | 2004-09-17 | 2011-03-29 | Agency For Science, Technology And Research | Spoken language identification system and methods for training and operating same |
| US8407058B2 (en) | 2008-10-28 | 2013-03-26 | Industrial Technology Research Institute | Food processor with phonetic recognition ability |
| US8380520B2 (en) | 2009-07-30 | 2013-02-19 | Industrial Technology Research Institute | Food processor with recognition ability of emotion-related information and emotional signals |
| TWI408675B (zh) * | 2009-12-22 | 2013-09-11 | Ind Tech Res Inst | 結合語意辨識功能之食品製造裝置 |
| US9190051B2 (en) | 2011-05-10 | 2015-11-17 | National Chiao Tung University | Chinese speech recognition system and method |
| CN108470476A (zh) * | 2018-05-15 | 2018-08-31 | 黄淮学院 | 一种英语发音匹配纠正系统 |
| CN108470476B (zh) * | 2018-05-15 | 2020-06-30 | 黄淮学院 | 一种英语发音匹配纠正系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4536323B2 (ja) | 音声−音声生成システムおよび方法 | |
| JP4914295B2 (ja) | 力み音声検出装置 | |
| JPS6147440B2 (zh) | ||
| WO2005034082A1 (en) | Method for synthesizing speech | |
| JPH08263097A (ja) | 音声のワードを認識する方法及び音声のワードを識別するシステム | |
| JPH0713594A (ja) | 音声合成において音声の質を評価するための方法 | |
| JPH05165486A (ja) | テキスト音声変換装置 | |
| TW508564B (en) | Method and system for phonetic recognition | |
| JP2001318915A (ja) | フォント変換装置 | |
| JP6289950B2 (ja) | 読み上げ装置、読み上げ方法及びプログラム | |
| JP3808732B2 (ja) | 音声認識方法及びそのシステム | |
| JP3029403B2 (ja) | 文章データ音声変換システム | |
| KR100554950B1 (ko) | 한국어 대화체 음성합성시스템의 특정 형태에 대한 선택적운율 구현 방법 | |
| JPH05224688A (ja) | テキスト音声合成装置 | |
| KR100334127B1 (ko) | 자동 통역/번역 장치와 그 방법 | |
| JP2664785B2 (ja) | 音声認識装置 | |
| JP3142160B2 (ja) | 発音記号生成装置 | |
| JPH05313685A (ja) | 文章読み上げ装置 | |
| JPS6386652A (ja) | 電話着呼情報提供システム | |
| JPH03249800A (ja) | テキスト音声合成装置 | |
| JP2003108170A (ja) | 音声合成学習方法および音声合成学習装置 | |
| TW476060B (en) | Smoothening apparatus and method for quick synthesized voice | |
| JP2584222B2 (ja) | 音声合成装置 | |
| JPS6027433B2 (ja) | 日本語情報入力装置 | |
| Ahmad et al. | Towards designing a high intelligibility rule based standard malay text-to-speech synthesis system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| GD4A | Issue of patent certificate for granted invention patent | ||
| MM4A | Annulment or lapse of patent due to non-payment of fees |