TW201017647A

TW201017647A - Auxiliary speech correcting device and method

Info

Publication number: TW201017647A
Application number: TW97139801A
Authority: TW
Inventors: Ming-Hsiang Yen; Jui-Yu Yen; Ping-Hsia Chao
Original assignee: Micro Star Int Co Ltd
Priority date: 2008-10-16
Filing date: 2008-10-16
Publication date: 2010-05-01

Description

201017647 九、發明說明：【發明所屬之技術領域】本發明是一種矯正發音的方法及裝置，特別是一種可迅速發現使用者發音問題之辅助矮正發音的方法及裝置。【先前技術】語言學習的過程之中，人們常常需要藉由各種不同的語言工具書，來辅助其學習語言’如電子辭典、個人電腦(pers〇nal Computer)及個人數位助 • 理(Personal Digital Assist, PDA)等，並經由軟體執行的方式進行語言學習的功能’其語音發音係將句子或單字以預錄方式儲存於電腦系統内，播放後讓使用者聽到正確的發音。或者同時提供錄音的功能，使用者操作電滕系統使其進行錄音作業，而可供使用者聆聽自己的聲音，藉此操作模式就可以達到橋正自己發音正痒性以及語言學習的效果。如中華民國發明公開第200713200號專利「互動式矮正發音的裝置與方法」’係利用參考音及使用者發音進行分析，並產生發音參數，再根據參 φ 考音並將使用者發音修改成正確的發音’藉以輔助使用者學習正確的發音；中華民國發明公告第556152號專利「自動標示音標以矯正發音之使用者介面、系統及方法」，係於使用者提供一個文句字串並輸入其相對的聲音訊號之後，在輸入聲音訊號的各個區段標示出其對應的音標，續以區段之對應音標以比對出教學者聲音訊號與學習者聲音訊號之間的差異，如各個音節的發音、音高、強度、長短的差異等，並據此進行評分或提出改善建議。上述前案並無法讓使用者無法真正了解正發音錯誤的情形，僅能依據 5 201017647 個人主觀判斷語言發音語調的正確性β因此，如何讓教學者瞭解每一位學習者的發音錯誤，或讓學習者了解自己發音上的錯誤，並讓教學者可以根據分析後的結果，提供學習者後續的辅助及矯正，是一個刻不容緩的待解決課題。【發明内容】有鑑於此’本發明提出一種辅助橋正發音的方法，係先提供範例句及複數錯誤規則’其中，範例句包含複數參考音素，且一個錯誤規則對應一 φ 個參考音素’此後再接收使用者發音，並辨識使用者發音為複數發音音素，於辨識完成後比對複數發音音素與複數錯誤規則，並記錄複數發音音素符合複數錯誤規則之錯誤次數。本發明亦提翻助矯正發音的裝置，包含：減模組、接收模組、辨識模組、_歡、比職組。播放模組肋獄包含複數參考音素之範例句。無輸接餘仙者錄個㈣翻之者發音後，經由辨識模靖識使料發音為複數發音音素。規聰組提供與細句相對應 #之複數錯誤規則’其中，-個錯誤規則對應一個參考音素。比對模組比對複數發音音素與複數錯誤規則。 - 本個之魏在於’學習者可依據細句Μ發出使用者發音，即會 ._者發音域·音音素，並職錄料素純錢則進行㈣’ 音素符合複數錯則之錯誤次數，學習者即可藉由錯誤次數了解自己發音上容易發生的錯誤，教學者亦可根據分析後的結果’快速掌握每-學習者發音的錯誤，並依據每一學習者不同之發音錯誤提供適當的後續辅助及矯正。 201017647 以下在實施方式中詳細敘述本發明之詳細特徵以及優點，其内容足以使任何熟習相關技藝者瞭解本發明之技術内容並據以實施，且根據本說明書所揭露之内容、申請專利範圍及圖式，任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。【實施方式】如「第1圖」所示，為顯示本發明之輔助矯正發音的裝置。本發明之辅助綠正發音的裝置，包含：播放模組20、接收模組3〇、辨 φ 識模組40、規則模組50、比對模組60 » 播放模組20以聲音或影像等方式播放範例句，在此，範例句可由複數單字所組成，每一單字具有至少一參考音素，如範例句為1 _ a b〇y.」，係由「I」、「am」、「a」、「boy」等四個單字所組成，且其參考音素為a〇$m D bCO。此外，組成範例句之單字可儲存於字典9〇内，並於字典9〇内儲存與每一單字對應之參考音素’在此所述之字典9〇係為一般市面上之英夬、英漢、漢央等字典、辭典並將其資料儲存於記憶單元内，但本發明 φ 不以此為限。接收模組30於使用者依據播放模組20之範例句發出使用者發音後，接收使用者所發出之使用者發音，以作為後續判斷使用者發音是否正確之基準。辨識模組40於接收使用者所發出之使用者發音後，辨識使用者發音為複數發音音素，如辨識使用者發音為a〇 Gm D bCO。其中，辨識模組4〇可以直接聲波比對或聲學模型比對進行辨識，且聲學模型較佳地可為隱藏式馬可夫模型(Hidden Markov Model，HMM)，但本發明不限於此，聲學模型 201017647 亦可為神_路(1^1«:〇1 Networics)、域_校準Time ’㈣， DTW)或語音模版比對(Template Matching)。規則模組50提供與範例句相對應之複數錯誤規則，在此，一個錯誤規則對應一個參考音素，且每一個錯誤規則具有至少一錯誤音素，如對應「$」之錯誤規則包含「G」、「A」、「D」等錯誤音素。比對模組60比對辨識模組40辨識之複數發音音素與規則.模組5〇提供之複數錯誤規則，在此，比對模組60依序將每一發音音素與對應之錯誤規 ® 則的錯誤音素進行比對。前述說明之範例句可為系統預先設定，或可由教學者預先輸入，其中，教學者可經由輸入模組10輸入範例句，並且其於輸入時可依據課程安排或學習者程度輸入不同之範例句。本發明之輔助橋正發音的裝置更包含：記錄模組70、輸出模組8〇。記錄楔組70可於比對模組6〇每次比對完成後，記錄複數發音音素符合複數錯誤規則之錯誤次數，並可隨時經由輸出模組8〇輸出錯誤次數，以供教學者或學習者掌握每次發音情況。

使用時教學者可先以輸入模組1〇輸入範例句「lam a boy.」，學習者再. 以播放模組20播放範例句，並依據播放模組20之範例句反覆發出使用者發音而練習發音。學習者每次發出使用者發音均經由接收模組3〇接收，再以辨識模組40辨識使用者發音為複數發音音素，並於比對模組60比對完成後以記錄模組7〇記錄錯誤次數，如使用者發音為σ0 $rn D bCO共30 次’使用者發音為α0 Gm D bCO共25次，使用者發音為αΟ Am D bCO 8 201017647 共10次，則可將其結果記錄為：參考音素（$) 錯誤音素 (G) 錯誤音素(A) 總次數正確率 30次 25次 ---—1 15次 70次 43% 於輪出模組80輪出錯誤次數後，學習者即可藉由錯誤次數了解自己發音上容易發生的錯誤’教學者亦可根據分析後的結果，快速掌握每一學習者發音的錯誤’如某-學習者容祕「$」發音成「G」，即可依據此一學 ® 習者容易發生的發音錯誤提供適當的後續辅助及橋正，協助其將「G」矯正發音為「$」。如「第2圖」所示，本發明之輔助構正發音的方法，包含下列步驟：步驟201 :提供包含複數參考音素之範例句。教學者可經由輸入模組10輸入範例句，並且其於輸入時可依據課程安排或學習雜麟人㈣之範納。糾，範綱可由複數單字所組成，每一單字具有至少一參考音素，因此可將範例句展開為複數參考音素，如參範例句為「I_boy·」，係由「。、「啦」、、、％」等四個單字所組成，且其參考音素為a0 $m D bCO。於展__之轉t ’係可依據字典9G展職_，在此，字典9〇係為-般市面上之英英、英漢、漢英等字典、辭典，並將其資料儲存於記憶單元内，但本發明不以此為限。步驟202 :提供複數錯誤規則’ 一個錯誤規則對應一個參考音素。以規則模組50提供與範例句相對應之複數錯誤規則，一個錯誤規則對 201017647 應-個參考音素，且每-個錯誤規則具有至少—錯誤音素，如對應「$」之錯誤規則包含「G」、「A」、「D」等錯誤音素。步驟203 :接收使用者發音。經由播放模組20以聲音或影像等方式播放範例句，學習者再依據範例句反覆發出使用者發音而練習發音’並以接收模袓％接收學習者每次所發出使用者發音。步驟204 :辨識使用者發音為複數發音音素。參以辨識模組40辨識使用者發音為複數發音音素，其中，辨識模組40 可以直接聲波比對或聲學模型比對進行辨識，且聲學模型較佳地可為隱藏式馬可夫模型(Hidden Markov Model，HMM) ’但本發明不限於此，聲學模型亦可為神經網路(Neural Networks)、動態時間校準(Dynamo Time Warping， DTW)或语音模版比對(Template Matching)。步驟205 :比對複數發音音素與複數錯誤規則。在此步称中，比對模組60依序將每一發音音素與對應之錯誤規則的錯 ❹誤音素進行比對^ 步驟206 :記錄複數發音音素符合複數錯誤規則之錯誤次數。步驟207 :輪出錯誤次數。於比對模組6〇比對完成後以記錄模組70記錄錯誤次數，並可經由輸出模組80輸出錯誤次數，藉以讓學習者了解自己發音上容易發生的錯誤，並可供教學者快速掌握每一學習者發音的錯誤，並依據各學習者容易發生的發音錯誤提供適當的後續輔助及橋正。 201017647 本發明可應用於電子辭典、個人電腦(Personal Computer)及個人數位助理(Personal Digital Assist PDA)等電子裝置’特別是可應用於日漸普及的低價電滕上’藉以讓學習者了解自己發音上的錯誤，同時可讓教學者直接瞭解每一位學習者的發音錯誤，而不需耗費大量時間分析每一學習者的發音，此外’教學者可以根據分析後的結果’提供學習者後續的辅助及橋正，不僅讓學習者學習更具效率’同時讓教學者可直接針對較為嚴重的發音錯誤提供橋正，有效節省輔導發音的時間。書雖然本發明的技術内容已經以較佳實施例揭露如上，然其並非用以限定本發明’任何熟習此技藝者，在不脫離本發明之精神所作些許之更動與潤都’皆應涵蓋於本發明的範疇内，因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。

11 201017647 【圖式簡單說明】第1圖為本發明辅助矯正發音的裝置之結構方塊圖。第2圖為本發明輔助矯正發音的方法之k程圖。【主要元件符號說明】 10..........輸入模組 20..........播放模組 30..........接收模組 40..........辨識模組 50..........規則模組 60..........比對模組 70..........記錄模組 80..........輸出模組 90..........字典

12

Claims

201017647 十、申請專利範圍： 1、一種辅助矯正發音的方法，包含下列步驟：提供一範例句，該範例句包含複數參考音素；提供複數錯誤規則，一個該錯誤規則對應一個該參考音素；接收一使用者發音； -辨識該使用者發音為複數發音音素；。比對該些發音音素與該些錯誤規則；及 •記錄該些發音音素符合該些錯誤規則之一錯誤次數。 2、如請求項1之辅助橋正發音的方法，於提供該範例句之步驟中，包含· 展開該範例句為該些參考音素。 3、如請求項2之輔助矯正發音的方法，於展開該範例句之步驟中，係依據一字典展開該範例句。 4、如請求項1之辅助矯正發音的方法，其中該範例句包含至少一單字，該單字由至少一該參考音素所組成。〇 5、如請求項i之辅助矯正發音的方法，其中該錯誤規則包含至少一錯誤音素。 6、如請求H麟正發音的方法’於輯該些發音音素触些錯誤規 -貝,J之步驟中’係依序將每一該發音音素與對應之該錯誤規則的該錯誤音素進行比對。 7如明求項1之輔助矯正發音的方法，於辨識該使用者發音之步驟中係以-直接聲纽對方式及—聲學_比之其中—者進行辨識。 8如請求項7之輔助矯正發音的方法，其中該聲學模型係選自一隱藏式馬 13 201017647 可夫模型(Hidden Markov Model，HMM)—神經網路(Neural Networks)、一動態時間校準(Dynamic Time Warping, DTW)及一語音模版比對 (Template Matching)所構成之群組。 9、如請求項1之辅助矯正發音的方法，於記錄該錯誤次數之步驟後，更包含：輸出該錯誤次數。 10、一種辅助墙正發音的裝置，包含：一播放模組’用以播放一範例句，該範例句包含複數參考音素；一接收模組’用以接收於一使用者依據該範例句所發出之一使用者發音；一辨識模組’用以辨識該使用者發音為複數發音音素；一規則模組’用以提供與該範例句相對應之複數錯誤規則，一個該錯誤規則對應一個該參考音素；及一比對模組’用以比對該些發音音素與該些錯誤規則。 11、如請求項10之輔助墙正發音的裝置，其中該範例句包含至少一單字，該單字由至少一該參考音素所組成。 12、如請求項11之辅助矯正發音的裝置，更包含：一字典，用以儲存該單字與對應之該參考音素。 13、如請求項1〇之辅助端正發音的裝置，其中該辨識模組以一直接聲波比對方式及一聲學模型比對之其中一者進行辨識。 14、如請求項π之輔助橋正發音的裝置，其中該聲學模型係選自一隱藏式馬可夫模型（Hidden Markov Model，HMM)、一神經網路(Neural 201017647 Networks)、一動態時間校準(Dynamic Time Warping, DTW)及一語音模版比對(Template Matching)所構成之群組。 15、如請求項10之辅助矯正發音的裝置，其中該錯誤規則包含至少一錯誤音素。 16、如請求項15之辅助矯正發音的裝置，其中該比對模組依序將每一該發音音素與對應之該錯誤規則的該錯誤音素進行比對。 , 17、如請求項1〇之辅助矯正發音的裝置，更包含：一輸入模組，用以輸入 • 該範例句而供該播放模組播放。 18、如請求項1〇之輔助墙正發音的裝置，更包含：一記錄模組，用以記錄該些發音音素符合該些錯誤規則之一錯誤次數。 19、如請求項18之辅助矯正發音的裝置’更包含：一輸出模組，用以輸出該錯誤次數。 ❹ 15