TW201017647A - Auxiliary speech correcting device and method - Google Patents

Auxiliary speech correcting device and method Download PDF

Info

Publication number
TW201017647A
TW201017647A TW97139801A TW97139801A TW201017647A TW 201017647 A TW201017647 A TW 201017647A TW 97139801 A TW97139801 A TW 97139801A TW 97139801 A TW97139801 A TW 97139801A TW 201017647 A TW201017647 A TW 201017647A
Authority
TW
Taiwan
Prior art keywords
pronunciation
module
phonemes
phoneme
error
Prior art date
Application number
TW97139801A
Other languages
English (en)
Inventor
Ming-Hsiang Yen
Jui-Yu Yen
Ping-Hsia Chao
Original Assignee
Micro Star Int Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Micro Star Int Co Ltd filed Critical Micro Star Int Co Ltd
Priority to TW97139801A priority Critical patent/TW201017647A/zh
Publication of TW201017647A publication Critical patent/TW201017647A/zh

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Description

201017647 九、發明說明: 【發明所屬之技術領域】 本發明是一種矯正發音的方法及裝置,特別是一種可迅速發現使用者 發音問題之辅助矮正發音的方法及裝置。 【先前技術】 語言學習的過程之中,人們常常需要藉由各種不同的語言工具書,來 辅助其學習語言’如電子辭典、個人電腦(pers〇nal Computer)及個人數位助 • 理(Personal Digital Assist, PDA)等,並經由軟體執行的方式進行語言學習的 功能’其語音發音係將句子或單字以預錄方式儲存於電腦系統内,播放後 讓使用者聽到正確的發音。或者同時提供錄音的功能,使用者操作電滕系 統使其進行錄音作業,而可供使用者聆聽自己的聲音,藉此操作模式就可 以達到橋正自己發音正痒性以及語言學習的效果。 如中華民國發明公開第200713200號專利「互動式矮正發音的裝置與 方法」’係利用參考音及使用者發音進行分析,並產生發音參數,再根據參 φ 考音並將使用者發音修改成正確的發音’藉以輔助使用者學習正確的發 音;中華民國發明公告第556152號專利「自動標示音標以矯正發音之使用 者介面、系統及方法」,係於使用者提供一個文句字串並輸入其相對的聲音 訊號之後,在輸入聲音訊號的各個區段標示出其對應的音標,續以區段之 對應音標以比對出教學者聲音訊號與學習者聲音訊號之間的差異,如各個 音節的發音、音高、強度、長短的差異等,並據此進行評分或提出改善建 議。 上述前案並無法讓使用者無法真正了解正發音錯誤的情形,僅能依據 5 201017647 個人主觀判斷語言發音語調的正確性β因此,如何讓教學者瞭解每一位學 習者的發音錯誤,或讓學習者了解自己發音上的錯誤,並讓教學者可以根 據分析後的結果,提供學習者後續的辅助及矯正,是一個刻不容緩的待解 決課題。 【發明内容】 有鑑於此’本發明提出一種辅助橋正發音的方法,係先提供範例句及 複數錯誤規則’其中,範例句包含複數參考音素,且一個錯誤規則對應一 φ 個參考音素’此後再接收使用者發音,並辨識使用者發音為複數發音音素, 於辨識完成後比對複數發音音素與複數錯誤規則,並記錄複數發音音素符 合複數錯誤規則之錯誤次數。 本發明亦提翻助矯正發音的裝置,包含:減模組、接收模組、 辨識模組、_歡、比職組。播放模組肋獄包含複數參考音素之 範例句。無輸接餘仙者錄個㈣翻之者發音後,經由 辨識模靖識使料發音為複數發音音素。規聰組提供與細句相對應 #之複數錯誤規則’其中,-個錯誤規則對應一個參考音素。比對模組比對 複數發音音素與複數錯誤規則。 - 本個之魏在於’學習者可依據細句Μ發出使用者發音,即會 ._者發音域·音音素,並職錄料素純錢則進行 ㈣’ 音素符合複數錯則之錯誤次數,學習者即可藉 由錯誤次數了解自己發音上容易發生的錯誤,教學者亦可根據分析後的結 果’快速掌握每-學習者發音的錯誤,並依據每一學習者不同之發音錯誤 提供適當的後續辅助及矯正。 201017647 以下在實施方式中詳細敘述本發明之詳細特徵以及優點,其内容足以 使任何熟習相關技藝者瞭解本發明之技術内容並據以實施,且根據本說明 書所揭露之内容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理 解本發明相關之目的及優點。 【實施方式】 如「第1圖」所示,為顯示本發明之輔助矯正發音的裝置。 本發明之辅助綠正發音的裝置,包含:播放模組20、接收模組3〇、辨 φ 識模組40、規則模組50、比對模組60 » 播放模組20以聲音或影像等方式播放範例句,在此,範例句可由複數 單字所組成,每一單字具有至少一參考音素,如範例句為1 _ a b〇y.」, 係由「I」、「am」、「a」、「boy」等四個單字所組成,且其參考音素為a〇$m D bCO。此外,組成範例句之單字可儲存於字典9〇内,並於字典9〇内儲 存與每一單字對應之參考音素’在此所述之字典9〇係為一般市面上之英 夬、英漢、漢央等字典、辭典並將其資料儲存於記憶單元内,但本發明 φ 不以此為限。 接收模組30於使用者依據播放模組20之範例句發出使用者發音後, 接收使用者所發出之使用者發音,以作為後續判斷使用者發音是否正確之 基準。 辨識模組40於接收使用者所發出之使用者發音後,辨識使用者發音為 複數發音音素,如辨識使用者發音為a〇 Gm D bCO。其中,辨識模組4〇 可以直接聲波比對或聲學模型比對進行辨識,且聲學模型較佳地可為隱藏 式馬可夫模型(Hidden Markov Model,HMM),但本發明不限於此,聲學模型 201017647 亦可為神_路(1^1«:〇1 Networics)、域_校準Time ’㈣, DTW)或語音模版比對(Template Matching)。 規則模組50提供與範例句相對應之複數錯誤規則,在此,一個錯誤規 則對應一個參考音素,且每一個錯誤規則具有至少一錯誤音素,如對應「$」 之錯誤規則包含「G」、「A」、「D」等錯誤音素。 比對模組60比對辨識模組40辨識之複數發音音素與規則.模組5〇提供 之複數錯誤規則,在此,比對模組60依序將每一發音音素與對應之錯誤規 ® 則的錯誤音素進行比對。 前述說明之範例句可為系統預先設定,或可由教學者預先輸入,其中, 教學者可經由輸入模組10輸入範例句,並且其於輸入時可依據課程安排或 學習者程度輸入不同之範例句。 本發明之輔助橋正發音的裝置更包含:記錄模組70、輸出模組8〇。記 錄楔組70可於比對模組6〇每次比對完成後,記錄複數發音音素符合複數 錯誤規則之錯誤次數,並可隨時經由輸出模組8〇輸出錯誤次數,以供教學 者或學習者掌握每次發音情況。
使用時教學者可先以輸入模組1〇輸入範例句「lam a boy.」,學習者再. 以播放模組20播放範例句,並依據播放模組20之範例句反覆發出使用者 發音而練習發音。學習者每次發出使用者發音均經由接收模組3〇接收,再 以辨識模組40辨識使用者發音為複數發音音素,並於比對模組60比對完 成後以記錄模組7〇記錄錯誤次數,如使用者發音為σ0 $rn D bCO共30 次’使用者發音為α0 Gm D bCO共25次,使用者發音為αΟ Am D bCO 8 201017647 共10次,則可將其結果記錄為: 參考音素($) 錯誤音素 (G) 錯誤音素(A) 總次數 正確率 30次 25次 ---—1 15次 70次 43% 於輪出模組80輪出錯誤次數後,學習者即可藉由錯誤次數了解自己發 音上容易發生的錯誤’教學者亦可根據分析後的結果,快速掌握每一學習 者發音的錯誤’如某-學習者容祕「$」發音成「G」,即可依據此一學 ® 習者容易發生的發音錯誤提供適當的後續辅助及橋正,協助其將「G」矯正 發音為「$」。 如「第2圖」所示,本發明之輔助構正發音的方法,包含下列步驟: 步驟201 :提供包含複數參考音素之範例句。 教學者可經由輸入模組10輸入範例句,並且其於輸入時可依據課程安 排或學習雜麟人㈣之範納。糾,範綱可由複數單字所組成, 每一單字具有至少一參考音素,因此可將範例句展開為複數參考音素,如 參範例句為「I_boy·」,係由「。、「啦」、、、%」等四個單字所組成, 且其參考音素為a0 $m D bCO。 於展__之轉t ’係可依據字典9G展職_,在此,字典9〇 係為-般市面上之英英、英漢、漢英等字典、辭典,並將其資料儲存於記 憶單元内,但本發明不以此為限。 步驟202 :提供複數錯誤規則’ 一個錯誤規則對應一個參考音素。 以規則模組50提供與範例句相對應之複數錯誤規則,一個錯誤規則對 201017647 應-個參考音素,且每-個錯誤規則具有至少—錯誤音素,如對應「$」之 錯誤規則包含「G」、「A」、「D」等錯誤音素。 步驟203 :接收使用者發音。 經由播放模組20以聲音或影像等方式播放範例句,學習者再依據範例 句反覆發出使用者發音而練習發音’並以接收模袓%接收學習者每次所發 出使用者發音。 步驟204 :辨識使用者發音為複數發音音素。 參 以辨識模組40辨識使用者發音為複數發音音素,其中,辨識模組40 可以直接聲波比對或聲學模型比對進行辨識,且聲學模型較佳地可為隱藏 式馬可夫模型(Hidden Markov Model,HMM) ’但本發明不限於此,聲學模型 亦可為神經網路(Neural Networks)、動態時間校準(Dynamo Time Warping, DTW)或语音模版比對(Template Matching)。 步驟205 :比對複數發音音素與複數錯誤規則。 在此步称中,比對模組60依序將每一發音音素與對應之錯誤規則的錯 ❹誤音素進行比對^ 步驟206 :記錄複數發音音素符合複數錯誤規則之錯誤次數。 步驟207 :輪出錯誤次數。 於比對模組6〇比對完成後以記錄模組70記錄錯誤次數,並可經由輸 出模組80輸出錯誤次數,藉以讓學習者了解自己發音上容易發生的錯誤, 並可供教學者快速掌握每一學習者發音的錯誤,並依據各學習者容易發生 的發音錯誤提供適當的後續輔助及橋正。 201017647 本發明可應用於電子辭典、個人電腦(Personal Computer)及個人數位助 理(Personal Digital Assist PDA)等電子裝置’特別是可應用於日漸普及的低 價電滕上’藉以讓學習者了解自己發音上的錯誤,同時可讓教學者直接瞭 解每一位學習者的發音錯誤,而不需耗費大量時間分析每一學習者的發 音,此外’教學者可以根據分析後的結果’提供學習者後續的辅助及橋正, 不僅讓學習者學習更具效率’同時讓教學者可直接針對較為嚴重的發音錯 誤提供橋正,有效節省輔導發音的時間。 書 雖然本發明的技術内容已經以較佳實施例揭露如上,然其並非用以限 定本發明’任何熟習此技藝者,在不脫離本發明之精神所作些許之更動與 潤都’皆應涵蓋於本發明的範疇内,因此本發明之保護範圍當視後附之申 請專利範圍所界定者為準。
11 201017647 【圖式簡單說明】 第1圖為本發明辅助矯正發音的裝置之結構方塊圖。 第2圖為本發明輔助矯正發音的方法之k程圖。 【主要元件符號說明】 10..........輸入模組 20..........播放模組 30..........接收模組 40..........辨識模組 50..........規則模組 60..........比對模組 70..........記錄模組 80..........輸出模組 90..........字典
12

Claims (1)

  1. 201017647 十、申請專利範圍: 1、 一種辅助矯正發音的方法,包含下列步驟: 提供一範例句,該範例句包含複數參考音素; 提供複數錯誤規則,一個該錯誤規則對應一個該參考音素; 接收一使用者發音; -辨識該使用者發音為複數發音音素; 。比對該些發音音素與該些錯誤規則;及 •記錄該些發音音素符合該些錯誤規則之一錯誤次數。 2、 如請求項1之辅助橋正發音的方法,於提供該範例句之步驟中,包含· 展開該範例句為該些參考音素。 3、 如請求項2之輔助矯正發音的方法,於展開該範例句之步驟中,係依據 一字典展開該範例句。 4、 如請求項1之辅助矯正發音的方法,其中該範例句包含至少一單字,該 單字由至少一該參考音素所組成。 〇 5、如請求項i之辅助矯正發音的方法,其中該錯誤規則包含至少一錯誤音 素。 6、如請求H麟正發音的方法’於輯該些發音音素触些錯誤規 -貝,J之步驟中’係依序將每一該發音音素與對應之該錯誤規則的該錯誤音 素進行比對。 7如明求項1之輔助矯正發音的方法,於辨識該使用者發音之步驟中係 以-直接聲纽對方式及—聲學_比之其中—者進行辨識。 8如請求項7之輔助矯正發音的方法,其中該聲學模型係選自一隱藏式馬 13 201017647 可夫模型(Hidden Markov Model,HMM)—神經網路(Neural Networks)、 一動態時間校準(Dynamic Time Warping, DTW)及一語音模版比對 (Template Matching)所構成之群組。 9、 如請求項1之辅助矯正發音的方法,於記錄該錯誤次數之步驟後,更包 含:輸出該錯誤次數。 10、 一種辅助墙正發音的裝置,包含: 一播放模組’用以播放一範例句,該範例句包含複數參考音素; 一接收模組’用以接收於一使用者依據該範例句所發出之一使用 者發音; 一辨識模組’用以辨識該使用者發音為複數發音音素; 一規則模組’用以提供與該範例句相對應之複數錯誤規則,一個 該錯誤規則對應一個該參考音素;及 一比對模組’用以比對該些發音音素與該些錯誤規則。 11、 如請求項10之輔助墙正發音的裝置,其中該範例句包含至少一單字, 該單字由至少一該參考音素所組成。 12、 如請求項11之辅助矯正發音的裝置,更包含:一字典,用以儲存該單 字與對應之該參考音素。 13、 如請求項1〇之辅助端正發音的裝置,其中該辨識模組以一直接聲波比 對方式及一聲學模型比對之其中一者進行辨識。 14、 如請求項π之輔助橋正發音的裝置,其中該聲學模型係選自一隱藏式 馬可夫模型(Hidden Markov Model,HMM)、一神經網路(Neural 201017647 Networks)、一 動態時間校準(Dynamic Time Warping, DTW)及一語音模版 比對(Template Matching)所構成之群組。 15、 如請求項10之辅助矯正發音的裝置,其中該錯誤規則包含至少一錯誤 音素。 16、 如請求項15之辅助矯正發音的裝置,其中該比對模組依序將每一該發 音音素與對應之該錯誤規則的該錯誤音素進行比對。 , 17、如請求項1〇之辅助矯正發音的裝置,更包含:一輸入模組,用以輸入 • 該範例句而供該播放模組播放。 18、 如請求項1〇之輔助墙正發音的裝置,更包含:一記錄模組,用以記錄 該些發音音素符合該些錯誤規則之一錯誤次數。 19、 如請求項18之辅助矯正發音的裝置’更包含:一輸出模組,用以輸出 該錯誤次數。 ❹ 15
TW97139801A 2008-10-16 2008-10-16 Auxiliary speech correcting device and method TW201017647A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW97139801A TW201017647A (en) 2008-10-16 2008-10-16 Auxiliary speech correcting device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW97139801A TW201017647A (en) 2008-10-16 2008-10-16 Auxiliary speech correcting device and method

Publications (1)

Publication Number Publication Date
TW201017647A true TW201017647A (en) 2010-05-01

Family

ID=44830942

Family Applications (1)

Application Number Title Priority Date Filing Date
TW97139801A TW201017647A (en) 2008-10-16 2008-10-16 Auxiliary speech correcting device and method

Country Status (1)

Country Link
TW (1) TW201017647A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI687804B (zh) * 2018-12-10 2020-03-11 亞東技術學院 發音錯誤檢測與矯正系統及方法
CN112133325A (zh) * 2020-10-14 2020-12-25 北京猿力未来科技有限公司 错误音素识别方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI687804B (zh) * 2018-12-10 2020-03-11 亞東技術學院 發音錯誤檢測與矯正系統及方法
CN112133325A (zh) * 2020-10-14 2020-12-25 北京猿力未来科技有限公司 错误音素识别方法及装置
CN112133325B (zh) * 2020-10-14 2024-05-07 北京猿力未来科技有限公司 错误音素识别方法及装置

Similar Documents

Publication Publication Date Title
Witt Automatic error detection in pronunciation training: Where we are and where we need to go
US8272874B2 (en) System and method for assisting language learning
US6853971B2 (en) Two-way speech recognition and dialect system
US7280964B2 (en) Method of recognizing spoken language with recognition of language color
US11145222B2 (en) Language learning system, language learning support server, and computer program product
JP2001159865A (ja) 対話型語学指導のための方法および装置
Daniels et al. The suitability of cloud-based speech recognition engines for language learning.
WO2004063902B1 (en) Speech training method with color instruction
CN101551947A (zh) 辅助口语语言学习的计算机系统
US20090220926A1 (en) System and Method for Correcting Speech
US8221126B2 (en) System and method for performing programmatic language learning tests and evaluations
WO2019075828A1 (zh) 一种语音评价方法及装置
KR102225435B1 (ko) Stt 기반 언어구사 학습-훈련 시스템
Liao et al. A prototype of an adaptive Chinese pronunciation training system
JP2010197644A (ja) 音声認識システム
KR20000049500A (ko) 음성 인식 및 음성 합성을 이용한 외국어 교육 서비스방법 및 그 시스템
JP2007148170A (ja) 外国語学習支援システム
TWI240875B (en) Method for interactive computer assistant language learning and system thereof
CN111508522A (zh) 一种语句分析处理方法及系统
TW201017647A (en) Auxiliary speech correcting device and method
Price et al. Assessment of emerging reading skills in young native speakers and language learners
Kantor et al. Reading companion: The technical and social design of an automated reading tutor
US20050144010A1 (en) Interactive language learning method capable of speech recognition
US8768697B2 (en) Method for measuring speech characteristics
TWI657421B (zh) 用以支援聆聽的方法、系統及非暫時性電腦可讀記錄媒體