TW202225910A - 外接式語音喚醒裝置及其控制方法 - Google Patents
外接式語音喚醒裝置及其控制方法 Download PDFInfo
- Publication number
- TW202225910A TW202225910A TW109145369A TW109145369A TW202225910A TW 202225910 A TW202225910 A TW 202225910A TW 109145369 A TW109145369 A TW 109145369A TW 109145369 A TW109145369 A TW 109145369A TW 202225910 A TW202225910 A TW 202225910A
- Authority
- TW
- Taiwan
- Prior art keywords
- wake
- voice
- electronic device
- sound signal
- sleep mode
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 22
- 230000005236 sound signal Effects 0.000 claims abstract description 54
- 238000012545 processing Methods 0.000 claims description 35
- 239000013078 crystal Substances 0.000 claims description 7
- 239000010453 quartz Substances 0.000 claims description 7
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 claims description 7
- 230000000087 stabilizing effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005265 energy consumption Methods 0.000 description 6
- 230000002618 waking effect Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3296—Power saving characterised by the action undertaken by lowering the supply or operating voltage
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3215—Monitoring of peripheral devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/324—Power saving characterised by the action undertaken by lowering clock frequency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Power Sources (AREA)
Abstract
一種語音喚醒裝置,包括麥克風模組、電連接器及微控制器單元。微控制器單元包括至少一微控制器及用於存儲微控器可執行指令的記憶體。微控制器可執行指令使微控制器單元執行多個任務,其包括偵測麥克風模組接收的環境聲音是否存在聲音訊號,並依據聲音訊號產生輸入聲音訊號,判斷輸入聲音訊號是否包括預定的喚醒語音,及確定輸入聲音訊號包括預定的喚醒語音,並輸出一喚醒指令用以喚醒處於休眠模式的電子設備進入非休眠模式。
Description
本揭示是有關一種語音裝置,特別是指一種用於喚醒電子設備的語音喚醒裝置及其控制方法。
隨著資訊科技的發展,電子設備,例如電腦或平板電腦的使用早已是一般日常生活中不可或缺的必需品。人們仰賴電腦完成需要達成的工作任務,更可提升工作效率,其中用戶與電腦或其他電子設備之間的人機交互方式,亦即溝通或控制方式同樣持續在演變。常見的人機互動方式可通過機械裝置(例如,鍵盤或滑鼠等)或電氣裝置(例如,觸控屏或觸控板)達成。現今更發展出通過用戶的語音的音頻實現人機互動。
語音音頻的人機互動是通過採集並響應人類語音的語音裝置進行。傳統語音裝置(或可稱智慧音箱)透過接收語音訊號,經由訊號處理過程後可以對應用端電子設備執行相對應的功能,使用戶可以不須以鍵盤或滑鼠等機械裝置,或以手指觸控觸控屏即可達到對電子設備的控制。在通過語音裝置控制的時候,用戶的雙手不須接觸電子設備,並可同時進行額外的工作。然而,傳統語音裝置或智慧音箱,在電子設備(如電腦) 閒置一段時間後,一旦進入到省電模式或是休眠模式後,內部的語音裝置(智慧音箱)同樣進入省電模式或是休眠模式,用戶就無法像正常使用智慧音箱的方式一樣,用特定的語音來喚醒電子設備,而必須改以鍵盤、滑鼠或觸控屏的方式喚醒。因此,如何改善前述問題,使語音裝置能在各種作業模式皆可實現喚醒的功能乃當下亟需解決的問題。
本揭示之一目的在於提供一種用於喚醒電子設備的語音喚醒裝置,其可解決傳統電子設備在休眠模式下無法透過語音喚醒的問題。
本揭示之另一目的在於提供一種語音喚醒裝置,其可減少電子設備用於喚醒功能的電力消耗。
本揭示之另一目的在於提供一種可外接於電子設備的語音喚醒裝置,其具有簡化的結構及低能耗的設計。
本揭示之另一目的在於提供一種用於喚醒處於休眠模式的電子設備的語音喚醒裝置的控制方法。
為達到前述目的,本揭示提供一種語音喚醒裝置,包括一麥克風模組,用於在電子設備處於休眠模式時接收環境聲音;一電連接器,用於電性連接於該電子設備的連接埠,使該語音喚醒裝置連接於該電子設備;以及一微控制器單元,耦接於該麥克風模組及該電連接器,包括至少一微控制器及用於存儲該微控器可執行指令的記憶體,該微控制器可執行指令使該微控制器單元執行多個任務,其包括:偵測該麥克風模組接收的環境聲音是否存在聲音訊號,並依據該聲音 訊號產生輸入聲音訊號;判斷該輸入聲音訊號是否包括預定的喚醒語音;及確定該輸入聲音訊號包括該預定的喚醒語音,並輸出一喚醒指令喚醒 該處於休眠模式的電子設備進入非休眠模式。
較佳的,該微控制器單元執行的多個任務更包括在該判斷該輸入聲音訊號是否包括預定的喚醒語音的任務前,該微控制器單元執行降噪處理,用於减少该麥克風模組所接收環境聲音的噪音,及執行回音處理,用於將該環境聲音中具有的回音消除。
較佳的,該麥克風模組包括由多個麥克風組成的麥克風陣列,及該微控制器單元包括至少一個波束形成組件,其中該麥克風陣列用於接收來自不同方向的環境聲音,該波束形成組件根據該不同方向的環境聲音生成集中定向的輸入聲音訊號。
本揭示另外提供一種語音喚醒裝置的控制方法,用於喚醒處於休眠模式的電子設備,該電子設備包括一連接埠,該語音喚醒裝置包括一麥克風模組、一電連接器,及包括至少一微控制器及一記憶體的微控制器單元,該控制方法包括通過該電連接器電性連接於該電子設備的連接埠,使該語音喚醒裝置連接於該電子設備,並設定喚醒語音;利用該微控制器單元判斷該電子設備是否處於休眠模式或非休眠模式;利用該麥克風模組在該電子設備處於休眠模式時接收環境聲音;由該微控制器單元偵測該麥克風模組接收的環境聲音是否存在聲音訊號,並依據該聲音訊號產生輸入聲音訊號,且判斷該輸入聲音訊號是否包括該預定的喚醒語音;以及確定該輸入聲音訊號包括該預定的喚醒語音,並輸出一喚醒指令喚醒該處於休眠模式的電子設備進入非休眠模式。
本揭示語音喚醒裝置利用晶片上系統的架構,通過外接方式連接於電子設備的主機系統,不僅控制方法簡單,更可解決傳統電子設備在休眠模式下無法透過語音喚醒的問題。其次,對於麥克風模組接收後的聲音,本揭示語音喚醒裝置利用微控制器單元執行音訊的處理,大幅減少硬體的需求,有效降低製造成本,更減少能耗損失。另外,本揭示語音喚醒裝置透過單獨的電源供應模組的設置,及自身低能耗的工作模式,大幅減少電子設備對於語音喚醒功能的電力要求,達到省電節能的功效。再者,本揭示利用微控制器單元執行音訊的處理,通過降噪及回音處理,有效優化人聲音訊,提升喚醒語音的辨識率,改善傳統語音喚醒容易漏判的問題。
為使本揭示的目的、技術方案及效果更加清楚、明確,以下參照圖式並舉實施例對本揭示進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本揭示,本揭示說明書所使用的詞語“實施例”意指用作實例、示例或例證,並不用於限定本揭示。此外,本揭示說明書和所附申請專利範圍中所使用的冠詞“一”,一般地可以被解釋為意指“一個或多個”,除非另外指定或從上下文可以清楚確定單數形式。並且,在所附圖式中,結構、功能相似或相同的元件是以相同元件標號來表示。
本揭示為一種語音喚醒裝置,尤指一種用於喚醒處於休眠模式的電子設備的語音喚醒裝置。根據一實施態樣,本揭示的語音喚醒裝置是透過外接方式和電子設備形成電性連接而實現該語音喚醒裝置的功能,亦可採用內建於電子設備的方式實施。該電子設備可為筆記型電腦、桌上型電腦、平板電腦或其他具有休眠模式及活耀模式(非休眠模式)的工作狀態的電子設備,其中休眠模式即為電子設備的主機系統進入到休眠狀態。
請參閱圖1,係為本揭示之語音喚醒裝置的結構方塊圖。本揭示的語音喚醒裝置1包括穩壓器11、石英晶體振盪器12、麥克風模組2、微控制器單元3及電連接器4。具體而言,語音喚醒裝置1包括一種晶片上系統(system on chip, SOC)。如圖1所示,麥克風模組2包括由多個間隔排列的麥克風21組成的麥克風陣列,用於在電子設備7處於休眠模式時接收來自不同方向的環境聲音,其中環境聲音可包括人類語音或非人類語音的聲音,亦即包括麥克風模組2周圍環境的各種聲音。另外,依據電子設備對於類比形式或數位形式的訊號處理要求,本揭示麥克風模組2可進一步耦接一類比數位轉換器(未圖示),用於執行麥克風模組2接收的環境聲音由類比訊號轉換至數位訊號的處理。特別說明的是,本揭示的電子設備7是以筆記型電腦作為示例,但並不以此為限。
電連接器4和麥克風模組2設置在一電路基板(未圖示)上。電連接器4具有隨插即用的連接介面,例如:通用序列匯流排(universal serial bus,USB)。相對地,電子設備7同樣具有支援隨插即用介面的連接埠,用以對接於語音喚醒裝置1的電連接器4。於另一實施例中,本揭示的電連接器4可被配置適用於電子設備7內部的積體匯流排電路(inter-integrated circuit, I
2C)。亦即,本揭示的語音喚醒裝置1可內建於電子設備7內部的電路基板上。
續請參閱圖1,微控制器單元3耦接於麥克風模組2及電連接器4,並共同配置於同一電路基板上。微控制器單元3包括一微控制器31(microcontroller, MCU)及記憶體32。記憶體32可以包括呈指令形式的應用程式,且該指令由微控器31執行,用於執行語音喚醒裝置1所需功能的任務或動作。記憶體32可以是一種類型的計算機存儲介質,其可包括易失性和非易失性存儲器。亦即,記憶體32可以包括但不限於隨機存取記憶體(random access memory, RAM)、唯讀記憶體(read-only memory, ROM)、快閃記憶體(flash memory)或其他存儲器技術。此外,如圖1所示,穩壓器11耦接於微控制器單元3及電連接器4,用於穩定提供至語音喚醒裝置3的電壓。例如來自電源供應端的輸入電壓為5V,則經過穩壓器11的調整為適合語音喚醒裝置1的工作電壓,例如,3.3V。石英晶體振盪器12耦接於微控制器單元3,用於使微控制器單元3在預定的工作頻率工作。
請參閱圖2,其為本揭示之語音喚醒裝置1的控制方法流程圖。本揭示的語音喚醒裝置的控制方法是用於喚醒處於休眠模式的電子設備,該控制方法包括以下所述動作。
動作501:連接及喚醒語音設定。通過語音喚醒裝置的電連接器對接於電子設備的連接埠,使語音喚醒裝置電性連接於電子設備,進而設定喚醒語音。於一實施例中,用戶可在語音喚醒裝置和電子設備電性連接後,透過電子設備預先安裝的喚醒語音設定程式設定喚醒語音,其中喚醒語音可為用戶自定的喚醒詞或發出的一種聲調。特別說明的是,本揭示語音喚醒裝置可辨識多個用戶設定的不同喚醒語音執行喚醒的功能。
動作502:利用微控制器單元判斷電子設備是否處於休眠模式或非休眠模式。具體而言,本揭示語音喚醒裝置首次連接于電子設備後,由於電子設備(例如,筆記型電腦)的連接埠具有隨插即用介面,隨即偵測到語音喚醒裝置的插入,因此使電子設備處於非休眠模式,亦即活耀模式(active mode)。當電子設備閒置一段時間後即進入休眠模式,其中該休眠模式為活耀模式以外的工作狀態,包括睡眠模式及休眠模式,且更包括電子設備已經關機但仍接受供電的狀態。此外,本揭示語音訊號裝置連接於電子設備後,即會主動接收電子設備預設的喚醒語音,並儲存在記憶體。在尚未有預設的喚醒語音的狀態下,則回到動作501,等待喚醒語音的設定。
動作503:利用麥克風模組在電子設備處於休眠模式時接收環境聲音。特別說明的是,本揭示麥克風模組只在電子設備呈現休眠模式時接收環境聲音,在活耀模式下則自動停止收音。
動作504:由微控制器單元判斷輸入聲音訊號是否包括預定的喚醒語音。具體而言,利用微控制器單元偵測麥克風模組接收的環境聲音是否存在聲音訊號,並依據聲音訊號產生輸入聲音訊號,且由微控制器單元判斷輸入聲音訊號是否包括預定的喚醒語音。在判斷輸入聲音訊號不包括預定的喚醒語音後,則回到動作503。
動作505:確定輸入聲音訊號包括預定的喚醒語音,並輸出一喚醒指令喚醒處於休眠模式的電子設備進入非休眠模式。特別說明的是,一旦電子設備被喚醒後,即表示電子設備處於非休眠模式,則本揭示語音喚醒裝置停止接收環境聲音並停止後續的動作。亦即,本揭示語音喚醒裝置回到動作502的判斷電子設備是否處於休眠模式或非休眠模式。
圖2已經說明本揭示語音喚醒裝置的控制方法。圖3為本揭示語音喚醒裝置的功能方塊圖,用以說明語音喚醒裝置的細部功能。請參閱圖3並配合圖2作為參考,本揭示語音喚醒裝置1更包括耦接於麥克風模組2的分時多工轉換器13,用於使語音喚醒裝置1可以執行即時任務。在此實施例中,麥克風模組2是以每10毫秒的間隔接收環境聲音,以實現即時喚醒的目的。如圖3所示,微控制器單元3更包括語音偵測組件33、波束形成組件34、降噪處理組件35、回音處理組件36及喚醒語音處理組件37,其中語音喚醒裝置1通過電連接器4電性連接至電子設備7。此外,微控制器單元3更包括脈波編碼調變組件14,用於配合電子設備7的訊號要求而調整微控制器單元3所處理的脈波訊號。前述各個組件是呈應用程式的方式儲存於記憶體32,並分別用於執行不同的任務,其詳細說明如後。特別說明的是,本揭示的波束形成組件34、降噪處理組件35、回音處理組件36可視實際需求而配置於本揭示的語音喚醒裝置。亦即,前述用於優化聲音訊號處理的組件可為其中之一或任二種以上的組合,亦可不配置,其並不會影響微控制器單元3的運作。
圖4為本揭示之語音喚醒裝置處理聲音訊號的流程圖。請參閱圖4並配合圖2及圖3作為參考。對應於圖2有關本揭示語音喚醒裝置的控制方法,該控制方法的細部流程包括如圖4所示的動作,其包括動作601:接收環境聲音。具體而言,利用包括在麥克風模組2的多個麥克風組成的麥克風陣列接收來自不同方向及不同遠近距離的環境聲音。
動作602:聲音訊號偵測。亦即,利用語音偵測組件33偵測麥克風模組2接收的環境聲音是否存在聲音訊號,並依據存在環境聲音的聲音訊號產生輸入聲音訊號。特別說明的是,在語音偵測組件33並未偵測出環境聲音存在聲音訊號時,語音偵測組件33的工作耗能極低,且由於未偵測出環境聲音存在聲音訊號,因此尚未進入後續動作的執行,進一步減少語音喚醒裝置1的能耗。
動作603:波束形成。利用波束形成組件34生成集中不同方向的輸入聲音訊號。具體而言,波束形成組件34用以響應於麥克風陣列形成的空間分離,並根據該不同方向及不同遠近距離的環境聲音生成集中定向的輸入聲音訊號,以更清楚分辨不同聲音源的訊號。
動作604:降噪處理。利用降噪處理組件35執行降噪處理,用於减少麥克風模組2所接收環境聲音的噪音。例如,環境中的吵雜聲或車流聲等可透過降噪處理組件35消除。
動作605:回音處理。亦即,利用回音處理組件36執行回音處理,將環境聲音中具有的回音消除。
動作606:喚醒語音的偵測。利用喚醒語音處理組件37偵測輸入聲音訊號是否包括喚醒語音。亦即,偵測輸入聲音訊號是否具有人類語音,避免針對所有聲音進行喚醒語音判斷而影響語音判斷效率。
動作607:喚醒語音的判斷。利用喚醒語音處理組件37判斷輸入聲音訊號是否包括預定的喚醒語音。亦即,依據具有人類語音的輸入聲音訊號,判斷是否包括用戶自定的喚醒詞或發出的一種聲調。基於輸入聲音訊號被判斷為不包括預定的喚醒語音,則回到動作602。
動作608:喚醒電子設備。亦即,確定輸入聲音訊號包括預定的喚醒語音,並輸出一喚醒指令喚醒處於休眠模式的電子設備進入非休眠模式。
圖5為本揭示之語音喚醒裝置的使用狀態示意圖。如圖5所示,本揭示語音喚醒裝置1為一種具有隨插即用介面的可攜式裝置。具體實施中,本揭示語音喚醒裝置1更包括一殼體10,殼體10內具有一容置空間,用以容置麥克風模組2、微控制器單元3及電連接器4。電連接器4具有USB接頭,用以連接於電子設備7具有相對應介面的連接埠71,使語音喚醒裝置1可插拔地電性連接於電子設備7。
續請參閱圖5,特別說明的是,本揭示語音喚醒裝置1更包括電源供應模組15,其耦接於穩壓器11。電源供應模組15作為語音喚醒裝置1獨立於電子設備71的電力供應源。於一實施例中,電源供應模組15可裝設有電池(未圖示)提供語音喚醒裝置1所需的電力。於另一實施例中,電源供應模組15可另外連接電纜線,透過外部電源的傳輸提供電力。例如,電源供應模組15可具有一微型通用序列匯流排(micro USB)介面的連接埠(未圖示),透過電纜線連接於外部電源進行電力傳輸。藉由電源供應模組15的設置,本揭示語音喚醒裝置1具有單獨的電源供應,不會消耗電子設備的電能。此外,如前所述,本揭示語音喚醒裝置1亦可內建於電子設備的主機系統,例如,透過I
2C的架構連接於主機系統。由於本揭示語音喚醒裝置1工作所需能耗極低,符合主流市場上環保節能規範的需求,因此,就算內建於主機系統,亦不會造成電子設備過多能耗。
綜上所述,本揭示語音喚醒裝置利用晶片上系統的架構,通過外接方式連接於電子設備的主機系統,不僅控制方法簡單,更可解決傳統電子設備在休眠模式下無法透過語音喚醒的問題。其次,對於麥克風模組接收後的聲音,本揭示語音喚醒裝置利用微控制器單元執行音訊的處理,大幅減少硬體的需求,有效降低製造成本,更減少能耗損失。另外,本揭示語音喚醒裝置透過單獨的電源供應模組的設置,及自身低能耗的工作模式,大幅減少電子設備對於語音喚醒功能的電力要求,達到省電節能的功效。再者,本揭示利用微控制器單元執行音訊的處理,通過降噪及回音處理,有效優化人聲音訊,提升喚醒語音的辨識率,改善傳統語音喚醒容易漏判的問題。
上文描述的實施例可採用程式設計方式(諸如利用電腦、處理器)實施為數據訊號處理器、模擬處理器等等。然而,在其它實施例中,可以使用專業或專用電路(包括類比電路和/或數位邏輯電路)實施元件、功能或元件中的一個或多個。如本文中使用的術語“組件”或“元件”旨在包括用於實施歸屬於組件或元件的功能的任何硬體、軟體、邏輯或前述組合。
上述實施例用以說明本揭示的技術思想,而並非用以限定本揭示的技術思想,因此本揭示的權利範圍並不限定於本實施例。本揭示的保護範圍應由權利要求書解釋,應解釋為與上述保護範圍相同或等同的所有技術思想均包括在本揭示的權利範圍內。
1:語音喚醒裝置
10:殼體
11:穩壓器
12:石英晶體振盪器
13:分時多工轉換器
14:脈波編碼調變組件
15:電源供應模組
2:麥克風模組
21:麥克風
3:微控制器單元
31:微控制器
32:記憶體
33:語音偵測組件
34:波束形成組件
35:降噪處理組件
36:回音處理組件
37:喚醒語音處理組件
4:電連接器
501-505:動作
601-608:動作
7:電子設備
71:連接埠
圖1為本揭示之語音喚醒裝置的結構方塊圖。
圖2為本揭示之語音喚醒裝置的控制方法流程圖。
圖3為本揭示之語音喚醒裝置的功能方塊圖。
圖4為本揭示之語音喚醒裝置處理聲音訊號的流程圖。
圖5為本揭示之語音喚醒裝置的使用狀態示意圖。
1:語音喚醒裝置
11:穩壓器
12:石英晶體振盪器
2:麥克風模組
21:麥克風
3:微控制器單元
31:微控制器
32:記憶體
4:電連接器
7:電子設備
Claims (10)
- 一種語音喚醒裝置,包括: 一麥克風模組,用於在電子設備處於休眠模式時接收環境聲音; 一電連接器,用於電性連接於該電子設備的連接埠,使該語音喚醒裝置連接於該電子設備;以及 一微控制器單元,耦接於該麥克風模組及該電連接器,包括至少一微控制器及用於存儲該微控器可執行指令的記憶體,該微控制器可執行指令使該微控制器單元執行多個任務,其包括: 偵測該麥克風模組接收的環境聲音是否存在聲音訊號,並依據該聲音 訊號產生輸入聲音訊號; 判斷該輸入聲音訊號是否包括預定的喚醒語音;及 確定該輸入聲音訊號包括該預定的喚醒語音,並輸出一喚醒指令喚醒 該處於休眠模式的電子設備進入非休眠模式。
- 如請求項1所述的語音喚醒裝置,其中該微控制器單元執行的多個任務更包括在該判斷該輸入聲音訊號是否包括預定的喚醒語音的任務前,該微控制器單元執行降噪處理,用於减少该麥克風模組所接收環境聲音的噪音,及執行回音處理,用於將該環境聲音中具有的回音消除。
- 如請求項1所述的語音喚醒裝置,其中該麥克風模組包括由多個麥克風組成的麥克風陣列,及該微控制器單元包括至少一個波束形成組件,其中該麥克風陣列用於接收來自不同方向的環境聲音,該波束形成組件根據該不同方向的環境聲音生成集中定向的輸入聲音訊號。
- 如請求項1所述的語音喚醒裝置,更包括分別耦接於該微控制器單元的一穩壓器及一石英晶體振盪器。
- 如請求項4所述的語音喚醒裝置,更包括電源供應模組,耦接於該穩壓器,該電源供應模組作為該語音喚醒裝置獨立於該電子設備的電力供應源。
- 一種語音喚醒裝置的控制方法,用於喚醒處於休眠模式的電子設備,該電子設備包括一連接埠,該語音喚醒裝置包括一麥克風模組、一電連接器,及包括至少一微控制器及一記憶體的微控制器單元,該控制方法包括: 通過該電連接器電性連接於該電子設備的連接埠,使該語音喚醒裝置連接於該電子設備,並設定喚醒語音; 利用該微控制器單元判斷該電子設備是否處於休眠模式或非休眠模式; 利用該麥克風模組在該電子設備處於休眠模式時接收環境聲音; 由該微控制器單元偵測該麥克風模組接收的環境聲音是否存在聲音訊號,並依據該聲音訊號產生輸入聲音訊號,且判斷該輸入聲音訊號是否包括該預定的喚醒語音;以及 確定該輸入聲音訊號包括該預定的喚醒語音,並輸出一喚醒指令喚醒該處於休眠模式的電子設備進入非休眠模式。
- 如請求項6所述的語音喚醒裝置的控制方法,其中在判斷該輸入聲音訊號是否包括該預定的喚醒語音之前,該控制方法更包括利用該微控制器單元執行降噪處理,用於减少该麥克風模組所接收環境聲音的噪音,及執行回音處理,用於將環境聲音中具有的回音消除。
- 如請求項6所述的語音喚醒裝置的控制方法,其中該利用該麥克風模組在該電子設備處於休眠模式時接收環境聲音包括:利用包括在該麥克風模組的多個麥克風組成的麥克風陣列接收來自不同方向的環境聲音,並利用包括在該微控制器單元的至少一個波束形成組件,根據該不同方向的環境聲音生成集中定向的輸入聲音訊號。
- 如請求項6所述的語音喚醒裝置的控制方法,其中該語音喚醒裝置更包括分別耦接於該微控制器單元的一穩壓器及一石英晶體振盪器,及耦接於該穩壓器的電源供應模組,其中該電源供應模組作為該語音喚醒裝置獨立於該電子設備的電力供應源,該穩壓器用於穩定提供至該語音喚醒裝置的電壓,及該石英晶體振盪器用於使該微控制器單元在預定的工作頻率運作。
- 如請求項6所述的語音喚醒裝置的控制方法,其中該麥克風模組是在經過一指定間隔時間反覆執行該接收環境聲音的動作,使該語音喚醒裝置可以即時喚醒該電子設備。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109145369A TWI765485B (zh) | 2020-12-21 | 2020-12-21 | 外接式語音喚醒裝置及其控制方法 |
US17/545,883 US20220199072A1 (en) | 2020-12-21 | 2021-12-08 | Voice wake-up device and method of controlling same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109145369A TWI765485B (zh) | 2020-12-21 | 2020-12-21 | 外接式語音喚醒裝置及其控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI765485B TWI765485B (zh) | 2022-05-21 |
TW202225910A true TW202225910A (zh) | 2022-07-01 |
Family
ID=82022464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109145369A TWI765485B (zh) | 2020-12-21 | 2020-12-21 | 外接式語音喚醒裝置及其控制方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220199072A1 (zh) |
TW (1) | TWI765485B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116259314A (zh) * | 2022-09-09 | 2023-06-13 | 青岛海尔空调器有限总公司 | 用于控制语音控制设备的方法及装置、控制语音控制设备 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9921803B2 (en) * | 2010-08-23 | 2018-03-20 | Nokia Technologies Oy | Audio user interface apparatus and method |
US8290336B2 (en) * | 2010-08-24 | 2012-10-16 | Allen Ku | Keyboard having video and audio recording function |
US9117449B2 (en) * | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
US9063731B2 (en) * | 2012-08-27 | 2015-06-23 | Samsung Electronics Co., Ltd. | Ultra low power apparatus and method to wake up a main processor |
US9703350B2 (en) * | 2013-03-15 | 2017-07-11 | Maxim Integrated Products, Inc. | Always-on low-power keyword spotting |
FR3030177B1 (fr) * | 2014-12-16 | 2016-12-30 | Stmicroelectronics Rousset | Dispositif electronique comprenant un module de reveil d'un appareil electronique distinct d'un coeur de traitement |
US9613626B2 (en) * | 2015-02-06 | 2017-04-04 | Fortemedia, Inc. | Audio device for recognizing key phrases and method thereof |
BR112017021673B1 (pt) * | 2015-04-10 | 2023-02-14 | Honor Device Co., Ltd | Método de controle de voz, meio não-transitório legível por computador e terminal |
TW201908920A (zh) * | 2017-07-21 | 2019-03-01 | 致伸科技股份有限公司 | 數位語音助理之操作系統 |
US10504511B2 (en) * | 2017-07-24 | 2019-12-10 | Midea Group Co., Ltd. | Customizable wake-up voice commands |
US10524046B2 (en) * | 2017-12-06 | 2019-12-31 | Ademco Inc. | Systems and methods for automatic speech recognition |
US10601599B2 (en) * | 2017-12-29 | 2020-03-24 | Synaptics Incorporated | Voice command processing in low power devices |
CN108877802A (zh) * | 2018-05-29 | 2018-11-23 | 康佳集团股份有限公司 | 一种集成语音唤醒功能的电路、电视和语音控制方法 |
CN111199733A (zh) * | 2018-11-19 | 2020-05-26 | 珠海全志科技股份有限公司 | 多级识别语音唤醒方法及装置、计算机存储介质及设备 |
US11423885B2 (en) * | 2019-02-20 | 2022-08-23 | Google Llc | Utilizing pre-event and post-event input streams to engage an automated assistant |
CN109949810B (zh) * | 2019-03-28 | 2021-09-07 | 荣耀终端有限公司 | 一种语音唤醒方法、装置、设备及介质 |
US20210373596A1 (en) * | 2019-04-02 | 2021-12-02 | Talkgo, Inc. | Voice-enabled external smart processing system with display |
KR102225001B1 (ko) * | 2019-05-21 | 2021-03-08 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US20210005181A1 (en) * | 2019-06-10 | 2021-01-07 | Knowles Electronics, Llc | Audible keyword detection and method |
KR20210050901A (ko) * | 2019-10-29 | 2021-05-10 | 엘지전자 주식회사 | 음성 인식 방법 및 음성 인식 장치 |
-
2020
- 2020-12-21 TW TW109145369A patent/TWI765485B/zh active
-
2021
- 2021-12-08 US US17/545,883 patent/US20220199072A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
TWI765485B (zh) | 2022-05-21 |
US20220199072A1 (en) | 2022-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101770932B1 (ko) | 모바일 디바이스용 상시 연결형 오디오 제어 | |
EP3552076B1 (en) | Low-power ambient computing system with machine learning | |
KR101994569B1 (ko) | 상시-온 컴포넌트에서의 클록 스위칭 | |
US20130173951A1 (en) | Controlling communication of a clock signal to a peripheral | |
TWI713016B (zh) | 語音偵測處理系統與語音偵測方法 | |
TWI574148B (zh) | 嵌入式控制器及其省電控制方法 | |
CN110853644B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
JP7471213B2 (ja) | 音声チップおよび電子機器 | |
TW201432494A (zh) | 具有語音控制功能之電腦系統以及語音控制方法 | |
TWI765485B (zh) | 外接式語音喚醒裝置及其控制方法 | |
US20180338206A1 (en) | Control method and control system for audio device | |
JP7133055B2 (ja) | 信号処理方法、装置、電子機器及びコンピュータプログラム製品 | |
CN113031749A (zh) | 电子设备 | |
CN114649000A (zh) | 语音唤醒装置及其控制方法 | |
CN108376059B (zh) | 一种通用计算机语音开机唤醒装置 | |
CN112992135A (zh) | 电子设备及语音控制的显示方法 | |
CN113311933B (zh) | 大屏智能设备的设备外设设置方法、装置及大屏智能设备 | |
US20140297011A1 (en) | Audio broadcasting method and electronic device using the same | |
TW201514855A (zh) | 具遠端喚醒功能的電子裝置 | |
KR20230107047A (ko) | 다이나믹 클럭 변조를 이용하는 저전력 센서 디바이스 및 전자 기기 | |
CN117850732A (zh) | 计算机系统及其声音信号的处理方法 |