TW201812570A - 可自動調整聲音輸出之方法及電子裝置 - Google Patents
可自動調整聲音輸出之方法及電子裝置 Download PDFInfo
- Publication number
- TW201812570A TW201812570A TW105130911A TW105130911A TW201812570A TW 201812570 A TW201812570 A TW 201812570A TW 105130911 A TW105130911 A TW 105130911A TW 105130911 A TW105130911 A TW 105130911A TW 201812570 A TW201812570 A TW 201812570A
- Authority
- TW
- Taiwan
- Prior art keywords
- sound
- voice message
- message
- processing unit
- audio processing
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000008774 maternal effect Effects 0.000 claims 1
- 238000007689 inspection Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
一種自動調整聲音輸出之方法,包括下列步驟:透過麥克風接收一聲音訊息;分析聲音訊息,以判斷聲音訊息是否為語音訊息;以及,若是,控制聲音播放器暫停播放當前所播放之聲音,或降低聲音播放器當前所播放之聲音的音量。
Description
本發明係關於一種自動調整聲音輸出之方法,特別是一種在接收人類發出之語音訊息後,自動調整當前聲音輸出之方法。
隨著行動裝置普及,有越來越來多人習慣在搭乘大眾交通工具時,以手機或平板電腦等行動裝置聆聽音樂或收看影片。為避免收聽或收看時影響到其他人,一般而言,於公共場合中以手機或平板電腦聽音樂或看影片時,多會使用耳機來播放聲音。然而,由於耳機使用時是整個貼近耳朵,因此其在播放聲音時,使用者將無法聽清楚身旁人所說的話,往往需要拿下耳機,或暫停音樂或影片的播出,才能與人清楚交談,對使用者而言,相當地不便利。
因此,實有必要思考一種方法,以解決前述問題。
本發明之主要目的係在提供一種可在接收人類發出之語音訊息後,自動調整當前聲音輸出之方法及可執行該方法之電子裝置。
為達成上述之目的,本發明之自動調整聲音輸出之方法適用於一電子裝置1,其中電子裝置1包括有聲音播放器、麥克風及音訊處理單元。本發明之自動調整聲音輸出之方法包括有下列步驟:透過麥克風接收一聲音訊息;音訊處理單元分析該聲音訊息,以判斷該聲音訊息是否為一語音訊息;以及,音訊處理單元控制聲音播放器暫停播放當前所播放之聲音,或降低聲音播放器當前所播放之聲音的音量。
本發明另提供一種可執行上述自動調整聲音輸出之方法的電子裝置,其包括有聲音播放器、麥克風以及音訊處理單元。麥克風用以接收一聲音訊息。音訊處理單元係與聲音播放器及麥克風電性連接,且音訊處理單元包括有聲音分析模組及控制模組。聲音分析模組用以分析聲音訊息,以判斷所接收之聲音訊息是否為語音訊息。控制模組係與聲音分析模組訊號連接,控制模組用以控制聲音播放器暫停播放當前所播放之聲音,或降低聲音播放器當前所播放之聲音的音量。
為能讓 貴審查委員能更瞭解本發明之技術內容,特舉較佳具體實施例說明如下。
以下請先參考圖1關於本發明之電子裝置之裝置架構圖。
如圖1所示,在本發明之一實施例中,本發明之電子裝置1包括有聲音播放器10、麥克風20以及音訊處理單元30。在本發明之具體實施例中,電子裝置1為智慧型手機,但本發明不以此為限,其也可為平板電腦、筆記型電腦,或其他具有聲音播放及運算處理功能之電子產品。
在本發明之一實施例中,聲音播放器10,例如可為耳機,用以播放聲音。
在本發明之一實施例中,麥克風20係用以接收電子裝置1外部的聲音訊息21。
在本發明之一實施例中,音訊處理單元30,例如可為一音訊處理晶片,係與聲音播放器10及麥克風20電性連接。音訊處理單元30可處理由麥克風20或其他元件(例如:處理器)產生之輸入聲音訊號,以產生輸出聲音訊號;輸出聲音訊號傳送至聲音播放器10或其他聲音播放裝置(例如:喇叭)後,聲音播放器10或其他聲音播放裝置可根據輸出聲音訊號播放聲音。由於聲音訊號之編解碼處理為習用技術,其原理及實施方式亦散見在許多公開文獻當中,且其並非本發明可專利性之重點,故在此即不再多做贅述。
在本發明之一實施例中,音訊處理單元30包括有聲音分析模組31及控制模組32,其中控制模組32係與聲音分析模組31訊號連接。此處需注意的是,所述聲音分析模組31及控制模組32除可配置為硬體裝置、軟體程式、韌體或其組合外,亦可藉電路迴路或其他適當型式配置;並且,各個模組除可以單獨之型式配置外,亦可以結合之型式配置。此外,本實施方式僅例示本發明之較佳實施例,為避免贅述,並未詳加記載所有可能的變化組合。然而,本領域之通常知識者應可理解,上述各模組或元件未必皆為必要。且為實施本發明,亦可能包含其他較細節之習知模組或元件。各模組或元件皆可能視需求加以省略或修改,且任兩模組間未必不存在其他模組或元件。
在本發明之一實施例中,聲音分析模組31用以分析由麥克風20所接收到的聲音訊息21,藉以判斷聲音訊息21是否為人類發出的語音訊息(即判斷是否為人聲)。在具體實施例中,聲音分析模組31包括音段切割單元312及母音檢查單元314,其中音段切割單元312用以將聲音訊息21切割為複數聲音段,而母音檢查單元314則用以檢查該複數聲音段是否有其中一聲音段為母音段,並在檢查出有其中一聲音段為母音段時,判斷聲音訊息21為語音訊息。關於母音段之判斷方法為習用之技術,其具體原理及實施方式可參照美國專利第9,311,933B2號(METHOD OF PROCESSING A VOICE SEGMENT AND HEARING AID),譬如透過檢查是否有複數段諧波現象(harmonic phenomenon);惟需注意的是,該文獻所述方式僅為現有母音偵測方法之一,然本發明自動調整聲音輸出之方法並不限以該方式實施母音偵測,應可理解的是,任何可辨識子、母之方法皆可為本發明所利用。
在本發明之一實施例中,控制模組32用以在聲音分析模組31判斷聲音訊息21為語音訊息時,控制聲音播放器10暫停播放當前所播放之聲音,或降低聲音播放器10當前所播放之聲音的音量,且一旦聲音播放器10暫停播放當前所播放之聲音時,控制模組32並會用以控制聲音播放器10播放麥克風20所接收到的聲音訊息21。
接著,請一併參考圖1至圖3。其中圖2係本發明之自動調整聲音輸出之方法的步驟流程圖;圖3係表示圖2所示之步驟S202的具體實施方式之一。需注意的是,以下雖是以前述之電子裝置1為例,說明本發明揭露之自動調整聲音輸出之方法,但本發明之自動調整聲音輸出之方法並不以應用於前述之電子裝置1為限。
首先,進行步驟S201:透過麥克風接收一聲音訊息。
由於本發明揭示之自動調整聲音輸出之方法係用以在電子裝置1接收人類所發出之語音訊息後,自動調整電子裝置1當前聲音之輸出,因此,方法執行的第一步即是先透過電子裝置1之麥克風20去接收電子裝置1外部之聲音訊息21。
步驟S202:分析聲音訊息,以判斷聲音訊息是否為語音訊息。
在完成步驟S201後,接著,電子裝置1之音訊處理單元30會分析麥克風20所接收到的聲音訊息21,藉以判斷聲音訊息21是否為語音訊息。在本發明之實施例中,步驟S202之具體實施方式之一可參考圖3,其實施之第一步會先將所接收到的聲音訊息21切割為複數聲音段(即步驟S2021),之後再檢查該複數聲音段是否有其中一聲音段為母音段(即步驟S2022)。一旦檢查無任何聲音段為母音段,音訊處理單元30即判斷聲音訊息21為非語音訊息(即步驟S2024)。反之,如果檢查出有其中至少一聲音段為母音段時,則判斷聲音訊息為語音訊息(即步驟S2023),並往下執行步驟S203。
步驟S203:控制聲音播放器暫停播放當前所播放之聲音,並控制聲音播放器播放聲音訊息。
在本發明之一實施例中,當分析出麥克風20所接收之聲音訊息21為語音訊息後,音訊處理單元30之控制模組32會控制聲音播放器10暫停播放當前所播放之聲音,並控制聲音播放器10播放麥克風20所接收到的聲音訊息21。舉例而言,假設使用者正透過電子裝置1之聲音播放器10聆聽音樂,此時如果有其他人跟他說話,聲音播放器10便會在上述方法執行完畢後,暫停播放音樂,並播放該他人所講的話。
綜上所陳,本發明無論就目的、手段及功效,在在均顯示其迥異於習知技術之特徵,懇請 貴審查委員明察,早日賜准專利,俾嘉惠社會,實感德便。惟應注意的是,上述諸多實施例僅係為了便於說明而舉例而已,本發明所主張之權利範圍自應以申請專利範圍所述為準,而非僅限於上述實施例。
1‧‧‧電子裝置
10‧‧‧聲音播放器
20‧‧‧麥克風
21‧‧‧聲音訊息
30‧‧‧音訊處理單元
31‧‧‧聲音分析模組
312‧‧‧音段切割單元
314‧‧‧母音檢查單元
32‧‧‧控制模組
10‧‧‧聲音播放器
20‧‧‧麥克風
21‧‧‧聲音訊息
30‧‧‧音訊處理單元
31‧‧‧聲音分析模組
312‧‧‧音段切割單元
314‧‧‧母音檢查單元
32‧‧‧控制模組
圖1係本發明之電子裝置之裝置架構圖。 圖2係本發明之自動調整聲音輸出之方法的步驟流程圖。 圖3係表示圖2所示之步驟S202的具體實施方式之一。
Claims (6)
- 一種自動調整聲音輸出之方法,適用於一電子裝置,該電子裝置包括一聲音播放器、一麥克風及一音訊處理單元,包括下列步驟: 透過該麥克風接收一聲音訊息; 該音訊處理單元分析該聲音訊息,以判斷該聲音訊息是否為一語音訊息;以及 若是,該音訊處理單元控制該聲音播放器暫停播放當前所播放之聲音,或降低該聲音播放器當前所播放之聲音的音量。
- 如申請專利範圍第1項所述之方法,其中判斷該聲音訊息是否為該語音訊息之步驟包括: 該音訊處理單元將該聲音訊息切割為複數聲音段; 該音訊處理單元檢查該複數聲音段是否有其中一聲音段為一母音段; 若是,該音訊處理單元判斷該聲音訊息為該語音訊息;以及 若否,該音訊處理單元判斷該聲音訊息為一非語音訊息。
- 如申請專利範圍第1項所述之方法,其中當控制該聲音播放器暫停播放當前所播放之聲音後,該方法更包括以下步驟: 該音訊處理單元控制該聲音播放器播放該聲音訊息。
- 一種電子裝置,包括: 一聲音播放器; 一麥克風,用以接收一聲音訊息; 一音訊處理單元,係與該聲音播放器及該麥克風電性連接,該音訊處理單元包括: 一聲音分析模組,用以分析該聲音訊息,以判斷該聲音訊息是否為一語音訊息;以及 一控制模組,係與該聲音分析模組訊號連接,用以在該聲音分析模組判斷該聲音訊息為語音訊息時,控制該聲音播放器暫停播放當前所播放之聲音,或降低該聲音播放器當前所播放之聲音的音量。
- 如申請專利範圍第4項所述之電子裝置,其中該聲音分析模組包括: 一音段切割單元,用以將該聲音訊息切割為複數聲音段; 一母音檢查單元,用以檢查該複數聲音段是否有其中一聲音段為一母音段,並在檢查出有其中一聲音段為母音段時,判斷該聲音訊息為該語音訊息。
- 如申請專利範圍第4項所述之電子裝置,其中該控制模組在控制該聲音播放器暫停播放當前所播放之聲音後,更用以控制該聲音播放器播放該聲音訊息。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105130911A TWI606390B (zh) | 2016-09-23 | 2016-09-23 | 可自動調整聲音輸出之方法及電子裝置 |
US15/366,022 US9880804B1 (en) | 2016-09-23 | 2016-12-01 | Method of automatically adjusting sound output and electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW105130911A TWI606390B (zh) | 2016-09-23 | 2016-09-23 | 可自動調整聲音輸出之方法及電子裝置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI606390B TWI606390B (zh) | 2017-11-21 |
TW201812570A true TW201812570A (zh) | 2018-04-01 |
Family
ID=61005433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105130911A TWI606390B (zh) | 2016-09-23 | 2016-09-23 | 可自動調整聲音輸出之方法及電子裝置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9880804B1 (zh) |
TW (1) | TWI606390B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112399004A (zh) * | 2019-08-14 | 2021-02-23 | 原相科技股份有限公司 | 声音输出的调整方法及执行该调整方法的电子装置 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI662546B (zh) * | 2018-04-27 | 2019-06-11 | 塞席爾商元鼎音訊股份有限公司 | 聲音調整方法和系統 |
CN110853662B (zh) * | 2018-08-02 | 2022-06-24 | 深圳市优必选科技有限公司 | 语音交互方法、装置及机器人 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6868385B1 (en) * | 1999-10-05 | 2005-03-15 | Yomobile, Inc. | Method and apparatus for the provision of information signals based upon speech recognition |
TWI241828B (en) * | 2004-02-18 | 2005-10-11 | Partner Tech Corp | Handheld personal data assistant (PDA) for communicating with a mobile in music-playing operation |
US6944277B1 (en) * | 2004-02-26 | 2005-09-13 | Nokia Corporation | Text-to-speech and MIDI ringing tone for communications devices |
JP4792703B2 (ja) * | 2004-02-26 | 2011-10-12 | 株式会社セガ | 音声解析装置、音声解析方法及び音声解析プログラム |
US20120253823A1 (en) * | 2004-09-10 | 2012-10-04 | Thomas Barton Schalk | Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing |
US20060109983A1 (en) * | 2004-11-19 | 2006-05-25 | Young Randall K | Signal masking and method thereof |
US9300790B2 (en) * | 2005-06-24 | 2016-03-29 | Securus Technologies, Inc. | Multi-party conversation analyzer and logger |
US8532678B2 (en) * | 2006-03-08 | 2013-09-10 | Tomtom International B.V. | Portable GPS navigation device |
US9477395B2 (en) * | 2007-09-04 | 2016-10-25 | Apple Inc. | Audio file interface |
US8599836B2 (en) * | 2010-01-27 | 2013-12-03 | Neobitspeak LLC | Web-based, hosted, self-service outbound contact center utilizing speaker-independent interactive voice response and including enhanced IP telephony |
KR102056461B1 (ko) * | 2012-06-15 | 2019-12-16 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 장치의 제어 방법 |
US9608952B2 (en) * | 2012-12-14 | 2017-03-28 | Intel Corporation | Systems and methods for user device interaction |
US9313582B2 (en) * | 2013-03-15 | 2016-04-12 | Unlimiter Mfa Co., Ltd. | Hearing aid and method of enhancing speech output in real time |
TWI576824B (zh) * | 2013-05-30 | 2017-04-01 | 元鼎音訊股份有限公司 | 處理聲音段之方法及其電腦程式產品及助聽器 |
US9439008B2 (en) * | 2013-07-16 | 2016-09-06 | iHear Medical, Inc. | Online hearing aid fitting system and methods for non-expert user |
TW201543909A (zh) * | 2014-05-12 | 2015-11-16 | Avermedia Tech Inc | 耳機裝置及其音量控制方法 |
US9812128B2 (en) * | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
TWI543072B (zh) * | 2014-11-18 | 2016-07-21 | 美律實業股份有限公司 | 行動裝置與其操作方法 |
EP3384686A4 (en) * | 2015-12-04 | 2019-08-21 | Ihear Medical Inc. | AUTOMATIC ADAPTATION OF A HEARING DEVICE |
-
2016
- 2016-09-23 TW TW105130911A patent/TWI606390B/zh active
- 2016-12-01 US US15/366,022 patent/US9880804B1/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112399004A (zh) * | 2019-08-14 | 2021-02-23 | 原相科技股份有限公司 | 声音输出的调整方法及执行该调整方法的电子装置 |
CN112399004B (zh) * | 2019-08-14 | 2024-05-24 | 达发科技股份有限公司 | 声音输出的调整方法及执行该调整方法的电子装置 |
Also Published As
Publication number | Publication date |
---|---|
US9880804B1 (en) | 2018-01-30 |
TWI606390B (zh) | 2017-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106462383B (zh) | 具有定向接口的免提装置 | |
US10043515B2 (en) | Voice activation system | |
US8909537B2 (en) | Device capable of playing music and method for controlling music playing in electronic device | |
TWI527024B (zh) | 傳送語音數據之方法及非暫態電腦可讀取媒體 | |
US8874448B1 (en) | Attention-based dynamic audio level adjustment | |
US20180285059A1 (en) | Language-based muting during multiuser communications | |
US20080158000A1 (en) | Autodetect of user presence using a sensor | |
US9666209B2 (en) | Prevention of unintended distribution of audio information | |
US20150170645A1 (en) | Name-sensitive listening device | |
US20190121605A1 (en) | Monitoring Environmental Noise and Data Packets to Display a Transcription of Call Audio | |
US20180150276A1 (en) | System and method for enabling communication of ambient sound as an audio stream | |
US20140241702A1 (en) | Dynamic audio perspective change during video playback | |
TWI606390B (zh) | 可自動調整聲音輸出之方法及電子裝置 | |
US20150348562A1 (en) | Apparatus and method for improving an audio signal in the spectral domain | |
CN105204761B (zh) | 一种音量调节方法及用户终端 | |
US20140314242A1 (en) | Ambient Sound Enablement for Headsets | |
TW201715380A (zh) | 電子裝置及其聲音訊號調整方法 | |
US20150049879A1 (en) | Method of audio processing and audio-playing device | |
TWI522904B (zh) | 電子裝置及用以校正電子裝置的耳機麥克風 | |
US11367457B2 (en) | Method for detecting ambient noise to change the playing voice frequency and sound playing device thereof | |
TWI578755B (zh) | 遠端多方會議音量調整系統及方法 | |
WO2017166495A1 (zh) | 一种语音信号处理方法及装置 | |
US11122160B1 (en) | Detecting and correcting audio echo | |
US10129382B2 (en) | Electronic device and method for controlling electronic device using headset | |
TWI617135B (zh) | 聲音輸出裝置及其控制方法 |