TW201812570A - 可自動調整聲音輸出之方法及電子裝置 - Google Patents

可自動調整聲音輸出之方法及電子裝置 Download PDF

Info

Publication number
TW201812570A
TW201812570A TW105130911A TW105130911A TW201812570A TW 201812570 A TW201812570 A TW 201812570A TW 105130911 A TW105130911 A TW 105130911A TW 105130911 A TW105130911 A TW 105130911A TW 201812570 A TW201812570 A TW 201812570A
Authority
TW
Taiwan
Prior art keywords
sound
voice message
message
processing unit
audio processing
Prior art date
Application number
TW105130911A
Other languages
English (en)
Other versions
TWI606390B (zh
Inventor
廖和信
趙冠力
治勇 楊
楊國屏
Original Assignee
元鼎音訊股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 元鼎音訊股份有限公司 filed Critical 元鼎音訊股份有限公司
Priority to TW105130911A priority Critical patent/TWI606390B/zh
Priority to US15/366,022 priority patent/US9880804B1/en
Application granted granted Critical
Publication of TWI606390B publication Critical patent/TWI606390B/zh
Publication of TW201812570A publication Critical patent/TW201812570A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

一種自動調整聲音輸出之方法,包括下列步驟:透過麥克風接收一聲音訊息;分析聲音訊息,以判斷聲音訊息是否為語音訊息;以及,若是,控制聲音播放器暫停播放當前所播放之聲音,或降低聲音播放器當前所播放之聲音的音量。

Description

可自動調整聲音輸出之方法及電子裝置
本發明係關於一種自動調整聲音輸出之方法,特別是一種在接收人類發出之語音訊息後,自動調整當前聲音輸出之方法。
隨著行動裝置普及,有越來越來多人習慣在搭乘大眾交通工具時,以手機或平板電腦等行動裝置聆聽音樂或收看影片。為避免收聽或收看時影響到其他人,一般而言,於公共場合中以手機或平板電腦聽音樂或看影片時,多會使用耳機來播放聲音。然而,由於耳機使用時是整個貼近耳朵,因此其在播放聲音時,使用者將無法聽清楚身旁人所說的話,往往需要拿下耳機,或暫停音樂或影片的播出,才能與人清楚交談,對使用者而言,相當地不便利。
因此,實有必要思考一種方法,以解決前述問題。
本發明之主要目的係在提供一種可在接收人類發出之語音訊息後,自動調整當前聲音輸出之方法及可執行該方法之電子裝置。
為達成上述之目的,本發明之自動調整聲音輸出之方法適用於一電子裝置1,其中電子裝置1包括有聲音播放器、麥克風及音訊處理單元。本發明之自動調整聲音輸出之方法包括有下列步驟:透過麥克風接收一聲音訊息;音訊處理單元分析該聲音訊息,以判斷該聲音訊息是否為一語音訊息;以及,音訊處理單元控制聲音播放器暫停播放當前所播放之聲音,或降低聲音播放器當前所播放之聲音的音量。
本發明另提供一種可執行上述自動調整聲音輸出之方法的電子裝置,其包括有聲音播放器、麥克風以及音訊處理單元。麥克風用以接收一聲音訊息。音訊處理單元係與聲音播放器及麥克風電性連接,且音訊處理單元包括有聲音分析模組及控制模組。聲音分析模組用以分析聲音訊息,以判斷所接收之聲音訊息是否為語音訊息。控制模組係與聲音分析模組訊號連接,控制模組用以控制聲音播放器暫停播放當前所播放之聲音,或降低聲音播放器當前所播放之聲音的音量。
為能讓 貴審查委員能更瞭解本發明之技術內容,特舉較佳具體實施例說明如下。
以下請先參考圖1關於本發明之電子裝置之裝置架構圖。
如圖1所示,在本發明之一實施例中,本發明之電子裝置1包括有聲音播放器10、麥克風20以及音訊處理單元30。在本發明之具體實施例中,電子裝置1為智慧型手機,但本發明不以此為限,其也可為平板電腦、筆記型電腦,或其他具有聲音播放及運算處理功能之電子產品。
在本發明之一實施例中,聲音播放器10,例如可為耳機,用以播放聲音。
在本發明之一實施例中,麥克風20係用以接收電子裝置1外部的聲音訊息21。
在本發明之一實施例中,音訊處理單元30,例如可為一音訊處理晶片,係與聲音播放器10及麥克風20電性連接。音訊處理單元30可處理由麥克風20或其他元件(例如:處理器)產生之輸入聲音訊號,以產生輸出聲音訊號;輸出聲音訊號傳送至聲音播放器10或其他聲音播放裝置(例如:喇叭)後,聲音播放器10或其他聲音播放裝置可根據輸出聲音訊號播放聲音。由於聲音訊號之編解碼處理為習用技術,其原理及實施方式亦散見在許多公開文獻當中,且其並非本發明可專利性之重點,故在此即不再多做贅述。
在本發明之一實施例中,音訊處理單元30包括有聲音分析模組31及控制模組32,其中控制模組32係與聲音分析模組31訊號連接。此處需注意的是,所述聲音分析模組31及控制模組32除可配置為硬體裝置、軟體程式、韌體或其組合外,亦可藉電路迴路或其他適當型式配置;並且,各個模組除可以單獨之型式配置外,亦可以結合之型式配置。此外,本實施方式僅例示本發明之較佳實施例,為避免贅述,並未詳加記載所有可能的變化組合。然而,本領域之通常知識者應可理解,上述各模組或元件未必皆為必要。且為實施本發明,亦可能包含其他較細節之習知模組或元件。各模組或元件皆可能視需求加以省略或修改,且任兩模組間未必不存在其他模組或元件。
在本發明之一實施例中,聲音分析模組31用以分析由麥克風20所接收到的聲音訊息21,藉以判斷聲音訊息21是否為人類發出的語音訊息(即判斷是否為人聲)。在具體實施例中,聲音分析模組31包括音段切割單元312及母音檢查單元314,其中音段切割單元312用以將聲音訊息21切割為複數聲音段,而母音檢查單元314則用以檢查該複數聲音段是否有其中一聲音段為母音段,並在檢查出有其中一聲音段為母音段時,判斷聲音訊息21為語音訊息。關於母音段之判斷方法為習用之技術,其具體原理及實施方式可參照美國專利第9,311,933B2號(METHOD OF PROCESSING A VOICE SEGMENT AND HEARING AID),譬如透過檢查是否有複數段諧波現象(harmonic phenomenon);惟需注意的是,該文獻所述方式僅為現有母音偵測方法之一,然本發明自動調整聲音輸出之方法並不限以該方式實施母音偵測,應可理解的是,任何可辨識子、母之方法皆可為本發明所利用。
在本發明之一實施例中,控制模組32用以在聲音分析模組31判斷聲音訊息21為語音訊息時,控制聲音播放器10暫停播放當前所播放之聲音,或降低聲音播放器10當前所播放之聲音的音量,且一旦聲音播放器10暫停播放當前所播放之聲音時,控制模組32並會用以控制聲音播放器10播放麥克風20所接收到的聲音訊息21。
接著,請一併參考圖1至圖3。其中圖2係本發明之自動調整聲音輸出之方法的步驟流程圖;圖3係表示圖2所示之步驟S202的具體實施方式之一。需注意的是,以下雖是以前述之電子裝置1為例,說明本發明揭露之自動調整聲音輸出之方法,但本發明之自動調整聲音輸出之方法並不以應用於前述之電子裝置1為限。
首先,進行步驟S201:透過麥克風接收一聲音訊息。
由於本發明揭示之自動調整聲音輸出之方法係用以在電子裝置1接收人類所發出之語音訊息後,自動調整電子裝置1當前聲音之輸出,因此,方法執行的第一步即是先透過電子裝置1之麥克風20去接收電子裝置1外部之聲音訊息21。
步驟S202:分析聲音訊息,以判斷聲音訊息是否為語音訊息。
在完成步驟S201後,接著,電子裝置1之音訊處理單元30會分析麥克風20所接收到的聲音訊息21,藉以判斷聲音訊息21是否為語音訊息。在本發明之實施例中,步驟S202之具體實施方式之一可參考圖3,其實施之第一步會先將所接收到的聲音訊息21切割為複數聲音段(即步驟S2021),之後再檢查該複數聲音段是否有其中一聲音段為母音段(即步驟S2022)。一旦檢查無任何聲音段為母音段,音訊處理單元30即判斷聲音訊息21為非語音訊息(即步驟S2024)。反之,如果檢查出有其中至少一聲音段為母音段時,則判斷聲音訊息為語音訊息(即步驟S2023),並往下執行步驟S203。
步驟S203:控制聲音播放器暫停播放當前所播放之聲音,並控制聲音播放器播放聲音訊息。
在本發明之一實施例中,當分析出麥克風20所接收之聲音訊息21為語音訊息後,音訊處理單元30之控制模組32會控制聲音播放器10暫停播放當前所播放之聲音,並控制聲音播放器10播放麥克風20所接收到的聲音訊息21。舉例而言,假設使用者正透過電子裝置1之聲音播放器10聆聽音樂,此時如果有其他人跟他說話,聲音播放器10便會在上述方法執行完畢後,暫停播放音樂,並播放該他人所講的話。
綜上所陳,本發明無論就目的、手段及功效,在在均顯示其迥異於習知技術之特徵,懇請 貴審查委員明察,早日賜准專利,俾嘉惠社會,實感德便。惟應注意的是,上述諸多實施例僅係為了便於說明而舉例而已,本發明所主張之權利範圍自應以申請專利範圍所述為準,而非僅限於上述實施例。
1‧‧‧電子裝置
10‧‧‧聲音播放器
20‧‧‧麥克風
21‧‧‧聲音訊息
30‧‧‧音訊處理單元
31‧‧‧聲音分析模組
312‧‧‧音段切割單元
314‧‧‧母音檢查單元
32‧‧‧控制模組
圖1係本發明之電子裝置之裝置架構圖。 圖2係本發明之自動調整聲音輸出之方法的步驟流程圖。 圖3係表示圖2所示之步驟S202的具體實施方式之一。

Claims (6)

  1. 一種自動調整聲音輸出之方法,適用於一電子裝置,該電子裝置包括一聲音播放器、一麥克風及一音訊處理單元,包括下列步驟: 透過該麥克風接收一聲音訊息; 該音訊處理單元分析該聲音訊息,以判斷該聲音訊息是否為一語音訊息;以及 若是,該音訊處理單元控制該聲音播放器暫停播放當前所播放之聲音,或降低該聲音播放器當前所播放之聲音的音量。
  2. 如申請專利範圍第1項所述之方法,其中判斷該聲音訊息是否為該語音訊息之步驟包括: 該音訊處理單元將該聲音訊息切割為複數聲音段; 該音訊處理單元檢查該複數聲音段是否有其中一聲音段為一母音段; 若是,該音訊處理單元判斷該聲音訊息為該語音訊息;以及 若否,該音訊處理單元判斷該聲音訊息為一非語音訊息。
  3. 如申請專利範圍第1項所述之方法,其中當控制該聲音播放器暫停播放當前所播放之聲音後,該方法更包括以下步驟: 該音訊處理單元控制該聲音播放器播放該聲音訊息。
  4. 一種電子裝置,包括: 一聲音播放器; 一麥克風,用以接收一聲音訊息; 一音訊處理單元,係與該聲音播放器及該麥克風電性連接,該音訊處理單元包括: 一聲音分析模組,用以分析該聲音訊息,以判斷該聲音訊息是否為一語音訊息;以及 一控制模組,係與該聲音分析模組訊號連接,用以在該聲音分析模組判斷該聲音訊息為語音訊息時,控制該聲音播放器暫停播放當前所播放之聲音,或降低該聲音播放器當前所播放之聲音的音量。
  5. 如申請專利範圍第4項所述之電子裝置,其中該聲音分析模組包括: 一音段切割單元,用以將該聲音訊息切割為複數聲音段; 一母音檢查單元,用以檢查該複數聲音段是否有其中一聲音段為一母音段,並在檢查出有其中一聲音段為母音段時,判斷該聲音訊息為該語音訊息。
  6. 如申請專利範圍第4項所述之電子裝置,其中該控制模組在控制該聲音播放器暫停播放當前所播放之聲音後,更用以控制該聲音播放器播放該聲音訊息。
TW105130911A 2016-09-23 2016-09-23 可自動調整聲音輸出之方法及電子裝置 TWI606390B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW105130911A TWI606390B (zh) 2016-09-23 2016-09-23 可自動調整聲音輸出之方法及電子裝置
US15/366,022 US9880804B1 (en) 2016-09-23 2016-12-01 Method of automatically adjusting sound output and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW105130911A TWI606390B (zh) 2016-09-23 2016-09-23 可自動調整聲音輸出之方法及電子裝置

Publications (2)

Publication Number Publication Date
TWI606390B TWI606390B (zh) 2017-11-21
TW201812570A true TW201812570A (zh) 2018-04-01

Family

ID=61005433

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105130911A TWI606390B (zh) 2016-09-23 2016-09-23 可自動調整聲音輸出之方法及電子裝置

Country Status (2)

Country Link
US (1) US9880804B1 (zh)
TW (1) TWI606390B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112399004A (zh) * 2019-08-14 2021-02-23 原相科技股份有限公司 声音输出的调整方法及执行该调整方法的电子装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI662546B (zh) * 2018-04-27 2019-06-11 塞席爾商元鼎音訊股份有限公司 聲音調整方法和系統
CN110853662B (zh) * 2018-08-02 2022-06-24 深圳市优必选科技有限公司 语音交互方法、装置及机器人

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6868385B1 (en) * 1999-10-05 2005-03-15 Yomobile, Inc. Method and apparatus for the provision of information signals based upon speech recognition
TWI241828B (en) * 2004-02-18 2005-10-11 Partner Tech Corp Handheld personal data assistant (PDA) for communicating with a mobile in music-playing operation
US6944277B1 (en) * 2004-02-26 2005-09-13 Nokia Corporation Text-to-speech and MIDI ringing tone for communications devices
JP4792703B2 (ja) * 2004-02-26 2011-10-12 株式会社セガ 音声解析装置、音声解析方法及び音声解析プログラム
US20120253823A1 (en) * 2004-09-10 2012-10-04 Thomas Barton Schalk Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
US20060109983A1 (en) * 2004-11-19 2006-05-25 Young Randall K Signal masking and method thereof
US9300790B2 (en) * 2005-06-24 2016-03-29 Securus Technologies, Inc. Multi-party conversation analyzer and logger
US8532678B2 (en) * 2006-03-08 2013-09-10 Tomtom International B.V. Portable GPS navigation device
US9477395B2 (en) * 2007-09-04 2016-10-25 Apple Inc. Audio file interface
US8599836B2 (en) * 2010-01-27 2013-12-03 Neobitspeak LLC Web-based, hosted, self-service outbound contact center utilizing speaker-independent interactive voice response and including enhanced IP telephony
KR102056461B1 (ko) * 2012-06-15 2019-12-16 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 제어 방법
US9608952B2 (en) * 2012-12-14 2017-03-28 Intel Corporation Systems and methods for user device interaction
US9313582B2 (en) * 2013-03-15 2016-04-12 Unlimiter Mfa Co., Ltd. Hearing aid and method of enhancing speech output in real time
TWI576824B (zh) * 2013-05-30 2017-04-01 元鼎音訊股份有限公司 處理聲音段之方法及其電腦程式產品及助聽器
US9439008B2 (en) * 2013-07-16 2016-09-06 iHear Medical, Inc. Online hearing aid fitting system and methods for non-expert user
TW201543909A (zh) * 2014-05-12 2015-11-16 Avermedia Tech Inc 耳機裝置及其音量控制方法
US9812128B2 (en) * 2014-10-09 2017-11-07 Google Inc. Device leadership negotiation among voice interface devices
US9318107B1 (en) * 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
TWI543072B (zh) * 2014-11-18 2016-07-21 美律實業股份有限公司 行動裝置與其操作方法
EP3384686A4 (en) * 2015-12-04 2019-08-21 Ihear Medical Inc. AUTOMATIC ADAPTATION OF A HEARING DEVICE

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112399004A (zh) * 2019-08-14 2021-02-23 原相科技股份有限公司 声音输出的调整方法及执行该调整方法的电子装置
CN112399004B (zh) * 2019-08-14 2024-05-24 达发科技股份有限公司 声音输出的调整方法及执行该调整方法的电子装置

Also Published As

Publication number Publication date
US9880804B1 (en) 2018-01-30
TWI606390B (zh) 2017-11-21

Similar Documents

Publication Publication Date Title
CN106462383B (zh) 具有定向接口的免提装置
US10043515B2 (en) Voice activation system
US8909537B2 (en) Device capable of playing music and method for controlling music playing in electronic device
TWI527024B (zh) 傳送語音數據之方法及非暫態電腦可讀取媒體
US8874448B1 (en) Attention-based dynamic audio level adjustment
US20180285059A1 (en) Language-based muting during multiuser communications
US20080158000A1 (en) Autodetect of user presence using a sensor
US9666209B2 (en) Prevention of unintended distribution of audio information
US20150170645A1 (en) Name-sensitive listening device
US20190121605A1 (en) Monitoring Environmental Noise and Data Packets to Display a Transcription of Call Audio
US20180150276A1 (en) System and method for enabling communication of ambient sound as an audio stream
US20140241702A1 (en) Dynamic audio perspective change during video playback
TWI606390B (zh) 可自動調整聲音輸出之方法及電子裝置
US20150348562A1 (en) Apparatus and method for improving an audio signal in the spectral domain
CN105204761B (zh) 一种音量调节方法及用户终端
US20140314242A1 (en) Ambient Sound Enablement for Headsets
TW201715380A (zh) 電子裝置及其聲音訊號調整方法
US20150049879A1 (en) Method of audio processing and audio-playing device
TWI522904B (zh) 電子裝置及用以校正電子裝置的耳機麥克風
US11367457B2 (en) Method for detecting ambient noise to change the playing voice frequency and sound playing device thereof
TWI578755B (zh) 遠端多方會議音量調整系統及方法
WO2017166495A1 (zh) 一种语音信号处理方法及装置
US11122160B1 (en) Detecting and correcting audio echo
US10129382B2 (en) Electronic device and method for controlling electronic device using headset
TWI617135B (zh) 聲音輸出裝置及其控制方法