TW201337722A - 音樂播放裝置及其控制方法 - Google Patents

音樂播放裝置及其控制方法 Download PDF

Info

Publication number
TW201337722A
TW201337722A TW101108075A TW101108075A TW201337722A TW 201337722 A TW201337722 A TW 201337722A TW 101108075 A TW101108075 A TW 101108075A TW 101108075 A TW101108075 A TW 101108075A TW 201337722 A TW201337722 A TW 201337722A
Authority
TW
Taiwan
Prior art keywords
voice
music
playing device
keyword
reference information
Prior art date
Application number
TW101108075A
Other languages
English (en)
Inventor
Qiang You
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201337722A publication Critical patent/TW201337722A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本發明涉及一種音樂播放裝置及控制方法。音樂播放裝置包括音樂播放器、語音採集裝置與控制系統,該音樂播放器用於播放音樂。語音採集裝置用於採集該音樂播放裝置周圍環境的語音資訊,獲取語音訊號。控制系統包括語音識別模組、語音分析模組以及執行模組。該語音識別模組用於識別處理該語音訊號,獲取語音訊號的語音特徵。語音分析模組用於將該語音特徵與參考資訊進行比較,並獲得比較結果。該執行模組用於依據比較結果控制該音樂播放器的工作,當分析結果表示該語音資訊與該參考資訊匹配時,控制該音樂播放器暫停播放音樂。

Description

音樂播放裝置及其控制方法
本發明關於一種音樂播放裝置及其控制方法。
目前,音樂播放裝置,如MP3播放器、手機、電腦已經廣泛地應用於公眾的工作及生活中。現有的音樂播放裝置中音樂的播放和暫停或者停止均由使用者手動進行操作,然而,在使用者使用音樂播放裝置收聽音樂的過程中,尤其在使用耳機收聽音樂時,若使用者需與他人交談,其需要手動暫停音樂的播放;或者當他人呼喊使用者而需與使用者交談時,使用者往往專注於音樂中而無法聽見。上述情況的發生給使用者使用該音樂播放裝置帶來諸多不便。
有鑑於此,提供一種能夠對音樂播放裝置自動調整的控制方法。
進一步,提供一種採用該控制方法的音樂播放裝置。
一種音樂播放裝置的控制方法,包括步驟:
啟動音樂播放裝置播放音樂;
採集該音樂播放裝置周圍環境的語音資訊,獲得環境語音訊號;
識別該環境語音訊號,獲取該環境語音訊號的語音特徵;
分析該環境語音訊號,將該環境語音訊號的語音特徵與參考資訊進行比較,並獲得分析比較結果;及
依據分析比較結果控制該音樂播放裝置的工作,當分析結果表示該環境語音訊號與該參考資訊匹配時,控制該音樂播放裝置暫停播放音樂。
一種音樂播放裝置,該音樂播放裝置包括音樂播放器、語音採集裝置與控制系統,該音樂播放器用於播放音樂,該語音採集裝置用於採集該音樂播放裝置周圍環境的語音資訊,獲取環境語音訊號。該控制系統包括:
語音識別模組,用於識別處理該環境語音訊號,獲取環境語音訊號的語音特徵;
語音分析模組,用於將該環境語音訊號的語音特徵與參考資訊進行比較,並獲得分析比較結果;及
執行模組用於,依據分析比較結果控制該音樂播放器的工作,當分析結果表示該語音資訊與該參考資訊匹配時,控制該音樂播放器暫停播放音樂。
相較於先前技術,該音樂播放裝置及控制方法能夠自動依據音樂播放環境中的語音資訊來控制音樂暫停播放,從而當使用者需與他人交談時自動暫停音樂播放,且能夠防止他人呼喊使用者需與使用者交談而使用者未聽見的情況出現。
請參閱圖1,其為一種音樂播放裝置的控制方法的流程圖。本實施方式中,所述的音樂播放裝置可以為,但不限於,MP3、手機、可擕式電腦等。該控制方法包括以下步驟:
步驟S101,啟動音樂播放裝置,音樂播放裝置開始播放音樂。
步驟S102,採集音樂播放裝置周圍環境的語音資訊,獲得環境語音訊號。該環境語音訊號的採集可以通過一錄音裝置來實現,如麥克風。
步驟S103,識別該環境語音訊號,獲取該環境語音訊號的語音特徵。具體地,對該環境語音訊號進行濾波、除噪、訊號放大、頻譜採集以及波形分析等處理,進而獲得該環境語音訊號的語音特徵,該語音特徵能夠表徵該環境語音訊號的具體內容以及該環境語音訊號的聲波頻譜。例如,表徵該環境語音訊號的具體內容的語音特徵可為“張x”或者使用者昵稱“小張”等。
步驟S104,分析環境語音訊號,將該環境語音訊號的語音特徵與預先存儲的參考資訊進行比較。其中,該參考資訊為包括預先存儲的表徵關鍵字或關鍵字的語音資訊和聲波頻譜。該關鍵字或者關鍵字可為該音樂播放裝置使用者的名字“張三”或者昵稱“小張”。聲波頻譜可以是音樂播放裝置使用者本身的聲波頻譜,其聲波頻譜能夠將該音樂播放裝置使用者與他人區分開。
具體地,在本實施方式中,將該環境語音訊號的語音特徵與參考資訊中表徵該關鍵字或者關鍵字的語音資訊比較,並將該語音特徵與預存的聲波頻譜進行比較,當該語音特徵中包括至少一種語音資訊或者具有至少一種預設的聲波頻譜時,表示該環境語音訊號與該參考資訊匹配;反之,則表示該環境語音訊號與該參考資訊不相匹配。當然,當該語音特徵中既包括至少一種語音資訊又具有預設的聲波頻譜時,也表示該環境語音訊號與該參考資訊匹配。
可變更地,在本發明音樂播放裝置的控制方法的另一實施方式中,需要該環境語音訊號的語音特徵既包括至少一個語音資訊又包含預設的至少一種聲波頻譜時,表示該語資訊與該參考資訊匹配;反之,則表示該環境語音訊號與該參考資訊不相匹配。
步驟S105,依據分析結果控制該音樂播放裝置的工作,當該環境語音訊號與該參考資訊匹配,控制該音樂播放裝置暫停播放音樂;反之,當該環境語音訊號與該參考環境語音訊號不匹配,則無需控制該音樂播放裝置暫停播放音樂。
優選地,該音樂播放方法還包括步驟S106,當音樂播放裝置暫停播放音樂後,計時未偵測到與參考資訊匹配的環境語音訊號的持續時間,當計時時間到達第一預設值時,控制該音樂播放裝置繼續播放音樂。該第一預設值可以依據實際需求預先進行設定,例如30秒或者1分鐘,從而使得使用者在與他人通話結束後自動恢復音樂播放。
相較於先前技術,該音樂播放裝置的控制方法能夠自動依據音樂播放環境中的語音資訊來控制音樂暫停播放,從而當使用者需與他人交談時自動暫停音樂播放,或者防止他人呼喊使用者需與使用者交談而使用者未聽見的情況出現。
請參閱圖2,其為本發明音樂播放裝置10的方框圖。音樂播放裝置10包括有處理器101、記憶體102、音樂播放器103、語音採集裝置104以及控制系統100。音樂播放器103用於音樂的播放;語音採集裝置104用於採集音樂播放裝置10周圍環境的語音資訊,獲得環境語音訊號;控制系統100存儲於記憶體102或者處理器101中並被處理器101執行,處理器101還用於控制音樂播放器103以及語音採集裝置104的工作情況。其中,音樂播放裝置10通過控制系統100、處理器101、記憶體102、音樂播放器103、語音採集裝置104的配合執行如圖1所示的控制方法,來達到對音樂播放的管理。
該控制系統100包括語音識別模組110、語音分析模組120、執行模組130以及計時模組140。該控制系統100可嵌入在音樂播放裝置10的作業系統中,也可單獨存儲。
該語音識別模組110用於識別該環境語音訊號,獲取該環境語音訊號的語音特徵。具體地,語音識別模組110接收該環境語音訊號,並對該環境語音訊號進行濾波、除噪、訊號放大、頻譜採集以及波形分析等處理,進而獲得該環境語音訊號的語音特徵,該語音特徵能夠表徵該環境語音訊號的具體內容以及該環境語音訊號的聲波頻譜。例如,表徵該環境語音訊號的具體內容的語音特徵可為“張x”或者使用者昵稱“小張”等。
所述語音分析模組120用於分析該語音特徵,將該語音特徵與預先存儲的參考資訊進行比較。其中,該參考資訊包括預先存儲的表徵關鍵字或關鍵字的語音資訊和預先存儲的聲波頻譜。該關鍵字或者關鍵字可為該音樂播放裝置使用者的名字“張三”或者昵稱“小張”。該聲波頻譜可以是音樂播放裝置使用者的聲波頻譜。
具體地,在本實施方式中,語音分析模組120將該環境語音訊號的語音特徵與該語音訊號比較,當該語音特徵中包括有至少一種表徵該關鍵字或者關鍵字的語音資訊,或者具有至少一種預設的聲波頻譜時,則表示該環境語音訊號與該參考資訊匹配;反之,則表示該環境語音訊號與該參考資訊不相匹配。
可變更地,在本發明音樂播放裝置的另一實施方式中,需要該環境語音訊號的語音特徵既包括至少一個語音資訊又包含預設的至少一種聲波頻譜時,表示該語資訊與該參考資訊匹配;反之,則表示該環境語音訊號與該參考資訊不相匹配。
所述執行模組130用於依據分析結果控制該音樂播放器103的工作,當該環境語音訊號與該參考資訊匹配,控制該音樂播放器103暫停播放音樂;反之,當該環境語音訊號與該參考語音資訊不匹配,則無需控制該音樂播放器103暫停播放音樂。
計時模組140用於當音樂播放器103暫停播放音樂後,計時未偵測到與參考資訊匹配的環境語音訊號的持續時間,當計時時間到達第一預設值時,所述執行模組130控制該音樂播放器103繼續播放音樂。
相較於先前技術,該音樂播放裝置能夠自動依據音樂播放環境中的語音資訊來控制音樂暫停播放,從而當使用者需與他人交談時自動暫停音樂播放,且能夠防止他人呼喊使用者需與使用者交談而使用者未聽見的情況出現。
綜上所述,本發明符合發明專利要件,爰依法提出專利申請。惟,以上所述僅為本發明之較佳實施方式,舉凡熟悉本案技藝之人士,在援依本案創作精神所作之等效修飾或變化,皆應包含於以下之申請專利範圍內。
10...音樂播放裝置
101...處理器
102...記憶體
103...音樂播放器
104...語音採集裝置
100...控制系統
110...語音識別模組
120...語音分析模組
130...執行模組
140...計時模組
圖1是本發明音樂播放裝置的控制方法一實施方式的流程示意圖。
圖2是本發明音樂播放裝置一實施方式的方框示意圖。
10...音樂播放裝置
101...處理器
102...記憶體
103...音樂播放器
104...語音採集裝置
100...控制系統
110...語音識別模組
120...語音分析模組
130...執行模組
140...計時模組

Claims (12)

  1. 一種音樂播放裝置之控制方法,包括步驟:
    啟動音樂播放裝置;
    採集該音樂播放裝置周圍環境的語音資訊,獲得環境語音訊號;
    識別該環境語音訊號,獲取該環境語音訊號的語音特徵;
    分析該語音特徵,將語音特徵與預設的參考資訊進行比較,並獲得分析比較結果;及
    依據分析比較結果控制該音樂播放裝置的工作,當分析結果表示該環境語音訊號與該參考資訊匹配時,控制該音樂播放裝置暫停播放音樂。
  2. 如申請專利範圍第1項所述之音樂播放裝置之控制方法,其中,該語音特徵表徵該環境語音訊號的具體內容與聲波頻譜。
  3. 如申請專利範圍第2項所述之音樂播放裝置之控制方法,其中,該參考資訊為表徵關鍵字或關鍵字的語音資訊和聲波頻譜。
  4. 如申請專利範圍第3項所述之音樂播放裝置之控制方法,其中,當該語音特徵包括至少一種該關鍵字或者該關鍵字的語音資訊,或者該語音特徵與至少一種該聲波頻譜相同時,表示環境語音訊號與該參考資訊匹配。
  5. 如申請專利範圍第3項所述之音樂播放裝置之控制方法,其中,當該語音特徵包括至少一種該關鍵字或者該關鍵字的語音資訊,並且該語音特徵與至少一種聲波頻譜相同時,表示環境語音訊號與該參考資訊匹配。
  6. 如申請專利範圍第1項所述之音樂播放裝置之控制方法,其中,該控制方法還包括步驟:該音樂播放裝置暫停播放音樂後,計時未偵測到與該參考資訊匹配的該環境語音訊號的時間,當計時時間到達一第一預設值時,控制該音樂播放裝置繼續播放音樂。
  7. 一種音樂播放裝置,該音樂播放裝置包括音樂播放器、語音採集裝置與控制系統,該音樂播放器用於播放音樂,該語音採集裝置用於採集該音樂播放裝置周圍環境的語音資訊,獲取環境語音訊號,該控制系統包括:
    語音識別模組,用於識別處理該環境語音訊號,獲取環境語音訊號的語音特徵;
    語音分析模組,用於分析該語音特徵,將該環境語音訊號的語音特徵與參考資訊進行比較,並獲得分析比較結果;及
    執行模組,用於依據分析比較結果控制該音樂播放器的工作,當分析結果表示該語音資訊與該參考資訊匹配時,控制該音樂播放器暫停播放音樂。
  8. 如申請專利範圍第7項所述之音樂播放裝置,其中,該語音特徵表徵該環境語音訊號的具體內容與聲波頻譜。
  9. 如申請專利範圍第8項所述之音樂播放裝置,其中,該參考資訊為表徵關鍵字或關鍵字的語音資訊和聲波頻譜。
  10. 如申請專利範圍第7項所述之音樂播放裝置,其中,當該語音特徵包括至少一種該關鍵字或者該關鍵字的語音資訊,或者該語音特徵與至少一種該聲波頻譜相同時,表示環境語音訊號與該參考資訊匹配。
  11. 如申請專利範圍第7項所述之音樂播放裝置,其中,當該語音特徵包括至少一種該關鍵字或者該關鍵字的語音資訊,並且該語音特徵與至少一種該聲波頻譜相同時,表示環境語音訊號與該參考資訊匹配。
  12. 如申請專利範圍第7項所述之音樂播放裝置,其中,該控制系統還包括計時模組,用於當音樂播放器暫停播放音樂後,計時未偵測到與該參考資訊匹配的該環境語音訊號的時間,當計時時間到達第一預設值時,控制該音樂播放器繼續播放音樂。
TW101108075A 2012-03-06 2012-03-09 音樂播放裝置及其控制方法 TW201337722A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210056442.9A CN103310812A (zh) 2012-03-06 2012-03-06 音乐播放装置及其控制方法

Publications (1)

Publication Number Publication Date
TW201337722A true TW201337722A (zh) 2013-09-16

Family

ID=49114877

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101108075A TW201337722A (zh) 2012-03-06 2012-03-09 音樂播放裝置及其控制方法

Country Status (3)

Country Link
US (1) US8909537B2 (zh)
CN (1) CN103310812A (zh)
TW (1) TW201337722A (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202520B1 (en) * 2012-10-17 2015-12-01 Amazon Technologies, Inc. Systems and methods for determining content preferences based on vocal utterances and/or movement by a user
KR102091003B1 (ko) * 2012-12-10 2020-03-19 삼성전자 주식회사 음성인식 기술을 이용한 상황 인식 서비스 제공 방법 및 장치
US8914818B2 (en) * 2012-12-13 2014-12-16 Intel Corporation Media device power management techniques
US9723381B2 (en) * 2013-12-23 2017-08-01 Nike, Inc. Athletic monitoring system having automatic pausing of media content
US9652532B2 (en) 2014-02-06 2017-05-16 Sr Homedics, Llc Methods for operating audio speaker systems
US10425717B2 (en) * 2014-02-06 2019-09-24 Sr Homedics, Llc Awareness intelligence headphone
US10224890B1 (en) * 2014-03-05 2019-03-05 Sprint Communications Company L.P. Application controlled variable audio ear plugs
CN105185384B (zh) * 2015-06-11 2018-11-30 南京舒尔茨智能技术有限公司 具有环境模拟功能的音控播放系统及控制方法
CN105244048B (zh) * 2015-09-25 2017-12-05 小米科技有限责任公司 音频播放控制方法和装置
CN105810219B (zh) * 2016-03-11 2018-03-16 宇龙计算机通信科技(深圳)有限公司 多媒体文件的播放方法、播放系统和音频终端
US9749733B1 (en) * 2016-04-07 2017-08-29 Harman Intenational Industries, Incorporated Approach for detecting alert signals in changing environments
CN106205647A (zh) * 2016-06-29 2016-12-07 广东美的厨房电器制造有限公司 一种基于厨房声音环境的音乐播放系统及方法
US10884696B1 (en) * 2016-09-15 2021-01-05 Human, Incorporated Dynamic modification of audio signals
US10719592B1 (en) 2017-09-15 2020-07-21 Wells Fargo Bank, N.A. Input/output privacy tool
CN107729114B (zh) * 2017-10-31 2021-06-01 北京酷我科技有限公司 一种播放控件的呈现方法
CN107995547A (zh) * 2017-11-29 2018-05-04 联想(北京)有限公司 耳机装置和控制方法
US10719832B1 (en) 2018-01-12 2020-07-21 Wells Fargo Bank, N.A. Fraud prevention tool
US11094327B2 (en) * 2018-09-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Audible input transcription
CN109348338A (zh) * 2018-11-01 2019-02-15 歌尔股份有限公司 一种耳机及其播放方法
CN112162490A (zh) * 2020-10-26 2021-01-01 周口师范学院 一种智能家居背景音乐管理系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7297859B2 (en) * 2002-09-04 2007-11-20 Yamaha Corporation Assistive apparatus, method and computer program for playing music
WO2008137870A1 (en) * 2007-05-04 2008-11-13 Personics Holdings Inc. Method and device for acoustic management control of multiple microphones
US8340796B2 (en) * 2007-09-10 2012-12-25 Palo Alto Research Center Incorporated Digital media player and method for facilitating social music discovery and commerce

Also Published As

Publication number Publication date
US20130238341A1 (en) 2013-09-12
US8909537B2 (en) 2014-12-09
CN103310812A (zh) 2013-09-18

Similar Documents

Publication Publication Date Title
TW201337722A (zh) 音樂播放裝置及其控制方法
US20210287671A1 (en) Speech recognition method, speech wakeup apparatus, speech recognition apparatus, and terminal
US11483434B2 (en) Method and apparatus for adjusting volume of user terminal, and terminal
CN105282345B (zh) 通话音量的调节方法和装置
US9374649B2 (en) Smart hearing aid
US20130006633A1 (en) Learning speech models for mobile device users
CN107564523B (zh) 一种耳机接听方法、装置以及耳机
KR20140121447A (ko) 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템
WO2017032030A1 (zh) 一种音量调节方法及用户终端
WO2016201767A1 (zh) 一种语音控制方法、装置及计算机存储介质
WO2014183529A1 (zh) 切换移动终端通话模式的方法、装置及存储介质
WO2019228329A1 (zh) 个人听力装置、外部声音处理装置及相关计算机程序产品
US10224029B2 (en) Method for using voiceprint identification to operate voice recognition and electronic device thereof
CN104851423B (zh) 一种声音信息处理方法及装置
TW201423587A (zh) 被叫提示系統及方法
WO2018032760A1 (zh) 一种语音信息处理方法和装置
CN107680592A (zh) 一种移动终端语音识别方法、及移动终端及存储介质
US10129382B2 (en) Electronic device and method for controlling electronic device using headset
US20130079908A1 (en) Electronic device with automatic pause function and method thereof
CN107957860A (zh) 可自动调整声音输出的方法及电子装置
TW201616252A (zh) 鬧鈴控制系統及方法
WO2018227560A1 (zh) 耳机控制方法及系统
JP2018084700A (ja) 対話補助システムの制御方法、対話補助システム、及び、プログラム
JP2020160430A (ja) 音声入力装置、音声入力方法及びそのプログラム
CN111158628A (zh) 一种基于外部环境改变播放器状态的方法及装置