TWI651966B - 影音控制系統 - Google Patents

影音控制系統 Download PDF

Info

Publication number
TWI651966B
TWI651966B TW106146361A TW106146361A TWI651966B TW I651966 B TWI651966 B TW I651966B TW 106146361 A TW106146361 A TW 106146361A TW 106146361 A TW106146361 A TW 106146361A TW I651966 B TWI651966 B TW I651966B
Authority
TW
Taiwan
Prior art keywords
audio signal
audio
signal
processor
sensor
Prior art date
Application number
TW106146361A
Other languages
English (en)
Other versions
TW201931864A (zh
Inventor
羅國治
鄒東勳
劉晉呈
Original Assignee
瑞軒科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 瑞軒科技股份有限公司 filed Critical 瑞軒科技股份有限公司
Priority to TW106146361A priority Critical patent/TWI651966B/zh
Priority to CN201811531730.9A priority patent/CN109672596B/zh
Priority to US16/231,164 priority patent/US10855947B2/en
Application granted granted Critical
Publication of TWI651966B publication Critical patent/TWI651966B/zh
Publication of TW201931864A publication Critical patent/TW201931864A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/04Diagnosis, testing or measuring for television systems or their details for receivers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4112Peripherals receiving signals from specially adapted client devices having fewer capabilities than the client, e.g. thin client having less processing power or no tuning capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/43615Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2642Domotique, domestic, home control, automation, smart house
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L2012/2847Home automation networks characterised by the type of home appliance used
    • H04L2012/2849Audio/video appliances
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N2017/006Diagnosis, testing or measuring for television systems or their details for television sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Manufacturing & Machinery (AREA)
  • Selective Calling Equipment (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一種影音控制系統具有第一音頻感測器、控制器、音頻播放器、第一動作感測器與處理器。第一音頻感測器於被致能時接收第一場域中的第一音頻信號。控制器判斷是否收到第一音頻信號。第一動作感測器偵測第一場域中的第一目標物動作,以產生第一動作偵測信號,控制器依據第一動作偵測信號致能第一音頻感測器。處理器透過區域網路控制第一裝置與第二裝置,依據第一動作偵測信號控制音頻播放器播放提示音頻信號,當第一音頻信號的來源對應於第一帳號時,處理器更處理第一音頻信號以得到控制信號以選擇控制第一裝置或第二裝置。

Description

影音控制系統
本發明係關於一種影音控制系統,特別是一種具有物連網功能的影音控制系統。
影音控制系統一般設置於住家的客廳、主臥房等處,便於讓使用者控制影音系統中的裝置例如電視、音響或是其他與視聽感受相關的裝置例如燈光。然而,一般的影音控制系統仰賴使用者主動下達指令。
雖然近來有一些可接受語音控制的智慧型控制系統,然而仍然仰賴使用者先喚醒控制系統,之後才能以語音的方式來進行影音系統乃至其他家電的控制,然而,這樣的方式對使用者來說仍然造成困擾。
本發明在於提供一種影音控制系統,免除使用者需要額外對影音控制系統喚醒的困擾。
依據本發明一實施例的影音控制系統,適於控制第一裝置與第二裝置,所述系統具有第一音頻感測器、控制器、音頻播放器、第一動作感測器與處理器。第一音頻感測器用於被致能時接收第一場域中的第一音頻信號。控制器通訊連接第一音頻感測器,用於判斷是否收到第一音頻信號。音頻播放器通訊連接該控制器。第一動作感測器通訊連接控制器,第一動作感測器用於偵測第一場域中的第一目標物動作,以產生第一動作偵測信號,控制器依據第一動作偵測信號致能第一音頻感測器。處理器通訊連接控制器,並透過區域網路控制第一裝置與第二裝置,用於依據第一動作偵測信號控制音頻播放器播放提示音頻信號,處理器並判斷第一音頻信號的來源是否對應於第一帳號,當第一音頻信號的來源對應於第一帳號時,處理器更處理第一音頻信號以得到控制信號以選擇控制第一裝置或第二裝置。
綜上所述,依據本發明一實施例的影音控制系統,藉由動作感測器的設置,自動地切換於待機模式與互動模式,免除了需要使用者額外下達喚醒指令的麻煩。
以上之關於本揭露內容之說明及以下之實施方式之說明係用以示範與解釋本發明之精神與原理,並且提供本發明之專利申請範圍更進一步之解釋。
以下在實施方式中詳細敘述本發明之詳細特徵以及優點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。以下之實施例係進一步詳細說明本發明之觀點,但非以任何觀點限制本發明之範疇。
請參照圖1,其係依據本發明一實施例的影音控制系統功能方塊圖。如圖1所示,本發明一實施例所揭示的影音控制系統1000,適於控制第一裝置2000與第二裝置3000。影音控制系統1000具有第一音頻感測器1100、第一動作感測器1300、音頻播放器1400、控制器1600、處理器1700、網際網路橋接器1800與路由器1900。其中,控制器1600通訊連接至第一音頻感測器1100、第一動作感測器1300、音頻播放器1400與處理器1700。本發明以下各實施例所述通訊連接,係指有信號封包往來於兩個裝置之間,至於兩個裝置是以有線或無線的方式來傳遞信號封包,則本發明不加以限制。以下以第一裝置2000是電視,第二裝置3000是音響來舉例說明,然而第一裝置2000與第二裝置3000實際上也可以例如是冷氣、風扇、電燈、監視器等具有物連網(IoT)能力的智能家電,本發明不加以限制。
第一音頻感測器1100用以於被致能時接收第一場域中的第一音頻信號。具體來說,第一音頻感測器1100例如具有麥克風以及類比數位轉換器(圖中未示)。麥克風可接收第一場域中聲音形式的第一音頻信號並將此聲音形式的第一音頻信號轉換為類比形式的第一音頻信號。類比數位轉換器則可將類比形式的第一音頻信號轉換成數位形式的第一音頻信號。本發明以下所謂第一場域係以住家的主臥方舉例說明,然而並不以此為限。
第一動作感測器1300可偵測第一場域中的目標物動作,以對應產生第一動作偵測信號。具體來說,第一動作感測器1300例如為紅外線第一動作感測器,藉由偵測生物體(例如人體或是寵物的身體)散發出來的紅外線變化,判斷上述生物體的移動。於一實施例中,本發明中的第一動作感測器1300接收到第一場域中的紅外線時,產生一個紅外線分佈圖。當紅外線分佈圖中的紅外線區域(對應於生物體)變化時,第一動作感測器1300產生第一動作偵測信號。於另一實施例中,雖然紅外線分佈圖中的紅外線區域有變化,然而紅外線區域的面積(像素數量)小於一第一閾值,則第一動作感測器1300不產生第一動作偵測信號。當紅外線區域的面積大於上述第一閾值時,第一動作感測器1300才會產生第一動作偵測信號。換言之,第一動作感測器1300可藉由紅外線區域的面積判斷第一場域中移動的生物體是人或者是寵物。此外,可藉由紅外線區域的變化判斷上述生物體是否有動作。依據上述說明,當第一場域中有生物體移動而產生動作且判斷該生物體是人,第一動作感測器1300才會產生第一動作偵測信號。如果當該生物體對應的紅外線區域的面積不夠大而判斷第一場域中產生動作的生物體是寵物,例如貓、狗,第一動作感測器1300不產生第一動作偵測信號。
控制器1600通訊連接第一音頻感測器1100與第一動作感測器1300。第一音頻感測器1100在不工作時通常是處於停能(disable) 狀態以節約電量。當收到第一動作偵測信號時,控制器1600可致能第一音頻感測器1100,使第一音頻控制器1100切換至工作狀態。於一實施例中,控制器1600有線地電性連接到第一音頻感測器1100。控制器1600在收到第一動作偵測信號時,控制器1600致能第一音頻感測器1100。於另一實施例中,第一音頻感測器1100與控制器1600是以無線通訊的方式來進行溝通。於此實施例中,第一音頻感測器1100的電路分為收音部與通訊部,而收音部在不工作時通常是處於停能狀態,通訊部則是始終維持在致能狀態。控制器1600在收到第一動作偵測信號時,控制器1600發送無線封包給第一音頻感測器1100的通訊部電路,以致能第一音頻感測器1100的收音部電路。於一實施例中,當第一音頻感測器1100持續一段時間(例如一分鐘)未收到任何音頻信號,則第一音頻感測器1100會自動地進入停能狀態。於另一實施例中,當第一動作感測器1300持續一段時間(例如一分鐘)未產生第一動作偵測信號,則控制器1600控制第一音頻感測器1100進入停能狀態。此外,控制器1600還用於判斷是否收到第一音頻信號。
處理器1700透過網際網路橋接器1800來連接到網際網路,並透過路由器1900而在區域網路中控制第一裝置2000與第二裝置3000。於一實施例中,當第一動作感測器1300產生第一動作偵測信號時,處理器1700透過控制器1600控制音頻播放器1400播放提示音頻信號。舉例來說,早上8點鐘時,第一場域中有使用者出現,則第一動作感測器1300產生第一動作偵測信號。接著處理器1700例如透過控制器1600使音頻播放器1400播放「早安,請問有甚麼可以為您服務的」的語音內容,來提示使用者第一音頻感測器1100已經準備好可以接收聲音。
此外,處理器1700可分析第一音頻信號,以判斷或辨識來自於第一音頻感測器1100的第一音頻信號的來源是否對應於第一帳號。當第一音頻信號的來源對應於第一帳號時,處理器1700處理第一音頻信號得到對應的控制信號,並以對應選擇控制第一裝置2000或第二裝置3000。前述所謂第一音頻信號的來源,指的是發出關聯於第一音頻信號的聲音的物體。具體來說,處理器1700分析第一音頻信號的特徵是否與第一帳號的聲紋特徵相符合,當處理器1700判斷聲紋符合時,才對於第一音頻信號進行處理以得到控制信號。
於一實施例中,使用者可將影音控制系統1000設定於訓練模式。在訓練模式中,處理器1700可判斷第一音頻信號與第一帳號的聲紋特徵相符合。當第一音頻信號與第一帳號的聲紋特徵相符合時,處理器1700會記錄第一音頻信號的來源在接下來一段時間內操作第一裝置2000及/或第二裝置3000相應的指令,以建立對應於第一帳號的第一指令集。當判斷第一音頻信號與第一帳號的聲紋特徵不符合時,或是第一音頻信號的聲紋特徵不符合任何一個帳號的聲紋特徵時,處理器1700可發出提示請第一音頻信號的來源新增帳號。
於另一實施例中,處理器1700更將時間資訊記錄於儲存媒介HDD。並且處理器1700根據第一指令集處理第一音頻信號來得到控制信號時,更可將時間資訊考量在內。也就是說,本發明的處理器1700除了依據第一指令集之外,更可增加時間資訊來產生上述控制指令。藉此使此控制指令符合對應使用者的習慣或喜好。在一實施例中,上述時間資訊可為可為在一預設時間區段(例如為一周或一個月)內,每天的一時間區段中發出第一音頻信號,使第一裝置3000執行特定功能的頻率。舉例來說,同一個使用者在早上通常選擇收看新聞頻道,而在晚上通常選擇收看電影頻道。經過一段時間的使用,當使用者早上起床後說出「開電視」的時候,處理器1700經過處理所發出的控制信號會使第二裝置2000(電視)開機並切換到新聞頻道。而當使用者晚上回家說出「開電視」的時候,處理器1700經處理所發出的控制信號會使第二裝置2000開機並切換到電影頻道。
於一實施例中,第一帳號的第一指令集例如是儲存在雲端伺服器4000。處理器1700藉由網際網路橋接器1800而透過網際網路與雲端伺服器4000通訊。處理器1700可將第一音頻信號傳送至該雲端伺服器4000,使雲端伺服器4000進行第一音頻信號的解析與處理等程序並依據解析與處裡結果產生控制命令。處理器1700再藉由網際網路橋接器1800從雲端伺服器取得控制信號。具體來說,前一個實施例中將第一指令集儲存在本地端的儲存媒介HDD中,可以縮短處理第一音頻信號得到控制信號所需要的時間,然而所能處理的指令複雜度及/或指令數量受限於處理器1700本身的能力以及儲存媒介HDD的儲存容量。而本實施例中,將第一指令集儲存在雲端伺服器4000,換句話說,解析、處理第一音頻信號以得到控制信號的流程實際上是由雲端伺服器4000來執行,這樣可以用更複雜的類神經網路架構的人工智慧系統(運行於雲端伺服器)來處理複雜的指令以及更多的指令數量,然而處理第一音頻信號以得到控制信號所花費的處理時間較前一個實施例來說較長。
於一實施例中,經過一段時間(例如一週或一個月)的訓練與記錄,第一指令集例如以行為模式的方式記錄。舉例來說,由於使用者每天早上起床後都下達開電視、切換至新聞頻道的指令以及關閉冷氣的指令,而每天晚上使用者回到主臥房後都下達了開冷氣、設定溫度為攝氏24度、舒眠模式的指令以及開電視、切換至HBO頻道的指令。因此,當早上7點中,第一動作感測器1300偵測到第一場域中有目標物動作,因此送出動作偵測信號給控制器1600,控制器1600直接將動作偵測信號送給處理器1700,而後處理器1700直接控制第一裝置2000(電視)開啟並切換至新聞頻道,同時處理器1700控制冷氣(未繪示)關閉。
於某些狀況中,使用者在第一場域(主臥房中)可能一邊看著電視(第一裝置2000)一邊以語音下達指令。於此狀況下,則第一裝置2000所發出的聲音可能會造成第一音頻信號處理上的困難。為了避免第一裝置2000發出的聲音影響第一音頻感測器1100的收音品質,因此本發明另一實施例的處理器1700可從第一裝置2000取得正在撥放的播放音頻信號,並且依據播放音頻信號對第一音頻信號進行雜訊抑制處理以得到第二音頻信號,接著再處理第二音頻信號以得到控制信號。其中,處理器1700是直接透過區域網路而從第一裝置2000取得電子信號格式的播放音頻信號。
具體來說,請參照圖2,其係依據本發明一實施例的雜訊抑制處理示意圖。在第2圖中,第一音頻信號V1是第一音頻感測器1100所接收的音頻信號。此音頻信號可包含第一音頻信號的來源(例如為上述第一帳號對應的使用者)發出的聲音,以及第一裝置2000實際撥放的聲音信號。播放音頻信號V2則是處理器1700直接由第一裝置2000取得的信號,而不是由第一音頻感測器1100收音並處理過的信號。如圖2所示,第一音頻信號V1減去播放音頻信號V2後,就得到第二音頻信號V3。由於播放音頻信號V2是來自第一裝置2000,因此處理器直接將第一裝置2000所要播放的聲音從第一音頻信號V1中減去就應該是使用者在第一場域中所發出的聲音。
由於從第一裝置2000播放聲音到第一音頻感測器1100接收到第一裝置2000所發出的聲音之間會有一段時間差距,為了更精確地消除第一裝置2000撥放的聲音造成的影響,於一實施例中,處理器1700在訓練模式中可直接取得第一裝置2000欲播放的測試音頻信號,再由第一音頻感測器1100取得第一裝置2000實際撥放的測試音頻信號。接著處理器1700分析以及處理直接取得的測試音頻信號與接收的測試音頻信號後,可得到上述兩個測試音頻信號的時間差T。處理器1700在進行第一音頻信號V1的雜訊抑制處理時,可依據此時間差T,將第一音頻信號減去延遲後的播放音頻信號,而得到第二音頻信號。
此外,由於第一裝置2000播放的音頻信號通常帶有音頻資訊與響度資訊,而處理器1700實際上無法得知響度資訊與實際上第一音頻感測器1100所接收的音頻信號的信號強度的關係,且第一裝置2000實際播放的聲音經過第一音頻感測器1100接收後會有響度差異。因此,於再一實施例中,處理器1700更依據直接取得的測試音頻信號的響度資訊與校正音頻信號來建立一個響度校正模型。處理器1700在進行雜訊抑制處理時,先以響度校正模型校正由第一音頻感測器1100取得的第一音頻信號,再以第一音頻信號減去校正後的播放音頻信號,以得到第二音頻信號。前述幾個實施例可以分別單獨實施,也可以互相搭配,本發明不加以限制。
具體來說,在訓練模式中,處理器1700控制第一裝置2000輸出的測試音頻信號例如以音量設定值20的一段語音。處理器1700例如從第一音頻感測器1100取得對應的校正音頻信號例如為50分貝。處理器1700控制第一裝置2000輸出的測試音頻信號例如以音量設定值15的該段語音。處理器1700例如從第一音頻感測器1100取得對應的校正音頻信號例如為40分貝。反覆多次,處理器1700藉由多個測試音頻信號與對應的多個校正音頻信號,建立響度校正模型來描述第一裝置2000輸出的播放音頻信號(於訓練模式中為測試音頻信號)與第一音頻感測器1100收到的第一音頻信號中對應的成分的關係。
於一實施例中,當處理器1700在非訓練模式中收到第一音頻信號時,處理器1700確認第一裝置2000當前是否正在播放節目。當第一裝置2000正在播放節目,則處理器1700從第一裝置2000取得當前的播放音頻信號,並以響度校正模型處理播放音頻信號得到在第一音頻信號中的對應波形、響度之後,並根據先前得到的時間差,從第一音頻信號中消除對應於播放音頻信號的成分來得到第二音頻信號。換句話說,於此實施例中係從第一音頻信號中消除經響度校正模型處理過的播放音頻信號。
於另一實施例中,當處理器1700在非訓練模式中收到第一音頻信號時,處理器1700確認第一裝置2000當前是否正在播放節目。當第一裝置2000正在播放節目,則處理器1700以響度校正模型所描述的關係,將第一音頻信號轉換為與播放音頻信號相同格式的資訊,並根據先前得到的時間差,從被響度校正處理過的第一音頻信號中減去播放音頻信號來得到第二音頻信號。換句話說,於此實施例中係先以響度校正模型處理第一音頻信號後,從中消除播放音頻信號。
於某些狀況中,影音控制系統1000所在的場域中,可能同時有多個人在其中。因此於一實施例中,當第一音頻感測器1100同時接收到第一音頻信號與一段第三音頻信號時,處理器1700更判斷第三音頻信號是否對應於一個第二帳號。當第三音頻信號不對應於第二帳號時,處理器1700僅處理第一音頻信號以得到控制信號。換句話說,當影音控制系統1000的使用者家中有客人來訪,則由於客人並未在影音控制系統1000設定有帳號,因此客人所發出的聲音會被忽略。
於本發明一實施例中,儲存媒介HDD除了儲存有第一指令集,還儲存有第二指令集。其中第一指令集關聯於第一帳號且第二指令集關聯於第二帳號。當處理器1700判斷第三音頻信號對應於第二帳號時,處理器1700判斷第一帳號是否優先於第二帳號,以決定使用第一指令集或第二指令集產生控制信號。具體來說,一個家庭中例如有父親(第一帳號)、母親(第二帳號)、姐姐(第三帳號)與弟弟(第四帳號)。其中優先順序依序為第二帳號、第一帳號、第三帳號與第四帳號。其中,父親通常偏好電影頻道、母親通常偏好日劇頻道、姐姐通常偏好韓劇頻道而弟弟通常偏好卡通頻道。如果父親與母親同時下達開電視的指令時,處理器1700則會控制第一裝置2000(電視)開機並切換至日劇頻道。而如果姐姐與弟弟同時下達開電視的指令時,處理器1700會控制第一裝置2000開機並切換至韓劇頻道。
於另一實施例中,請回到圖1,影音控制系統1000還具有設置於第二場域(客廳)中的第二音頻感測器1200通訊連接控制器1600。第二音頻感測器1200用以於被致能時接收第二場域中的第二音頻信號。其作動方式已如前述,於此不再贅述。此外,此實施例中的影音控制系統1000還具有第二動作感測器1500,用於偵測第二場域中的第二目標物動作,以產生第二動作偵測信號。控制器1600依據第二動作偵測信號來致能第二音頻感測器1200。於此實施例中,儲存媒介HDD儲存有第一指令集與第二指令集。此第一指令集關聯於第一帳號與第一場域,第二指令集關聯於第一帳號與第二場域。此外,控制器1600可在音頻信號中加入代表特定指令集的旗標。例如,控制器1600可在第一音頻信號中加入第一旗標,以及在第二音頻信號中加入第二旗標。且第一旗標對應於第一指令集,第二旗標對應第二指令集為例,當從控制器1600收到一個待處理音頻信號時,處理器1700可判斷此待處理音頻信號中的旗標是第一旗標或第二旗標。當待處理音頻信號中的旗標是第一旗標,則處理器1700選擇以第一指令集處理待處理音頻信號以得到控制信號。當待處理音頻信號中的旗標是第二旗標,則處理器1700選擇以第二指令集處理待處理音頻信號以得到控制信號。
此外,於另一些實施例中,影音控制系統1000還可以具有溫度感測器、濕度感測器、影像感測器或其他適合的感測器(圖中未示)。控制器1600可以依據使用者的指令或是依據使用者所在場域選擇性地致能上述全部或部分的該些感測器。舉例來說,當第一帳號的使用者進入第一場域時,控制器1600致能溫度感測器與濕度感測器。第一帳號的使用者通常習慣臥房中的溫度為攝氏24度、相對濕度50%。則處理器1700得以依據溫度感測器及/或濕度感測器傳來的感測信號,選擇是否開啟冷氣機/除濕機。
綜上所述,依據本發明一實施例的影音控制系統,藉由動作感測器的設置,自動地切換於待機模式與互動模式,免除了需要使用者額外下達喚醒指令的麻煩。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。
1000‧‧‧影音控制系統
1100‧‧‧第一音頻感測器
1200‧‧‧第二音頻感測器
1300‧‧‧第一動作感測器
1400‧‧‧音頻播放器
1500‧‧‧第二動作感測器
1600‧‧‧控制器
1700‧‧‧處理器
1800‧‧‧網際網路橋接器
1900‧‧‧路由器
2000‧‧‧第一裝置
3000‧‧‧第二裝置
4000‧‧‧雲端伺服器
HDD‧‧‧儲存媒介
V1‧‧‧第一音頻信號
V2‧‧‧播放音頻信號
V3‧‧‧第二音頻信號
圖1係依據本發明一實施例的影音控制系統功能方塊圖。 圖2係依據本發明一實施例的雜訊抑制處理示意圖。

Claims (9)

  1. 一種影音控制系統,適於控制一第一裝置與一第二裝置,所述系統包括:一第一音頻感測器,用以於被致能時接收一第一場域中的一第一音頻信號;一控制器,通訊連接該第一音頻感測器,至少用於判斷是否收到該第一音頻信號;一音頻播放器,通訊連接該控制器;一第一動作感測器,通訊連接該控制器,該第一動作感測器用於偵測該第一場域中的一第一目標物動作,以產生一第一動作偵測信號,該控制器依據該第一動作偵測信號致能該第一音頻感測器;以及一處理器,通訊連接該控制器,並透過一區域網路控制該第一裝置與該第二裝置,用於依據該第一動作偵測信號控制該音頻播放器播放一提示音頻信號,該處理器並判斷該第一音頻信號的來源是否對應於一第一帳號,當該第一音頻信號的來源對應於該第一帳號時,該處理器更處理該第一音頻信號以得到一控制信號以選擇控制該第一裝置或該第二裝置。
  2. 如請求項1的系統,其中該處理器更透過一網際網路與一雲端伺服器通訊,且該處理器於處理該第一音頻信號以得到該控制信號時,係將第一音頻信號傳送至該雲端伺服器,以從該雲端伺服器取得該控制信號。
  3. 如請求項1的系統,更包括一儲存媒介儲存有一第一指令集,該第一指令集係關聯於該第一帳號,其中該處理器於處理該第一音頻信號以得到該控制信號時,係解析該第一音頻信號以依據該第一指令集產生該控制信號。
  4. 如請求項2或3的系統,其中該第一裝置係一影音裝置,該處理器更從該影音裝置取得一播放音頻信號,並且依據該播放音頻信號對於該第一音頻信號進行一雜訊抑制處理以得到一第二音頻信號,該處理器並處理該第二音頻信號以得到該控制信號。
  5. 如請求項4的系統,其中該處理器更控制該影音裝置播放一測試音頻信號,並透過控制器控制該第一音頻感測器接受一校正音頻信號,該處理器依據該測試音頻信號與該校正音頻信號取得一時間差,該處理器在依據該播放音頻信號對於該第一音頻信號進行雜訊抑制處理以得到該第二音頻信號時,更依據該時間差對該第一音頻信號進行該雜訊抑制處理以得到該第二音頻信號。
  6. 如請求項1的系統,其中當該第一音頻感測器同時接收到該第一音頻信號與一第三音頻信號時,該處理器更判斷該第三音頻信號是否對應於一第二帳號,當該第三音頻信號不對應於該第二帳號時,僅處理該第一音頻信號以得到該控制信號。
  7. 如請求項6的系統,更包括一儲存媒介儲存有一第一指令集與一第二指令集,其中該第一指令集關聯於該第一帳號且該第二指令集關聯於該第二帳號,當該第三音頻信號對應於該第二帳號時,該處理器判斷該第一帳號是否優先於該第二帳號,以決定使用該第一指令集或該第二指令集產生該控制信號。
  8. 如請求項1的系統,更包括:一第二音頻感測器,通訊連接該控制器,用以於被致能時接收一第二場域中的一第二音頻信號;一第二動作感測器,通訊連接該控制器該,該第二動作感測器用於偵測該第二場域中的一第二目標物動作,以產生一第二動作偵測信號,該控制器依據該第二動作偵測信號致能該第二音頻感測器;以及一儲存媒介,儲存有一第一指令集與一第二指令集;其中,該第一指令集係關聯於該第一場域,該第二指令集係關聯於該第二場域;其中該控制器更對該第一音頻信號加入一第一旗標,對該第二音頻信號加入一第二旗標,該處理器判斷收到的一待處理音頻信號中具有該第一旗標或該第二旗標,選擇以該第一指令集或該第二指令集處理該待處理音頻信號,以得到該控制信號。
  9. 如請求項1或8的系統,其中該處理器更依據一時間資訊來得到該控制信號。
TW106146361A 2017-12-29 2017-12-29 影音控制系統 TWI651966B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW106146361A TWI651966B (zh) 2017-12-29 2017-12-29 影音控制系統
CN201811531730.9A CN109672596B (zh) 2017-12-29 2018-12-14 影音控制系统
US16/231,164 US10855947B2 (en) 2017-12-29 2018-12-21 Audio-video control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106146361A TWI651966B (zh) 2017-12-29 2017-12-29 影音控制系統

Publications (2)

Publication Number Publication Date
TWI651966B true TWI651966B (zh) 2019-02-21
TW201931864A TW201931864A (zh) 2019-08-01

Family

ID=66143805

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106146361A TWI651966B (zh) 2017-12-29 2017-12-29 影音控制系統

Country Status (3)

Country Link
US (1) US10855947B2 (zh)
CN (1) CN109672596B (zh)
TW (1) TWI651966B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI823739B (zh) * 2023-01-05 2023-11-21 飛鳥車用電子股份有限公司 感測裝置、感測裝置的節能方法和電子裝置的節能方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN200953604Y (zh) * 2006-09-05 2007-09-26 康佳集团股份有限公司 节能电视机
CN101894502A (zh) * 2009-05-19 2010-11-24 日立民用电子株式会社 影像显示装置
US20130124207A1 (en) * 2011-11-15 2013-05-16 Microsoft Corporation Voice-controlled camera operations
US20140192259A1 (en) * 2013-01-08 2014-07-10 Leap Motion, Inc. Power consumption in motion-capture systems with audio and optical signals
TW201733363A (zh) * 2016-03-11 2017-09-16 台達電子工業股份有限公司 播音系統及其傳聲裝置與電子裝置之控制方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046557A1 (en) * 2001-09-06 2003-03-06 Miller Keith F. Multipurpose networked data communications system and distributed user control interface therefor
US6889191B2 (en) * 2001-12-03 2005-05-03 Scientific-Atlanta, Inc. Systems and methods for TV navigation with compressed voice-activated commands
JP4381291B2 (ja) * 2004-12-08 2009-12-09 アルパイン株式会社 車載用オーディオ装置
WO2007085267A2 (en) * 2006-01-25 2007-08-02 Tc Electronic A/S Auditory perception controlling device and method
CN101477799B (zh) * 2009-01-19 2011-02-09 北京农业信息技术研究中心 一种使用语音对农业设备进行控制的系统及控制方法
CN201491093U (zh) * 2009-09-15 2010-05-26 陕西科技大学 远程家电控制系统
US9689960B1 (en) * 2013-04-04 2017-06-27 Amazon Technologies, Inc. Beam rejection in multi-beam microphone systems
TW201501542A (zh) * 2013-06-28 2015-01-01 Powertech Ind Co Ltd 耳機傳輸線及其連接端子
US20150172878A1 (en) * 2013-12-12 2015-06-18 Aliphcom Acoustic environments and awareness user interfaces for media devices
KR102429260B1 (ko) * 2015-10-12 2022-08-05 삼성전자주식회사 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치
US10134399B2 (en) * 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
CN106530615A (zh) * 2016-11-29 2017-03-22 武汉易安世纪科技有限公司 卫生间意外检测报警设备及意外检测报警方法
US10282166B2 (en) * 2017-05-03 2019-05-07 The Reverie Group, Llc Enhanced control, customization, and/or security of a sound controlled device such as a voice controlled assistance device
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN200953604Y (zh) * 2006-09-05 2007-09-26 康佳集团股份有限公司 节能电视机
CN101894502A (zh) * 2009-05-19 2010-11-24 日立民用电子株式会社 影像显示装置
US20130124207A1 (en) * 2011-11-15 2013-05-16 Microsoft Corporation Voice-controlled camera operations
US20140192259A1 (en) * 2013-01-08 2014-07-10 Leap Motion, Inc. Power consumption in motion-capture systems with audio and optical signals
TW201733363A (zh) * 2016-03-11 2017-09-16 台達電子工業股份有限公司 播音系統及其傳聲裝置與電子裝置之控制方法

Also Published As

Publication number Publication date
CN109672596B (zh) 2021-09-07
CN109672596A (zh) 2019-04-23
TW201931864A (zh) 2019-08-01
US10855947B2 (en) 2020-12-01
US20190208156A1 (en) 2019-07-04

Similar Documents

Publication Publication Date Title
US10379807B2 (en) Apparatus, systems and methods for limiting output volume of a media presentation device
US11631403B2 (en) Apparatus, system and method for directing voice input in a controlling device
JP5695447B2 (ja) テレビジョン装置及び遠隔操作装置
US9431980B2 (en) Apparatus, systems and methods for adjusting output audio volume based on user location
TWI501108B (zh) 用於情色相關媒體內容之呈現管理之裝置、系統及方法
US20090016540A1 (en) Auditory perception controlling device and method
US20100122277A1 (en) device and a method for playing audio-video content
KR102533443B1 (ko) 콘텐츠 제공 방법 및 이를 사용하는 전자 장치
EP3613045B1 (en) Methods, systems, and media for providing information relating to detected events
JP2007533235A (ja) メディアコンテンツ処理装置の制御方法及びメディアコンテンツ処理装置
TWI651966B (zh) 影音控制系統
KR20150130541A (ko) 엔터테인먼트 시스템을 관리하기 위한 시스템들, 방법들 및 미디어
TWI656789B (zh) 影音控制系統
JP2021509730A (ja) 制御デバイスにおいて音声入力を指示する装置、システム及び方法
KR101500061B1 (ko) 복수의 미디어 채널에 적용가능한 신 스위칭 시스템 및 방법, 그리고 그 기록매체
WO2020056710A1 (en) Method and device for configuring hdmi audio setting
CN115379273B (zh) 基于智能床垫的视频播放控制方法及相关产品
JP2020061046A (ja) 音声操作装置、音声操作方法、コンピュータプログラムおよび音声操作システム
CN111801729B (zh) 用于引导控制设备中的语音输入的装置、系统和方法
US20240176408A1 (en) Standby modes to minimise consumption and startup time
JP2019091972A (ja) オーディオ装置およびテレビ