CN109672596B - 影音控制系统 - Google Patents

影音控制系统 Download PDF

Info

Publication number
CN109672596B
CN109672596B CN201811531730.9A CN201811531730A CN109672596B CN 109672596 B CN109672596 B CN 109672596B CN 201811531730 A CN201811531730 A CN 201811531730A CN 109672596 B CN109672596 B CN 109672596B
Authority
CN
China
Prior art keywords
audio signal
audio
signal
sensor
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811531730.9A
Other languages
English (en)
Other versions
CN109672596A (zh
Inventor
罗国治
邹东勋
刘晋呈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Raken Technology Co Ltd
Original Assignee
Suzhou Raken Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Raken Technology Co Ltd filed Critical Suzhou Raken Technology Co Ltd
Publication of CN109672596A publication Critical patent/CN109672596A/zh
Application granted granted Critical
Publication of CN109672596B publication Critical patent/CN109672596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/04Diagnosis, testing or measuring for television systems or their details for receivers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4112Peripherals receiving signals from specially adapted client devices having fewer capabilities than the client, e.g. thin client having less processing power or no tuning capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/43615Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2642Domotique, domestic, home control, automation, smart house
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L2012/2847Home automation networks characterised by the type of home appliance used
    • H04L2012/2849Audio/video appliances
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N2017/006Diagnosis, testing or measuring for television systems or their details for television sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Selective Calling Equipment (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种影音控制系统,适于控制第一装置与第二装置,系统具有第一音频传感器、控制器、音频播放器、第一动作传感器与处理器。第一音频传感器用于被致能时接收第一场域中的第一音频信号。控制器用于判断是否收到第一音频信号。第一动作传感器用于侦测第一场域中的第一目标物动作,以产生第一动作侦测信号,控制器依据第一动作侦测信号致能第一音频传感器。处理器通过局域网络控制第一装置与第二装置,用于依据第一动作侦测信号控制音频播放器播放提示音频信号,当第一音频信号的来源对应于第一账号时,处理器还处理第一音频信号以得到控制信号以选择控制第一装置或第二装置。本发明可自动切换于待机模式与互动模式,免除了需要用户额外下达唤醒指令的麻烦。

Description

影音控制系统
技术领域
本发明涉及一种影音控制系统,具体涉及一种具有物联网功能的影音控制系统。
背景技术
影音控制系统一般设置于住家的客厅、主卧房等处,便于让用户控制影音系统中的装置例如电视、音响或是其他与视听感受相关的装置例如灯光等。然而,大多影音控制系统仰赖用户主动下达指令。
虽然近来有一些可接受语音控制的智能型控制系统,然而仍然仰赖用户先唤醒控制系统本身,之后才能以语音的方式来进行影音系统乃至其他家电的控制,显然这样的操作方式对用户来说仍然会造成困扰。
因此,如何解决上述现有技术存在的不足,便成为本发明所要研究解决的课题。
发明内容
本发明的目的是提供一种影音控制系统,免除用户需要额外对影音控制系统唤醒的困扰。
为达到上述目的,本发明采用的技术方案是:
一种影音控制系统;适用于控制一第一装置与一第二装置,所述系统包括:
一第一音频传感器,用以于被致能时接收一第一场域中的一第一音频信号;
一控制器,通讯连接所述第一音频传感器,至少用于判断是否收到所述第一音频信号;
一音频播放器,通讯连接所述控制器;
一第一动作传感器,通讯连接所述控制器,该第一动作传感器用于侦测所述第一场域中的一第一目标物动作,以产生一第一动作侦测信号,所述控制器依据该第一动作侦测信号致能所述第一音频传感器;以及
一处理器,通讯连接所述控制器,并通过一局域网络控制所述第一装置与所述第二装置,用于依据所述第一动作侦测信号控制所述音频播放器播放一提示音频信号,该处理器并判断所述第一音频信号的来源是否对应于一第一账号,当第一音频信号的来源对应于第一账号时,所述处理器还处理第一音频信号以得到一控制信号以选择控制所述第一装置或所述第二装置。
上述技术方案中的有关内容解释如下:
1.上述方案中,所述处理器还通过一因特网与一云端服务器通讯,且该处理器于处理所述第一音频信号以得到所述控制信号时,是将第一音频信号传送至云端服务器,以从云端服务器取得所述控制信号。
2.上述方案中,还包括一储存媒介,该储存媒介中储存有一第一指令集,该第一指令集关联于所述第一账号,其中所述处理器于处理所述第一音频信号以得到所述控制信号时,是通过解析所述第一音频信号并依据所述第一指令集产生所述控制信号。
3.上述方案中,所述第一装置为一影音装置,所述处理器还从该影音装置取得一播放音频信号,并且依据该播放音频信号对于该第一音频信号进行一噪声抑制处理以得到一第二音频信号,该处理器通过处理该第二音频信号以得到所述控制信号。
4.上述方案中,所述处理器还控制所述影音装置播放一测试音频信号,并通过控制器控制所述第一音频传感器接收一校正音频信号,该处理器依据测试音频信号与校正音频信号取得一时间差,处理器在依据播放音频信号对于所述第一音频信号进行噪声抑制处理以得到所述第二音频信号时,还依据所述时间差对第一音频信号进行噪声抑制处理以得到所述第二音频信号。
5.上述方案中,当所述第一音频传感器同时接收到所述第一音频信号与一第三音频信号时,所述处理器还判断该第三音频信号是否对应于一第二账号,当第三音频信号不对应于该第二账号时,仅处理所述第一音频信号以得到所述控制信号。
6.上述方案中,还包括一储存媒介,该储存媒介中储存有一第一指令集与一第二指令集,其中所述第一指令集关联于所述第一账号且所述第二指令集关联于所述第二账号,当第三音频信号对应于第二账号时,所述处理器判断第一账号是否优先于第二账号,以决定使用所述第一指令集或所述第二指令集产生所述控制信号。
7.上述方案中,还包括:
一第二音频传感器,通讯连接所述控制器,用以于被致能时接收一第二场域中的一第二音频信号;
一第二动作传感器,通讯连接所述控制器,该第二动作传感器用于侦测第二场域中的一第二目标物动作,以产生一第二动作侦测信号,所述控制器依据第二动作侦测信号致能所述第二音频传感器;以及
一储存媒介,储存有一第一指令集与一第二指令集;
其中,所述第一指令集关联于所述第一场域,所述第二指令集关联于所述第二场域;
其中所述控制器还对所述第一音频信号加入一第一旗标,对所述第二音频信号加入一第二旗标,所述处理器判断收到的一待处理音频信号中具有第一旗标或第二旗标,选择以第一指令集或第二指令集处理待处理音频信号,以得到所述控制信号。
8.上述方案中,所述处理器还依据一时间信息来得到所述控制信号。
本发明的工作原理及优点如下:
依据本发明一实施例的影音控制系统,适于控制第一装置与第二装置,所述系统具有第一音频传感器、控制器、音频播放器、第一动作传感器与处理器。第一音频传感器用于被致能时接收第一场域中的第一音频信号。控制器通讯连接第一音频传感器,用于判断是否收到第一音频信号。音频播放器通讯连接该控制器。第一动作传感器通讯连接控制器,第一动作传感器用于侦测第一场域中的第一目标物动作,以产生第一动作侦测信号,控制器依据第一动作侦测信号致能第一音频传感器。处理器通讯连接控制器,并通过局域网络控制第一装置与第二装置,用于依据第一动作侦测信号控制音频播放器播放提示音频信号,处理器并判断第一音频信号的来源是否对应于第一账号,当第一音频信号的来源对应于第一账号时,处理器还处理第一音频信号以得到控制信号以选择控制第一装置或第二装置。
综上所述,本发明通过动作传感器的设置,可自动地切换于待机模式与互动模式,免除了需要用户额外下达唤醒指令的麻烦。
附图说明
附图1为依据本发明一实施例的影音控制系统功能框图;
附图2为依据本发明一实施例的噪声抑制处理示意图。
以上附图中:1000.影音控制系统;1100.第一音频传感器;1200.第二音频传感器;1300.第一动作传感器;1400.音频播放器;1500.第二动作传感器;1600.控制器;1700.处理器;1800.因特网网桥;1900.路由器;2000.第一装置;3000.第二装置;4000.云端服务器;HDD.储存媒介;V1.第一音频信号;V2.播放音频信号;V3.第二音频信号。
具体实施方式
下面结合附图及实施例对本发明作进一步描述:
实施例:以下在实施方式中详细叙述本发明的详细特征以及优点,其内容足以使任何本领域技术人员了解本发明的技术内容并据以实施,且根据本说明书所公开的内容、申请专利范围及图示,任何本领域技术人员可轻易地理解本发明相关的目的及优点。以下的实施例为进一步详细说明本发明的观点,但非以任何观点限制本发明的范畴。
请参照图1,为依据本发明一实施例的影音控制系统功能框图。
如图1所示,本发明一实施例所揭示的影音控制系统1000,适用于控制第一装置2000与第二装置3000。影音控制系统1000具有第一音频传感器1100、第一动作传感器1300、音频播放器1400、控制器1600、处理器1700、因特网网桥1800与路由器1900。
其中,控制器1600通讯连接至第一音频传感器1100、第一动作传感器1300、音频播放器1400与处理器1700。本发明以下各实施例所述通讯连接,是指有信号封包往来于两个装置之间,至于两个装置是以有线或无线的方式来传递信号封包,则本发明不加以限制。以下以第一装置2000是电视,第二装置3000是音响来举例说明,然而第一装置2000与第二装置3000实际上也可以例如是冷气、风扇、电灯、监视器等具有物联网(IoT)能力的智能家电,本发明不加以限制。
第一音频传感器1100用以于被致能(enabled)时接收第一场域中的第一音频信号。具体来说,第一音频传感器1100例如具有麦克风以及模拟数字转换器(图中未示)。麦克风可接收第一场域中声音形式的第一音频信号并将此声音形式的第一音频信号转换为模拟形式的第一音频信号。模拟数字转换器则可将模拟形式的第一音频信号转换成数字形式的第一音频信号。本发明以下所谓第一场域是以住家的主卧方举例说明,然而并不以此为限。
第一动作传感器1300可侦测第一场域中的目标物动作,以对应产生第一动作侦测信号。具体来说,第一动作传感器1300例如为红外线第一动作传感器,通过侦测生物体(例如人体或是宠物的身体)散发出来的红外线变化,判断上述生物体的移动。于一实施例中,本发明中的第一动作传感器1300接收到第一场域中的红外线时,产生一个红外线分布图。当红外线分布图中的红外线区域(对应于生物体)变化时,第一动作传感器1300产生第一动作侦测信号。于另一实施例中,虽然红外线分布图中的红外线区域有变化,然而红外线区域的面积(像素数量)小于一第一阈值,则第一动作传感器1300不产生第一动作侦测信号。当红外线区域的面积大于上述第一阈值时,第一动作传感器1300才会产生第一动作侦测信号。换言之,第一动作传感器1300可通过红外线区域的面积判断第一场域中移动的生物体是人或者是宠物。此外,可通过红外线区域的变化判断上述生物体是否有动作。依据上述说明,当第一场域中有生物体移动而产生动作且判断该生物体是人,第一动作传感器1300才会产生第一动作侦测信号。如果当该生物体对应的红外线区域的面积不够大而判断第一场域中产生动作的生物体是宠物,例如猫、狗,第一动作传感器1300不产生第一动作侦测信号。
控制器1600通讯连接第一音频传感器1100与第一动作传感器1300。第一音频传感器1100在不工作时通常是处于停能(disable)状态以节约电量。当收到第一动作侦测信号时,控制器1600可致能第一音频传感器1100,使第一音频控制器1100切换至工作状态。于一实施例中,控制器1600有线地电性连接到第一音频传感器1100。控制器1600在收到第一动作侦测信号时,控制器1600致能第一音频传感器1100。于另一实施例中,第一音频传感器1100与控制器1600是以无线通信的方式来进行沟通。于此实施例中,第一音频传感器1100的电路分为收音部与通讯部,而收音部在不工作时通常是处于停能状态,通讯部则是始终维持在致能状态。控制器1600在收到第一动作侦测信号时,控制器1600发送无线封包给第一音频传感器1100的通讯部电路,以致能第一音频传感器1100的收音部电路。于一实施例中,当第一音频传感器1100持续一段时间(例如一分钟)未收到任何音频信号,则第一音频传感器1100会自动地进入停能状态。于另一实施例中,当第一动作传感器1300持续一段时间(例如一分钟)未产生第一动作侦测信号,则控制器1600控制第一音频传感器1100进入停能状态。此外,控制器1600还用于判断是否收到第一音频信号。
处理器1700通过因特网网桥1800来连接到因特网,并通过路由器1900而在局域网络中控制第一装置2000与第二装置3000。于一实施例中,当第一动作传感器1300产生第一动作侦测信号时,处理器1700通过控制器1600控制音频播放器1400播放提示音频信号。举例来说,早上8点钟时,第一场域中有用户出现,则第一动作传感器1300产生第一动作侦测信号。接着处理器1700例如通过控制器1600使音频播放器1400播放“早上好,请问有什么可以为您服务的”的语音内容,来提示用户第一音频传感器1100已经准备好可以接收声音。
此外,处理器1700可分析第一音频信号,以判断或辨识来自于第一音频传感器1100的第一音频信号的来源是否对应于第一账号。当第一音频信号的来源对应于第一账号时,处理器1700处理第一音频信号得到对应的控制信号,并以对应选择控制第一装置2000或第二装置3000。前述所谓第一音频信号的来源,指的是发出关联于第一音频信号的声音的物体。具体来说,处理器1700分析第一音频信号的特征是否与第一账号的声纹特征相符合,当处理器1700判断声纹符合时,才对于第一音频信号进行处理以得到控制信号。
于一实施例中,用户可将影音控制系统1000设定于训练模式。在训练模式中,处理器1700可判断第一音频信号与第一账号的声纹特征相符合。当第一音频信号与第一账号的声纹特征相符合时,处理器1700会记录第一音频信号的来源在接下来一段时间内操作第一装置2000及/或第二装置3000相应的指令,以建立对应于第一账号的第一指令集。当判断第一音频信号与第一账号的声纹特征不符合时,或是第一音频信号的声纹特征不符合任何一个账号的声纹特征时,处理器1700可发出提示请第一音频信号的来源新增账号。
于另一实施例中,处理器1700还将时间信息记录于储存媒介HDD。并且处理器1700根据第一指令集处理第一音频信号来得到控制信号时,还可将时间信息考虑在内。也就是说,本发明的处理器1700除了依据第一指令集之外,还可增加时间信息来产生上述控制指令。借此使此控制指令符合对应用户的习惯或喜好。在一实施例中,上述时间信息可为可为在一预设时间区段(例如为一周或一个月)内,每天的一时间区段中发出第一音频信号,使第一装置3000执行特定功能的频率。举例来说,同一个用户在早上通常选择收看新闻频道,而在晚上通常选择收看电影频道。经过一段时间的使用,当用户早上起床后说出“开电视”的时候,处理器1700经过处理所发出的控制信号会使第二装置2000(电视)开机并切换到新闻频道。而当用户晚上回家说出“开电视”的时候,处理器1700经处理所发出的控制信号会使第二装置2000开机并切换到电影频道。
于一实施例中,第一账号的第一指令集例如是储存在云端服务器4000。处理器1700通过因特网网桥1800而通过因特网与云端服务器4000通讯。处理器1700可将第一音频信号传送至该云端服务器4000,使云端服务器4000进行第一音频信号的解析与处理等程序并依据解析与处里结果产生控制命令。处理器1700再通过因特网网桥1800从云端服务器取得控制信号。具体来说,前一个实施例中将第一指令集储存在本地端的储存媒介HDD中,可以缩短处理第一音频信号得到控制信号所需要的时间,然而所能处理的指令复杂度及/或指令数量受限于处理器1700本身的能力以及储存媒介HDD的储存容量。而本实施例中,将第一指令集储存在云端服务器4000,换句话说,解析、处理第一音频信号以得到控制信号的流程实际上是由云端服务器4000来执行,这样可以用更复杂的类神经网络架构的人工智能系统(运行于云端服务器)来处理复杂的指令以及更多的指令数量,然而处理第一音频信号以得到控制信号所花费的处理时间较前一个实施例来说较长。
于一实施例中,经过一段时间(例如一周或一个月)的训练与记录,第一指令集例如以行为模式的方式记录。举例来说,由于用户每天早上起床后都下达开电视、切换至新闻频道的指令以及关闭冷气的指令,而每天晚上用户回到主卧房后都下达了开冷气、设定温度为摄氏24度、舒眠模式的指令以及开电视、切换至HBO频道的指令。因此,当早上7点中,第一动作传感器1300侦测到第一场域中有目标物动作,因此送出动作侦测信号给控制器1600,控制器1600直接将动作侦测信号送给处理器1700,而后处理器1700直接控制第一装置2000(电视)开启并切换至新闻频道,同时处理器1700控制冷气(未绘示)关闭。
于某些状况中,用户在第一场域(主卧房中)可能一边看着电视(第一装置2000)一边以语音下达指令。于此状况下,则第一装置2000所发出的声音可能会造成第一音频信号处理上的困难。为了避免第一装置2000发出的声音影响第一音频传感器1100的收音质量,因此本发明另一实施例的处理器1700可从第一装置2000取得正在拨放的播放音频信号,并且依据播放音频信号对第一音频信号进行噪声抑制处理以得到第二音频信号,接着再处理第二音频信号以得到控制信号。其中,处理器1700是直接通过局域网络而从第一装置2000取得电子信号格式的播放音频信号。
具体来说,请参照图2,为依据本发明一实施例的噪声抑制处理示意图。在图2中,第一音频信号V1是第一音频传感器1100所接收的音频信号。此音频信号可包含第一音频信号的来源(例如为上述第一账号对应的用户)发出的声音,以及第一装置2000实际拨放的声音信号。播放音频信号V2则是处理器1700直接由第一装置2000取得的信号,而不是由第一音频传感器1100收音并处理过的信号。如图2所示,第一音频信号V1减去播放音频信号V2后,就得到第二音频信号V3。由于播放音频信号V2是来自第一装置2000,因此处理器直接将第一装置2000所要播放的声音从第一音频信号V1中减去就应该是用户在第一场域中所发出的声音。
由于从第一装置2000播放声音到第一音频传感器1100接收到第一装置2000所发出的声音之间会有一段时间差距,为了更精确地消除第一装置2000拨放的声音造成的影响,于一实施例中,处理器1700在训练模式中可直接取得第一装置2000欲播放的测试音频信号,再由第一音频传感器1100取得第一装置2000实际拨放的测试音频信号。接着处理器1700分析以及处理直接取得的测试音频信号与接收的测试音频信号后,可得到上述两个测试音频信号的时间差T。处理器1700在进行第一音频信号V1的噪声抑制处理时,可依据此时间差T,将第一音频信号减去延迟后的播放音频信号,而得到第二音频信号。
此外,由于第一装置2000播放的音频信号通常带有音频信息与响度信息,而处理器1700实际上无法得知响度信息与实际上第一音频传感器1100所接收的音频信号的信号强度的关系,且第一装置2000实际播放的声音经过第一音频传感器1100接收后会有响度差异。因此,于再一实施例中,处理器1700还依据直接取得的测试音频信号的响度信息与校正音频信号来建立一个响度校正模型。处理器1700在进行噪声抑制处理时,先以响度校正模型校正由第一音频传感器1100取得的第一音频信号,再以第一音频信号减去校正后的播放音频信号,以得到第二音频信号。前述几个实施例可以分别单独实施,也可以互相搭配,本发明不加以限制。
具体来说,在训练模式中,处理器1700控制第一装置2000输出的测试音频信号例如以音量设定值20的一段语音。处理器1700例如从第一音频传感器1100取得对应的校正音频信号例如为50分贝。处理器1700控制第一装置2000输出的测试音频信号例如以音量设定值15的该段语音。处理器1700例如从第一音频传感器1100取得对应的校正音频信号例如为40分贝。反复多次,处理器1700通过多个测试音频信号与对应的多个校正音频信号,建立响度校正模型来描述第一装置2000输出的播放音频信号(于训练模式中为测试音频信号)与第一音频传感器1100收到的第一音频信号中对应的成分的关系。
于一实施例中,当处理器1700在非训练模式中收到第一音频信号时,处理器1700确认第一装置2000当前是否正在播放节目。当第一装置2000正在播放节目,则处理器1700从第一装置2000取得当前的播放音频信号,并以响度校正模型处理播放音频信号得到在第一音频信号中的对应波形、响度之后,并根据先前得到的时间差,从第一音频信号中消除对应于播放音频信号的成分来得到第二音频信号。换句话说,于此实施例中是从第一音频信号中消除经响度校正模型处理过的播放音频信号。
于另一实施例中,当处理器1700在非训练模式中收到第一音频信号时,处理器1700确认第一装置2000当前是否正在播放节目。当第一装置2000正在播放节目,则处理器1700以响度校正模型所描述的关系,将第一音频信号转换为与播放音频信号相同格式的信息,并根据先前得到的时间差,从被响度校正处理过的第一音频信号中减去播放音频信号来得到第二音频信号。换句话说,于此实施例中是先以响度校正模型处理第一音频信号后,从中消除播放音频信号。
于某些状况中,影音控制系统1000所在的场域中,可能同时有多个人在其中。因此于一实施例中,当第一音频传感器1100同时接收到第一音频信号与一段第三音频信号时,处理器1700还判断第三音频信号是否对应于一个第二账号。当第三音频信号不对应于第二账号时,处理器1700仅处理第一音频信号以得到控制信号。换句话说,当影音控制系统1000的用户家中有客人来访,则由于客人并未在影音控制系统1000设定有账号,因此客人所发出的声音会被忽略。
于本发明一实施例中,储存媒介HDD除了储存有第一指令集,还储存有第二指令集。其中第一指令集关联于第一账号且第二指令集关联于第二账号。当处理器1700判断第三音频信号对应于第二账号时,处理器1700判断第一账号是否优先于第二账号,以决定使用第一指令集或第二指令集产生控制信号。具体来说,一个家庭中例如有父亲(第一账号)、母亲(第二账号)、姐姐(第三账号)与弟弟(第四账号)。其中优先级依序为第二账号、第一账号、第三账号与第四账号。其中,父亲通常偏好电影频道、母亲通常偏好日剧频道、姐姐通常偏好韩剧频道而弟弟通常偏好卡通频道。如果父亲与母亲同时下达开电视的指令时,处理器1700则会控制第一装置2000(电视)开机并切换至日剧频道。而如果姐姐与弟弟同时下达开电视的指令时,处理器1700会控制第一装置2000开机并切换至韩剧频道。
于另一实施例中,请回到图1,影音控制系统1000还具有设置于第二场域(客厅)中的第二音频传感器1200通讯连接控制器1600。第二音频传感器1200用以于被致能时接收第二场域中的第二音频信号。其作动方式已如前述,于此不再赘述。此外,此实施例中的影音控制系统1000还具有第二动作传感器1500,用于侦测第二场域中的第二目标物动作,以产生第二动作侦测信号。控制器1600依据第二动作侦测信号来致能第二音频传感器1200。于此实施例中,储存媒介HDD储存有第一指令集与第二指令集。此第一指令集关联于第一账号与第一场域,第二指令集关联于第一账号与第二场域。此外,控制器1600可在音频信号中加入代表特定指令集的旗标。例如,控制器1600可在第一音频信号中加入第一旗标,以及在第二音频信号中加入第二旗标。且第一旗标对应于第一指令集,第二旗标对应第二指令集为例,当从控制器1600收到一个待处理音频信号时,处理器1700可判断此待处理音频信号中的旗标是第一旗标或第二旗标。当待处理音频信号中的旗标是第一旗标,则处理器1700选择以第一指令集处理待处理音频信号以得到控制信号。当待处理音频信号中的旗标是第二旗标,则处理器1700选择以第二指令集处理待处理音频信号以得到控制信号。
此外,于另一些实施例中,影音控制系统1000还可以具有温度传感器、湿度传感器、影像传感器或其他适合的传感器(图中未示)。控制器1600可以依据用户的指令或是依据用户所在场域选择性地致能上述全部或部分的该些传感器。举例来说,当第一账号的用户进入第一场域时,控制器1600致能温度传感器与湿度传感器。第一账号的用户通常习惯卧房中的温度为摄氏24度、相对湿度50%。则处理器1700得以依据温度传感器及/或湿度传感器传来的感测信号,选择是否开启冷气机/除湿机。
综上所述,依据本发明一实施例的影音控制系统,通过动作传感器的设置,自动地切换于待机模式与互动模式,免除了需要用户额外下达唤醒指令的麻烦。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种影音控制系统;其特征在于:适用于控制一第一装置与一第二装置,所述系统包括:
一第一音频传感器,用以于被致能时接收一第一场域中的一第一音频信号;
一控制器,通讯连接所述第一音频传感器,至少用于判断是否收到所述第一音频信号;
一音频播放器,通讯连接所述控制器;
一第一动作传感器,通讯连接所述控制器,该第一动作传感器用于侦测所述第一场域中的一第一目标物动作,以产生一第一动作侦测信号,所述控制器依据该第一动作侦测信号致能所述第一音频传感器;
第一动作传感器为红外线第一动作传感器,通过侦测生物体散发出来的红外线变化,判断上述生物体的移动;第一动作传感器接收到第一场域中的红外线时,产生一个红外线分布图,当红外线分布图中的红外线区域有变化,而红外线区域的面积小于一第一阈值,则第一动作传感器不产生第一动作侦测信号;当红外线区域的面积大于上述第一阈值时,第一动作传感器产生第一动作侦测信号;以及
一处理器,通讯连接所述控制器,并通过一局域网络控制所述第一装置与所述第二装置,用于依据所述第一动作侦测信号控制所述音频播放器播放一提示音频信号,该处理器并判断所述第一音频信号的来源是否对应于一第一账号,当第一音频信号的来源对应于第一账号时,所述处理器还处理第一音频信号以得到一控制信号以选择控制所述第一装置或所述第二装置。
2.根据权利要求1所述的控制系统,其特征在于:所述处理器还通过一因特网与一云端服务器通讯,且该处理器于处理所述第一音频信号以得到所述控制信号时,是将第一音频信号传送至云端服务器,以从云端服务器取得所述控制信号。
3.根据权利要求1所述的控制系统,其特征在于:还包括一储存媒介,该储存媒介中储存有一第一指令集,该第一指令集关联于所述第一账号,其中所述处理器于处理所述第一音频信号以得到所述控制信号时,是通过解析所述第一音频信号并依据所述第一指令集产生所述控制信号。
4.根据权利要求1所述的控制系统,其特征在于:所述第一装置为一影音装置,所述处理器还从该影音装置取得一播放音频信号,并且依据该播放音频信号对于该第一音频信号进行一噪声抑制处理以得到一第二音频信号,该处理器通过处理该第二音频信号以得到所述控制信号。
5.根据权利要求4所述的控制系统,其特征在于:所述处理器还控制所述影音装置播放一测试音频信号,并通过控制器控制所述第一音频传感器接收一校正音频信号,该处理器依据测试音频信号与校正音频信号取得一时间差,处理器在依据播放音频信号对于所述第一音频信号进行噪声抑制处理以得到所述第二音频信号时,还依据所述时间差对第一音频信号进行噪声抑制处理以得到所述第二音频信号。
6.根据权利要求1所述的控制系统,其特征在于:当所述第一音频传感器同时接收到所述第一音频信号与一第三音频信号时,所述处理器还判断该第三音频信号是否对应于一第二账号,当第三音频信号不对应于该第二账号时,仅处理所述第一音频信号以得到所述控制信号。
7.根据权利要求6所述的控制系统,其特征在于:还包括一储存媒介,该储存媒介中储存有一第一指令集与一第二指令集,其中所述第一指令集关联于所述第一账号且所述第二指令集关联于所述第二账号,当第三音频信号对应于第二账号时,所述处理器判断第一账号是否优先于第二账号,以决定使用所述第一指令集或所述第二指令集产生所述控制信号。
8.根据权利要求1所述的控制系统,其特征在于:还包括:
一第二音频传感器,通讯连接所述控制器,用以于被致能时接收一第二场域中的一第二音频信号;
一第二动作传感器,通讯连接所述控制器,该第二动作传感器用于侦测第二场域中的一第二目标物动作,以产生一第二动作侦测信号,所述控制器依据第二动作侦测信号致能所述第二音频传感器;以及
一储存媒介,储存有一第一指令集与一第二指令集;
其中,所述第一指令集关联于所述第一场域,所述第二指令集关联于所述第二场域;
其中所述控制器还对所述第一音频信号加入一第一旗标,对所述第二音频信号加入一第二旗标,所述处理器判断收到的一待处理音频信号中具有第一旗标或第二旗标,选择以第一指令集或第二指令集处理待处理音频信号,以得到所述控制信号。
9.根据权利要求1所述的控制系统,其特征在于:所述处理器还依据一时间信息来得到所述控制信号。
CN201811531730.9A 2017-12-29 2018-12-14 影音控制系统 Active CN109672596B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW106146361 2017-12-29
TW106146361A TWI651966B (zh) 2017-12-29 2017-12-29 影音控制系統

Publications (2)

Publication Number Publication Date
CN109672596A CN109672596A (zh) 2019-04-23
CN109672596B true CN109672596B (zh) 2021-09-07

Family

ID=66143805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811531730.9A Active CN109672596B (zh) 2017-12-29 2018-12-14 影音控制系统

Country Status (3)

Country Link
US (1) US10855947B2 (zh)
CN (1) CN109672596B (zh)
TW (1) TWI651966B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI823739B (zh) * 2023-01-05 2023-11-21 飛鳥車用電子股份有限公司 感測裝置、感測裝置的節能方法和電子裝置的節能方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106530615A (zh) * 2016-11-29 2017-03-22 武汉易安世纪科技有限公司 卫生间意外检测报警设备及意外检测报警方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030046557A1 (en) * 2001-09-06 2003-03-06 Miller Keith F. Multipurpose networked data communications system and distributed user control interface therefor
US6889191B2 (en) * 2001-12-03 2005-05-03 Scientific-Atlanta, Inc. Systems and methods for TV navigation with compressed voice-activated commands
JP4381291B2 (ja) * 2004-12-08 2009-12-09 アルパイン株式会社 車載用オーディオ装置
EP1977508A2 (en) * 2006-01-25 2008-10-08 TC Electronic A/S Auditory perception controlling device and method
CN200953604Y (zh) * 2006-09-05 2007-09-26 康佳集团股份有限公司 节能电视机
CN101477799B (zh) * 2009-01-19 2011-02-09 北京农业信息技术研究中心 一种使用语音对农业设备进行控制的系统及控制方法
JP5299866B2 (ja) * 2009-05-19 2013-09-25 日立コンシューマエレクトロニクス株式会社 映像表示装置
CN201491093U (zh) * 2009-09-15 2010-05-26 陕西科技大学 远程家电控制系统
US9031847B2 (en) * 2011-11-15 2015-05-12 Microsoft Technology Licensing, Llc Voice-controlled camera operations
US9626015B2 (en) * 2013-01-08 2017-04-18 Leap Motion, Inc. Power consumption in motion-capture systems with audio and optical signals
US9689960B1 (en) * 2013-04-04 2017-06-27 Amazon Technologies, Inc. Beam rejection in multi-beam microphone systems
TW201501542A (zh) * 2013-06-28 2015-01-01 Powertech Ind Co Ltd 耳機傳輸線及其連接端子
US20150172878A1 (en) * 2013-12-12 2015-06-18 Aliphcom Acoustic environments and awareness user interfaces for media devices
KR102429260B1 (ko) * 2015-10-12 2022-08-05 삼성전자주식회사 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치
TWI639343B (zh) * 2016-03-11 2018-10-21 台達電子工業股份有限公司 播音系統及其傳聲裝置與電子裝置之控制方法
US10134399B2 (en) * 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10282166B2 (en) * 2017-05-03 2019-05-07 The Reverie Group, Llc Enhanced control, customization, and/or security of a sound controlled device such as a voice controlled assistance device
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106530615A (zh) * 2016-11-29 2017-03-22 武汉易安世纪科技有限公司 卫生间意外检测报警设备及意外检测报警方法

Also Published As

Publication number Publication date
CN109672596A (zh) 2019-04-23
US20190208156A1 (en) 2019-07-04
US10855947B2 (en) 2020-12-01
TW201931864A (zh) 2019-08-01
TWI651966B (zh) 2019-02-21

Similar Documents

Publication Publication Date Title
US9596429B2 (en) Apparatus, systems and methods for providing content when loud background noise is present
EP3798685B1 (en) Systems and methods of ultrasonic sensing in smart devices
US11217241B2 (en) Method for providing content and electronic device supporting the same
US20090016540A1 (en) Auditory perception controlling device and method
JP2011118822A (ja) 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム
US20120254909A1 (en) System and method for adjusting presentation characteristics of audio/video content in response to detection of user sleeping patterns
EP3613045B1 (en) Methods, systems, and media for providing information relating to detected events
US10248377B2 (en) Photoinduction loudspeaker, photoinduction loudspeaker control method and apparatus
US20210072378A1 (en) Systems and methods of ultrasonic sensing in smart devices
KR20190096852A (ko) 볼륨 조절 장치 및 이의 조절 방법
CN106681686B (zh) 播报控制方法、播报控制装置和空调器
CN109672596B (zh) 影音控制系统
CN111801729A (zh) 用于引导控制设备中的语音输入的装置、系统和方法
WO2015182177A1 (ja) 電子機器および伝言システム
CN109521685B (zh) 一种影音控制系统
CN115379273B (zh) 基于智能床垫的视频播放控制方法及相关产品
CN111918108A (zh) 一种联动控制方法、系统、计算机设备及可读存储介质
US12040913B2 (en) Selecting a destination for a sensor signal in dependence on an active light setting
WO2020158435A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US20060139500A1 (en) Television control system and method
US20210399915A1 (en) Selecting a destination for a sensor signal in dependence on an active light setting
CN116801035A (zh) 电视音量的调整方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant