CN105957519B - 多区域同时进行语音控制的方法和系统、服务器及麦克风 - Google Patents

多区域同时进行语音控制的方法和系统、服务器及麦克风 Download PDF

Info

Publication number
CN105957519B
CN105957519B CN201610514152.2A CN201610514152A CN105957519B CN 105957519 B CN105957519 B CN 105957519B CN 201610514152 A CN201610514152 A CN 201610514152A CN 105957519 B CN105957519 B CN 105957519B
Authority
CN
China
Prior art keywords
sound information
server
decibel
sound
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610514152.2A
Other languages
English (en)
Other versions
CN105957519A (zh
Inventor
霍伟明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Midea Group Co Ltd
GD Midea Air Conditioning Equipment Co Ltd
Original Assignee
Midea Group Co Ltd
Guangdong Midea Refrigeration Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Midea Group Co Ltd, Guangdong Midea Refrigeration Equipment Co Ltd filed Critical Midea Group Co Ltd
Priority to CN201610514152.2A priority Critical patent/CN105957519B/zh
Publication of CN105957519A publication Critical patent/CN105957519A/zh
Application granted granted Critical
Publication of CN105957519B publication Critical patent/CN105957519B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/02Non-electrical signal transmission systems, e.g. optical systems using infrasonic, sonic or ultrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明公开了一种多区域同时进行语音控制的方法和系统、服务器及麦克风,所述方法包括以下步骤:服务器在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程,其中,服务器存储多个线程,每个线程对应一个区域;服务器通过多个线程分别对多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放。从而通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制,保证响应时间,提高用户体验。

Description

多区域同时进行语音控制的方法和系统、服务器及麦克风
技术领域
本发明涉及智能控制技术领域,特别涉及一种多区域同时进行语音控制的方法和系统、服务器及麦克风。
背景技术
在多区域组成的空间内,例如用户家庭中,很容易出现多个用户在不同的房间内同时发出语音指令,来控制扬声器播放音乐等,此时,如果不能够及时对用户发出的语音指令做出响应,将导致很长一段时间的延时,影响用户体验;而如果在同一时刻只允许一人进行交互控制,则同样会影响用户体验。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种多区域同时进行语音控制的方法,通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制,保证响应时间,提高用户体验。
本发明的第二个目的在于提出一种服务器。
本发明的第三个目的在于提出一种麦克风。
本发明的第四个目的在于提出一种多区域同时进行语音控制的系统。
为实现上述目的,本发明第一方面实施例提出了一种多区域同时进行语音控制的方法,包括以下步骤:服务器在接收到多个区域的声音信息后,选择所述多个区域中每个区域对应的线程,其中,所述服务器存储多个线程,每个线程对应一个区域;所述服务器通过多个线程分别对所述多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据所述指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放。
根据本发明实施例的多区域同时进行语音控制的方法,服务器在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程,然后通过多个线程分别对多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,从而通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制,保证响应时间,提高用户体验。
根据本发明的一个实施例,所述多个区域中的每个区域均通过多个麦克风收集所述声音信息,并将所述声音信息通过有线或者无线方式传输至所述服务器。
根据本发明的一个实施例,上述的多区域同时进行语音控制的方法,还包括:所述多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断所述声音信息的分贝是否大于预设分贝,以及判断所述声音信息的频率是否在预设频率范围内;如果所述声音信息的分贝大于所述预设分贝且所述声音信息的频率在所述预设范围内,则对应的麦克风发送所述声音信息至所述服务器。
为实现上述目的,本发明第二方面实施例提出了一种服务器,包括:选择模块和多个线程模块,所述选择模块分别与所述多个线程模块中的每个线程模块相连,所述选择模块用于在接收到多个区域的声音信息后,选择所述多个区域中每个区域对应的线程模块;所述多个线程模块中的每个线程模块用于对对应的区域的声音信息进行解析,以提取用户的指令信息,并根据所述指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放。
根据本发明实施例的服务器,选择模块在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程模块,然后,线程模块对对应的区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,从而通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制。
根据本发明的一个实施例,所述多个区域中的每个区域的声音信息均通过多个麦克风收集获得。
根据本发明的一个实施例,所述每个线程模块用于对对应的区域的声音信息进行解析,包括:对所述声音信息进行回声消除、降噪、滤波处理以及语音合成分析。
为实现上述目的,本发明第三方面实施例提出了一种麦克风,包括:声音收集模块,所述声音收集模块用于收集区域内的声音信息;通讯模块,所述通讯模块用于与服务器建立通讯连接;判断模块,所述判断模块与所述声音收集模块相连,所述判断模块用于判断所述声音信息的分贝是否大于预设分贝,并判断所述声音信息的频率是否在预设频率范围内;发送模块,所述发送模块分别与所述判断模块、所述通讯模块和所述声音收集模块相连,所述发送模块用于在所述声音信息的分贝大于所述预设分贝且所述声音信息的频率在所述预设范围内时,通过所述通讯模块发送所述声音信息至所述服务器。
根据本发明实施例的麦克风,在声音收集模块收集到区域内的声音信息后,并不直接发送至服务器,而是先通过判断模块判断声音信息的分贝是否大于预设分贝,并判断声音信息的频率是否在预设频率范围内,如果声音信息的分贝大于预设分贝且声音信息的频率在预设范围内,则发送模块通过通讯模块以有线方式或者无线方式发送声音信息至服务器,从而使得麦克风只传送更有效的部分,减少了数据的传输量,特别是在多个麦克风同时传输数据至同一服务器时,避免了因大量数据同时传输导致的带宽拥堵现象,减少了对传输带宽的要求,并且进一步减少了服务器的处理时间和处理任务量,提高了服务器的响应速度。
为实现上述目的,本发明第四方面实施例提出了一种多区域同时进行语音控制的系统,包括:多个语音收集模块,所述多个语音收集模块对应设置在多个区域中,所述多个语音收集模块中的每个语音收集模块用于收集所在区域的声音信息;服务器,所述服务器用于接收所述多个区域的声音信息,并在接收到所述多个区域的声音信息后,选择所述多个区域中每个区域对应的线程,并通过多个线程分别对所述多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据所述指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,其中,所述服务器存储多个线程,每个线程对应一个区域。
根据本发明实施例的多区域同时进行语音控制的系统,服务器在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程,然后通过多个线程分别对多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,从而通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制。
根据本发明的一个实施例,所述每个语音收集模块均包括:多个麦克风,所述多个麦克风设置在同一区域不同位置处。
根据本发明的一个实施例,所述多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断所述声音信息的分贝是否大于预设分贝,以及判断所述声音信息的频率是否在预设范围内,其中,如果所述声音信息的分贝大于所述预设分贝且所述声音信息的频率在所述预设范围内,则发送所述声音信息至所述服务器。
附图说明
图1是根据本发明一个实施例的多区域同时进行语音控制的方法的流程图;
图2是根据本发明一个具体示例的麦克风、扬声器的布局示意图;
图3是根据本发明一个实施例的服务器的多线程示意图;
图4是根据本发明另一个实施例的多区域同时进行语音控制的方法的流程图;
图5是根据本发明一个实施例的服务器的结构示意图;
图6是根据本发明一个实施例的麦克风的结构示意图;
图7是根据本发明另一个实施例的麦克风的结构示意图;以及
图8是根据本发明一个实施例的多区域同时进行语音控制的系统的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图来描述根据本发明实施例提出的多区域同时进行语音控制的方法和系统、服务器及麦克风。
图1是根据本发明一个实施例的多区域同时进行语音控制的方法的流程图。如图1所示,该多区域同时进行语音控制的方法包括以下步骤:
S110,服务器在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程,其中,服务器存储多个线程,每个线程对应一个区域。
根据本发明的一个实施例,多个区域中的每个区域均通过多个麦克风收集声音信息,并将声音信息通过有线或者无线方式传输至服务器。
具体而言,由于语音识别对环境的要求较高,环境噪声和区域内的回声(墙壁回弹噪声)等会影响语音识别的质量,因此,可以在同一区域内,根据现场情况设置两个以上的麦克风,以抑制干扰噪声。
作为一个具体示例,如图2所示,可以将餐厅和客厅作为同一区域A,根据餐厅和客厅的面积和结构可以设置六个麦克风;将图中右上角的侧卧室作为同一区域B,根据侧卧室的面积可以设置两个麦克风;将图中右下角的主卧室作为同一区域C,根据主卧室的面积可以设置三个麦克风。然后,通过设置在区域内的多个麦克风获取所在区域内的声音信息,包括区域内的环境噪声和回声等。也就是说,利用设置在同一区域不同位置处的麦克风分别收集环境噪声和回声等数据,并传输至服务器。
例如,可通过区域A中的六个麦克风收集区域A中的所有声音信息,并将收集到的声音信息传输至服务器,同时通过区域B中的两个麦克风收集区域B中的所有声音信息,以及同时通过区域C中的三个麦克风收集区域C中的所有声音信息,其中,每个麦克风可具有有线功能和无线功能,每个麦克风可通过有线以太网接入局域网中的服务器,也可以通过WIFI、蓝牙、Zigbee等无线方式传输至服务器,具体这里不做限定。
当不同区域的麦克风同时将收集到的声音信息发送至服务器时,服务器可以根据麦克风的唯一标识号来选择该麦克风所在区域对应的线程,如图3所示,区域A中的麦克风对应线程A,区域B中的麦克风对应线程B,区域C中的麦克风对应线程C,具体线程的个数可根据实际设定区域设置。
S120,服务器通过多个线程分别对多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放。
也就是说,当不同区域的不同用户同时向服务器发送指令信息时,可以通过不同的线程来进行处理,以实现不同区域多个用户同时使用语音来控制。
具体而言,服务器同时通过不同的线程对相应的区域的声音信息进行噪声的分离和消除等,以提取出用户的指令信息,然后根据用户的指令信息从搜索引擎中获取播放内容,最后通过对应区域中的至少一个扬声器进行播放,如图2所示,可以在区域A中设置五个扬声器,在区域B中设置两个扬声器,在区域C中设置两个扬声器,通过控制所在区域内的一个或多个扬声器进行播放。
可以理解的是,在本发明的实施例中,麦克风可通过无线方式接入服务器,因此,区域数目的增加并不需要增加布线,只要增加带宽即可,同时服务器中只需增加对应的线程即可,实现简单。
根据本发明实施例的多区域同时进行语音控制的方法,服务器在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程,然后通过多个线程分别对多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,从而通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制,保证响应时间,提高用户体验。
考虑到实际应用中,当多个麦克风同时上传数据到服务器,可能出现带宽拥堵现象,为此,在本发明的实施例中,可以先对每个麦克风收集到的声音信息进行判断,如果声音信息满足一定要求,则再将该声音信息上传至服务器,以减少因同时上传较多数据导致带宽拥堵现象发生。
如图4所示,多区域同时进行语音控制的方法还可包括以下步骤:
S410,多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断声音信息的分贝是否大于预设分贝,以及判断声音信息的频率是否在预设频率范围内。
S420,如果声音信息的分贝大于预设分贝且声音信息的频率在预设范围内,则对应的麦克风发送声音信息至服务器。
具体而言,如图2所示,当区域A中有声音时,区域A中的六个麦克风会自动检测声音的大小(分贝),并判断该声音是否在人声范围内。如果声音比较大,如:声音信息的分贝大于预设分贝,并且该声音在人声范围内,如:声音信息的频率在预设范围内,则麦克风自动将声音信息上传至服务器,从而使得多个麦克风只传送更有效的部分,减少了对传输带宽的要求,减少了服务器的解析处理时间,提高了响应速度。
需要说明的是,服务器可以根据具体的环境声音对预设分贝进行动态调整。例如,当环境声音很大时,服务器将预设分贝进行调高;环境声音较小时,服务器则将预设分贝进行调小。具体场景如下:由于多区域同时控制,可能产生区域间的声音干扰,此时服务器可根据每个区域的环境声音对预设分贝进行调节。例如,当客厅在播放歌曲时,由于房间隔音效果一般,从而导致房间的环境声音变大,因此服务器会根据每个区域的相互间的声音影响进行判断以确定预设分贝,并将其发送至麦克风中。
可以理解的是,在本发明的实施例中,可以将多个麦克风设置在家用电器中,以增强整个设备群的隐蔽性,提高室内的美观度,提高用户体验。
根据本发明实施例的多区域同时进行语音控制的方法,在麦克风收集到声音信息时,还自动检测该声音信息是否满足一定要求,如果满足,再将该声音信息上传至服务器,从而使得多个麦克风只传送更有效的部分,减少了对传输带宽的要求,减少了服务器处理时间,提高了响应速度。而且,通过将多个麦克风设置在不同的家用电器中,增强了整个设备群的隐蔽性,提高了室内的美观度,提高了用户体验。
图5是根据本发明一个实施例的服务器的结构示意图。如图5所示,服务器100包括:选择模块110和多个线程模块120~12n。
具体地,选择模块110分别与多个线程模块中的每个线程模块相连,选择模块110用于在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程模块。多个线程模块120~12n中的每个线程模块用于对对应的区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放。其中,声音信息可包括区域内的环境噪声和回声等。
根据本发明的一个实施例,每个线程模块用于对对应的区域的声音信息进行解析,包括:对声音信息进行回声消除、降噪、滤波处理以及语音合成分析。
具体而言,当不同区域的声音收集装置(如麦克风)同时将收集到的声音信息发送至服务器100时,服务器100中的选择模块110可以根据声音收集装置的唯一标识号来选择该声音收集装置所在区域对应的线程模块。例如,可设定图2中的区域A中的麦克风对应线程模块120,区域B中的麦克风对应线程模块121,区域C中的麦克风对应线程模块122。
然后,服务器100中的多个线程模块同时对相应的区域的声音信息进行回声消除、降噪、滤波处理以及语音合成分析,以提取出用户的指令信息,并根据用户的指令信息从搜索引擎中获取播放内容,最后通过对应区域中的至少一个扬声器进行播放,如图2所示,可以在区域A中设置五个扬声器,在区域B中设置两个扬声器,在区域C中设置两个扬声器,通过控制所在区域内的一个或多个扬声器进行播放,从而实现当不同区域的不同用户同时向服务器发送指令信息时,可以通过不同的线程模块来进行处理,以实现不同区域多个用户同时使用语音来控制。其中,可以采用现有技术对声音信息进行回声消除、降噪、滤波处理以及语音合成分析等,具体这里不再详述。
根据本发明实施例的服务器,选择模块在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程模块,然后,线程模块对对应的区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,从而通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制。
图6是根据本发明一个实施例的麦克风的结构示意图,如图6所示,麦克风200包括:声音收集模块210、通讯模块220、判断模块230和发送模块240。
其中,声音收集模块210用于收集区域内的声音信息。通讯模块220用于与服务器建立通讯连接。判断模块230与声音收集模块210相连,判断模块230用于判断声音信息的分贝是否大于预设分贝,并判断声音信息的频率是否在预设频率范围内。发送模块240分别与判断模块230、通讯模块220和声音收集模210相连,发送模块240用于在声音信息的分贝大于预设分贝且声音信息的频率在预设范围内时,通过通讯模块220发送声音信息至服务器。
具体地,麦克风200在收集声音信息时,不仅会收集到人正常说话的声音信息,而且会收集到动物、电视机等发出的声音信息等,如果此时直接将收集到的声音信息发送至服务器进行处理,将会大大增加服务器的处理任务量,尤其是当多个麦克风同时发送声音信息至服务器,不仅会增加服务器的处理时间,降低响应速度,而且会造成宽带拥堵问题。
为此,在本发明的实施例中,在声音收集模块210收集到声音信息后,并不直接发送收集的声音信息至服务器,而是先通过判断模块230判断该声音信息是否满足一定要求,包括判断该声音信息的分贝(大小)是否大于预设分贝,以及判断该声音信息的频率是否在预设范围内。如果该声音信息满足一定要求,则再将该声音信息通过通讯模块220发送至服务器。从而使得麦克风只传送更有效的部分,减少了数据的传输量,特别是在多个麦克风同时传输数据至同一服务器时,避免了因大量数据同时传输导致的带宽拥堵现象,减少了对传输带宽的要求,并且进一步减少了服务器的处理时间和处理任务量,提高了服务器的响应速度。
可以理解的是,如图7所示,通讯模块220可包括:有线通讯子模块221和/或无线通讯子模块222。
具体地,通讯模块220可包括有线通讯子模块221,或者无线通讯子模块222,或者同时包含有线通讯子模块221和无线通讯子模块222。发送模块240可通过有线通讯子模块221(如有线以太网)接入局域网中的服务器,也可以通过无线通讯子模块222(如WIFI、蓝牙、Zigbee等)将数据传输至服务器。
根据本发明实施例的麦克风,在声音收集模块收集到区域内的声音信息后,并不直接发送至服务器,而是先通过判断模块判断声音信息的分贝是否大于预设分贝,并判断声音信息的频率是否在预设频率范围内,如果声音信息的分贝大于预设分贝且声音信息的频率在预设范围内,则发送模块通过通讯模块以有线方式或者无线方式发送声音信息至服务器,从而使得麦克风只传送更有效的部分,减少了数据的传输量,特别是在多个麦克风同时传输数据至同一服务器时,避免了因大量数据同时传输导致的带宽拥堵现象,减少了对传输带宽的要求,并且进一步减少了服务器的处理时间和处理任务量,提高了服务器的响应速度。
图8是根据本发明一个实施例的多区域同时进行语音控制的系统的结构示意图。如图8所示,多区域同时进行语音控制的系统包括:多个语音收集模块300和服务器100。
其中,多个语音收集模块300对应设置在多个区域中,多个语音收集模块300中的每个语音收集模块用于收集所在区域的声音信息。服务器100用于接收多个区域的声音信息,并在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程,并通过多个线程分别对多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,其中,服务器100存储多个线程,每个线程对应一个区域。
具体地,服务器100通过预设配置信息,把声音信息的发送方(多个语音收集模块300)与多个区域的线程进行绑定。当有声音信息时,服务器100可通过通讯模块直接将声音信息传送给对应的线程,各区域对应的线程独立运作,进行与其绑定的声音源的分析,并进行解析,以提取用户的指令信息,以及根据指令信息获取播放内容,然后,服务器100控制对应的区域中的至少一个扬声器进行播放,从而实现不同区域多个用户同时使用语音指令的交互控制。
进一步地,考虑到语音识别对环境的要求较高,环境噪声和区域内的回声等会影响语音识别的质量,因此,在本发明的一个实施例中,每个语音收集模块300均包括多个麦克风,多个麦克风设置在同一区域不同位置处,以抑制干扰噪声。其中,麦克风可以为图6-图7所述的麦克风。
作为一个具体示例,如图2所示,可以将餐厅和客厅作为同一区域A,根据餐厅和客厅的面积和结构可以设置六个麦克风;将图中右上角的侧卧室作为同一区域B,根据侧卧室的面积可以设置两个麦克风;将图中右下角的主卧室作为同一区域C,根据主卧室的面积可以设置三个麦克风。然后,通过设置在区域内的多个麦克风获取所在区域内的声音信息,包括区域内的环境噪声和回声等。
也就是说,利用设置在同一区域不同位置处的麦克风分别收集环境噪声和回声等数据,并传输至服务器100。例如,可通过区域A中的六个麦克风收集区域A中的所有声音信息,并将收集到的声音信息传输至服务器100,同时通过区域B中的两个麦克风收集区域B中的所有声音信息,以及同时通过区域C中的三个麦克风收集区域C中的所有声音信息。
当不同区域的麦克风同时将收集到的声音信息发送至服务器100时,服务器100可以根据麦克风的唯一标识号来选择该麦克风所在区域对应的线程,例如图3所示,区域A中的麦克风对应线程A,区域B中的麦克风对应线程B,区域C中的麦克风对应线程C,具体线程的个数可根据实际设定区域设置。
然后,服务器100中的多个线程同时对相应的区域的声音信息进行噪声的分离和消除等,以提取出用户的指令信息,并根据用户的指令信息从搜索引擎中获取播放内容,最后通过对应区域中的至少一个扬声器进行播放,如图2所示,可以在区域A中设置五个扬声器,在区域B中设置两个扬声器,在区域C中设置两个扬声器,通过控制所在区域内的一个或多个扬声器进行播放。从而实现当不同区域的不同用户同时向服务器发送指令信息时,可以通过不同的线程来进行处理,以实现不同区域多个用户同时使用语音来控制。
根据本发明实施例的多区域同时进行语音控制的系统,服务器在接收到多个区域的声音信息后,选择多个区域中每个区域对应的线程,然后通过多个线程分别对多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,从而通过独立的线程对对应区域的声音信息进行处理,实现不同区域多个用户同时使用语音指令的交互控制。
考虑到实际应用中,当多个麦克风同时上传数据到服务器100,可能出现带宽拥堵现象,为此,在本发明的实施例中,可以先对每个麦克风收集到的声音信息进行判断,如果声音信息满足一定要求,则再将该声音信息上传至服务器100,以减少因同时上传较多数据导致带宽拥堵现象发生。
根据本发明的一个实施例,多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断声音信息的分贝是否大于预设分贝,以及判断声音信息的频率是否在预设范围内,其中,如果声音信息的分贝大于预设分贝且声音信息的频率在预设范围内,则发送声音信息至服务器100。
具体而言,如图2所示,当区域A有声音时,区域A中的六个麦克风会自动检测声音的大小(分贝),并判断该声音是否在人声范围内。如果声音比较大,如:声音信息的分贝大于预设分贝,并且该声音在人声范围内,如:声音信息的频率在预设范围内,则麦克风自动将声音信息上传至服务器100,从而使得多个麦克风只传送更有效的部分,减少了对传输带宽的要求,减少了服务器的解析处理时间,提高了响应速度。
需要说明的是,服务器100可以根据具体的环境声音对预设分贝进行动态调整。例如,当环境声音很大时,服务器100将预设分贝进行调高;环境声音较小时,服务器100则将预设分贝进行调小。具体场景如下:由于多区域同时控制,可能产生区域间的声音干扰,此时服务器100可根据每个区域的环境声音对预设分贝进行调节。例如,当客厅在播放歌曲时,由于房间隔音效果一般,从而导致房间的环境声音变大,因此服务器100会根据每个区域的相互间的声音影响进行判断以确定预设分贝,并将其发送至麦克风中。
可以理解的是,在本发明的实施例中,可以将多个麦克风设置在家用电器中,以增强整个设备群的隐蔽性,提高室内的美观度,提高用户体验。
根据本发明实施例的多区域同时进行语音控制的系统,在麦克风收集到声音信息时,还自动检测该声音信息是否满足一定要求,如果满足,再将该声音信息上传至服务器,从而使得多个麦克风只传送更有效的部分,减少了对传输带宽的要求,减少了服务器处理时间,提高了响应速度。而且,通过将多个麦克风设置在不同的家用电器中,增强了整个设备群的隐蔽性,提高了室内的美观度,提高了用户体验。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (5)

1.一种多区域同时进行语音控制的方法,其特征在于,包括以下步骤:
服务器在接收到多个区域的声音信息后,选择所述多个区域中每个区域对应的线程,其中,所述服务器存储多个线程,每个线程对应一个区域;
所述服务器通过多个线程分别对所述多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据所述指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,其中,所述多个区域中的每个区域均通过多个麦克风收集所述声音信息,并将所述声音信息通过有线或者无线方式传输至所述服务器,其中,所述方法还包括:
所述多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断所述声音信息的分贝是否大于预设分贝,以及判断所述声音信息的频率是否在预设频率范围内;
如果所述声音信息的分贝大于所述预设分贝且所述声音信息的频率在所述预设范围内,则对应的麦克风发送所述声音信息至所述服务器,其中,所述服务器根据环境声音对预设分贝进行动态调整,当所述环境声音大时,所述服务器将所述预设分贝调高,当所述环境声音小时,所述服务器则将所述预设分贝调小。
2.一种服务器,其特征在于,包括:选择模块和多个线程模块,所述选择模块分别与所述多个线程模块中的每个线程模块相连,
所述选择模块用于在接收到多个区域的声音信息后,选择所述多个区域中每个区域对应的线程模块;
所述多个线程模块中的每个线程模块用于对对应的区域的声音信息进行解析,以提取用户的指令信息,并根据所述指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,所述多个区域中的每个区域的声音信息均通过多个麦克风收集获得,其中,所述多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断所述声音信息的分贝是否大于预设分贝,以及判断所述声音信息的频率是否在预设频率范围内;
如果所述声音信息的分贝大于所述预设分贝且所述声音信息的频率在所述预设范围内,则对应的麦克风发送所述声音信息至所述服务器,其中,所述服务器根据环境声音对预设分贝进行动态调整,当所述环境声音大时,所述服务器将所述预设分贝调高,当所述环境声音小时,所述服务器则将所述预设分贝调小。
3.根据权利要求2所述的服务器,其特征在于,所述每个线程模块用于对对应的区域的声音信息进行解析,包括:对所述声音信息进行回声消除、降噪、滤波处理以及语音合成分析。
4.一种多区域同时进行语音控制的系统,其特征在于,包括:
多个语音收集模块,所述多个语音收集模块对应设置在多个区域中,所述多个语音收集模块中的每个语音收集模块用于收集所在区域的声音信息,所述语音收集模块包括麦克风;
服务器,所述服务器用于接收所述多个区域的声音信息,并在接收到所述多个区域的声音信息后,选择所述多个区域中每个区域对应的线程,并通过多个线程分别对所述多个区域中每个区域的声音信息进行解析,以提取用户的指令信息,并根据所述指令信息获取播放内容,以及控制对应的区域中的至少一个扬声器进行播放,其中,所述服务器存储多个线程,每个线程对应一个区域,所述每个语音收集模块均包括:多个麦克风,所述多个麦克风设置在同一区域不同位置处,其中,所述多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断所述声音信息的分贝是否大于预设分贝,以及判断所述声音信息的频率是否在预设频率范围内;
如果所述声音信息的分贝大于所述预设分贝且所述声音信息的频率在所述预设范围内,则对应的麦克风发送所述声音信息至所述服务器,其中,所述服务器根据环境声音对预设分贝进行动态调整,当所述环境声音大时,所述服务器将所述预设分贝调高,当所述环境声音小时,所述服务器则将所述预设分贝调小。
5.根据权利要求4所述的多区域同时进行语音控制的系统,其特征在于,所述多个麦克风中的每个麦克风检测收集到的声音信息的分贝和频率,并判断所述声音信息的分贝是否大于预设分贝,以及判断所述声音信息的频率是否在预设范围内,其中,
如果所述声音信息的分贝大于所述预设分贝且所述声音信息的频率在所述预设范围内,则发送所述声音信息至所述服务器。
CN201610514152.2A 2016-06-30 2016-06-30 多区域同时进行语音控制的方法和系统、服务器及麦克风 Active CN105957519B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610514152.2A CN105957519B (zh) 2016-06-30 2016-06-30 多区域同时进行语音控制的方法和系统、服务器及麦克风

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610514152.2A CN105957519B (zh) 2016-06-30 2016-06-30 多区域同时进行语音控制的方法和系统、服务器及麦克风

Publications (2)

Publication Number Publication Date
CN105957519A CN105957519A (zh) 2016-09-21
CN105957519B true CN105957519B (zh) 2019-12-10

Family

ID=56903163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610514152.2A Active CN105957519B (zh) 2016-06-30 2016-06-30 多区域同时进行语音控制的方法和系统、服务器及麦克风

Country Status (1)

Country Link
CN (1) CN105957519B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108257610A (zh) * 2016-12-27 2018-07-06 乐视汽车(北京)有限公司 一种车机及对应的语音传输方法及系统
CN106789484A (zh) * 2017-02-17 2017-05-31 张德明 一种基于网络的分布式麦克风智能家居系统
CN107919119A (zh) 2017-11-16 2018-04-17 百度在线网络技术(北京)有限公司 多设备交互协同的方法、装置、设备及计算机可读介质
CN108986821B (zh) * 2018-08-23 2021-03-23 珠海格力电器股份有限公司 一种设置房间与设备关系的方法和设备
CN109509468B (zh) * 2018-11-01 2021-03-16 珠海格力电器股份有限公司 一种设备执行语音播报任务的方法及装置
CN111629301B (zh) 2019-02-27 2021-12-31 北京地平线机器人技术研发有限公司 用于控制多个扬声器播放音频的方法、装置和电子设备
CN113851109A (zh) * 2019-02-28 2021-12-28 百度在线网络技术(北京)有限公司 多音区唤醒测试方法、装置及存储介质
CN110164436A (zh) * 2019-05-22 2019-08-23 深圳市智乐创科技有限公司 便携式多点智能语音控制家居的系统及方法
CN112053683A (zh) * 2019-06-06 2020-12-08 阿里巴巴集团控股有限公司 一种语音指令的处理方法、设备及控制系统
CN112309378B (zh) * 2019-07-24 2023-11-03 广东美的白色家电技术创新中心有限公司 语音识别设备及其唤醒响应方法、计算机存储介质
CN110992946A (zh) * 2019-11-01 2020-04-10 上海博泰悦臻电子设备制造有限公司 一种语音控制方法、终端及计算机可读存储介质
CN111145751A (zh) * 2019-12-31 2020-05-12 百度在线网络技术(北京)有限公司 音频信号处理方法、装置以及电子设备
CN112351299B (zh) * 2020-11-05 2022-11-04 山东亚华电子股份有限公司 一种宣教广播方法及设备
CN113450835B (zh) * 2021-06-04 2023-03-21 佛吉亚歌乐电子(丰城)有限公司 一种优化车载中控无声时底噪的方法、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1361516A (zh) * 2000-12-28 2002-07-31 广东科龙电器股份有限公司 家庭综合服务器
CN103916875A (zh) * 2014-04-24 2014-07-09 山东大学 基于wifi无线网络多类控制终端的管理与规划系统
CN104509079A (zh) * 2012-08-01 2015-04-08 谷歌公司 基于位置标记的语音识别模型
CN105068722A (zh) * 2015-07-20 2015-11-18 江西洪都航空工业集团有限责任公司 一种面向智能家居环境的人机交互控制方法
CN105427861A (zh) * 2015-11-03 2016-03-23 胡旻波 智能家居协同麦克风语音控制系统及控制方法
CN105553799A (zh) * 2016-02-29 2016-05-04 深圳市广佳乐新智能科技有限公司 一种基于语音识别的智能家居系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2496593T3 (es) * 2006-10-16 2014-09-19 Assa Abloy Hospitality, Inc. Red inalámbrica centralizada para propiedades de gran tamaño con múltiples habitaciones
TWI531226B (zh) * 2013-01-24 2016-04-21 大同聯合科技股份有限公司 智慧型互動式電視遙控系統

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1361516A (zh) * 2000-12-28 2002-07-31 广东科龙电器股份有限公司 家庭综合服务器
CN104509079A (zh) * 2012-08-01 2015-04-08 谷歌公司 基于位置标记的语音识别模型
CN103916875A (zh) * 2014-04-24 2014-07-09 山东大学 基于wifi无线网络多类控制终端的管理与规划系统
CN105068722A (zh) * 2015-07-20 2015-11-18 江西洪都航空工业集团有限责任公司 一种面向智能家居环境的人机交互控制方法
CN105427861A (zh) * 2015-11-03 2016-03-23 胡旻波 智能家居协同麦克风语音控制系统及控制方法
CN105553799A (zh) * 2016-02-29 2016-05-04 深圳市广佳乐新智能科技有限公司 一种基于语音识别的智能家居系统

Also Published As

Publication number Publication date
CN105957519A (zh) 2016-09-21

Similar Documents

Publication Publication Date Title
CN105957519B (zh) 多区域同时进行语音控制的方法和系统、服务器及麦克风
US11172329B2 (en) Systems and methods for target device prediction
US11031014B2 (en) Voice detection optimization based on selected voice assistant service
CN109076285B (zh) 音频响应回放
US9942678B1 (en) Audio playback settings for voice interaction
US11764885B2 (en) Systems and methods for state detection via wireless radios
US11790937B2 (en) Voice detection optimization using sound metadata
CN106162436A (zh) 基于多扬声器的播放方法和系统
CN113168850B (zh) 分布式同步回放设备及用于其的方法
CN106128459A (zh) 语音控制装置及基于多麦克风的语音控制方法
US11758326B2 (en) Wearable audio device within a distributed audio playback system
GB2550877A (en) Object-based audio rendering
CN106331960A (zh) 一种基于Multi‑room的音响控制方法及系统
US20230097522A1 (en) Mapping and characterizing acoustic events within an environment via audio playback devices
Jackson et al. Object-Based Audio Rendering
US20230046698A1 (en) Techniques for dynamic routing
WO2024073651A1 (en) Method of configuring a portable playback device, corresponding playback device and playback system
WO2023245014A2 (en) Systems and methods for uwb multi-static radar

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant