CN108320749A - 远场语音控制设备和远场语音控制系统 - Google Patents

远场语音控制设备和远场语音控制系统 Download PDF

Info

Publication number
CN108320749A
CN108320749A CN201810208870.6A CN201810208870A CN108320749A CN 108320749 A CN108320749 A CN 108320749A CN 201810208870 A CN201810208870 A CN 201810208870A CN 108320749 A CN108320749 A CN 108320749A
Authority
CN
China
Prior art keywords
far field
voice
control device
information
voice messaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810208870.6A
Other languages
English (en)
Inventor
赵立峰
吴登峰
邢仁泰
陈杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810208870.6A priority Critical patent/CN108320749A/zh
Publication of CN108320749A publication Critical patent/CN108320749A/zh
Priority to JP2018223358A priority patent/JP2019159306A/ja
Priority to US16/295,881 priority patent/US20190287523A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0225Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal
    • H04W52/0235Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal where the received signal is a power saving command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/12Arrangements for remote connection or disconnection of substations or of equipment thereof
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请实施例公开了远场语音控制设备和远场语音控制系统。该远场语音控制设备的一具体实施方式包括:远场收音器件和语音分析器件;远场收音器件接收用户发送的语音信息,将语音信息发送至语音分析器件;语音分析器件对语音信息进行分析,确定语音信息中是否包含预设唤醒词,若包含预设唤醒词,将语音信息发送至与远场语音控制设备通信连接的云服务器。也就是说,远距离用户可以通过语音与支持远场收音功能的远场语音控制设备进行交互,从而实现相应的控制功能。这样有助于提高控制的便捷性。

Description

远场语音控制设备和远场语音控制系统
技术领域
本申请实施例涉及计算机技术领域,具体涉及远场语音控制设备和远场语音控制系统。
背景技术
随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代。不仅仅是电脑、手机、虚拟现实(virtual reality,VR)眼镜等电子产品。人们的衣食住行的方方面面都开始应用智能技术,如智能电视,智能导航,智能家居等等。智能技术将在人们生活的各个方面提供方便快捷的服务。其中,智能语音交互技术就是目前被广泛应用的一项智能技术。
智能语音交互通常是基于语音输入的新一代交互模式,即通过说话就可以得到反馈结果。这种交互方式是人类最自然最轻松的交互方式,能高效的解放双手,且可以最大程度地降低操作难度。
发明内容
本申请实施例提出了远场语音控制设备和远场语音控制系统。
第一方面,本申请实施例提出了一种远场语音控制设备,包括远场收音器件和语音分析器件;远场收音器件接收用户发送的语音信息,将语音信息发送至语音分析器件;语音分析器件对语音信息进行分析,确定语音信息中是否包含预设唤醒词,若包含预设唤醒词,将语音信息发送至与远场语音控制设备通信连接的云服务器。
在一些实施例中,远场语音控制设备还包括远场放音器件,远场放音器件播放从云服务器接收到的语音播放信息。
在一些实施例中,远场放音器件包括用于放大语音播放信息的功率的功率放大器。
在一些实施例中,在远场收音器件接收用户发送的语音信息之后,远场收音器件还对语音信息进行去噪处理。
在一些实施例中,远场语音控制设备还包括以下至少一种联网器件:无线局域网联网器件,蓝牙联网器件、红外联网器件,远场语音控制设备通过至少一种联网器件与云服务器和至少一台智能设备建立通信连接。
在一些实施例中,远场语音控制设备安装于接线盒内,接线盒的面板为触控面板,其中,触控面板设置有触控按键和/或指示灯。
第二方面,本申请实施例提出了一种远场语音控制系统,包括云服务器以及如第一方面中任一实施例所描述的远场语音控制设备,云服务器与远场语音控制设备通信连接。
在一些实施例中,云服务器接收远场语音控制设备发送的语音信息,对语音信息进行分析处理,确定与语音信息对应的控制信息,将包括控制信息的控制指令发送至远场语音控制设备。
在一些实施例中,当控制信息中包括语音播放信息时,远场语音控制设备的远场放音器件播放语音播放信息。
在一些实施例中,远场语音控制系统还包括至少一台智能设备,当控制信息中包括非语音播放信息时,远场语音控制设备从至少一台智能设备中确定执行与非语音播放信息对应的操作的智能设备作为目标智能设备,将非语音播放信息发送至目标智能设备,以使目标智能设备执行与非语音播放信息对应的操作。
在一些实施例中,远场语音控制设备接收用户发送的语音信息,对语音信息进行分析,确定语音信息中是否包含预设唤醒词,若包含预设唤醒词,将语音信息发送至云服务器;云服务器对语音信息进行分析处理,确定与语音信息对应的控制信息,将包括控制信息的控制指令发送至远场语音控制设备;当控制信息中包括语音播放信息时,远场语音控制设备的远场放音器件播放语音播放信息;当控制信息中包括非语音播放信息时,远场语音控制设备从至少一台智能设备中确定执行与非语音播放信息对应的操作的智能设备作为目标智能设备,将非语音播放信息发送至目标智能设备,以使目标智能设备执行与非语音播放信息对应的操作。
本申请实施例提出的远场语音控制设备和远场语音控制系统,通过远场语音控制设备的远场收音器件接收用户发送的语音信息,以便于将语音信息发送至远场语音控制设备的语音分析器件。之后,语音分析器件对语音信息进行分析,以确定语音信息中是否包含预设唤醒词,在包含预设唤醒词的情况下,将语音信息发送至与远场语音控制设备通信连接的云服务器。也就是说,远距离用户可以通过语音与支持远场收音功能的远场语音控制设备和远场语音控制系统进行交互,从而实现相应的控制功能。这样有助于提高控制的便捷性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请提供的远场语音控制设备的一个实施例的结构示意图;
图2是本申请提供的远场语音控制设备的又一个实施例的结构示意图;
图3是本申请提供的远场语音控制系统的一个实施例的结构示意图;
图4是本申请提供的远场语音控制系统的又一个实施例的结构示意图;
图5是本申请提供的远场语音控制系统的一个应用场景的内部交互流程图;
图6是本申请提供的远场语音控制系统的又一个应用场景的内部交互流程图。
具体实施方式
下面结合附图和实施例对本申请的原理和特征作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参见图1所示,其示出了本申请提供的远场语音控制设备的一个实施例的结构示意图。本实施例中的远场语音控制设备可以包括远场收音器件11和语音分析器件12。
在本实施例中,远场收音器件11可以首先接收用户发送的语音信息,然后将语音信息发送至语音分析器件12。语音分析器件12可以对语音信息进行分析,从而确定语音信息中是否包含预设唤醒词,在确定语音信息中包含预设唤醒词的情况下,将语音信息发送至与远场语音控制设备通信连接的云服务器。
在本实施例中,远场收音器件11可以是各种可接收远距离用户所发送的语音信息的器件,例如麦克风阵列(Microphone Array)。其中,麦克风阵列可以是由一定数目,一定空间构型的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。实践中,线性、环形、球形麦克风阵列在原理上并无太大区别,只是由于空间构型不同,导致不同形状的麦克风阵列可分辨的空间范围不同。比如,在声源定位上,线性阵列只有一维信息,只能分辨180度,环形阵列是平面阵列,有两维信息,能分辨360度,球形阵列是立体三维空间阵列,有三维信息,能分辨360度的方位角和180度俯仰角。这里,为了便于不同位置的用户进行远场语音控制,通常采用环形麦克风阵列或球形麦克风阵列作为远场收音器件11。其次,麦克风阵列中的麦克风的数量越多,波束能区分的空间越精细,在嘈杂环境下所接收到的语音信息的质量越高。然而,麦克风阵列中的麦克风的数量越多,其成本也越高。因此,可以结合远场语音控制的距离确定出合适的麦克风数目。
在本实施例的一些可选的实现方式中,为了提高后续对语音信息进行识别的准确度,在接收到用户发送的语音信息之后,远场收音器件11还可以采用一些处理算法(例如去噪算法、用于消除回声、去除混响等的声学算法等)对语音信息进行去噪处理。例如,远场收音器件11可以基于波束形成的方法,通过将麦克风阵列中的多个麦克风所接收的语音信息进行加权相加,在目标方向形成一个拾音波束,同时衰减来自其他方向的反射声,从而得到一路干净的语音信息。
在本实施例中,语音分析器件12可以采用常用的语音分析方法(例如语音识别方法、语义理解方法),来对从远场收音器件11接收到的语音信息进行分析。例如,语音分析器件12可以首先利用语音识别技术(Automatic Speech Recognition,ASR)对语音信息进行语音识别,将语音信息中的词汇内容转换为书面语言形式的词汇内容;然后利用分词技术(例如全切分方法),把书面语言形式的词汇内容分割成词;最后确定所分割成的词中是否存在预设唤醒词(例如“AA”、“你好”等),在确定语音信息中包含预设唤醒词的情况下,将语音信息发送至与远场语音控制设备通信连接的云服务器,以使云服务器对语音信息进行分析处理,并反馈相应的控制信息,以实现对远场语音控制设备和/或与远场语音控制设备通信连接的智能设备进行远场语音控制。在确定语音信息中不包含预设唤醒词的情况下,结束流程。也就是说,若用户想要实现对远场语音控制设备和/或与远场语音控制设备通信连接的智能设备的远场语音控制,需要同时说出预设唤醒词和对远场语音控制设备和/或与远场语音控制设备通信连接的智能设备进行控制的信息。
在本实施例中,远场语音控制设备不仅可以与云服务器通信连接,还可以与至少一台智能设备通信连接。通常,远场语音控制设备可以通过有线连接方式或者无线连接方式连接网络以实现与云服务器通信连接。同理,当至少一台智能设备联网时,远场语音控制设备也可以通过有线连接方式或者无线连接方式连接网络以实现与至少一台智能设备通信连接。此外,当至少一台智能设备没有联网时,远场语音控制设备与至少一台智能设备之间可以建立蓝牙连接或红外连接。因此,远场语音控制设备还可以包括以下至少一种联网器件:无线局域网联网器件,蓝牙联网器件、红外联网器件,远场语音控制设备可以通过至少一种联网器件与云服务器和至少一台智能设备建立通信连接。
作为一种示例,远场语音控制设备可以设置有线端口器件。有线端口器件可以与网线连接,从而实现有线网络连接。其中,有线端口器件中可以包括有线接口,如RJ45(Registered Jack 45,连接器)中的插座。这样,当网线的接头插入该插座后,便可以实现有线网络连接。可以理解的是,这种有线连接方式,可以即插即用,而无需繁琐的配置网络流程。并且通常情况下不会出现断网现象,网络运行较稳定。
作为另一种示例,远场语音控制设备可以配置有无线局域网联网器件,例如Wi-Fi(Wireless-Fidelity,无线局域网)芯片。无线局域网联网器件可以触发远场语音控制设备连接无线局域网络。此外,无线局域网联网器件还可以作为Wi-Fi中继器使用。也就是说,当远场语音控制设备通过有线端口器件连接有线网络时,无线局域网联网器件可以将有线网络转换为无线网络,供至少一台智能设备连接使用。当至少一台智能设备连接该无线网络时,即可实现远场语音控制设备与至少一台智能设备通信连接。
作为又一种示例,远场语音控制设备可以配置蓝牙联网器件(例如蓝牙模块)。蓝牙联网器件可以触发远场语音控制设备与至少一台智能设备之间建立短距离无线通信连接。也就是说,远场语音控制设备与至少一台智能设备之间可以使用蓝牙传输信息。这样,在至少一台智能设备没有联网的情况下,远场语音控制设备也能与至少一台智能设备进行交互。
作为再一种示例,远场语音控制设备可以配置红外联网器件(例如红外模块)。红外联网器件可以内置有红外发射器和红外接收器。其中,红外发射器可以用于发射红外信号,红外接收器可以用于接收红外信号。通常,至少一台智能设备可以支持红外控制,远场语音控制设备可以根据云服务器反馈的控制信息,利用红外发射器向相应的智能设备发射相应的红外信号,以控制相应的智能设备执行相应的操作。例如,通过红外信号控制空调的开关,调整空调的温度、风速、风向等运行参数。
在本实施例的一些可选的实现方式中,远场语音控制设备可以安装于接线盒内,例如家中墙面上的开关或插座中。这样既可以减少远场语音控制设备所占用的空间,同时有利于室内的美观设计。为了进一步扩大远场语音控制设备的适用范围,这里的接线盒可以包括各种常见规格的接线盒,如86盒等。通常,接线盒的面板可以为触控面板,其中,触控面板可以设置有触控按键和/或指示灯。这样,用户还可以通过触碰触控面板上的触控按键,来调整远场语音控制设备的控制功能,如远场语音控制设备的打开、关闭等。指示灯可以用于指示远场语音控制设备的开、关、待机等状态。
本申请实施例提出的远场语音控制设备,远场语音控制设备的远场收音器件接收用户发送的语音信息,以便于将语音信息发送至远场语音控制设备的语音分析器件。之后,语音分析器件对语音信息进行分析,以确定语音信息中是否包含预设唤醒词,在包含预设唤醒词的情况下,将语音信息发送至与远场语音控制设备通信连接的云服务器。也就是说,远距离用户可以通过语音与支持远场收音功能的远场语音控制设备和远场语音控制系统进行交互,从而实现相应的控制功能。这样有助于提高控制的便捷性。
继续参见图2,其示出了本申请提供的远场语音控制设备的又一个实施例的结构示意图。本实施例中的远场语音控制设备可以包括远场收音器件11、语音分析器件12和远场放音器件13。
在本实施例中,远场收音器件11可以首先接收用户发送的语音信息,然后将语音信息发送至语音分析器件12。语音分析器件12可以对语音信息进行分析,从而确定语音信息中是否包含预设唤醒词,在确定语音信息中包含预设唤醒词的情况下,将语音信息发送至与远场语音控制设备通信连接的云服务器。同时,远场语音控制设备还可以包括远场放音器件13,远场放音器件13可以从云服务器接收语音播放信息,并播放从云服务器接收到的语音播放信息。
在本实施例中,远场放音器件13可以由多个不同方位的扬声器组合而成,以使不同位置的用户均能接收到语音播放信息。通常,远场放音器件13设置有功率放大器,用于放大语音播放信息的功率。这样,可以增大远场放音器件13播放的语音播放信息的音量,以使距离远场语音控制设备较远的用户也可以很好的接收到语音播放信息。
从图2中可以看出,与图1对应的实施例相比,本实施例中的远场语音控制设备增加了远场放音器件13。由此,本实施例描述的远场语音控制设备不仅支持远场收音功能,还支持远场放音功能,从而使远场语音控制设备支持远场语音交互功能。
本申请实施例还提供了一种远场语音控制系统,该远场语音控制系统可以包括云服务器和上述各实施例中所描述的远场语音控制设备。其中,云服务器可以与远场语音控制设备通信连接。作为示例,远场语音控制系统可以如图3所示,其示出了本申请提供的远场语音控制系统的一个实施例的结构示意图。
如图3所示,远场语音控制系统可以包括云服务器2和远场语音控制设备1。云服务器2和远场语音控制设备1通信连接。
在本实施例中,云服务器2与远场语音控制设备1可以通过多种方式建立通信连接,包括但不限于有线网络连接、无线网络连接。
在本实施例中,云服务器2可以接收远场语音控制设备1发送的语音信息,从而对语音信息进行分析处理,以确定与语音信息对应的控制信息;然后将包括控制信息的控制指令发送至远场语音控制设备1,以使远场语音控制设备1执行与控制信息对应的操作,或者远场语音控制设备1将包括控制信息的控制指令发送至相应的智能设备,以使相应的智能设备执行与控制信息对应的操作。例如,云服务器2可以预先存储样本语音信息集合和与每个样本语音信息的对应的样本控制信息。具体地,云服务器2可以首先从与其通信连接的远场语音控制设备1中获取语音信息;然后将语音信息与样本语音信息集合中的每个样本语音信息逐个进行匹配,若样本语音信息集合中存在一个样本语音信息与语音信息相同或相似的样本语音信息,则该样本语音信息与语音信息匹配。此时,云服务器2可以查找出与该样本语音信息对应的样本控制信息,作为与语音信息对应的控制信息,并反馈至远场语音控制设备1,以使远场语音控制设备1执行与控制信息对应的操作,或者远场语音控制设备1将包括控制信息的控制指令发送至相应的智能设备,以使相应的智能设备执行与控制信息对应的操作。
在本实施例的一些可选的实现方式中,当控制信息中包括语音播放信息时,远场语音控制设备1的远场放音器件播放语音播放信息。这样,利用远场放音器件播放语音播放信息,从而使语音播放信息可以被远距离用户很好的接收。例如,若控制信息是歌曲《XX》的音频信息,那么远场语音控制设备1的远场放音器件可以播放歌曲《XX》的音频信息。
在本实施例的一些可选的实现方式中,远场语音控制系统还可以包括至少一台智能设备,远场语音控制设备1可以与至少一台智能设备通信连接。通常,当至少一台智能设备联网时,远场语音控制设备也可以通过有线连接方式或者无线连接方式连接网络以实现与至少一台智能设备通信连接。此外,当至少一台智能设备没有联网时,远场语音控制设备与至少一台智能设备之间可以建立蓝牙连接或红外连接。当控制信息中包括非语音播放信息时,远场语音控制设备1可以首先从至少一台智能设备中确定执行与非语音播放信息对应的操作的智能设备作为目标智能设备,然后将非语音播放信息发送至目标智能设备,以使目标智能设备执行与非语音播放信息对应的操作。例如,若控制信息是“打开空调”,那么远场语音控制设备1从至少一台智能设备中确定出空调,并向空调发送控制指令,以控制空调运转。
本申请实施例提出的远场语音控制系统,通过远场语音控制设备的远场收音器件接收用户发送的语音信息,以便于将语音信息发送至远场语音控制设备的语音分析器件。之后,语音分析器件对语音信息进行分析,从而确定语音信息中是否包含预设唤醒词,在包含预设唤醒词的情况下,将语音信息发送至与远场语音控制设备通信连接的云服务器。也就是说,远距离用户可以通过语音与支持远场收音功能的远场语音控制系统进行交互,从而实现相应的控制功能。这样有助于提高控制的便捷性。
继续参见图4,其示出了本申请提供的远场语音控制系统的又一个实施例的结构示意图。本实施例中的远场语音控制系统可以包括远场语音控制设备1、云服务器2和至少一台智能设备3(图4中示出了电灯泡31和空调32)。
在本实施例中,远场语音控制设备1可以首先接收用户发送的语音信息;然后对语音信息进行分析,从而确定语音信息中是否包含预设唤醒词,若包含预设唤醒词,将语音信息发送至云服务器2;云服务器2可以对语音信息进行分析处理,从而确定与语音信息对应的控制信息,将包括控制信息的控制指令发送至远场语音控制设备1;当控制信息中包括语音播放信息时,远场语音控制设备1的远场放音器件播放语音播放信息;当控制信息中包括非语音播放信息时,远场语音控制设备1从至少一台智能设备3中确定执行与非语音播放信息对应的操作的智能设备(例如空调31)作为目标智能设备,将非语音播放信息发送至目标智能设备;目标智能设备执行与非语音播放信息对应的操作。
本申请实施例还提供了远场语音控制系统的一个应用场景。图5示出了本申请提供的远场语音控制系统的一个应用场景的内部交互流程500。首先如501所示,用户可以对着远场语音控制系统中的远场语音控制设备1说出语音信息:“AA,打开空调”;此时如502所示,远场控制设备1的远场收音器件可以将语音信息发送至远场语音控制设备1的语音分析器件;而后如503所示,语音分析器件对语音信息进行分析,确定出语音信息中包含预设唤醒词“AA”;此时如504所示,远场控制设备1可以将语音信息发送至云服务器2;之后如505所示,云服务器2可以对语音信息进行分析处理,并将打开空调的指令反馈给远场语音控制设备1;然后如506所示,远场语音控制设备1向空调发送打开空调的指令;最后如507所示,空调运转。
本申请实施例还提供了远场语音控制系统的又一个应用场景。图6示出了本申请提供的远场语音控制系统的又一个应用场景的内部交互流程600。首先如601所示,用户可以对着远场语音控制系统中的远场语音控制设备1说出语音信息:“AA,播放歌曲名为《XX》的歌曲”;此时如602所示,远场控制设备1的远场收音器件可以将语音信息发送至远场语音控制设备1的语音分析器件;而后如603所示,语音分析器件对语音信息进行分析,确定出语音信息中包含预设唤醒词“AA”;之后如604所示,远场控制设备1可以将语音信息发送至云服务器2;然后如605所示,云服务器2可以对语音信息进行分析处理,并将歌曲《XX》的音频信息反馈给远场语音控制设备1;最后如506所示,远场语音控制设备1播放歌曲《XX》的音频信息。
本申请实施例提出的远场语音控制系统,通过远场语音控制设备的远场收音器件接收用户发送的语音信息,以便于将语音信息发送至远场语音控制设备的语音分析器件。之后,语音分析器件对语音信息进行分析,从而确定语音信息中是否包含预设唤醒词,在包含预设唤醒词的情况下,将语音信息发送至与远场语音控制设备通信连接的云服务器,云服务器对语音信息进行分析处理,确定与语音信息对应的控制信息,以控制相应的设备执行控制信息所对应的操作。也就是说,远距离用户可以通过语音与支持远场交互功能的远场语音控制系统进行交互,从而实现相应的控制功能。这样有助于提高控制的便捷性。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (11)

1.一种远场语音控制设备,包括远场收音器件和语音分析器件;
所述远场收音器件接收用户发送的语音信息,将所述语音信息发送至语音分析器件;
所述语音分析器件对所述语音信息进行分析,确定所述语音信息中是否包含预设唤醒词,若包含所述预设唤醒词,将所述语音信息发送至与所述远场语音控制设备通信连接的云服务器。
2.根据权利要求1所述的远场语音控制设备,其中,所述远场语音控制设备还包括远场放音器件,所述远场放音器件播放从所述云服务器接收到的语音播放信息。
3.根据权利要求2所述的远场语音控制设备,其中,所述远场放音器件包括用于放大所述语音播放信息的功率的功率放大器。
4.根据权利要求1所述的远场语音控制设备,其中,在所述远场收音器件接收用户发送的语音信息之后,所述远场收音器件还对所述语音信息进行去噪处理。
5.根据权利要求1所述的远场语音控制设备,其中,所述远场语音控制设备还包括以下至少一种联网器件:无线局域网联网器件,蓝牙联网器件、红外联网器件,所述远场语音控制设备通过所述至少一种联网器件与所述云服务器和至少一台智能设备建立通信连接。
6.根据权利要求1-5之一所述的远场语音控制设备,其中,所述远场语音控制设备安装于接线盒内,所述接线盒的面板为触控面板,其中,所述触控面板设置有触控按键和/或指示灯。
7.一种远场语音控制系统,包括云服务器以及如权利要求1-5之一所述的远场语音控制设备,所述云服务器与所述远场语音控制设备通信连接。
8.根据权利要求7所述的远场语音控制系统,其中,所述云服务器接收所述远场语音控制设备发送的所述语音信息,对所述语音信息进行分析处理,确定与所述语音信息对应的控制信息,将包括所述控制信息的控制指令发送至所述远场语音控制设备。
9.根据权利要求8所述的远场语音控制系统,其中,当所述控制信息中包括语音播放信息时,所述远场语音控制设备的远场放音器件播放所述语音播放信息。
10.根据权利要求8或9所述的远场语音控制系统,其中,所述远场语音控制系统还包括至少一台智能设备,当所述控制信息中包括非语音播放信息时,所述远场语音控制设备从所述至少一台智能设备中确定执行与所述非语音播放信息对应的操作的智能设备作为目标智能设备,将所述非语音播放信息发送至所述目标智能设备,以使所述目标智能设备执行与所述非语音播放信息对应的操作。
11.根据权利要求10所述的远场语音控制系统,其中,
所述远场语音控制设备接收用户发送的语音信息,对所述语音信息进行分析,确定所述语音信息中是否包含预设唤醒词,若包含所述预设唤醒词,将所述语音信息发送至所述云服务器;
所述云服务器对所述语音信息进行分析处理,确定与所述语音信息对应的控制信息,将包括所述控制信息的控制指令发送至所述远场语音控制设备;
当所述控制信息中包括语音播放信息时,所述远场语音控制设备的远场放音器件播放所述语音播放信息;
当所述控制信息中包括非语音播放信息时,所述远场语音控制设备从所述至少一台智能设备中确定执行与所述非语音播放信息对应的操作的智能设备作为目标智能设备,将所述非语音播放信息发送至所述目标智能设备,以使所述目标智能设备执行与所述非语音播放信息对应的操作。
CN201810208870.6A 2018-03-14 2018-03-14 远场语音控制设备和远场语音控制系统 Pending CN108320749A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810208870.6A CN108320749A (zh) 2018-03-14 2018-03-14 远场语音控制设备和远场语音控制系统
JP2018223358A JP2019159306A (ja) 2018-03-14 2018-11-29 ファーフィールド音声制御デバイス及びファーフィールド音声制御システム
US16/295,881 US20190287523A1 (en) 2018-03-14 2019-03-07 Far-field voice control device and far-field voice control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810208870.6A CN108320749A (zh) 2018-03-14 2018-03-14 远场语音控制设备和远场语音控制系统

Publications (1)

Publication Number Publication Date
CN108320749A true CN108320749A (zh) 2018-07-24

Family

ID=62901935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810208870.6A Pending CN108320749A (zh) 2018-03-14 2018-03-14 远场语音控制设备和远场语音控制系统

Country Status (3)

Country Link
US (1) US20190287523A1 (zh)
JP (1) JP2019159306A (zh)
CN (1) CN108320749A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003609A (zh) * 2018-08-15 2018-12-14 珠海格力电器股份有限公司 语音设备、智能语音系统、设备控制方法及装置
CN109065048A (zh) * 2018-09-12 2018-12-21 深圳市卓翼科技股份有限公司 语音控制方法及装置
CN109192208A (zh) * 2018-09-30 2019-01-11 深圳创维-Rgb电子有限公司 一种电器设备的控制方法、系统、装置、设备及介质
CN109347710A (zh) * 2018-11-07 2019-02-15 四川长虹电器股份有限公司 一种实现全屋语音交互控制智能家居的系统及方法
CN109697987A (zh) * 2018-12-29 2019-04-30 苏州思必驰信息科技有限公司 一种外接式的远场语音交互装置及实现方法
CN109859757A (zh) * 2019-03-19 2019-06-07 百度在线网络技术(北京)有限公司 一种语音设备控制方法、装置和终端
CN109949821A (zh) * 2019-03-15 2019-06-28 慧言科技(天津)有限公司 一种利用cnn的u-net结构进行远场语音去混响的方法
CN110209429A (zh) * 2019-06-10 2019-09-06 百度在线网络技术(北京)有限公司 信息提取方法、装置及存储介质
CN110278205A (zh) * 2019-06-19 2019-09-24 百度在线网络技术(北京)有限公司 蓝牙音箱底座及其控制方法和系统
CN112185096A (zh) * 2020-09-22 2021-01-05 深圳创维-Rgb电子有限公司 语音遥控方法、装置、电子设备和存储介质
CN112203250A (zh) * 2020-11-04 2021-01-08 深圳市恒必达电子科技有限公司 监测坐姿的智能眼镜控制方法、装置、存储介质及系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102098152B1 (ko) * 2018-08-03 2020-04-07 박윤종 사운드를 이용한 맞춤 컨텐츠 제공 시스템 및 방법
CN112752193B (zh) * 2020-12-17 2022-11-25 江苏惠通集团有限责任公司 远场语音设备及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN105009204A (zh) * 2012-12-11 2015-10-28 亚马逊技术有限公司 语音识别功率管理
CN205281145U (zh) * 2016-01-15 2016-06-01 深圳市纳海电子有限公司 一种用于智能家居的控制装置
CN105793923A (zh) * 2013-09-20 2016-07-20 亚马逊技术股份有限公司 本地和远程语音处理
CN106155009A (zh) * 2014-11-14 2016-11-23 高雄第科技大学 智能家庭控制装置及方法
CN106653031A (zh) * 2016-10-17 2017-05-10 海信集团有限公司 语音唤醒方法及语音交互装置
CN107134286A (zh) * 2017-05-15 2017-09-05 深圳米唐科技有限公司 基于语音交互的无线音频播放方法、音乐播放器及存储介质
CN107622652A (zh) * 2016-07-15 2018-01-23 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9472205B2 (en) * 2013-05-06 2016-10-18 Honeywell International Inc. Device voice recognition systems and methods
JP6406957B2 (ja) * 2014-09-25 2018-10-17 シャープ株式会社 サーバ、サーバの制御方法、サーバの制御プログラム、および制御システム
US10331312B2 (en) * 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
JP6627537B2 (ja) * 2016-01-29 2020-01-08 株式会社富士通ゼネラル 空気調和機
JP2017163221A (ja) * 2016-03-07 2017-09-14 パナソニックIpマネジメント株式会社 機器情報管理システム
US10373612B2 (en) * 2016-03-21 2019-08-06 Amazon Technologies, Inc. Anchored speech detection and speech recognition
KR102307976B1 (ko) * 2016-05-10 2021-09-30 구글 엘엘씨 디바이스들 상의 보이스 어시스턴트에 대한 구현들
JP6660808B2 (ja) * 2016-05-13 2020-03-11 シャープ株式会社 音声出力制御装置、電子機器、および音声出力制御装置の制御方法
JP6543676B2 (ja) * 2017-11-01 2019-07-10 ソフトバンク株式会社 送信制御装置及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN105009204A (zh) * 2012-12-11 2015-10-28 亚马逊技术有限公司 语音识别功率管理
CN105793923A (zh) * 2013-09-20 2016-07-20 亚马逊技术股份有限公司 本地和远程语音处理
CN106155009A (zh) * 2014-11-14 2016-11-23 高雄第科技大学 智能家庭控制装置及方法
CN205281145U (zh) * 2016-01-15 2016-06-01 深圳市纳海电子有限公司 一种用于智能家居的控制装置
CN107622652A (zh) * 2016-07-15 2018-01-23 青岛海尔智能技术研发有限公司 家电系统的语音控制方法与家电控制系统
CN106653031A (zh) * 2016-10-17 2017-05-10 海信集团有限公司 语音唤醒方法及语音交互装置
CN107134286A (zh) * 2017-05-15 2017-09-05 深圳米唐科技有限公司 基于语音交互的无线音频播放方法、音乐播放器及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曾斌: "亚马逊后来居上 如何开发一款Echo智能音响?", 《HTTP://DY.163.COM/V2/ARTICLE/DETAIL/CECH2Q6505118IG5.HTML》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003609A (zh) * 2018-08-15 2018-12-14 珠海格力电器股份有限公司 语音设备、智能语音系统、设备控制方法及装置
CN109065048A (zh) * 2018-09-12 2018-12-21 深圳市卓翼科技股份有限公司 语音控制方法及装置
CN109192208A (zh) * 2018-09-30 2019-01-11 深圳创维-Rgb电子有限公司 一种电器设备的控制方法、系统、装置、设备及介质
CN109192208B (zh) * 2018-09-30 2021-07-30 深圳创维-Rgb电子有限公司 一种电器设备的控制方法、系统、装置、设备及介质
CN109347710A (zh) * 2018-11-07 2019-02-15 四川长虹电器股份有限公司 一种实现全屋语音交互控制智能家居的系统及方法
CN109697987A (zh) * 2018-12-29 2019-04-30 苏州思必驰信息科技有限公司 一种外接式的远场语音交互装置及实现方法
CN109949821A (zh) * 2019-03-15 2019-06-28 慧言科技(天津)有限公司 一种利用cnn的u-net结构进行远场语音去混响的方法
CN109949821B (zh) * 2019-03-15 2020-12-08 慧言科技(天津)有限公司 一种利用cnn的u-net结构进行远场语音去混响的方法
CN109859757A (zh) * 2019-03-19 2019-06-07 百度在线网络技术(北京)有限公司 一种语音设备控制方法、装置和终端
CN110209429A (zh) * 2019-06-10 2019-09-06 百度在线网络技术(北京)有限公司 信息提取方法、装置及存储介质
CN110278205A (zh) * 2019-06-19 2019-09-24 百度在线网络技术(北京)有限公司 蓝牙音箱底座及其控制方法和系统
US10950238B2 (en) 2019-06-19 2021-03-16 Baidu Online Network Technology (Beijing) Co., Ltd. Bluetooth speaker base, method and system for controlling thereof
CN112185096A (zh) * 2020-09-22 2021-01-05 深圳创维-Rgb电子有限公司 语音遥控方法、装置、电子设备和存储介质
CN112203250A (zh) * 2020-11-04 2021-01-08 深圳市恒必达电子科技有限公司 监测坐姿的智能眼镜控制方法、装置、存储介质及系统

Also Published As

Publication number Publication date
US20190287523A1 (en) 2019-09-19
JP2019159306A (ja) 2019-09-19

Similar Documents

Publication Publication Date Title
CN108320749A (zh) 远场语音控制设备和远场语音控制系统
CN108428452A (zh) 终端支架和远场语音交互系统
US20220392481A1 (en) Voice Wakeup Method and System, and Device
CN107464564B (zh) 语音交互方法、装置及设备
CN106910500B (zh) 对带麦克风阵列的设备进行语音控制的方法及设备
US20210409861A1 (en) Two-way wireless headphones
CN106898348B (zh) 一种出声设备的去混响控制方法和装置
WO2020143566A1 (en) Audio device and audio processing method
CN108681440A (zh) 一种智能设备音量控制方法及系统
CN108962240A (zh) 一种基于耳机的语音控制方法及系统
CN109949801A (zh) 一种基于耳机的智能家居设备语音控制方法及系统
CN105163236A (zh) 一种具有网关控制功能的智能音响系统
CN109672966A (zh) 一种语音拾取方法、装置和系统
CN206559550U (zh) 一种内置麦克风阵列的遥控器及电视系统
CN109379490B (zh) 音频播放方法、装置、电子设备及计算机可读介质
CN110225195B (zh) 一种语音通话方法及终端
CN114172757A (zh) 服务器、智能家居系统及多设备语音唤醒方法
CN111741404B (zh) 拾音设备、拾音系统和声音信号采集的方法
CN114727212A (zh) 音频的处理方法及电子设备
CN106409306A (zh) 一种获取人声的智能系统及基于该系统的获取方法
CN108449504B (zh) 语音通话数据检测方法、装置、存储介质及移动终端
CN101796799B (zh) 用于检测电话听筒的状态的方法和通信终端设备
CN109473096B (zh) 一种智能语音设备及其控制方法
CN111556394B (zh) 耳机
CN114745624A (zh) 无线耳机寻找方法、装置、耳机及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180724