CN106653008A - 一种语音控制方法、装置及系统 - Google Patents
一种语音控制方法、装置及系统 Download PDFInfo
- Publication number
- CN106653008A CN106653008A CN201510715912.1A CN201510715912A CN106653008A CN 106653008 A CN106653008 A CN 106653008A CN 201510715912 A CN201510715912 A CN 201510715912A CN 106653008 A CN106653008 A CN 106653008A
- Authority
- CN
- China
- Prior art keywords
- speech
- data
- smart machine
- voice
- control command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000002708 enhancing effect Effects 0.000 claims description 18
- 230000001143 conditioned effect Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000013481 data capture Methods 0.000 claims description 7
- 230000001360 synchronised effect Effects 0.000 claims description 7
- 230000001965 increasing effect Effects 0.000 claims description 4
- 238000005728 strengthening Methods 0.000 claims description 4
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000007726 management method Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002407 reforming Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明公开了一种语音控制方法、装置及系统,应用于同一网络中的多个智能设备,包括:至少一智能设备通过至少一语音接口接收用户语音,并获得从用户语音解析出的语音数据;所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令,其中,语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据,语音控制指令包括待操控智能设备名称以及操控命令;当所述智能设备识别出的语音控制指令的置信度高于预设阈值时,所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。本发明提供的语音控制方法、装置及系统,能够提高语音控制的准确性及便利性。
Description
技术领域
本发明涉及智能控制技术领域,尤其涉及一种语音控制方法、装置及系统。
背景技术
随着人们工作、居家、旅行等的便利需要和智能管控技术的发展,单位、家庭及个人拥有和管理的智能设备越来越多,人机交互的便利给智能设备带来的体验越来越符合人们生产生活的需要。智能设备的麦克风(MIC,Microphone)和扬声器(Speaker)如同人类的耳朵和嘴巴,用来听和说。人类除了眼睛之外与现实世界做互动用的最多的器官就是耳朵和嘴巴,也就是说大多数人通过嘴巴说和耳朵听来感知世界,这两种器官是人类社会认识自然,改造世界最基本的工具。对于现有的智能设备来说,大部分都已经具备了MIC和Speaker。虽然现有技术可以实现通过语音方式进行远程遥控,然而,现有方案在远距离语音操控方面的性能需要进一步提高。
发明内容
为了解决上述技术问题,本发明提供一种语音控制方法、装置及系统,能够提高语音控制的准确性及便利性。
为了达到上述技术目的,本发明提供一种语音控制方法,应用于同一网络中的多个智能设备,包括:至少一智能设备通过至少一语音接口接收用户语音,并获得从所述用户语音解析出的语音数据;所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令,其中,所述语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据,所述语音控制指令包括待操控智能设备名称以及操控命令;当所述智能设备识别出的语音控制指令的置信度高于预设阈值时,所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。
进一步地,当至少两个智能设备分别通过语音接口接收用户语音,并分别获得从用户语音解析出的语音数据时,所述至少两个智能设备分别通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令之后,还包括:当所述至少两个智能设备识别出的语音控制指令的置信度均小于所述预设阈值时,所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列,得到增强的语音,分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据,识别出增强语音控制指令,当其中一个增强语音控制指令的置信度高于所述预设阈值时,所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。
进一步地,所述满足预设条件的语音接口包括:接收到用户语音的语音接口,或者,接收到用户语音且数据相关性大于阈值的语音接口。
进一步地,所述智能设备通过至少一语音接口接收用户语音,并获得从所述用户语音解析出的语音数据,包括:
所述智能设备通过本地语音接口接收用户语音,并从所述用户语音解析得到语音数据;和/或,
所述智能设备通过远程语音接口接收用户语音,并从远程语音服务器接收从所述用户语音解析出的语音数据。
进一步地,该方法还包括:各智能设备通过智能管理终端加入所述网络,并从所述智能管理终端同步更新的语音信息列表。
进一步地,该方法还包括:各智能设备记录设备名称录音,解析所述设备名称录音得到相应的语音特征参数数据以及语义数据,存储所述设备名称录音、语音特征参数数据及语义数据至本地的语音信息列表,并将更新的语音信息列表同步给所述网络中的其他智能设备。
进一步地,所述语音特征参数数据包括设备名称语音特征参数数据以及语音操控特征参数数据。
本发明还提供一种语音控制装置,应用于智能设备,包括:至少一语音接口,用于接收用户语音;数据获取单元,用于获得从所述用户语音解析出的语音数据;语音识别单元,用于通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令,其中,所述语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据,所述语音控制指令包括待操控智能设备名称以及操控命令;指令驱动单元,用于当识别出的语音控制指令的置信度高于预设阈值时,根据所述语音控制指令控制待操控智能设备执行所述操控命令。
进一步地,所述语音接口包括本地语音接口和/或远程语音接口,所述数据获取单元包括数据解析单元和/或数据接收单元,其中,所述数据解析单元,用于从所述用户语音解析得到语音数据,所述数据接收单元,用于从远程语音服务器接收从所述用户语音解析出的语音数据。
本发明还提供一种语音控制系统,包括:至少两个如上所述的智能设备,其中,当所述至少两个智能设备识别出的语音控制指令的置信度均小于预设阈值时,所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列,得到增强的语音,分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据,识别出增强语音控制指令,当其中一个增强语音控制指令的置信度高于所述预设阈值时,所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。
进一步地,该系统还包括:智能管理终端,用于设置所述至少两个智能设备所在的网络,并向所述至少两个智能设备同步更新的语音信息列表。
本发明提供的语音控制方法,应用于同一网络中的多个智能设备,至少一智能设备通过至少一语音接口接收用户语音,并获得从所述用户语音解析出的语音数据;所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令,其中,所述语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据,所述语音控制指令包括待操控智能设备名称以及操控命令;当所述智能设备识别出的语音控制指令的置信度高于预设阈值时,所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。如此,通过智能设备语音接口识别置信度高于预设阈值的语音控制指令进行远程语音操控,提升了远距离语音操控智能设备的准确性和便利性。而且,本发明的实现简单且实用。
进一步地,在本发明中,各智能设备记录设备名称录音,解析所述设备名称录音得到相应的语音特征参数数据以及语义数据,存储所述设备名称录音、语音特征参数数据及语义数据至本地的语音信息列表,并将更新的语音信息列表同步给网络中的其他智能设备。如此,通过智能设备的语音接口配置管理网络中的智能设备名称实现智能设备的语音定位,进而实现基于该语音定位的智能设备语音操控。
进一步地,当至少两个智能设备识别出的语音控制指令的置信度均小于所述预设阈值时,所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列,得到增强的语音,分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据,识别出增强语音控制指令,当其中一个增强语音控制指令的置信度高于所述预设阈值时,所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。如此,通过多个智能设备语音接口进行远程语音操控智能设备,提升了远距离语音操控智能设备的准确性和便利性。
附图说明
图1为本发明实施例提供的语音控制方法的流程图;
图2为本发明一实施例提供的语音控制装置的示意图;
图3为本发明一实施例提供的语音控制系统的示意图;
图4为本发明实施例中智能设备加入语音管理网络的流程图;
图5为本发明实施例中智能设备的语音信息的配置流程图;
图6为本发明实施例中语音控制指令的驱动流程图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,应当理解,以下所说明的实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明实施例提供的语音控制方法的流程图。如图1所示,本实施例提供的语音控制方法,应用于同一网络中的多个智能设备,包括以下步骤:
步骤101:至少一智能设备通过至少一语音接口接收用户语音,并获得从所述用户语音解析出的语音数据。
具体而言,步骤101包括:
所述智能设备通过本地语音接口接收用户语音,并从所述用户语音解析得到语音数据;和/或,
所述智能设备通过远程语音接口接收用户语音,并从远程语音服务器接收从所述用户语音解析出的语音数据。
步骤102:所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令。
其中,所述语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据。其中,语音特征参数数据例如包括设备名称语音特征参数数据以及语音操控特征参数数据。于一实施例中,语音信息列表例如包括:所述网络中各智能设备的介质访问控制(MAC,Medium Access Control)地址数据包、设备类型数据包、设备名称录音数据包、设备名称语音特征参数数据包、语音操控特征参数数据包、语义解析数据包以及设备状态标志位。
其中,所述从用户语音解析出的语音数据例如包括:设备名称语音特征数据、语音操控特征数据以及语义解析数据。所述语音控制指令包括待操控智能设备名称以及操控命令。
于此,在用户语音记录、从用户语音解析出的语音数据以及语音信息列表的基础上,根据预设的语音网络算法,识别出具有一定置信度的语音控制指令。其中,置信度表示可信程度。举例而言,针对每个智能设备而言,通过现有的语音识别技术从用户语音中解析出语音参数或语义,根据预设算法比对得到的语音参数或语音与语音信息列表中的数据,确定其中置信度最高的数据组合得到语音控制指令。之后,通过所述置信度与预设阈值的比较,确定是否执行识别出的语音控制指令。
步骤103:当所述智能设备识别出的语音控制指令的置信度高于预设阈值时,所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。
具体而言,当所述智能设备识别出的语音控制指令的置信度高于预设阈值时,所述智能设备根据本地的语音信息列表确定该语音控制指令对应的待操控智能设备的地址,在与该待操控智能设备建立连接之后,发送所述语音控制指令至该待操控智能设备,通过所述语音控制指令控制该待操控智能设备执行操控命令。
进一步地,当至少两个智能设备分别通过语音接口接收用户语音,并分别获得从用户语音解析出的语音数据时,所述至少两个智能设备分别通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令之后,该方法还包括:
当所述至少两个智能设备识别出的语音控制指令的置信度均小于预设阈值时,所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列,得到增强的语音,分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据,识别出增强语音控制指令,当其中一个增强语音控制指令的置信度高于所述预设阈值时,所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。
其中,所述满足预设条件的语音接口包括:接收到用户语音的语音接口,或者,接收到用户语音且数据相关性大于阈值的语音接口。其中,所述语音接口为智能设备的本地麦克风或远程麦克风。
进一步地,该方法还包括:各智能设备通过智能管理终端加入所述网络,并从所述智能管理终端同步更新的语音信息列表。
进一步地,该方法还包括:各智能设备记录设备名称录音,解析所述设备名称录音得到相应的语音特征参数数据以及语义数据,存储所述设备名称录音、语音特征参数数据及语义数据至本地的语音信息列表,并将更新的语音信息列表同步给所述网络中的其他智能设备。
此外,本发明还提供一种语音控制装置,应用于智能设备,包括:至少一语音接口,用于接收用户语音;数据获取单元,用于获得从所述用户语音解析出的语音数据;语音识别单元,用于通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令,其中,所述语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据,所述语音控制指令包括待操控智能设备名称以及操控命令;指令驱动单元,用于当识别出的语音控制指令的置信度高于预设阈值时,根据所述语音控制指令控制待操控智能设备执行所述操控命令。
其中,所述语音接口包括本地语音接口和/或远程语音接口,所述数据获取单元包括数据解析单元和/或数据接收单元,其中,所述数据解析单元,用于从所述用户语音解析得到语音数据,所述数据接收单元,用于从远程语音服务器接收从所述用户语音解析出的语音数据。所述语音接口例如为麦克风。
图2为本发明一实施例提供的语音控制装置的示意图。如图2所示,本实施例提供的语音控制装置包括语音接口(如本地麦克风或远程麦克风)、数据获取单元、语音识别单元以及指令驱动单元。其中,所述数据获取单元包括数据解析单元和/或数据接收单元,所述数据解析单元用于从用户语音解析得到语音数据,例如由语音数据存储单元、语音特征解析单元以及语义解析单元组成。具体而言,语音数据存储单元,用于存储用户语音;语音特征解析单元,用于从存储的用户语音中解析出语音特征数据以及语音操控特征数据;语义解析单元,用于解析出语义。所述数据接收单元,用于从远程语音服务器接收从所述用户语音解析出的语音数据。然而,本发明对此并不限定。当采用远程语音接口接收用户语音时,数据解析单元例如设置在远程语音服务器,由远程语音服务器将从用户语音中解析出的语音数据发送给智能设备。
于实际应用中,数据解析单元以及语音识别单元例如为处理器等具有信息能力的元件,指令驱动单元例如为发射器等具有信息发送能力的元件,数据接收单元例如为接收器等具有信息接收能力的元件。然而,本发明对此并不限定。数据解析单元以及语音识别单元的功能例如通过处理器执行存储在存储器的程序/指令实现。
此外,本实施例还提供一种语音控制系统,包括至少两个如上所述的智能设备,其中,当所述至少两个智能设备识别出的语音控制指令的置信度均小于预设阈值时,所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列,得到增强的语音,分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据,识别出增强语音控制指令,当其中一个增强语音控制指令的置信度高于所述预设阈值时,所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。其中,所述语音接口包括本地麦克风和/或远程麦克风。
进一步地,该系统还包括智能管理终端,用于设置所述至少两个智能设备所在的网络,并向所述至少两个智能设备同步更新的语音信息列表。
图3为本发明一实施例提供的语音控制系统的示意图。如图3所示,本实施例提供的语音控制系统例如包括智能管理终端以及智能设备A~D。然而,本发明对于智能设备的数目并不限定,满足大于或等于二即可。其中,智能设备与智能管理终端之间以及智能设备之间例如通过无线或者有线方式连接。
以下对本发明实施例进行详细说明。
图4为本发明实施例中智能设备加入语音管理网络的流程图。如图4所示,本实施例中智能设备加入语音管理网络的过程包括以下步骤:
步骤401:启动智能管理终端的应用(APP,Application)进入管理系统待机主界面,点击智能管理终端应用的“添加设备”按钮,或者,发出语音“添加设备”,扫描智能设备外观的二维码,二维码例如包括设备类型数据、MAC地址数据以及智能设备自身无线保真(WIFI,WIreless-FIdelity)热点密码,如表1所示,智能管理终端自动加入智能设备自身WIFI,其中,智能设备加电启动没有连接WIFI网络时,起始均以WIFI热点存在;
表1智能设备外观的二维码包括内容
步骤402:智能管理终端APP显示所在范围内所有WIFI网络,选择智能设备需要加入的正式WIFI网络,将智能设备加入到所选的WIFI网络中,并获取该智能设备缺省的语音管理列表信息,其中,语音管理列表如表2所示:
表2语音管理列表
步骤403:智能管理终端的APP每加入一台智能设备,根据语音管理信息列表中的各智能设备的MAC地址,通过地址解析协议(ARP,AddressResolution Protocol)解析网络协议(IP,Internet Protocol)地址,建立传输控制协议(TCP,Transmission Control Protocol)/IP连接后,同步网络中所有的智能设备的语音信息列表。例如,将新增的智能设备信息同步给网络中所有的智能设备,以确定网络中每台智能设备的语音信息列表保持最新且相同。
图5为本发明实施例中智能设备的语音信息的配置流程图。如图5所示,本实施例中智能设备的语音信息的配置过程包括以下步骤:
步骤501:用户通过智能设备的本地MIC或者远程MIC进行录音;
步骤502:智能设备通过本地或者远程语音数据解析单元,进行录音记录(如存储“设备名称”录音记录)、进行特征值提取(如提取“设备名称”语音特征参数以及语音操控特征参数)以及进行语义解析(如解析设备名称),并将上述数据存储到本地语音信息列表中;
步骤503:智能设备通过网络同步所有在线的智能设备的本地语音信息列表。例如,将智能设备新增的语音配置信息同步给网络中所有的智能设备,以确定网络中每台智能设备的语音信息列表保持最新且相同。
图6为本发明实施例中语音控制指令的网络驱动流程图。为了进行更好地说明,先进行如下假设:在同一个网络环境,一个空间内,用户进行语音操控时,有至少一个智能设备的至少一个MIC会收到声音;其中,网络中通过语音配置的n个智能设备的名称为:Name1、Name2……Namen;智能设备所带的m个麦克风的名称为(m≥n,n为大于或等于1的整数):MIC1、MIC2……MICm,其中,智能设备与麦克风为一对一或者一对多的关系;CONF(MICi,Namej)代表智能设备网络中的第i个麦克风识别出呼叫第j个智能设备的置信度;VAD(MICi)>0表示智能设备网络中第i个麦克风有人说话;CORR(MICi,MICj)表示智能设备网络中第i个麦克风与第j个麦克风的数据相关性。
如图6所示,本实施例中语音控制指令的网络驱动过程包括以下步骤:
步骤601:用户通过语音发出智能设备控制指令,在同一空间的网络中的多个智能设备的MIC收到用户语音;
步骤602:收到用户语音的各个智能设备比对从用户语音解析出的数据及语音信息列表中的数据,当获取置信度超过预设阀值的语音控制指令时,识别出该语音控制指令的智能设备与该语音控制指令对应的待操控智能设备建立网络,驱动该待操控智能设备执行该语音控制指令携带的操控命令;例如,语音控制命令为客厅大灯开;
具体而言,当VAD(MICi)>0且CONF(MICi,Namej)>预设阈值P(P<1,例如0.8),此时说话人离智能设备麦克风i最近,且智能设备麦克风i识别出来的呼叫智能设备Namej可信,则智能设备Namei与智能设备Namej建立TCP/IP连接,驱动智能设备Namej的命令列表中的设备控制命令;
步骤603:当多个智能设备获取的语音控制指令的置信度均小于预设阀值时,则调动网络中所有存在语音输入的智能设备MIC形成一个MIC阵列,对声源进行定位,形成一个指向声源的波束,进而形成置信度高于预设阈值的语音控制指令驱动相应的智能设备操控;其中,所述多个智能设备中的任意一个可根据语音控制指令与待操控智能设备建立连接,进而控制待操控智能设备执行相应操控指令。然而,本发明对此并不限定。所述根据语音控制指令与待操控智能设备建立连接的智能设备例如为识别出高于预设阈值的置信度的语音控制指令的智能设备。
举例而言,当说话人没有特别靠近某个麦克风时,智能设备通过用户数据报协议(UDP,User Datagram Protocol)广播把所有VAD(MICi)>0且VAD(MICj)>0且CORR(MICi,MICj)>阈值C(C<1,例如0.5)的麦克风自动组成一个麦克风阵列,对声源进行定位,并形成一个指向声源的波束,增强采集语音,提高识别率,波束形成后的增强语音作为语音识别的输入,进而识别出增强语音控制指令。
综上所述,在本发明实施例中,通过智能设备的语音接口来配置管理网络中的智能设备名称实现智能设备的语音定位,并且通过多个智能设备的语音接口进行远程语音操控智能设备,从而提升远距离语音操控智能设备的准确性和便利性。而且,本发明方案实现简单且实用。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (11)
1.一种语音控制方法,应用于同一网络中的多个智能设备,其特征在于,包括:
至少一智能设备通过至少一语音接口接收用户语音,并获得从所述用户语音解析出的语音数据;
所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令,其中,所述语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据,所述语音控制指令包括待操控智能设备名称以及操控命令;
当所述智能设备识别出的语音控制指令的置信度高于预设阈值时,所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。
2.如权利要求1所述的方法,其特征在于,当至少两个智能设备分别通过语音接口接收用户语音,并分别获得从用户语音解析出的语音数据时,所述至少两个智能设备分别通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令之后,还包括:当所述至少两个智能设备识别出的语音控制指令的置信度均小于所述预设阈值时,所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列,得到增强的语音,分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据,识别出增强语音控制指令,当其中一个增强语音控制指令的置信度高于所述预设阈值时,所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。
3.如权利要求2所述的方法,其特征在于,所述满足预设条件的语音接口包括:接收到用户语音的语音接口,或者,接收到用户语音且数据相关性大于阈值的语音接口。
4.如权利要求1或2所述的方法,其特征在于,所述智能设备通过至少一语音接口接收用户语音,并获得从所述用户语音解析出的语音数据,包括:
所述智能设备通过本地语音接口接收用户语音,并从所述用户语音解析得到语音数据;和/或,
所述智能设备通过远程语音接口接收用户语音,并从远程语音服务器接收从所述用户语音解析出的语音数据。
5.如权利要求1所述的方法,其特征在于,还包括:各智能设备通过智能管理终端加入所述网络,并从所述智能管理终端同步更新的语音信息列表。
6.如权利要求1所述的方法,其特征在于,还包括:各智能设备记录设备名称录音,解析所述设备名称录音得到相应的语音特征参数数据以及语义数据,存储所述设备名称录音、语音特征参数数据及语义数据至本地的语音信息列表,并将更新的语音信息列表同步给所述网络中的其他智能设备。
7.如权利要求1、2或6所述的方法,其特征在于,所述语音特征参数数据包括设备名称语音特征参数数据以及语音操控特征参数数据。
8.一种语音控制装置,应用于智能设备,其特征在于,包括:
至少一语音接口,用于接收用户语音;
数据获取单元,用于获得从所述用户语音解析出的语音数据;
语音识别单元,用于通过比对所述语音数据与本地存储的语音信息列表中的数据,识别出语音控制指令,其中,所述语音信息列表至少包括:所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据,所述语音控制指令包括待操控智能设备名称以及操控命令;
指令驱动单元,用于当识别出的语音控制指令的置信度高于预设阈值时,根据所述语音控制指令控制待操控智能设备执行所述操控命令。
9.如权利要求8所述的装置,其特征在于,所述语音接口包括本地语音接口和/或远程语音接口,所述数据获取单元包括数据解析单元和/或数据接收单元,其中,所述数据解析单元,用于从所述用户语音解析得到语音数据,所述数据接收单元,用于从远程语音服务器接收从所述用户语音解析出的语音数据。
10.一种语音控制系统,其特征在于,包括:至少两个如权利要求8至9任一项所述的智能设备,其中,当所述至少两个智能设备识别出的语音控制指令的置信度均小于预设阈值时,所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列,得到增强的语音,分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据,识别出增强语音控制指令,当其中一个增强语音控制指令的置信度高于所述预设阈值时,所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。
11.如权利要求10所述的系统,其特征在于,还包括:智能管理终端,用于设置所述至少两个智能设备所在的网络,并向所述至少两个智能设备同步更新的语音信息列表。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510715912.1A CN106653008B (zh) | 2015-10-28 | 2015-10-28 | 一种语音控制方法、装置及系统 |
PCT/CN2016/103785 WO2017071645A1 (zh) | 2015-10-28 | 2016-10-28 | 语音控制方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510715912.1A CN106653008B (zh) | 2015-10-28 | 2015-10-28 | 一种语音控制方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106653008A true CN106653008A (zh) | 2017-05-10 |
CN106653008B CN106653008B (zh) | 2021-02-02 |
Family
ID=58629910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510715912.1A Active CN106653008B (zh) | 2015-10-28 | 2015-10-28 | 一种语音控制方法、装置及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106653008B (zh) |
WO (1) | WO2017071645A1 (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107564518A (zh) * | 2017-08-21 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 智能设备控制方法、装置及计算机设备 |
CN107577151A (zh) * | 2017-08-25 | 2018-01-12 | 谢锋 | 一种语音识别的方法、装置、设备和存储介质 |
CN107766482A (zh) * | 2017-10-13 | 2018-03-06 | 北京猎户星空科技有限公司 | 信息推送及发送方法、装置、电子设备、存储介质 |
CN107908116A (zh) * | 2017-10-20 | 2018-04-13 | 深圳市艾特智能科技有限公司 | 语音控制方法、智能家居系统、存储介质和计算机设备 |
CN108170034A (zh) * | 2017-12-29 | 2018-06-15 | 上海器魂智能科技有限公司 | 智能设备控制方法、装置、计算机设备和储存介质 |
CN108183844A (zh) * | 2018-02-06 | 2018-06-19 | 四川虹美智能科技有限公司 | 一种智能家电语音控制方法、装置及系统 |
CN108630201A (zh) * | 2018-03-07 | 2018-10-09 | 北京墨丘科技有限公司 | 一种用于建立设备关联的方法和装置 |
CN109978170A (zh) * | 2019-03-05 | 2019-07-05 | 浙江邦盛科技有限公司 | 一种基于多要素的移动设备识别方法 |
TWI673673B (zh) * | 2018-01-05 | 2019-10-01 | 華南商業銀行股份有限公司 | 智能語音交易系統 |
WO2019184406A1 (en) * | 2018-03-26 | 2019-10-03 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
CN113012699A (zh) * | 2021-05-07 | 2021-06-22 | 宇博科创(深圳)科技有限公司 | 基于离线语音的红外线遥控开关方法及系统 |
CN114678022A (zh) * | 2022-03-25 | 2022-06-28 | 青岛海尔科技有限公司 | 终端设备的语音控制方法和装置、存储介质及电子设备 |
CN116095254A (zh) * | 2022-05-30 | 2023-05-09 | 荣耀终端有限公司 | 音频处理方法和装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019061382A1 (zh) * | 2017-09-30 | 2019-04-04 | 陈银芳 | 基于智能音箱的家电语音控制方法及相关产品 |
CN109658937A (zh) * | 2017-10-10 | 2019-04-19 | 苏州宝时得电动工具有限公司 | 智能割草机的语音控制方法、装置、系统和智能割草机 |
CN111739533A (zh) * | 2020-07-28 | 2020-10-02 | 睿住科技有限公司 | 语音控制系统、方法与装置以及存储介质、语音设备 |
CN111782992B (zh) * | 2020-09-04 | 2021-01-12 | 北京维数统计事务所有限公司 | 显示控制方法、装置、设备及可读存储介质 |
CN112331212A (zh) * | 2020-10-27 | 2021-02-05 | 合肥飞尔智能科技有限公司 | 一种智能设备语音控制系统及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1670823A (zh) * | 2004-03-17 | 2005-09-21 | 哈曼贝克自动系统股份有限公司 | 通过麦克风阵列检测和降低噪声的方法 |
US20060047513A1 (en) * | 2004-09-02 | 2006-03-02 | Inventec Multimedia & Telecom Corporation | Voice-activated remote control system and method |
US20060229881A1 (en) * | 2005-04-11 | 2006-10-12 | Global Target Enterprise Inc. | Voice recognition gateway apparatus |
US7885816B2 (en) * | 2003-12-08 | 2011-02-08 | International Business Machines Corporation | Efficient presentation of correction options in a speech interface based upon user selection probability |
CN102255780A (zh) * | 2010-05-20 | 2011-11-23 | 株式会社曙飞电子 | 家庭网络系统及其控制方法 |
CN102760432A (zh) * | 2012-07-06 | 2012-10-31 | 广东美的制冷设备有限公司 | 一种家电用声控遥控器及其控制方法 |
CN102855872A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的家电控制方法及系统 |
CN103700368A (zh) * | 2014-01-13 | 2014-04-02 | 联想(北京)有限公司 | 用于语音识别的方法、语音识别装置和电子设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1307231A (zh) * | 2000-02-02 | 2001-08-08 | 邦毅科技股份有限公司 | 用以操控设备的集中式语音识别遥控方法及系统 |
TW200912731A (en) * | 2007-09-07 | 2009-03-16 | Compal Communications Inc | Voice control system and method |
CN101599270A (zh) * | 2008-06-02 | 2009-12-09 | 海尔集团公司 | 语音服务器及语音控制的方法 |
US9978260B2 (en) * | 2012-12-18 | 2018-05-22 | Samsung Electronics Co., Ltd. | Method and apparatus for controlling a home device remotely in a home network system |
-
2015
- 2015-10-28 CN CN201510715912.1A patent/CN106653008B/zh active Active
-
2016
- 2016-10-28 WO PCT/CN2016/103785 patent/WO2017071645A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7885816B2 (en) * | 2003-12-08 | 2011-02-08 | International Business Machines Corporation | Efficient presentation of correction options in a speech interface based upon user selection probability |
CN1670823A (zh) * | 2004-03-17 | 2005-09-21 | 哈曼贝克自动系统股份有限公司 | 通过麦克风阵列检测和降低噪声的方法 |
US20060047513A1 (en) * | 2004-09-02 | 2006-03-02 | Inventec Multimedia & Telecom Corporation | Voice-activated remote control system and method |
US20060229881A1 (en) * | 2005-04-11 | 2006-10-12 | Global Target Enterprise Inc. | Voice recognition gateway apparatus |
CN102255780A (zh) * | 2010-05-20 | 2011-11-23 | 株式会社曙飞电子 | 家庭网络系统及其控制方法 |
CN102760432A (zh) * | 2012-07-06 | 2012-10-31 | 广东美的制冷设备有限公司 | 一种家电用声控遥控器及其控制方法 |
CN102855872A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于终端及互联网语音交互的家电控制方法及系统 |
CN103700368A (zh) * | 2014-01-13 | 2014-04-02 | 联想(北京)有限公司 | 用于语音识别的方法、语音识别装置和电子设备 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107564518A (zh) * | 2017-08-21 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 智能设备控制方法、装置及计算机设备 |
CN107564518B (zh) * | 2017-08-21 | 2021-10-22 | 百度在线网络技术(北京)有限公司 | 智能设备控制方法、装置及计算机设备 |
CN107577151A (zh) * | 2017-08-25 | 2018-01-12 | 谢锋 | 一种语音识别的方法、装置、设备和存储介质 |
CN107766482A (zh) * | 2017-10-13 | 2018-03-06 | 北京猎户星空科技有限公司 | 信息推送及发送方法、装置、电子设备、存储介质 |
CN107908116A (zh) * | 2017-10-20 | 2018-04-13 | 深圳市艾特智能科技有限公司 | 语音控制方法、智能家居系统、存储介质和计算机设备 |
CN108170034A (zh) * | 2017-12-29 | 2018-06-15 | 上海器魂智能科技有限公司 | 智能设备控制方法、装置、计算机设备和储存介质 |
TWI673673B (zh) * | 2018-01-05 | 2019-10-01 | 華南商業銀行股份有限公司 | 智能語音交易系統 |
CN108183844A (zh) * | 2018-02-06 | 2018-06-19 | 四川虹美智能科技有限公司 | 一种智能家电语音控制方法、装置及系统 |
CN108183844B (zh) * | 2018-02-06 | 2020-09-08 | 四川虹美智能科技有限公司 | 一种智能家电语音控制方法、装置及系统 |
CN108630201B (zh) * | 2018-03-07 | 2020-09-29 | 北京墨丘科技有限公司 | 一种用于建立设备关联的方法和装置 |
CN108630201A (zh) * | 2018-03-07 | 2018-10-09 | 北京墨丘科技有限公司 | 一种用于建立设备关联的方法和装置 |
WO2019184406A1 (en) * | 2018-03-26 | 2019-10-03 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
US10755706B2 (en) | 2018-03-26 | 2020-08-25 | Midea Group Co., Ltd. | Voice-based user interface with dynamically switchable endpoints |
CN109978170A (zh) * | 2019-03-05 | 2019-07-05 | 浙江邦盛科技有限公司 | 一种基于多要素的移动设备识别方法 |
CN109978170B (zh) * | 2019-03-05 | 2020-04-28 | 浙江邦盛科技有限公司 | 一种基于多要素的移动设备识别方法 |
CN113012699A (zh) * | 2021-05-07 | 2021-06-22 | 宇博科创(深圳)科技有限公司 | 基于离线语音的红外线遥控开关方法及系统 |
CN113012699B (zh) * | 2021-05-07 | 2024-01-23 | 宇博科创(深圳)科技有限公司 | 基于离线语音的红外线遥控开关方法及系统 |
CN114678022A (zh) * | 2022-03-25 | 2022-06-28 | 青岛海尔科技有限公司 | 终端设备的语音控制方法和装置、存储介质及电子设备 |
CN116095254A (zh) * | 2022-05-30 | 2023-05-09 | 荣耀终端有限公司 | 音频处理方法和装置 |
CN116095254B (zh) * | 2022-05-30 | 2023-10-20 | 荣耀终端有限公司 | 音频处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2017071645A1 (zh) | 2017-05-04 |
CN106653008B (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106653008A (zh) | 一种语音控制方法、装置及系统 | |
CN107454508B (zh) | 麦克风阵列的电视机及电视系统 | |
CN102842306B (zh) | 语音控制方法及装置、语音响应方法及装置 | |
CN107862060B (zh) | 一种追踪目标人的语义识别装置及识别方法 | |
US20220317641A1 (en) | Device control method, conflict processing method, corresponding apparatus and electronic device | |
CN110223690A (zh) | 基于图像与语音融合的人机交互方法及装置 | |
CN110049270A (zh) | 多人会议语音转写方法、装置、系统、设备及存储介质 | |
CN107564510A (zh) | 一种语音虚拟角色管理方法、装置、服务器和存储介质 | |
CN108182944A (zh) | 控制智能终端的方法、装置及智能终端 | |
CN109378006B (zh) | 一种跨设备声纹识别方法及系统 | |
CN109949801A (zh) | 一种基于耳机的智能家居设备语音控制方法及系统 | |
CN107644638A (zh) | 语音识别方法、装置、终端和计算机可读存储介质 | |
JP2020034895A (ja) | 応答方法及び装置 | |
CN108335695A (zh) | 语音控制方法、装置、计算机设备和存储介质 | |
CN205508398U (zh) | 具有云端交互功能的智能机器人 | |
CN107655154A (zh) | 终端控制方法、空调器及计算机可读存储介质 | |
CN109377992A (zh) | 基于无线通信的全空间语音交互物联网控制系统及方法 | |
CN107845381A (zh) | 一种机器人语义处理的方法及系统 | |
CN110956965A (zh) | 一种基于声纹识别的个性化智能家居安全控制系统及方法 | |
CN107729433A (zh) | 一种音频处理方法及设备 | |
CN107205097A (zh) | 移动终端查找方法、装置以及计算机可读存储介质 | |
CN107277276A (zh) | 一种具备语音控制功能智能手机 | |
CN107863106A (zh) | 语音识别控制方法及装置 | |
CN101211615A (zh) | 一种对特定人的语音进行自动录制的方法、系统及设备 | |
CN206057845U (zh) | 智能终端、智能家居系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |