CN109243448A - 一种语音控制方法及装置 - Google Patents
一种语音控制方法及装置 Download PDFInfo
- Publication number
- CN109243448A CN109243448A CN201811201041.1A CN201811201041A CN109243448A CN 109243448 A CN109243448 A CN 109243448A CN 201811201041 A CN201811201041 A CN 201811201041A CN 109243448 A CN109243448 A CN 109243448A
- Authority
- CN
- China
- Prior art keywords
- equipment
- voice
- target
- voice control
- data information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012545 processing Methods 0.000 claims description 10
- 238000003708 edge detection Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明公开了一种语音控制方法及装置。所述方法包括:语音控制设备获取待控制的目标设备的标识,并接收用户发送的第一语音控制指令,然后可以根据预设的第一语音数据库,识别第一语音控制指令对应的目标操作,并根据目标操作对目标设备进行控制。如此,语音控制设备可以先确定待控制的设备,然后在识别该设备对应的操作指令,分步地实现语音控制,相比于现有技术中的语音控制方法而言,对于同样的操作指令,语音数据库只需要存储一种语音数据信息就可以实现对多个不同的设备进行控制的目的,从而能够有效减小语音数据库占用的内存,提高语音系统的加载速度,进而提高识别的速率。
Description
技术领域
本发明涉及家电技术领域,尤其涉及一种语音控制方法及装置。
背景技术
随着电子设备的智能化发展,语音控制技术也逐渐进入了人们的生活。以电视机、空调、音箱等家用电器为例,目前常用的语音控制方式是基于一个服务器控制多个家电的语音控制系统,不同的家电对应不同的语音控制指令。
随着家电数量的增多,就需要更多的语音数据信息来识别不同的语音控制指令。比如,“打开电视机”和“打开空调”就属于两条不同的语音控制指令,在对此进行识别时,就需要两个语音数据信息来进行识别。这就容易导致语音数据库占用的内存不断增大,进而造成语音系统加载缓慢,识别速率降低的问题。
基于此,目前亟需一种语音控制方法,用于解决现有技术中语音数据库占用的内存不断增大导致语音系统加载缓慢,识别速率降低的问题。
发明内容
本发明实施例提供一种语音控制方法及装置,以解决现有技术中语音数据库占用的内存不断增大导致语音系统加载缓慢,识别速率降低的技术问题。
本发明实施例提供一种语音控制方法,所述方法包括:
语音控制设备获取待控制的目标设备的标识;
所述语音控制设备接收用户发送的第一语音控制指令;
所述语音控制设备根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
采用这种方法,语音控制设备可以先确定待控制的设备,然后在识别该设备对应的操作指令,分步地实现语音控制,相比于现有技术中的语音控制方法而言,对于同样的操作指令,语音数据库只需要存储一种语音数据信息就可以实现对多个不同的设备进行控制的目的,从而能够有效减小语音数据库占用的内存,提高语音系统的加载速度,进而提高识别的速率。
在一种可能的实现方式中,所述语音控制设备获取待控制的目标设备的标识,包括:
所述语音控制设备接收图像获取设备发送的所述目标设备的标识;所述目标设备的标识是所述图像获取设备根据拍摄到的所述目标设备的图像信息确定的。
在一种可能的实现方式中,所述语音控制设备获取待控制的目标设备的标识,包括:
所述语音控制设备接收用户发送的第二语音控制指令;
所述语音控制设备根据预设的第二语音数据库,识别所述第二语音控制指令对应的所述目标设备的名称;所述第二语音数据库记录的语音数据信息为设备名称的语音数据信息;
所述语音控制设备根据所述目标设备的名称,以及预先存储的设备的名称和设备的标识的对应关系,确定所述目标设备的标识。
在一种可能的实现方式中,所述语音控制设备根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,包括:
所述语音控制设备从所述第一语音数据库中确定与所述目标设备的标识对应的操作指令的语音数据信息;
所述语音控制设备根据所述目标设备的标识对应的操作指令的语音数据信息,识别所述第一语音控制指令对应的所述目标操作。
本发明实施例提供一种语音控制方法,所述方法包括:
图像获取设备拍摄待控制的目标设备的图像信息;
所述图像获取设备根据所述目标设备的图像信息,确定所述目标设备的标识;
所述图像获取设备将所述目标设备的标识发送给语音控制设备,以使所述语音控制设备在接收到用户发送的第一语音控制指令后,根据预设的第一语音数据库,识别所述语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
采用图像获取设备确定目标设备的方式,无需人为地输入目标设备的标识,减少了用户的操作负担,执行效率高且智能高效。
在一种可能的实现方式中,所述图像获取设备根据所述目标设备的图像信息,确定所述目标设备的标识,包括:
所述图像获取设备采用边缘检测的方式对所述目标设备的图像信息进行识别,确定所述目标设备的轮廓;
所述语音控制设备根据所述目标设备的轮廓,确定所述目标设备的设备类型;
所述语音控制设备根据所述目标设备的设备类型,以及预先存储的设备类型与设备标识的对应关系,确定所述目标设备的标识。
本发明实施例提供一种语音控制装置,所述装置为语音控制设备,所述装置包括:
获取单元,用于获取待控制的目标设备的标识;
接收单元,用于接收用户发送的第一语音控制指令;
控制单元,用于根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
在一种可能的实现方式中,所述获取单元具体用于:
接收图像获取设备发送的所述目标设备的标识;所述目标设备的标识是所述图像获取设备根据拍摄到的所述目标设备的图像信息确定的。
在一种可能的实现方式中,所述获取单元具体用于:
接收用户发送的第二语音控制指令;并根据预设的第二语音数据库,识别所述第二语音控制指令对应的所述目标设备的名称;所述第二语音数据库记录的语音数据信息为设备名称的语音数据信息;以及根据所述目标设备的名称,以及预先存储的设备的名称和设备的标识的对应关系,确定所述目标设备的标识。
在一种可能的实现方式中,所述控制单元具体用于:
从所述第一语音数据库中确定与所述目标设备的标识对应的操作指令的语音数据信息;以及根据所述目标设备的标识对应的操作指令的语音数据信息,识别所述第一语音控制指令对应的所述目标操作。
本发明实施例提供一种语音控制装置,所述装置为图像获取设备,所述装置包括:
拍摄单元,用于拍摄待控制的目标设备的图像信息;
处理单元,用于根据所述目标设备的图像信息,确定所述目标设备的标识;
发送单元,用于将所述目标设备的标识发送给语音控制设备,以使所述语音控制设备在接收到用户发送的第一语音控制指令后,根据预设的第一语音数据库,识别所述语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
在一种可能的实现方式中,所述处理单元具体用于:
采用边缘检测的方式对所述目标设备的图像信息进行识别,确定所述目标设备的轮廓;并根据所述目标设备的轮廓,确定所述目标设备的设备类型;以及根据所述目标设备的设备类型,以及预先存储的设备类型与设备标识的对应关系,确定所述目标设备的标识。
本申请实施例的还提供一种装置,该装置可以为语音控制设备或图像获取设备,该装置具有实现上文所描述的语音控制方法的功能。该功能可以通过硬件执行相应的软件实现,在一种可能的设计中,该装置包括:处理器、收发器、存储器;该存储器用于存储计算机执行指令,该收发器用于实现该装置与其他通信实体进行通信,该处理器与该存储器通过该总线连接,当该装置运行时,该处理器执行该存储器存储的该计算机执行指令,以使该装置执行上文所描述的语音控制方法。
本发明实施例还提供一种计算机存储介质,所述存储介质中存储软件程序,该软件程序在被一个或多个处理器读取并执行时实现上述各种可能的实现方式中所描述的语音控制方法。
本发明实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种可能的实现方式中所描述的语音控制方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例适用的一种系统架构图;
图2为本发明实施例提供的一种语音控制方法所对应的流程示意图;
图3为本发明实施例提供的一种语音控制装置的结构示意图;
图4为本发明实施例适用的另一种系统架构图;
图5为本发明实施例提供的另一种语音控制方法所对应的流程示意图;
图6为本发明实施例提供的另一种语音控制装置的结构示意图;
图7为本发明实施例提供的又一种语音控制装置的结构示意图。
具体实施方式
下面结合说明书附图对本申请进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例中。
实施例一
图1示例性示出了本发明实施例适用的一种系统架构图。如图1所示,该系统100包括语音控制设备101、语音数据库102、至少一个待控制设备(如图1中示出的待控制设备1031、待控制设备1032、待控制设备1033)。其中,语音控制设备101可以通过网络从语音数据库102中获取信息;语音控制设备101也可以通过网络对待控制设备1031、待控制设备1032、待控制设备1033中任一设备进行控制。
具体地,如图1所示,语音控制设备101可以包括语音采集模块1011、语音识别模块1012和语音控制模块1013。其中,语音采集模块1011可以用于接收用户发送的语音控制指令,语音识别模块1012可以用于识别语音控制指令,语音控制模块1013可以用于根据识别出的操作对待控制设备进行控制。
本发明实施例中,语音数据库102可以为设置于单独的服务器设备中,或者也可以设置于语音控制设备101中,具体不做限定。
本发明实施例中,待控制设备可以为多种类型的设备,比如,可以为智能电视、智能冰箱、智能空调等设备,具体不做限定。
基于图1所示的系统架构,图2示例性示出了本发明实施例提供的一种语音控制方法所对应的流程示意图。如图2所示,该方法可以由图1中示出的语音控制设备101执行,具体包括如下步骤:
步骤201,语音控制设备获取待控制的目标设备的标识。
步骤202,语音控制设备接收用户发送的第一语音控制指令。
步骤203,语音控制设备根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制。
采用这种方法,语音控制设备可以先确定待控制的设备,然后在识别该设备对应的操作指令,分步地实现语音控制。相比于现有技术中的语音控制方法而言,对于同样的操作指令,语音数据库只需要存储一种语音数据信息就可以实现对多个不同的设备进行控制的目的,比如,现有技术中若需要执行打开电视机和打开空调的操作,需要用户提供两条不同的语音控制指令,即“打开电视机”和“打开空调”,进而,在语音数据库中也需要存储这两个不同的语音控制指令对应的语音数据信息。而采用本发明实施例提供的方法,由于语音控制设备事先确定了待控制的目标设备,比如已确定待控制的目标设备为电视机,那么,用户只需要说“打开”,即可实现打开电视机的操作,相应地,语音数据库中所存储的语音数据信息的量也减少了。如此,能够有效减小语音数据库占用的内存,提高语音系统的加载速度,进而提高识别的速率。
具体来说,步骤201中,语音控制设备获取目标设备的标识的方法有多种,一个示例中,语音控制设备可以通过接收用户发送的第二语音控制指令,并根据预设的第二语音数据库,识别第二语音控制指令对应的目标设备的名称,进而,可以根据目标设备的名称,以及预先存储的设备的名称和设备的标识的对应关系,确定目标设备的标识。其中,预先存储的设备的名称和设备的标识的对应关系可以是存储在图1中示出的语音控制设备101的本地,或者也可以是存储在图1中示出的语音数据库102中,具体不做限定。
举个例子,用户发送的第二语音控制指令可以为“电视机”,语音控制设备在接收到这样一条第二语音控制指令之后,可以根据预设的第二语音数据库,识别出目标设备的名称为电视机,进而可以确定目标设备的标识。
需要说明的是,第二语音指令可以为仅包括目标设备的名称的语音指令,比如,第二语音指令可以为“电视机”、“冰箱”、“空调”等;或者,第二语音指令也可以为包括目标设备的名称和设备的相关内容的语音指令,其中,设备的相关内容可以为设备的地点、设备的型号、设备的品牌等,比如,第二语音指令可以为“客厅里的电视机”、“冰箱XXX”、“格力空调”等,具体不做限定。
在其它可能的示例中,语音控制设备可以通过用户输入的方式来确定目标设备的标识,比如,用户可以直接在语音控制设备中输入目标设备的名称,进而,可以根据预先存储的设备的名称和设备的标识的对应关系,确定目标设备的标识;或者,语音控制设备也可以从其它设备中获取目标设备的标识,比如,其它设备可以先确定出目标设备的标识,然后再将目标设备的标识发送给语音控制设备,具体不做限定。
步骤202中,在语音控制设备根据步骤201中的内容,确定出待控制的目标设备的标识之后,用户所发送的第一语音控制指令可以仅包括操作指令,比如“打开”、“关闭”、“增大音量”、“减小音量”、“查找XXX”等;或者,用户所发送的第一语音控制指令也可以包括操作指令和其它相关内容,具体不做限定。
步骤203中,第一语音数据库中记录的语音数据信息可以为操作指令的语音数据信息,如表1所示,为第一语音数据库中记录的语音数据信息的一种示例。即,第一语音数据库中可以包括各待控制设备的操作指令,比如,表1中示出的“增大音量”、“减小音量”可以适用于对电视机、音响等设备进行控制,表1中示出的“提高温度”可以适用于对空调、电冰箱等设备进行控制。
表1:第一语音数据库中记录的语音数据信息的一种示例
编号 | 语音数据信息 |
1 | 打开 |
2 | 关闭 |
3 | 增大音量 |
4 | 减小音量 |
5 | 提高温度 |
…… | …… |
进一步地,考虑到不同的待控制设备对应的语音数据信息可能存在不同,比如,表1中示出的“增大音量”、“减小音量”可能并不适用于空调、电冰箱等设备。因此,如表2所示,第一语音数据库中记录的语音数据信息的另一种示例。其中,电视机的标识为A,对应的语音数据信息可以包括“打开”、“关闭”、“增大音量”、“减小音量”、“调台”等;空调的标识为B,对应的语音数据信息可以包括“打开”、“关闭”、“提高温度”、“降低温度”、“提高风速”、“降低风速”、“转换模式”等;电灯的标识为C,对应的语音数据信息可以包括“打开”、“关闭”、“提高亮度”、“降低亮度”等。
表2:第一语音数据库中记录的语音数据信息的另一种示例
以表2示出的第一语音数据库为例,语音控制设备可以从表2示出的第一语音数据库中确定与目标设备的标识对应的操作指令的语音数据信息,进而,可以根据目标设备的标识对应的操作指令的语音数据信息,识别第一语音控制指令对应的目标操作。
举个例子,语音控制设备获取到的目标设备的标识为“A”,则语音控制设备在接收到用户发送的第一语音控制指令后,以表2示出的第一语音数据库为例,语音控制设备可以从表2确定出与设备标识“A”对应的语音数据信息,即包括“打开”、“关闭”、“增大音量”、“减小音量”、“调台”。进一步地,语音控制设备可以根据“打开”、“关闭”、“增大音量”、“减小音量”、“调台”这五个语音数据信息对第一语音控制指令进行识别。
基于同样的发明构思,图3示例性示出了本发明实施例提供的一种语音控制装置的结构示意图,如图3所示,该装置可以为图1中示出的语音控制设备101,该装置包括获取单元301、接收单元302、控制单元303;其中,
获取单元301,用于获取待控制的目标设备的标识;
接收单元302,用于接收用户发送的第一语音控制指令;
控制单元303,用于根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
在一种可能的实现方式中,所述获取单元301具体用于:
接收用户发送的第二语音控制指令;并根据预设的第二语音数据库,识别所述第二语音控制指令对应的所述目标设备的名称;所述第二语音数据库记录的语音数据信息为设备名称的语音数据信息;以及根据所述目标设备的名称,以及预先存储的设备的名称和设备的标识的对应关系,确定所述目标设备的标识。
在一种可能的实现方式中,所述控制单元303具体用于:
从所述第一语音数据库中确定与所述目标设备的标识对应的操作指令的语音数据信息;以及根据所述目标设备的标识对应的操作指令的语音数据信息,识别所述第一语音控制指令对应的所述目标操作。
本申请实施例的还提供一种装置,该装置可以为语音控制设备,该装置具有实现上文所描述的语音控制方法的功能。该功能可以通过硬件执行相应的软件实现,在一种可能的设计中,该装置包括:处理器、收发器、存储器;该存储器用于存储计算机执行指令,该收发器用于实现该装置与其他通信实体进行通信,该处理器与该存储器通过该总线连接,当该装置运行时,该处理器执行该存储器存储的该计算机执行指令,以使该装置执行上文所描述的语音控制方法。
本发明实施例还提供一种计算机存储介质,所述存储介质中存储软件程序,该软件程序在被一个或多个处理器读取并执行时实现上述各种可能的实现方式中所描述的语音控制方法。
本发明实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种可能的实现方式中所描述的语音控制方法。
实施例二
图4示例性示出了本发明实施例适用的另一种系统架构图。如图4所示,该系统400包括语音控制设备401、图像获取设备402、语音数据库403、至少一个待控制设备(如图4中示出的待控制设备4041、待控制设备4042、待控制设备4043)。其中,语音控制设备401可以通过网络与图像获取设备402连接;语音控制设备401也可以通过网络从语音数据库403中获取信息;语音控制设备401还可以通过网络对待控制设备4041、待控制设备4042、待控制设备4043中任一设备进行控制。
具体地,如图4所示,语音控制设备401可以包括语音采集模块4011、语音识别模块4012和语音控制模块4013。其中,语音采集模块4011可以用于接收用户发送的语音控制指令,语音识别模块4012可以用于识别语音控制指令,语音控制模块4013可以用于根据识别出的操作对待控制设备进行控制。
图像获取设备402可以为多种类型的设备,比如,可以为摄像机、带有摄像功能的终端,各种AR设备(如AR穿戴设备、AR手持移动终端)等,具体不做限定。
语音数据库403可以为设置于单独的服务器设备中,或者也可以设置于语音控制设备401中,具体不做限定。
本发明实施例中,待控制设备可以为多种类型的设备,比如,可以为智能电视、智能冰箱、智能空调等设备,具体不做限定。
基于图4所示的系统架构,图5示例性示出了本发明实施例提供的另一种语音控制方法所对应的流程示意图。如图5所示,具体包括如下步骤:
步骤501,图像获取设备拍摄待控制的目标设备的图像信息。
步骤502,图像获取设备根据所述目标设备的图像信息,确定所述目标设备的标识。
步骤503,图像获取设备将所述目标设备的标识发送给语音控制设备。
步骤504,语音控制设备获取待控制的目标设备的标识。
步骤505,语音控制设备接收用户发送的第一语音控制指令。
步骤506,语音控制设备根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制。
需要说明的是,上述步骤501至步骤503可以由图4中示出的图像获取设备402执行,上述步骤504至步骤506可以由图4中示出的语音控制设备401执行。
采用这种方法,语音控制设备可以先确定待控制的设备,然后在识别该设备对应的操作指令,分步地实现语音控制,相比于现有技术中的语音控制方法而言,对于同样的操作指令,语音数据库只需要存储一种语音数据信息就可以实现对多个不同的设备进行控制的目的,从而能够有效减小语音数据库占用的内存,提高语音系统的加载速度,进而提高识别的速率。进一步地,采用图像获取设备确定目标设备的方式,无需人为地输入目标设备的标识,减少了用户的操作负担,执行效率高且智能高效。
具体来说,步骤501中,根据图像获取设备的类型的不同,所拍摄到的目标设备的图像信息也不同。比如,图像获取设备为普通摄像头时,所拍摄到的目标设备的图像信息可以为二维图像信息;又比如,图像获取设备为AR摄像头时,所拍摄到的目标设备的图像信息可以为三维图像信息。
步骤502中,图像获取设备确定目标设备的标识的方式有多种,一个示例中,以目标设备的图像信息为三维图像信息为例,图像获取设备可以采用边缘检测的方式对目标设备的图像信息进行识别,确定目标设备的轮廓,从而可以根据目标设备的轮廓来确定目标设备的设备类型,进而,语音控制设备可以根据目标设备的设备类型,以及预先存储的设备类型与设备标识的对应关系,确定目标设备的标识。
另一个示例中,以目标设备的图像信息为二维图像信息为例,图像获取设备可以根据拍摄到的目标设备的图像信息中携带的设备标签来确定目标设备的标识。其中,所携带的设备标签可以通过多种方式呈现,比如,设备标签可以是二维码、条形码等,具体不做限定。
在其它可能的示例中,图像获取设备也可以通过其它方式来确定目标设备的标识,比如,采用图像识别技术对所拍摄到的目标设备的图像信息进行识别,进而确定目标设备的标识,具体不做限定。
步骤503和步骤504中,图像获取设备在确定目标设备的标识之后,可以直接将该目标设备的标识发送给语音控制设备;或者,图像获取设备也可以向将该目标设备的标识发送给云端服务器,再由云端服务器将该目标设备的标识发送给语音控制设备,具体不做限定。
步骤505和步骤506的具体描述可以参考实施例一种步骤202和步骤203的相关内容,此处不再赘述。
基于同样的发明构思,图6示例性示出了本发明实施例提供的另一种语音控制装置的结构示意图,如图6所示,该装置可以为图4中示出的语音控制设备401,该装置600包括获取单元601、接收单元602、控制单元603;其中,
在一种可能的实现方式中,所述获取单元601具体用于:
接收图像获取设备发送的所述目标设备的标识;所述目标设备的标识是所述图像获取设备根据拍摄到的所述目标设备的图像信息确定的。
在一种可能的实现方式中,所述获取单元601具体用于:
接收用户发送的第二语音控制指令;并根据预设的第二语音数据库,识别所述第二语音控制指令对应的所述目标设备的名称;所述第二语音数据库记录的语音数据信息为设备名称的语音数据信息;以及根据所述目标设备的名称,以及预先存储的设备的名称和设备的标识的对应关系,确定所述目标设备的标识。
在一种可能的实现方式中,所述控制单元603具体用于:
从所述第一语音数据库中确定与所述目标设备的标识对应的操作指令的语音数据信息;以及根据所述目标设备的标识对应的操作指令的语音数据信息,识别所述第一语音控制指令对应的所述目标操作。
基于同样的发明构思,图7示例性示出了本发明实施例提供的又一种语音控制装置的结构示意图,如图7所示,该装置可以为图4中示出的图像获取设备402,该装置700包括拍摄单元701、处理单元702、发送单元703;其中,
拍摄单元701,用于拍摄待控制的目标设备的图像信息;
处理单元702,用于根据所述目标设备的图像信息,确定所述目标设备的标识;
发送单元703,用于将所述目标设备的标识发送给语音控制设备,以使所述语音控制设备在接收到用户发送的第一语音控制指令后,根据预设的第一语音数据库,识别所述语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
在一种可能的实现方式中,所述处理单元702具体用于:
采用边缘检测的方式对所述目标设备的图像信息进行识别,确定所述目标设备的轮廓;并根据所述目标设备的轮廓,确定所述目标设备的设备类型;以及根据所述目标设备的设备类型,以及预先存储的设备类型与设备标识的对应关系,确定所述目标设备的标识。
本申请实施例的还提供一种装置,该装置可以为语音控制设备或图像获取设备,该装置具有实现上文所描述的语音控制方法的功能。该功能可以通过硬件执行相应的软件实现,在一种可能的设计中,该装置包括:处理器、收发器、存储器;该存储器用于存储计算机执行指令,该收发器用于实现该装置与其他通信实体进行通信,该处理器与该存储器通过该总线连接,当该装置运行时,该处理器执行该存储器存储的该计算机执行指令,以使该装置执行上文所描述的语音控制方法。
本发明实施例还提供一种计算机存储介质,所述存储介质中存储软件程序,该软件程序在被一个或多个处理器读取并执行时实现上述各种可能的实现方式中所描述的语音控制方法。
本发明实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种可能的实现方式中所描述的语音控制方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种语音控制方法,其特征在于,所述方法包括:
语音控制设备获取待控制的目标设备的标识;
所述语音控制设备接收用户发送的第一语音控制指令;
所述语音控制设备根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
2.根据权利要求1所述的方法,其特征在于,所述语音控制设备获取待控制的目标设备的标识,包括:
所述语音控制设备接收图像获取设备发送的所述目标设备的标识;所述目标设备的标识是所述图像获取设备根据拍摄到的所述目标设备的图像信息确定的。
3.根据权利要求1所述的方法,其特征在于,所述语音控制设备获取待控制的目标设备的标识,包括:
所述语音控制设备接收用户发送的第二语音控制指令;
所述语音控制设备根据预设的第二语音数据库,识别所述第二语音控制指令对应的所述目标设备的名称;所述第二语音数据库记录的语音数据信息为设备名称的语音数据信息;
所述语音控制设备根据所述目标设备的名称,以及预先存储的设备的名称和设备的标识的对应关系,确定所述目标设备的标识。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述语音控制设备根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,包括:
所述语音控制设备从所述第一语音数据库中确定与所述目标设备的标识对应的操作指令的语音数据信息;
所述语音控制设备根据所述目标设备的标识对应的操作指令的语音数据信息,识别所述第一语音控制指令对应的所述目标操作。
5.一种语音控制方法,其特征在于,所述方法包括:
图像获取设备拍摄待控制的目标设备的图像信息;
所述图像获取设备根据所述目标设备的图像信息,确定所述目标设备的标识;
所述图像获取设备将所述目标设备的标识发送给语音控制设备,以使所述语音控制设备在接收到用户发送的第一语音控制指令后,根据预设的第一语音数据库,识别所述语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
6.根据权利要求5所述的方法,其特征在于,所述图像获取设备根据所述目标设备的图像信息,确定所述目标设备的标识,包括:
所述图像获取设备采用边缘检测的方式对所述目标设备的图像信息进行识别,确定所述目标设备的轮廓;
所述语音控制设备根据所述目标设备的轮廓,确定所述目标设备的设备类型;
所述语音控制设备根据所述目标设备的设备类型,以及预先存储的设备类型与设备标识的对应关系,确定所述目标设备的标识。
7.一种语音控制装置,其特征在于,所述装置为语音控制设备,所述装置包括:
获取单元,用于获取待控制的目标设备的标识;
接收单元,用于接收用户发送的第一语音控制指令;
控制单元,用于根据预设的第一语音数据库,识别所述第一语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
8.一种语音控制装置,其特征在于,所述装置为图像获取设备,所述装置包括:
拍摄单元,用于拍摄待控制的目标设备的图像信息;
处理单元,用于根据所述目标设备的图像信息,确定所述目标设备的标识;
发送单元,用于将所述目标设备的标识发送给语音控制设备,以使所述语音控制设备在接收到用户发送的第一语音控制指令后,根据预设的第一语音数据库,识别所述语音控制指令对应的目标操作,并根据所述目标操作对所述目标设备进行控制;所述第一语音数据库中记录的语音数据信息为操作指令的语音数据信息。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有指令,当所述指令在计算机上运行时,使得计算机实现执行权利要求1至6中任一项所述的方法。
10.一种计算机设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811201041.1A CN109243448A (zh) | 2018-10-16 | 2018-10-16 | 一种语音控制方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811201041.1A CN109243448A (zh) | 2018-10-16 | 2018-10-16 | 一种语音控制方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109243448A true CN109243448A (zh) | 2019-01-18 |
Family
ID=65053591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811201041.1A Pending CN109243448A (zh) | 2018-10-16 | 2018-10-16 | 一种语音控制方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109243448A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859756A (zh) * | 2019-03-15 | 2019-06-07 | 北京金山云网络技术有限公司 | 设备控制方法、系统、装置、边缘计算设备和存储介质 |
CN110706708A (zh) * | 2019-11-29 | 2020-01-17 | 上海庆科信息技术有限公司 | 语音识别方法、装置及系统 |
CN111010322A (zh) * | 2019-12-17 | 2020-04-14 | 联想(北京)有限公司 | 信息配置方法、装置、电子设备及存储介质 |
CN111524514A (zh) * | 2020-04-22 | 2020-08-11 | 海信集团有限公司 | 一种语音控制方法及中控设备 |
CN113314111A (zh) * | 2020-02-27 | 2021-08-27 | 青岛海尔洗衣机有限公司 | 照明设备控制方法、装置、洗衣机及移动端 |
CN114244879A (zh) * | 2021-12-15 | 2022-03-25 | 北京声智科技有限公司 | 一种工业控制系统、工业控制方法和电子设备 |
CN114694652A (zh) * | 2022-03-30 | 2022-07-01 | 北京中科博联科技集团有限公司 | 基于语音识别的环保装备控制方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070299670A1 (en) * | 2006-06-27 | 2007-12-27 | Sbc Knowledge Ventures, Lp | Biometric and speech recognition system and method |
CN106128456A (zh) * | 2016-06-16 | 2016-11-16 | 美的集团股份有限公司 | 智能家电的语音控制方法、终端及系统 |
CN106231196A (zh) * | 2016-08-16 | 2016-12-14 | 北京金山安全软件有限公司 | 一种视频拍摄控制方法、装置及电子设备 |
CN106896732A (zh) * | 2015-12-18 | 2017-06-27 | 美的集团股份有限公司 | 家用电器的展示方法和装置 |
CN107330893A (zh) * | 2017-08-23 | 2017-11-07 | 无锡北斗星通信息科技有限公司 | 罐装汽车图像识别系统 |
CN107393528A (zh) * | 2017-06-30 | 2017-11-24 | 北京小米移动软件有限公司 | 语音控制方法及装置 |
CN107516081A (zh) * | 2017-08-23 | 2017-12-26 | 无锡北斗星通信息科技有限公司 | 一种罐装汽车图像识别方法 |
CN107826070A (zh) * | 2017-10-31 | 2018-03-23 | 奇瑞汽车股份有限公司 | 监测车辆内部环境的方法和装置 |
-
2018
- 2018-10-16 CN CN201811201041.1A patent/CN109243448A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070299670A1 (en) * | 2006-06-27 | 2007-12-27 | Sbc Knowledge Ventures, Lp | Biometric and speech recognition system and method |
CN106896732A (zh) * | 2015-12-18 | 2017-06-27 | 美的集团股份有限公司 | 家用电器的展示方法和装置 |
CN106128456A (zh) * | 2016-06-16 | 2016-11-16 | 美的集团股份有限公司 | 智能家电的语音控制方法、终端及系统 |
CN106231196A (zh) * | 2016-08-16 | 2016-12-14 | 北京金山安全软件有限公司 | 一种视频拍摄控制方法、装置及电子设备 |
CN107393528A (zh) * | 2017-06-30 | 2017-11-24 | 北京小米移动软件有限公司 | 语音控制方法及装置 |
CN107330893A (zh) * | 2017-08-23 | 2017-11-07 | 无锡北斗星通信息科技有限公司 | 罐装汽车图像识别系统 |
CN107516081A (zh) * | 2017-08-23 | 2017-12-26 | 无锡北斗星通信息科技有限公司 | 一种罐装汽车图像识别方法 |
CN107826070A (zh) * | 2017-10-31 | 2018-03-23 | 奇瑞汽车股份有限公司 | 监测车辆内部环境的方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859756A (zh) * | 2019-03-15 | 2019-06-07 | 北京金山云网络技术有限公司 | 设备控制方法、系统、装置、边缘计算设备和存储介质 |
CN110706708A (zh) * | 2019-11-29 | 2020-01-17 | 上海庆科信息技术有限公司 | 语音识别方法、装置及系统 |
CN111010322A (zh) * | 2019-12-17 | 2020-04-14 | 联想(北京)有限公司 | 信息配置方法、装置、电子设备及存储介质 |
CN111010322B (zh) * | 2019-12-17 | 2021-12-24 | 联想(北京)有限公司 | 信息配置方法、装置、电子设备及存储介质 |
CN113314111A (zh) * | 2020-02-27 | 2021-08-27 | 青岛海尔洗衣机有限公司 | 照明设备控制方法、装置、洗衣机及移动端 |
CN111524514A (zh) * | 2020-04-22 | 2020-08-11 | 海信集团有限公司 | 一种语音控制方法及中控设备 |
CN114244879A (zh) * | 2021-12-15 | 2022-03-25 | 北京声智科技有限公司 | 一种工业控制系统、工业控制方法和电子设备 |
CN114694652A (zh) * | 2022-03-30 | 2022-07-01 | 北京中科博联科技集团有限公司 | 基于语音识别的环保装备控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109243448A (zh) | 一种语音控制方法及装置 | |
CN109032039B (zh) | 一种语音控制的方法及装置 | |
EP3550828B1 (en) | Method and device for controlling camera shooting, smart device and computer storage medium | |
CN109450747B (zh) | 一种唤醒智能家居设备的方法、装置及计算机存储介质 | |
CN112053683A (zh) | 一种语音指令的处理方法、设备及控制系统 | |
CN104896868A (zh) | 一种根据远程图像识别管理冰箱食品列表的方法 | |
CN105405442B (zh) | 语音的识别方法、装置和设备 | |
CN111197841A (zh) | 控制方法、装置、遥控终端、空调器、服务器及存储介质 | |
CN108833222A (zh) | 家电设备控制方法、装置、遥控器、终端、服务器及介质 | |
CN111724784A (zh) | 设备控制方法及装置 | |
CN107591156B (zh) | 语音识别方法及装置 | |
CN109286832A (zh) | 实现语音操控的方法、装置及机顶盒和计算机可读存储介质 | |
CN108932947B (zh) | 语音控制方法及家电设备 | |
CN109067883B (zh) | 信息推送方法及装置 | |
CN107742520B (zh) | 语音控制方法、装置及系统 | |
CN112908321A (zh) | 设备控制方法、装置、存储介质及电子装置 | |
CN107563467A (zh) | 物品寻找方法和装置 | |
CN109243453A (zh) | 语音信息的处理方法及装置、存储介质、电子装置 | |
CN103822433A (zh) | 一种信息处理方法及冰箱 | |
CN108959889A (zh) | 一种智能家电的注册系统及方法 | |
CN106773852A (zh) | 智能镜子及其工作控制方法、装置 | |
CN109343481B (zh) | 一种控制设备的方法与设备 | |
CN105208262A (zh) | 网络摄影数据管理系统与方法 | |
CN111703278B (zh) | 香氛释放方法、装置、车端、云端、系统和存储介质 | |
CN106843882B (zh) | 一种信息处理方法、装置及信息处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190118 |
|
RJ01 | Rejection of invention patent application after publication |