CN116564311A - 设备控制方法、装置、电子设备及可读存储介质 - Google Patents
设备控制方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN116564311A CN116564311A CN202310846804.2A CN202310846804A CN116564311A CN 116564311 A CN116564311 A CN 116564311A CN 202310846804 A CN202310846804 A CN 202310846804A CN 116564311 A CN116564311 A CN 116564311A
- Authority
- CN
- China
- Prior art keywords
- voice
- text
- equipment
- control
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000006855 networking Effects 0.000 claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
- H04L67/125—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Abstract
本申请公开了一种设备控制方法、装置、电子设备及可读存储介质,所述设备控制方法包括:响应设备组网操作,将多个设备添加至同一私有网络中;响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值;基于所述语音文本和语音能量值,在所述私有网络中确定目标设备;控制所述目标设备执行与所述语音文本对应的操作。本申请提供的设备控制方案简化了设备控制的流程。
Description
技术领域
本申请涉及通信领域,具体涉及一种设备控制方法、装置、电子设备及可读存储介质。
背景技术
随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,智能电视、智能空调、智能冰箱等为我们的现代家居生活带来了很多便利,因此,智能家居系统应运而生。
在目前的智能家居系统中,用户想要精准地控制某个设备,需要明确指定该设备的名字或位置信息,用户交互较为繁琐。
发明内容
针对上述技术问题,本申请提供一种设备控制方法、装置、电子设备及可读存储介质,无需用户明确指定设备的名字或位置信息,简化了设备控制的流程。
为解决上述技术问题,本申请提供一种设备控制方法,包括:
响应设备组网操作,将多个设备添加至同一私有网络中;
响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值;
基于所述语音文本和语音能量值,在所述私有网络中确定目标设备;
控制所述目标设备执行与所述语音文本对应的操作。
可选的,在本申请的一些实施例中,所述控制所述目标设备执行与所述语音文本对应的操作,包括:
识别所述语音文本的设备词;
确定所述设备词对应的设备控制模型;
基于所述设备控制模型,控制所述目标设备执行与所述语音文本对应的操作。
可选的,在本申请的一些实施例中,所述确定所述设备词对应的设备控制模型,包括:
确定所述目标设备的设备类型;
获取预设的设备控制模型集,所述设备控制模型集包括多个预设的设备控制模型;
基于所述设备类型以及所述设备词,在所述设备控制模型中确定目标设备控制模型;
将当前设备控制模型更新为所述目标设备控制模型。
可选的,在本申请的一些实施例中,所述基于所述设备控制模型,控制所述目标设备执行与所述语音文本对应的操作,包括:
利用所述设备控制模型对所述语音文本进行识别,得到所述语音文本对应的命令文本;
识别所述命令文本是否预设文本;
当识别到所述命令文本为预设文本时,则根据所述预设文本对应的指令控制所述目标设备。
可选的,在本申请的一些实施例中,还包括:
当识别到所述命令文本不为预设文本时,则获取预设的指令词表;
根据所述指令词表,控制所述目标设备执行与所述语音文本对应的操作。
可选的,在本申请的一些实施例中,所述基于所述语音文本和语音能量值,在所述私有网络中确定目标设备,包括:
识别所述语音文本中的设备词;
在所述私有网络中确定所述设备词对应的候选设备;
根据所述语音能量值,在所述私有网络中确定目标设备。
可选的,在本申请的一些实施例中,所述响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值,包括:
响应于语音控制操作,采集所述语音控制操作对应的语音信号;
对所述语音信号进行滤波处理,得到所述语音信号对应的语音能量值;
对所述语音信号进行文本转换,得到所述语音信号对应的语音文本。
相应的,本申请还提供一种设备控制装置,包括:
添加模块,用于响应设备组网操作,将多个设备添加至同一私有网络中;
获取模块,用于响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值;
确定模块,用于基于所述语音文本和语音能量值,在所述私有网络中确定目标设备;
控制模块,用于控制所述目标设备执行与所述语音文本对应的操作。
本申请还提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。
本申请还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。
如上所述,本申请提供一种设备控制方法、装置、电子设备及可读存储介质,响应设备组网操作,将多个设备添加至同一私有网络中,响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值,然后,基于所述语音文本和语音能量值,在所述私有网络中确定目标设备,最后,控制所述目标设备执行与所述语音文本对应的操作。在本申请提供的设备控制方案中,可以预先将多个设备添加至同一私有网络中,在执行语音控制操作时,基于语音文本和语音能量值,在私有网络中确定目标设备,最后,控制目标设备执行与语音文本对应的操作,无需用户明确指定设备的名字或位置信息,可以根据语音文本和语音能量值控制语音文本对应的操作,由此,可以简化设备控制的流程,进而提高设备控制的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的设备控制系统的结构示意图;
图2是本申请实施例提供的设备控制方法的流程示意图;
图3是本申请实施例提供的设备控制装置的结构示意图;
图4是本申请实施例提供的智能终端的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或者“单元”可以混合地使用。
以下对本申请涉及的实施例进行具体描述,需要说明的是,在本申请中对实施例的描述顺序不作为对实施例优先顺序的限定。
本申请实施例提供一种设备控制方法、装置、存储介质及电子设备。具体地,本申请实施例的设备控制方法可以由电子设备或服务器执行,其中,该电子设备可以为终端。该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机(PC,PersonalComputer)、个人数字助理(Personal Digital Assistant,PDA)等电子设备,终端还可以包括客户端,该客户端可以是智能家居客户端或其他客户端等。
例如,当该设备控制方法运行于主控设备时,由主控设备的处理器响应设备组网操作,将多个设备添加至同一私有网络中,其中,该设备组网操作可以是由用户触发的,在私有网络的设备可以是智能音箱、智能空调、智能电视、智能灯具或智能机器人,然后,该主控设备响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值,紧接着,主控设备基于语音文本和语音能量值,在私有网络中确定目标设备,最后,主控设备控制目标设备执行与语音文本对应的操作。
请参阅图1,图1为本申请实施例提供的设备控制装置的系统示意图。该系统可以包括至少一个电子设备1000,至少一个服务器或个人电脑2000。用户持有的电子设备1000可以通过网络连接到不同的服务器或个人电脑。电子设备1000可以是具有计算硬件的电子设备,该计算硬件能够支持和执行与多媒体对应的软件产品。另外,电子设备1000还可以具有用于感测和获得用户通过在一个或者多个触控显示屏的多个点执行的触摸或者滑动操作的输入的一个或者多个多触敏屏幕。另外,电子设备1000可以通过网络与服务器或个人电脑2000相互连接。网络可以是无线网络或者有线网络,比如无线网络为无线局域网(WLAN)、局域网(LAN)、蜂窝网络、2G网络、3G网络、4G网络、5G网络等。另外,不同的电子设备1000之间也可以使用自身的蓝牙网络或者热点网络连接到其他嵌入式平台或者连接到服务器以及个人电脑等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请实施例提供了一种设备控制方法,该方法可以由电子设备或服务器执行。本申请实施例以设备控制方法由电子设备执行为例来进行说明。其中,该电子设备包括触控显示屏和处理器,该触控显示屏用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。用户通过触控显示屏对图形用户界面进行操作时,该图形用户界面可以通过响应于接收到的操作指令控制电子设备本地的内容,也可以通过响应于接收到的操作指令控制服务器端的内容。例如,用户作用于图形用户界面产生的操作指令包括用于对初始音频数据进行处理的指令,处理器被配置为在接收到用户提供的指令之后启动对应的应用程序。此外,处理器被配置为在触控显示屏上渲染和绘制与应用程序相关联的图形用户界面。触控显示屏是能够感测屏幕上的多个点同时执行的触摸或者滑动操作的多触敏屏幕。用户在使用手指在图形用户界面上执行触控操作,图形用户界面在检测到触控操作时,控制应用的图形用户界面中显示对应的操作。
本申请提供的设备控制方案,可以预先将多个设备添加至同一私有网络中,在执行语音控制操作时,基于语音文本和语音能量值,在私有网络中确定目标设备,最后,控制目标设备执行与语音文本对应的操作,无需用户明确指定设备的名字或位置信息,可以根据语音文本和语音能量值控制语音文本对应的操作,由此,可以简化设备控制的流程,进而提高设备控制的效率。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优先顺序的限定。
一种设备控制方法,包括:响应设备组网操作,将多个设备添加至同一私有网络中;响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值;基于语音文本和语音能量值,在私有网络中确定目标设备;控制目标设备执行与语音文本对应的操作。
请参阅图2,图2为本申请实施例提供的设备控制方法的流程示意图。该数设备控制方法的具体流程可以如下:
101、响应设备组网操作,将多个设备添加至同一私有网络中。
设备组网指的是根据用户的需求将不同的设备添加至同一局域网中,并且,在同一局域网中,各类设备能够与用户进行交互。
目前的设备组网方式是通过某个固定的设备进行设备组网,如利用用户的手机、家里的音箱或电视等设备作为主控设备,可见,目前的设备组网方式是依赖于固定的设备进行组网,不便于用户进行快速组网,故,本申请提供一种新的设备组网方式,响应于设备组网操作,将智能设备的网络密钥配置为公共网络密钥,其中,该公共网络密钥为预先配置在智能设备中的,此时,处于公共网络密钥的智能设备可以进行通信,随后,智能设备根据公共网络密钥进入公共网络,并在该公共网络中传输数据,如一串特定的字符串或者是设备信息等,接着,在该公共网络中将接收数据最多的智能设备确定为中心设备,最后,中心设备基于预设策略输出私有网络密钥,并将私有网络密钥分发至处于公共网络的智能设备中,随后,公共网络的智能设备(包括中心设备)基于私有网络密钥构建私有网络,最后,将多个设备添加至同一私有网络中,由此,完成设备组网。
102、响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值。
其中,语音控制操作可以是由用户触发的,比如,用户发出声音“开灯”,主控设备可以获取语音控制操作对应的语音文本和语音能量值,可选地,在一些实施例中,步骤“响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值”,具体可以包括:
(11)响应于语音控制操作,采集语音控制操作对应的语音信号;
(12)对语音信号进行滤波处理,得到语音信号对应的语音能量值;
(13)对语音信号进行文本转换,得到语音信号对应的语音文本。
具体的,利用主控设备的麦克风采集语音控制操作对应的语音信号,然后,对语音信号进行滤波处理,得到语音信号对应的语音能量值,如将语音信号的每帧声音的幅值进行滤波求均值,由此计算出语音信号对应的语音能量值;此外,对语音信号进行文本转换,得到语音信号对应的语音文本,如采用预设的语音文本转换模型对语音信号进行文本转换,从而得到语音信号对应的语音文本。
103、基于语音文本和语音能量值,在私有网络中确定目标设备。
其中,在设备控制的场景下,语音文本的形式通常为设备词+命令词,如开灯、关闭音箱和关空调,“开”、“关”以及“关闭”属于命令词,“灯”、“音箱”以及“空调”属于设备词,因此,可以识别语音文本中的设备词,确定设备词对应的设备,再根据语音能量值在确定的设备中确定目标设备,即,可选地,在一些实施例中,步骤“基于语音文本和语音能量值,在私有网络中确定目标设备”,具体可以包括:
(21)识别语音文本中的设备词;
(22)在私有网络中确定设备词对应的候选设备;
(23)根据语音能量值,在私有网络中确定目标设备。
例如,具体的,可以采用预设的命名实体识别(Named Entity Recognition, NER,NER)算法对语音文本进行实体切分,从而得到语音文本对应的至少一个实体,然后,在切分得到的实体识别设备词,NER自然语言处理中一项非常基础的任务,是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。命名实体一般指的是文本中具有特定意义或者指代性强的实体,学术上通常包括实体类,时间类,数字类三大类和人名、地名、组织机构名、时间、日期、货币、百分比七小类。NER就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体。
命名实体识别算法可以包括基于词典和规则的方法、传统机器学习的方法以及采用基于深度学习的方法。
基于规则的NER系统依赖于人工制定的规则。规则的设计一般基于句法、语法、词汇的模式以及特定领域的知识等。词典是由特征词构成的词典和外部词典共同组成,外部词典指已有的常识词典。 制定好规则和词典后,通常使用匹配的方式对文本进行处理以实现命名实体识别。
在基于机器学习的方法中,命名实体识别被当作是序列标注问题。与分类问题相比,序列标注问题中当前的预测标签不仅与当前的输入特征相关,还与之前的预测标签相关,即预测标签序列之间是有强相互依赖关系的。采用的传统机器学习方法主要包括:隐马尔可夫模型、最大熵、最大熵马尔可夫模型、支持向量机以及条件随机场。
NER使用深度学习的原因主要是:1.NER适用于非线性转化。2.深度学习避免大量的人工特征的构建,节省了设计NER功能的大量精力。3.深度学习能通过梯度传播来训练,这样可以构建更复杂的网络。5. 端到端的训练方式。
在本申请中,可以根据实际需求选择相应的NER算法,在此不再赘述。
通过上述步骤,即可先根据语音能量确定语音入口(也即用户所在区域),再结合语音文本来确定待控设备,其中待控设备可能是一个或多个,比如用户在客厅说“打开灯”,此时客厅接收到语音能量最大,因此判断客厅的灯为待控设备,系统便可以执行“打开(客厅)灯”命令,最终让客厅的一个或多个灯执行动作,也即开灯。
104、控制目标设备执行与语音文本对应的操作。
例如,具体的,可以识别语音文本中的命令词,然后,基于命令词确定相应的设备控制模型,最后,根据该设备控制模型以及语音文本,控制目标设备执行与语音文本对应的操作,即,可选地,在一些实施例中,步骤“控制目标设备执行与语音文本对应的操作”,具体可以包括:
(31)识别语音文本的设备词;
(32)确定设备词对应的设备控制模型;
(33)基于设备控制模型,控制目标设备执行与语音文本对应的操作。
具体的,可以采用命名实体识别算法识别语音文本的设备词,具体请参阅前面实施例,在此不再赘述。需要说明的是,在智能家居的场景中,可能会出现在一个环境下包含多个设备,其中,同类型的设备可能会分布在不同的区域,比如,在房间A内安装有吊顶灯、床头灯以及智能空调,在房间A内的厕所也安装有吊顶灯,当用户说出“开灯”时,在目前的设备控制方案中,需要设备控制模型判断哪个设备是待控设备,并且,当环境中存在大量相同类型的设备时,很可能会出现将同类型的设备全部开启或关闭,而用户所期望开启的设备往往是某一个,故,设备控制的精确性不佳;在本申请中,可以根据设备词确定相应的候选设备控制模型,并根据目标设备的位置,进而确定设备控制模型,即,可选地,在一些实施例中,步骤“确定设备词对应的设备控制模型”,具体可以包括:
(41)获取设备词对应的候选设备控制模型;
(42)根据目标设备的位置,在候选设备控制模型确定设备控制模型。
例如,具体的,当识别到设备词为灯时,获取灯对应的候选设备控制模型分别为:模型A1、模型A2以及模型A3,其中,模型A1设置在客厅,模型A2设置在房间B1,模型A3设置在房间B2,而此时,目标设备(灯)所在的位置为房间B2,故,将模型A3确定为设备控制模型,由此,实现分布式设备控制。
在确定设备控制模型后,利用设备控制模型对语音文本进行识别,从而得到语音文本对应的命令文本,并基于该命令文本对目标设备进行控制。需要说明的是,命令文本可以理解为语音文本的过滤结果,即,利用设备控制模型对语音文本进行文本分割,得到语音文本对应的至少一个文本词,然后,将分割得到的文本词中无意义的词进行过滤,从而得到命令文本。可以理解的是,该命令文本中每个字或词为设备词或命令词,比如,针对于语音文本“请帮我打开卧室灯”,其过滤后得到的命令文本为“打开卧室灯”,其中,“打开”为命令词,“卧室灯”为设备词,由此,控制器可以开启卧室灯,实现对卧室灯的控制。
还需要说明的是,在一些实施例中,用户可以预先设定某些文本,该预设文本对应不同的指令,比如,用户可以预先设置文本“一二三”对应开启卧室灯和卧室空调,在实际控制过程中,用户发出的语音为“请帮我一二三”,其对应的命令文本为“一二三”,则可以开启卧室灯和卧室空调。其中,上述预设文本可以为设备在出厂时已经预先设置好的,用户通过预设文本即可直接唤醒设备,也可以为用户通过操作来自行设置的,另外,在用户自行设置预设文本时也可以通过智能设备本身或者关联的手机或服务器来进行设置,本实施例对此不作进一步限定。即,可选地,在一些实施例中,步骤“基于设备控制模型,控制目标设备执行与语音文本对应的操作”,具体可以包括:
(51)利用设备控制模型对所述语音文本进行识别,得到语音文本对应的命令文本;
(52)识别命令文本是否预设文本;
(53)当识别到命令文本为预设文本时,则根据预设文本对应的指令控制目标设备。
此外,当命令文本不为预设文本时,此时,可以获取预设的词表,根据词表中对应的指令,对目标设备进行控制,即,可选地,在一些实施例中,本申请提供的设备控制方法具体还可以包括:
(61)当识别到命令文本不为预设文本时,则获取预设的指令词表;
(62)根据指令词表,控制目标设备执行与语音文本对应的操作。
以上完成本申请的设备控制流程。
由上可知,本申请提供一种设备控制方法,响应设备组网操作,将多个设备添加至同一私有网络中,响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值,然后,基于语音文本、语音能量值、电磁波能量值以及传输延迟等因素,在私有网络中确定目标设备,最后,控制目标设备执行与语音文本对应的操作,在本申请提供的设备控制方案中,可以预先将多个设备添加至同一私有网络中,在执行语音控制操作时,基于语音文本和语音能量值,在私有网络中确定目标设备,最后,控制目标设备执行与语音文本对应的操作,无需用户明确指定设备的名字或位置信息,可以根据语音文本和语音能量值控制语音文本对应的操作,由此,可以简化设备控制的流程,进而提高设备控制的效率。
为便于更好的实施本申请的设备控制方法,本申请还提供一种基于上述设备控制装置。其中名词的含义与上述设备控制方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3,图3为本申请提供的设备控制装置的结构示意图,其中该设备控制装置可以包括添加模块201、获取模块202、确定模块203以及控制模块204,具体可以如下:
添加模块201,用于响应设备组网操作,将多个设备添加至同一私有网络中。
添加模块201响应于设备组网操作,将智能设备的网络密钥配置为公共网络密钥,其中,该公共网络密钥为预先配置在智能设备中的,此时,处于公共网络密钥的智能设备可以进行通信,在智能设备根据公共网络密钥进入公共网络后,确定中心设备,并根据预设策略输出私有网络密钥,然后,将私有网络密钥分发至处于公共网络的智能设备中,随后,公共网络的智能设备(包括中心设备)基于私有网络密钥构建私有网络,最后,添加模块201将多个设备添加至同一私有网络中。
获取模块202,用于响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值。
可选地,在一些实施例中,获取模块202具体可以用于:响应于语音控制操作,采集语音控制操作对应的语音信号;对语音信号进行滤波处理,得到语音信号对应的语音能量值;对语音信号进行文本转换,得到语音信号对应的语音文本。
确定模块203,用于基于语音文本和语音能量值,在私有网络中确定目标设备。
可选地,在一些实施例中,确定模块203具体可以用于:识别语音文本中的设备词;在私有网络中确定设备词对应的候选设备;根据语音能量值,在私有网络中确定目标设备。
控制模块204,用于控制目标设备执行与所述语音文本对应的操作。
例如,具体的,控制模块204可以识别语音文本中的命令词,然后,控制模块204基于命令词确定相应的设备控制模型,最后,控制模块204根据该设备控制模型以及语音文本,控制目标设备执行与语音文本对应的操作,即,可选地,在一些实施例中,控制模块204具体可以包括:
识别单元,用于识别语音文本的设备词;
确定单元,用于确定设备词对应的设备控制模型;
控制单元,用于基于设备控制模型,控制目标设备执行与语音文本对应的操作。
可选地,在一些实施例中,确定单元具体可以用于:获取设备词对应的候选设备控制模型;根据目标设备的位置,在候选设备控制模型确定设备控制模型。
可选地,在一些实施例中,控制单元具体可以用于:利用设备控制模型对所述语音文本进行识别,得到语音文本对应的命令文本;识别命令文本是否预设文本;当识别到命令文本为预设文本时,则根据预设文本对应的指令控制目标设备。
可选地,在一些实施例中,控制单元具体还可以用于:当识别到命令文本不为预设文本时,则获取预设的指令词表;根据指令词表,控制目标设备执行与语音文本对应的操作。
以上完成本申请的设备控制流程。
由上可知,本申请提供一种设备控制装置,添加模块201响应设备组网操作,将多个设备添加至同一私有网络中,获取模块202响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值,然后,确定模块203基于语音文本和语音能量值,在私有网络中确定目标设备,最后,控制模块204控制目标设备执行与语音文本对应的操作,在本申请提供的设备控制方案中,可以预先将多个设备添加至同一私有网络中,在执行语音控制操作时,基于语音文本和语音能量值,在私有网络中确定目标设备,最后,控制目标设备执行与语音文本对应的操作,无需用户明确指定设备的名字或位置信息,可以根据语音文本和语音能量值控制语音文本对应的操作,由此,可以简化设备控制的流程,进而提高设备控制的效率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
本发明实施例还提供一种电子设备500,如图4所示,该电子设备500可以集成上述设备控制装置,还可以进一步包括射频(RF,Radio Frequency)电路501、包括有一个或一个以上计算机可读存储介质的存储器502、输入单元503、显示单元504、传感器505、音频电路506、无线保真(Wi-Fi,Wireless Fidelity)模块507、包括有一个或者一个以上处理核心的处理器508、以及电源509等部件。本领域技术人员可以理解,图4中示出的电子设备500结构并不构成对电子设备500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路501可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器508处理;另外,将涉及上行的数据发送给基站。通常,RF电路501包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路501还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS ,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器502可用于存储软件程序以及模块,处理器508通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及信息处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、目标数据播放功能等)等;存储数据区可存储根据电子设备500的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器508和输入单元503对存储器502的访问。
输入单元503可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元503可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器508,并能接收处理器508发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元503还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元504可用于显示由用户输入的信息或提供给用户的信息以及电子设备500的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元504可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器508以确定触摸事件的类型,随后处理器508根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图4中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
电子设备500还可包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在电子设备500移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备500还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路506、扬声器,传声器可提供用户与电子设备500之间的音频接口。音频电路506可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路506接收后转换为音频数据,再将音频数据输出处理器508处理后,经RF电路501以发送给比如另一电子设备500,或者将音频数据输出至存储器502以便进一步处理。音频电路506还可能包括耳塞插孔,以提供外设耳机与电子设备500的通信。
WiFi属于短距离无线传输技术,电子设备500通过WiFi模块507可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块507,但是可以理解的是,其并不属于电子设备500的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器508是电子设备500的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行电子设备500的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器508可包括一个或多个处理核心;优选的,处理器508可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器508中。
电子设备500还包括给各个部件供电的电源509(比如电池),优选的,电源可以通过电源管理系统与处理器508逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源509还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源数据指示器等任意组件。
尽管未示出,电子设备500还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备500中的处理器508会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器508来运行存储在存储器502中的应用程序,从而实现各种功能:
响应设备组网操作,将多个设备添加至同一私有网络中;响应于语音控制操作,获取语音控制操作对应的语音文本和语音能量值;基于语音文本和语音能量值,在私有网络中确定目标设备;控制目标设备执行与语音文本对应的操作。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文设备控制方法的详细描述,此处不再赘述。
由上可知,本发明实施例的电子设备500可以预先将多个设备添加至同一私有网络中,在执行语音控制操作时,基于语音文本和语音能量值,在私有网络中确定目标设备,最后,控制目标设备执行与语音文本对应的操作,无需用户明确指定设备的名字或位置信息,可以根据语音文本和语音能量值控制语音文本对应的操作,由此,可以简化设备控制的流程,进而提高设备控制的效率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例还提供一种存储介质,其上存储有多条指令,所述指令适于处理器进行加载,以执行上述设备控制方法中的步骤。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种设备控制方法中的步骤,因此,可以实现本发明实施例所提供的任一种设备控制方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的设备控制方法、装置、系统及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种设备控制方法,其特征在于,包括:
响应设备组网操作,将多个设备添加至同一私有网络中;
响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值;
基于所述语音文本和语音能量值,在所述私有网络中确定目标设备;
控制所述目标设备执行与所述语音文本对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述控制所述目标设备执行与所述语音文本对应的操作,包括:
识别所述语音文本的设备词;
确定所述设备词对应的设备控制模型;
基于所述设备控制模型,控制所述目标设备执行与所述语音文本对应的操作。
3.根据权利要求2所述的方法,其特征在于,所述确定所述设备词对应的设备控制模型,包括:
获取所述设备词对应的候选设备控制模型;
根据所述目标设备的位置,在所述候选设备控制模型中确定设备控制模型。
4.根据权利要求2所述的方法,其特征在于,所述基于所述设备控制模型,控制所述目标设备执行与所述语音文本对应的操作,包括:
利用所述设备控制模型对所述语音文本进行识别,得到所述语音文本对应的命令文本;
识别所述命令文本是否为预设文本;
当识别到所述命令文本为所述预设文本时,则根据所述预设文本对应的指令控制所述目标设备。
5.根据权利要求4所述的方法,其特征在于,还包括:
当识别到所述命令文本不为所述预设文本时,则获取预设的指令词表;
根据所述指令词表,控制所述目标设备执行与所述语音文本对应的操作。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述基于所述语音文本和语音能量值,在所述私有网络中确定目标设备,包括:
识别所述语音文本中的设备词;
在所述私有网络中确定所述设备词对应的候选设备;
根据所述语音能量值,在所述私有网络中确定所述目标设备。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值,包括:
响应于所述语音控制操作,采集所述语音控制操作对应的语音信号;
对所述语音信号进行滤波处理,得到所述语音信号对应的语音能量值;
对所述语音信号进行文本转换,得到所述语音信号对应的语音文本。
8.一种设备控制装置,其特征在于,包括:
添加模块,用于响应设备组网操作,将多个设备添加至同一私有网络中;
获取模块,用于响应于语音控制操作,获取所述语音控制操作对应的语音文本和语音能量值;
确定模块,用于基于所述语音文本和语音能量值,在所述私有网络中确定目标设备;
控制模块,用于控制所述目标设备执行与所述语音文本对应的操作。
9.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述设备控制方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述设备控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310846804.2A CN116564311B (zh) | 2023-07-11 | 2023-07-11 | 设备控制方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310846804.2A CN116564311B (zh) | 2023-07-11 | 2023-07-11 | 设备控制方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116564311A true CN116564311A (zh) | 2023-08-08 |
CN116564311B CN116564311B (zh) | 2023-09-29 |
Family
ID=87490218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310846804.2A Active CN116564311B (zh) | 2023-07-11 | 2023-07-11 | 设备控制方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116564311B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110675870A (zh) * | 2019-08-30 | 2020-01-10 | 深圳绿米联创科技有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN111294258A (zh) * | 2020-02-10 | 2020-06-16 | 成都捷顺宝信息科技有限公司 | 一种控制智能家居设备的语音交互系统及方法 |
US20210096814A1 (en) * | 2019-09-29 | 2021-04-01 | Baidu Online Network Technology (Beijing) Co., Ltd. | Speech control method, speech control device, electronic device, and readable storage medium |
JP2022101663A (ja) * | 2021-08-18 | 2022-07-06 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | ヒューマンコンピュータインタラクション方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
CN115039169A (zh) * | 2021-01-06 | 2022-09-09 | 京东方科技集团股份有限公司 | 一种语音指令识别方法、电子设备以及非瞬态计算机可读存储介质 |
-
2023
- 2023-07-11 CN CN202310846804.2A patent/CN116564311B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110675870A (zh) * | 2019-08-30 | 2020-01-10 | 深圳绿米联创科技有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
US20210096814A1 (en) * | 2019-09-29 | 2021-04-01 | Baidu Online Network Technology (Beijing) Co., Ltd. | Speech control method, speech control device, electronic device, and readable storage medium |
KR20210038812A (ko) * | 2019-09-29 | 2021-04-08 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | 음성 제어 방법, 장치, 전자 기기 및 판독 가능 저장 매체 |
CN111294258A (zh) * | 2020-02-10 | 2020-06-16 | 成都捷顺宝信息科技有限公司 | 一种控制智能家居设备的语音交互系统及方法 |
CN115039169A (zh) * | 2021-01-06 | 2022-09-09 | 京东方科技集团股份有限公司 | 一种语音指令识别方法、电子设备以及非瞬态计算机可读存储介质 |
JP2022101663A (ja) * | 2021-08-18 | 2022-07-06 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | ヒューマンコンピュータインタラクション方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN116564311B (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6311194B2 (ja) | 連絡先グルーピング方法および装置 | |
KR20200027554A (ko) | 음성 인식 방법 및 장치, 그리고 저장 매체 | |
KR20160001965A (ko) | 음성 명령어 제공 방법 및 이를 지원하는 전자 장치 | |
CN106528545B (zh) | 一种语音信息的处理方法及装置 | |
CN108287918B (zh) | 基于应用页面的音乐播放方法、装置、存储介质和电子设备 | |
JP6492184B2 (ja) | 情報の推薦を管理するための方法、デバイス、およびシステム | |
CN103702297A (zh) | 短信增强方法、装置及系统 | |
CN104281568B (zh) | 一种释义显示方法和装置 | |
CN107885718B (zh) | 语义确定方法及装置 | |
CN109389977B (zh) | 一种语音交互方法及装置 | |
CN114115895A (zh) | 一种代码查询方法、装置、电子设备和存储介质 | |
CN116486833B (zh) | 音频增益调整方法、装置、存储介质及电子设备 | |
CN115981798B (zh) | 文件解析方法、装置、计算机设备及可读存储介质 | |
CN112286122A (zh) | 一种智能家居控制方法、装置、终端以及存储介质 | |
CN116564311B (zh) | 设备控制方法、装置、电子设备及可读存储介质 | |
CN110136724A (zh) | 一种数据处理方法及终端设备 | |
CN106933626B (zh) | 应用关联方法及装置 | |
CN111897916B (zh) | 语音指令识别方法、装置、终端设备及存储介质 | |
CN116564312B (zh) | 设备控制方法、装置、电子设备及可读存储介质 | |
CN111027406B (zh) | 图片识别方法、装置、存储介质及电子设备 | |
CN106230919B (zh) | 一种文件上传的方法和装置 | |
CN110955327B (zh) | 启动和关闭智能设备方法、存储装置和终端 | |
CN110209924B (zh) | 推荐参数获取方法、装置、服务器及存储介质 | |
CN110781274A (zh) | 一种问答对生成的方法与装置 | |
CN115831120B (zh) | 语料数据采集方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |