CN116092498A - 语音指令的响应方法和装置、存储介质及电子装置 - Google Patents
语音指令的响应方法和装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN116092498A CN116092498A CN202310095496.4A CN202310095496A CN116092498A CN 116092498 A CN116092498 A CN 116092498A CN 202310095496 A CN202310095496 A CN 202310095496A CN 116092498 A CN116092498 A CN 116092498A
- Authority
- CN
- China
- Prior art keywords
- voice
- voice recognition
- determining
- waiting time
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000004044 response Effects 0.000 title claims abstract description 24
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种语音指令的响应方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该语音指令的响应方法包括:当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
Description
技术领域
本申请涉及智慧家庭技术领域,具体而言,涉及一种语音指令的响应方法和装置、存储介质及电子装置。
背景技术
为了用户更好的使用语音功能,智能设备为用户准备了两种语音控制方式:在线语音命令和离线语音命令。设备在离线时使用离线语音命令,设备在线时为防止在线语音命令超时,既能收到离线语音命令也能收到在线语音命令,但在线语音命令词汇更为丰富,建议优先使用在线语音命令。由于离线语音命令是由本地算法提供,所以先于在线语音命令被接收。所以在收到离线语音命令之后,会等待一段时间,如果超时仍然未收到在线语音命令,则播报并执行离线语音命令,否则,播报并执行在线语音命令。
然而,在一些场景下,这样的语音交互方式会影响用户体验——比如,在设备联网但是网络较差时,在线语音命令大概率超时,但是智能设备仍然需要等待超时后才会执行离线语音命令,增大了用户语音控制到设备执行的时间,影响用户语音交互体验。
针对相关技术中,智能设备不能灵活根据网络情况确定等待时长等问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种语音指令的响应方法和装置、存储介质及电子装置,以至少解决相关技术中,智能设备不能灵活根据网络情况确定等待时长等问题。
根据本申请实施例的一个实施例,提供了一种语音指令的响应方法,包括:当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
在一个示例性实施例中,根据当前网络质量的网络等级确定等待时长,包括:确定所述网络等级对应的网络等级系数;确定在预设时间段内响应第三语音识别控制指令的次数,以及确定所述次数与第一预设阈值的第一大小关系,其中,所述第三语音识别控制指令为所述预置的语音识别模型识别历史语音控制信息得到的控制指令;根据所述第一大小关系和所述网络等级系数确定所述等待时长。
在一个示例性实施例中,根据所述第一大小关系和所述网络等级系数确定所述等待时长,包括:在所述第一大小关系指示所述次数小于或等于所述第一预设阈值的情况下,确定所述次数与第二预设阈值的第二大小关系,根据所述第二大小关系和所述网络等级系数确定所述等待时长;在所述第一大小关系指示所述次数大于所述第一预设阈值的情况下,确定所述等待时长为目标值。
在一个示例性实施例中,根据所述第二大小关系和所述网络等级系数确定所述等待时长,包括:在所述第二大小关系指示所述次数大于或等于所述第二预设阈值的情况下,确定所述智能设备的默认等待时长系数,计算所述等待时长系数、所述网络等级系数与默认等待时长的第一乘积,并确定所述第一乘积为所述等待时长;在所述第二大小关系指示所述次数大于所述第一预设阈值的情况下,计算所述网络等级系数与默认等待时长的第二乘积,并确定所述第二乘积为所述等待时长。
在一个示例性实施例中,根据当前网络质量的网络等级确定等待时长之前,所述方法还包括:确定是否与配网设备建立网络连接;在与所述配网设备建立网络连接的情况下,确定与所述配网设备建立的网络连接的当前网络质量;在与所述配网设备未建立网络连接的情况下,基于预置的语音识别模型识别所述语音控制信息,得到并响应所述第二语音识别控制指令。
在一个示例性实施例中,根据当前网络质量的网络等级确定等待时长之后,所述方法至少包括以下之一:周期性地确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长;在成功响应所述第一语音识别控制指令的情况下,确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长。
在一个示例性实施例中,根据当前网络质量的网络等级确定等待时长之后,所述方法还包括:若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,将所述智能设备在预设时间段内响应第三语音识别控制指令的次数加目标值;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,将所述智能设备在预设时间段内响应第三语音识别控制指令的次数清零。
根据本申请实施例的另一个实施例,还提供了一种语音指令的响应装置,包括:确定模块,用于当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;响应模块,用于若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;识别模块,用于若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述语音指令的响应方法。
根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的语音指令的响应方法。
在本申请实施例中,当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令;采用上述技术方案,解决了智能设备不能灵活根据网络情况确定等待时长等问题,本发明实施例可以通过智能设备的当前网络质量确定所述智能设备的等待时长,进而可以灵活确定等待时长,以及灵活确定响应语音服务器反馈的第一语音识别控制指令或者语音识别模型识别的第二语音识别控制指令。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例的一种语音指令的响应方法的硬件环境示意图;
图2是根据本申请实施例的语音指令的响应方法的流程图;
图3是根据本申请可选实施例的语音指令的响应方法的示意图;
图4是根据本申请可选实施例的语音指令的响应方法的流程图;
图5是根据本申请实施例的一种语音指令的响应装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种语音指令的响应方法。该语音指令的响应方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(IntelligenceHouse)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述语音指令的响应方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
在本实施例中提供了一种语音指令的响应方法,应用于计算机终端,图2是根据本申请实施例的语音指令的响应方法的流程图,该流程包括如下步骤:
步骤S202,当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;
需要说明的是,当前网络质量可以理解为接收信号强度,其中,所述接收信号强度的单位为dBm,通常情况下,-70dBm为理想信号强度,-70dBm—-80dBm为中等信号强度,小于-80dBm为弱信号强度,本发明实施例可以根据实际情况预设理想信号强度、中等信号强度、弱信号强度的取值范围。
需要说明的是,接收信号强度=发射功率+接收天线增益+发射天线增益-电缆和缆头的衰耗-自由空间损耗。
步骤S204,若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;
步骤S206,若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
通过上述步骤,当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令,解决了相关技术中,智能设备不能灵活根据网络情况确定等待时长等问题,本发明实施例可以通过智能设备的当前网络质量确定所述智能设备的等待时长,进而可以灵活确定等待时长,以及灵活确定响应语音服务器反馈的第一语音识别控制指令或者语音识别模型识别的第二语音识别控制指令。
步骤S204中,根据当前网络质量的网络等级确定等待时长的确定方式有很多种,本发明实施例给出了一种实现方式,具体的:确定所述网络等级对应的网络等级系数;确定在预设时间段内响应第三语音识别控制指令的次数,以及确定所述次数与第一预设阈值的第一大小关系,其中,所述第三语音识别控制指令为所述预置的语音识别模型识别历史语音控制信息得到的控制指令;根据所述第一大小关系和所述网络等级系数确定所述等待时长。
需要说明的是,网络等级可以理解为:理想信号强度等级、中等信号强度等级、弱信号强度等级;还可以理解为:第一等级、第二等级……第N等级,在第一等级为最高等级的情况下,第N等级为最低等级;在第一等级为最低等级的情况下,第N等级为最高等级。本发明实施例可以根据实际情况预设不同等级的信号强度取值范围。
举例来讲,预设-70dBm为理想信号强度,-70dBm—-80dBm为中等信号强度,小于-80dBm为弱信号强度,理想信号强度对应的网络等级系数为1,中等信号强度对应的网络等级系数为0.8,弱信号强度对应的网络等级系数为0.6。在智能设备确定当前网络质量为-75dBm的情况下,确定当前网络质量为中等信号强度,对应的网络等级系数为0.8。
在一个示例性实施例中,根据所述第一大小关系和所述网络等级系数确定所述等待时长,包括以下两种情况:
1)在所述第一大小关系指示所述次数小于或等于所述第一预设阈值的情况下,确定所述次数与第二预设阈值的第二大小关系,根据所述第二大小关系和所述网络等级系数确定所述等待时长;
2)在所述第一大小关系指示所述次数大于所述第一预设阈值的情况下,确定所述等待时长为目标值。
也就是说,在情况1)中,说明在线语音命令偶尔超时,因此,进一步根据所述第二大小关系和所述网络等级系数确定智能设备的等待时长,可以进一步地缩短智能设备的等待时长。在情况2)中,说明在线语音命令连续多次超时,辅助确定此时的网络强度非常差,直接执行预置的语音识别模型识别语音控制信息得到的控制指令,进而解决了相关技术中,智能设备不能灵活根据网络情况确定等待时长等问题,本发明实施例可以通过当前网络质量确定所述等待时长,进而可以灵活确定等待时长,以及灵活确定响应语音服务器反馈的第一语音识别控制指令或者语音识别模型识别的第二语音识别控制指令。
在一个示例性实施例中,根据所述第二大小关系和所述网络等级系数确定所述等待时长,包括:在所述第二大小关系指示所述次数大于或等于所述第二预设阈值的情况下,确定所述默认等待时长系数,计算所述等待时长系数、所述网络等级系数与默认等待时长的第一乘积,并确定所述第一乘积为所述等待时长;在所述第二大小关系指示所述次数大于所述第一预设阈值的情况下,计算所述网络等级系数与默认等待时长的第二乘积,并确定所述第二乘积为所述等待时长。
举例来讲,预设-70dBm为理想信号强度,-70dBm—-80dBm为中等信号强度,小于-80dBm为弱信号强度,理想信号强度对应的网络等级系数为1,中等信号强度对应的网络等级系数为0.8,弱信号强度对应的网络等级系数为0.6,第二预设阈值为10,等待时长系数为0.8。在智能设备确定当前网络质量为-75dBm的情况下,确定当前网络质量为中等信号强度,对应的网络等级系数为0.8;在智能设备连续执行预置的语音识别模型识别语音控制信息得到的控制指令的次数为9的情况下,确定等待时长=0.8*默认等待时长。在智能设备连续执行预置的语音识别模型识别语音控制信息得到的控制指令的次数为13的情况下,确定等待时长=0.8*0.8*默认等待时长。
也就是说,本发明实施例在所述第二大小关系指示所述次数小于或等于所述第二预设阈值的情况下,通过等待时长系数、所述网络等级系数与默认等待时长的第二乘积确定等待时长;在所述第二大小关系指示所述次数大于所述第二预设阈值的情况下,在接收到语音控制信息时,基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令,无需等待设定语音服务器反馈的第一语音识别控制指令。进而解决了相关技术中,智能设备不能灵活根据网络情况确定等待时长等问题,达到了根据当前网络质量和执行预置的语音识别模型识别语音控制信息得到的控制指令的次数灵活确定等待时长的技术效果。
在一个示例性实施例中,根据当前网络质量的网络等级确定等待时长之前,还包括:确定是否与配网设备建立网络连接;在与所述配网设备建立网络连接的情况下,确定与所述配网设备建立的网络连接的当前网络质量;在与所述配网设备未建立网络连接的情况下,基于预置的语音识别模型识别所述语音控制信息,得到并响应所述第二语音识别控制指令。
也就是说,接收离线语音命令后,需要判断当前智能设备是否已连接网络,若未连接网络,则立即基于预置的语音识别模型识别所述语音控制信息,得到并响应所述第二语音识别控制指令,并结束本次操作;若已连接网络,则需要继续判断当前网络质量,并根据当前网络质量确定等待时长。相较于相关技术中,无论在是否联网的情况下,均需等待预先设定的等待时长,本发明实施例可以更加快速且灵活地确定是否执行预置的语音识别模型识别语音控制信息得到的控制指令。
在一个示例性实施例中,根据当前网络质量的网络等级确定等待时长之后,所述方法至少包括以下之一:周期性地确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长;在成功响应所述第一语音识别控制指令的情况下,确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长。
需要说明的是,本发明实施例需要触发检测当前网络质量,因此,需要确定触发检测当前网络质量的触发条件,具体的:1)周期性检测当前网络质量,例如,设置一个周期定时检测时间,例如每40s检测当前网络质量,并根据当前网络质量更新所述等待时长;2)在成功响应所述第一语音识别控制指令的情况下,检测当前网络质量,并根据确定后的当前网络质量更新所述等待时长。
在一个示例性实施例中,根据当前网络质量的网络等级确定等待时长之后,还包括:若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,将在预设时间段内响应第三语音识别控制指令的次数加目标值;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,将在预设时间段内响应第三语音识别控制指令的次数清零。
需要说明的是,上述目标值可以理解为一。
为了更好的理解上述语音指令的响应方法的过程,以下再结合可选实施例对上述语音指令的响应的实现方法流程进行说明,但不用于限定本申请实施例的技术方案。
在本实施例中提供了一种语音指令的响应方法,图4是根据本申请可选实施例的语音指令的响应方法的流程图,如图4所示,具体如下步骤:
步骤S401:开始;
步骤S402:收集网络信号强度数据(相当于上述实施例中的当前网络质量);
智能设备实时检测当前网络状态,将网络信号分级,信号越差,级别越低,网络信号系数也越低。
步骤S403:接收离线语音命令(相当于上述实施例中的第二语音识别控制指令);
接收离线语音命令,离线语音命令先于在线语音命令(相当于上述实施例中的第一语音识别控制指令)被接收,因此需要根据实际情况判断是否执行离线语音命令。如图3所示。如下图所示,离线语音命令由于是本地算法提供,先于在线语音命令被接收(time1),两个命令的接收间隔(interval)如果大于设定的阈值(interval threshold),则在线语音命令超时,执行离线语音命令。如果网络信号较差,则在线语音命令回复慢,大概率会超时,在这种情况下,智能设备仍然需要等待设定的阈值时间超时才会执行。
步骤S404:判断智能设备是否联网;
在接收离线语音命令后,需要判断智能设备是否已连接网络,若未连接网络,则立即执行步骤S412;若已连接网络,则需要执行步骤S405;
步骤S405:是否检测语音离在线状态,在检测语音离在线状态的情况下,执行步骤S406,否则执行步骤S408;
无论当前网络状态如何,都需要定期设置一个系统等待时长(T),此系统等待时长的目的是为了周期性的检测网络状态,进而判断之后使用哪种语音命令。此设计主要针对网络状态比较复杂的情况,一开始网络状态差,设备缩短等待时长(如0.8*T)甚至直接使用离线语音命令以提高语音交互响应,但是每隔一段时长(如30秒),则会发送设置一个较长的等待时长(如T),若在线语音命令仍然超时,则继续缩短等待时长(0.8T);若在线语音命令在超时前被接收到,则恢复系统等待时长(T)。
步骤S406:设置设备等待时长为系统等待时长;
步骤S407:检测连续执行离线语音命令次数是否大于最大值M,在大于最大值的情况下执行步骤S408,否则执行步骤S412;
步骤S408:检测连续执行离线语音命令次数是否大于预期的需要缩减等待时长的次数N,在大于次数N的情况下执行步骤S409,否则执行步骤S410;
步骤S409:根据网络信号强度和等待时长系数确定超时时间(超时时间=T*网络信号强度系数*等待时长系数);
步骤S410:根据网络信号强度确定超时时间(超时时间=T*网络信号强度系数);
步骤S411:启动定时器。
步骤S412:执行离线语音指令;
步骤S413:结束。
在一个实施例中,例如:网络各状态对应的等待时长计算方式如表1所示:
表1
需要说明的是:网络等级系数<=1,等待时长系数<1
系统默认等待时长为1500毫秒,网络等级系数为(1级:0.8;2级:0.9;3级:0.95),当前网络等级为2级,等待时长系数为0.7,N为10次,M为25次,语音离在线检测时间为40秒。
若在线语音命令指令未超时,则等待时长是1500毫秒;
若在线语音命令偶尔超时1-2次(未超过N),则等待时长是1500毫秒;
若在线语音命令经常超时,在连续超时10次(N)之前,等待时长是1500毫秒,并累加连续离线语音命令执行个数;
在连续超时10次(N)之后,等待时长调整为945毫秒(系统默认等待时长*网络等级系数*等待时长系数),并累加连续离线语音命令执行个数;
在连续超时25次(M)之后,收到离线语音指令后立即执行,无需等待在线语音指令,并累加连续离线语音命令执行个数;
在上述任何情况下,每隔40秒(语音离在线检测时间),在线语音超时时间都要设置为40秒,若在线语音仍然超时,则收到仍然按照当前的超时时间设置,并累加连续离线语音命令执行个数;若在线语音命令未超时,则需将超时时间恢复为1500毫秒(系统默认等待时长),且将连续离线语音命令执行个数清零。
需要说明的是,只要在线语音命令未超时,则需将超时时间恢复为1500毫秒(系统默认等待时长),且将连续离线语音命令执行个数清零。
需要说明的是,本发明实施例中的智能设备既可以在接收到语音控制信息时,同时将所述语音控制信息发送至设定语音服务器进行语音识别,以及通过智能设备的预置的语音识别模型识别所述语音控制信息;也可以在接收到语音控制信息时,先将所述语音控制信息发送至设定语音服务器进行语音识别,若在所述等待时长内未接收到所述设定语音服务器反馈的在线语音指令,通过预置的语音识别模型识别所述语音控制信息,得到并响应离线语音指令,本发明实施例不作限定。
通过上述实施例,在设备连接网络但是网络信号差时,检测网络信号并结合之前的离在线语音命令使用情况,优化收到离线语音命令后等待在线语音命令的时间,在网络信号差时缩短语音命令响应时间,同时不影响网络信号良好时的语音命令响应速度,让用户在任何网络情况下都可以体验到流畅的语音交互,进而提高语音对话的流畅度和用户体验感。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
图5是根据本申请实施例的一种语音指令的响应装置的结构框图;如图5所示,包括:
确定模块52,用于当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;
响应模块54,用于若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;
识别模块56,用于若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
通过上述装置,当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令,解决了相关技术中,智能设备不能灵活根据网络情况确定等待时长等问题,本发明实施例可以通过当前网络质量确定所述等待时长,进而可以灵活确定等待时长,以及灵活确定响应语音服务器反馈的第一语音识别控制指令或者语音识别模型识别的第二语音识别控制指令。
在一个示例性实施例中,确定模块52,用于确定所述网络等级对应的网络等级系数;确定在预设时间段内响应第三语音识别控制指令的次数,以及确定所述次数与第一预设阈值的第一大小关系;根据所述第一大小关系和所述网络等级系数确定所述等待时长。
在一个示例性实施例中,确定模块52,用于在所述第一大小关系指示所述次数小于或等于所述第一预设阈值的情况下,确定所述次数与第二预设阈值的第二大小关系,根据所述第二大小关系和所述网络等级系数确定所述等待时长;在所述第一大小关系指示所述次数大于所述第一预设阈值的情况下,确定所述等待时长为目标值。
在一个示例性实施例中,确定模块52,用于在所述第二大小关系指示所述次数大于或等于所述第二预设阈值的情况下,确定所述默认等待时长系数,计算所述等待时长系数、所述网络等级系数与默认等待时长的第一乘积,并确定所述第一乘积为所述等待时长;在所述第二大小关系指示所述次数大于所述第一预设阈值的情况下,计算所述网络等级系数与默认等待时长的第二乘积,并确定所述第二乘积为所述等待时长。
在一个示例性实施例中,确定模块52,用于确定是否与配网设备建立网络连接;在与所述配网设备建立网络连接的情况下,确定与所述配网设备建立的网络连接的当前网络质量;在与所述配网设备未建立网络连接的情况下,基于预置的语音识别模型识别所述语音控制信息,得到并响应所述第二语音识别控制指令。
在一个示例性实施例中,确定模块52,用于至少以下之一:周期性地确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长;在成功响应所述第一语音识别控制指令的情况下,确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长。
在一个示例性实施例中,确定模块52,用于若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,将所述智能设备在预设时间段内响应第三语音识别控制指令的次数加目标值;若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,将所述智能设备在预设时间段内响应第三语音识别控制指令的次数清零。
本申请的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;
S2,若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;
S3,若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
本申请的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,根据当前网络质量的网络等级确定等待时长;
S2,若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;
S3,若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种语音指令的响应方法,其特征在于,包括:
当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;
若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;
若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
2.根据权利要求1所述的语音指令的响应方法,其特征在于,根据当前网络质量的网络等级确定等待时长,包括:
确定所述网络等级对应的网络等级系数;
确定在预设时间段内响应第三语音识别控制指令的次数,以及确定所述次数与第一预设阈值的第一大小关系,其中,所述第三语音识别控制指令为所述预置的语音识别模型识别历史语音控制信息得到的控制指令;
根据所述第一大小关系和所述网络等级系数确定所述等待时长。
3.根据权利要求2所述的语音指令的响应方法,其特征在于,根据所述第一大小关系和所述网络等级系数确定所述等待时长,包括:
在所述第一大小关系指示所述次数小于或等于所述第一预设阈值的情况下,确定所述次数与第二预设阈值的第二大小关系,根据所述第二大小关系和所述网络等级系数确定所述等待时长;
在所述第一大小关系指示所述次数大于所述第一预设阈值的情况下,确定所述等待时长为目标值。
4.根据权利要求3所述的语音指令的响应方法,其特征在于,根据所述第二大小关系和所述网络等级系数确定所述等待时长,包括:
在所述第二大小关系指示所述次数大于或等于所述第二预设阈值的情况下,确定默认等待时长系数,计算所述等待时长系数、所述网络等级系数与默认等待时长的第一乘积,并确定所述第一乘积为所述等待时长;
在所述第二大小关系指示所述次数大于所述第一预设阈值的情况下,计算所述网络等级系数与默认等待时长的第二乘积,并确定所述第二乘积为所述等待时长。
5.根据权利要求1所述的语音指令的响应方法,其特征在于,根据当前网络质量的网络等级确定等待时长之前,所述方法还包括:
确定是否与配网设备建立网络连接;
在与所述配网设备建立网络连接的情况下,确定与所述配网设备建立的网络连接的当前网络质量;
在与所述配网设备未建立网络连接的情况下,基于预置的语音识别模型识别所述语音控制信息,得到并响应所述第二语音识别控制指令。
6.根据权利要求1所述的语音指令的响应方法,其特征在于,根据当前网络质量的网络等级确定等待时长之后,所述方法至少包括以下之一:
周期性地确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长;
在成功响应所述第一语音识别控制指令的情况下,确定当前网络质量,并根据确定后的当前网络质量更新所述等待时长。
7.根据权利要求2所述的语音指令的响应方法,其特征在于,根据当前网络质量的网络等级确定等待时长之后,所述方法还包括:
若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,将在预设时间段内响应第三语音识别控制指令的次数加上目标值若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,将在预设时间段内响应第三语音识别控制指令的次数清零。
8.一种语音指令的响应装置,其特征在于,包括:
确定模块,用于当接收到语音控制信息时,将所述语音控制信息发送至设定语音服务器进行语音识别,并根据当前网络质量的网络等级确定等待时长;响应模块,用于若在所述等待时长内接收到所述设定语音服务器反馈的第一语音识别控制指令,则响应所述第一语音识别控制指令;
识别模块,用于若在所述等待时长内未接收到所述设定语音服务器反馈的第一语音识别控制指令,则基于预置的语音识别模型识别所述语音控制信息,得到并响应第二语音识别控制指令。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310095496.4A CN116092498A (zh) | 2023-01-31 | 2023-01-31 | 语音指令的响应方法和装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310095496.4A CN116092498A (zh) | 2023-01-31 | 2023-01-31 | 语音指令的响应方法和装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116092498A true CN116092498A (zh) | 2023-05-09 |
Family
ID=86210048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310095496.4A Pending CN116092498A (zh) | 2023-01-31 | 2023-01-31 | 语音指令的响应方法和装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116092498A (zh) |
-
2023
- 2023-01-31 CN CN202310095496.4A patent/CN116092498A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116016002A (zh) | 智能家电配网方法、装置及电子装置 | |
CN116092498A (zh) | 语音指令的响应方法和装置、存储介质及电子装置 | |
CN115309062A (zh) | 设备的控制方法、装置、存储介质及电子装置 | |
CN114915514B (zh) | 意图的处理方法和装置、存储介质及电子装置 | |
CN115345225A (zh) | 推荐场景的确定方法及装置、存储介质及电子装置 | |
CN115148204B (zh) | 语音唤醒的处理方法及装置、存储介质及电子装置 | |
CN114992970A (zh) | 清洁指令的发送方法、装置、存储介质及电子装置 | |
CN115312048A (zh) | 设备唤醒方法及装置、存储介质及电子装置 | |
CN115314331B (zh) | 智能终端的控制方法和装置、存储介质及电子装置 | |
CN117527459A (zh) | 智能设备的控制方法和装置、存储介质及电子装置 | |
CN115616930A (zh) | 控制指令的发送方法及装置、存储介质及电子装置 | |
CN117542355A (zh) | 分布式语音唤醒方法和装置、存储介质及电子装置 | |
CN116246624A (zh) | 智能设备的语音控制方法、装置、存储介质及电子装置 | |
CN116483449A (zh) | 设备唤醒方法和装置、存储介质及电子装置 | |
CN115001885B (zh) | 设备控制方法及装置、存储介质及电子装置 | |
CN115312049A (zh) | 指令的响应方法、存储介质及电子装置 | |
CN117542356A (zh) | 智能设备的语音唤醒方法、存储介质及电子装置 | |
CN115312050A (zh) | 指令的响应方法、存储介质及电子装置 | |
CN117749843A (zh) | 场景的触发方法和装置、存储介质及电子装置 | |
CN115148204A (zh) | 语音唤醒的处理方法及装置、存储介质及电子装置 | |
CN117879984A (zh) | 应用于智能家居设备的消息接收免打扰处理方法及装置 | |
CN116009438A (zh) | 控制场景生成方法、装置、存储介质及电子装置 | |
CN116382110A (zh) | 设备调度方法及装置、存储介质及电子装置 | |
CN116007028A (zh) | 档位调节方法和装置、存储介质及电子装置 | |
CN117524211A (zh) | 分布式语音唤醒方法和装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |