CN111540352B - 工作状态切换方法和装置 - Google Patents

工作状态切换方法和装置 Download PDF

Info

Publication number
CN111540352B
CN111540352B CN202010296233.6A CN202010296233A CN111540352B CN 111540352 B CN111540352 B CN 111540352B CN 202010296233 A CN202010296233 A CN 202010296233A CN 111540352 B CN111540352 B CN 111540352B
Authority
CN
China
Prior art keywords
voice
voice module
module
logic control
controlled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010296233.6A
Other languages
English (en)
Other versions
CN111540352A (zh
Inventor
李云喷
司帅帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
Sipic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sipic Technology Co Ltd filed Critical Sipic Technology Co Ltd
Priority to CN202010296233.6A priority Critical patent/CN111540352B/zh
Publication of CN111540352A publication Critical patent/CN111540352A/zh
Application granted granted Critical
Publication of CN111540352B publication Critical patent/CN111540352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开工作状态切换方法和装置,其中,一种工作状态切换方法,用于语音模组,包括:经由语音模组与各受控设备的连接,获取并存储各受控设备的逻辑控制映射表,其中,语音模组通过带状态感知的可编程逻辑开关装置与各受控设备建立连接;响应于语音模组经由带状态感知的可编程逻辑开关装置检测到各受控设备中某一受控设备发生工作状态变更,提示用户修改某一受控设备的至少一个预设属性;获取并识别用户语音输入的与预设属性对应的修改信息;基于修改信息形成新的逻辑控制信息;以及基于新的逻辑控制信息更新逻辑控制映射表以形成新的控制协议并基于新的控制协议对某一受控设备进行控制。

Description

工作状态切换方法和装置
技术领域
本发明属于智能对话技术领域,尤其涉及工作状态切换方法和装置。
背景技术
市面上语音模组中控开关通过WIFI/ZigBee/BT(Bluetooth)/RS485/CAN/物理连线等连接受控设备,修改受控设备名字需辅助APP修改,所以语音模组需要实现和手机的联网功能。
市面上语音模块也是采用语音识别控制受控设备,但是需要连接网络,语音模组没有集成可编程控制开关,只能通过辅助APP修改语音模块名,没有涉及到语音模块和受控设备之间动态控制逻辑的修改。
发明内容
本发明实施例提供一种工作状态切换方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种工作状态切换方法,用于语音模组,包括:经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接;响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性;获取并识别用户语音输入的与所述预设属性对应的修改信息;基于所述修改信息形成新的逻辑控制信息;以及基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
第二方面,本发明实施例提供一种工作状态切换方法,用于受控设备,包括:响应于经由所述受控设备与所述语音模组的连接,接收所述语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接;基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的预设属性修改信息;以及接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
第三方面,本发明实施例提供一种工作状态切换装置,用于语音模组,包括:存储模块,配置为经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接;检测模块,配置为响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性;获取识别模块,配置为获取并识别用户语音输入的与所述预设属性对应的修改信息;修改模块,配置为基于所述修改信息形成新的逻辑控制信息;以及控制协议生成模块,配置为基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
第四方面,本发明实施例提供一种工作状态切换装置,用于受控设备,包括:接收模块,配置为响应于经由所述受控设备与所述语音模组的连接,接收所述语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接;反馈模块,配置为基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;变更触发模块,配置为接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的预设属性修改信息;更新模块,配置为接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
第五方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的工作状态切换方法的步骤。
第六方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的工作状态切换方法的步骤。
本申请的方法和装置提供的方案通过带状态感知的可编程逻辑开关装置是的语音模组与受控设备之间建立连接,之后受控设备发生状态变更语音模组能够及时感知,并通过采集用户的语音输入的修改信息对设备的预设属性进行修改。从而可以提供给用户一种语音修改受控设备的方式,无需联网,避免物理接触,还能实现个性化修改和定制,充分解放人们的双手,提高生活品质。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种用于语音模组的工作状态切换方法的流程图;
图2为本发明一实施例提供的另一种用于语音模组的工作状态切换方法的流程图;
图3为本发明一实施例提供的一种用于受控设备的工作状态切换方法的流程图;
图4为本发明一实施例提供的一种工作状态切换方法的一具体实施例的逻辑架构图;
图5为本发明一实施例提供的一种工作状态切换方法的一具体实施例的业务流程图;
图6为本发明一实施例提供的一种用于语音模组的工作状态切换装置的框图;
图7为本发明一实施例提供的一种用于受控设备的工作状态切换装置的框图;
图8是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其示出了本申请的工作状态切换方法一实施例的流程图,本实施例的工作状态切换方法可以适用于与一个或多个受控设备连接的智能语音模组,例如安装在电梯上的智能语音模组、与智能家居连接的智能音箱等,本申请在此没有限制。
如图1所示,在步骤101中,经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表;
在步骤102中,响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性;
在步骤103中,获取并识别用户语音输入的与所述预设属性对应的修改信息;
在步骤104中,基于所述修改信息形成新的逻辑控制信息;
在步骤105中,基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
在本实施例中,对于步骤101,语音模组可以通过物理连接的方式与各受控设备建立连接,之后语音模组经由该连接获取并存储各受控设备的逻辑控制映射表,其中,该语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接,能够在受控设备的状态发生改变后及时与用户交互获取用户对受控设备的修改信息。
之后,对于步骤102,当语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更时,及时通知并提示用户语音输入针对该状态发生变更的某一受控设备的至少一个预设属性的修改信息。
之后,对于步骤103,获取并识别用户语音输入的与所述预设属性对应的修改信息,其中,预设属性可以一些与该设备相关的属性,例如设备名、设备需要加入的场景模式等。然后,对于步骤104,语音模组基于所述修改信息形成新的逻辑控制信息,因为设备的预设属性发生更改了,则逻辑控制信息中与发生修改的属性相关的内容也需要进行相应的修改并形成新的逻辑控制信息。最后,对于步骤105,基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
本申请实施例的方法通过带状态感知的可编程逻辑开关装置是的语音模组与受控设备之间建立连接,之后受控设备发生状态变更语音模组能够及时感知,并通过采集用户的语音输入的修改信息对设备的预设属性进行修改。从而可以提供给用户一种语音修改受控设备的方式,无需联网,避免物理接触,还能实现个性化修改和定制,充分解放人们的双手,提高生活品质。
进一步参考图2,其示出了本申请一实施例提供的另一种工作状态切换方法的流程图。该流程图主要是针对图1中步骤105中“基于新的控制协议对所述某一受控设备进行控制”进一步限定的步骤的流程图。
如图2所示,在步骤201中,所述语音模组采集用户语音并对所述用户语音进行语音活性检测;
在步骤202中,对经过语音活性检测通过后的用户语音进行前端语音处理;
在步骤203中,将前端语音处理后的用户音频发送至语音识别系统进行语音识别处理,获取所述语音识别系统的识别结果;
在步骤204中,基于所述控制协议对所述识别结果进行编码,将编码后的结果发送至所述某一受控设备以对所述某一受控设备进行控制。
在本实施例中,对于步骤201,语音模组采集某一空间或者某一范围内语音,然后对该语音进行语音活性检测,检测该语音中是否包含人声,如果包含人声则检测通过,不包含人声则检测不通过。然后,对于步骤202,语音模组对经过语音活性检测且检测通过后的用户语音进行前端语音处理,前端处理可以包括对用户语音先进行回声消除,然后再做定向增强,本申请在此没有限制。之后,对于步骤203中,语音模组将经过前端语音处理后的用户音频发送至语音识别系统进行语音识别处理,语音识别系统会输出识别结果,语音模组获取该语音识别系统的识别结果。最后,对于步骤204中,语音模组基于控制协议对获取的语音识别结果进行编码,将编码后的结果发送至所述某一受控设备以对所述某一受控设备进行控制。例如,智能语音模组可以通过物理连接/WIFI/BT(蓝牙)/CAN/RS485/LAN/ModBUS等协议发送协议编码到受控设备,本申请在此没有限制。
在本实施例中,语音模组通过对采集的语音进行一系列的处理,然后再发送至语音识别系统进行语音识别,之后基于识别后的结果对各受控设备进行控制。从而可以实现基于更新后的设备名和控制逻辑对与语音模组绑定的各受控设备进行语音控制。
在一些可选的实施例中,所述至少一个预设属性包括设备名和待加入的特定场景模式。从而用户可以语音修改设备名和待加入的特定场景模式,例如可以将当前受控设备加入至“会客模式”、“回家模式”等,本申请在此没有限制,在此不再赘述。
请参考图3,其示出了本申请一实施例提供的一种用于受控设备的工作状态切换方法的流程图。
如图3所示,在步骤301中,响应于经由所述受控设备与所述语音模组的连接,接收所述语音模组的逻辑控制信息获取请求;
在步骤302中,基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;
在步骤303中,接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的预设属性修改信息;
在步骤304中,接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
在本实施例中,对于步骤303,受控设备与语音模组建立连接,然后受控设备经由该连接接收语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接。之后,对于步骤302,受控设备在接到逻辑信息获取请求后将语音模组所需的信息反馈给该语音模组。之后,对于步骤303,当接收到用户对受控设备的状态变更触发指令之后,将该触发指令经由语音模组的带状态感知的可编程逻辑开关反馈至语音模组以使语音模组采集用户语音输入的预设属性修改信息,其中,用户触发的方式可以是按键、触摸或者扫码,在此不再赘述。最后,对于步骤304,受控设备在接收语音模组根据该预设属性修改信息更新的逻辑控制信息之后,可以基于该修改后的逻辑控制信息对之后语音模组的控制进行相应的反馈或者响应。
本实施例的方法通过受控设备与语音模组建立的连接采集受控设备的逻辑控制信息,之后响应于用户的触发反馈至语音模组,并经由语音模组接收用户的修改信息,最后根据修改后的逻辑控制信息对语音模组后续发来的命令进行响应和反馈,从而可以实现在无需联网的情况下也能与语音模组建立连接并接受语音模组的控制。
在一些可选的实施例中,所述工作状态切换装置包括以以下任一形式被触发:机械按键,触摸按键,触摸屏,控制感知传感器,无线遥控,RFID,NFC,感应线圈,二维码。
下面对通过描述发明人在实现本发明的过程中遇到的一些问题和对最终确定的方案的一个具体实施例进行说明,以使本领域技术人员更好地理解本申请的方案。
现有技术的方案,至少存在以下缺陷:语音模块必须支持WIFI/BT/ZigBee等网络连接,增加了模组的成本,没办法同时修改受控设备名字又同时支持修改被控的逻辑,比如把某一个受控设备加入语音模组的“回家模式”等。
发明人在实现本申请的过程中,发现现有技术中存在的问题主要是由于以下内容导致的:1、语音模组必须支持WIFI/BT/ZigBee等网络连接,需要获得受控设备的唯一标识并建立基本的映射逻辑,同时语音模组需直接集成可编程逻辑开关装置,通过物理连线控制受控设备。2、需要语音模组有管理受控设备的能力,需要语音模组能动态修改受控设备名并进行识别模型的训练。
由于自定义语音模块需要集成多个学科的技术,首先需要了解受控设备协议架构流程,控制逻辑,通信协议等,然后还需要熟悉智能语音行业的语音前端算法AEC(回声消除),Beamforming(波束成形),ASR(语音识别),DNN/RNN/CNN等深度神经网络算法;所以智能语音模块系统是一项复杂的需要有多个学科技术实力的公司才能设计方案,一般公司很少会有熟悉全部流程的专业人才。因此本领域技术人员不容易想到本申请的技术方案。
本申请实施例提供的语音模组可以在不需要联网的基础下修改被控设备名字,并进行1对1,1对多或者多对多的控制逻辑映射,并支持特定场景下修改被控设备映射关系。
本申请实施例提供的语音模组集成了可编程逻辑开关装置,该逻辑开关装置可感知受控设备的工作状态,并集成了修改语音模组工作状态的按钮/触摸按键/触摸板等,同时受控设备也会集成可修改工作状态的按钮/触摸按键/触摸板等;当激活受控设备工作状态开关后,语音模组收到工作状态变化的信息,通过思必驰语音识别技术,重新命名新设备或者加入新的控制逻辑场景,并把控制逻辑进行映射后保存到语音模块,然后语音模块把声音转换成文字,把文字转换成控制命令,根据已保存的设备映射逻辑通过可编程逻辑开关装置控制受控设备。
软件实现逻辑如下:
第一步:语音采集模组通过可编程逻辑开关装置和受控设备连接
第二步:存储受控设备(1个或者多个)逻辑控制信息
第三步:受控设备通过按钮/触摸按键/触摸板等触发工作状态变更
第四步:语音模组检测到具体某个设备状态变更,语音提示客户修改名字或者加入特定业务场景(比如:回家模式)
第五步:语音模组识别到客户说出的新的设备的名字或者加入的特定场景的名字
第六步:语音模组生成并保存新的受控设备名字和新的特定场景的逻辑信息
第七步:根据新的受控设备名和逻辑信息转换成对应的控制协议
第八步:思必驰语音模组启动麦克风采集周围声音并送至思必驰前端语音算法
第九步:语音模组输出并判断识别结果,然后编码。
第十步:语音模组根据编码结果控制对应的可编程逻辑开关装置来控制受控设备。
说明:
带状态感知的可编程开关装置:是指一种可以控制被控设备的开关器件,在操作该器件的同时可以反馈一个该器件的状态;该开关装置包括但不限于:可以是二值状态,可以是多值状态,可以是连续状态;开关具体实现可以是机械,按键或者触摸,也可以是遥控等方式;状态反馈的实现方式可以是机械的,模拟电信号或者数字编码信号等方式。
工作状态切换装置:是指包括但不限于机械按键,触摸按键,触摸屏,控制感知传感器,无线遥控,RFID,NFC,感应线圈,二维码等装置。
本申请实施例提供的智能语音模块,避免物理接触,还能实现更个性话的控制设备组合,多场景定期需求,充分解放人们的双手,提高生活品质。
请参考图6,其示出了本发明一实施例提供的一种用于语音模组的工作状态切换装置的框图。
如图6所示,工作状态切换装置600,包括存储模块610、检测模块620、获取识别模块630、修改模块640和控制协议生成模块650。
其中,存储模块610,配置为经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接;检测模块620,配置为响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性;获取识别模块630,配置为获取并识别用户语音输入的与所述预设属性对应的修改信息;修改模块640,配置为基于所述修改信息形成新的逻辑控制信息;以及控制协议生成模块650,配置为基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
请参考图7,其示出了本发明一实施例提供的一种用于语音模组的工作状态切换装置的框图。
如图7所示,工作状态切换装置700包括接收模块710、反馈模块720、变更触发模块730和更新模块740。
其中,接收模块710,配置为响应于经由所述受控设备与所述语音模组的连接,接收所述语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接;反馈模块720,配置为基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;变更触发模块730,配置为接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的预设属性修改信息;以及更新模块740,配置为接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
在一些可选的实施例中,上述工作状态切换装置可以包括机械按键,触摸按键,触摸屏,控制感知传感器,无线遥控,RFID,NFC,感应线圈,二维码。从而工作状态切换装置可以通过这些方式进行工作状态切换的触发。
应当理解,图6和图7中记载的诸模块与参考图1和图3中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图6和图7中的诸模块,在此不再赘述。
值得注意的是,本申请的实施例中的模块并不用于限制本申请的方案,例如修改模块可以描述为基于所述修改信息形成新的逻辑控制信息的模块。另外,还可以通过硬件处理器来实现相关功能模块,例如结果返回模块也可以用处理器实现,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的用于语音模组的工作状态切换方法;
经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接;
响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性;
获取并识别用户语音输入的与所述预设属性对应的修改信息;
基于所述修改信息形成新的逻辑控制信息;
基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的用于受控设备的工作状态切换方法;
响应于经由所述受控设备与所述语音模组的连接,接收所述语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接;
基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;
接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的预设属性修改信息;
接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据工作状态切换装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至工作状态切换装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项工作状态切换方法。
图8是本发明实施例提供的电子设备的结构示意图,如图8所示,该设备包括:一个或多个处理器810以及存储器820,图8中以一个处理器810为例。工作状态切换方法的设备还可以包括:输入装置830和输出装置840。处理器810、存储器820、输入装置830和输出装置840可以通过总线或者其他方式连接,图8中以通过总线连接为例。存储器820为上述的非易失性计算机可读存储介质。处理器810通过运行存储在存储器820中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例工作状态切换方法。输入装置830可接收输入的数字或字符信息,以及产生与工作状态切换装置的用户设置以及功能控制有关的键信号输入。输出装置840可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于工作状态切换装置中,用于语音模组,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接;
响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性;
获取并识别用户语音输入的与所述预设属性对应的修改信息;
基于所述修改信息形成新的逻辑控制信息;
基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
作为一种实施方式,上述电子设备应用于工作状态切换装置中,用于受控设备,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
响应于经由所述受控设备与所述语音模组的连接,接收所述语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接;
基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;
接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的预设属性修改信息;
接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种工作状态切换方法,用于语音模组,包括:
经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接;
响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性,其中,所述预设属性包括设备名和待加入的特定场景模式;
获取并识别用户语音输入的与所述预设属性对应的修改信息;
基于所述修改信息形成新的逻辑控制信息;
基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
2.根据权利要求1所述的方法,其中,所述基于所述新的控制协议对所述某一受控设备进行控制包括:
所述语音模组采集用户语音并对所述用户语音进行语音活性检测;
对经过语音活性检测通过后的用户语音进行前端语音处理;
将前端语音处理后的用户音频发送至语音识别系统进行语音识别处理,获取所述语音识别系统的识别结果;
基于所述控制协议对所述识别结果进行编码,将编码后的结果发送至所述某一受控设备以对所述某一受控设备进行控制。
3.根据权利要求1或2所述的方法,其中,所述受控设备物理连接到所述语音模组的带状态改制的可编程控制开关装置。
4.一种工作状态切换方法,用于受控设备,包括:
响应于经由所述受控设备与语音模组的连接,接收所述语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接;
基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;
接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的对于预设属性的修改信息,其中,所述预设属性包括设备名和待加入的特定场景模式;
接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
5.一种工作状态切换装置,用于语音模组,包括:
存储模块,配置为经由所述语音模组与各受控设备的连接,获取并存储所述各受控设备的逻辑控制映射表,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述各受控设备建立连接;
检测模块,配置为响应于所述语音模组经由所述带状态感知的可编程逻辑开关装置检测到所述各受控设备中某一受控设备发生工作状态变更,提示用户修改所述某一受控设备的至少一个预设属性,其中,所述预设属性包括设备名和待加入的特定场景模式;
获取识别模块,配置为获取并识别用户语音输入的与所述预设属性对应的修改信息;
修改模块,配置为基于所述修改信息形成新的逻辑控制信息;
控制协议生成模块,配置为基于所述新的逻辑控制信息更新所述逻辑控制映射表以形成新的控制协议并基于所述新的控制协议对所述某一受控设备进行控制。
6.一种工作状态切换装置,用于受控设备,包括:
接收模块,配置为响应于经由所述受控设备与语音模组的连接,接收所述语音模组的逻辑控制信息获取请求,其中,所述语音模组通过带状态感知的可编程逻辑开关装置与所述受控设备建立连接;
反馈模块,配置为基于所述逻辑控制信息获取请求将所述受控设备的逻辑控制信息反馈给所述语音模组;
变更触发模块,配置为接收用户对所述受控设备的状态变更触发指令,将所述状态变更触发指令反馈至所述语音模组以使所述语音模组采集用户语音输入的对于预设属性的修改信息,其中,所述预设属性包括设备名和待加入的特定场景模式;
更新模块,配置为接收所述语音模组基于所述预设属性修改信息更新后的逻辑控制信息并基于所述修改后的逻辑控制信息对所述语音模组的控制进行反馈。
7.根据权利要求6所述的装置,其中,所述工作状态切换装置包括以以下任一形式存在:机械按键,触摸按键,触摸屏,控制感知传感器,无线遥控,RFID,NFC,感应线圈,二维码。
8.一种非易失性计算机可读存储介质,其中,所述非易失性计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至4任一项所述方法的步骤。
CN202010296233.6A 2020-04-15 2020-04-15 工作状态切换方法和装置 Active CN111540352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010296233.6A CN111540352B (zh) 2020-04-15 2020-04-15 工作状态切换方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010296233.6A CN111540352B (zh) 2020-04-15 2020-04-15 工作状态切换方法和装置

Publications (2)

Publication Number Publication Date
CN111540352A CN111540352A (zh) 2020-08-14
CN111540352B true CN111540352B (zh) 2023-03-24

Family

ID=71976860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010296233.6A Active CN111540352B (zh) 2020-04-15 2020-04-15 工作状态切换方法和装置

Country Status (1)

Country Link
CN (1) CN111540352B (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109410958A (zh) * 2017-08-16 2019-03-01 芜湖美的厨卫电器制造有限公司 语音提示方法、装置及饮水机
CN110350927A (zh) * 2019-07-19 2019-10-18 常州市小先信息技术有限公司 可语音控制的智能收音机及其实现方法及其检测方法

Also Published As

Publication number Publication date
CN111540352A (zh) 2020-08-14

Similar Documents

Publication Publication Date Title
CN110459221B (zh) 多设备协同语音交互的方法和装置
EP2613313B1 (en) Image display apparatus and method of controlling the same
CN101599224B (zh) 一种演示系统以及移动终端和无线上网卡
CN103730116A (zh) 在智能手表上实现智能家居设备控制的系统及其方法
CN104360736A (zh) 基于手势的终端控制方法和系统
KR101771071B1 (ko) 통신 방법, 클라이언트, 및 단말
CN102577141A (zh) 控制显示设备和移动电话的方法
CN111490915A (zh) 语音控制智能家电的方法及其系统
US11392346B2 (en) Electronic device for providing voice-based service using external device, external device and operation method thereof
CN107481721A (zh) 用于可穿戴电子设备的语音交互方法和可穿戴电子设备
CN109151789B (zh) 翻译方法、装置、系统以及蓝牙耳机
CN106251605B (zh) 语音识别功能的启动方法、装置和系统及遥控器
CN106297786A (zh) 一种语音功能遥控开启方法及装置
CN111302167A (zh) 电梯语音控制方法和装置
CN108986810A (zh) 一种通过耳机实现语音交互的方法及装置
CN108922163A (zh) 一种红外遥控的学习方法、装置、终端和存储介质
CN106388713A (zh) 智能扫地机器人
CN104898839A (zh) 一种终端设备及其控制方法
CN113671846A (zh) 智能设备控制方法、装置、可穿戴设备及存储介质
CN110944056A (zh) 交互方法、移动终端及可读存储介质
CN111540352B (zh) 工作状态切换方法和装置
CN104796550A (zh) 智能硬件肢体控制接听来电
CN105407445A (zh) 一种连接方法及第一电子设备
CN104008634A (zh) 设备控制方法、装置及系统
CN110691016A (zh) 一种基于音频设备实现的交互方法及音频设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

GR01 Patent grant
GR01 Patent grant