CN108170034B - 智能设备控制方法、装置、计算机设备和储存介质 - Google Patents

智能设备控制方法、装置、计算机设备和储存介质 Download PDF

Info

Publication number
CN108170034B
CN108170034B CN201711479615.7A CN201711479615A CN108170034B CN 108170034 B CN108170034 B CN 108170034B CN 201711479615 A CN201711479615 A CN 201711479615A CN 108170034 B CN108170034 B CN 108170034B
Authority
CN
China
Prior art keywords
user
information
text information
voice recognition
recognition model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711479615.7A
Other languages
English (en)
Other versions
CN108170034A (zh
Inventor
吴昌洋
何嘉
王培�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Machine Mindasas Science And Technology Co ltd
Original Assignee
Shanghai Machine Mindasas Science And Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Machine Mindasas Science And Technology Co ltd filed Critical Shanghai Machine Mindasas Science And Technology Co ltd
Priority to CN201711479615.7A priority Critical patent/CN108170034B/zh
Publication of CN108170034A publication Critical patent/CN108170034A/zh
Application granted granted Critical
Publication of CN108170034B publication Critical patent/CN108170034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2642Domotique, domestic, home control, automation, smart house
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了智能设备控制方法、装置、计算机设备和储存介质。智能设备控制方法包括:获取用户的文本信息和所述用户的ID;通过预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令;其中,所述预设语义引擎至少将所述文本信息与所述用户的ID对应的自定义语义库进行匹配;根据所述设备操作指令,控制与所述用户的ID预设相关的全部或部分智能设备执行相应的操作。本发明实施例的技术方案可实现方便用户控制智能设备执行相应操作的效果。

Description

智能设备控制方法、装置、计算机设备和储存介质
技术领域
本发明实施例涉及智能设备控制技术,尤其涉及智能设备控制方法、装置、计算机设备和储存介质。
背景技术
智能家居是将传统家电进行智能化的领域。智能家居系统可以是将传统的智能家居与智慧终端连接,实现智能;也可以通过将传统家电内部嵌入可与互联网通信的模块,实现智能。
目前智能家居的设备主要是通过终端上的应用程序或是网页进行控制,但是由于智能家居的设备种类繁多,如何识别并理解出用户的控制指令目前决定智能家居交互体验的核心问题。现有技术中,控制智能家居的设备,需要用户输入预先设定的控制指令,以实现控制操作。
但是,用户需要记忆每条控制指令,增加了用户控制设备的难度,并且当用户需要控制多个设备满足自己的需求时,就要逐条输入控制指令,使用户的操作繁琐,降低了操作的效率。
发明内容
本发明实施例提供一种智能设备控制方法、装置、计算机设备和储存介质,以实现方便用户控制智能设备执行相应的操作。
第一方面,本发明实施例提供了一种智能设备控制方法,包括:
获取用户的文本信息和所述用户的ID;
通过预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令;其中,所述预设语义引擎至少将所述文本信息与所述用户的ID对应的自定义语义库进行匹配;
根据所述设备操作指令,控制与所述用户的ID预设相关的全部或部分智能设备执行相应的操作。
第二方面,本发明实施例还提供了一种智能设备控制装置,包括:
用户信息获取模块,用于获取用户的文本信息和所述用户的ID;
设备操作指令生成模块,用于基于预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令;其中,所述预设语义引擎至少将所述文本信息与所述用户的ID对应的自定义语义库进行匹配;
设备控制模块,用于根据所述设备操作指令,控制与所述用户的ID预设相关的全部或部分智能设备执行相应的操作。
第三方面,本发明实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
麦克风,用于获取语音信息;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面提供的智能设备控制方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面提供的智能设备控制方法。
本发明实施例通过将用户的文本信息输入自定义语义库进行语义匹配,确定设备操作指令,以控制相应的智能设备,解决用户需要记忆每条固定的控制指令且需逐条输入控制指令导致的操作繁琐的问题,实现方便用户自定义指令控制智能设备执行相应的操作的效果。
附图说明
图1是本发明实施例一中的一种智能设备控制方法的流程图;
图2是本发明实施例二中的一种智能设备控制方法的流程图;
图3是本发明实施例三中的一种智能设备控制方法的流程图;
图4是本发明实施例四中的一种智能设备控制方法的流程图;
图5a是本发明实施例五中的一种智能设备控制装置的结构示意图;
图5b是本发明实施例五中的另一种智能设备控制装置的结构示意图;
图5c是本发明实施例五中的另一种智能设备控制装置的结构示意图;
图5d是本发明实施例五中的另一种智能设备控制装置的结构示意图;
图5e是本发明实施例五中的另一种智能设备控制装置的结构示意图;
图5f是本发明实施例五中的另一种智能设备控制装置的结构示意图;
图5g是本发明实施例五中的另一种智能设备控制装置的结构示意图;
图5h是本发明实施例五中的另一种智能设备控制装置的结构示意图;
图6是本发明实施例五中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种智能设备控制方法的流程图,本实施例可适用于家庭或办公室等环境下,控制智能设备的情况,该方法可以由智能设备控制装置来执行,该装置可以由软件和/或硬件来实现,智能设备控制方法具体包括如下步骤:
步骤110、获取用户的文本信息和用户的ID。
其中,用户可以通过自己的智能终端输入文本信息,例如,通过智能手机、平板电脑或者个人计算机,在预设的应用程序中或者网页中输入文本信息。用户的身份标识号码ID可以是用户自己预设的个人信息,也可以是用户自己的智能终端的标识信息,例如个人计算机的物理地址。并且,获取用户的文本信息和获取用户的ID,可以同时分别执行,也可以分先后执行。该文本信息的内容可以是用户自定义的语音指令,也可以是控制相关智能设备的通用语音指令。
步骤120、通过预设语义引擎,根据文本信息生成与文本信息语义匹配的设备操作指令。
其中,预设语义引擎至少将文本信息与用户的ID对应的自定义语义库进行匹配。在预设语义引擎中配置有与用户的ID对应的自定义语义库,自定义语义库中存储有与用户的ID对应的自定义词类信息和/或自定义指令信息。根据文本信息与自定义词类信息和自定义指令信息的匹配结果,得到设备操作指令。预设语义引擎可以预置在用户的智能终端中,也可以预置在服务器中,智能终端将文本信息发送至服务器,由服务器执行根据文本信息生成与文本信息语义匹配的设备操作指令。
步骤130、根据设备操作指令,控制与用户的ID预设相关的全部或部分智能设备执行相应的操作。
其中,每个用户有与其预设相关的智能设备,根据设备操作指令可以确定需要执行操作的智能设备,以及操作的具体内容。需要执行动作的智能设备可以是一个或多个,操作的具体内容可以包括执行操作的时间、地点、执行条件和操作内容。根据设备操作指令确定要执行操作的智能设备,以及智能设备对应的操作的具体内容。用户可以通过智能终端向智能设备下发对应的操作指令,也可以由服务器向智能设备下发对应的操作指令,这样便实现了用户控制相应的智能设备执行自己下达的操作指令。
本实施例的技术方案,通过将用户的文本信息输入自定义语义库进行语义匹配,确定设备操作指令,以控制相应的智能设备,解决用户需要记忆每条固定的控制指令且需逐条输入控制指令导致的操作繁琐的问题,实现方便用户自定义指令控制智能设备执行相应的操作的效果。
实施例二
图2为本发明实施例二提供的一种智能设备控制方法的流程图,本实施例的技术方案是在上述技术方案的基础上进一步细化,可选的,智能设备控制方法包括:
步骤210、获取用户输入的语音信息和用户的ID。
其中,用户可以通过智能终端上配置的麦克风输入语音信息,该语音信息的内容可以是用户自定义的语音指令,也可以是控制相关智能设备的通用语音指令。获取用户的语音信息和获取用户的ID,可以同时分别执行,也可以分先后执行。
步骤220、根据用户输入的语音信息进行语音识别得到文本信息。
其中,用户使用语音信息来控制智能设备,较为方便快捷。可选的,根据用户输入的语音信息进行语音识别得到文本信息,包括:将所述语音信息输入预设语音识别引擎生成对应的文本信息;其中,所述预设语音识别引擎至少将所述语音信息输入自定义语音识别模型库,所述自定义语音识别模型库中包括与所述自定义语义库中的语义信息对应的自定义语音识别模型。用户的自定义语音识别模型经过预设方式根据对应自定义语义库中的语义信息训练生成。
可选的,将所述语音信息输入预设语音识别引擎生成对应的文本信息,包括:通过所述自定义语音识别模型库,生成所述语音信息对应的第一备选文本信息及所述第一备选文本信息的置信度;当所述第一备选文本信息的置信度大于等于第一阈值,将所述第一备选文本信息作为所述文本信息。可选的,所述预设语音识别引擎中还包括通用语音识别模型库;在所述通过所述自定义语音识别模型库,生成所述语音信息对应的第一备选文本信息及所述第一备选文本信息的置信度之后,还包括:当所述第一备选文本信息的置信度小于所述第一阈值,通过所述通用语音识别模型库,生成根据所述语音信息对应的第二备选文本信息及所述第二备选文本信息的置信度;当所述第二备选文本信息的置信度大于等于第二阈值,将所述第二备选文本信息作为所述指令文本信息。
可选的,通过所述自定义语音识别模型库生成所述语音信息对应的第一备选文本信息及所述第一备选文本信息的置信度,并且通过所述通用语音识别模型库,生成根据所述语音信息对应的第二备选文本信息及所述第二备选文本信息的置信度;当所述第一备选文本信息的置信度大于等于第一阈值,且所述第二备选文本信息的置信度小于第二阈值,将所述第一备选文本信息作为所述指令文本信息;当所述第一备选文本信息的置信度小于第一阈值,且所述第二备选文本信息的置信度大于等于第二阈值,将所述第二备选文本信息作为所述指令文本信息;当所述第一备选文本信息的置信度大于等于第一阈值,且所述第二备选文本信息的置信度大于等于第二阈值,将所述第一备选文本信息和所述第二备选文本信息中置信度较大者作为所述指令文本信息。
步骤230、通过预设语义引擎,根据文本信息生成与文本信息语义匹配的设备操作指令。
步骤240、根据设备操作指令,控制与用户的ID预设相关的全部或部分智能设备执行相应的操作。
本实施例的技术方案,通过将用户的语音信息输入预设语音识别引擎进行语音识别,通过自定义语音识别模型库确定文本信息使得对自定义语义对应的语音的识别更加精准,实现方便用户通过语音控制智能设备执行相应的操作的效果。
实施例三
图3为本发明实施例三提供的一种智能设备控制方法的流程图,本实施例的技术方案是在上述技术方案的基础上进一步细化,可选的,智能设备控制方法包括:
步骤310、获取用户的文本信息和用户的ID。
步骤320、通过预设语义引擎将文本信息与自定义语义库语义匹配,得到第一备选设备操作指令及所述第一备选设备操作指令的置信度。
其中,自定义语义库包括自定义词类信息和/或自定义指令信息;可选的,自定义词类信息包括地点词类、设备词类、动作词类和功能词类。词类信息可以是标签化词类,如地点词类:阳台、卧室、主卧、客卧、次卧、书房、客房、客厅、餐厅、厨房、淋浴间、浴室、更衣室、厕所、储物间、洗手间、卫生间、门厅、楼上、楼下、地下室、一楼、二楼、三楼、家、办公室、别墅和公司等,可以将标签预置为“locWords”;如设备词类:风扇、插座、油烟机、冰箱、扫地机器人、灯、空调、窗帘、空气净化器和音箱等,可以预置为“devWords”。如动作词类:启动、关闭、增大和减小等。如功能词类:制热、制冷、录像、拍照和保温等。用户可以在智能终端上将自己填写的词类进行自定义词类的标签化,也就是将自己输入的词类赋予自己期望的标签。并且,还需要确定自定义的词类对应的通用词类,例如若用户将“凯旋”自定义为设备词类,并等同于“空调”,则用户自定义词“凯旋”将会与“空调”与“devWords”组成对应关系存储到自定义语义库。如此即可实现将用户说的:“凯旋开启”等同于智能家居指令:“空调打开”。
自定义指令信息中包括和通用的设备操作指令的关联关系,当然也可以是自定义的新操作模式,如多个不同通用操作的顺序组合。比如自定义指令信息中的“芝麻开门”对应通用的设备操作指令中的“打开音响”。
步骤330、当第一备选设备操作指令的置信度大于等于第一阈值,将第一备选设备操作指令作为设备操作指令。
步骤340、根据设备操作指令,控制与用户的ID预设相关的全部或部分智能设备执行相应的操作。
可选的,在通过预设语义引擎将文本信息与自定义语义库语义匹配,得到第一备选设备操作指令及所述第一备选设备操作指令的置信度之后,还包括:
当所述第一备选设备操作指令的置信度小于所述第一阈值,将所述文本信息中的自定义词类替换为对应的通用词类,生成预处理设备操作指令;通过预设语义引擎将所述文本信息与所述通用语义库语义匹配,得到第二备选设备操作指令及所述第二备选设备操作指令的置信度;其中,所述预设通用语义库包括通用词类信息和通用指令信息;当所述第二备选设备操作指令的置信度大于等于第二阈值,将所述第二备选设备操作指令作为所述设备操作指令。
本实施例的技术方案,通过自定义语义库将文本信息进行语义匹配得到设备操作指令,实现用户通过自定义的语音指令控制智能设备,扩展了操作指令。
实施例四
图4为本发明实施例四提供的一种智能设备控制方法的流程图,本实施例的技术方案是在上述技术方案的基础上进一步细化,可选的,智能设备控制方法包括:
步骤410、获取用户输入的语音信息和用户的ID。
步骤420、根据自定义语义库中的自定义词类信息及其对应的指令信息生成自定义语音学习训练语料。
其中,自定义语音学习训练语料为自定义指令与自定义词类的文本集合。
步骤430、根据自定义语音学习训练语料生成自定义语音识别模型。
其中,将自定义指令与对应的自定义词类根据预设规则生成对应的自定义语音识别模型。
步骤440、将自定义语音识别模型加入用户的ID对应的自定义语音识别模型库中。
可选的,在将语音信息输入预设语音识别引擎生成对应的文本信息之前,还包括:获取预设自定义语音学习训练语料;根据所述预设自定义语音学习训练语料生成自定义语音识别模型;将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。其中,可以通过运维人员人工编辑自定义语音识别模型添加到自定义语音识别模型库中。
或者,获取用户输入的自定义词类信息、对应的自定义指令信息和所述用户的ID;将所述自定义词类信息和对应的自定义指令信息以预设结构化报文的形式输入所述自定义语音识别模型库;根据所述自定义语音识别模型库中的所述自定义词类信息及其对应的指令信息生成自定义语音学习训练语料;根据所述自定义语音学习训练语料生成自定义语音识别模型;将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。其中,在智能终端通过可与预设语音识别引擎通信的接口,将用户编辑的自定义指令与自定义词类直接以结构化报文的形式传输给预设语音识别引擎,并由预设语音识别引擎自行生产自定义语音学习训练语料。
步骤450、将语音信息输入预设语音识别引擎生成对应的文本信息。
步骤460、根据设备操作指令,控制与用户的ID预设相关的全部或部分智能设备执行相应的操作。
在实现了语义扩展与同步后,需要进行语音模型的训练,否则语音识别结果可能错误,从而导致最终语义结构化结果的错误。以往的语音训练结果需要人为的将词类与控制指令进行模型训练,本发明实施例中用户可以在智能终端上编辑并完成自定义指令与自定义词类在自定义语义库中的同步,并将自定义指令与对应的自定义词类根据预设规则生成对应的自定义语音识别模型,形成基于用户ID的自定义语音识别模型库,并可实现如下效果:
如无自定义语音识别模型的训练,当用户定义一个设备词类为:“莎呱”,若用户的语音指令是:“莎呱调到三档”可能识别成“傻瓜调到三档”这样错误的语音识别结果,是因为并没有“莎呱”的语音模型,若预先训练相关的自定义语音识别模型后,会有“莎呱”的语音模型与用户的语音信号进行匹配,可大大提高语音识别引擎识别出“莎呱调到三档”的概率。
本实施例的技术方案,通过建立自定义语音识别模型库,提高识别自定义语音指令的准确性。
实施例五
图5a为本发明实施例五提供的一种智能设备控制装置的结构示意图,该装置可以配置在智能设备控制系统中,智能设备控制装置包括:
用户信息获取模块501,用于获取用户的文本信息和所述用户的ID;
设备操作指令生成模块502,用于基于预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令;其中,所述预设语义引擎至少将所述文本信息与所述用户的ID对应的自定义语义库进行匹配;
设备控制模块503,用于根据所述设备操作指令,控制与所述用户的ID预设相关的全部或部分智能设备执行相应的操作。
本实施例的技术方案,通过将用户的文本信息输入自定义语义库进行语义匹配,确定设备操作指令,以控制相应的智能设备,解决逐条输入控制指令导致的操作繁琐的问题,实现方便用户控制智能设备执行相应的操作的效果。
可选的,如图5b所示,用户信息获取模块501包括:
语音信息获取子模块5011,用于获取用户输入的语音信息;
文本信息确定子模块5012,用于根据用户输入的语音信息进行语音识别得到所述文本信息。
可选的,如图5c所示,所述文本信息确定子模块5012包括:
文本信息生成单元50121,用于将所述语音信息输入预设语音识别引擎生成对应的文本信息;其中,所述预设语音识别引擎至少将所述语音信息输入自定义语音识别模型库,所述自定义语音识别模型库中包括与所述自定义语义库中的语义信息对应的自定义语音识别模型。
可选的,如图5d所示,所述文本信息生成单元50121包括:
第一备选文本信息生成子单元50121a,用于通过所述自定义语音识别模型库,生成所述语音信息对应的第一备选文本信息及所述第一备选文本信息的置信度;
文本信息第一确定子单元50121b,用于当所述第一备选文本信息的置信度大于等于第一阈值,将所述第一备选文本信息作为所述文本信息。
可选的,所述文本信息生成单元50121还包括:
第二备选文本信息生成子单元50121c,用于当所述第一备选文本信息的置信度小于所述第一阈值,通过所述通用语音识别模型库,生成根据所述语音信息对应的第二备选文本信息及所述第二备选文本信息的置信度;
文本信息第二确定子单元50121d,用于当所述第二备选文本信息的置信度大于等于第二阈值,将所述第二备选文本信息作为所述文本信息。
可选的,如图5e所示,设备操作指令生成模块502包括:
第一备选设备操作指令生成子模块5021,用于通过预设语义引擎将所述文本信息与所述自定义语义库语义匹配,得到第一备选设备操作指令及所述第一备选设备操作指令的置信度;其中,所述自定义语义库包括自定义词类信息和/或自定义指令信息;
设备操作指令第一确定子模块5022,用于当所述第一备设备操作指令的置信度大于等于第一阈值,将所述第一备选设备操作指令作为所述设备操作指令。
可选的,设备操作指令生成模块502还包括:
预处理设备操作指令生成子模块5023,用于当所述第一备选设备操作指令的置信度小于所述第一阈值,将所述文本信息中的自定义词类替换为对应的通用词类,生成预处理设备操作指令;
第二备选设备操作指令生成子模块5024,用于通过预设语义引擎将所述文本信息与所述通用语义库语义匹配,得到第二备选设备操作指令及所述第二备选设备操作指令的置信度;其中,所述预设通用语义库包括通用词类信息和通用指令信息;
设备操作指令第二确定子模块5025,用于当所述第二备选设备操作指令的置信度大于等于第二阈值,将所述第二备选设备操作指令作为所述设备操作指令。
可选的,所述自定义词类信息包括地点词类、设备词类、动作词类和功能词类。
可选的,如图5f所示,智能设备控制装置,还包括:
自定义语音学习训练语料生成模块504,用于在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,根据所述自定义语义库中的自定义词类信息及其对应的指令信息生成自定义语音学习训练语料;
自定义语音识别模型生成模块505,用于根据所述自定义语音学习训练语料生成自定义语音识别模型;
自定义语音识别模型库建立模块506,用于将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
可选的,智能设备控制装置,还包括:
信息获取模块507,用于在所述根据所述自定义语义库中的自定义词类信息及其对应的指令信息生成自定义语音学习训练语料之前,获取用户输入的自定义词类信息和/或自定义指令信息;
信息同步模块508,用于将所述自定义词类信息和/或自定义指令信息同步到所述自定义语义库。
可选的,如图5g所示,智能设备控制装置,还包括:
预设自定义语音学习训练语料获取模块509,用于在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,获取预设自定义语音学习训练语料;
自定义语音识别模型生成模块510,用于根据所述预设自定义语音学习训练语料生成自定义语音识别模型;
自定义语音识别模型库建立模块511,用于将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
可选的,如图5h所示,智能设备控制装置,还包括:
信息获取模块512,用于在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,获取用户输入的自定义词类信息、对应的自定义指令信息和所述用户的ID;
信息输入模块513,用于将所述自定义词类信息和对应的自定义指令信息以预设结构化报文的形式输入所述自定义语音识别模型库;
自定义语音识别训练语料生成模块514,用于根据所述自定义语音识别模型库中的所述自定义词类信息及其对应的指令信息生成自定义语音学习训练语料;
自定义语音识别模型生成模块515,用于根据所述自定义语音学习训练语料生成自定义语音识别模型;
自定义语音识别模型库建立模块516,用于将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
实施例六
图6为本发明实施例六提供的一种计算机设备的结构示意图,如图6所示,该设备包括处理器60、存储器61、输入装置62、输出装置63和麦克风64;设备中处理器60的数量可以是一个或多个,图6中以一个处理器60为例;设备中的处理器60、存储器61、输入装置62、输出装置63和麦克风64可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器61作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的智能设备控制方法对应的程序指令/模块(例如,智能设备控制装置中的用户信息获取模块510、设备操作指令生成模块520和设备控制模块530)。处理器60通过运行存储在存储器61中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的智能设备控制方法。
存储器61可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器61可进一步包括相对于处理器60远程设置的存储器,这些远程存储器可以通过网络连接至设备/终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置62可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置63可包括显示屏等显示设备。麦克风64可用于获取用户的语音指令等声音信号。
实施例七
本发明实施例七还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种智能设备控制方法,该方法包括:
获取用户的文本信息和所述用户的ID;
通过预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令;其中,所述预设语义引擎至少将所述文本信息与所述用户的ID对应的自定义语义库进行匹配;
根据所述设备操作指令,控制与所述用户的ID预设相关的全部或部分智能设备执行相应的操作。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的搜索方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述搜索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (20)

1.一种智能设备控制方法,其特征在于,包括:
获取用户的文本信息和所述用户的ID;
通过预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令;其中,所述预设语义引擎至少将所述文本信息与所述用户的ID对应的自定义语义库进行匹配;
根据所述设备操作指令,控制与所述用户的ID预设相关的全部或部分智能设备执行相应的操作;
所述通过预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令,包括:
通过预设语义引擎将所述文本信息与所述自定义语义库语义匹配,得到第一备选设备操作指令及所述第一备选设备操作指令的置信度;其中,所述自定义语义库包括自定义词类信息和/或自定义指令信息;
当所述第一备选设备操作指令的置信度大于等于第一阈值,将所述第一备选设备操作指令作为所述设备操作指令;
当所述第一备选设备操作指令的置信度小于所述第一阈值,将所述文本信息中的自定义词类替换为对应的通用词类,生成预处理设备操作指令;
通过预设语义引擎将所述文本信息与通用语义库语义匹配,得到第二备选设备操作指令及所述第二备选设备操作指令的置信度;其中,所述通用语义库包括通用词类信息和通用指令信息;
当所述第二备选设备操作指令的置信度大于等于第二阈值,将所述第二备选设备操作指令作为所述设备操作指令;
所述自定义词类信息包括地点词类、设备词类、动作词类和功能词类。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的文本信息,包括:
获取用户输入的语音信息;
根据用户输入的语音信息进行语音识别得到所述文本信息。
3.根据权利要求2所述的方法,其特征在于,所述根据用户输入的语音信息进行语音识别得到所述文本信息,包括:
将所述语音信息输入预设语音识别引擎生成对应的文本信息;其中,所述预设语音识别引擎至少将所述语音信息输入自定义语音识别模型库,所述自定义语音识别模型库中包括与所述自定义语义库中的语义信息对应的自定义语音识别模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述语音信息输入预设语音识别引擎生成对应的文本信息,包括:
通过所述自定义语音识别模型库,生成所述语音信息对应的第一备选文本信息及所述第一备选文本信息的置信度;
当所述第一备选文本信息的置信度大于等于第一阈值,将所述第一备选文本信息作为所述文本信息。
5.根据权利要求4所述的方法,其特征在于,所述预设语音识别引擎中还包括通用语音识别模型库;
在所述通过所述自定义语音识别模型库,生成所述语音信息对应的第一备选文本信息及所述第一备选文本信息的置信度之后,还包括:
当所述第一备选文本信息的置信度小于所述第一阈值,通过通用语音识别模型库,生成根据所述语音信息对应的第二备选文本信息及所述第二备选文本信息的置信度;
当所述第二备选文本信息的置信度大于等于第二阈值,将所述第二备选文本信息作为所述指令文本信息。
6.根据权利要求3所述的方法,其特征在于,在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,还包括:
根据所述自定义语义库中的自定义词类信息及其对应的指令信息生成自定义语音学习训练语料;
根据所述自定义语音学习训练语料生成自定义语音识别模型;
将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
7.根据权利要求6所述的方法,其特征在于,在所述根据所述自定义语义库中的自定义词类信息及其对应的指令信息生成自定义语音学习训练语料之前,还包括:
获取用户输入的自定义词类信息和/或自定义指令信息;
将所述自定义词类信息和/或自定义指令信息同步到所述自定义语义库。
8.根据权利要求3所述的方法,其特征在于,在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,还包括:
获取预设自定义语音学习训练语料;
根据所述预设自定义语音学习训练语料生成自定义语音识别模型;
将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
9.根据权利要求3所述的方法,其特征在于,在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,还包括:
获取用户输入的自定义词类信息、对应的自定义指令信息和所述用户的ID;
将所述自定义词类信息和对应的自定义指令信息以预设结构化报文的形式输入所述自定义语音识别模型库;
根据所述自定义语音识别模型库中的所述自定义词类信息及其对应的指令信息生成自定义语音学习训练语料;
根据所述自定义语音学习训练语料生成自定义语音识别模型;
将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
10.一种智能设备控制装置,其特征在于,包括:
用户信息获取模块,用于获取用户的文本信息和所述用户的ID;
设备操作指令生成模块,用于基于预设语义引擎,根据所述文本信息生成与所述文本信息语义匹配的设备操作指令;其中,所述预设语义引擎至少将所述文本信息与所述用户的ID对应的自定义语义库进行匹配;
设备控制模块,用于根据所述设备操作指令,控制与所述用户的ID预设相关的全部或部分智能设备执行相应的操作;
所述设备操作指令生成模块包括:
第一备选设备操作指令生成子模块,用于通过预设语义引擎将所述文本信息与所述自定义语义库语义匹配,得到第一备选设备操作指令及所述第一备选设备操作指令的置信度;其中,所述自定义语义库包括自定义词类信息和/或自定义指令信息;
设备操作指令第一确定子模块,用于当所述第一备选设备操作指令的置信度大于等于第一阈值,将所述第一备选设备操作指令作为所述设备操作指令;
预处理设备操作指令生成子模块,用于当所述第一备选设备操作指令的置信度小于所述第一阈值,将所述文本信息中的自定义词类替换为对应的通用词类,生成预处理设备操作指令;
第二备选设备操作指令生成子模块,用于通过预设语义引擎将所述文本信息与通用语义库语义匹配,得到第二备选设备操作指令及所述第二备选设备操作指令的置信度;其中,所述通用语义库包括通用词类信息和通用指令信息;
设备操作指令第二确定子模块,用于当所述第二备选设备操作指令的置信度大于等于第二阈值,将所述第二备选设备操作指令作为所述设备操作指令;
所述自定义词类信息包括地点词类、设备词类、动作词类和功能词类。
11.根据权利要求10所述的装置,其特征在于,所述用户信息获取模块包括:
语音信息获取子模块,用于获取用户输入的语音信息;
文本信息确定子模块,用于根据用户输入的语音信息进行语音识别得到所述文本信息。
12.根据权利要求11所述的装置,其特征在于,所述文本信息确定子模块包括:
文本信息生成单元,用于将所述语音信息输入预设语音识别引擎生成对应的文本信息;其中,所述预设语音识别引擎至少将所述语音信息输入自定义语音识别模型库,所述自定义语音识别模型库中包括与所述自定义语义库中的语义信息对应的自定义语音识别模型。
13.根据权利要求12所述的装置,其特征在于,所述文本信息生成单元包括:
第一备选文本信息生成子单元,用于通过所述自定义语音识别模型库,生成所述语音信息对应的第一备选文本信息及所述第一备选文本信息的置信度;
文本信息第一确定子单元,用于当所述第一备选文本信息的置信度大于等于第一阈值,将所述第一备选文本信息作为所述文本信息。
14.根据权利要求13所述的装置,其特征在于,所述文本信息生成单元还包括:
第二备选文本信息生成子单元,用于当所述第一备选文本信息的置信度小于所述第一阈值,通过通用语音识别模型库,生成根据所述语音信息对应的第二备选文本信息及所述第二备选文本信息的置信度;
文本信息第二确定子单元,用于当所述第二备选文本信息的置信度大于等于第二阈值,将所述第二备选文本信息作为所述文本信息。
15.根据权利要求12所述的装置,其特征在于,还包括:
自定义语音学习训练语料生成模块,用于在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,根据所述自定义语义库中的自定义词类信息及其对应的指令信息生成自定义语音学习训练语料;
自定义语音识别模型生成模块,用于根据所述自定义语音学习训练语料生成自定义语音识别模型;
自定义语音识别模型库建立模块,用于将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
16.根据权利要求15所述的装置,其特征在于,还包括:
信息获取模块,用于在所述根据所述自定义语义库中的自定义词类信息及其对应的指令信息生成自定义语音学习训练语料之前,获取用户输入的自定义词类信息和/或自定义指令信息;
信息同步模块,用于将所述自定义词类信息和/或自定义指令信息同步到所述自定义语义库。
17.根据权利要求12所述的装置,其特征在于,还包括:
预设自定义语音学习训练语料获取模块,用于在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,获取预设自定义语音学习训练语料;
自定义语音识别模型生成模块,用于根据所述预设自定义语音学习训练语料生成自定义语音识别模型;
自定义语音识别模型库建立模块,用于将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
18.根据权利要求12所述的装置,其特征在于,还包括:
信息获取模块,用于在所述将所述语音信息输入预设语音识别引擎生成对应的文本信息之前,获取用户输入的自定义词类信息、对应的自定义指令信息和所述用户的ID;
信息输入模块,用于将所述自定义词类信息和对应的自定义指令信息以预设结构化报文的形式输入所述自定义语音识别模型库;
自定义语音识别训练语料生成模块,用于根据所述自定义语音识别模型库中的所述自定义词类信息及其对应的指令信息生成自定义语音学习训练语料;
自定义语音识别模型生成模块,用于根据所述自定义语音学习训练语料生成自定义语音识别模型;
自定义语音识别模型库建立模块,用于将所述自定义语音识别模型加入所述用户的ID对应的自定义语音识别模型库中。
19.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
麦克风,用于获取语音信息;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的智能设备控制方法。
20.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-9中任一所述的智能设备控制方法。
CN201711479615.7A 2017-12-29 2017-12-29 智能设备控制方法、装置、计算机设备和储存介质 Active CN108170034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711479615.7A CN108170034B (zh) 2017-12-29 2017-12-29 智能设备控制方法、装置、计算机设备和储存介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711479615.7A CN108170034B (zh) 2017-12-29 2017-12-29 智能设备控制方法、装置、计算机设备和储存介质

Publications (2)

Publication Number Publication Date
CN108170034A CN108170034A (zh) 2018-06-15
CN108170034B true CN108170034B (zh) 2021-06-08

Family

ID=62516402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711479615.7A Active CN108170034B (zh) 2017-12-29 2017-12-29 智能设备控制方法、装置、计算机设备和储存介质

Country Status (1)

Country Link
CN (1) CN108170034B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613037B1 (en) * 2018-06-27 2020-10-21 Google LLC Rendering responses to a spoken utterance of a user utilizing a local text-response map
US10650819B2 (en) 2018-10-15 2020-05-12 Midea Group Co., Ltd. System and method for providing portable natural language processing interface across multiple appliances
US10978046B2 (en) * 2018-10-15 2021-04-13 Midea Group Co., Ltd. System and method for customizing portable natural language processing interface for appliances
CN110136700B (zh) * 2019-03-15 2021-04-20 湖北亿咖通科技有限公司 一种语音信息处理方法及装置
CN111756603B (zh) * 2019-03-26 2023-05-26 北京京东尚科信息技术有限公司 智能家居系统的控制方法、装置、电子设备和可读介质
CN110246499B (zh) * 2019-08-06 2021-05-25 思必驰科技股份有限公司 家居设备的语音控制方法及装置
CN110618613A (zh) * 2019-09-03 2019-12-27 珠海格力电器股份有限公司 一种智能设备的联动控制方法及装置
CN111640435A (zh) * 2020-06-09 2020-09-08 合肥飞尔智能科技有限公司 基于智能音箱控制红外家电的方法及装置
CN112073471B (zh) * 2020-08-17 2023-07-21 青岛海尔科技有限公司 设备的控制方法和装置、存储介质及电子装置
CN112420034B (zh) * 2020-09-14 2023-06-02 当趣网络科技(杭州)有限公司 语音识别的方法、系统、电子装置和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676565B2 (en) * 2010-03-26 2014-03-18 Virtuoz Sa Semantic clustering and conversational agents
CN103646646B (zh) * 2013-11-27 2018-08-31 联想(北京)有限公司 一种语音控制方法及电子设备
CN103730120A (zh) * 2013-12-27 2014-04-16 深圳市亚略特生物识别科技有限公司 电子设备的语音控制方法及系统
CN106653008B (zh) * 2015-10-28 2021-02-02 中兴通讯股份有限公司 一种语音控制方法、装置及系统
CN105810200A (zh) * 2016-02-04 2016-07-27 深圳前海勇艺达机器人有限公司 基于声纹识别的人机对话装置及其方法
CN105847099B (zh) * 2016-05-30 2019-12-06 北京百度网讯科技有限公司 基于人工智能的物联网实现系统和方法
CN106328124A (zh) * 2016-08-24 2017-01-11 安徽咪鼠科技有限公司 一种基于用户行为特征的语音识别方法

Also Published As

Publication number Publication date
CN108170034A (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
CN108170034B (zh) 智能设备控制方法、装置、计算机设备和储存介质
EP3314876B1 (en) Technologies for conversational interfaces for system control
CN112074898B (zh) 用于意图推理的上下文无关文法的机器生成
US11354089B2 (en) System and method for dialog interaction in distributed automation systems
CN108010523B (zh) 信息处理方法以及记录介质
CN107644638B (zh) 语音识别方法、装置、终端和计算机可读存储介质
CN106647311B (zh) 智能中控系统、设备、服务器及智能设备控制方法
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
JP6908461B2 (ja) 情報処理方法及びプログラム
Han et al. A smart home control system based on context and human speech
EP2933789A1 (en) Security alarm system with adaptive speech processing
CN114582318B (zh) 一种基于语音识别的智能家居控制方法及系统
CN113990324A (zh) 一种语音智能家居控制系统
WO2018023514A1 (zh) 一种家居背景音乐控制系统
CN112233665A (zh) 模型训练的方法和装置、电子设备和存储介质
WO2018023523A1 (zh) 一种运动及情感识别家居控制系统
Vanus et al. Voice control of technical functions in smart home with KNX technology
CN112787899B (zh) 设备语音交互方法、计算机可读存储介质以及冰箱
WO2018023518A1 (zh) 一种语音交互识别智能终端
CN104062910A (zh) 命令生成装置、设备的智能控制方法和系统
CN114627859A (zh) 一种脱机语义识别电子相框的方法及系统
KR100529950B1 (ko) 음성 대화형 에어컨 시스템 및 그 동작방법
WO2019154282A1 (zh) 家电设备及其语音识别方法、控制方法、控制装置
US11978458B2 (en) Electronic apparatus and method for recognizing speech thereof
WO2018023517A1 (zh) 一种语音交互识别控制系统

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant