CN111312253A - 语音控制方法、云端服务器及终端设备 - Google Patents

语音控制方法、云端服务器及终端设备 Download PDF

Info

Publication number
CN111312253A
CN111312253A CN201811513015.2A CN201811513015A CN111312253A CN 111312253 A CN111312253 A CN 111312253A CN 201811513015 A CN201811513015 A CN 201811513015A CN 111312253 A CN111312253 A CN 111312253A
Authority
CN
China
Prior art keywords
voice
control instruction
cloud server
voice information
terminal equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811513015.2A
Other languages
English (en)
Inventor
黄振兴
许升
尹俊明
舒海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Washing Machine Co Ltd
Original Assignee
Qingdao Haier Washing Machine Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Washing Machine Co Ltd filed Critical Qingdao Haier Washing Machine Co Ltd
Priority to CN201811513015.2A priority Critical patent/CN111312253A/zh
Priority to EP19896959.4A priority patent/EP3896689A4/en
Priority to JP2021533254A priority patent/JP7159475B2/ja
Priority to US17/413,150 priority patent/US11967320B2/en
Priority to PCT/CN2019/120824 priority patent/WO2020119438A1/zh
Publication of CN111312253A publication Critical patent/CN111312253A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Control Of Washing Machine And Dryer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉语音控制技术领域,具体涉及一种语音控制方法、云端服务器及终端设备。本发明旨在解决现有的具有语音识别功能的洗衣机存在的用户体验差的问题。为此目的,本发明的语音控制方法包括:终端设备接收语音信息;终端设备从本地语音库中查询语音信息对应的控制指令;当在本地语音库中未查询到语音信息对应的控制指令时,终端设备将语音信息上传至云端服务器;云端服务器解析语音信息对应的控制指令;当解析出语音信息对应的控制指令时,云端服务器向终端设备发送控制指令;终端设备接收控制指令,并基于控制指令执行相应的操作。通过上述控制方式,本发明能够提高带有语音识别功能的终端设备的响应速度,大幅提升用户的用户体验。

Description

语音控制方法、云端服务器及终端设备
技术领域
本发明涉语音控制技术领域,具体涉及一种语音控制方法、云端服务器及终端设备。
背景技术
随着人们生活水平的日益提高,洗衣机已成为人们家中必备的家用电器之一,为了满足用户的差异化洗衣需求,现有洗衣机的功能越来越多,随之而来的是洗衣模式和洗衣参数的调节选项也越来越烦杂,这无疑增加了用户的学习和使用成本。
为解决功能的增多带来的学习和使用成本增加的问题,现有部分洗衣机搭载了语音识别模块,通过语音识别模块识别出用户所说的指令来启动相应的洗衣程序,从而避免繁杂的洗衣模式和洗衣参数的调节过程。虽然上述解决方案一定程度上简化了洗衣机的操作,但是也不可避免地存在如下问题:现有的语音识别模块主要分为离线语音识别模块和在线语音识别模块,离线语音识别模块虽然响应速度快,但是其只能识别特定的命令关键词,而且关键词的数量往往受存储空间的限制,用户想要开启特定的洗衣程序,必须准确地记住相对应的关键词,体验非常不好。相比于离线语音识别模块,在线语音识别模块则可以进行语义识别,通过将用户说出的命令语句上传到云端进行分析和解析,准确的执行用户所需的洗衣程序,但是在线语音识别模块需要将命令上传至云端解析,响应较慢,造成用户等待时间过长,因此体验也不是很好。
相应地,本领域需要一种新的语音控制方法来解决上述问题。
发明内容
为了解决现有技术中的上述问题,即为了解决现有的具有语音识别功能的洗衣机存在的用户体验差的问题,第一方面,本发明提供了一种语音控制方法,所述语音控制方法包括:
终端设备接收语音信息;
所述终端设备从本地语音库中查询所述语音信息对应的控制指令;
当在所述本地语音库中未查询到所述语音信息对应的控制指令时,所述终端设备将所述语音信息上传至云端服务器;
所述云端服务器解析所述语音信息对应的控制指令;
当解析出所述语音信息对应的控制指令时,所述云端服务器向所述终端设备发送所述控制指令;
所述终端设备接收所述控制指令,并基于所述控制指令执行相应的操作。
在上述语音控制方法的优选技术方案中,在“所述云端服务器解析所述语音信息对应的控制指令”的步骤之后,所述语音控制方法还包括:
当解析出所述语音信息对应的控制指令时,所述云端服务器确定所述语音信息与所述控制指令之间的映射关系在云端语音库中的记录次数;
当所述记录次数不等于零时,所述云端服务器比较所述记录次数与预设次数的大小;
当所述记录次数大于所述预设次数时,所述云端服务器将所述映射关系发送至终端设备;
所述终端设备接收所述映射关系,并将所述映射关系存储至所述本地语音库。
在上述语音控制方法的优选技术方案中,所述语音控制方法还包括:
当所述记录次数等于零时,所述云端服务器将所述映射关系记录到所述云端语音库中。
第二方面,本发明提供了一种语音控制方法,所述语音控制方法包括:
云端服务器接收终端设备上传的语音信息;
所述云端服务器解析所述语音信息对应的控制指令;
当解析出所述语音信息对应的控制指令时,所述云端服务器向所述终端设备发送所述控制指令,以便所述终端设备基于所述控制指令执行相应的操作;
其中,所述终端设备在从本地语音库中无法查询到所述语音信息对应的控制指令时上传所述语音信息。
在上述语音控制方法的优选技术方案中,在“所述云端服务器解析所述语音信息对应的控制指令”的步骤之后,所述语音控制方法还包括:
当解析出所述语音信息对应的控制指令时,所述云端服务器确定所述语音信息与所述控制指令之间的映射关系在云端语音库中的记录次数;
当所述记录次数不等于零时,所述云端服务器比较所述记录次数与预设次数的大小;
当所述记录次数大于所述预设次数时,所述云端服务器将所述映射关系发送至所述终端设备,以便所述终端设备将所述映射关系存储至所述本地语音库。
在上述语音控制方法的优选技术方案中,所述语音控制方法还包括:
当所述记录次数等于零时,所述云端服务器将所述映射关系记录到所述云端语音库中。
第三方面,本发明提供了一种语音控制方法,所述语音控制方法包括:
终端设备接收语音信息;
所述终端设备从本地语音库中查询所述语音信息对应的控制指令;
当在所述本地语音库中未查询到所述语音信息对应的控制指令时,所述终端设备将所述语音信息上传至云端服务器,以便所述云端服务器解析所述语音信息对应的控制指令;
所述终端设备从所述云端服务器接收解析出的所述语音信息对应的控制指令,并基于所述控制指令执行相应的操作。
在上述语音控制方法的优选技术方案中,在“所述终端设备将所述语音信息上传至云端服务器”的步骤之后,所述控制方法还包括:
所述终端设备从所述云端服务器接收所述语音信息与所述控制指令之间的映射关系,并将所述映射关系存储至所述本地语音库;
其中,当所述云端服务器解析出所述语音信息对应的控制指令时,所述云端服务器确定所述语音信息与所述控制指令之间的映射关系在云端语音库中的记录次数;所述映射关系是当所述记录次数不等于零且大于预设次数时所述云端服务器发送的。
本发明还提供了一种云端服务器,所述云端服务器包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器加载以便执行上述第二方面的优选技术方案中任一项所述的语音控制方法。
本发明还提供了一种终端设备,所述终端设备包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器加载以便执行上述第三方面的优选技术方案中任一项所述的语音控制方法。
本领域技术人员能够理解的是,在本发明的优选技术方案中,语音控制方法包括:终端设备接收语音信息;终端设备从本地语音库中查询语音信息对应的控制指令;当在本地语音库中未查询到语音信息对应的控制指令时,终端设备将语音信息上传至云端服务器;云端服务器解析语音信息对应的控制指令;当解析出语音信息对应的控制指令时,云端服务器向终端设备发送该控制指令;终端设备接收该控制指令,并基于控制指令执行相应的操作。
通过上述控制方式,本发明的语音控制方法能够提高带有语音识别功能的终端设备的响应速度,大幅提升用户的用户体验。具体而言,终端设备在接收语音信息后,首先进行本地查询,如果本地语音库中查询到该语音信息对应的控制指令,则按照该控制指令执行相应的操作。由于本地语音库的响应速度快,因此终端设备的操作执行快,用户体验好。如果本地语音库中未查询到该语音信息对应的控制指令,则通过将语音信息上传至云端服务器进行解析,并在解析出该语音信息对应的控制指令时,云端服务器将控制指令发送给终端设备,从而终端设备基于该控制指令执行相应的操作。由于云端服务器能够进行语音语义识别,其识别范围广、准确性高,因此在本地语音库中未查询到控制指令时,通过云端服务器对语音信息的解析能够避免只通过本地识别时识别准确率低的问题,提升用户体验。
进一步地,通过云端服务器确定语音信息与对应的控制指令之间的映射关系的记录次数,并且在该记录次数不等于零且大于预设次数时,将对应的映射关系发送至终端设备,从而终端设备将该映射关系存储在本地语音库中,使得终端设备还能够基于用户的使用习惯自动更新本地语音库,使终端设备的语音识别功能的智能程度得到极大地提升,进而大幅度提高终端设备的响应速度和用户的使用体验。
附图说明
下面参照附图并结合洗衣机来描述本发明的语音控制方法、云端服务器及终端设备。附图中:
图1为本发明的语音控制方法的一种实施方式流程图;
图2为本发明的语音控制方法的又一种实施方式的流程图;
图3为本发明的语音控制方法的再一种实施方式的流程图;
图4为本发明的语音控制方法的一种实施方式的逻辑图;
图5为本发明的语音控制方法的又一种实施方式的逻辑图。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。例如,虽然本实施方式是结合洗衣机进行描述的,但是本发明的应用场景并非只限于此,在不偏离本发明原理的条件下,本领域技术人员可以将本发明的控制方法应用于其他终端设备,只要该终端设备具有语音识别功能即可。如,显然本发明的控制方法还可以应用于带有语音识别功能的电冰箱、电视机、音箱等。
实施例一
首先参照图1,对本发明的语音控制方法的第一种实施方式进行描述。其中,图1为本发明的语音控制方法的一种实施方式流程图。该方法的执行主体是洗衣机和云端服务器(以下或简称云端),其中,洗衣机设置有控制模块和语音识别模块,语音识别模块能够识别语音信息对应的控制指令,并且在语音信息能够转化为控制指令时将控制指令发送给控制模块,从而控制模块基于该控制指令控制洗衣机执行相应的操作。其中,云端服务器同样能够识别语音信息对应的控制指令,并且云端服务器还能够直接与语音识别模块通信或通过与洗衣机通信从而间接与语音识别模块通信,以接收语音识别模块或洗衣机发送的语音信息,以及向语音识别模块或洗衣机发送指令信息或语音信息与控制指令之间的映射关系,以便洗衣机能够执行相应的操作。同样地,本实施方式中对云端服务器的形式不做限制,任何不在本地的远程服务器均可作为云端服务器应用于本发明中。
如图1所示,为了解决现有的具有语音识别功能的洗衣机存在的用户体验差的问题,本发明的语音控制方法主要包括以下步骤:
S101、洗衣机接收语音信息。例如,语音信息可以通过洗衣机上设置的麦克风等采集元件获取,也可以通过接收音频文件后转换获取,本实施方式对此不做限制。如在洗衣机开机后,麦克风一直处于导通状态从而获取语音信息,或者在用户按下洗衣机上设置的语音输入按钮后处于导通状态而获取语音信息;再如,用户通过对移动设备(如手机、平板电脑等)输入语音信息,从而洗衣机通过接收移动设备发送的音频文件后转换成语音信息。
S102、洗衣机从本地语音库中查询语音信息对应的控制指令。例如,洗衣机中存储有本地语音库,本地语音库中存储有语音信息与控制指令的映射关系,洗衣机在接收语音信息后,通过控制语音识别模块查询本地语音库中存储的映射关系来识别接收到的语音信息对应的控制指令。
S103、当在本地语音库中未查询到语音信息对应的控制指令时,洗衣机将语音信息上传至云端服务器。例如,当在本地语音库中查询到语音信息对应的控制指令时将该控制指令发送给控制模块,从而控制模块基于该控制指令控制洗衣机执行相应的操作,如执行洗衣程序、脱水程序等。当在本地语音库中未查询到该语音信息对应的控制指令时,语音识别模块或洗衣机将该语音信息上传至云端服务器,以便利用云端服务器强大的处理能力对该语音信息进行解析。其中语音识别模块或洗衣机通过有线或无线的方式将语音信息上传至云端服务器,本实施方式对此不做限制。
S104、云端服务器解析语音信息对应的控制指令。例如,云端服务器在接收到语音信息后,对该语音信息进行语音和/或语义的解析识别。
S105、当解析出语音信息对应的控制指令时,云端服务器向洗衣机发送控制指令。例如,当云端服务器未能解析出语音信息对应的控制指令时,可以向洗衣机发送解析失败指令,从而控制模块收到该解析失败指令后控制洗衣机发出提示信息,如发出提示音提示用户重新输入,或控制指示灯闪烁等。当云端服务器成功解析出语音信息对应的控制指令时,可以向洗衣机发送该控制指令,以便洗衣机能够基于该控制指令执行相应的操作。
S106、洗衣机接收控制指令,并基于控制指令执行相应的操作。例如,在云端服务器成功解析出控制指令并发送给洗衣机后,控制模块接收该控制指令,并基于该控制指令控制洗衣机执行相应的操作,如执行洗衣程序、脱水程序等。
通过上述控制方式,本发明的语音控制方法能够提高洗衣机的响应速度,大幅提升用户的用户体验。具体而言,洗衣机在接收语音信息后,首先控制语音识别模块进行本地查询,如果本地语音库中查询到该语音信息对应的控制指令,则控制模块按照该控制指令控制洗衣机执行相应的操作。由于本地语音库的响应速度快,因此这种情况下洗衣机的操作执行快,用户体验好。如果本地语音库中未查询到该语音信息对应的控制指令,则通过将语音信息上传至云端服务器进行解析,并在解析出该语音信息对应的控制指令时,云端服务器将控制指令发送给洗衣机,从而控制模块基于该控制指令控制洗衣机执行相应的操作。由于云端服务器具有强大的运算能力,能够进行语音和语义的解析识别,其识别范围广、准确性高,因此在本地语音库中未查询到控制指令时,通过云端服务器对语音信息的解析能够避免只通过本地进行语音识别时识别准确率低的问题,提升用户体验。
作为一种优选的实施方式,在步骤S104之后,所述语音控制方法还包括如下步骤:
当解析出语音信息对应的控制指令时,云端服务器确定语音信息与控制指令之间的映射关系在云端语音库中的记录次数。例如,在云端服务器中存储有云端语音库,云端语音库中存储有大量的语音信息与控制指令的映射关系,该映射关系可以是事先存储的,也可以是连接到该服务器的所有用户在使用过程中生成的。在云端服务器解析出语音信息对应的控制指令时,证明该语音信息与控制指令之间的映射关系已经形成,云端服务器可以在向终端设备发送控制指令之后,确定云端语音库中该映射关系的记录次数。
当所述记录次数等于零时,云端服务器将映射关系记录到云端语音库中。例如,云端服务器在云端语音库中未查询到相同的映射关系,证明该映射关系之前并未记录在云端语音库中,也就是该用户或其他用户均未使用过该映射关系,此时云端服务器将该映射关系记录到云端语音库中,以便下次有相同的映射关系时方便云端服务器从云端语音库中调取该映射关系的记录次数。当记录次数不等于零时,云端服务器进一步比较记录次数与预设次数的大小。例如,云端服务器在云端语音库中查询到相同的映射关系,说明该用户或其他用户使用过相同的映射关系,此时获取该映射关系的记录次数,并将本次的记录更新至该记录次数后(即记录次数+1)与预设次数相比较。其中,预设次数优选地为 10-30次,更为优选的为20次。当然,预设次数的设置本领域技术人员可以基于不用的应用场景进行调整。此外,记录次数在与预设次数比较之前,可以将本次的记录更新至记录次数中,也可以不更新直接比较。
当记录次数大于预设次数时,证明该映射关系使用频率较高,此时云端服务器将该映射关系发送至终端设备,终端设备接收该映射关系,并将该映射关系存储至本地语音库,以便下次用户输入相同的语音信息时,洗衣机能够直接从本地语音库中查询到相应的控制指令。当记录次数小于预设次数时,证明该映射关系使用的频率较低,此时无需将该映射关系发送至终端设备,以避免映射关系过多而占用本地语音库的存储空间。
通过上述设置方式,使得本发明的洗衣机还能够基于用户的使用习惯自动更新本地语音库,从而使洗衣机的语音识别功能的智能程度得到极大地提升,从而大幅度提高终端设备的响应速度和用户的使用体验。实际上,由于本地语音库的存储容量有限,不能够像云端服务器一样存储大量的映射关系,而在应用本发明的语音控制方法后,本地语音库中始终存储着用户使用频率最高的一些映射关系,从而使洗衣机能够高度适应用户的使用习惯,真正做到洗衣机的智能化控制。
需要说明的是,上述优选的实施方式仅仅用于阐述本发明的原理,并非旨在于限制本发明的保护范围。在不偏离本发明原理的前提下,本领域技术人员可以对上述设置方式进行调整,以便本发明能够适用于更加具体的应用场景。
例如,在一种可替换的实施方式中,云端服务器可以在向终端设备发送控制指令的同时或之前,确定云端语音库中该映射关系的记录次数,这种步骤顺序的更改并未偏离本发明的原理,因此理应落入本发明的保护范围之中。
再如,在另一种可替换的实施方式中,当比较记录次数与预设次数的大小时,可以先获取映射关系在云端语音库中的记录次数,将该记录次数与预设次数相比较;然后如果在记录次数小于预设次数时,再进一步确定该记录次数是否为零。这种步骤顺序的更改并未偏离本发明的原理,因此理应落入本发明的保护范围之中。
实施例二
参照图2,对本发明的语音控制方法的第二种实施方式进行描述。其中,图2为本发明的语音控制方法的又一种实施方式流程图。该方法的执行主体是云端服务器(以下或简称云端)。其中,以下实施方式涉及到的洗衣机和云端服务器的设置方式与实施例一相同,在此不再赘述。
如图2所示,本发明的语音控制方法主要包括以下步骤:
S201、云端服务器接收洗衣机上传的语音信息;
S202、云端服务器解析语音信息对应的控制指令;
S203、当解析出语音信息对应的控制指令时,云端服务器向洗衣机发送控制指令,以便洗衣机基于控制指令执行相应的操作;其中,洗衣机在从本地语音库中无法查询到语音信息对应的控制指令时上传语音信息。
通过洗衣机在从本地语音库中无法查询到语音信息对应的控制指令时上传语音信息至云端服务器,从而云端服务器对该语音信息进行解析得到对应的控制指令,并将该控制指令发送给洗衣机,以便洗衣机能够基于该控制指令执行相应的操作,本发明的语音控制方法能够提高洗衣机的识别准确率,避免洗衣机只通过本地语音库中有限的映射关系进行识别带来的准确率低的问题,大幅提升用户体验。
为进一步提升用户体验,作为一种优选的实施方式,本发明的语音控制方法在步骤S202之后还包括:
当解析出语音信息对应的控制指令时,云端服务器确定语音信息与控制指令之间的映射关系在云端语音库中的记录次数;
当记录次数等于零时,云端服务器将映射关系记录到所述云端语音库中;当记录次数不等于零时,云端服务器比较记录次数与预设次数的大小;当记录次数大于预设次数时,云端服务器将映射关系发送至洗衣机,以便洗衣机将映射关系存储至本地语音库。
通过云端服务器确定语音信息与对应的控制指令之间的映射关系的记录次数,并且在该记录次数不等于零且大于预设次数时,将对应的映射关系发送至洗衣机,以便洗衣机将该映射关系存储在本地语音库中,本发明的语音控制方法使得洗衣机还能够基于用户的使用习惯自动更新洗衣机中的本地语音库,使洗衣机的语音识别功能的智能程度得到极大地提升,从而进一步提高洗衣机的响应速度和用户的使用体验。
实施例三
参照图3,对本发明的语音控制方法的第三种实施方式进行描述。其中,图3为本发明的语音控制方法的再一种实施方式流程图。该方法的执行主体是洗衣机。其中,以下实施方式涉及到的洗衣机和云端服务器(或简称云端)的设置方式与实施例一相同,在此不再赘述。
如图3所示,本发明的语音控制方法主要包括以下步骤:
S301、洗衣机接收语音信息;
S302、洗衣机从本地语音库中查询语音信息对应的控制指令;
S303、当在本地语音库中未查询到语音信息对应的控制指令时,洗衣机将语音信息上传至云端服务器,以便云端服务器解析语音信息对应的控制指令;
S304、洗衣机从云端服务器接收解析出的语音信息对应的控制指令,并基于控制指令执行相应的操作。
通过洗衣机接收到语音信息后先在本地语音库中查询控制指令,如果本地语音库中查询到相应的控制指令则按照该控制指令执行相应的操作,本发明的语音控制方法能够使洗衣机的操作执行快,用户体验好。而在从本地语音库中无法查询到语音信息对应的控制指令时,通过上传语音信息至云端服务器,以便云端服务器对该语音信息进行解析得到对应的控制指令,然后洗衣机接收解析出的语音信息对应的控制指令,并基于控制指令进行相应的操作,本发明的语音控制方法还能够在无法在本地识别语音信息时通过云端服务器的解析提高洗衣机的识别准确率,避免洗衣机只通过本地语音库中有限的映射关系进行识别带来的准确率低的问题,大幅提升用户体验。
为进一步提升用户体验,作为一种优选的实施方式,本发明的语音控制方法在步骤S303之后还包括:
洗衣机从云端服务器接收语音信息与控制指令之间的映射关系,并将映射关系存储至本地语音库;其中,当云端服务器解析出语音信息对应的控制指令时,云端服务器确定语音信息与控制指令之间的映射关系在云端语音库中的记录次数;映射关系是当记录次数不等于零且大于预设次数时云端服务器发送的。
通过云端服务器解析出语音信息对应的控制指令时,确定语音信息与对应的控制指令之间的映射关系在云端语音库中的记录次数,并且在该记录次数不等于零且大于预设次数时,将对应的映射关系发送至洗衣机,从而洗衣机接收该映射关系并将该映射关系存储在本地语音库中,本发明的语音控制方法使得洗衣机还能够基于用户的使用习惯自动更新洗衣机中的本地语音库,使洗衣机的语音识别功能的智能程度得到极大地提升,从而进一步提高洗衣机的响应速度和用户的使用体验。
此外,本发明还提供了一种云端服务器,该云端服务器包括存储器、处理器以及计算机程序,其中存储器与处理器连接,计算机程序存储在存储器中,并被配置为由处理器加载以便执行实施例二中所述的语音控制方法。
此外,本发明还提供了一种洗衣机,该洗衣机包括存储器、处理器以及计算机程序,其中存储器与处理器连接,计算机程序存储在存储器中,并被配置为由处理器加载以便执行实施例三中所述的语音控制方法。
下面参照图4和图5,对本发明的控制方法的控制过程进行描述。其中,图4为本发明的语音控制方法的一种实施方式的逻辑图;图5为本发明的语音控制方法的又一种实施方式的逻辑图。
首先参照图4,在一种可能的实施方式中,洗衣机接收用户的语音信息,语音识别模块基于该语音信息在本体语音库中查询对应的控制指令;当在本地语音库中查询到该语音信息对应的控制指令时,语音识别模块将控制指令发送给控制模块,控制模块基于该控制指令控制洗衣机执行相应的操作;当未查询到该语音信息对应的控制指令时,洗衣机将该语音信息通过无线的方式上传至云端,云端服务器对该语音信息进行解析,如果成功解析出该语音信息对应的控制指令,则将该控制指令返回洗衣机的控制模块,从而洗衣机的控制模块基于该控制指令控制洗衣机执行相应的操作;如果云端服务器未成功解析出该语音信息对应的控制指令,则将失败指令返回洗衣机的控制模块,从而控制模块控制洗衣机发出提示音,提示用户重新输入语音信息。
接下来参照图5,在另一种可能的实施方式中,云端在接收到洗衣机上传的语音信息后,对语音信息进行解析,如果未解析出该语音信息对应的指令,则结束命令;如果解析出对应的控制指令,则进一步查询该语音信息与该控制指令之间的映射关系在云端语音库中的记录次数;当记录次数等于零时,将映射关系记录到云端语音库;当记录次数不等于零时,更新记录次数(即记录次数+1)并判断记录次数是否大于N次,如果记录次数不大于N次,则结束命令;如果记录次数大于N 次,则将该映射关系发送给洗衣机。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (10)

1.一种语音控制方法,其特征在于,所述语音控制方法包括:
终端设备接收语音信息;
所述终端设备从本地语音库中查询所述语音信息对应的控制指令;
当在所述本地语音库中未查询到所述语音信息对应的控制指令时,所述终端设备将所述语音信息上传至云端服务器;
所述云端服务器解析所述语音信息对应的控制指令;
当解析出所述语音信息对应的控制指令时,所述云端服务器向所述终端设备发送所述控制指令;
所述终端设备接收所述控制指令,并基于所述控制指令执行相应的操作。
2.根据权利要求1所述的语音控制方法,其特征在于,在“所述云端服务器解析所述语音信息对应的控制指令”的步骤之后,所述语音控制方法还包括:
当解析出所述语音信息对应的控制指令时,所述云端服务器确定所述语音信息与所述控制指令之间的映射关系在云端语音库中的记录次数;
当所述记录次数不等于零时,所述云端服务器比较所述记录次数与预设次数的大小;
当所述记录次数大于所述预设次数时,所述云端服务器将所述映射关系发送至终端设备;
所述终端设备接收所述映射关系,并将所述映射关系存储至所述本地语音库。
3.根据权利要求2所述的语音控制方法,其特征在于,所述语音控制方法还包括:
当所述记录次数等于零时,所述云端服务器将所述映射关系记录到所述云端语音库中。
4.一种语音控制方法,其特征在于,所述语音控制方法包括:
云端服务器接收终端设备上传的语音信息;
所述云端服务器解析所述语音信息对应的控制指令;
当解析出所述语音信息对应的控制指令时,所述云端服务器向所述终端设备发送所述控制指令,以便所述终端设备基于所述控制指令执行相应的操作;
其中,所述终端设备在从本地语音库中无法查询到所述语音信息对应的控制指令时上传所述语音信息。
5.根据权利要求4所述的语音控制方法,其特征在于,在“所述云端服务器解析所述语音信息对应的控制指令”的步骤之后,所述语音控制方法还包括:
当解析出所述语音信息对应的控制指令时,所述云端服务器确定所述语音信息与所述控制指令之间的映射关系在云端语音库中的记录次数;
当所述记录次数不等于零时,所述云端服务器比较所述记录次数与预设次数的大小;
当所述记录次数大于所述预设次数时,所述云端服务器将所述映射关系发送至所述终端设备,以便所述终端设备将所述映射关系存储至所述本地语音库。
6.根据权利要求5所述的语音控制方法,其特征在于,所述语音控制方法还包括:
当所述记录次数等于零时,所述云端服务器将所述映射关系记录到所述云端语音库中。
7.一种语音控制方法,其特征在于,所述语音控制方法包括:
终端设备接收语音信息;
所述终端设备从本地语音库中查询所述语音信息对应的控制指令;
当在所述本地语音库中未查询到所述语音信息对应的控制指令时,所述终端设备将所述语音信息上传至云端服务器,以便所述云端服务器解析所述语音信息对应的控制指令;
所述终端设备从所述云端服务器接收解析出的所述语音信息对应的控制指令,并基于所述控制指令执行相应的操作。
8.根据权利要求7所述的语音控制方法,其特征在于,在“所述终端设备将所述语音信息上传至云端服务器”的步骤之后,所述控制方法还包括:
所述终端设备从所述云端服务器接收所述语音信息与所述控制指令之间的映射关系,并将所述映射关系存储至所述本地语音库;
其中,当所述云端服务器解析出所述语音信息对应的控制指令时,所述云端服务器确定所述语音信息与所述控制指令之间的映射关系在云端语音库中的记录次数;所述映射关系是当所述记录次数不等于零且大于预设次数时所述云端服务器发送的。
9.一种云端服务器,其特征在于,所述云端服务器包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器加载以便执行权利要求4至6中任一项所述的语音控制方法。
10.一种终端设备,其特征在于,所述终端设备包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器加载以便执行权利要求7至8中任一项所述的语音控制方法。
CN201811513015.2A 2018-12-11 2018-12-11 语音控制方法、云端服务器及终端设备 Pending CN111312253A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201811513015.2A CN111312253A (zh) 2018-12-11 2018-12-11 语音控制方法、云端服务器及终端设备
EP19896959.4A EP3896689A4 (en) 2018-12-11 2019-11-26 VOICE CONTROL METHOD, CLOUD SERVER AND TERMINAL DEVICE
JP2021533254A JP7159475B2 (ja) 2018-12-11 2019-11-26 音声制御方法、クラウドサーバおよび端末装置
US17/413,150 US11967320B2 (en) 2018-12-11 2019-11-26 Processing voice information with a terminal device and a cloud server to control an operation
PCT/CN2019/120824 WO2020119438A1 (zh) 2018-12-11 2019-11-26 语音控制方法、云端服务器及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811513015.2A CN111312253A (zh) 2018-12-11 2018-12-11 语音控制方法、云端服务器及终端设备

Publications (1)

Publication Number Publication Date
CN111312253A true CN111312253A (zh) 2020-06-19

Family

ID=71076208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811513015.2A Pending CN111312253A (zh) 2018-12-11 2018-12-11 语音控制方法、云端服务器及终端设备

Country Status (5)

Country Link
US (1) US11967320B2 (zh)
EP (1) EP3896689A4 (zh)
JP (1) JP7159475B2 (zh)
CN (1) CN111312253A (zh)
WO (1) WO2020119438A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283237A (zh) * 2021-05-31 2021-08-20 青岛海尔科技有限公司 家电设备异常的处理方法及装置、存储介质、电子装置
CN114005448A (zh) * 2021-12-29 2022-02-01 广州小鹏汽车科技有限公司 语音交互方法及其装置、模型训练方法、车辆和存储介质
CN114005449A (zh) * 2021-12-29 2022-02-01 广州小鹏汽车科技有限公司 语音交互方法及其装置、模型训练方法、车辆和存储介质
CN114811864A (zh) * 2022-03-14 2022-07-29 青岛海尔空调器有限总公司 用于控制空调器的方法及装置、空调器、存储介质
WO2023241482A1 (zh) * 2022-06-13 2023-12-21 华为技术有限公司 一种人机对话方法、设备及系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111312234A (zh) * 2018-12-11 2020-06-19 青岛海尔洗衣机有限公司 语音控制方法、云端处理器及终端设备
CN112509585A (zh) * 2020-12-22 2021-03-16 北京百度网讯科技有限公司 车载设备的语音处理方法、装置、设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575494A (zh) * 2013-10-16 2015-04-29 中兴通讯股份有限公司 一种语音处理的方法和终端
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN105913847A (zh) * 2016-06-01 2016-08-31 北京灵隆科技有限公司 语音控制系统、用户端设备、服务器和中央控制单元
US20170004829A1 (en) * 2014-01-06 2017-01-05 Ntt Docomo, Inc. Terminal apparatus, program, and server apparatus for providing information according to user data input
CN106782526A (zh) * 2016-12-12 2017-05-31 深圳Tcl数字技术有限公司 语音控制方法和装置
CN106778927A (zh) * 2016-12-30 2017-05-31 深圳Tcl新技术有限公司 更新电视语义识别词库方法及装置
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN107274902A (zh) * 2017-08-15 2017-10-20 深圳诺欧博智能科技有限公司 用于家电的语音控制装置和方法
CN107276864A (zh) * 2017-07-25 2017-10-20 广东美的制冷设备有限公司 智能语音设备控制家电的方法、装置及系统
CN107481722A (zh) * 2017-08-21 2017-12-15 无锡小天鹅股份有限公司 语音控制方法、衣物处理装置及服务器
CN108154882A (zh) * 2017-12-13 2018-06-12 广东美的制冷设备有限公司 遥控设备的控制方法及控制装置、存储介质及遥控设备
CN108172223A (zh) * 2017-12-14 2018-06-15 深圳市欧瑞博科技有限公司 语音指令识别方法、装置及服务器和计算机可读存储介质
CN108320747A (zh) * 2018-02-08 2018-07-24 广东美的厨房电器制造有限公司 家电设备控制方法、设备、终端及计算机可读存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6182038B1 (en) * 1997-12-01 2001-01-30 Motorola, Inc. Context dependent phoneme networks for encoding speech information
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
US20020138274A1 (en) * 2001-03-26 2002-09-26 Sharma Sangita R. Server based adaption of acoustic models for client-based speech systems
CN102496364A (zh) 2011-11-30 2012-06-13 苏州奇可思信息科技有限公司 基于云端网络的交互式语音识别方法
CN102708865A (zh) * 2012-04-25 2012-10-03 北京车音网科技有限公司 语音识别方法、装置及系统
US9060224B1 (en) 2012-06-01 2015-06-16 Rawles Llc Voice controlled assistant with coaxial speaker and microphone arrangement
KR101330671B1 (ko) 2012-09-28 2013-11-15 삼성전자주식회사 전자장치, 서버 및 그 제어방법
US9734151B2 (en) 2012-10-31 2017-08-15 Tivo Solutions Inc. Method and system for voice based media search
KR20140055502A (ko) 2012-10-31 2014-05-09 삼성전자주식회사 방송 수신 장치, 서버 및 그 제어 방법
US9767803B1 (en) * 2013-12-16 2017-09-19 Aftershock Services, Inc. Dynamically selecting speech functionality on client devices
US9741344B2 (en) 2014-10-20 2017-08-22 Vocalzoom Systems Ltd. System and method for operating devices using voice commands
CN104538034B (zh) 2014-12-31 2018-08-28 深圳雷柏科技股份有限公司 一种语音识别方法及系统
US10388277B1 (en) * 2015-06-25 2019-08-20 Amazon Technologies, Inc. Allocation of local and remote resources for speech processing
US10274911B2 (en) * 2015-06-25 2019-04-30 Intel Corporation Conversational interface for matching text of spoken input based on context model
WO2017054122A1 (zh) * 2015-09-29 2017-04-06 深圳市全圣时代科技有限公司 语音识别系统及方法、客户端设备及云端服务器
US20180166068A1 (en) * 2016-12-11 2018-06-14 Microsoft Technology Licensing, Llc Cloud And Name Optimized Speech Recognition
CN110235087B (zh) * 2017-01-20 2021-06-08 华为技术有限公司 一种实现语音控制的方法和终端
US10614804B2 (en) * 2017-01-24 2020-04-07 Honeywell International Inc. Voice control of integrated room automation system
CN108510984B (zh) 2017-02-24 2020-10-27 九阳股份有限公司 一种智能家电设备的语音协同控制方法
US10565986B2 (en) * 2017-07-20 2020-02-18 Intuit Inc. Extracting domain-specific actions and entities in natural language commands
US10572594B2 (en) * 2017-08-01 2020-02-25 Intuit Inc. Extracting domain-specific actions and entities in natural language commands recognized based on edition and recognition scores
US10777203B1 (en) * 2018-03-23 2020-09-15 Amazon Technologies, Inc. Speech interface device with caching component
CN108520747A (zh) 2018-03-29 2018-09-11 浙江吉利汽车研究院有限公司 一种具有语音识别功能的车载控制装置
CN111312234A (zh) * 2018-12-11 2020-06-19 青岛海尔洗衣机有限公司 语音控制方法、云端处理器及终端设备
US11695809B2 (en) * 2019-07-29 2023-07-04 Samsung Electronics Co., Ltd. System and method for registering device for voice assistant service
KR20210036527A (ko) * 2019-09-26 2021-04-05 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 작동 방법
KR20210060897A (ko) * 2019-11-19 2021-05-27 삼성전자주식회사 음성 처리 방법 및 장치

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575494A (zh) * 2013-10-16 2015-04-29 中兴通讯股份有限公司 一种语音处理的方法和终端
US20170004829A1 (en) * 2014-01-06 2017-01-05 Ntt Docomo, Inc. Terminal apparatus, program, and server apparatus for providing information according to user data input
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN105913847A (zh) * 2016-06-01 2016-08-31 北京灵隆科技有限公司 语音控制系统、用户端设备、服务器和中央控制单元
CN106782526A (zh) * 2016-12-12 2017-05-31 深圳Tcl数字技术有限公司 语音控制方法和装置
CN106778927A (zh) * 2016-12-30 2017-05-31 深圳Tcl新技术有限公司 更新电视语义识别词库方法及装置
CN107146622A (zh) * 2017-06-16 2017-09-08 合肥美的智能科技有限公司 冰箱、语音交互系统、方法、计算机设备、可读存储介质
CN107276864A (zh) * 2017-07-25 2017-10-20 广东美的制冷设备有限公司 智能语音设备控制家电的方法、装置及系统
CN107274902A (zh) * 2017-08-15 2017-10-20 深圳诺欧博智能科技有限公司 用于家电的语音控制装置和方法
CN107481722A (zh) * 2017-08-21 2017-12-15 无锡小天鹅股份有限公司 语音控制方法、衣物处理装置及服务器
CN108154882A (zh) * 2017-12-13 2018-06-12 广东美的制冷设备有限公司 遥控设备的控制方法及控制装置、存储介质及遥控设备
CN108172223A (zh) * 2017-12-14 2018-06-15 深圳市欧瑞博科技有限公司 语音指令识别方法、装置及服务器和计算机可读存储介质
CN108320747A (zh) * 2018-02-08 2018-07-24 广东美的厨房电器制造有限公司 家电设备控制方法、设备、终端及计算机可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283237A (zh) * 2021-05-31 2021-08-20 青岛海尔科技有限公司 家电设备异常的处理方法及装置、存储介质、电子装置
CN114005448A (zh) * 2021-12-29 2022-02-01 广州小鹏汽车科技有限公司 语音交互方法及其装置、模型训练方法、车辆和存储介质
CN114005449A (zh) * 2021-12-29 2022-02-01 广州小鹏汽车科技有限公司 语音交互方法及其装置、模型训练方法、车辆和存储介质
CN114811864A (zh) * 2022-03-14 2022-07-29 青岛海尔空调器有限总公司 用于控制空调器的方法及装置、空调器、存储介质
WO2023241482A1 (zh) * 2022-06-13 2023-12-21 华为技术有限公司 一种人机对话方法、设备及系统

Also Published As

Publication number Publication date
JP7159475B2 (ja) 2022-10-24
US11967320B2 (en) 2024-04-23
EP3896689A1 (en) 2021-10-20
JP2022512357A (ja) 2022-02-03
EP3896689A4 (en) 2022-05-18
US20220028384A1 (en) 2022-01-27
WO2020119438A1 (zh) 2020-06-18

Similar Documents

Publication Publication Date Title
CN111312253A (zh) 语音控制方法、云端服务器及终端设备
CN111312234A (zh) 语音控制方法、云端处理器及终端设备
CN107644638B (zh) 语音识别方法、装置、终端和计算机可读存储介质
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
KR102004872B1 (ko) 전자장치, 서버 및 그 제어방법
US10388277B1 (en) Allocation of local and remote resources for speech processing
WO2016206494A1 (zh) 语音控制方法、装置和移动终端
US20060195323A1 (en) Distributed speech recognition system
WO2014096506A1 (en) Method, apparatus, and computer program product for personalizing speech recognition
CN107966910B (zh) 语音处理方法、智能音箱及可读存储介质
CN103944983B (zh) 语音控制指令纠错方法和系统
US20070061147A1 (en) Distributed speech recognition method
CN109545213A (zh) 设备控制方法、装置、存储介质及空调
KR20190001435A (ko) 음성 입력에 대응하는 동작을 수행하는 전자 장치
US10976997B2 (en) Electronic device outputting hints in an offline state for providing service according to user context
CN115482806B (zh) 语音处理系统、方法、装置、存储介质和计算机设备
CN108847231B (zh) 远场语音识别方法、装置及系统
CN114550719A (zh) 语音控制指令的识别方法和装置、存储介质
CN114121005A (zh) 语音控制方法、装置、电子设备及存储介质
CN111028832B (zh) 麦克风静音模式控制方法、装置及存储介质和电子设备
CN115328321B (zh) 基于身份转换的人机交互方法及相关装置
KR102575697B1 (ko) 음향을 제어하는 공용 단말, 방법 및 컴퓨터 프로그램
CN111583925B (zh) 设备控制方法、智能设备及存储介质
CN114627865A (zh) 语音指令执行控制方法、装置、终端设备及存储介质
CN111835602A (zh) 用户指令处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200619

RJ01 Rejection of invention patent application after publication