CN112151026A - 语音控制方法、装置、服务器和计算机可读存储介质 - Google Patents
语音控制方法、装置、服务器和计算机可读存储介质 Download PDFInfo
- Publication number
- CN112151026A CN112151026A CN202010842290.XA CN202010842290A CN112151026A CN 112151026 A CN112151026 A CN 112151026A CN 202010842290 A CN202010842290 A CN 202010842290A CN 112151026 A CN112151026 A CN 112151026A
- Authority
- CN
- China
- Prior art keywords
- voice control
- control instruction
- information
- matching
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000004891 communication Methods 0.000 claims abstract description 7
- 238000004590 computer program Methods 0.000 claims description 13
- 239000008280 blood Substances 0.000 claims description 12
- 210000004369 blood Anatomy 0.000 claims description 12
- 230000005059 dormancy Effects 0.000 claims description 8
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 4
- 229910052760 oxygen Inorganic materials 0.000 claims description 4
- 239000001301 oxygen Substances 0.000 claims description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 2
- 239000008103 glucose Substances 0.000 claims description 2
- 150000002632 lipids Chemical class 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000007958 sleep Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 208000008035 Back Pain Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 239000003570 air Substances 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000004898 kneading Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Massaging Devices (AREA)
Abstract
本申请涉及一种语音控制方法和装置、服务器、计算机可读存储介质,包括:应用于与按摩仪通信连接的终端,因为用户每次所发出的语音控制指令存在差异,所以先将语音控制指令中的声音信息与预设语音控制指令中的声音信息进行匹配,若匹配度低于匹配阈值,则输出调整指令,使得用户根据调整指令重新发出语音控制指令。若匹配度高于匹配阈值,对第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。从而,通过不断调整语音控制指令,以提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种语音控制方法和装置、服务器、计算机可读存储介质。
背景技术
随着科技的不断发展,现代工作生活中对于各种电子设备的长时间使用,导致人们出现各种“腰酸背痛”等不适症状。为了缓解这种不适症状,各种保健器材顺势而生,也受到了人们的追捧和欢迎。其中,按摩仪就是一种保健器材,按摩仪是按摩器升级版,根据物理学,仿生学,生物电学、中医学以及多年临床实践而研制开发出的新一代保健器材。按摩仪能够在一定程度上缓解人们的各种不适症状。
传统的按摩仪一般通过手动来进行控制,且即使可以通过安装在终端上的应用程序对按摩仪进行语音控制,但是由于语音识别的准确率较低,也很难实现对按摩仪进行准确地语音控制。以至于在对按摩仪进行语音控制的过程中,按摩仪经常错误执行按摩动作或无法执行按摩动作,因此无法满足用户的使用需求。
发明内容
本申请实施例提供一种语音控制方法、装置、服务器、计算机可读存储介质,可以提高通过语音对按摩仪进行控制的准确性。
一种语音控制方法,应用于与按摩仪通信连接的终端,包括:
接收用户发出的第一语音控制指令,所述语音控制指令中包含声音信息及语义信息;
对所述第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度;
若所述第一匹配度低于预定的第一匹配阈值,则输出调整指令,所述调整指令用于指示用户重新发出语音控制指令;
若所述第一匹配度高于所述预定的第一匹配阈值,对所述第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向所述按摩仪发出控制指令。
在其中一个实施例中,在所述输出调整指令之后,所述方法还包括:
接收用户发出的第二语音控制指令;
对所述第二语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第二匹配度;
若所述第二匹配度高于预定的第一匹配阈值,对所述第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向所述按摩仪发出控制指令。
在其中一个实施例中,所述声音信息包括音调信息、音色信息及响度信息;所述对所述第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度,包括:
对所述第一语音控制指令中的声音信息进行识别,得到音调信息、音色信息及响度信息;
将所述音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度。
在其中一个实施例中,将所述音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度,包括:
将所述音色信息与预设语音控制指令中的音色信息进行匹配;
若所述音色信息与预设语音控制指令中的音色信息的匹配度大于预设音色阈值,则将所述音调信息与预设语音控制指令中的音调信息进行匹配得到音调匹配度、将所述响度信息与预设语音控制指令中的响度信息进行匹配得到响度匹配度。
在其中一个实施例中,若所述第一匹配度低于第一匹配阈值,则输出调整指令,包括:
从所述音调匹配度及所述响度匹配度中获取不匹配的声音信息;
根据所述不匹配的声音信息输出调整指令。
在其中一个实施例中,所述语义信息包括关键词;所述对所述第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令,包括:
从所述第二语音控制指令中提取关键词;
将所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词进行匹配;
若所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定所述第二语音控制指令与所述预设语音控制指令匹配;
向按摩仪发出与所述预设语音指令相对应的控制指令。
在其中一个实施例中,在所述将所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词进行匹配之后,所述方法还包括:
若所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,则获取历史语音控制指令中的关键词;
将所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词进行匹配;
若所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定所述第二语音控制指令与所述历史语音控制指令匹配;
向按摩仪发出与所述历史语音指令相对应的控制指令。
在其中一个实施例中,在所述将所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词进行匹配之后,所述方法还包括:
若所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,则将所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词进行模糊匹配;
若模糊匹配所得的匹配度大于预设关键词阈值,则确定所述第二语音控制指令与所述历史语音控制指令匹配;
向按摩仪发出与所述历史语音指令相对应的控制指令。
在其中一个实施例中,所述方法还包括:
获取所述按摩仪上采集用户的生命体征信息及所述按摩仪的运行信息;
在所述按摩仪转入待机状态、或转入休眠状态、或转入关机状态后,将所述生命体征信息及所述按摩仪的运行信息上传至服务器进行存储。
在其中一个实施例中,所述方法还包括:
接收所述按摩仪在转入待机状态、或转入休眠状态、或转入关机状态时发送的待机反馈、或休眠反馈、或关机反馈。
在其中一个实施例中,所述生命体征信息包括使用者的心跳、心率、血氧饱和度、血糖、血脂信息中的任意一种或多种。
在其中一个实施例中,所述运行信息包括所述按摩仪的按摩模式、按摩时长及按摩力度信息中的任意一种或多种。
一种语音控制装置,应用于与按摩仪连接的终端,所述装置包括:
第一语音控制指令接收模块,用于接收用户发出的第一语音控制指令,所述语音控制指令中包含声音信息及语义信息;
匹配模块,用于对所述第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度;
调整指令输出模块,用于若所述第一匹配度低于预定的第一匹配阈值,则输出调整指令,所述调整指令用于指示用户重新发出语音控制指令;
控制模块,用于若所述第一匹配度高于所述预定的第一匹配阈值,对所述第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向所述按摩仪发出控制指令。
一种终端,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上方法的步骤。
上述语音控制方法、装置、服务器、计算机可读存储介质,应用于与按摩仪通信连接的终端,因为用户每次所发出的语音控制指令存在差异,所以先将语音控制指令中的声音信息与预设语音控制指令中的声音信息进行匹配,若匹配度低于匹配阈值,则输出调整指令,使得用户根据调整指令重新发出语音控制指令。若匹配度高于匹配阈值,对第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。从而,通过不断调整语音控制指令,以提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中语音控制方法的应用环境图;
图2为一个实施例中语音控制方法的流程示意图;
图3为在图2中在所述输出调整指令之后语音控制方法的流程示意图;
图4为一个实施例中将音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配的方法的流程示意图;
图5为图2中对第二语音控制指令中的语义信息进行识别,向按摩仪发出控制指令的方法的流程示意图;
图6为一个具体的实施例中语音控制方法的流程示意图;
图7为一个实施例中语音控制装置的结构示意框图;
图8为一个实施例中终端的内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。
如图1所示,为一个实施例中语音控制方法的应用环境图。该应用环境包括按摩仪120、与按摩仪通信连接的终端140,按摩仪120与终端140的通信连接方式可以是有线或无线方式,例如利用蓝牙、WiFi、Zigbee等连接方式实现通信连接。终端140接收第一语音控制指令,语音控制指令中包含声音信息及语义信息;接收用户发出的第一语音控制指令,语音控制指令中包含声音信息及语义信息;对第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度;若第一匹配度低于预定的第一匹配阈值,则输出调整指令,调整指令用于指示用户重新发出语音控制指令;若第一匹配度高于预定的第一匹配阈值,对第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。这里的终端可以是手机、平板电脑或者个人数字助理或穿戴式设备等,本申请对此不做限定。
图2为一个实施例中语音控制方法的流程图,如图2所示,提供了一种语音控制方法,应用于与按摩仪通信连接的终端,包括步骤220至步骤260。
步骤220,接收用户发出的第一语音控制指令,语音控制指令中包含声音信息及语义信息。
具体的,终端接收用户发出的第一语音控制指令,可以是通过终端上所安装的控制按摩仪的应用程序来接收语音控制指令,以实现对按摩仪的语音控制,也可以是直接由终端接收到语音控制指令,以实现对按摩仪的语音控制。
语音控制指令中包含声音信息及语义信息,其中,声音指的是由物体振动产生的声波。声音是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。可以被人耳识别的声音的频率一般在20Hz~20000Hz之间。声音所携带的信息就是声音信息,声音信息包括但不限于音调、响度、语速、语气、音色等信息,这些信息分别从不同的维度来描述声音的特征。其中,语义信息指的是语音控制指令中的语言所蕴含的意义,在本申请实施例中用于指示控制按摩仪实施对应的操作。
终端接收用户发出的第一语音控制指令,该第一语音控制指令中包含声音信息及语义信息。
步骤240,对第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度。
因为声音信息包括但不限于音调、响度、语速、语气、音色等信息,所以对第一语音控制指令中的声音信息进行识别,就是对第一语音控制指令中的音调、响度、语速、语气、音色等信息分别进行识别。例如,声音实际上是声波,可以基于声波的振幅来识别出声音的响度信息,基于声波的频率来识别出声音的音调信息。
音色是指不同声音表现在波形方面上不同的特性,不同物体的振动也都有不同的特点。音色由基音和泛音组成,不同的发声体由于其材料、结构等不同,则所发出声音的音色也不同。例如钢琴、小提琴和人发出的声音不一样,且每一个人所发出的声音也不一样。语速指的是在单位时间内所呈现的词汇的个数,语气是在一定的具体思想感情支配下具体语句的一种声音形式。
具体的,预先采集该按摩仪的使用者在对按摩仪进行语音控制时所发出的预设语音控制指令(标准语句),从该标准语句中提取出该使用者的声音信息并存储在数据库中。同理,该声音信息包括但不限于音调、响度、语速、语气、音色等信息。对第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度。
步骤250,判断第一匹配度高于预定的第一匹配阈值;若是,执行步骤280,若否,执行步骤260。
步骤260,则输出调整指令,调整指令用于指示用户重新发出语音控制指令。
将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度,判断第一匹配度高于预定的第一匹配阈值。而在多数情况下,使用者每次所发出的第一语音控制指令存在差异,不一定与标准语句的匹配度较高。若所识别出的声音信息中的各个信息与预设语音控制指令中的各个声音信息均不相互匹配,则就需要使用者对第一语音控制指令进行调整并重新输入新的语音控制指令,以便后续进行语义识别进而准确地向按摩仪发出控制指令。尤其是若所识别出的声音信息与预设语音控制指令中的声音信息中的音调信息、音色信息及响度信息中的任一项不相互匹配,则就需要使用者对第一语音控制指令进行调整并重新输入新的语音控制指令。
具体为,若判断出第一匹配度并未高于预定的第一匹配阈值,根据匹配结果输出调整指令,以使使用者根据调整指令去调整下一次所要发出的语音控制指令。
步骤280,对第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。
将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度,若第一匹配度高于预定的第一匹配阈值。例如,所识别出的声音信息中的各个信息与预设语音控制指令中的各个声音信息的匹配度高于第一匹配阈值,则得出第一语音控制指令与预设语音控制指令相互匹配。此时,说明终端此时所接收的第一语音控制指令与预设语音控制指令(标准语句)的匹配度较高,不需要使用者对第一语音控制指令进行调整并重新输入新的语音控制指令。在终端接收第一语音控制指令之后,对第一语音控制指令中的语义信息进行识别得到语义识别结果。然后,终端基于语义识别结果向按摩仪发出控制指令。例如,终端对第一语音控制指令中的语义信息进行识别得到语义识别结果为“开始捶打模式”,则基于语义识别结果向按摩仪发出“切换至捶打模式”的控制指令,以使按摩仪切换至捶打模式。
本申请实施例中,应用于与按摩仪通信连接的终端,因为用户每次所发出的语音控制指令存在差异,所以先将语音控制指令中的声音信息与预设语音控制指令中的声音信息进行匹配,若匹配度低于匹配阈值,则输出调整指令,使得用户根据调整指令重新发出语音控制指令。若匹配度高于匹配阈值,对第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。从而,通过不断调整语音控制指令,以提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
在一个实施例中,如图3所示,提供了一种语音控制方法,包括:
步骤302,接收用户发出的第一语音控制指令,语音控制指令中包含声音信息及语义信息。
步骤304,对第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度。
步骤306,判断第一匹配度高于预定的第一匹配阈值;若是,执行步骤308,若否,执行步骤310。
步骤308,对第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。
步骤310,输出调整指令,调整指令用于指示用户重新发出语音控制指令。
在步骤310输出调整指令之后,还包括:
步骤312,接收用户发出的第二语音控制指令;
步骤314,对第二语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第二匹配度;
步骤316,判断第二匹配度是否高于预定的第一匹配阈值;若是,执行步骤318,若否,则进入步骤310。
步骤318,对第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。
具体的,而在多数情况下,使用者每次所发出的第一语音控制指令存在差异,不一定与标准语句的匹配度较高。若所识别出的声音信息中的各个信息与预设语音控制指令中的各个声音信息均不相互匹配,则就需要使用者对第一语音控制指令进行调整并重新输入新的语音控制指令,以便后续进行语义识别进而准确地向按摩仪发出控制指令。尤其是若所识别出的声音信息与预设语音控制指令中的声音信息中的音调信息、音色信息及响度信息中的任一项不相互匹配,则就需要使用者对第一语音控制指令进行调整并重新输入新的语音控制指令。
具体为,根据第一匹配度输出调整指令,以使使用者根据调整指令去调整下一次所要发出的语音控制指令。接收用户发出的第二语音控制指令,对第二语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第二匹配度。直到使用者所发出的第二语音控制指令中的声音信息与预设语音控制指令中的声音信息相互匹配,即第二匹配度大于预定的第一匹配阈值。此时,终端接收第二语音控制指令,基于所识别出的语义信息向按摩仪发出控制指令。
本申请实施例中,因为用户每次所发出的语音控制指令存在差异,所以先将语音控制指令中的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度,再基于第一匹配度给用户发出调整指令。使得用户根据调整指令调整语音控制指令,生成第二语音控制指令。然后,对第二语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第二匹配度。若第二匹配度高于预定的第一匹配阈值,对第二语音控制指令中的语义信息进行识别。此时,就可以对第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。从而,通过不断调整语音控制指令,以提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
在一个实施例中,声音信息包括音调信息、音色信息及响度信息;对第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到匹配结果,包括:
对第一语音控制指令中的声音信息进行识别,得到音调信息、音色信息及响度信息;
将音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度。
具体的,声音信息中的音色信息用于鉴别是否为合法的使用者,且音调信息、响度信息需高于一定阈值,才能保证语音控制指令的清晰。其中,合法的使用者为预先在终端上进行了注册的用户。例如,预先为按摩仪设置了多个合法使用者,则为这些合法使用者均录入了标准语句,从标准语句中提取出每一位合法使用者的预设语音控制指令中的声音信息并存储在数据库中。同理,该预设语音控制指令中的声音信息包括但不限于音调、响度、语速、语气、音色等信息。
因此,在对第一语音控制指令中的声音信息进行识别,得到音调信息、音色信息及响度信息之后,将音调信息、音色信息及响度信息与每一位合法使用者的预设语音控制指令中的声音信息进行匹配,得到第一匹配度。
在一个实施例中,可以将音调信息、音色信息及响度信息与每一位合法使用者的预设语音控制指令中的声音信息进行匹配,分别得到音色匹配度、音调匹配度、响度匹配度。
在一个实施例中,可以计算音色匹配度、音调匹配度、响度匹配度的平均值,或者加权平均值来得到第一匹配度;
在另一个实施例中,可以将音色匹配度、音调匹配度、响度匹配度都大于预设阈值的语音控制指令的匹配度设定为大于第一匹配阈值,其中任意一项小于或等于预设阈值的语音控制指令的匹配度设定为小于或等于第一匹配阈值。
本申请实施例中,由于声音信息中的音色信息用于鉴别是否为合法的使用者,且音调信息、响度信息需高于一定阈值,才能保证语音控制指令的清晰。因此,对第一语音控制指令中的声音信息进行识别,得到音调信息、音色信息及响度信息,再将音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度。从而,从音调信息、音色信息及响度信息三个维度上筛选出清晰的语音控制指令,进而提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
在一个实施例中,如图4所示,将音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度,包括:
步骤420,将音色信息与预设语音控制指令中的音色信息进行匹配;
步骤440,判断音色信息与预设语音控制指令中的音色信息的匹配度是否大于预设音色阈值;若是,执行步骤460,若否,则执行步骤480;
步骤460,则将音调信息与预设语音控制指令中的音调信息进行匹配得到音调匹配度、将响度信息与预设语音控制指令中的响度信息进行匹配得到响度匹配度。
步骤480,结束语音控制流程。
具体的,因为声音信息中的音色信息用于鉴别是否为合法的使用者,且音调信息、响度信息需高于一定阈值,才能保证语音控制指令的清晰。因此,在将第一语音控制指令中的音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度的时候,先将第一语音控制指令中的音色信息与预设语音控制指令中的音色信息(以下简称预设音信息)进行匹配,判断音色信息与预设音色信息的匹配度是否大于预设音色阈值,例如85%。若音色信息与预设音色信息的匹配度小于或等于预设音色阈值,则说明第一语音控制指令中的音色信息与预设音色信息不匹配,则鉴别出发出第一语音控制指令的使用者为非法的使用者,不需要进行后续音调、响度的匹配步骤。也即是在本实施例中,若音色匹配度低于预设音色阈值,可直接判定第一语音控制指令的第一匹配度低于第一匹配阈值。
若第一语音控制指令中的音色信息与预设音色信息的匹配度大于预设音色阈值,则进一步将第一语音控制指令中的音调信息与预设语音控制指令中的音调信息(以下简称预设音调信息)进行匹配得到音调匹配度、将第一语音控制指令中的响度信息与预设语音控制指令中的响度信息(以下简称预设响度信息)进行匹配得到响度匹配度。其中,将第一语音控制指令中的音调信息与预设音调信息进行匹配得到音调匹配度,实际上就是计算第一语音控制指令中的音调信息与预设音调信息之间的匹配度,也可以称之为相似度。然后,再判断匹配度是否大于预设阈值,例如85%。对于将第一语音控制指令中的响度信息与预设响度信息进行匹配得到响度匹配度,也是同理,在此不再赘述。
本申请实施例中,在将第一语音控制指令中的音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度的时候,先将第一语音控制指令中的音色信息与预设语音控制指令中的音色信息进行匹配。若第一语音控制指令中的音色信息与预设语音控制指令中的音色信息相互匹配,则进而判断第一语音控制指令中的音调信息与预设语音控制指令中的音调信息是否匹配、响度信息与预设响度信息是否匹配。通过音色信息剔除非法用户,过滤其他非法用户所带来的噪音,实现了避免终端频繁响应、进而减少资源浪费。
在一个实施例中,步骤260,若第一匹配度低于第一匹配阈值,则输出调整指令,包括:
从音调匹配度及响度匹配度中获取不匹配的声音信息;
根据不匹配的声音信息输出调整指令。
具体的,若第一语音控制指令中的音色信息与预设语音控制指令中的音色信息的匹配度大于预设音色阈值,则进一步将第一语音控制指令中的音调信息与预设语音控制指令中的音调信息进行匹配得到音调匹配度、将第一语音控制指令中的响度信息与预设语音控制指令中的响度信息进行匹配得到响度匹配度。
进而,从音调匹配度及响度匹配度中获取不匹配的声音信息,根据不匹配的声音信息输出调整指令,调整指令用于对第一语音控制指令进行调整。具体为,若音调信息与预设音调信息之间的匹配度小于预设音调阈值,且响度信息与预设响度信息之间的匹配度也小于预设响度阈值,则说明音调信息、响度信息均为不匹配的声音信息。根据不匹配的声音信息输出调整指令,例如,当音调信息相对于预设音调信息、响度信息相对于预设响度信息均太高时,输出调整指令可以为:“请调低音调和音量”。其中,音量又称响度。当音调信息相对于预设音调信息太高,而响度信息相对于预设响度信息太低时,输出调整指令可以为:“请调低音调并调高音量”或“请调低音调并大声说一遍”。当音调信息相对于预设音调信息太低,而响度信息相对于预设响度信息太高时,输出调整指令可以为:“请调高音调并调低音量”或“请调高音调并小声说一遍”。当然,也可以直接输出调整指令为:“请清晰重说一遍,我未听清”,并不给出一个具体的调整方向。
在使用者根据调整指令对第一语音控制指令进行调整之后,生成新的语音控制指令。终端再次接收新的语音控制指令,重复执行上述匹配的过程。具体为,先将新的语音控制指令中的音色信息与预设音色信息进行匹配。若音色信息与预设音色信息的匹配度大于预设音色阈值,则将新的语音控制指令中的音调信息与预设音调信息进行匹配得到音调匹配度、将新的语音控制指令中的响度信息与预设响度信息进行匹配得到响度匹配度。若这两这个匹配度对应的匹配度均分别大于预设音调阈值、预设响度阈值,则说明该新的语音控制指令中的声音信息与预设语音控制指令中的声音信息相互匹配,将该新的语音控制指令作为第二语音控制指令。
当然,在其他情况下,若新的语音控制指令中的音调信息、音色信息及响度信息中的任意一项与预设语音控制指令中的声音信息的匹配度小于或等于各自对应的预设阈值,则说明该新的语音控制指令中的声音信息与预设声音信不相互匹配,则需要继续对该新的语音控制指令进行调整,直到调整后的语音控制指令中的声音信息与预设声音信相互匹配,将该调整后的语音控制指令作为第二语音控制指令。
本申请实施例中,从音调匹配度及响度匹配度中获取不匹配的声音信息。根据不匹配的声音信息输出调整指令,使得使用者可以根据调整指令用于对第一语音控制指令进行针对性地调整,从而,避免使用者漫无目的进行调整,提高调整的效率。
在一个实施例中,语义信息包括关键词;如图5所示,步骤380,对第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令,包括:
步骤382,从第二语音控制指令中提取关键词。
具体的,在使用者基于调整指令对前一次的语音控制指令进行调整,直到使用者所发出的语音控制指令中的音调信息、音色信息及响度信息与预设声音信相互匹配,将该调整后的语音控制指令作为第二语音控制指令。然后,采用语音识别方法从第二语音控制指令中提取关键词。其中,语音控制指令中的关键词包括加热中(具体划分为升档、降档、最小档、最大档、某个具体档位)、强度(具体划分为升档、降档、最小档、最大档、某个具体档位)、按摩模式(具体划分为按压、揉捏、捶打、混合)、按摩时长(具体划分为定时长“X”分钟,加时长、减时长)、状态(具体划分为开机、关机、暂停、同步到云)等,本申请对此不做限定。
步骤384,将第二语音控制指令中的关键词与预设语音控制指令中的关键词进行匹配。
预先已经提取出了预设语音控制指令中的关键词,此时直接获取预设语音控制指令中的关键词。将第二语音控制指令中的关键词与预设语音控制指令中的关键词进行匹配,计算匹配度(相似度)。
步骤386,若第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定第二语音控制指令与预设语音控制指令匹配;
步骤388,向按摩仪发出与预设语音指令相对应的控制指令。
在计算出了第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度之后,判断第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度是否大于预设关键词阈值。若第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度大于预设关键词阈值,则向按摩仪发出与预设语音指令相对应的控制指令。
本申请实施例中,将第二语音控制指令中的语义信息与预设语音控制指令中的语义信息采用关键词匹配的方式进行匹配。若第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度大于预设关键词阈值,则向按摩仪发出与预设语音指令相对应的控制指令。通过关键词匹配的方式,能够实现精准地匹配到语义信息,进而提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
接上一个实施例中,提供了一种语音控制方法,在将第二语音控制指令中的关键词与预设语音控制指令中的关键词进行匹配之后,还包括:
若第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,则获取历史语音控制指令中的关键词;
将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行匹配;
若第二语音控制指令中的关键词与历史语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定第二语音控制指令与历史语音控制指令匹配;
向按摩仪发出与历史语音指令相对应的控制指令。
本申请实施例中,在第二语音控制指令中的关键词与预设语音控制指令中的关键词匹配失败之后,将第二语音控制指令中的语义信息与历史语音控制指令中的语义信息采用关键词匹配的方式进行匹配。若第二语音控制指令中的关键词与历史预设语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定第二语音控制指令与历史语音控制指令匹配,向按摩仪发出与历史语音指令相对应的控制指令。增加将第二语音控制指令中的语义信息与历史语音控制指令中的语义信息采用关键词匹配的方式进行匹配的步骤,扩大比对范围、提高语音控制的成功率。且通过关键词匹配的方式,能够实现精准地匹配到语义信息,进而提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
接上一个实施例中,提供了一种语音控制方法,在将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行匹配之后,还包括:
若第二语音控制指令中的关键词与历史语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行模糊匹配;
若模糊匹配所得的匹配度大于预设关键词阈值,则确定第二语音控制指令与历史语音控制指令匹配;
向按摩仪发出与历史语音指令相对应的控制指令。
具体的,先获取与第二语音控制指令中的关键词具有相似语义的词汇,例如,近义词、同义词、缩略词等,本申请对此不做限定。其中,模糊匹配指的是将第二语音控制指令中的关键词的近义词、同义词、缩略词等与历史语音控制指令中的关键词进行匹配。
本申请实施例中,在第二语音控制指令中的关键词与历史语音控制指令中的关键词匹配失败之后,将第二语音控制指令中的关键词与历史语音控制指令中的关键词采用模糊匹配的方式进行匹配。若模糊匹配所得的匹配度大于预设关键词阈值,则确定第二语音控制指令与历史语音控制指令匹配,向按摩仪发出与历史语音指令相对应的控制指令。增加将第二语音控制指令中的关键词与历史语音控制指令中的关键词采用模糊匹配的方式进行匹配的步骤,扩大比对范围、提高语音控制的成功率。且通过关键词匹配的方式,能够实现精准地匹配到语义信息,进而提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
在一个实施例中,本申请提供的一种语音控制方法,还包括:
获取按摩仪上采集用户的生命体征信息及按摩仪的运行信息;
在按摩仪转入待机状态、或转入休眠状态、或转入关机状态后,将生命体征信息及按摩仪的运行信息上传至服务器进行存储。
具体的,在按摩仪给使用者提供按摩服务的过程中,按摩仪实时采集用户的生命体征信息及按摩仪的运行信息。其中,生命体征信息包括使用者的心跳、心率、血氧饱和度、血糖、血脂中的任意一种或多种,运行信息包括按摩仪的按摩模式、按摩时长及按摩力度信息中的任意一种或多种。本申请对此不作限定。终端可以实时或定时从按摩仪上采集用户的生命体征信息及按摩仪的运行信息。
若按摩仪在预设时间段内未接收到终端上的应用程序所发出的控制指令,则按摩仪可以根据预设时间段的时长选择转入待机状态、或转入休眠、或关机状态。例如,当按摩仪开机之后,在15s内未接收到终端上的应用程序所发出的控制指令,则按摩仪可以选择转入待机状态。当按摩仪开机之后,在60s内未接收到终端上的应用程序所发出的控制指令,则按摩仪可以选择转入休眠或关机状态。
然后,在按摩仪转入待机状态、或转入休眠状态、或转入关机状态后,将生命体征信息及按摩仪的运行信息上传至服务器(云平台存储器)进行存储。
本申请实施例中,终端可以实时或定时从按摩仪上采集用户的生命体征信息及按摩仪的运行信息。在按摩仪转入待机状态、或转入休眠状态、或转入关机状态后,经终端的应用程序将这些信息上传至服务器上进行存储。选择在按摩仪转入待机状态、或转入休眠状态、或转入关机状态后,才进行数据的上传,避免占用控制指令发送的通道,以提高终端根据语音控制指令对按摩仪进行语音控制的效率。
在一个实施例中,提供了一种语音控制方法,还包括:接收按摩仪在转入待机状态、或转入休眠状态、或转入关机状态时发送待机反馈、或休眠反馈、或关机反馈。
本申请实施例中,按摩仪在转入待机状态、或转入休眠状态、或转入关机状态时,向终端分别发送待机反馈、或休眠反馈、或关机反馈。这样,终端可以及时了解按摩仪当前的使用状态,方便用户及时做出调整。
在一个具体的实施例中,如图6所示,提供了一种语音控制方法,包括:
步骤602,接收第一语音控制指令,语音控制指令中包含声音信息及语义信息;进入步骤604;
步骤604,对第一语音控制指令中的声音信息进行识别,得到音调信息、音色信息及响度信息;进入步骤606;
步骤606,将音色信息与预设语音控制指令中的音色信息进行匹配;进入步骤608;
步骤608,判断音色信息与预设语音控制指令中的音色信息的匹配度是否大于预设音色阈值;若是,进入步骤610;若否,进入步骤612;
步骤610,将音调信息与预设语音控制指令中的音调信息进行匹配得到音调匹配度、将响度信息与预设语音控制指令中的响度信息进行匹配得到响度匹配度;进入步骤614;
步骤612,结束语音控制流程;
步骤614,从音调匹配度及响度匹配度中获取不匹配的声音信息;进入步骤616;
步骤616,根据不匹配的声音信息输出调整指令;进入步骤618;
步骤618,接收基于调整指令对第一语音控制指令进行调整所生成的第二语音控制指令;进入步骤620;
步骤620,从第二语音控制指令中提取关键词;进入步骤622;
步骤622,将第二语音控制指令中的关键词与预设语音控制指令中的关键词进行匹配,判断匹配度是否大于预设关键词阈值;若是,进入步骤624;若否,进入步骤626;
步骤624,基于第二语音控制指令中的关键词向按摩仪发出控制指令;进入步骤626;
步骤626,获取历史语音控制指令中的关键词;进入步骤628;
步骤628,将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行匹配,判断匹配度是否大于预设关键词阈值;若是,进入步骤624;若否,进入步骤630;
步骤630,将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行模糊匹配,判断匹配度是否大于预设关键词阈值;若是,进入步骤624;若否,进入步骤612。
本申请实施例中,因为用户每次所发出的语音控制指令存在差异,所以先将语音控制指令中的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度,再基于第一匹配度给用户发出调整指令。使得用户根据调整指令调整语音控制指令,生成第二语音控制指令。然后,对第二语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第二匹配度。若第二匹配度高于预定的第一匹配阈值,对第二语音控制指令中的语义信息进行识别。此时,就可以对第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。从而,通过不断调整语音控制指令,以提高终端根据语音控制指令对按摩仪进行语音控制的准确性。
在一个实施例中,提供了一种语音控制装置700,包括:
第一语音控制指令接收模块720,用于接收用户发出的第一语音控制指令,语音控制指令中包含声音信息及语义信息;
匹配模块740,用于对第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度;
调整指令输出模块760,用于若第一匹配度低于预定的第一匹配阈值,则输出调整指令,调整指令用于指示用户重新发出语音控制指令;
控制模块780,用于若第一匹配度高于预定的第一匹配阈值,对第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。
在一个实施例中,提供了一种语音控制装置700,还包括:
第二语音控制指令接收模块,用于接收用户发出的第二语音控制指令;对第二语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第二匹配度;若第二匹配度高于预定的第一匹配阈值,对第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令。
在一个实施例中,声音信息包括音调信息、音色信息及响度信息;匹配模块740,还用于对第一语音控制指令中的声音信息进行识别,得到音调信息、音色信息及响度信息;将音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度。
在一个实施例中,匹配模块740,包括:
音色信息匹配单元,用于将音色信息与预设语音控制指令中的音色信息进行匹配;
音调及响度信息匹配单元,用于若音色信息与预设语音控制指令中的音色信息的匹配度大于预设音色阈值,则将音调信息与预设语音控制指令中的音调信息进行匹配得到音调匹配度、将响度信息与预设语音控制指令中的响度信息进行匹配得到响度匹配度。
在一个实施例中,第二语音控制指令接收模块760,还用于从音调匹配度及响度匹配度中获取不匹配的声音信息;根据不匹配的声音信息输出调整指令。
在一个实施例中,控制模块780,还用于从第二语音控制指令中提取关键词;将第二语音控制指令中的关键词与预设语音控制指令中的关键词进行匹配;若第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定第二语音控制指令与预设语音控制指令匹配;向按摩仪发出与预设语音指令相对应的控制指令。
在一个实施例中,控制模块780,还用于在将第二语音控制指令中的关键词与预设语音控制指令中的关键词进行匹配之后,包括:若第二语音控制指令中的关键词与预设语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,则获取历史语音控制指令中的关键词;将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行匹配;若第二语音控制指令中的关键词与历史语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定第二语音控制指令与历史语音控制指令匹配;向按摩仪发出与历史语音指令相对应的控制指令。
在一个实施例中,控制模块780,还用于在将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行匹配之后,包括:若第二语音控制指令中的关键词与历史语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,则将第二语音控制指令中的关键词与历史语音控制指令中的关键词进行模糊匹配;若模糊匹配所得的匹配度大于预设关键词阈值,则确定第二语音控制指令与历史语音控制指令匹配;向按摩仪发出与历史语音指令相对应的控制指令。
在一个实施例中,提供了一种语音控制装置,还包括:
信息采集模块,用于获取按摩仪上采集用户的生命体征信息及按摩仪的运行信息;
上传模块,用于在按摩仪转入待机状态、或转入休眠状态、或转入关机状态后,将生命体征信息及按摩仪的运行信息上传至服务器进行存储。
在一个实施例中,提供了一种语音控制装置,还包括:
反馈模块,用于接收按摩仪在转入待机状态、或转入休眠状态、或转入关机状态时发送待机反馈、或休眠反馈、或关机反馈。
在一个实施例中,生命体征信息包括使用者的心跳、心率、血氧饱和度、血糖、血脂信息中的任意一种或多种。
在一个实施例中,运行信息包括按摩仪的按摩模式、按摩时长及按摩力度信息中的任意一种或多种。
上述语音控制装置中各个模块的划分仅用于举例说明,在其他实施例中,可将语音控制装置按照需要划分为不同的模块,以完成上述语音控制装置的全部或部分功能。
图8为一个实施例中终端的内部结构示意图。如图8所示,该终端包括通过系统总线连接的处理器和存储器。其中,该处理器用于提供计算和控制能力,支撑整个终端的运行。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种语音控制方法。内存储器为非易失性存储介质中的操作系统计算机程序提供高速缓存的运行环境。该终端可以是手机、平板电脑或者个人数字助理或穿戴式设备等。
本申请实施例中提供的语音控制装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述的语音控制方法的全部或部分步骤。
本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当计算机可执行指令被一个或多个处理器执行时,使得处理器执行前述实施例所描述的语音控制方法的全部或部分步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述实施例所描述的语音控制方法的全部或部分步骤。
本申请实施例所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。合适的非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种语音控制方法,其特征在于,应用于与按摩仪通信连接的终端,包括:
接收用户发出的第一语音控制指令,所述语音控制指令中包含声音信息及语义信息;
对所述第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度;
若所述第一匹配度低于预定的第一匹配阈值,则输出调整指令,所述调整指令用于指示用户重新发出语音控制指令;
若所述第一匹配度高于所述预定的第一匹配阈值,对所述第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向所述按摩仪发出控制指令。
2.根据权利要求1所述的方法,其特征在于,在所述输出调整指令之后,所述方法还包括:
接收用户发出的第二语音控制指令;
对所述第二语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第二匹配度;
若所述第二匹配度高于预定的第一匹配阈值,对所述第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向所述按摩仪发出控制指令。
3.根据权利要求1所述的方法,其特征在于,所述声音信息包括音调信息、音色信息及响度信息;
所述对所述第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度,包括:
对所述第一语音控制指令中的声音信息进行识别,得到音调信息、音色信息及响度信息;
将所述音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度。
4.根据权利要求3所述的方法,其特征在于,将所述音调信息、音色信息及响度信息与预设语音控制指令中的声音信息进行匹配,得到第一匹配度,包括:
将所述音色信息与预设语音控制指令中的音色信息进行匹配;
若所述音色信息与预设语音控制指令中的音色信息的匹配度大于预设音色阈值,则将所述音调信息与预设语音控制指令中的音调信息进行匹配得到音调匹配度、将所述响度信息与预设语音控制指令中的响度信息进行匹配得到响度匹配度。
5.根据权利要求4所述的方法,其特征在于,若所述第一匹配度低于第一匹配阈值,则输出调整指令,包括:
从所述音调匹配度及所述响度匹配度中获取不匹配的声音信息;
根据所述不匹配的声音信息输出调整指令。
6.根据权利要求2所述的方法,其特征在于,所述语义信息包括关键词;所述对所述第二语音控制指令中的语义信息进行识别,基于所识别出的语义信息向按摩仪发出控制指令,包括:
从所述第二语音控制指令中提取关键词;
将所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词进行匹配;
若所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定所述第二语音控制指令与所述预设语音控制指令匹配;
向按摩仪发出与所述预设语音指令相对应的控制指令。
7.根据权利要求6所述的方法,其特征在于,在所述将所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词进行匹配之后,所述方法还包括:
若所述第二语音控制指令中的关键词与所述预设语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,则获取历史语音控制指令中的关键词;
将所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词进行匹配;
若所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词的匹配度大于预设关键词阈值,则确定所述第二语音控制指令与所述历史语音控制指令匹配;
向按摩仪发出与所述历史语音指令相对应的控制指令。
8.根据权利要求7所述的方法,其特征在于,在所述将所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词进行匹配之后,所述方法还包括:
若所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词的匹配度小于或等于预设关键词阈值,则将所述第二语音控制指令中的关键词与所述历史语音控制指令中的关键词进行模糊匹配;
若模糊匹配所得的匹配度大于预设关键词阈值,则确定所述第二语音控制指令与所述历史语音控制指令匹配;
向按摩仪发出与所述历史语音指令相对应的控制指令。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述方法还包括:
获取所述按摩仪上采集用户的生命体征信息及所述按摩仪的运行信息;
在所述按摩仪转入待机状态、或转入休眠状态、或转入关机状态后,将所述生命体征信息及所述按摩仪的运行信息上传至服务器进行存储。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
接收所述按摩仪在转入待机状态、或转入休眠状态、或转入关机状态时发送的待机反馈、或休眠反馈、或关机反馈。
11.根据权利要求9所述的方法,其特征在于,所述生命体征信息包括使用者的心跳、心率、血氧饱和度、血糖、血脂信息中的任意一种或多种。
12.根据权利要求9所述的方法,其特征在于,所述运行信息包括所述按摩仪的按摩模式、按摩时长及按摩力度信息中的任意一种或多种。
13.一种语音控制装置,其特征在于,应用于与按摩仪连接的终端,所述装置包括:
第一语音控制指令接收模块,用于接收用户发出的第一语音控制指令,所述语音控制指令中包含声音信息及语义信息;
匹配模块,用于对所述第一语音控制指令中的声音信息进行识别,将所识别出的声音信息与预设语音控制指令中的声音信息进行匹配得到第一匹配度;
调整指令输出模块,用于若所述第一匹配度低于预定的第一匹配阈值,则输出调整指令,所述调整指令用于指示用户重新发出语音控制指令;
控制模块,用于若所述第一匹配度高于所述预定的第一匹配阈值,对所述第一语音控制指令中的语义信息进行识别,基于所识别出的语义信息向所述按摩仪发出控制指令。
14.一种终端,包括存储器及处理器,所述存储器中储存有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述的语音控制方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的语音控制方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010842290.XA CN112151026A (zh) | 2020-08-20 | 2020-08-20 | 语音控制方法、装置、服务器和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010842290.XA CN112151026A (zh) | 2020-08-20 | 2020-08-20 | 语音控制方法、装置、服务器和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112151026A true CN112151026A (zh) | 2020-12-29 |
Family
ID=73888698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010842290.XA Pending CN112151026A (zh) | 2020-08-20 | 2020-08-20 | 语音控制方法、装置、服务器和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112151026A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112767916A (zh) * | 2021-02-05 | 2021-05-07 | 百度在线网络技术(北京)有限公司 | 智能语音设备的语音交互方法、装置、设备、介质及产品 |
CN112954521A (zh) * | 2021-01-26 | 2021-06-11 | 深圳市富天达电子有限公司 | 一种具有声控免按键调节系统的蓝牙耳机 |
CN113488052A (zh) * | 2021-07-22 | 2021-10-08 | 深圳鑫思威科技有限公司 | 无线语音传输和ai语音识别互操控方法 |
CN114023332A (zh) * | 2021-10-30 | 2022-02-08 | 中万恩科技有限公司 | 一种具有语音播报与语音识别的洗碗机 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807395A (zh) * | 2010-02-26 | 2010-08-18 | 中山大学 | 一种通过语音控制智能终端的方法 |
CN104902070A (zh) * | 2015-04-13 | 2015-09-09 | 青岛海信移动通信技术股份有限公司 | 一种移动终端语音控制的方法及移动终端 |
CN108369808A (zh) * | 2015-11-10 | 2018-08-03 | 三星电子株式会社 | 电子设备和用于控制该电子设备的方法 |
CN108670706A (zh) * | 2018-05-02 | 2018-10-19 | 上海久工实业有限公司 | 体征检测按摩椅、体征检测按摩椅系统及其工作方法 |
CN111192574A (zh) * | 2018-11-14 | 2020-05-22 | 奇酷互联网络科技(深圳)有限公司 | 智能语音交互方法、移动终端和计算机可读存储介质 |
-
2020
- 2020-08-20 CN CN202010842290.XA patent/CN112151026A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101807395A (zh) * | 2010-02-26 | 2010-08-18 | 中山大学 | 一种通过语音控制智能终端的方法 |
CN104902070A (zh) * | 2015-04-13 | 2015-09-09 | 青岛海信移动通信技术股份有限公司 | 一种移动终端语音控制的方法及移动终端 |
CN108369808A (zh) * | 2015-11-10 | 2018-08-03 | 三星电子株式会社 | 电子设备和用于控制该电子设备的方法 |
CN108670706A (zh) * | 2018-05-02 | 2018-10-19 | 上海久工实业有限公司 | 体征检测按摩椅、体征检测按摩椅系统及其工作方法 |
CN111192574A (zh) * | 2018-11-14 | 2020-05-22 | 奇酷互联网络科技(深圳)有限公司 | 智能语音交互方法、移动终端和计算机可读存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112954521A (zh) * | 2021-01-26 | 2021-06-11 | 深圳市富天达电子有限公司 | 一种具有声控免按键调节系统的蓝牙耳机 |
CN112767916A (zh) * | 2021-02-05 | 2021-05-07 | 百度在线网络技术(北京)有限公司 | 智能语音设备的语音交互方法、装置、设备、介质及产品 |
CN112767916B (zh) * | 2021-02-05 | 2024-03-01 | 百度在线网络技术(北京)有限公司 | 智能语音设备的语音交互方法、装置、设备、介质及产品 |
CN113488052A (zh) * | 2021-07-22 | 2021-10-08 | 深圳鑫思威科技有限公司 | 无线语音传输和ai语音识别互操控方法 |
CN114023332A (zh) * | 2021-10-30 | 2022-02-08 | 中万恩科技有限公司 | 一种具有语音播报与语音识别的洗碗机 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112151026A (zh) | 语音控制方法、装置、服务器和计算机可读存储介质 | |
US11878169B2 (en) | Somatic, auditory and cochlear communication system and method | |
Smiljanic | Clear speech perception: Linguistic and cognitive benefits | |
CN105895105B (zh) | 语音处理方法及装置 | |
CN109036395A (zh) | 个性化的音箱控制方法、系统、智能音箱及存储介质 | |
CN110719558B (zh) | 助听器验配方法、装置、计算机设备及存储介质 | |
US20220386902A1 (en) | Scoring speech audiometry | |
CN106504742A (zh) | 合成语音的传输方法、云端服务器和终端设备 | |
Shafiro et al. | The influence of environmental sound training on the perception of spectrally degraded speech and environmental sounds | |
CN108536668A (zh) | 唤醒词评估方法及装置、存储介质、电子设备 | |
Turcott et al. | Efficient evaluation of coding strategies for transcutaneous language communication | |
Vojtech et al. | The effects of modulating fundamental frequency and speech rate on the intelligibility, communication efficiency, and perceived naturalness of synthetic speech | |
JP6729923B1 (ja) | 難聴判定装置、難聴判定システム、コンピュータプログラム及び認知機能レベル補正方法 | |
US20170116978A1 (en) | Voice Synthesizing Apparatus, Voice Synthesizing Method, and Storage Medium Therefor | |
CN113724687A (zh) | 基于脑电信号的语音生成方法、装置、终端及存储介质 | |
KR102413860B1 (ko) | 사용자 상태에 기반한 응답 음성을 생성하는 음성 에이전트 시스템 및 방법 | |
Loebach et al. | Transfer of auditory perceptual learning with spectrally reduced speech to speech and nonspeech tasks: implications for cochlear implants | |
CN110767282A (zh) | 一种健康档案生成方法、装置以及计算机可读存储介质 | |
Mamun et al. | Quantifying cochlear implant users’ ability for speaker identification using ci auditory stimuli | |
Zhou et al. | Lexical tone recognition with an artificial neural network | |
CN113544768A (zh) | 使用多传感器的语音识别 | |
WO2020095308A1 (en) | Computerized system and method for evaluating a psychological state based on voice analysis | |
CN113975078A (zh) | 基于人工智能的按摩控制方法及相关设备 | |
Charfuelan | MARY TTS HMMbased voices for the Blizzard Challenge 2012 | |
JP7180127B2 (ja) | 情報提示システム、情報提示方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |