CN108597500A - 一种智能穿戴设备及基于智能穿戴设备的语音识别方法 - Google Patents

一种智能穿戴设备及基于智能穿戴设备的语音识别方法 Download PDF

Info

Publication number
CN108597500A
CN108597500A CN201810292998.5A CN201810292998A CN108597500A CN 108597500 A CN108597500 A CN 108597500A CN 201810292998 A CN201810292998 A CN 201810292998A CN 108597500 A CN108597500 A CN 108597500A
Authority
CN
China
Prior art keywords
voice
data
target
speech data
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810292998.5A
Other languages
English (en)
Inventor
薛彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Feixun Information Technology Co Ltd
Original Assignee
Sichuan Feixun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Feixun Information Technology Co Ltd filed Critical Sichuan Feixun Information Technology Co Ltd
Priority to CN201810292998.5A priority Critical patent/CN108597500A/zh
Publication of CN108597500A publication Critical patent/CN108597500A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Abstract

本发明公开了一种智能穿戴设备及语音识别方法,包括设备本体,还包括:语音采集模块,用于在智能穿戴设备所处环境中采集初始语音数据;语音处理模块,用于根据当前预存语音识别算法、当前预存语音特征信息,对所述初始语音数据进行语音识别,从所述初始语音数据中识别出目标语音数据;第一处理模块,当从所述初始语音数据中识别出的目标语音数据时,用于根据所述目标语音数据对所述当前预存语音识别算法和/或当前预存语音特征信息进行优化后,更新所述第一处理模块和语音处理模块中存储的当前预存语音识别算法和/或当前预存语音特征信息。随着用户对智能穿戴设备的使用时间变长,智能穿戴设备更能满足用户个性化语音识别要求。

Description

一种智能穿戴设备及基于智能穿戴设备的语音识别方法
技术领域
本发明属于人工智能技术领域,特别涉及一种智能穿戴设备及基于智能穿戴设备的语音识别方法。
背景技术
语音识别技术是让机器通过语音识别和语义理解等,识别出目标对象发出语音时所要表达的含义,以及找到相应的回应内容。目前,语音识别技术被广泛应用于智能机器人、智能手机、智能耳机等设备领域中。
目前,基于人工智能的语音识别主要是在服务器中进行,其智能耳机、智能机器人主要是采集环境中存在的语音数据后,将语音数据传输到服务器中,服务器对采集到的语音数据进行语音识别和语义理解等;采集到的语音数据既包括目标对象的语音数据,还包括环境噪音、非目标对象的语音数据。
由于智能机器人、智能耳机直接将采集到的语音数据传输到服务器中进行语音识别和语义理解时,完全依靠服务器对语音数据进行处理和识别等,从而会存在由于传输距离长,存在较大延时,无法及时有效地识别出采集到的语音数据是否为有效语音数据等缺陷。
另外,服务器在对语音数据进行识别时,所利用的语音识别算法是适于大众的基础型语音识别算法,只能识别出常规语音数据,无法识别出个性化语音数据,无法满足用户个性化语音识别要求。
发明内容
本发明的目的是提供一种智能穿戴设备及基于智能穿戴设备的语音识别方法,预存语音识别算法不断学习,和/或预存语音特征信息不断更新,从而使得智能穿戴设备更容易识别出用户的用户语音数据或经常与用户交互的交互对象的交互语音数据;随着用户对智能穿戴设备的使用时间变长,智能穿戴设备更能满足用户个性化语音识别要求。
本发明提供的技术方案如下:
本发明提供一种智能穿戴设备,包括设备本体,还包括:语音采集模块,用于在智能穿戴设备所处环境中采集初始语音数据;语音处理模块,与所述语音采集模块电连接,存储有当前预存语音识别算法、当前预存语音特征信息;用于根据当前预存语音识别算法、当前预存语音特征信息,对所述初始语音数据进行语音识别,从所述初始语音数据中识别出目标语音数据;第一处理模块,与所述语音处理模块电连接,存储有当前预存语音识别算法和/或当前预存语音特征信息;当从所述初始语音数据中识别出的目标语音数据时,用于根据所述目标语音数据对所述当前预存语音识别算法和/或当前预存语音特征信息进行优化后,更新所述第一处理模块和语音处理模块中存储的当前预存语音识别算法和/或当前预存语音特征信息。
进一步优选的,所述第一处理模块,还用于将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;所述第一处理模块和语音处理模块,还用于利用所述目标语音识别算法更替所述当前预存语音识别算法;和/或;所述第一处理模块,还用于利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;所述第一处理模块和语音处理模块,还用于利用所述目标语音特征信息更替所述当前预存语音特征信。
进一步优选的,所述语音处理模块,用于滤除所述初始语音数据中的环境噪音数据后形成备用语音数据;所述语音处理模块,还用于利用预存语音识别算法从所述备用语音数据中滤除与预存语音特征信息不符合的语音数据后形成目标语音数据。
进一步优选的,所述语音处理模块,还用于根据所述初始语音数据或备用语音数据、以及预设语音过滤规则,从多个预存语音特征信息中选择一个预存语音特征信息作为当前预存语音特征信息。
优选的,还包括:第二处理模块,与所述语音处理模块电连接,当从所述初始语音数据中识别出的目标语音数据时,用于通过通信模块发送所述目标语音数据;提示模块,与所述第二处理模块电连接,当从所述初始语音数据中未识别出目标语音数据时,所述第二处理模块控制所述提示模块发出相应的提示信息。
本发明还提供一种基于智能穿戴设备的语音识别方法,包括:S10、在智能穿戴设备所处环境中采集初始语音数据;S20、根据当前预存语音识别算法、当前预存语音特征信息,对所述初始语音数据进行语音识别,从所述初始语音数据中识别出目标语音数据;S30、当从所述初始语音数据中识别出目标语音数据时,根据所述目标语音数据对所述当前预存语音识别算法和/或当前预存语音特征信息进行优化更新。
进一步优选的,步骤S30进一步包括:S31、将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;S33、利用所述目标语音识别算法更替所述当前预存语音识别算法;和/或;S32、利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;S34、利用所述目标语音特征信息更替中所述当前预存语音特征信息。
进一步优选的,步骤S20进一步包括:S21、滤除所述初始语音数据中的环境噪音数据后形成备用语音数据;S23、利用预存语音识别算法从所述备用语音数据中滤除与预存语音特征信息不符合的语音数据后形成目标语音数据。
进一步优选的,步骤S20进一步包括:S22、根据所述初始语音数据或备用语音数据、以及预设语音过滤规则,从多个预存语音特征信息中选择一个预存语音特征信息作为当前预存语音特征信息。
优选的,还包括:S40、当从所述初始语音数据中识别出目标语音数据时,发送所述目标语音数据;S50、当从所述初始语音数据中未识别出目标语音数据时,发出相应的提示信息。
与现有技术相比,本发明提供的一种智能穿戴设备及基于智能穿戴设备的语音识别方法具有以下有益效果:
1、本发明中智能穿戴设备在每次识别出目标语音数据后,都会将目标语音数据作为语音数据样本,对预存语音识别算法进行训练,让预存语音识别算法不断学习,和/或让预存语音特征信息不断更新,从而使得智能穿戴设备更容易识别出用户的用户语音数据或经常与用户交互的交互对象的交互语音数据;随着用户对智能穿戴设备的使用时间变长,智能穿戴设备更能满足用户个性化语音识别要求。
2、本发明在采集到初始语音数据后,结合智能穿戴设备中存储的预存语音识别算法、预存语音特征信息,对初始语音数据进行语音识别,在初始语音数据中识别出目标语音数据后,发送目标语音数据;在初始语音数据中未识别出目标语音数据后,发出相应的提示信息。
智能穿戴设备会对初始语音数据进行初步语音识别,拦截掉非目标语音数据,只会将目标语音数据发送给智能终端或服务器,不仅让智能终端或服务器更准确、快速地将目标语音数据转换成目标语音文本数据,以及对目标语音文本数据进行语义理解等;还能避免将无效语音数据发送给智能终端或服务器进行后续处理。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种智能穿戴设备及基于智能穿戴设备的语音识别方法的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种基于智能穿戴设备的语音识别方法的流程示意图;
图2是本发明中步骤S30的流程示意图;
图3是本发明中步骤S20的流程示意图;
图4是本发明又一种基于智能穿戴设备的语音识别方法的流程示意图;
图5是本发明又一种智能穿戴设备的结构示意框图;
附图标号说明:
10—语音采集模块 20—语音处理模块 30—第一处理模块 40—第二处理模块50—提示模块 60—通信模块
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
根据本发明提供的一种实施例,如图1、图2所示,一种语音识别方法,包括:
S10、在智能穿戴设备所处环境中采集初始语音数据;
S20、根据当前预存语音识别算法、当前预存语音特征信息,对所述初始语音数据进行语音识别,从所述初始语音数据中识别出目标语音数据;
S30、当从所述初始语音数据中识别出目标语音数据时,根据所述目标语音数据对所述当前预存语音识别算法和/或当前预存语音特征信息进行优化更新。
进一步,步骤S30进一步包括:S31、将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;S33、利用所述目标语音识别算法更替所述当前预存语音识别算法;
和/或;
S32、利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;S34、利用所述目标语音特征信息更替所述当前预存语音特征信息。
具体的,智能穿戴设备可以为智能耳机、智能手环、智能手表等,当用户佩戴上智能穿戴设备时,在智能穿戴设备上通过机械开关或上电等方式开启语音采集功能,或者通过智能终端(例如手机等)向智能穿戴设备发送语音采集开启控制命令,智能穿戴设备接收到语音采集开启控制命令后,开启语音采集功能。
智能穿戴设备采集周围环境中的初始语音数据,初始语音数据包括目标对象语音数据、其他对象语音数据、环境声音数据;例如当用户佩戴智能穿戴设备身处商场时,会采集到用户自己发出的用户语音数据,还会采集到其他顾客、推销人员、店员等发出的语音数据;甚至会采集到其他东西发出的碰撞声等环境声音数据。如果当前预存语音特征信息为用户自己的用户语音特征信息,利用当前预存语音识别算法从初始语音数据中识别出用户自己发出的用户语音数据作为目标语音数据。
当识别出用户自己发出的用户语音数据时,将用户语音数据作为语音数据样本,对当前预存语音识别算法进行模型训练,当前预存语音识别算法训练后形成目标语音识别算法;将目标语音识别算法将当前预存语音识别算法替换掉,使得当前预存语音识别算法更容易识别出用户的用户语音数据。
在当前预存语音识别算法训练成目标语音识别算法后,或者在将目标语音识别算法替换当前预存语音识别算法后,利用目标语音识别算法或替换后的当前预存语音识别算法从用户语音数据中提取用户语音特征信息,并将用户语音特征信息替换当前预存语音特征信息,使得当前预存语音特征信息更接近用户的语音特征信息。
根据本发明提供的另一种实施例,如图1、2、3所示,一种语音智能识别方法,包括:
S10、在智能穿戴设备所处环境中采集初始语音数据;
S21、滤除所述初始语音数据中的环境噪音数据后形成备用语音数据;
可选的,S22、根据所述初始语音数据或备用语音数据、以及预设语音过滤规则,从多个预存语音特征信息中选择一个预存语音特征信息作为当前预存语音特征信息。
S23、利用预存语音识别算法从所述备用语音数据中滤除与预存语音特征信息不符合的语音数据后形成目标语音数据;
S31、将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;S33、利用所述目标语音识别算法更替所述当前预存语音识别算法;
和/或;
S32、利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;S34、利用所述目标语音特征信息更替所述当前预存语音特征信息。
具体的,当用户佩戴智能穿戴设备身处商场时,在智能穿戴设备采集到初始语音数据后,初始语音数据包括用户自己发出的用户语音数据,其他顾客、推销人员、店员等发出的语音数据;以及其他东西发出的碰撞声等环境声音数据。
先将初始语音数据中的环境噪音数据(其他东西发出的碰撞声等)滤除掉后形成备用语音数据,备用语音数据为人类发出的语音数据;此时,备用语音数据可能是用户自己发出的用户语音数据,还有可能是其他顾客、推销人员、店员等发出的语音数据。
当当前预存语音特征信息为用户的用户语音特征信息时,利用当前预存语音识别算法从备用语音数据中滤除其他顾客、推销人员、店员等发出的语音数据,只剩用户自己发出的用户语音数据。
当用户佩戴智能穿戴设备身处工作场所时,在智能穿戴设备采集到初始语音数据后,初始语音数据包括用户自己发出的用户语音数据,其他对象乙、丙、丁等发出的语音数据;以及其他环境声音数据。
先将初始语音数据中的环境噪音数据(脚步声)滤除掉后形成备用语音数据,备用语音数据为人类发出的语音数据;此时,备用语音数据可能是用户自己发出的用户语音数据,还有可能是其他对象乙、丙、丁等发出的语音数据。
当当前预存语音特征信息为用户、乙、丙、丁各自的语音特征信息时,结合预设语音过滤规则,例如,先采集到谁的语音,就将谁作为目标对象;或者,谁的声音较大,就将谁作为目标对象;利用当前预存语音识别算法从备用语音数据中滤除用户和/或乙和/或丙和/或丁等发出的语音数据,只剩一个当前预存语音特征信息对应的语音数据。
根据本发明提供的又一种实施例,如图2、3、4所示,一种语音智能识别方法,包括:
S10、在智能穿戴设备所处环境中采集初始语音数据;
S21、滤除所述初始语音数据中的环境噪音数据后形成备用语音数据;
可选的,S22、根据所述初始语音数据或备用语音数据、以及预设语音过滤规则,从多个预存语音特征信息中选择一个预存语音特征信息作为当前预存语音特征信息。
S23、利用预存语音识别算法从所述备用语音数据中滤除与预存语音特征信息不符合的语音数据后形成目标语音数据;
S31、将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;S33、利用所述目标语音识别算法更替所述当前预存语音识别算法;
和/或;
S32、利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;S34、利用所述目标语音特征信息更替所述当前预存语音特征信息。
S40、当从所述初始语音数据中识别出目标语音数据时,发送所述目标语音数据;
S50、当从所述初始语音数据中未识别出目标语音数据时,发出相应的提示信息。
具体的,在利用智能穿戴设备每次采集并识别出目标语音数据后,除了利用目标语音数据优化更新当前预存语音识别算法和/或当前预存语音特征信息外,还向智能终端(手机)或服务器发送目标语音数据,智能终端或服务器将用户语音数据转换成目标语音文本数据后进行语义理解;当未识别出目标语音数据时,放弃发送目标语音数据,并发出相应的提示信息,提示目标对象再次发出语音数据。
预存语音特征信息可以是一个,也可也是多个,在智能穿戴设备上开启预存语音特征信息的预设功能后,采集一个目标对象的目标语音数据,利用当前语音识别算法从目标语音数据中提取目标语音特征信息作为预存语音特征信息。当需要预存多个预存语音特征信息时,重复上述步骤。
根据本发明提供的一种实施例,一种智能穿戴设备,包括设备本体,包括:
语音采集模块10,用于在智能穿戴设备所处环境中采集初始语音数据;
语音处理模块20,与所述语音采集模块10电连接,存储有当前预存语音识别算法、当前预存语音特征信息;用于根据当前预存语音识别算法、当前预存语音特征信息,对所述初始语音数据进行语音识别,从所述初始语音数据中识别出目标语音数据;
第一处理模块30,与所述语音处理模块20电连接,存储有当前预存语音识别算法、当前预存语音特征信息;用于接收所述语音处理模块20发出的从所述初始语音数据中识别出的目标语音数据,根据所述目标语音数据对所述当前预存语音识别算法和/或当前预存语音特征信息进行优化后,更新所述第一处理模块30和语音处理模块20中存储的当前预存语音识别算法和/或当前预存语音特征信息。
具体的,语音采集模块10包括主麦克风,安装在所述设备本体上朝向用户发音的一侧,主要用于采集用户语音数据;副麦克风,安装在所述设备本体上背离用户发音的一侧,主要用于采集环境声音。
智能穿戴设备采用双核处理器,第一处理模块30(主控MCU)、第二处理模块40(人工智能MCU),第一处理模块30负责预存语音识别算法的在线学习,第二处理模块40负责各种任务的调度等,第一处理模块30、第二处理模块40、数字信号处理器之间相互协调,共同完成目标语音数据的识别。
语音处理模块20从初始语音数据中识别出目标语音数据,例如在多人讲话的场景下,识别出用户本人的语音数据,可以有效地避免其他人说话的干扰,有利于手机或服务器更容易对语音数据的语义理解,有效地过滤其他人的语言,有效提高语义理解的效率。
根据本发明提供的另一种实施例,如图5所示,一种智能穿戴设备,包括设备本体,包括:
语音采集模块10,用于在智能穿戴设备所处环境中采集初始语音数据;
语音处理模块20,与所述语音采集模块10电连接,存储有当前预存语音识别算法、当前预存语音特征信息;用于滤除所述初始语音数据中的环境噪音数据后形成备用语音数据;所述语音处理模块20包括数字信号处理器;
所述语音处理模块20,还用于根据所述初始语音数据或备用语音数据、以及预设语音过滤规则,从多个预存语音特征信息中选择一个预存语音特征信息作为当前预存语音特征信息。
所述语音处理模块20,还用于利用预存语音识别算法从所述备用语音数据中滤除与预存语音特征信息不符合的语音数据后形成目标语音数据。
第一处理模块30,与所述语音处理模块20电连接,存储有当前预存语音识别算法、当前预存语音特征信息;用于接收所述语音处理模块20发出的从所述初始语音数据中识别出的目标语音数据,将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;
所述第一处理模块30和语音处理模块20,还用于利用所述目标语音识别算法更替所述当前预存语音识别算法;
和/或;
所述第一处理模块30,还用于利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;
所述第一处理模块30和语音处理模块20,还用于利用所述目标语音特征信息更替所述当前预存语音特征信。
第二处理模块40,与所述语音处理模块20电连接,用于接收所述语音处理模块20发出的从所述初始语音数据中识别出的目标语音数据,通过通信模块60发送所述目标语音数据;
提示模块50,与所述第二处理模块40电连接,用于当所述第二处理模块40接收到从所述初始语音数据中未识别出目标语音数据时,所述第二处理模块 40控制所述提示模块50发出相应的提示信息。
具体的,主麦克风、副麦克风采集到的语音数据作为初始语音数据,并将初始语音数据传输给数字信号处理器,数字信号处理器将主麦克风采集到的语音数据减去副麦克风采集到的语音数据,相当于从初始语音数据中滤除了环境噪音(例如车鸣笛声等),形成备用语音数据;备用语音数据为至少一个人发出的人类语音数据。
数字信号处理器再结合当前预存语音识别算法、当前预存语音特征信息,从备用语音数据中剔除非目标对象的语音数据,只剩一个目标对象发出的语音数据;可以有效地避免其他人说话的干扰,有利于手机或服务器更容易对语音数据的语义理解;有效地过滤其他人的语言后,可以有效提高语义理解的效率。
例如:甲、乙、丙、丁四人在马路上谈话,智能穿戴设备上主麦克风、副麦克风共同采集甲、乙、丙、丁四人在马路上谈话时的初始语音数据,既包括甲和/或乙和/或丙和/或丁发出的语音数据,还包括车鸣笛声等环境噪音。
数字信号处理器先从初始语音数据中滤除环境噪音后,得到甲和/或乙和/或丙和/或丁发出的语音数据。
若甲是目标对象,当前预存语音特征信息为甲的语音特征信息,数字信号处理器结合预存语音识别算法、预存语音特征信息,从备用语音数据中剔除乙和/或丙和/或丁的语音数据,只剩一个甲发出的语音数据;可以有效地避免其他人说话的干扰。
若甲和乙均是目标对象,预存语音特征信息为甲和乙各自的语音特征信息,数字信号处理器结合预存语音识别算法、预存语音特征信息,以及预设语音过滤规则,例如,先采集到谁的语音,就将谁作为目标对象;或者,谁的声音较大,就将谁作为目标对象;从备用语音数据中剔除甲和/ 或乙和/或丙和/或丁的语音数据,只剩一个目标对象发出的语音数据;可以有效地避免其他人说话的干扰。
或者,在多个目标对象同时发声时,智能穿戴设备会发出无法识别的提示信息。
数字信号处理器在识别出目标语音数据后,将目标语音数据发送给第一处理模块30,第一处理模块30通过通信模块60(例如蓝牙模块、WIFI 模块等)发送给手机或服务器;不仅方便手机或服务器对目标语音数据快速、准确地进行语义理解;还能减轻手机或服务器对语音数据的处理工作。
在数字信号处理器识别出目标语音数据后,还会将目标语音数据传输给第二处理模块40,第二处理模块40结合目标语音数据对当前预存语音识别算法进行训练,使得当前预存语音识别算法不断学习,并在当前预存语音识别算法完成训练后,同步更新第一处理模块30中的预存语音识别算法。并利用完成训练后的当前预存语音识别算法从目标语音数据中提取目标语音特征信息,同步更新第一处理模块30中的预存语音特征信息。
数字信号处理器中的当前预存语音识别算法不断在线学习后,以及当前预存语音特征信息不断更新后,使得本适于大众群众的语音识别基础算法,只能识别出比较常见的语音数据;使当前预存语音识别算法更具有独特性,更容易识别出一些独特的语音数据,更适于智能穿戴设备的用户本身。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种智能穿戴设备,包括设备本体,其特征在于,还包括:
语音采集模块,用于在智能穿戴设备所处环境中采集初始语音数据;
语音处理模块,与所述语音采集模块电连接,存储有当前预存语音识别算法、当前预存语音特征信息;用于根据当前预存语音识别算法、当前预存语音特征信息,对所述初始语音数据进行语音识别,从所述初始语音数据中识别出目标语音数据;
第一处理模块,与所述语音处理模块电连接,存储有当前预存语音识别算法和/或当前预存语音特征信息;当从所述初始语音数据中识别出的目标语音数据时,用于根据所述目标语音数据对所述当前预存语音识别算法和/或当前预存语音特征信息进行优化后,更新所述第一处理模块和语音处理模块中存储的当前预存语音识别算法和/或当前预存语音特征信息。
2.根据权利要求1所述的一种智能穿戴设备,其特征在于:
所述第一处理模块,还用于将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;
所述第一处理模块和语音处理模块,还用于利用所述目标语音识别算法更替所述当前预存语音识别算法;
和/或;
所述第一处理模块,还用于利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;
所述第一处理模块和语音处理模块,还用于利用所述目标语音特征信息更替所述当前预存语音特征信。
3.根据权利要求1所述的一种智能穿戴设备,其特征在于:
所述语音处理模块,用于滤除所述初始语音数据中的环境噪音数据后形成备用语音数据;
所述语音处理模块,还用于利用预存语音识别算法从所述备用语音数据中滤除与预存语音特征信息不符合的语音数据后形成目标语音数据。
4.根据权利要求3所述的一种智能穿戴设备,其特征在于:
所述语音处理模块,还用于根据所述初始语音数据或备用语音数据、以及预设语音过滤规则,从多个预存语音特征信息中选择一个预存语音特征信息作为当前预存语音特征信息。
5.根据权利要求1~4中任意一项所述的一种智能穿戴设备,其特征在于,还包括:
第二处理模块,与所述语音处理模块电连接,当从所述初始语音数据中识别出的目标语音数据时,用于通过通信模块发送所述目标语音数据;
提示模块,与所述第二处理模块电连接,当从所述初始语音数据中未识别出目标语音数据时,所述第二处理模块控制所述提示模块发出相应的提示信息。
6.一种基于智能穿戴设备的语音识别方法,其特征在于,包括:
S10、在智能穿戴设备所处环境中采集初始语音数据;
S20、根据当前预存语音识别算法、当前预存语音特征信息,对所述初始语音数据进行语音识别,从所述初始语音数据中识别出目标语音数据;
S30、当从所述初始语音数据中识别出目标语音数据时,根据所述目标语音数据对所述当前预存语音识别算法和/或当前预存语音特征信息进行优化更新。
7.根据权利要求6所述的一种基于智能穿戴设备的语音智能识别方法,其特征在于,步骤S30进一步包括:
S31、将所述目标语音数据作为语音数据样本,利用所述语音数据样本将所述当前预存语音识别算法训练成目标语音识别算法;
S33、利用所述目标语音识别算法更替所述当前预存语音识别算法;
和/或;
S32、利用所述目标语音识别算法从所述目标语音数据中提取目标语音特征信息;
S34、利用所述目标语音特征信息更替中所述当前预存语音特征信息。
8.根据权利要求6所述的一种基于智能穿戴设备的语音智能识别方法,其特征在于,步骤S20进一步包括:
S21、滤除所述初始语音数据中的环境噪音数据后形成备用语音数据;
S23、利用预存语音识别算法从所述备用语音数据中滤除与预存语音特征信息不符合的语音数据后形成目标语音数据。
9.根据权利要求8所述的一种基于智能穿戴设备的语音智能识别方法,其特征在于,步骤S20进一步包括:
S22、根据所述初始语音数据或备用语音数据、以及预设语音过滤规则,从多个预存语音特征信息中选择一个预存语音特征信息作为当前预存语音特征信息。
10.根据权利要求1~9中任意一项所述的一种基于智能穿戴设备的语音智能识别方法,其特征在于,还包括:
S40、当从所述初始语音数据中识别出目标语音数据时,发送所述目标语音数据;
S50、当从所述初始语音数据中未识别出目标语音数据时,发出相应的提示信息。
CN201810292998.5A 2018-03-30 2018-03-30 一种智能穿戴设备及基于智能穿戴设备的语音识别方法 Pending CN108597500A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810292998.5A CN108597500A (zh) 2018-03-30 2018-03-30 一种智能穿戴设备及基于智能穿戴设备的语音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810292998.5A CN108597500A (zh) 2018-03-30 2018-03-30 一种智能穿戴设备及基于智能穿戴设备的语音识别方法

Publications (1)

Publication Number Publication Date
CN108597500A true CN108597500A (zh) 2018-09-28

Family

ID=63625363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810292998.5A Pending CN108597500A (zh) 2018-03-30 2018-03-30 一种智能穿戴设备及基于智能穿戴设备的语音识别方法

Country Status (1)

Country Link
CN (1) CN108597500A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117722A1 (zh) * 2013-01-30 2014-08-07 华为终端有限公司 语音处理方法、装置及终端设备
CN104112445A (zh) * 2014-07-30 2014-10-22 宇龙计算机通信科技(深圳)有限公司 一种终端及语音识别方法
CN106328124A (zh) * 2016-08-24 2017-01-11 安徽咪鼠科技有限公司 一种基于用户行为特征的语音识别方法
CN106537493A (zh) * 2015-09-29 2017-03-22 深圳市全圣时代科技有限公司 语音识别系统及方法、客户端设备及云端服务器
CN107464558A (zh) * 2017-08-23 2017-12-12 绵阳美菱软件技术有限公司 一种语音识别方法、终端以及服务端
CN107591150A (zh) * 2017-08-16 2018-01-16 珠海市魅族科技有限公司 语音识别方法及装置、计算机装置及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014117722A1 (zh) * 2013-01-30 2014-08-07 华为终端有限公司 语音处理方法、装置及终端设备
CN104112445A (zh) * 2014-07-30 2014-10-22 宇龙计算机通信科技(深圳)有限公司 一种终端及语音识别方法
CN106537493A (zh) * 2015-09-29 2017-03-22 深圳市全圣时代科技有限公司 语音识别系统及方法、客户端设备及云端服务器
CN106328124A (zh) * 2016-08-24 2017-01-11 安徽咪鼠科技有限公司 一种基于用户行为特征的语音识别方法
CN107591150A (zh) * 2017-08-16 2018-01-16 珠海市魅族科技有限公司 语音识别方法及装置、计算机装置及计算机可读存储介质
CN107464558A (zh) * 2017-08-23 2017-12-12 绵阳美菱软件技术有限公司 一种语音识别方法、终端以及服务端

Similar Documents

Publication Publication Date Title
CN103456305B (zh) 终端和基于多个声音采集单元的语音处理方法
CN1761265B (zh) 移动设备上的多传感语音增强方法和装置
CN104715752B (zh) 语音识别方法、装置及系统
CN107862060A (zh) 一种追踪目标人的语义识别装置及识别方法
CN104168353B (zh) 蓝牙耳机及其语音交互控制方法
CN105306657B (zh) 身份识别方法、装置及通讯终端
CN105869626A (zh) 一种语速自动调节的方法及终端
CN110992932B (zh) 一种自学习的语音控制方法、系统及存储介质
CN103116576A (zh) 一种语音手势交互翻译装置及其控制方法
CN103514883B (zh) 一种自适应实现男女声切换方法
CN108305623A (zh) 电器控制方法及装置
CN105304081A (zh) 一种智能家居的语音播报系统及语音播报方法
CN107644643A (zh) 一种语音交互系统及方法
CN110070863A (zh) 一种语音控制方法及装置
CN105244042B (zh) 一种基于有限状态自动机的语音情感交互装置与方法
CN109271533A (zh) 一种多媒体文件检索方法
CN109598003B (zh) 一种ar翻译装置及方法
CN108256458A (zh) 一种针对聋人自然手语的双向实时翻译系统及方法
CN109871238A (zh) 语音交互方法、装置和存储介质
CN109117484A (zh) 一种语音翻译方法和语音翻译设备
CN114666695A (zh) 一种主动降噪的方法、设备及系统
CN203149569U (zh) 一种语音手势交互翻译装置
CN206301081U (zh) 具有双麦克风的智能眼镜和智能交互系统
CN107277276A (zh) 一种具备语音控制功能智能手机
CN107729433A (zh) 一种音频处理方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180928