CN109448713A - 语音识别方法、装置、计算机设备及存储介质 - Google Patents
语音识别方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109448713A CN109448713A CN201811347774.6A CN201811347774A CN109448713A CN 109448713 A CN109448713 A CN 109448713A CN 201811347774 A CN201811347774 A CN 201811347774A CN 109448713 A CN109448713 A CN 109448713A
- Authority
- CN
- China
- Prior art keywords
- user
- temperature
- voice
- voice messaging
- temperature data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 48
- 238000003062 neural network model Methods 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims description 28
- 230000005284 excitation Effects 0.000 claims description 26
- 238000013527 convolutional neural network Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 6
- 210000004218 nerve net Anatomy 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 14
- 238000007630 basic procedure Methods 0.000 description 10
- 230000006854 communication Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明实施例公开了一种语音识别方法、装置、计算机设备及存储介质,包括下述步骤:获取用户的语音信息;根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息;按照用户的身份信息调用所述用户的温度数据,并按照所述温度数据所表征的温度调节热水器的温度。通过语音卷积神经网络模型对语音信息进行识别得到用户的身份信息,并利用身份信息调用用户的温度数据,进而按照温度数据调节热水器。该方法不仅可以自动调节热水器的温度,操作简单,还可以满足每个用户的温度喜好,提高了用户的体验。
Description
技术领域
本发明实施例涉及金融领域,尤其是一种语音识别方法、装置、计算机设备及存储介质。
背景技术
随着经济的发展,人们生活水平的提高,家用电器成为生活的必备。通常,热水器安装于洗手间中,人们在洗澡的时候通过手动输入温度值,热水器就可以将水加热到该温度下,极大的为人们提供了便利。
在实际应用中,每个人洗澡适宜的温度均不相同,在热水器的使用过程中,每个人都需要手动调节水温,操作复杂。
发明内容
本发明实施例提供一种语音识别方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种语音识别方法,包括下述步骤:
获取用户的语音信息;
根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息;
按照用户的身份信息调用所述用户的温度数据,并按照所述温度数据所表征的温度调节热水器的温度。
可选地,所述根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息,包括:
将所述用户语音信息输入到所述语音卷积神经网络模型中,得到输出值;
判断所述输出值是否在预设的输出范围之内;
当所述输出值在预设的输出范围之内时,确定发出所述语音信息的用户为所述输出范围指向的家庭用户。
可选地,所述根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息,包括:
当所述输出值不在预设的输出范围之内时,确定发出所述语音信息的用户为非家庭用户。
可选地,当所述用户为家庭用户时,每个家庭用户具有各自的识别信息;所述按照用户的身份信息调用所述用户的温度数据,包括:
根据所述家庭用户的识别信息查找与所述识别信息具有映射关系的温度数据;
计算所述温度数据的平均值,得到适用于所述用户的温度数值。
可选地,当所述用户为非家庭用户时,所述按照用户的身份信息调用所述用户的温度数据,包括:
判断发出所述语音信息的非家庭用户是否为儿童;
当所述非家庭用户不是儿童时,调用预存的标准温度信息,并按照所述标准温度调整所述热水器。
可选地,所述判断发出所述语音信息的非家庭用户是否为儿童之后,还包括:
当所述非家庭用户是儿童时,不作处理。
可选地,所述语音卷积神经网络模型的训练方法,包括:
获取家庭用户的语音信息的训练样本集;
获取所述训练样本集的期望分类值;
将所述训练样本集输入到所述卷积神经网络模型中,得到激励分类值;
比对所述期望分类值与所述激励分类值之间的距离是否小于或等于预设的阈值,并当所述期望分类值与所述激励分类值之间的距离大于阈值时,反复循环迭代的通过反向算法更新卷积神经网络模型中的权重,至期望分类值与激励分类值之间的距离小于或等于预设的第一阈值时,得到所述语音卷积神经网络模型。
为解决上述技术问题,本发明实施例还提供一种语音识别装置,包括:
获取模块,用于获取用户的语音信息;
处理模块,用于根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息;
执行模块,用于按照用户的身份信息调用所述用户的温度数据,并按照所述温度数据所表征的温度调节热水器的温度。
可选地,所述处理模块包括:
第一处理子模块,用于将所述用户语音信息输入到所述语音卷积神经网络模型中,得到输出值;
第二处理子模块,用于判断所述输出值是否在预设的输出范围之内;
第一执行子模块,用于当所述输出值在预设的输出范围之内时,确定发出所述语音信息的用户为所述输出范围指向的家庭用户。
可选地,所述处理模块包括:
第二执行子模块,用于当所述输出值不在预设的输出范围之内时,确定发出所述语音信息的用户为非家庭用户。
可选地,当所述用户为家庭用户时,每个家庭用户具有各自的识别信息;所述执行模块包括:
第一获取子模块,用于根据所述家庭用户的识别信息查找与所述识别信息具有映射关系的温度数据;
第三执行子模块,用于计算所述温度数据的平均值,得到适用于所述用户的温度数值。
可选地,当所述用户为非家庭用户时,所述执行模块包括:
第三处理子模块,用于判断发出所述语音信息的非家庭用户是否为儿童;
第四执行子模块,用于当所述非家庭用户不是儿童时,调用预存的标准温度信息,并按照所述标准温度调整所述热水器。
可选地,还包括:
第五执行子模块,用于当所述非家庭用户是儿童时,不作处理。
可选地,还包括:
第二获取子模块,用于获取家庭用户的语音信息的训练样本集;
第三获取子模块,用于获取所述训练样本集的期望分类值;
第四处理子模块,用于将所述训练样本集输入到所述卷积神经网络模型中,得到激励分类值;
第六执行子模块,用于比对所述期望分类值与所述激励分类值之间的距离是否小于或等于预设的阈值,并当所述期望分类值与所述激励分类值之间的距离大于阈值时,反复循环迭代的通过反向算法更新卷积神经网络模型中的权重,至期望分类值与激励分类值之间的距离小于或等于预设的第一阈值时,得到所述语音卷积神经网络模型。
为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述语音识别方法的步骤。
为解决上述技术问题,本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述语音识别方法的步骤。
本发明实施例的有益效果是:通过语音卷积神经网络模型对语音信息进行识别得到用户的身份信息,并利用身份信息调用用户的温度数据,进而按照温度数据调节热水器。该方法不仅可以自动调节热水器的温度,操作简单,还可以满足每个用户的温度喜好,提高了用户的体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例语音识别方法的基本流程示意图;
图2为本发明实施例提供的一种根据预设的语音卷积神经网络模型对语音信息进行识别得到用户的身份信息的方法的基本流程示意图;
图3为本发明实施例提供的一种按照用户的身份信息调用用户的温度数据的方法的基本流程示意图;
图4为本发明实施例提供的另一种按照用户的身份信息调用用户的温度数据的方法的基本流程示意图;
图5为本发明实施例提供的一种语音卷积神经网络模型的训练方法的基本流程示意图;
图6为本发明实施例语音识别装置基本结构框图;
图7为本发明实施例计算机设备基本结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本实施方式中的客户终端即为上述的终端。
具体地,请参阅图1,图1为本实施例语音识别方法的基本流程示意图。
如图1所示,语音识别方法包括下述步骤:
S1100、获取用户的语音信息;
语音信息为用户发出的用于控制热水器的开、关、调节加热温度的指令的语音信息。例如,用户说“打开热水器”时,该语音信息用于控制热水器打开;用户说“加热到39摄氏度”时,该语音信息用于控制热水器将加热温度调节至39摄氏度。
在实际应用中,终端获取语音信息时,可以接收用户输入的语音信息,或者接收其它终端转发的语音信息。其中,终端为智能家居控制终端,该智能家居控制终端可以为任意的一种智能家居,例如,热水器、冰箱或者用于控制各个家具的家用服务器,也可以为移动终端,例如,手机、平板电脑等。
本发明的一个应用场景,用户在使用热水器之前,向移动终端发出语音信息,移动终端将该语音信息转发到热水器,对热水器的温度进行调节。
S1200、根据预设的语音卷积神经网络模型对语音信息进行识别,得到用户的身份信息;
语音卷积神经网络模型为预先由用户的语音进行训练过的模型,本实施方式中的神经网络模型能够是CNN卷积神经网络模型、VGG卷积神经网络模型,用于识别发出该语音信息的用户的身份信息。其中,该身份信息用于表征发出语音信息的用户的身份。在一些实施方式中,当应用于智能家居控制终端时,用户的身份信息可以为家庭用户,也可以为非家庭用户。需要解释的是,家庭用户为预先利用语音样本对语音卷积神经网络模型进行训练过的用户,非家庭用户为未预先利用语音样本对语音卷积神经网络模型进行训练过的用户。
本发明的一个实施例,语音卷积神经网络模型包括多个通道,每个通道对应一种身份信息,例如,家庭用户和非家庭用户,其中,家庭用户包括三个,即三种身份信息,由于非家庭用户没有预先对卷积神经网络模型训练过,所有的非家庭用户均为一种身份信息,因此,语音卷积神经网络模型包括四个通道,即四种身份信息。
当该语音卷积神经网络模型应用于智能家居终端时,智能家居终端将常用的用户的语音作为训练样本数据对预设的卷积神经网络模型进行训练,进而得到了语音卷积神经网络模型。
S1300、按照用户的身份信息调用用户的温度数据,并按照温度数据所表征的温度调节热水器的温度。
本发明的一个实施例,当用户使用过该热水器时,即终端识别用户的身份为家庭用户时,由于终端存储有该家庭用户使用过热水器的历史数据,且历史数据反映了用户的温度喜好,因此,终端按照用户的历史数据来调节热水器的温度。如此,针对每个家庭用户,终端均可以调用符合每个家庭用户的温度,提高了用户的体验。
本发明的另一个实施例,当终端识别该用户为非家庭用户时,即用户为首次使用,终端位存储有该非家庭用户的温度使用记录,此时,终端按照预设的温度对热水器进行调节。
上述语音识别方法,通过语音卷积神经网络模型对语音信息进行识别得到用户的身份信息,并利用身份信息调用用户的温度数据,进而按照温度数据调节热水器。该方法不仅可以自动调节热水器的温度,操作简单,还可以满足每个用户的温度喜好,提高了用户的体验。
本发明实施例提供一种根据预设的语音卷积神经网络模型对语音信息进行识别,得到用户的身份信息的方法,如图2所示,图2为本发明实施例提供的一种根据预设的语音卷积神经网络模型对语音信息进行识别得到用户的身份信息的方法的基本流程示意图。
具体地,如图2所示,步骤S1200包括下述步骤:
S1211、将用户语音信息输入到语音卷积神经网络模型中,得到输出值;
本发明实施例中,利用预设的音频处理软件将语音信息转为音频谱图,并将该音频谱图输入到预先训练至收敛的卷积神经网络模型中,即语音卷积神经网络模型中,得到该音频图像的输出值。
S1212、判断输出值是否在预设的输出范围之内;
通常情况下,输出范围的个数与语音卷积神经网络模型可识别的家庭用户的个数对应,例如,当家庭用户为三个时,输出范围的个数也为三个。例如,输出范围包括:0-1、1-2、2-3三个范围,其中,输出值为0-1对应第一家庭用户,输出值1-2对应第二家庭用户,输出值2-3对应第三家庭用户。因此,本发明实施例中,当得到语音卷积神经网络模型输出的输出值时,判断输出值所在范围。
S1213、当输出值在预设的输出范围之内时,确定发出语音信息的用户为输出范围指向的家庭用户。
S1214、当输出值不在预设的输出范围之内时,确定发出语音信息的用户为非家庭用户。
由上述举例可知,当输出值在上述预设的输出范围时,即可确定该输出范围指向的家庭用户为输入语音信息的用户的身份。由于没有利用非家庭用户的语音对语音卷积神经网络模型进行训练,因此,非家庭用户的输出值不在预设的范围之内。
在实际应用中,当用户为家庭用户且为多个时,为了清楚的对终端中存储的每个家庭用户的热水器历史温度数据进行标记,每个家庭用户具有各自的识别信息。鉴于此,本发明实施例提供一种按照用户的身份信息调用用户的温度数据的方法,如图3所示,图3为本发明实施例提供的一种按照用户的身份信息调用用户的温度数据的方法的基本流程示意图。
具体地,如图3所示,步骤S1300包括下述步骤:
S1310、根据家庭用户的识别信息查找与识别信息具有映射关系的温度数据;
识别信息为用于识别多个家庭用户的温度数据的信息,可以用文字、数字、图像、字母等对温度数据进行标记。本发明实施例中,终端中预存有温度数据信息表,其中,温度数据信息表包括家庭用户的识别信息与家庭用户的温度数据的映射关系,通过查找温度数据信息表即可获得与识别信息具有映射关系的温度数据。
S1320、计算温度数据的平均值,得到适用于用户的温度数值。
在计算温度数据的平均值时,可以将预设的时间段内的温度数据进行平均值运算,得到用户所适用的温度数值。随着环境的变化,家庭用户所适用的水温会发生变化,例如,冬天时,环境温度较低,人们在洗澡时的水温通常较高,夏天时,环境温度较高,为凉爽人们在洗澡时的水温通常较低。本发明实施例中,预设的时间段可以选一个月、两个月,在此不作限定。通过计算温度平均值,可以获取到某一时间段内用户偏好的温度,尽可能的适应用户对水温的变化,提高用户的体验。
当用户为非家庭用户时,本发明实施例提供一种按照用户的身份信息调用用户的温度数据的方法,如图4所示,图4为本发明实施例提供的另一种按照用户的身份信息调用用户的温度数据的方法的基本流程示意图。
具体地,如图4所示,步骤S1300包括下述步骤:
S1321、判断发出语音信息的非家庭用户是否为儿童;
本发明实施例中,当判断语音信息为非家庭用户时,为了安全起见,通过判断非家庭用户是否为儿童,可以避免儿童恶作剧开启热水器的情况发生,进而确保儿童的生命安全。
在判断语音信息是否为儿童发出的时,可以通过预设的语音处理软件进行判断,通常情况下,儿童的音调和频率较成人的音调和频率高,通过判断语音信息中的音调和频率是否大于预设值来确定是否为儿童。
S1322、当非家庭用户不是儿童时,调用预存的标准温度信息,并按照标准温度调整热水器。
不是儿童时,终端调用预存的标准温度信息,并将该温度信息发送给热水器,使热水器进行调节。其中,标准温度信息为大部分人惯用的温度,例如,37-40摄氏度,具体可以进行设置。
S1323、当非家庭用户是儿童时,不作处理。
当非家庭用户是儿童时,终端不作处理,即不发送指令给热水器,如此可以确保儿童的安全。在实际应用中,在上述情况下需要使用热水器时,可以手动进行调节水温。
本发明实施例提供一种语音卷积神经网络模型的训练方法,如图5所示,图5为本发明实施例提供的一种语音卷积神经网络模型的训练方法的基本流程示意图。
具体地,如图5所示,步骤S1200之前包括下述步骤:
S1201、获取家庭用户的语音信息的训练样本集;
训练样本集包括所有家庭用户的语音样本,其中,每个家庭用户包括多个语音样本,且每个语音样本均标记了该家庭用户的标记,本实施例中,可以标记分值,例如,第一家庭用户为1分,第二家庭用户为2分,第三家庭用户为3分。
由于家庭用户经常在家中说话,因此,终端收集每个家庭用户的语音作为训练样本集。需要解释的是,训练样本集实际为语音样本经预设的音频处理软件处理后的音频图谱图。
S1202、获取训练样本集的期望分类值;
本发明实施例中,将训练样本集输入到预设的分类模型中,获取多个家庭用户的语音图谱分类值,得到每张语音图谱的分数。以数值为限定条件对同一家庭用户的语音图谱的分数按照大小进行排序,取中间值作为每个家庭用户的训练样本的期望分类值。
分类模型为现有的对语音图谱进行分类的模型,例如,CNN卷积神经网络模型和VGG卷积神经网络模型。
S1203、将训练样本集输入到卷积神经网络模型中,得到激励分类值;
将训练样本集中的人脸图像依次输入到卷积神经网络模型中,卷积神经网络模型对人脸图像进行特征提取和分类。激励分类值是卷积神经网络模型根据输入的人脸图像而输出的激励数据,在神经网络模型未被训练至收敛之前,激励分类值为离散性较大的数值,当神经网络模型未被训练至收敛之后,激励分类值为相对稳定的数据。
S1204、比对期望分类值与激励分类值之间的距离是否小于或等于预设的阈值,并当期望分类值与激励分类值之间的距离大于阈值时,反复循环迭代的通过反向算法更新卷积神经网络模型中的权重,至期望分类值与激励分类值之间的距离小于或等于预设的第一阈值。
通过损失函数判断卷积神经网络模型全连接层输出的激励分类值与设定的期望分类值是否一致,当结果不一致时,需要通过反向传播算法对第一通道内的权重进行调整。
在一些实施方式中,损失函数通过计算激励分类值与设定的期望分类值之间的距离(欧氏距离或者空间距离),来确定激励分类值与设定的分类期望值是否一致,设定第一阈值(例如,0.05),当激励分类值与设定的期望分类值之间的距离小于或等于第一阈值时,则确定激励分类值与设定的期望分类值一致,否则,则激励分类值与设定的期望分类值不一致。
为解决上述技术问题本发明实施例还提供一种语音识别装置。具体请参阅图6,图6为本实施例语音识别装置基本结构框图。
如图6所示,一种语音识别装置,包括:获取模块2100、处理模块2200和执行模块2300。其中,获取模块2100,用于获取用户的语音信息;处理模块2200,用于根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息;执行模块2300,用于按照用户的身份信息调用所述用户的温度数据,并按照所述温度数据所表征的温度调节热水器的温度。
语音识别装置通过语音卷积神经网络模型对语音信息进行识别得到用户的身份信息,并利用身份信息调用用户的温度数据,进而按照温度数据调节热水器。该方法不仅可以自动调节热水器的温度,操作简单,还可以满足每个用户的温度喜好,提高了用户的体验。
在一些实施方式中,所述处理模块包括:第一处理子模块,用于将所述用户语音信息输入到所述语音卷积神经网络模型中,得到输出值;第二处理子模块,用于判断所述输出值是否在预设的输出范围之内;第一执行子模块,用于当所述输出值在预设的输出范围之内时,确定发出所述语音信息的用户为所述输出范围指向的家庭用户。
在一些实施方式中,所述处理模块包括:第二执行子模块,用于当所述输出值不在预设的输出范围之内时,确定发出所述语音信息的用户为非家庭用户。
在一些实施方式中,当所述用户为家庭用户时,每个家庭用户具有各自的识别信息;所述执行模块包括:第一获取子模块,用于根据所述家庭用户的识别信息查找与所述识别信息具有映射关系的温度数据;第三执行子模块,用于计算所述温度数据的平均值,得到适用于所述用户的温度数值。
在一些实施方式中,当所述用户为非家庭用户时,所述执行模块包括:第三处理子模块,用于判断发出所述语音信息的非家庭用户是否为儿童;第四执行子模块,用于当所述非家庭用户不是儿童时,调用预存的标准温度信息,并按照所述标准温度调整所述热水器。
在一些实施方式中,还包括:第五执行子模块,用于当所述非家庭用户是儿童时,不作处理。
在一些实施方式中,还包括:第二获取子模块,用于获取家庭用户的语音信息的训练样本集;第三获取子模块,用于获取所述训练样本集的期望分类值;第四处理子模块,用于将所述训练样本集输入到所述卷积神经网络模型中,得到激励分类值;第六执行子模块,用于比对所述期望分类值与所述激励分类值之间的距离是否小于或等于预设的阈值,并当所述期望分类值与所述激励分类值之间的距离大于阈值时,反复循环迭代的通过反向算法更新卷积神经网络模型中的权重,至期望分类值与激励分类值之间的距离小于或等于预设的第一阈值时,得到所述语音卷积神经网络模型。
为解决上述技术问题,本发明实施例还提供计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
如图7所示,计算机设备的内部结构示意图。如图7所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种语音识别方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种语音识别方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图6中获取模块2100、处理模块2200和执行模块2300的具体内容,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有语音识别方法中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
计算机设备通过语音卷积神经网络模型对语音信息进行识别得到用户的身份信息,并利用身份信息调用用户的温度数据,进而按照温度数据调节热水器。该方法不仅可以自动调节热水器的温度,操作简单,还可以满足每个用户的温度喜好,提高了用户的体验。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述语音识别方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种语音识别方法,其特征在于,包括下述步骤:
获取用户的语音信息;
根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息;
按照用户的身份信息调用所述用户的温度数据,并按照所述温度数据所表征的温度调节热水器的温度。
2.根据权利要求1所述的语音识别方法,其特征在于,所述根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息,包括:
将所述用户语音信息输入到所述语音卷积神经网络模型中,得到输出值;
判断所述输出值是否在预设的输出范围之内;
当所述输出值在预设的输出范围之内时,确定发出所述语音信息的用户为所述输出范围指向的家庭用户。
3.根据权利要求2所述的语音识别方法,其特征在于,所述根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息,包括:
当所述输出值不在预设的输出范围之内时,确定发出所述语音信息的用户为非家庭用户。
4.根据权利要求1所述的语音识别方法,其特征在于,当所述用户为家庭用户时,每个家庭用户具有各自的识别信息;所述按照用户的身份信息调用所述用户的温度数据,包括:
根据所述家庭用户的识别信息查找与所述识别信息具有映射关系的温度数据;
计算所述温度数据的平均值,得到适用于所述用户的温度数值。
5.根据权利要求1所述的语音识别方法,其特征在于,当所述用户为非家庭用户时,所述按照用户的身份信息调用所述用户的温度数据,包括:
判断发出所述语音信息的非家庭用户是否为儿童;
当所述非家庭用户不是儿童时,调用预存的标准温度信息,并按照所述标准温度调整所述热水器。
6.根据权利要求5所述的语音识别方法,其特征在于,所述判断发出所述语音信息的非家庭用户是否为儿童之后,还包括:
当所述非家庭用户是儿童时,不作处理。
7.根据权利要求1至6所述的语音识别方法,其特征在于,所述语音卷积神经网络模型的训练方法,包括:
获取家庭用户的语音信息的训练样本集;
获取所述训练样本集的期望分类值;
将所述训练样本集输入到所述卷积神经网络模型中,得到激励分类值;
比对所述期望分类值与所述激励分类值之间的距离是否小于或等于预设的阈值,并当所述期望分类值与所述激励分类值之间的距离大于阈值时,反复循环迭代的通过反向算法更新卷积神经网络模型中的权重,至期望分类值与激励分类值之间的距离小于或等于预设的第一阈值时,得到所述语音卷积神经网络模型。
8.一种语音识别装置,其特征在于,包括:
获取模块,用于获取用户的语音信息;
处理模块,用于根据预设的语音卷积神经网络模型对所述语音信息进行识别,得到所述用户的身份信息;
执行模块,用于按照用户的身份信息调用所述用户的温度数据,并按照所述温度数据所表征的温度调节热水器的温度。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述语音识别方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述语音识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811347774.6A CN109448713A (zh) | 2018-11-13 | 2018-11-13 | 语音识别方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811347774.6A CN109448713A (zh) | 2018-11-13 | 2018-11-13 | 语音识别方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109448713A true CN109448713A (zh) | 2019-03-08 |
Family
ID=65551012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811347774.6A Pending CN109448713A (zh) | 2018-11-13 | 2018-11-13 | 语音识别方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109448713A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047512A (zh) * | 2019-04-25 | 2019-07-23 | 广东工业大学 | 一种环境声音分类方法、系统及相关装置 |
CN110197666A (zh) * | 2019-05-30 | 2019-09-03 | 广东工业大学 | 一种基于神经网络的语音识别方法、装置 |
CN110798318A (zh) * | 2019-09-18 | 2020-02-14 | 云知声智能科技股份有限公司 | 设备管理方法及装置 |
CN111159334A (zh) * | 2019-12-10 | 2020-05-15 | 贝壳技术有限公司 | 用于房源跟进信息处理的方法及系统 |
CN111199747A (zh) * | 2020-03-05 | 2020-05-26 | 北京花兰德科技咨询服务有限公司 | 人工智能通信系统及通信方法 |
CN112541398A (zh) * | 2020-11-17 | 2021-03-23 | 芜湖美的厨卫电器制造有限公司 | 基于步态识别用户的方法、装置、处理器及热水器 |
CN112712444A (zh) * | 2019-10-25 | 2021-04-27 | 北京声智科技有限公司 | 一种基于物联网的酒店管理方法及相关设备 |
CN115471984A (zh) * | 2022-07-29 | 2022-12-13 | 青岛海尔科技有限公司 | 告警事件的执行方法及装置、存储介质及电子装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5461697A (en) * | 1988-11-17 | 1995-10-24 | Sekisui Kagaku Kogyo Kabushiki Kaisha | Speaker recognition system using neural network |
CN1567431A (zh) * | 2003-07-10 | 2005-01-19 | 上海优浪信息科技有限公司 | 一种说话者身份识别方法和系统 |
CN105847974A (zh) * | 2016-03-30 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种解锁方法、装置及智能电视 |
CN107015781A (zh) * | 2017-03-28 | 2017-08-04 | 联想(北京)有限公司 | 语音识别方法和系统 |
CN108320753A (zh) * | 2018-01-22 | 2018-07-24 | 珠海格力电器股份有限公司 | 电器设备的控制方法、装置和系统 |
CN108366280A (zh) * | 2018-01-29 | 2018-08-03 | 山东浪潮商用系统有限公司 | 一种通过声纹识别用户进行儿童锁设置的方法 |
CN108592301A (zh) * | 2018-04-28 | 2018-09-28 | 四川虹美智能科技有限公司 | 一种声控智能空调、系统及使用方法 |
-
2018
- 2018-11-13 CN CN201811347774.6A patent/CN109448713A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5461697A (en) * | 1988-11-17 | 1995-10-24 | Sekisui Kagaku Kogyo Kabushiki Kaisha | Speaker recognition system using neural network |
CN1567431A (zh) * | 2003-07-10 | 2005-01-19 | 上海优浪信息科技有限公司 | 一种说话者身份识别方法和系统 |
CN105847974A (zh) * | 2016-03-30 | 2016-08-10 | 乐视控股(北京)有限公司 | 一种解锁方法、装置及智能电视 |
CN107015781A (zh) * | 2017-03-28 | 2017-08-04 | 联想(北京)有限公司 | 语音识别方法和系统 |
CN108320753A (zh) * | 2018-01-22 | 2018-07-24 | 珠海格力电器股份有限公司 | 电器设备的控制方法、装置和系统 |
CN108366280A (zh) * | 2018-01-29 | 2018-08-03 | 山东浪潮商用系统有限公司 | 一种通过声纹识别用户进行儿童锁设置的方法 |
CN108592301A (zh) * | 2018-04-28 | 2018-09-28 | 四川虹美智能科技有限公司 | 一种声控智能空调、系统及使用方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047512A (zh) * | 2019-04-25 | 2019-07-23 | 广东工业大学 | 一种环境声音分类方法、系统及相关装置 |
CN110047512B (zh) * | 2019-04-25 | 2021-04-16 | 广东工业大学 | 一种环境声音分类方法、系统及相关装置 |
CN110197666A (zh) * | 2019-05-30 | 2019-09-03 | 广东工业大学 | 一种基于神经网络的语音识别方法、装置 |
CN110197666B (zh) * | 2019-05-30 | 2022-05-10 | 广东工业大学 | 一种基于神经网络的语音识别方法、装置 |
CN110798318A (zh) * | 2019-09-18 | 2020-02-14 | 云知声智能科技股份有限公司 | 设备管理方法及装置 |
CN112712444A (zh) * | 2019-10-25 | 2021-04-27 | 北京声智科技有限公司 | 一种基于物联网的酒店管理方法及相关设备 |
CN111159334A (zh) * | 2019-12-10 | 2020-05-15 | 贝壳技术有限公司 | 用于房源跟进信息处理的方法及系统 |
CN111199747A (zh) * | 2020-03-05 | 2020-05-26 | 北京花兰德科技咨询服务有限公司 | 人工智能通信系统及通信方法 |
CN112541398A (zh) * | 2020-11-17 | 2021-03-23 | 芜湖美的厨卫电器制造有限公司 | 基于步态识别用户的方法、装置、处理器及热水器 |
CN115471984A (zh) * | 2022-07-29 | 2022-12-13 | 青岛海尔科技有限公司 | 告警事件的执行方法及装置、存储介质及电子装置 |
CN115471984B (zh) * | 2022-07-29 | 2023-09-15 | 青岛海尔科技有限公司 | 告警事件的执行方法及装置、存储介质及电子装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109448713A (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
US11601552B2 (en) | Hierarchical interface for adaptive closed loop communication system | |
US11367044B2 (en) | Method and apparatus for outputting storage position information | |
US11721356B2 (en) | Adaptive closed loop communication system | |
US11715459B2 (en) | Alert generator for adaptive closed loop communication system | |
CN106295275B (zh) | 一种应用冻结管理的方法、装置以及终端 | |
CN107256267A (zh) | 查询方法和装置 | |
CN107077845B (zh) | 一种语音输出方法及装置 | |
CN107483493A (zh) | 交互式日程提醒方法、装置、存储介质及智能家居系统 | |
US11947612B2 (en) | Mediating method and device | |
CN105653673B (zh) | 信息搜索方法及装置 | |
CN110060677A (zh) | 语音遥控器控制方法、装置及计算机可读存储介质 | |
US7716153B2 (en) | Memory assistance system comprising of a signal processing server receiving a media signal and associated data relating to information to be remembered and processing the input signal to identify media characteristics relevant to aiding user memory | |
US10897368B2 (en) | Integrating an interactive virtual assistant into a meeting environment | |
JP7488871B2 (ja) | 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム | |
US20210021709A1 (en) | Configurable dynamic call routing and matching system | |
CN106653013A (zh) | 语音识别方法及装置 | |
CN107577188A (zh) | 空调器控制方法、装置、空调器及计算机可读存储介质 | |
US20230282207A1 (en) | System and method for electronic communication | |
US20190050909A1 (en) | Server and method for configuring a chatbot | |
CN110502623A (zh) | 智能问答方法、电子装置、计算机设备及可读存储介质 | |
CN111540355A (zh) | 基于语音助手的个性化设置方法和设备 | |
CN105045882A (zh) | 一种热词处理方法及装置 | |
US20140223466A1 (en) | Method and Apparatus for Recommending Video from Video Library | |
CN114548092A (zh) | 客服会话调度方法及其装置、设备、介质、产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |