CN208141826U - 一种语音离线识别装置 - Google Patents

一种语音离线识别装置 Download PDF

Info

Publication number
CN208141826U
CN208141826U CN201820771917.5U CN201820771917U CN208141826U CN 208141826 U CN208141826 U CN 208141826U CN 201820771917 U CN201820771917 U CN 201820771917U CN 208141826 U CN208141826 U CN 208141826U
Authority
CN
China
Prior art keywords
voice
interface
voice signal
npu
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201820771917.5U
Other languages
English (en)
Inventor
张立涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chumen Wenwen Information Technology Co Ltd
Original Assignee
Chumen Wenwen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chumen Wenwen Information Technology Co Ltd filed Critical Chumen Wenwen Information Technology Co Ltd
Priority to CN201820771917.5U priority Critical patent/CN208141826U/zh
Application granted granted Critical
Publication of CN208141826U publication Critical patent/CN208141826U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本实用新型提供了一种语音离线识别装置,该装置包括:DSP设备、NPU以及MCU;DSP设备,用于接收外部输入的语音信号,对语音信号进行处理,得到目标语音信号,并发送给NPU;NPU,用于存储至少一个语音训练模型;在接收到DSP设备发送的目标语音信号时,利用至少一个语音训练模型对目标语音信号进行离线识别,形成针对于目标语音信号的识别结果信息;将所述识别结果信息发送给MCU;MCU,用于与外部的至少一个执行元件相连;在接收到NPU发送的识别结果信息时,确定目标执行元件,并控制目标执行元件执行与识别结果信息相对应的动作。因此,本实用新型提供的方案可以提高语音识别速度。

Description

一种语音离线识别装置
技术领域
本实用新型实施例涉及计算机技术领域,特别是涉及一种语音离线识别装置。
背景技术
语音识别技术由于能够为用户提供更加便捷的服务,因此得到了广泛应用。
目前,具有语音识别技术的装置在获得语音信号时,需要将语音信号发送到云端语音识别系统,由云端语音识别系统对语音信号进行识别。云端语音识别系统将识别结果信息反馈给具有语音识别技术的装置,以使该装置可以根据识别结果信息进行相应的处理。但是由于目前语音识别需要在线与云端语音识别系统进行交互,由于交互过程中会存在网络传输不稳定因素,会存在语音识别速度的情况发生。
可见,现有的方式,由于需要在线语音识别,因此语音识别速度较慢。
实用新型内容
有鉴于此,本实用新型实施例提出了一种语音离线识别装置,主要目的在于在可以提高语音识别速度。
本实用新型实施例提供了一种语音离线识别装置,该语音离线识别装置包括:
数字信号处理DSP设备、嵌入式神经网络处理器NPU以及微控制单元MCU;
所述DSP设备,用于接收外部输入的语音信号,对所述语音信号进行处理,得到目标语音信号,并发送给所述NPU;
所述NPU,用于存储至少一个语音训练模型;在接收到所述DSP设备发送的所述目标语音信号时,利用所述至少一个语音训练模型对所述目标语音信号进行离线识别,形成针对于所述目标语音信号的识别结果信息;将所述识别结果信息发送给所述MCU;
所述MCU,用于与外部的至少一个执行元件相连;在接收到所述NPU发送的所述识别结果信息时,确定目标执行元件,并控制所述目标执行元件执行与所述识别结果信息相对应的动作。
可选的,
所述NPU,包括:训练器;
所述训练器,用于在接收到所述DSP设备发送的所述目标语音信号时,在所述至少一个语音训练模型中选择出至少一个目标语音训练模型对所述目标语音信号进行离线识别。
可选的,
所述NPU,进一步包括:识别处理器;
所述识别处理器,用于在所述训练器开始对所述目标语音信号进行离线识别时,设定检查时间;在当前时间达到所述检查时间时,判断所述训练器是否形成了所述识别结果信息;如果否,将所述目标语音信号发送给外部的云端语音识别系统,以使所述云端语音识别系统对所述目标语音信号进行在线识别;
所述MCU,进一步用于接收所述云端语音识别系统发送的针对于所述目标语音信号的识别结果信息。
可选的,
所述DSP设备,包括:DSP芯片和方法存储器;
所述方法存储器,用于存储至少一种语音处理方法;
所述DSP芯片,用于在接收到所述语音信号时,从所述方法存储器中获取至少一个目标语音处理方法;利用所述至少一个目标语音处理方法对所述语音信号进行处理。
可选的,
所述DSP芯片,包括:模拟数字转换ADC接口;
所述ADC接口,用于接收外部输入的参考音频信号;
所述DSP芯片,进一步用于利用所述至少一个目标语音处理方法,根据所述参考音频信号对所述语音信号进行处理。
可选的,
所述DSP芯片,包括:至少一个第一数据接口以及至少一个第一时钟接口;
所述方法存储器,包括:至少一个第二数据接口以及至少一个第二时钟接口;
所述至少一个第一数据接口与至少一个第二数据接口一一对应连接;
所述至少一个第一时钟接口与至少一个第二时钟接口一一对应连接。
可选的,
所述至少一个第一数据接口,包括:场景SCN接口、从机输出主机输入SOMI接口、从机输入主机输出SIMO接口中的至少一个或多个。
可选的,
所述至少一个第二数据接口,包括:场景SCN接口、从机输出主机输入SOMI接口、从机输入主机输出SIMO接口中的至少一个或多个。
可选的,
所述NPU,包括:至少一个第三数据接口和至少一种第三时钟接口;
所述DSP设备,包括:至少一个第四数据接口和至少一种第四时钟接口;
所述至少一个第三数据接口与所述至少一个第四数据接口一一对应连接;
所述至少一个第三时钟接口与所述至少一个第四时钟接口一一对应连接。
可选的,
所述至少一个第三时钟接口,包括:主时钟接口、总线时钟接口、左右声音识别时钟接口中的至少一个或多个。
可选的,
所述至少一个第四时钟接口,包括:主时钟接口、总线时钟接口、左右声音识别时钟接口中的至少一个或多个。
可选的,
所述MCU,包括:升级处理器;
所述升级处理器,用于为所述NPU设定升级时间;判断当前时间是否达到所述升级时间,如果是,则从外部的升级系统中获取至少一个新的语音训练模型,并发送给所述NPU;
所述NPU,用于在接收到所述升级处理器发送的所述至少一个新的语音训练模型时,利用所述至少一个新的语音训练模型更新所述至少一个语音训练模型。
可选的,
进一步包括:电源;
所述电源分别与所述NPU、所述DSP设备以及所述MCU相连;
所述电源,用于将外部输入的电压转换为供电电压,并分别为所述NPU、所述DSP设备以及所述MCU提供所述供电电压。
本实用新型实施例提供了一种语音离线识别装置,该语音离线识别装置包括DSP设备、NPU以及MCU。在DSP设备接收到语音信号时,对语音信号进行处理,得到目标语音信号,并将目标语音信号发送给NPU。NPU在接收到DSP设备发送的目标语音信号时,利用自身存储的一个或多个语音训练模型对目标语音信号进行离线识别。离线识别后NPU形成针对于目标语音信号的识别结果信息,并将识别结果信息发送给MCU。在MCU接收到识别结果信息时,在各个执行元件中确定目标执行元件,并控制目标执行元件执行与识别结果信息相对应的动作。通过上述可知,由于通过NPU、DSP设备以及MCU之间的交互便可以对DSP设备得到的目标语音信号完成语音识别,从而使得MCU根据识别结果信息及时控制相关的执行元件来执行相应的动作。可见本实用新型实施例中通过NPU、DSP设备以及MCU之间的交互便可完成语音识别,并不需要将语音信号发送给云端语音识别系统,从而节省了与云端语音识别系统交互的时间。因此,本实用新型实施例提供的方案可以提高语音识别速度。
上述说明仅是本实用新型技术方案的概述,为了能够更清楚了解本实用新型的技术手段,而可依照说明书的内容予以实施,并且为了让本实用新型的上述和其它目的、特征和优点能够更明显易懂,以下特举本实用新型的具体实施方式。
附图说明
为了更清楚地说明本实用新型实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本实用新型的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本实用新型一个实施例提供的一种语音离线识别装置的结构示意图;
图2示出了本实用新型一个实施例提供的一种包括训练器和识别处理器的语音离线识别装置的结构示意图;
图3示出了本实用新型另一个实施例提供的一种语音离线识别装置的结构示意图;
图4示出了本实用新型又一个实施例提供的一种语音离线识别装置的结构示意图;
图5示出了本实用新型一个实施例提供的一种包括升级处理器的语音离线识别装置的结构示意图;
图6示出了本实用新型一个实施例提供的一种包括电源的语音离线识别装置的结构示意图。
具体实施方式
下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本实用新型实施例提供了一种语音离线识别装置,该语音离线识别装置包括:
DSP设备101、NPU102以及MCU103;
所述DSP设备101,用于接收外部输入的语音信号,对所述语音信号进行处理,得到目标语音信号,并发送给所述NPU102;
所述NPU102,用于存储至少一个语音训练模型;在接收到所述DSP设备101发送的所述目标语音信号时,利用所述至少一个语音训练模型对所述目标语音信号进行离线识别,形成针对于所述目标语音信号的识别结果信息;将所述识别结果信息发送给所述MCU103;
所述MCU103,用于与外部的至少一个执行元件相连;在接收所述NPU102发送的所述识别结果信息时,确定目标执行元件,并控制所述目标执行元件执行与所述识别结果信息相对应的动作。
根据图1所示的实施例,该语音离线识别装置包括DSP设备、NPU以及MCU。在DSP设备接收到语音信号时,对语音信号进行处理,得到目标语音信号,并将目标语音信号发送给NPU。NPU在接收到DSP设备发送的目标语音信号时,利用自身存储的一个或多个语音训练模型对目标语音信号进行离线识别。离线识别后NPU形成针对于目标语音信号的识别结果信息,并将识别结果信息发送给MCU。在MCU接收到识别结果信息时,在各个执行元件中确定目标执行元件,并控制目标执行元件执行与识别结果信息相对应的动作。通过上述可知,由于通过NPU、DSP设备以及MCU之间的交互便可以对DSP设备得到的目标语音信号完成语音识别,从而使得MCU根据识别结果信息及时控制相关的执行元件来执行相应的动作。可见本实用新型实施例中通过NPU、DSP设备以及MCU之间的交互便可完成语音识别,并不需要将语音信号发送给云端语音识别系统,从而节省了与云端语音识别系统交互的时间。因此,本实用新型实施例提供的方案可以提高语音识别速度。
在本实用新型一个实施例中,MCU中可以包括两组数据接口。其中,一组数据接口与DSP设备中的数据接口相连,通过该组数据接口可以与DSP设备进行如下操作:一、初始化DSP设备,为DSP设备配置数据;二、为DSP设备提供升级数据。另一组数据接口与NPU中的数据接口相连,通过该组数据接口可以与NPU进行如下操作能够:一、初始化NPU,为NPU设备配置数据;二、为NPU提供升级数据,以使NPU升级语音训练模型;三、获取NPU中的识别结果信息。
在本实施例中,MCU中可以包括两组时钟接口。其中,一组时钟接口与DSP设备中的时钟接口相连;另一组时钟接口与NPU相连。通过两组时钟接口统一时钟。
在本实施例中,时钟接口和数据接口的类型均可以根据业务要求确定。比如可以包括但不限于I2C接口、I2S接口、SPI接口、USB接口中的任意一种。
在本实用新型一个实施例中,如图2所示,所述NPU102包括训练器1021;
所述训练器1021,用于在接收到所述DSP设备101发送的所述目标语音信号时,在所述至少一个语音训练模型中选择出至少一个目标语音训练模型对所述目标语音信号进行离线识别。
在本实施例中,在训练器接收到目标语音信号时,选用目标语音训练模型时存在如下两种情况:
第一种,将所有的语音训练模型均选择为目标语音训练模型;
第二种,对目标语音信号进行初步解析得到解析结果,在各个语音训练模型中确定与解析结果相匹配的模型,并将这些确定的语音训练模型均选择为目标语音训练模型。
在本实施例中,在训练器选择出目标语音训练模型之后,利用各个目标语音训练模型对目标语音信号进行离线识别。该离线识别的过程即为对目标语音信号进行训练的过程。待离线识别完成后得到目标语音信号对应的识别结果信息。
在本实施例中,识别结果信息包括的具体的内容与目标语音信号有关。举例说明:目标语音信号涉及的内容为“把音量调节到40分贝”。则识别结果信息中包括音量和40分贝。
在本实施例中,训练器在各个语音训练模型中选择出至少一个目标语音训练模型对目标语音信号进行离线识别的过程为现有技术,训练器可通过任何一种现有技术在各个语音训练模型中选择出至少一个目标语音训练模型对目标语音信号进行离线识别。
根据上述实施例,在接收到目标语音信号时,训练器就可以在各个语音训练模型中选择出一个或多个语音训练模型对目标语音信号进行离线识别。由于可以利用与目标语音信号相匹配的各个目标语音训练模型对目标语音信号进行离线识别。因此,可以快速对目标语音进行识别。
在本实用新型一个实施例中,如图2所示,所述NPU102进一步包括:识别处理器1022;
所述识别处理器1022,用于在所述训练器1021开始对所述目标语音信号进行离线识别时,设定检查时间;在当前时间达到所述检查时间时,判断所述训练器是否形成了所述识别结果信息;如果否,将所述目标语音信号发送给外部的云端语音识别系统,以使所述云端语音识别系统对所述目标语音信号进行在线识别;
所述MCU103,进一步用于接收所述云端语音识别系统发送的针对于所述目标语音信号的识别结果信息。
在本实施例中,检查时间可以根据业务要求确定。比如,检查时间与离线识别开始时的开始时间之间具有设定的时间间隔,比如该时间间隔可以为小于5S之内的任一数值。
在本实施例中,在当前时间达到检查时间时,则识别处理器开始判断此时是否形成了目标语音信号对应的识别结果信息。如果没有形成识别结果信息,则说明训练器对目标语音信号的离线识别可能失败了。为了保证MCU可以及时执行目标语音信息要求的执行动作,识别处理器需要将目标语音信号转发给云端语音识别系统。由于云端语音识别系统中包括大量且全面的语音训练模型,因此,此时由云端语音识别系统对目标语音信号进行在线识别。然后MCU接收云端语音识别系统反馈的针对于目标语音信号的识别结果信息,并控制相应的执行元件来执行与识别结果信息相对应的动作。
根据上述实施例,识别处理器可以监控训练器是否在设定的时间内形成识别结果信息。如果判断出未形成识别结果信息时,说明训练器可能存在异常。则将目标语音信号发送给云端语音识别系统,以使云端语音识别系统对目标语音信号进行在线识别。由于可以实现离线识别和在线识别的切换。因此即使在训练器异常时也可以为MCU提供识别结果信息。
在本实用新型一个实施例中,如图3所示,所述DSP设备101,包括:DSP芯片1011和方法存储器1012;
所述方法存储器1012,用于存储至少一种语音处理方法;
所述DSP芯片1011,用于在接收到所述语音信号时,从所述方法存储器1012中获取至少一个目标语音处理方法;利用所述至少一个目标语音处理方法对所述语音信号进行处理。
在本实施例中,至少一种语音处理方法可以包括但不限于语音信号拾取方法、信号的放大方法、降噪处理方法、回声消除方法以及麦克风的波束成形方法中的一种或多种。
在本实施例中,在DSP芯片接收到语音信号时,从方法存储器中获取语音处理方法。然后用获取到的语音处理方法对语音信号进行处理。比如,可以对语音信号进行降噪、回声消除等处理。从而得到较为规整的语音信号。
在本实施例中,DSP芯片利用各个目标语音处理方法对语音信号进行处理的过程为现有技术。DSP芯片可通过任何一种现有技术利用各个目标语音处理方法对语音信号进行处理。
根据上述实施例,由于DSP芯片在接收到语音信号时,利用方法存储器中存储的语音处理方法对语音信号进行处理。从而得到较为规整的目标语音信号。因此,可以降低离线识别的难度。
在本实用新型一个实施例中,如图3所示,所述DSP芯片1011包括:模拟数字转换ADC接口1011A;
所述ADC接口1011A,用于接收外部输入的参考音频信号;
所述DSP芯片1011,进一步用于利用所述至少一个目标语音处理方法,根据所述参考音频信号对所述语音信号进行处理。
在本实施例中,DSP芯片在接收到语音信号时,利用各个目标语音处理方法,以参考音频信号为标准对语音信号进行处理。处理后得到的目标语音信号对应的参数与参考音频信号对应的参数相似。参数包括但不限于回音量、噪音量、信号放大值中的至少一种或多种。
在本实施例中,DSP芯片利用各个目标语音处理方法根据参考音频信号对语音信号进行处理的过程为现有技术。DSP芯片可通过任何一种现有技术利用各个目标语音处理方法根据参考音频信号对语音信号进行处理。
根据上述实施例,由于DSP芯片在接收到语音信号时,利用各个目标语音处理方法,以参考音频信号为标准对语音信号进行处理。因此,得到目标语音信号更为标准。
在本实用新型一个实施例中,如图3所示,所述DSP芯片1011包括:至少一个第一数据接口1011B以及至少一个第一时钟接口1011C;
所述方法存储器1012,包括:至少一个第二数据接口1012A以及至少一个第二时钟接口1012B;
所述至少一个第一数据接口1011B与至少一个第二数据接口1012A一一对应连接;
所述至少一个第一时钟接口1011C与至少一个第二时钟接口1012B一一对应连接。
在本实施例中,DSP芯片和方法存储器可以通过相互连接的数据接口进行数据交互。比如,DSP芯片可以通过相互连接的数据接口从方法存储器中获取到目标语音处理方法。
在本实施例中,DSP芯片和方法存储器可以通过相互连接的时钟接口统一时钟。
在本实施例中,至少一个第一数据接口1011B可以包括但不限于场景SCN接口、从机输出主机输入SOMI接口、从机输入主机输出SIMO接口中的至少一个或多个。
在本实施例中,至少一个第二数据接口1012A可以包括但不限于场景SCN接口、从机输出主机输入SOMI接口、从机输入主机输出SIMO接口中的至少一个或多个。
在本实施例中,时钟接口和数据接口的类型均可以根据业务要求确定。比如可以包括但不限于I2C接口、I2S接口、SPI接口、USB接口中的任意一种。
在本实用新型一个实施例中,如图4所示,所述NPU102可以包括:至少一个第三数据接口1021和至少一种第三时钟接口1022;
所述DSP设备101可以包括:至少一个第四数据接口1013和至少一种第四时钟接口1014;
所述至少一个第三数据接口1021与所述至少一个第四数据接口1013一一对应连接;
所述至少一个第三时钟接口1022与所述至少一个第四时钟接口1014一一对应连接。
在本实施例中,NPU和DSP设备可以通过相互连接的数据接口进行数据交互。比如,DSP设备可以通过相互连接的数据接口向NPU传输目标语音信号。
在本实施例中,NPU和DSP设备可以通过相互连接的时钟接口统一时钟。
在本实施例中,至少一个第三时钟接口1022可以包括但不限于主时钟接口、总线时钟接口、左右声音识别时钟接口中的至少一个或多个。
在本实施例中,至少一个第四时钟接口1014可以包括但不限于主时钟接口、总线时钟接口、左右声音识别时钟接口中的至少一个或多个。
在本实用新型一个实施例中,如图5所示,所述MCU103可以包括:升级处理器1031;
所述升级处理器1031,用于为所述NPU设定升级时间;判断当前时间是否达到所述升级时间,如果是,则从外部的升级系统中获取至少一个新的语音训练模型,并发送给所述NPU102;
所述NPU102,用于在接收到所述升级处理器1031发送的所述至少一个新的语音训练模型时,利用所述至少一个新的语音训练模型更新所述至少一个语音训练模型;
在本实施例中,由于语音训练模型更新速度很快,为了更好的利用语音训练模型对语音信号进行离线识别,需要定时更新语音训练模型。
在本实施例中,升级时间可以根据业务要求确定。举例说明:可以设定为每月固定的一个时间点。比如,升级时间为每月最后一天的晚上22:00。
在本实施例中,升级处理器在确定当前时间达到升级时间时,直接从外部的升级系统中获取一个或多个新的语音训练模型。然后NPU利用各个新的语音训练模型更新已存储的语音训练模型。其中,更新的方式可以为:一、删除所有已存储的语音训练模型,并存储各个新的语音训练模型。二、针对每一个新的语音训练模型均执行:判断在已存储的语音训练模型中是否存储对应的语音训练模型,如果是,替换对应的语音训练模型;否则,直接存储该新的语音训练模型。
升级处理器以及NPU在本实施例中所涉及的操作过程为现有技术,升级处理器以及NPU可通过任何一种现有技术来实现本实施例中所涉及的操作过程。
根据上述实施例,升级处理器根据NPU的升级时间定时获取新的语音训练模型,以使NPU利用新的语音训练模型更新已存储的语音训练模型。因此,可以更好、更快的利用语音训练模型对语音信号进行离线识别。
在本实用新型一个实施例中,如图6所示,语音离线识别装置可以进一步包括:电源104;
所述电源104分别与所述NPU102、所述DSP设备101以及所述MCU103相连;
所述电源104,用于将外部输入的电压转换为供电电压,并分别为所述NPU102、所述DSP设备101以及所述MCU103提供所述供电电压。
在本实施例中,举例说明:电源可以将外部输入的12V电压转换为3V和1.8V的供电电压,并分别为NPU、MCU、DSP设备中的方法存储器提供3V供电电压,以及为DSP芯片提供1.8V的供电电压。以使NPU、DSP设备以及MCU可以正常工作和运转。
在实用新型一个实施例中,DSP设备对语音信号进行处理得到目标语音信号的过程为现有技术。DSP设备可通过任何一种现有技术对语音信号进行处理得到目标语音信号。
在实用新型一个实施例中,MCU根据识别结果信息确定目标执行元件,并控制所述目标执行元件执行与识别结果信息相对应的动作的过程为现有技术。MCU可通过任何一种现有技术根据识别结果信息确定目标执行元件,并控制所述目标执行元件执行与识别结果信息相对应的动作。
本实用新型各个实施例至少具有如下有益效果:
1、在本实用新型实施例中,该语音离线识别装置包括DSP设备、NPU以及MCU。在DSP设备接收到语音信号时,对语音信号进行处理,得到目标语音信号,并将目标语音信号发送给NPU。NPU在接收到DSP设备发送的目标语音信号时,利用自身存储的一个或多个语音训练模型对目标语音信号进行离线识别。离线识别后NPU形成针对于目标语音信号的识别结果信息,并将识别结果信息发送给MCU。在MCU接收到识别结果信息时,在各个执行元件中确定目标执行元件,并控制目标执行元件执行与识别结果信息相对应的动作。通过上述可知,由于通过NPU、DSP设备以及MCU之间的交互便可以对DSP设备得到的目标语音信号完成语音识别,从而使得MCU根据识别结果信息及时控制相关的执行元件来执行相应的动作。可见本实用新型实施例中通过NPU、DSP设备以及MCU之间的交互便可完成语音识别,并不需要将语音信号发送给云端语音识别系统,从而节省了与云端语音识别系统交互的时间。因此,本实用新型实施例提供的方案可以提高语音识别速度。
2、在本实用新型实施例中,在接收到目标语音信号时,训练器就可以在各个语音训练模型中选择出一个或多个语音训练模型对目标语音信号进行离线识别。由于可以利用与目标语音信号相匹配的各个目标语音训练模型对目标语音信号进行离线识别。因此,可以快速对目标语音进行识别。
3、在本实用新型实施例中,识别处理器可以监控训练器是否在设定的时间内形成识别结果信息。如果判断出未形成识别结果信息时,说明训练器可能存在异常。则将目标语音信号发送给云端语音识别系统,以使云端语音识别系统对目标语音信号进行在线识别。由于可以实现离线识别和在线识别的切换。因此即使在训练器异常时也可以为MCU提供识别结果信息。
4、在本实用新型实施例中,由于DSP芯片在接收到语音信号时,利用方法存储器中存储的语音处理方法对语音信号进行处理。从而得到较为规整的目标语音信号。因此,可以降低离线识别的难度。
5、在本实用新型实施例中,由于DSP芯片在接收到语音信号时,利用各个目标语音处理方法,以参考音频信号为标准对语音信号进行处理。因此,得到目标语音信号更为标准。
6、在本实用新型实施例中,升级处理器根据NPU的升级时间定时获取新的语音训练模型,以使NPU利用新的语音训练模型更新已存储的语音训练模型。因此,可以更好、更快的利用语音训练模型对语音信号进行离线识别。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本实用新型的较佳实施例,仅用于说明本实用新型的技术方案,并非用于限定本实用新型的保护范围。凡在本实用新型的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本实用新型的保护范围内。

Claims (10)

1.一种语音离线识别装置,其特征在于,包括:
数字信号处理DSP设备、嵌入式神经网络处理器NPU以及微控制单元MCU;
所述DSP设备,用于接收外部输入的语音信号,对所述语音信号进行处理,得到目标语音信号,并发送给所述NPU;
所述NPU,用于存储至少一个语音训练模型;在接收到所述DSP设备发送的所述目标语音信号时,利用所述至少一个语音训练模型对所述目标语音信号进行离线识别,形成针对于所述目标语音信号的识别结果信息;将所述识别结果信息发送给所述MCU;
所述MCU,用于与外部的至少一个执行元件相连;在接收到所述NPU发送的所述识别结果信息时,确定目标执行元件,并控制所述目标执行元件执行与所述识别结果信息相对应的动作。
2.根据权利要求1所述的语音离线识别装置,其特征在于,
所述NPU,包括:训练器;
所述训练器,用于在接收到所述DSP设备发送的所述目标语音信号时,在所述至少一个语音训练模型中选择出至少一个目标语音训练模型对所述目标语音信号进行离线识别。
3.根据权利要求2所述的语音离线识别装置,其特征在于,
所述NPU,进一步包括:识别处理器;
所述识别处理器,用于在所述训练器开始对所述目标语音信号进行离线识别时,设定检查时间;在当前时间达到所述检查时间时,判断所述训练器是否形成了所述识别结果信息;如果否,将所述目标语音信号发送给外部的云端语音识别系统,以使所述云端语音识别系统对所述目标语音信号进行在线识别;
所述MCU,进一步用于接收所述云端语音识别系统发送的针对于所述目标语音信号的识别结果信息。
4.根据权利要求1至3任一所述的语音离线识别装置,其特征在于,
所述DSP设备,包括:DSP芯片和方法存储器;
所述方法存储器,用于存储至少一种语音处理方法;
所述DSP芯片,用于在接收到所述语音信号时,从所述方法存储器中获取至少一个目标语音处理方法;利用所述至少一个目标语音处理方法对所述语音信号进行处理。
5.根据权利要求4所述的语音离线识别装置,其特征在于,
所述DSP芯片,包括:模拟数字转换ADC接口;
所述ADC接口,用于接收外部输入的参考音频信号;
所述DSP芯片,进一步用于利用所述至少一个目标语音处理方法,根据所述参考音频信号对所述语音信号进行处理。
6.根据权利要求4所述的语音离线识别装置,其特征在于,
所述DSP芯片,包括:至少一个第一数据接口以及至少一个第一时钟接口;
所述方法存储器,包括:至少一个第二数据接口以及至少一个第二时钟接口;
所述至少一个第一数据接口与至少一个第二数据接口一一对应连接;
所述至少一个第一时钟接口与至少一个第二时钟接口一一对应连接。
7.根据权利要求6所述的语音离线识别装置,其特征在于,
所述至少一个第一数据接口,包括:场景SCN接口、从机输出主机输入SOMI接口、从机输入主机输出SIMO接口中的至少一个或多个;
和/或,
所述至少一个第二数据接口,包括:场景SCN接口、从机输出主机输入SOMI接口、从机输入主机输出SIMO接口中的至少一个或多个。
8.根据权利要求1-3中任一所述的语音离线识别装置,其特征在于,
所述NPU,包括:至少一个第三数据接口和至少一种第三时钟接口;
所述DSP设备,包括:至少一个第四数据接口和至少一种第四时钟接口;
所述至少一个第三数据接口与所述至少一个第四数据接口一一对应连接;
所述至少一个第三时钟接口与所述至少一个第四时钟接口一一对应连接。
9.根据权利要求8所述的语音离线识别装置,其特征在于,
所述至少一个第三时钟接口,包括:主时钟接口、总线时钟接口、左右声音识别时钟接口中的至少一个或多个;
和/或,
所述至少一个第四时钟接口,包括:主时钟接口、总线时钟接口、左右声音识别时钟接口中的至少一个或多个。
10.根据权利要求1-3中任一所述的语音离线识别装置,其特征在于,
所述MCU,包括:升级处理器;
所述升级处理器,用于为所述NPU设定升级时间;判断当前时间是否达到所述升级时间,如果是,则从外部的升级系统中获取至少一个新的语音训练模型,并发送给所述NPU;
所述NPU,用于在接收到所述升级处理器发送的所述至少一个新的语音训练模型时,利用所述至少一个新的语音训练模型更新所述至少一个语音训练模型;
和/或,
进一步包括:电源;
所述电源分别与所述NPU、所述DSP设备以及所述MCU相连;
所述电源,用于将外部输入的电压转换为供电电压,并分别为所述NPU、所述DSP设备以及所述MCU提供所述供电电压。
CN201820771917.5U 2018-05-22 2018-05-22 一种语音离线识别装置 Active CN208141826U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201820771917.5U CN208141826U (zh) 2018-05-22 2018-05-22 一种语音离线识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201820771917.5U CN208141826U (zh) 2018-05-22 2018-05-22 一种语音离线识别装置

Publications (1)

Publication Number Publication Date
CN208141826U true CN208141826U (zh) 2018-11-23

Family

ID=64314229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201820771917.5U Active CN208141826U (zh) 2018-05-22 2018-05-22 一种语音离线识别装置

Country Status (1)

Country Link
CN (1) CN208141826U (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109683938A (zh) * 2018-12-26 2019-04-26 苏州思必驰信息科技有限公司 用于移动终端的声纹模型升级方法和装置
CN111341301A (zh) * 2020-05-19 2020-06-26 北京小米移动软件有限公司 一种录音处理方法
CN113611296A (zh) * 2021-08-20 2021-11-05 天津讯飞极智科技有限公司 语音识别装置和拾音设备
JP7408723B2 (ja) 2021-06-18 2024-01-05 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ニューラルネットワークプロセッシングユニット、ニューラルネットワークの処理方法及びその装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109683938A (zh) * 2018-12-26 2019-04-26 苏州思必驰信息科技有限公司 用于移动终端的声纹模型升级方法和装置
CN109683938B (zh) * 2018-12-26 2022-08-02 思必驰科技股份有限公司 用于移动终端的声纹模型升级方法和装置
CN111341301A (zh) * 2020-05-19 2020-06-26 北京小米移动软件有限公司 一种录音处理方法
JP7408723B2 (ja) 2021-06-18 2024-01-05 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ニューラルネットワークプロセッシングユニット、ニューラルネットワークの処理方法及びその装置
CN113611296A (zh) * 2021-08-20 2021-11-05 天津讯飞极智科技有限公司 语音识别装置和拾音设备

Similar Documents

Publication Publication Date Title
CN208141826U (zh) 一种语音离线识别装置
CN109741754A (zh) 一种会议语音识别方法及系统、存储介质及终端
CN109637548A (zh) 基于声纹识别的语音交互方法及装置
CN108737933A (zh) 一种基于智能音箱的对话方法、装置及电子设备
CN106845624A (zh) 与智能机器人的应用程序有关的多模态交互方法及系统
CN108962262A (zh) 语音数据处理方法和装置
WO2020253064A1 (zh) 语音的识别方法及装置、计算机设备、存储介质
CN107655154A (zh) 终端控制方法、空调器及计算机可读存储介质
CN109473104A (zh) 语音识别网络延时优化方法及装置
CN110992932B (zh) 一种自学习的语音控制方法、系统及存储介质
CN112634897B (zh) 设备唤醒方法、装置和存储介质及电子装置
CN108899027A (zh) 语音解析方法及装置
CN111261151A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN108632653A (zh) 语音管控方法、智能电视及计算机可读存储介质
CN109271503A (zh) 智能问答方法、装置、设备及存储介质
CN109635028A (zh) 数据查询方法及装置、服务器及计算机可读存储介质
CN108228134A (zh) 一种任务语音的处理方法、装置、智能音箱和存储介质
CN106557165A (zh) 智能设备的动作模拟交互方法和装置及智能设备
CN111128150A (zh) 一种唤醒智能语音设备的方法及装置
CN109686370A (zh) 基于语音控制进行斗地主游戏的方法及装置
CN108758990A (zh) 空调设备的控制系统及方法、存储介质、处理器
CN110517672B (zh) 用户意图识别方法、用户指令执行方法、系统及设备
CN110534096A (zh) 一种基于微控制器的人工智能语音识别方法及系统
CN107331399A (zh) 一种学习效果检测方法、系统及终端设备
CN110099295A (zh) 电视机语音控制方法、装置、设备及存储介质

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant