CN109087646B

CN109087646B - 一种导入人工智能超深度学习用于语音图像识别的方法

Info

Publication number: CN109087646B
Application number: CN201811249231.0A
Authority: CN
Inventors: 韩青江
Original assignee: Wuhan Tuorui Chuanqi Technology Co ltd
Current assignee: Wuhan Qichuang Funeng Intelligent Technology Co.,Ltd.
Priority date: 2018-10-25
Filing date: 2018-10-25
Publication date: 2021-04-06
Anticipated expiration: 2038-10-25
Also published as: CN109087646A

Abstract

本发明公开了一种导入人工智能超深度学习用于语音图像识别的方法，包括触摸屏、图像识别模块、语音识别模块和CORTEX‑A75处理器，述触摸屏具有摄像头、麦克风、程序储存器、随机储存器数据、图像识别模块、语音识别模块和CORTEX‑A75处理器，所述图像识别模块包括摄像控制模块和图像对比模块，所述摄像控制模块包括图像处理模块和图片传输模块，所述语音识别模块包括预处理系统、特征提取系统和模式匹配系统，且模式匹配系统内具有语言模型库。人员通过本发明快速识别相应信息，且再识别过程中，可对录入的语音信号进行减噪滤波处理，提高识别的精确性，能实现数据不断更新和上传云端，在扩大检索的范围和多样化的同时，实现数据共享。

Description

一种导入人工智能超深度学习用于语音图像识别的方法

技术领域

本发明属于语音图像识别技术领域，具体涉及一种导入人工智能超深度学习用于语音图像识别的方法。

背景技术

在图像语音识别过程中，录入的图像或语音的资源存在在准确性上或资源检索范围上都存在较大的局限性，在没有实现新数据创建下，且不存在大资源的共享学习更新，在语音识别上没有对语音信号实现优化降噪滤波的处理，且因数据的局限，不能识别可能已出现的数据资源或将不相关的信号数据因未优化处理识别出错误的位置信息。

发明内容

本发明的目的在于提供一种导入人工智能超深度学习用于语音图像识别的方法，以解决上述背景技术中提出的在图像语音识别过程中，录入的图像或语音的资源存在在准确性上或资源检索范围上都存在较大的局限性，在没有实现新数据创建下，且不存在大资源的共享学习更新，在语音识别上没有对语音信号实现优化降噪滤波的处理，且因数据的局限，不能识别可能已出现的数据资源或将不相关的信号数据因未优化处理识别出错误的位置信息。

为实现上述目的，本发明提供如下技术方案：一种导入人工智能超深度学习用于语音图像识别的模块，包括触摸屏、图像识别模块、语音识别模块和CORTEX-A75处理器，所述触摸屏具有摄像头、麦克风、程序储存器、随机储存器数据、图像识别模块、语音识别模块和CORTEX-A75处理器，所述图像识别模块包括摄像控制模块和图像对比模块，所述摄像控制模块包括图像处理模块和图片传输模块，所述语音识别模块包括预处理系统、特征提取系统和模式匹配系统，且模式匹配系统内具有语言模型库，所述预处理系统电连接特征提取系统，且特征提取系统与模式匹配系统数据连接，实现语音数据识别，所述图像识别模块电连接摄像头，所述语音识别模块电连接麦克风，所述图像识别模块和语音识别模块分别与CORTEX-A75处理器数据连接，且CORTEX-A75处理器与程序储存器和随机储存器数据连接，实现图像数据和语音数据的处理和存储，所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接。

进一步地，所述麦克风具有多组，所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接，可定期实现更新程序储存器、随机储存器的资源数据和语言模型库，进而扩大人员图像语音检索的范围，且利用CORTEX-A75处理器将处理后的图片语音通过网络控制器上传于云端服务器，实现数据共享。

进一步地，所述预处理系统内具有反混叠失真滤波器、预加重器、端点检测模块和噪声滤波器。

进一步地，所述特征提取系统具有LPC、LPCC、MFCC和ASCC。

与现有技术相比，本发明的有益效果是：可通过录入的图像或语音信号快速进入对应的信息数据的位置，便于人员通过本发明快速识别相应信息，且再识别过程中，可对录入的语音信号进行减噪滤波处理，提高识别的精确性，能实现数据不断更新和上传云端，在扩大检索的范围和多样化的同时，实现数据共享。

附图说明

图1为本发明一种导入人工智能超深度学习用于语音图像识别的方法的处理流程示意图。

图2为本发明一种导入人工智能超深度学习用于语音图像识别的方法的数据信号连接关系结构示意图。

图3为本发明一种导入人工智能超深度学习用于语音图像识别的方法的图像识别模块的系统架构结构示意图。

图4为本发明一种导入人工智能超深度学习用于语音图像识别的方法的语音识别模块的系统架构结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1-4所示，一种导入人工智能超深度学习用于语音图像识别的模块，包括触摸屏、图像识别模块、语音识别模块和CORTEX-A75处理器，所述触摸屏具有摄像头、麦克风、程序储存器、随机储存器数据、图像识别模块、语音识别模块和CORTEX-A75处理器，所述图像识别模块包括摄像控制模块和图像对比模块，所述摄像控制模块包括图像处理模块和图片传输模块，所述语音识别模块包括预处理系统、特征提取系统和模式匹配系统，且模式匹配系统内具有语言模型库，所述预处理系统电连接特征提取系统，且特征提取系统与模式匹配系统数据连接，实现语音数据识别，所述图像识别模块电连接摄像头，所述语音识别模块电连接麦克风，所述图像识别模块和语音识别模块分别与CORTEX-A75处理器数据连接，且CORTEX-A75处理器与程序储存器和随机储存器数据连接，实现图像数据和语音数据的处理和存储，所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接。

一种导入人工智能超深度学习用于语音图像识别的方法，具体识别方法如下：

图像识别步骤：通过触摸屏内的图像识别模块将摄像头拍摄的图片通过图像处理模块进行处理，且处理后传输至图像对比模块，通过CORTEX-A75处理器数据连接对其进行信息处理和传输，且CORTEX-A75处理器通过程序储存器内的数据进行检索对比并产生第一对比指令或第二对比指令，所述第一对比指令为程序储存器中至少有一项信息与处理后传输至图像对比模块对比后的结果对应，且根据第一对比指令的结果进入结果相应的图片应用系统中至少有一项信息与处理后传输至图像对比模块的图片数据参数进行对比得到识别结果的位置，且继续对其进行操作，操作后选择退出该系统；所述第二对比指令为程序储存器中不具有任意一项信息与处理后传输至图像对比模块对比后的结果对应，根据第二对比指令的结果进入创建新图片信息对话框，且产生确认创建指令和取消指令，所述确认创建指令将通过CORTEX-A75处理器在储存器中创建处理后传输至图像对比模块对比后的结果对应的位置信息；所述取消指令为取消操作，且退出该系统。

语音识别步骤：通过触摸屏内的语音识别模块将麦克风输入的语音信号通过预处理系统进行矫正处理实现语音信号数字化，再由特征提取系统进行特征分析，抽取可反映语音本质的特征参数，形成矢量序列，且通过模式匹配系统由CORTEX-A75处理器对语言模型库内的声学模版参数进行对比得到识别结果，且CORTEX-A75处理器通过程序储存器内的数据进行检索对比并产生第一对比指令或第二对比指令，所述第一对比指令的为程序储存器中至少有一项信息与语言模型库内的声学模版参数进行对比得到识别结果对应，且根据第一对比指令的结果进入结果相应的应用系统中至少有一项信息处理与语言模型库内的声学模版参数进行对比得到识别结果的位置，且继续对其进行操作，操作后选择退出该系统；所述第二对比指令为程序储存器中不具有任意一项信息与语音本质的特征参数的结果对应，根据第二对比指令的结果进入创建新语音信息对话框，且产生确认创建指令和取消指令，所述确认创建指令将通过CORTEX-A75处理器在储存器中创建语音本质的特征参数的结果对应的语音信息；所述取消指令为取消操作，且退出该系统。

图像识别步骤：通过触摸屏内的图像识别模块将摄像头拍摄的图片通过图像处理模块进行处理，且处理后传输至图像对比模块，通过CORTEX-A75处理器数据连接对其进行信息处理和传输，且CORTEX-A75处理器通过程序储存器内的数据进行检索对比并产生第一对比指令或第二对比指令，所述第一对比指令的为程序储存器中至少有一项信息与处理后传输至图像对比模块对比后的结果对应，且根据第一对比指令的结果进入图片应用系统中至少有一项信息与处理后传输至图像的位置，且继续对其进行操作，操作后选择退出该系统；所述第二对比指令为程序储存器中不具有任意一项信息与处理后传输至图像对比模块对比后的结果对应，根据第二对比指令的结果进入创建新图片信息对话框，且产生确认创建指令和取消指令，所述确认创建指令将通过CORTEX-A75处理器在储存器中创建处理后传输至图像对比模块对比后的结果对应的位置信息；所述取消指令为取消操作，且退出该系统。

其中，所述麦克风具有多组，所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接，可定期实现更新程序储存器、随机储存器的资源数据和语言模型库，进而扩大人员图像语音检索的范围，且利用CORTEX-A75处理器将处理后的图片语音通过网络控制器上传于云端服务器，实现数据共享。

其中，所述预处理系统内具有反混叠失真滤波器、预加重器、端点检测模块和噪声滤波器。

其中，所述特征提取系统具有LPC、LPCC、MFCC和ASCC。

本发明的工作原理及使用流程：可通过录入的图像或语音信号快速进入对应的信息数据的位置，便于人员通过本发明快速识别相应信息，且再识别过程中，可对录入的语音信号进行减噪滤波处理，提高识别的精确性，能实现数据不断更新和上传云端，在扩大检索的范围和多样化的同时，实现数据共享。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种导入人工智能超深度学习用于语音图像识别的方法,导入人工智能超深度学习用于语音图像识别模块，包括触摸屏、图像识别模块、语音识别模块和CORTEX-A75处理器，其特征在于：所述触摸屏具有摄像头、麦克风、程序储存器、随机储存器数据、图像识别模块、语音识别模块和CORTEX-A75处理器，所述图像识别模块包括摄像控制模块和图像对比模块，所述摄像控制模块包括图像处理模块和图片传输模块，所述语音识别模块包括预处理系统、特征提取系统和模式匹配系统，且模式匹配系统内具有语言模型库，所述预处理系统电连接特征提取系统，且特征提取系统与模式匹配系统数据连接，实现语音数据识别，所述图像识别模块电连接摄像头，所述语音识别模块电连接麦克风，所述图像识别模块和语音识别模块分别与CORTEX-A75处理器数据连接，且CORTEX-A75处理器与程序储存器和随机储存器数据连接，实现图像数据和语音数据的处理和存储，所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接；

具体识别方法如下：

图像识别步骤：通过触摸屏内的图像识别模块将摄像头拍摄的图片通过图像处理模块进行处理，且处理后传输至图像对比模块，通过CORTEX-A75处理器数据连接对其进行信息处理和传输，且CORTEX-A75处理器通过程序储存器内的数据进行检索对比并产生第一对比指令或第二对比指令，所述第一对比指令为程序储存器中至少有一项信息与处理后传输至图像对比模块对比后的结果对应，且根据第一对比指令的结果进入结果相应的图片应用系统中至少有一项信息与处理后传输至图像对比模块的图片数据参数进行对比得到识别结果的位置，且继续对其进行操作，操作后选择退出该系统；所述第二对比指令为程序储存器中不具有任意一项信息与处理后传输至图像对比模块对比后的结果对应，根据第二对比指令的结果进入创建新图片信息对话框，且产生确认创建指令和取消指令，所述确认创建指令将通过CORTEX-A75处理器在储存器中创建处理后传输至图像对比模块对比后的结果对应的位置信息；所述取消指令为取消操作，且退出该系统；

2.根据权利要求1所述的一种导入人工智能超深度学习用于语音图像识别的方法，其特征在于：所述麦克风具有多组，所述CORTEX-A75处理器通过网络控制器与云端服务器数据连接，可定期实现更新程序储存器、随机储存器的资源数据和语言模型库，进而扩大人员图像语音检索的范围，且利用CORTEX-A75处理器将处理后的图片语音通过网络控制器上传于云端服务器，实现数据共享。

3.根据权利要求1所述的一种导入人工智能超深度学习用于语音图像识别的方法，其特征在于：所述预处理系统内具有反混叠失真滤波器、预加重器、端点检测模块和噪声滤波器。

4.根据权利要求1所述的一种导入人工智能超深度学习用于语音图像识别的方法，其特征在于：所述特征提取系统具有LPC、LPCC、MFCC和ASCC。