CN116884437B

CN116884437B - 基于人工智能的语音识别处理器

Info

Publication number: CN116884437B
Application number: CN202311145762.6A
Authority: CN
Inventors: 周丽宁
Original assignee: Beijing Huilang Times Technology Co Ltd
Current assignee: Beijing Huilang Times Technology Co Ltd
Priority date: 2023-09-07
Filing date: 2023-09-07
Publication date: 2023-11-17
Anticipated expiration: 2043-09-07
Also published as: CN116884437A

Abstract

本发明公开了基于人工智能的语音识别处理器，涉及语音识别技术领域，包括数据采集模块、数据预处理模块、特征提取模块、特征分析模块、判定模块、预警模块和显示模块；解决了一些不法分子利用语音和网络信息来生成与用户相似的仿真语音，并且通过仿真语音欺骗设备达到控制设备开启目的的技术问题：通过人声声纹特征对判定声音音频进行初步验证，然后再通过人声共鸣特征对判定声音音频进行验证，将人声共鸣特征和人声声纹特征结合起来，可以增强声音识别的准确性和安全性，可以有效防止不法分子利用AI仿声技术欺骗设备，提高了声音识别的准确性和可靠性，防止不法分子利用进行AI仿声技术进行欺骗和冒充。

Description

基于人工智能的语音识别处理器

技术领域

本发明涉及语音识别技术领域，具体涉及基于人工智能的语音识别处理器。

背景技术

随着科技的发展，智能语音识别技术越来越广泛应用于各个领域。智能语音识别可以通过识别人的声音特征进行身份验证，并且声纹识别具有不易仿冒和无需物理接触的优点，因此在替代传统的密码、指纹和面部识别方面具有潜力；

随着AI声音合成技术的进步，一些不法分子利用语音和网络信息来生成与用户相似的仿真语音，并且通过仿真语音欺骗设备达到控制设备开启目的（如声纹识别门禁系统，声纹识别开启的电子设备等），导致控制设备被不法分子开启，造成一定程度的风险后果，基于此，提出一种基于人工智能的语音识别处理器。

发明内容

本发明的目的在于提供基于人工智能的语音识别处理器，解决了一些不法分子利用语音和网络信息来生成与用户相似的仿真语音，并且通过仿真语音欺骗设备达到控制设备开启目的的技术问题。

本发明的目的可以通过以下技术方案实现：

基于人工智能的语音识别处理器，包括：

数据采集模块，用于对用户的样本声音音频进行获取，并将其发送至数据预处理模块；

数据预处理模块，用于对用户的样本声音音频进行降噪、去除静音段和均衡化音量操作，同时将进行预处理后的样本声音音频发送至特征提取模块；

特征提取模块，用于对进行预处理后的样本声音音频中的用户声纹特征和人声共鸣特征进行提取，并将其发送至特征分析模块；

特征分析模块，用于对用户声纹特征和人声共鸣特征进行量化分析，进而得到标准声纹特征向量和标准共鸣特征向量，并将其发送至判定模块；

用户声纹特征包括音调特征、频谱峰值和谐波特征，人声共鸣特征是指用户声音频率在喉咙、口腔和鼻腔中的共振效应，即用户声音频率在声道中的共振峰特征和共振频率特征；

判定模块，用于对判定声音音频进行获取，并通过对判定声音音频的用户声纹特征和人声共鸣特征分析，获得判定声音音频对应的判定声纹特征向量和判定共鸣特征向量，再将判定声纹特征向量和标准声纹特征向量进行相似度计算，将判定共鸣特征向量和标准共鸣特征向量进行相似度计算，然后根据相似度计算结果判定生成仿声标识，同时将仿声标识传输至预警模块和显示模块。

作为本发明进一步的方案：特征提取模块包括人声共鸣特征提取单元和用户声纹特征提取单元；

用户声纹特征提取单元，用于对样本声音音频中的用户声纹特征进行提取，人声共鸣特征提取单元，用于对样本声音音频中的人声共鸣特征进行提取，对用户声纹特征进行提取的具体方式为：

将预处理后的样本声音音频均等分割成n个短时帧音频，对n个短时帧音频中的音调特征、频谱峰值和谐波特征进行提取并将其进行量化处理后，分别标记为A₁、A₂、……A_n，B₁、B₂、……B_n和C₁、C₂、……C_n；

对人声共鸣特征进行提取的具体方式为：

根据喉咙、口腔和鼻腔对不同频率范围的影响，使用滤波器或其他频率域处理方法来分离不同频率范围的共振特征，同时获得n个短时帧音频中喉咙的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E1₁、E1₂、……E1_n和F1₁、F1₂、……F1_n；

获得n个短时帧音频中口腔的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E2₁、E2₂、……E2_n和F2₁、F2₂、……F2_n；

获得n个短时帧音频中鼻腔的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E3₁、E3₂、……E3_n和F3₁、F3₂、……F3_n。

作为本发明进一步的方案：特征分析模块包括用户声纹特征分析单元和人声共鸣特征分析单元，用户声纹特征分析单元，用于对用户声纹特征中的音调特征、频谱峰值和谐波特征进行量化分析，并根据分析结果获得标准声纹特征向量，获得标准声纹特征向量的具体方式为：

J1：对n个短时帧音频中的音调特征A₁、A₂、……A_n，频谱峰值B₁、B₂、……B_n和谐波特征值C₁、C₂、……C_n，分别进行均值化处理，进而获得音调特征、频谱峰值和谐波对应的标准特征值，并将其分别标记为Ap、Bp和Cp；

J2：将音调特征、频谱峰值和谐波对应的标准特征值转换为向量形式，同时将其组合成一个特征向量，形成声标准声纹特征向量，并将其标记为SW（Ap，Bp，Cp）。

作为本发明进一步的方案：人声共鸣特征分析单元，用于对人声共鸣特征中喉咙、口腔和鼻腔对应的共振峰特征和共振谷特征进行量化分析，并根据分析结果获得标准共鸣特征向量，获得标准共鸣特征向量的具体方式为：

K1：将n个短时帧音频中喉咙的共振峰特征E1₁、E1₂、……E1_n和共振谷特征F1₁、F1₂、……F1_n，分别进行均值化处理，进而获得喉咙的共振峰特征和共振谷特征对应的标准特征值，并将其分别标记为E1p和F1p；

将n个短时帧音频中口腔的共振峰特征E2₁、E2₂、……E2_n和共振谷特征F2₁、F2₂、……F2_n，分别进行均值化处理，进而获得口腔的共振峰特征和共振谷特征对应的标准特征值，并将其分别标记为E2p和F2p；

将n个短时帧音频中鼻腔的共振峰特征E3₁、E3₂、……E3_n和共振谷特征F3₁、F3₂、……F3_n，分别进行均值化处理，进而获得鼻腔的共振峰特征和共振谷特征对应的标准特征值，并将其分别标记为E3p和F3p；

K2：通过公式（E1p+E2p+E3p）×β1=Zp，计算获得人声共鸣特征的共振峰计算值Zp，其中β1为修正系数；

通过公式（F1p+F2p+F3p）×β2=Gp，计算获得人声共鸣特征的共振谷计算值Gp，其中β2为修正系数；

K3：将共振峰计算值和共振谷计算值转换为向量形式，同时将其组合成一个特征向量，形成共标准共鸣特征向量，并将其标记为WH（Zp，Gp）。

作为本发明进一步的方案：判定生成仿声标识的具体方式为：

L1：将判定声音音频的用户声纹特征中的音调特征、频谱峰值和谐波特征分别进行量化处理后组合成一个判定声纹特征向量，标记为UW（U1，U2，U3）；

将判定声音音频的人声共鸣特征中的共振峰特征和共振频率分别进行量化处理后组合成一个判定共鸣特征向量，标记为UH（U4，U5）；

L2：通过公式，计算获得标准声纹特征向量SW（Ap，Bp，Cp）和判定声纹特征向量YD（U1，U2，U3）之间的相似度UHSW；

当UHSW≥Y1时，则通过公式，计算获得标准共鸣特征向量WH（Zp，Gp）和判定鸣特征向量UH（U4，U5）之间的相似度WHUH；

当WHUH＜Y2时，则生成仿声标识，此处，Y1和Y2均为预设值。

作为本发明进一步的方案：预警模块，用于对仿声标识和进行接收，并根据仿声标识播放对应的语音警示信息。

作为本发明进一步的方案：显示模块，用于对仿声标识进行显示。

作为本发明进一步的方案：在步骤L2中通过对判定特征向量和判定共鸣特征向量与标准特征向量和标准共鸣特征向量之间进行分析，并根据分析结果判定生成识别失败标识或识别成功标识，并将其发送至控制模块，生成识别失败标识和识别成功标识的具体方式为：

当UHSW＜Y1时，则生成识别失败标识；

当WHUH≥Y2时，则生成识别成功标识。

作为本发明进一步的方案：控制模块，用于对识别失败标识和识别成功标识接收。

本发明的有益效果：

本发明，首先通过人声声纹特征对判定声音音频进行初步验证，然后再通过人声共鸣特征对判定声音音频进行验证，将人声共鸣特征和人声声纹特征结合起来，可以增强声音识别的准确性和安全性；

同时由于人体的共鸣腔体不同，人的声音在共鸣腔体中会产生特定的频谱特征，同时由于不法分子无法利用AI仿声技术模仿声音的共鸣特征，进而通过结合这两个特征进行对声音进行识别，可以有效防止不法分子利用AI仿声技术欺骗设备，提高了声音识别的准确性和可靠性，防止不法分子利用进行AI仿声技术进行欺骗和冒充。

附图说明

下面结合附图对本发明作进一步的说明。

图1是本发明基于人工智能的语音识别处理器的系统框架结构示意图；

图2是本发明基于人工智能的语音识别处理器的方法框架结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例一

请参阅图1-图2所示，本发明为基于人工智能的语音识别处理器，包括，数据采集模块、数据预处理模块、特征提取模块、特征分析模块、判定模块、预警模块和显示模块；

数据采集模块，用于对用户的样本声音音频进行获取，并将其发送至数据预处理模块，样本声音音频是通过麦克风或其他录音设备进行采集获得的；

数据预处理模块，用于对用户的样本声音音频进行预处理，以提高后续对样本声音音频的质量和准确性，同时将进行预处理后的样本声音音频发送至特征提取模块；

预处理的具体步骤包括对样本声音音频进行降噪、去除静音段和均衡化音量操作处理，此处对样本声音音频进行降噪、去除静音段和均衡化音量的预处理操作均属于现有且成熟的技术，因此在此不做赘述；

用户声纹特征是指用户在发声过程中产生的独特声音特征，类似于指纹或人脸的生物特征，用户声纹特征主要包括音调特征、频谱峰值和谐波特征；

人声共鸣特征是指用户声音频率在喉咙、口腔和鼻腔中的共振效应，即用户声音频率在声道中的共振峰特征和共振频率特征：

特征提取模块包括人声共鸣特征提取单元和用户声纹特征提取单元；

用户声纹特征提取单元，用于对样本声音音频中的用户声纹特征进行提取，并将其发送至特征分析模块，对用户声纹特征进行提取的具体方式为：

将预处理后的样本声音音频均等分割成n个短时帧音频，此处，n≧1，单个短时帧音频的时长优选为50毫秒；

对n个短时帧音频中的音调特征、频谱峰值和谐波特征进行提取并将其进行量化处理后，并分别标记为A₁、A₂、……A_n，B₁、B₂、……B_n和C₁、C₂、……C_n；

通过分析n个短时帧音频中的基频或音调轮廓，获得声纹的音调特征；

通过将n个短时帧音频转换为频域表示，并对其的频谱峰值继续提取，将样将n个短时帧音频转换为频域的方法为傅里叶变换或小波变换方法，傅里叶变换或小波变换方法均属于现有且成熟的技术，因此在此不做赘述；

通过自相关函数或相关滤波器，分析n个短时帧音频的谐波分布特征，提取声纹的谐波特征；

人声共鸣特征提取单元，用于对样本声音音频中的人声共鸣特征进行提取，并将其发送至特征分析模块，对人声共鸣特征进行提取的具体方式为：

由于喉咙、口腔和鼻腔的共振特征是不同的，因为它们对声音的共振效应是通过不同的声道实现的，喉咙主要影响低频分量，口腔主要影响中频分量，鼻腔主要影响高频分量；

进而根据喉咙、口腔和鼻腔对不同频率范围的影响，使用滤波器或其他频率域处理方法来分离不同频率范围的共振特征；

使用低通滤波器或者采用频率截断的方式将高频部分去除，保留低频成分对于喉咙的特征进行提取，同时获得n个短时帧音频中喉咙的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E1₁、E1₂、……E1_n和F1₁、F1₂、……F1_n；

使用带通滤波器选择中心频率在中频范围内的频率成分，保留中频成分对于口腔的特征进行提取，同时获得n个短时帧音频中口腔的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E2₁、E2₂、……E2_n和F2₁、F2₂、……F2_n；

使用高通滤波器或者采用频率截断的方式将低频部分去除，保留高频成分对于鼻腔的特征进行提取，同时获得n个短时帧音频中鼻腔的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E3₁、E3₂、……E3_n和F3₁、F3₂、……F3_n；

特征分析模块包括用户声纹特征分析单元和人声共鸣特征分析单元；

用户声纹特征分析单元，用于对用户声纹特征中的音调特征、频谱峰值和谐波特征进行量化分析，并根据分析结果获得标准声纹特征向量，获得标准声纹特征向量的具体方式为：

J2：将音调特征、频谱峰值和谐波对应的标准特征值转换为向量形式，同时将其组合成一个特征向量，形成声标准声纹特征向量，并将其标记为SW（Ap，Bp，Cp）；

人声共鸣特征分析单元，用于对人声共鸣特征中喉咙、口腔和鼻腔对应的共振峰特征和共振谷特征进行量化分析，并根据分析结果获得标准共鸣特征向量，获得标准共鸣特征向量的具体方式为：

K2：通过公式（E1p+E2p+E3p）×β1=Zp，计算获得人声共鸣特征的共振峰计算值Zp，其中β1为修正系数，具体数值由相关工作人员进行拟定；

通过公式（F1p+F2p+F3p）×β2=Gp，计算获得人声共鸣特征的共振谷计算值Gp，其中β2为修正系数，具体数值由相关工作人员进行拟定；

K3：将共振峰计算值和共振谷计算值转换为向量形式，同时将其组合成一个特征向量，形成共标准共鸣特征向量，并将其标记为WH（Zp，Gp）；

判定模块，用于对判定声音音频进行获取，并通过对判定声音音频的用户声纹特征和人声共鸣特征分析，获得判定声音音频对应的判定声纹特征向量和判定共鸣特征向量，再将判定声纹特征向量和标准声纹特征向量进行相似度计算，将判定共鸣特征向量和标准共鸣特征向量进行相似度计算，然后根据相似度计算结果判定生成仿声标识，同时将仿声标识传输至预警模块和显示模块，判定生成仿声标识的具体方式为：

此处判定声音音频指代为；

当WHUH＜Y2时，则生成仿声标识；

此处，Y1和Y2均为预设值，具体数值由相关工作人员进行拟定；

预警模块，用于对仿声标识和进行接收，并根据仿声标识播放对应的语音警示信息，对操作人员进行警告；

语音警示信息为提前录入的语音录音通过播放模块进行播放，为现有且成熟的技术在此不做赘述；

显示模块，用于对仿声标识进行显示，以提醒相关人员疑似出现可疑人员试图通过仿真语音欺骗设备以达到控制设备开启的目的，提醒相关人员及时对设备进行查看和管理。

实施例二

作为本发明的实施例二，本申请在具体实施时，相较于实施例一，本实施例的技术方案与实施例一的区别仅在于本实施例中步骤L2中通过对判定声音音频进行获取，并通过对判定声音音频的用户声纹特征和人声共鸣特征的分析，获得判定声音音频对应的判定特征向量和判定共鸣特征向量，将判定特征向量和标准特征向量进行相似度计算，判定共鸣特征向量和标准共鸣特征向量进行相似度计算，并根据分析结果判定生成识别失败标识或识别成功标识，同时将其发送至控制模块，生成识别失败标识和识别成功标识的具体方式为：

当UHSW＜Y1时，则生成识别失败标识；

当WHUH≥Y2时，则生成识别成功标识；

控制模块，用于对识别失败标识和识别成功标识接收，当接收到识别成功标识时，则通过控制模块控制对应设备进行开启，当接收到识别失败标识时，则控制模块不做操作。

实施例三

作为本发明的实施例三，本申请在具体实施时，相较于实施例一和实施例二，本实施例的技术方案是在于将上述实施例一和实施例二和的方案进行组合实施。

本发明的工作原理：对用户的样本声音音频进行获取，然后对用户的样本声音音频进行降噪、去除静音段和均衡化音量操作，以提高后续对样本声音音频的质量和准确性，然后对进行预处理后的样本声音音频中的用户声纹特征和人声共鸣特征进行提取，对用户声纹特征和人声共鸣特征进行量化分析，进而得到标准声纹特征向量和标准共鸣特征向量，然后对判定声音音频进行获取，并根据判定声音音频的用户声纹特征和人声共鸣特征分析获得判定声音音频对应的判定声纹特征向量和判定共鸣特征向量，将判定声纹特征向量和标准声纹特征向量进行相似度计算，将判定共鸣特征向量和标准共鸣特征向量进行相似度计算，然后根据相似度计算结果判定生成仿声标识，通过预警模块根据仿声标识播放对应的语音警示信息，对操作人员进行警示，通过显示模块以提醒相关人员疑似出现可疑人员试图通过仿真语音欺骗设备以达到控制设备开启的目的，提醒相关人员及时对设备进行查看和管理。

上述公式均是去量纲取其数值计算，公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式，公式中的预设参数以及阈值选取由本领域的技术人员根据实际情况进行设置。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.基于人工智能的语音识别处理器，其特征在于，包括：

数据预处理模块，用于对用户的样本声音音频进行降噪、去除静音段和均衡化音量操作处理，同时将进行处理后的样本声音音频发送至特征提取模块；

判定模块，用于对判定声音音频进行获取，并通过对判定声音音频的用户声纹特征和人声共鸣特征分析，获得判定声音音频对应的判定声纹特征向量和判定共鸣特征向量，再将判定声纹特征向量和标准声纹特征向量进行相似度计算，将判定共鸣特征向量和标准共鸣特征向量进行相似度计算，然后根据相似度计算结果判定生成仿声标识，同时将仿声标识传输至预警模块和显示模块；

用户声纹特征提取单元，用于对样本声音音频中的用户声纹特征进行提取，人声共鸣特征提取单元，用于对样本声音音频中的人声共鸣特征进行提取，对用户声纹特征进行提取的具体方式为：将预处理后的样本声音音频均等分割成n个短时帧音频，对n个短时帧音频中的音调特征、频谱峰值和谐波特征进行提取并将其进行量化处理后，并分别标记为A₁、A₂、……、A_n，B₁、B₂、……、B_n和C₁、C₂、……、C_n，n≧1；

对人声共鸣特征进行提取的具体方式为：根据喉咙、口腔和鼻腔对不同频率范围的影响，使用滤波器或其他频率域处理方法来分离不同频率范围的共振特征，进而获得n个短时帧音频中喉咙的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E1₁、E1₂、……、E1_n和F1₁、F1₂、……、F1_n；获得n个短时帧音频中口腔的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E2₁、E2₂、……、E2_n和F2₁、F2₂、……、F2_n；获得n个短时帧音频中鼻腔的共振峰特征和共振谷特征，并将其进行量化处理后，分别标记为E3₁、E3₂、……、E3_n和F3₁、F3₂、……、F3_n；

特征分析模块包括用户声纹特征分析单元和人声共鸣特征分析单元，用户声纹特征分析单元，用于对用户声纹特征中的音调特征、频谱峰值和谐波特征进行量化分析，并根据分析结果获得标准声纹特征向量，获得标准声纹特征向量的具体方式为：J1：对n个短时帧音频中的音调特征A₁、A₂、……、A_n，频谱峰值B₁、B₂、……、B_n和谐波特征值C₁、C₂、……、C_n，分别进行均值化处理，进而获得音调特征、频谱峰值和谐波对应的标准特征值，并将其分别标记为Ap、Bp和Cp；

J2：将音调特征、频谱峰值和谐波对应的标准特征值转换为向量形式，同时其组合成一个特征向量，形成声标准声纹特征向量，并将其标记为SW（Ap，Bp，Cp）；

K1：将n个短时帧音频中喉咙的共振峰特征E1₁、E1₂、……、E1_n和共振谷特征F1₁、F1₂、……、F1_n，分别进行均值化处理，进而获得喉咙的共振峰特征和共振谷特征对应的标准特征值，并将其分别标记为E1p和F1p；

将n个短时帧音频中口腔的共振峰特征E2₁、E2₂、……、E2_n和共振谷特征F2₁、F2₂、……、F2_n，分别进行均值化处理，进而获得口腔的共振峰特征和共振谷特征对应的标准特征值，并将其分别标记为E2p和F2p；

将n个短时帧音频中鼻腔的共振峰特征E3₁、E3₂、……、E3_n和共振谷特征F3₁、F3₂、……、F3_n，分别进行均值化处理，进而获得鼻腔的共振峰特征和共振谷特征对应的标准特征值，并将其分别标记为E3p和F3p；K2：通过公式（E1p+E2p+E3p）×β1=Zp，计算获得人声共鸣特征的共振峰计算值Zp，其中β1为修正系数；通过公式（F1p+F2p+F3p）×β2=Gp，计算获得人声共鸣特征的共振谷计算值Gp，其中β2为修正系数；K3：将共振峰计算值和共振谷计算值转换为向量形式，同时将其组合成一个特征向量，形成共标准共鸣特征向量，并将其标记为WH（Zp，Gp）；

判定生成仿声标识的具体方式为：L1：将判定声音音频的用户声纹特征中的音调特征、频谱峰值和谐波特征分别进行量化处理后组合成一个判定声纹特征向量，标记为UW（U1，U2，U3）；将判定声音音频的人声共鸣特征中的共振峰特征和共振频率分别进行量化处理后组合成一个判定共鸣特征向量，标记为UH（U4，U5）；L2：通过公式，计算获得标准声纹特征向量SW（Ap，Bp，Cp）和判定声纹特征向量YD（U1，U2，U3）之间的相似度UHSW；当UHSW≥Y1时，则通过公式/>，计算获得标准共鸣特征向量WH（Zp，Gp）和判定鸣特征向量UH（U4，U5）之间的相似度WHUH；当WHUH＜Y2时，则生成仿声标识，此处，Y1和Y2均为预设值。

2.根据权利要求1所述的基于人工智能的语音识别处理器，其特征在于，预警模块，用于对仿声标识和进行接收，并根据仿声标识播放对应的语音警示信息。

3.根据权利要求2所述的基于人工智能的语音识别处理器，其特征在于，显示模块，用于对仿声标识进行显示。

4.根据权利要求3所述的基于人工智能的语音识别处理器，其特征在于，所述步骤L2中通过对判定声音音频进行获取，并通过对判定声音音频的用户声纹特征和人声共鸣特征的分析，获得判定声音音频对应的判定特征向量和判定共鸣特征向量，将判定特征向量和标准特征向量进行相似度计算，判定共鸣特征向量和标准共鸣特征向量进行相似度计算，并根据分析结果判定生成识别失败标识或识别成功标识，同时将其发送至控制模块，生成识别失败标识和识别成功标识的具体方式为：

当UHSW＜Y1时，则生成识别失败标识；

当WHUH≥Y2时，则生成识别成功标识。

5.根据权利要求4所述的基于人工智能的语音识别处理器，其特征在于，控制模块，用于对识别失败标识和识别成功标识接收。