CN109243469B

CN109243469B - 一种数字化检测信息采集系统

Info

Publication number: CN109243469B
Application number: CN201711331154.9A
Authority: CN
Inventors: 程爽
Original assignee: AVIC Beijing Precision Engineering Institute for Aircraft Industry
Current assignee: AVIC Beijing Precision Engineering Institute for Aircraft Industry
Priority date: 2017-12-13
Filing date: 2017-12-13
Publication date: 2021-12-10
Anticipated expiration: 2037-12-13
Also published as: CN109243469A

Abstract

本发明公开了一种数字化检测信息采集系统。包括：信息采集模块、预定义语音样本库模块、语音判断自学习模块，所述信息采集模块，用于指定用户的声音认证信息（用于声纹比对）采集，检测名称及数据的发音和内部简称信息采集，检测过程中的检测数据采集；所述预定义语音样本库模块，用于存储人员认证语音，检测名称的多种发音、内部简称，数据的发音方式和内部简称等信息；所述语音判断自学习模块，用于提取登录人员认证声音及预定义语音样本库中音频样本，对采集的音频数据进行模糊语音识别。本发明所述的检测信息采集系统可以快速准确的将音频数据采集到上层系统，显著提高现场检测效率。

Description

一种数字化检测信息采集系统

技术领域

本发明涉及采集系统领域，具体地说是一种数字化检测信息采集系统。

背景技术

数字化检测技术的应用，使得生产现场的数显量具、测量机、粗糙度仪等数字化测量仪器的检测数据可以通过数据传输接口直接发送给上层数据采集系统。但是，在实际生产中存在着大量不具备数据输出接口的检测设备，这就造成了这种量具检测出的结果只能通过人工录入的方式，反馈给上层数据采集系统。由于这种检测方式在生产现场存在广、数据量大、且录入操作繁琐，所以严重影响了生产效率。那么如何快速准确的将这些数据采集到上层系统，成为提高现场检测效率的关键技术问题。

发明内容

本发明的目的就是解决以上技术中存在的问题，并为此提供一种数字化检测信息采集系统。

为实现以上技术目的，本发明技术方案如下：

一种数字化检测信息采集系统，包括：

信息采集模块，用于指定用户的声音认证信息采集用于声纹比对，检测名称及数据的发音和内部简称信息采集，检测过程中的音频检测数据采集；

预定义语音样本库模块，用于存储人员认证语音，检测名称的多种发音、内部简称，数据的发音方式和内部简称等信息；

语音判断自学习模块，用于提取登录人员认证声音及预定义语音样本库中音频样本，对采集的音频数据进行模糊语音识别。

作为优选，所述信息采集模块采集检测过程中的检测数据，包括：

获取预定义语音样本库模块生成登录人员声纹的特征图；

以生成的声纹特征图为标准特征图，从采集的音频信息中提取符合特征的信息。

作为优选，所述预定义语音样本库模块检验名称的多种发音包括：检验名称的普通话发音和用户所在地方言发音。

作为优选，所述预定义语音样本库模块检验尺寸的内部简称包括：检验尺寸的通用简称和用户特设的名称。

作为优选，所述语音判断自学习模块，用于提取检测尺寸名称和内部简称发音，通过模糊匹配算法，生成特征图，提取音频数据生成检测结果。

作为优选，上述检测信息采集系统还包括人员信息库、检验规程生成模块、信息显示模块，其中

所述人员信息库，用于存储检测人员基本信息，包括名称、岗位等信息；

所述检验规程生成模块，用于生成电子检验规程或提取其他软件数据库中的电子检验规程；

所述信息显示模块，用于显示依据电子规程生成检验单及采集到的检测数据，并语音播报检测结果。

作为优选，所述信息采集模块基于终端自带的麦克风输入声音。

作为优选，所述终端选自平板电脑、笔记本电脑或台式电脑。

一种实现系统对于某尺寸数据多次检测的数据采集方法，其特征在于采用上面所述的检测信息采集系统，通过预设自定义标志信息，实现数据采集的开始、结束、多次录入。

本发明所述的检测信息采集系统克服了现有技术中在生产现场存在广、数据量大、且录入操作繁琐，生产效率地下的问题，可以快速准确的将音频数据采集到上层系统，显著提高现场检测效率。

附图说明

图1是本发明一种数字化检测信息采集系统架构示意图；

图2是本发明中的信息采集流程；

图3是本发明中的语音采集降噪流程；

图4是本发明中的重复检测采集流程。

具体实施方式

为了使本发明更容易被清楚理解，以下结合附图和实施例对本发明的技术方案作以详细说明。

本发明实施例提供一种基于语音识别的数字化检测检测信息采集系统，系统架构如图1所示。该系统可以安装在移动终端，比如手机、穿戴式智能设备、平板电脑、和/或笔记本电脑等设备中，可以单独进行信息采集，也可以与生产过程执行系统MES（ManufacturingExecution System）、过程控制软件SPC（Statistical Process Control）及数字化检测软件进行集成。

实施例一

以该系统集成在数字化检测软件中并安装在平板电脑上为例。系统采集信息流程如图2所示，提取数字化检测软件的电子检验规程，判断检验规程中的信息录入方式，是语音录入则激活CPU开启进程并打开麦克风(MIC，Microphone)，实时采集音频数据，通过CPU对音频数据进行模糊语音识别，当存在有效数据时，由语音判断自学习模块进行语义分析，得到有效数据，并通过显示模块显示和播报，用户核对无误后用语音确认，完成一次的信息录入。

需说明的是，实时采集音频数据开启方式为，根据模糊聚类分析建立模糊聚类神经网络；将所述模糊聚类神经网络作为概率密度函数的估计器，对所述音频数据包含采集开始信息的概率进行预测；若预测结果指示概率大于等于设定值，则生成指示存在采集信息的模糊语音识别结果；若预测结果指示概率小于设定值，则生成指示不存在采集信息的模糊语音识别结果。

需说明的是，为了准确提取到有用信息，需要滤除目标声音外的其他音频信息，即降噪。具体做法如图3所示，根据登录人员信息从预定义语音样本库获取该人员声纹的特征图，得到标准特征图，分析采集到的音频信息中各声音的特征图，得到待匹配特征图，匹配对比，滤除特征不符合的音频信息，得到希望被采集的音频信息。

需说明的是，自学习模块进行语义分析的方式为，首先模块将预定义语音样本库中已录入的检测名称发音和内部简称构造模糊矩阵，并根据隶属度来确定聚类关系，用模糊数学计算样本之间的模糊关系量，达到准确客观的聚类。其中，分类就是将数据集分成多个类或簇，使得各个类之间的数据差别应尽可能大，类内之间的数据差别应尽可能小。在识别音频数据信息时，可以使用模糊匹配算法，结合检测尺寸名称和内部简称发音构造出的模糊矩阵，生成检测名称和数字发音的特征图，并生成采集信息特征图，匹配对比，若结果大于等于预设值，则为数据结果。将得到的有效数据传递给显示模块，显示并提示。

实施例二

以实施例一为基础举例详细说明针对检测中会遇到的几种采集数据方式，如检验人员口误、需要多次采集数据等的流程，如图4所示。

系统在预定义语音样本库中保存几种标志信息，如标志信息采集开始的关键词、标志信息采集结束的关键词、标志信息采集重新开始的关键词、标志取消前测结果的关键词。

系统在采集过程中采集到标志开始的关键词信息，开始语音采集直到采集到结束信号停止采集。过程中，如果采集到取消前测结果的关键词则清除数据，直接重新开始检测。

需说明的是，某些检测数据要求取多次检测的均值或最大最小值，则可以让系统依据电子检验规程中的数据计算方式确定检验数据进行一次录入还是多次录入，及录入的次数。当需要多次录入时，再结束一次检测时，记录当前录入数据的次数，小于预设次数，则继续等待采集音频信息，直到达到检测次数，通过结果计算出需要的结果。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种数字化检测信息采集系统，其特征在于，包括：

信息采集模块，用于指定用户的声音认证信息采集并用于声纹比对，检测名称及数据的发音和内部简称信息采集，检测过程中的音频检测数据采集；采集音频数据开启方式为，根据模糊聚类分析建立模糊聚类神经网络；将所述模糊聚类神经网络作为概率密度函数的估计器，对所述音频数据包含采集开始信息的概率进行预测；

预定义语音样本库模块，用于存储人员认证语音，检测名称的多种发音和内部简称，数据的发音方式和内部简称，检测尺寸的内部简称信息；

语音判断自学习模块，用于提取登录人员认证声音及预定义语音样本库中音频样本，对采集的音频数据进行模糊语音识别；还用于提取检测尺寸、检测名称和内部简称发音，通过模糊匹配算法，生成特征图，提取音频数据生成检测结果；自学习模块进行语义分析的方式为，首先模块将预定义语音样本库中已录入的检测名称发音和内部简称构造模糊矩阵，并根据隶属度来确定聚类关系，用模糊数学计算样本之间的模糊关系量，达到准确聚类；在识别音频数据信息时，使用模糊匹配算法，结合检测尺寸、检测名称和内部简称发音构造出的模糊矩阵，生成检测名称和数字发音的特征图，并生成采集信息特征图，匹配对比。

2.根据权利要求1所述的数字化检测信息采集系统，其特征在于，所述信息采集模块采集检测过程中音频检测数据，包括：

获取预定义语音样本库模块生成登录人员声纹的特征图；

3.根据权利要求1所述的数字化检测信息采集系统，其特征在于，所述预定义语音样本库模块检测名称的多种发音包括：检测名称的普通话发音和用户所在地方言发音。

4.根据权利要求1所述的数字化检测信息采集系统，其特征在于，所述预定义语音样本库模块检测尺寸的内部简称包括：检测尺寸的通用简称和用户特设的名称。

5.根据权利要求1所述的数字化检测信息采集系统，其特征在于，还包括人员信息库、检验规程生成模块、信息显示模块，其中

所述人员信息库，用于存储检测人员基本信息，包括名称、岗位信息；

所述信息显示模块，用于显示依据电子规程生成的检验单及采集到的检测数据，并语音播报检测结果；

所述信息采集模块基于终端自带的麦克风输入声音。

6.根据权利要求1所述的数字化检测信息采集系统，其特征在于，采集系统的终端选自平板电脑、笔记本电脑或台式电脑。

7.一种实现系统对于某尺寸数据多次检测的数据采集方法，其特征在于，采用权利要求1至6任一项所述的数字化检测信息采集系统，通过预设自定义标志信息，实现数据采集的开始、结束、多次录入。