CN109243469B - 一种数字化检测信息采集系统 - Google Patents

一种数字化检测信息采集系统 Download PDF

Info

Publication number
CN109243469B
CN109243469B CN201711331154.9A CN201711331154A CN109243469B CN 109243469 B CN109243469 B CN 109243469B CN 201711331154 A CN201711331154 A CN 201711331154A CN 109243469 B CN109243469 B CN 109243469B
Authority
CN
China
Prior art keywords
detection
information
data
module
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711331154.9A
Other languages
English (en)
Other versions
CN109243469A (zh
Inventor
程爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AVIC Beijing Precision Engineering Institute for Aircraft Industry
Original Assignee
AVIC Beijing Precision Engineering Institute for Aircraft Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AVIC Beijing Precision Engineering Institute for Aircraft Industry filed Critical AVIC Beijing Precision Engineering Institute for Aircraft Industry
Priority to CN201711331154.9A priority Critical patent/CN109243469B/zh
Publication of CN109243469A publication Critical patent/CN109243469A/zh
Application granted granted Critical
Publication of CN109243469B publication Critical patent/CN109243469B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Business, Economics & Management (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种数字化检测信息采集系统。包括:信息采集模块、预定义语音样本库模块、语音判断自学习模块,所述信息采集模块,用于指定用户的声音认证信息(用于声纹比对)采集,检测名称及数据的发音和内部简称信息采集,检测过程中的检测数据采集;所述预定义语音样本库模块,用于存储人员认证语音,检测名称的多种发音、内部简称,数据的发音方式和内部简称等信息;所述语音判断自学习模块,用于提取登录人员认证声音及预定义语音样本库中音频样本,对采集的音频数据进行模糊语音识别。本发明所述的检测信息采集系统可以快速准确的将音频数据采集到上层系统,显著提高现场检测效率。

Description

一种数字化检测信息采集系统
技术领域
本发明涉及采集系统领域,具体地说是一种数字化检测信息采集系统。
背景技术
数字化检测技术的应用,使得生产现场的数显量具、测量机、粗糙度仪等数字化测量仪器的检测数据可以通过数据传输接口直接发送给上层数据采集系统。但是,在实际生产中存在着大量不具备数据输出接口的检测设备,这就造成了这种量具检测出的结果只能通过人工录入的方式,反馈给上层数据采集系统。由于这种检测方式在生产现场存在广、数据量大、且录入操作繁琐,所以严重影响了生产效率。那么如何快速准确的将这些数据采集到上层系统,成为提高现场检测效率的关键技术问题。
发明内容
本发明的目的就是解决以上技术中存在的问题,并为此提供一种数字化检测信息采集系统。
为实现以上技术目的, 本发明技术方案如下:
一种数字化检测信息采集系统,包括:
信息采集模块,用于指定用户的声音认证信息采集用于声纹比对,检测名称及数据的发音和内部简称信息采集,检测过程中的音频检测数据采集;
预定义语音样本库模块,用于存储人员认证语音,检测名称的多种发音、内部简称,数据的发音方式和内部简称等信息;
语音判断自学习模块,用于提取登录人员认证声音及预定义语音样本库中音频样本,对采集的音频数据进行模糊语音识别。
作为优选,所述信息采集模块采集检测过程中的检测数据,包括:
获取预定义语音样本库模块生成登录人员声纹的特征图;
以生成的声纹特征图为标准特征图,从采集的音频信息中提取符合特征的信息。
作为优选,所述预定义语音样本库模块检验名称的多种发音包括:检验名称的普通话发音和用户所在地方言发音。
作为优选,所述预定义语音样本库模块检验尺寸的内部简称包括:检验尺寸的通用简称和用户特设的名称。
作为优选,所述语音判断自学习模块,用于提取检测尺寸名称和内部简称发音,通过模糊匹配算法,生成特征图,提取音频数据生成检测结果。
作为优选,上述检测信息采集系统还包括人员信息库、检验规程生成模块、信息显示模块,其中
所述人员信息库,用于存储检测人员基本信息,包括名称、岗位等信息;
所述检验规程生成模块,用于生成电子检验规程或提取其他软件数据库中的电子检验规程;
所述信息显示模块,用于显示依据电子规程生成检验单及采集到的检测数据,并语音播报检测结果。
作为优选,所述信息采集模块基于终端自带的麦克风输入声音。
作为优选,所述终端选自平板电脑、笔记本电脑或台式电脑。
一种实现系统对于某尺寸数据多次检测的数据采集方法,其特征在于采用上面所述的检测信息采集系统,通过预设自定义标志信息,实现数据采集的开始、结束、多次录入。
本发明所述的检测信息采集系统克服了现有技术中在生产现场存在广、数据量大、且录入操作繁琐,生产效率地下的问题,可以快速准确的将音频数据采集到上层系统,显著提高现场检测效率。
附图说明
图1是本发明一种数字化检测信息采集系统架构示意图;
图2是本发明中的信息采集流程;
图3是本发明中的语音采集降噪流程;
图4是本发明中的重复检测采集流程。
具体实施方式
为了使本发明更容易被清楚理解,以下结合附图和实施例对本发明的技术方案作以详细说明。
本发明实施例提供一种基于语音识别的数字化检测检测信息采集系统,系统架构如图1所示。该系统可以安装在移动终端,比如手机、穿戴式智能设备、平板电脑、和/或笔记本电脑等设备中,可以单独进行信息采集,也可以与生产过程执行系统MES(ManufacturingExecution System)、过程控制软件SPC(Statistical Process Control)及数字化检测软件进行集成。
实施例一
以该系统集成在数字化检测软件中并安装在平板电脑上为例。系统采集信息流程如图2所示,提取数字化检测软件的电子检验规程,判断检验规程中的信息录入方式,是语音录入则激活CPU开启进程并打开麦克风(MIC,Microphone),实时采集音频数据,通过CPU对音频数据进行模糊语音识别,当存在有效数据时,由语音判断自学习模块进行语义分析,得到有效数据,并通过显示模块显示和播报,用户核对无误后用语音确认,完成一次的信息录入。
需说明的是,实时采集音频数据开启方式为,根据模糊聚类分析建立模糊聚类神经网络;将所述模糊聚类神经网络作为概率密度函数的估计器,对所述音频数据包含采集开始信息的概率进行预测;若预测结果指示概率大于等于设定值,则生成指示存在采集信息的模糊语音识别结果;若预测结果指示概率小于设定值,则生成指示不存在采集信息的模糊语音识别结果。
需说明的是,为了准确提取到有用信息,需要滤除目标声音外的其他音频信息,即降噪。具体做法如图3所示,根据登录人员信息从预定义语音样本库获取该人员声纹的特征图,得到标准特征图,分析采集到的音频信息中各声音的特征图,得到待匹配特征图,匹配对比,滤除特征不符合的音频信息,得到希望被采集的音频信息。
需说明的是,自学习模块进行语义分析的方式为,首先模块将预定义语音样本库中已录入的检测名称发音和内部简称构造模糊矩阵,并根据隶属度来确定聚类关系,用模糊数学计算样本之间的模糊关系量,达到准确客观的聚类。其中,分类就是将数据集分成多个类或簇,使得各个类之间的数据差别应尽可能大,类内之间的数据差别应尽可能小。在识别音频数据信息时,可以使用模糊匹配算法,结合检测尺寸名称和内部简称发音构造出的模糊矩阵,生成检测名称和数字发音的特征图,并生成采集信息特征图,匹配对比,若结果大于等于预设值,则为数据结果。将得到的有效数据传递给显示模块,显示并提示。
实施例二
以实施例一为基础举例详细说明针对检测中会遇到的几种采集数据方式,如检验人员口误、需要多次采集数据等的流程,如图4所示。
系统在预定义语音样本库中保存几种标志信息,如标志信息采集开始的关键词、标志信息采集结束的关键词、标志信息采集重新开始的关键词、标志取消前测结果的关键词。
系统在采集过程中采集到标志开始的关键词信息,开始语音采集直到采集到结束信号停止采集。过程中,如果采集到取消前测结果的关键词则清除数据,直接重新开始检测。
需说明的是,某些检测数据要求取多次检测的均值或最大最小值,则可以让系统依据电子检验规程中的数据计算方式确定检验数据进行一次录入还是多次录入,及录入的次数。当需要多次录入时,再结束一次检测时,记录当前录入数据的次数,小于预设次数,则继续等待采集音频信息,直到达到检测次数,通过结果计算出需要的结果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种数字化检测信息采集系统,其特征在于,包括:
信息采集模块,用于指定用户的声音认证信息采集并用于声纹比对,检测名称及数据的发音和内部简称信息采集,检测过程中的音频检测数据采集;采集音频数据开启方式为,根据模糊聚类分析建立模糊聚类神经网络;将所述模糊聚类神经网络作为概率密度函数的估计器,对所述音频数据包含采集开始信息的概率进行预测;
预定义语音样本库模块,用于存储人员认证语音,检测名称的多种发音和内部简称,数据的发音方式和内部简称,检测尺寸的内部简称信息;
语音判断自学习模块,用于提取登录人员认证声音及预定义语音样本库中音频样本,对采集的音频数据进行模糊语音识别;还用于提取检测尺寸、检测名称和内部简称发音,通过模糊匹配算法,生成特征图,提取音频数据生成检测结果;自学习模块进行语义分析的方式为,首先模块将预定义语音样本库中已录入的检测名称发音和内部简称构造模糊矩阵,并根据隶属度来确定聚类关系,用模糊数学计算样本之间的模糊关系量,达到准确聚类;在识别音频数据信息时,使用模糊匹配算法,结合检测尺寸、检测名称和内部简称发音构造出的模糊矩阵,生成检测名称和数字发音的特征图,并生成采集信息特征图,匹配对比。
2.根据权利要求1所述的数字化检测信息采集系统,其特征在于,所述信息采集模块采集检测过程中音频检测数据,包括:
获取预定义语音样本库模块生成登录人员声纹的特征图;
以生成的声纹特征图为标准特征图,从采集的音频信息中提取符合特征的信息。
3.根据权利要求1所述的数字化检测信息采集系统,其特征在于,所述预定义语音样本库模块检测名称的多种发音包括:检测名称的普通话发音和用户所在地方言发音。
4.根据权利要求1所述的数字化检测信息采集系统,其特征在于,所述预定义语音样本库模块检测尺寸的内部简称包括:检测尺寸的通用简称和用户特设的名称。
5.根据权利要求1所述的数字化检测信息采集系统,其特征在于,还包括人员信息库、检验规程生成模块、信息显示模块,其中
所述人员信息库,用于存储检测人员基本信息,包括名称、岗位信息;
所述检验规程生成模块,用于生成电子检验规程或提取其他软件数据库中的电子检验规程;
所述信息显示模块,用于显示依据电子规程生成的检验单及采集到的检测数据,并语音播报检测结果;
所述信息采集模块基于终端自带的麦克风输入声音。
6.根据权利要求1所述的数字化检测信息采集系统,其特征在于,采集系统的终端选自平板电脑、笔记本电脑或台式电脑。
7.一种实现系统对于某尺寸数据多次检测的数据采集方法,其特征在于,采用权利要求1至6任一项所述的数字化检测信息采集系统,通过预设自定义标志信息,实现数据采集的开始、结束、多次录入。
CN201711331154.9A 2017-12-13 2017-12-13 一种数字化检测信息采集系统 Active CN109243469B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711331154.9A CN109243469B (zh) 2017-12-13 2017-12-13 一种数字化检测信息采集系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711331154.9A CN109243469B (zh) 2017-12-13 2017-12-13 一种数字化检测信息采集系统

Publications (2)

Publication Number Publication Date
CN109243469A CN109243469A (zh) 2019-01-18
CN109243469B true CN109243469B (zh) 2021-12-10

Family

ID=65084040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711331154.9A Active CN109243469B (zh) 2017-12-13 2017-12-13 一种数字化检测信息采集系统

Country Status (1)

Country Link
CN (1) CN109243469B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101840363B1 (ko) * 2011-11-07 2018-03-21 에스케이텔레콤 주식회사 오류 발음 검출을 위한 단말 및 음성 인식 장치, 그리고 그의 음향 모델 학습 방법
CN103699530A (zh) * 2012-09-27 2014-04-02 百度在线网络技术(北京)有限公司 根据语音输入信息在目标应用中输入文本的方法与设备
CN104751846B (zh) * 2015-03-20 2019-03-01 努比亚技术有限公司 语音到文本转换的方法及装置
CN105138663A (zh) * 2015-09-01 2015-12-09 百度在线网络技术(北京)有限公司 词库查询方法及装置
CN105702255A (zh) * 2016-03-28 2016-06-22 华智水稻生物技术有限公司 农业数据采集方法、装置及移动终端

Also Published As

Publication number Publication date
CN109243469A (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN111179975B (zh) 用于情绪识别的语音端点检测方法、电子设备及存储介质
CN109389971B (zh) 基于语音识别的保险录音质检方法、装置、设备和介质
CN110334241B (zh) 客服录音的质检方法、装置、设备及计算机可读存储介质
CN109599093B (zh) 智能质检的关键词检测方法、装置、设备及可读存储介质
EP3089158B1 (en) Speech recognition processing
WO2019148586A1 (zh) 多人发言中发言人识别方法以及装置
WO2021000408A1 (zh) 面试评分方法、装置、设备及存储介质
CN109801628B (zh) 一种语料收集方法、装置及系统
CN107133135B (zh) 一种基于统计学与声音定位的键盘按键检测方法
EP2199755A1 (en) An apparatus, a method and a computer program for recognition of flow regimes in a multiphase fluid flowing in a conduit
CN109326305B (zh) 一种批量测试语音识别和文本合成的方法和测试系统
CN110738998A (zh) 基于语音的个人信用评估方法、装置、终端及存储介质
CN109947971B (zh) 图像检索方法、装置、电子设备及存储介质
CN113823293B (zh) 一种基于语音增强的说话人识别方法及系统
CN109215647A (zh) 语音唤醒方法、电子设备及非暂态计算机可读存储介质
CN104282303B (zh) 利用声纹识别进行语音辨识的方法及其电子装置
CN106782517A (zh) 一种语音音频关键词过滤方法及装置
CN109243469B (zh) 一种数字化检测信息采集系统
CN115102789B (zh) 一种反通信网络诈骗研判预警拦截综合平台
CN115168563B (zh) 一种基于意图识别的机场服务引导方法、系统及装置
CN111489736A (zh) 座席话术自动评分装置及方法
CN110688558A (zh) 网页搜索的方法、装置、电子设备和存储介质
CN114037154A (zh) 基于注意特征的科技成果数量与主题的预测方法及系统
CN114121038A (zh) 音响语音测试方法、装置、设备及存储介质
CN113096667A (zh) 一种错别字识别检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant