CN112084907B - 一种时频图特征数据点抓取与处理方法、存储介质及设备 - Google Patents

一种时频图特征数据点抓取与处理方法、存储介质及设备 Download PDF

Info

Publication number
CN112084907B
CN112084907B CN202010879542.6A CN202010879542A CN112084907B CN 112084907 B CN112084907 B CN 112084907B CN 202010879542 A CN202010879542 A CN 202010879542A CN 112084907 B CN112084907 B CN 112084907B
Authority
CN
China
Prior art keywords
data
time
data points
data point
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010879542.6A
Other languages
English (en)
Other versions
CN112084907A (zh
Inventor
蒋秉宏
高博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202010879542.6A priority Critical patent/CN112084907B/zh
Publication of CN112084907A publication Critical patent/CN112084907A/zh
Application granted granted Critical
Publication of CN112084907B publication Critical patent/CN112084907B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种时频图特征数据点抓取与处理方法、存储介质及设备,对原信号数据进行处理,绘制原信号的时频图,并保留绘制时频图时所用到的数据;设定能量阈值,对时频图及绘制时频图所依据的数据进行数据点筛选,舍去时频图中能量低于设定能量阈值的数据点;对保留的数据点进行聚类,得到若干数据点簇并筛除,完成数据点抓取;对保留数据点簇的每一簇中的数据点进行拟合,得到每一簇对应的特征曲线的拟合曲线及方程,完成数据点处理。本发明对机械震动信号、声音信号等不同物理信号处理得到的结果,可作为反映振动中重要特征信号波形特点的重要依据,用于阈值相关的机械故障诊断、声波分析等领域中。

Description

一种时频图特征数据点抓取与处理方法、存储介质及设备
技术领域
本发明属于计算物理学技术领域,具体涉及一种时频图特征数据点抓取与处理方法、存储介质及设备,以机器学习中聚类方法为基础,从时频图中提取并分析多条特征曲线上数据点。
背景技术
在物理与工程研究中,经常需要研究某一段信号(如声音、电磁信号)中的一个或多个特征信号(即在任一时刻频率单一且与时间存在某种关系的信号)频率随时间变化的关系。进行此类研究的一个通用方法是先利用相关软件绘制该信号的时频图,然后分析时频图上的特征曲线(时频图上反应特征信号频率随时间变化的一条曲线,通常具有反映高能量分布的亮色)。分析特征曲线时,需要抓取该曲线上的数据点并进行拟合(以下称这些数据点为“特征数据点”),进而得到特征曲线的拟合方程。该拟合方程既是时频图中特征曲线的近似描述,也直接反映了特征信号频率随时间变化的关系,是研究特征信号的重要数据参考。
一般分析与拟合时频图中特征曲线时抓取数据点的主要方式为人工抓取。这种低效的数据点抓取方法所抓取到数据点的数量不可能很高,导致最终拟合曲线方程的精度降低。此外,人工数据点抓取需要耗费大量人工成本且效率低下,且高额的时间成本使其不适合进行大数据量时频图的分析,尤其是对含有多条特征曲线(如5条以上)的时频图进行分析。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种时频图特征数据点抓取与处理方法、存储介质及设备,解决了现有技术中存在的特征曲线拟合结果精度低下,需数据点提取的人工与时间成本高,且分析数据量存在限制的问题。
本发明采用以下技术方案:
一种时频图特征数据点抓取与处理方法,包括以下步骤:
S1、对原信号数据进行处理,绘制原信号的时频图,并保留绘制时频图时所用到的数据;
S2、设定能量阈值,对步骤S1的时频图及绘制时频图所依据的数据进行数据点筛选,舍去时频图中能量低于设定能量阈值的数据点;
S3、对步骤S2保留的数据点进行聚类,得到若干数据点簇;
S4、对步骤S3得到的若干数据点簇进行筛除,完成数据点抓取;
S5、对步骤S4保留数据点簇的每一簇中的数据点进行拟合,得到每一簇对应的特征曲线的拟合曲线及方程,完成数据点处理,所得到的特征曲线反映特征信号频率随时间的变化,用于机械故障诊断。
具体的,步骤S1中,保留的数据包括各数据点的时间、频率和能量数据。
具体的,步骤S2中,保留特征曲线上5%~20%的数据点,舍去其他数据。
具体的,步骤S3中,对步骤S2筛选的数据点进行聚类,分为若干含有有效数据点占总数据量10%以上的簇,以及若干由无效数据点组成的,占总数据量1%以下的簇。
具体的,步骤S4中,保留步骤S3中所有含有有效数据点的簇,舍去所有含有无效数据点的簇。
具体的,步骤S5中,采用待定系数法实现数据点拟合。
本发明的另一个技术方案是,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行所述的方法中的任一方法。
本发明的另一个技术方案是,一种计算设备,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行所述的方法中的任一方法的指令。
与现有技术相比,本发明至少具有以下有益效果:
本发明一种时频图特征数据点抓取与处理方法,将原本需要人工完成的数据处理过程转化为可以由程序处理的过程。该方法与传统方法相比具有精度高、人工与时间成本低的特点。
进一步的,将波形信号转化为了能量~时间~频率数据,即转化为可以被聚类算法处理的数据形式,好处是将复杂的震动信号转化为了便于算法分析的数据形式。
进一步的,由于本方法仅舍去了所有不在特征曲线上的数据点,而尽可能将剩余每一个数据点归入一条特征曲线对应的簇中,因而保证了尽可能多的数据用于特征曲线方程的拟合,提高了用于拟合曲线的数据量和准确度,提升了拟合的精度。
进一步的,由于采用了聚类这一人工智能算法,本方法可以用于编写自动抓取时频图特征曲线上数据点并以此为依据进行特征曲线拟合,改人工抓取为程序自动分析识别,降低了时频图分析的人工成本,使得数据的采集可以由计算机程序快速进行,提升了时频图分析的速度,并使得大数据量、多特征曲线的时频图分析成为了可能。
进一步的,最大限度地剔除无效数据点,并将数据点按照其所归属的特征曲线分类,这样做的好处是通过算法而不是人工完成了上述分类,是整个方法在无人工干预下进行的关键。
进一步的,将筛选后按归属曲线分类的数据点通过拟合转化为最终的音频分析结果,其好处在于将复杂的数据点分布转化为了简洁的、便于观察和理解的特征曲线拟合方程。
综上所述,本发明有效提高了时频图特征数据点抓取与分析的精度和速度。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明方法步骤图;
图2为时频图;
图3为按能量阈值初筛数据点后效果图;
图4为聚类后数据点簇示意图。
具体实施方式
请参阅图1,本发明一种时频图特征数据点抓取与处理方法,包括以下步骤:
S1、对原信号数据进行处理,绘制原信号的时频图,并保留绘制时频图时所用到的数据;
对原信号数据进行处理,绘制出原信号的时频图,如图2所示。同时保留绘制时频图时所用到的数据,包括各数据点的时间、频率、能量数据,以便稍后步骤中进行分析。
时频图绘制可以采用编程或使用工具软件,例如Adobe Audition。
S2、设定能量阈值,对步骤S1的时频图及绘制时频图所依据的数据进行数据点筛选,舍去时频图中能量低于设定能量阈值的数据点;
设定的能量阈值应满足以下条件:
能量阈值能够保留特征曲线上5%~20%的数据点,舍去其他数据。
基于能量阈值对处于特征曲线上的数据点进行初筛,为下一步聚类做准备,筛选后数据点的分布情况如图3所示。
S3、对步骤S2保留的数据点进行聚类,得到若干数据点簇;
聚类所采用的具体算法应视步骤S2得到的数据点分布情况而定,首选采用基于密度的聚类算法;聚类结果良好的判定标准是能够使同一特征曲线上的数据点被分到同一簇中,将每一簇中达到步骤S2保留数据量10%以上的数据点分到同一簇中,将步骤S2中残留的无效数据点单独分出,形成包含少于1%的数据点的若干簇。
如果聚类结果无法达到上述标准,则对聚类半径进行调整,具体调整方法采用如下原则:
当多条特征曲线上的数据点被分到同一簇中时,依据二分法原则增大聚类半径;反之,若同一曲线上的数据点被分为多簇(即没有被分入同一簇),则依据二分法原则减小聚类半径。
若上述两种情况同时发生,则更换聚类算法为使用高斯混合模型的最大期望聚类。S4、舍去步骤S3分出的若干数据点簇中,含有数据点较少的簇,即所述包含少于1%的残留无效数据点的簇,保留剩余点簇及数据点,以筛除无效数据点;以上逐步剔除无效数据点,并将有效数据点按照其属于的特征曲线分为若干簇的过程,即数据点抓取过程。
请参阅图4,利用聚类从时频图上筛选出并保留的数据点簇。
S5、对步骤S4保留数据点簇的每一簇中的数据点进行拟合,得到每一簇对应的特征曲线的拟合曲线及方程,完成数据点处理,所得到的特征曲线反映特征信号频率随时间的变化,用于对信号进行更加深入的分析。
运用本发明方法对机械震动信号、声音信号等不同物理信号处理得到的结果,可作为反映振动中重要特征信号波形特点(其量化反应即为波形瞬时频率与时间的关系)的重要依据,能够用于阈值相关的机械故障诊断、声波分析等领域中。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了验证本发明方法的高精确性,现采用本发明所述方法与传统方法对一系列利用Matlab软件合成的带有白噪声背景的模拟理想弦震动波作为测试音频进行声学特征频率分析。测试信号共9段,所有波信号长10秒,模拟理想弦震动波的基频随时间变化规律如下:
Figure BDA0002653688610000061
其中,f为基频频率,t为时间,上述两变量均采取国际单位制。
九段音频中白噪声平均能量与模拟理想弦震动波在音频最开始能量之比分别为
Figure BDA0002653688610000071
现分别使用传统方法与本发明所述方法分析测试音频中基波与一至四级泛音频率随之间变化的关系(即特征曲线)进行分析,并在已知对应关系表达式的情况下通过拟合特征曲线测算出待定系数A的值。
基本形式为:
Figure BDA0002653688610000072
利用传统方法与本发明方法对上述9段音频中的指定的45条特征曲线进行拟合后,将得到的A值与真实值A=1000进行对比。传统方法的平均误差为4.4%,其中,最大的一次拟合误差为7.6%;本专利中所述方法的平均误差为2.0%,其中最大的一次拟合误差为3.4%。由此可见,本专利中所述方法具有更高的拟合精度。
综上所述,本发明一种时频图特征数据点抓取与处理方法、存储介质及设备,通过能量阈值初筛和聚类处理对信号转化为的时频图进行无效数据点筛除、对有效数据点按所归属特征曲线分类的处理,并最终通过待定系数法拟合分类后的数据点得到信号分析结果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (4)

1.一种时频图特征数据点抓取与处理方法,其特征在于,包括以下步骤:
S1、对音频信号数据进行处理,绘制原信号的时频图,并保留绘制时频图时所用到的数据,时频图上的特征曲线为特征信号频率随时间变化;
S2、设定能量阈值,对步骤S1的时频图及绘制时频图所依据的数据进行数据点筛选,保留特征曲线上5%~20%的数据点,舍去时频图中能量低于设定能量阈值的数据点;
S3、采用基于密度的聚类算法,对步骤S2保留的数据点进行聚类,得到若干数据点簇,对步骤S2筛选的数据点进行聚类,分为若干含有有效数据点占总数据量10%以上的簇,以及若干由无效数据点组成的,占总数据量1%以下的簇;
S4、对步骤S3得到的若干数据点簇进行筛除,保留步骤S3中所有含有有效数据点的簇,舍去所有含有无效数据点的簇,完成数据点抓取;
S5、采用待定系数法对步骤S4保留数据点簇的每一簇中的数据点进行拟合,得到每一簇对应的特征曲线的拟合曲线及方程,完成数据点处理,所得到的特征曲线反映特征信号频率随时间的变化。
2.根据权利要求1所述的时频图特征数据点抓取与处理方法,其特征在于,步骤S1中,保留的数据包括各数据点的时间、频率和能量数据。
3.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1或2所述的方法中的任一方法。
4.一种计算设备,其特征在于,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1或2所述的方法中的任一方法的指令。
CN202010879542.6A 2020-08-27 2020-08-27 一种时频图特征数据点抓取与处理方法、存储介质及设备 Active CN112084907B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010879542.6A CN112084907B (zh) 2020-08-27 2020-08-27 一种时频图特征数据点抓取与处理方法、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010879542.6A CN112084907B (zh) 2020-08-27 2020-08-27 一种时频图特征数据点抓取与处理方法、存储介质及设备

Publications (2)

Publication Number Publication Date
CN112084907A CN112084907A (zh) 2020-12-15
CN112084907B true CN112084907B (zh) 2022-12-09

Family

ID=73728024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010879542.6A Active CN112084907B (zh) 2020-08-27 2020-08-27 一种时频图特征数据点抓取与处理方法、存储介质及设备

Country Status (1)

Country Link
CN (1) CN112084907B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428631A (zh) * 2020-03-23 2020-07-17 中南大学 无人机飞控信号可视化识别分选方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050222515A1 (en) * 2004-02-23 2005-10-06 Biosignetics Corporation Cardiovascular sound signature: method, process and format
CN104347068B (zh) * 2013-08-08 2020-05-22 索尼公司 音频信号处理装置和方法以及监控系统
US11023494B2 (en) * 2017-12-12 2021-06-01 International Business Machines Corporation Computer-implemented method and computer system for clustering data
CN108872962B (zh) * 2018-05-10 2022-03-15 南京航空航天大学 基于分数阶傅里叶变换的激光雷达微弱信号提取和分解方法
CN109766393A (zh) * 2018-12-06 2019-05-17 中科恒运股份有限公司 异常数据检测方法及装置
CN111504675B (zh) * 2020-04-14 2021-04-09 河海大学 一种气体绝缘组合电器机械故障在线诊断方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428631A (zh) * 2020-03-23 2020-07-17 中南大学 无人机飞控信号可视化识别分选方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Fuzzy Clustering of Seismic Sequences: Segmentation of Time-Frequency Representations;Hosein Hashemi et al;《 IEEE Signal Processing Magazine》;20120531;第29卷(第3期);82-87页 *
基于有效频带特征的有载分接开关机械状态诊断方法;胡东等;《电气应用》;20180731;第37卷(第14期);42-47页 *
无线电频谱与无线电信号数据协同可视分析方法;周芳芳等;《计算机辅助设计与图形学学报》;20170131;第29卷(第1期);27-37页 *

Also Published As

Publication number Publication date
CN112084907A (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN107274915B (zh) 一种基于特征融合的数字音频篡改自动检测方法
CN111062425B (zh) 基于c-k-smote算法的不平衡数据集处理方法
CN112329713A (zh) 网络流量异常在线检测方法、系统、计算机设备及存储介质
CN104484410A (zh) 应用于大数据系统的数据融合方法及系统
CN104484412A (zh) 基于多形式处理的大数据分析系统
CN114416707A (zh) 工业时序数据的自动化特征工程方法和装置
CN112084907B (zh) 一种时频图特征数据点抓取与处理方法、存储介质及设备
CN107515876B (zh) 一种特征模型的生成、应用方法及装置
CN107247931A (zh) 一种旋转机械振动信号降噪方法
CN102930865B (zh) 一种波形音乐粗情感软切割分类方法
CN112257332B (zh) 一种仿真模型的评估方法及装置
CN110689885A (zh) 机器合成语音识别方法、装置、存储介质及电子设备
CN112462442B (zh) 重磁位场场源位置估计方法、系统、介质及电子设备
CN109800215A (zh) 一种对标处理的方法、装置、计算机存储介质及终端
CN107886113B (zh) 一种基于卡方检验的电磁频谱噪声提取和滤波方法
CN114239757B (zh) 一种电磁时间序列数据的去噪方法及系统
CN116311492A (zh) 一种基于深度相机和轮廓提取的手势识别方法及系统
CN111274123A (zh) 基于软件基因的安全防护软件测试集自动生成方法、架构
CN113375065B (zh) 管道泄漏监测中趋势信号的消除方法及装置
CN114334033A (zh) 抗乳腺癌候选药物分子描述符的筛选方法、系统及终端
CN114565033A (zh) 储能运行工况特征参数体系构建方法、系统及存储介质
CN114417918A (zh) 一种风电场信号特征提取及去噪优化数据的方法
CN108090483B (zh) 乳腺肿块候选区的检测方法及装置
CN116636815B (zh) 基于脑电信号的水下作业人员睡眠质量评估方法及系统
CN116671867B (zh) 一种针对水下作业人员的睡眠质量评测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant