CN110059288A - 用于获得促进机器学习任务用的最佳母小波的系统和方法 - Google Patents

用于获得促进机器学习任务用的最佳母小波的系统和方法 Download PDF

Info

Publication number
CN110059288A
CN110059288A CN201811520918.3A CN201811520918A CN110059288A CN 110059288 A CN110059288 A CN 110059288A CN 201811520918 A CN201811520918 A CN 201811520918A CN 110059288 A CN110059288 A CN 110059288A
Authority
CN
China
Prior art keywords
group
signal
wavelet
morther
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811520918.3A
Other languages
English (en)
Other versions
CN110059288B (zh
Inventor
伊尚·萨胡
斯内西斯·班纳吉
塔努什亚姆·查托帕迪亚
阿尔潘·帕尔
乌特帕尔·加兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of CN110059288A publication Critical patent/CN110059288A/zh
Application granted granted Critical
Publication of CN110059288B publication Critical patent/CN110059288B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

用于获得用于促进机器学习任务的最佳母小波的系统和方法。传统的系统和方法提供了使用一些传统的技术和方法来选择母小波和信号分类,但是它们都没有提供选择最佳母小波以促进机器学习任务。本公开的实施方式提供了获得最佳母小波以促进机器学习任务,通过基于标记的数据集和可能的母小波组计算能量和熵的值,基于能量和熵的值计算质心和标准偏差的值,计算距离值组并归一化该距离值组并基于该距离值组获得最佳母小波,用于执行小波变换,并通过对对应于新信号组的新信号组类进行分类或回归来进一步促进机器学习任务。

Description

用于获得促进机器学习任务用的最佳母小波的系统和方法
相关申请和优先权的交叉引用
该专利申请要求于2017年12月28日在印度提交的印度说明书(标题:Systems andMethods for obtaining optimal mother wavelets for facilitating machinelearning tasks)No.201721047125的优先权。
技术领域
本公开大体上涉及获得用于促进机器学习任务的最佳母小波。更特别地,本公开涉及用于获得用于促进机器学习任务的最佳母小波的系统和方法。
背景技术
通常,小波是数学函数,其基本上将数据分成多个频率分量,以便以与其刻度匹配的分辨率来研究每个分量。执行小波分析过程以采用小波原型函数,其被叫作或称为分析小波或母小波。理想地,小波用于使用多个时移和频率刻度而通过时域和频域二者来分析具有高分辨率的信号。每当小波与已识别的信号的形态匹配时,应用小波变换如离散小波变换有助于分析和从信号中提取特征。
母小波形成用于分析小波变换中的给定信号的基础。基于在信号类上执行的特定任务,母小波可以从一个应用到另一个而不同。因此,选择最佳母小波是重要的,因为通过应用小波变换获得的结果可能受到所选择的母小波的影响。因此,信号和母小波之间必须有一定程度的相关性。此外,人们可以从大量母小波函数中进行选择。因此,应用小波分析的最大挑战是如何为给定任务选择所需的母小波。普遍同意的是,小波变换应用的成功取决于为任务选择合适的小波函数。
传统的系统和方法提供了使用众所周知的技术来选择母小波,例如,连续小波变换(CWT),但它们都没有提供选择可以实现机器学习任务的最佳或最优的母小波。
发明内容
以下呈现了本公开的一些实施方式的简化概述,以便提供实施方式的基本理解。该概述不是实施方式的广泛综述。并不意在标识实施方式的关键/重要元素或描绘实施方式的范围。其唯一目的是以简化的形式呈现一些实施方式,作为下面呈现的更详细描述的序言。
本公开的系统和方法使得能够获得用于促进机器学习任务的最佳母小波。在本公开的实施方式中,提供了一种用于获得用于促进机器学习任务的最佳母小波的方法,该方法包括:基于多个信号,通过一个或多个硬件处理器来识别第一组信号数据,其中第一组信号数据包括对应于一个或多个信号类的标记数据集;基于第一组信号数据和可能的母小波组来计算能量和熵的值,包括对应于通过可能的母小波组的小波变换的第一组信号的熵比和多级小波熵;基于能量和熵的值计算第二组信号数据,包括对应于一个或多个信号类的第一组信号的质心和标准偏差的值;基于第二组信号数据计算距离值组,包括对应于一个或多个信号类的质心之间的距离,其中该距离值组基于对应于第二组信号数据的函数来计算;基于对应于一个或多个信号类的该距离值组和标准偏差的值,获得一个或多个最佳母小波,用于执行第一组信号的小波变换;通过基于能量和熵的值使用N范数技术归一化该距离值组来计算该距离值组,以获得一个或多个最佳母小波;基于标记数据集通过分析可能的母小波组来获得一个或多个最佳母小波,以对一个或多个信号类进行分类;并且通过所获得的一个或多个最佳母小波,使得能够通过执行第二组信号的小波变换来分解第二组信号,并且其中第二组信号通过对对应于第二组信号的一个或多个信号类进行分类或回归来促进机器学习任务。
在本公开的实施方式中,提供了一种用于获得用于促进机器学习任务的最佳母小波的系统,该系统包括一个或多个处理器;一个或多个数据存储设备,可操作地耦合到一个或多个处理器,并且被配置成存储被配置为由一个或多个处理器实行的指令以:基于多个信号,通过一个或多个硬件处理器来识别第一组信号数据,其中第一组信号数据包括对应于一个或多个信号类的标记数据集;基于可能的母小波组和第一组信号数据来计算能量和熵的值,包括对应于通过可能的母小波组的小波变换的第一组信号的熵比和多级小波熵;基于能量和熵的值计算第二组信号数据,包括对应于一个或多个信号类的第一组信号的质心和标准偏差的值;基于第二组信号数据计算距离值组,包括对应于一个或多个信号类的质心之间的距离,其中该距离值组基于对应于第二组信号数据的函数来计算;基于对应于一个或多个信号类的该距离值组和标准偏差的值,获得一个或多个最佳母小波,用于执行第一组信号的小波变换;基于能量和熵的值使用N范数技术来归一化该距离值组,以获得一个或多个最佳母小波;基于标记数据集分析可能的母小波组,以对一个或多个信号类进行分类;并且通过所获得的一个或多个最佳母小波,使得通过执行第二组信号的小波变换来分解第二组信号,并且其中第二组信号通过对对应于第二组信号的一个或多个信号类进行分类或回归来促进机器学习任务。
在本公开的实施方式中,提供了包括一个或多个指令的一个或多个非暂时性机器可读信息存储介质,其当由一个或多个硬件处理器实行时,使得一个或多个硬件处理器执行一种用于获得用于促进机器学习任务的最佳母小波的方法,该方法包括:基于多个信号,通过一个或多个硬件处理器来识别第一组信号数据,其中第一组信号数据包括对应于一个或多个信号类的标记数据集;基于第一组信号数据和可能的母小波组来计算能量和熵的值,包括对应于通过可能的母小波组的小波变换的第一组信号的熵比和多级小波熵;基于能量和熵的值计算第二组信号数据,包括对应于一个或多个信号类的第一组信号的质心和标准偏差的值;基于第二组信号数据计算距离值组,包括对应于一个或多个信号类的质心之间的距离,其中该距离值组基于对应于第二组信号数据的函数来计算;基于对应于一个或多个信号类的该距离值组和标准偏差的值,获得一个或多个最佳母小波,用于执行第一组信号的小波变换;通过基于能量和熵的值使用N范数技术归一化该距离值组来计算该距离值组,以获得一个或多个最佳母小波;通过基于标记数据集分析可能的母小波组来获得一个或多个最佳母小波,以对一个或多个信号类进行分类;并且通过所获得的一个或多个最佳母小波,使得能够通过执行第二组信号的小波变换来分解第二组信号,并且其中第二组信号通过对对应于第二组信号的一个或多个信号类进行分类或回归来促进机器学习任务。
要理解的是,前面的一般性描述和下面的详细描述,二者都仅是示例性和说明性的,并不是对要求保护的本公开的限制。
附图说明
根据以下参考附图的详细描述,将更好地理解本文的实施方式,其中:
图1示出了根据本公开的实施方式的用于获得用于促进机器学习任务的最佳母小波的系统的框图;
图2是示出根据本公开的实施方式的用于获得用于促进机器学习任务的最佳母小波所涉及的步骤的流程图;
图3示出了根据本公开的实施方式的对应于来自用于获得最佳母小波的一个或多个信号类中的一个类的多个信号的图形表示;
图4示出了根据本公开的实施方式的对应于来自用于获得最佳母小波的一个或多个信号类中的另一类的多个信号的图形表示;以及
图5示出了根据本公开的实施方式对应于所分析的每个母小波的归一化的距离值组的样本结果组的图形表示。
具体实施方式
参考在随附附图中示出并在以下描述中详述的非限制性实施方式,更全面地解释本文的实施方式及其各种特征和有利细节。本文使用的示例仅意在促进理解可以实践本文的实施方式的方式,并且进一步使本领域技术人员能够实践本文的实施方式。因此,示例不应被解释为限制本文的实施方式的范围。
本公开的实施方式提供用于获得用于促进机器学习任务的最佳母小波的系统和方法。作为一种流行的时频分析方法的小波分析已经应用于各种领域,以分析各种各样的信号,举几个例子,覆盖生物信号、振动信号、声学和超声信号。小波分析具有提供时域和频域信息二者的能力,主要用于信号的时频分析、信号压缩、信号去噪、奇异性分析和特征提取。执行小波变换的主要挑战是为给定任务选择最佳母小波,因为应用于同一信号的不同母小波可能产生不同的结果。
机器学习技术通过自动调整算法的参数来操作,使得在训练之后输入被正确分类。不幸的是,训练可能涉及向算法和其他复杂任务呈现数十万对(输入,目标)。传统的系统和方法提供信号分类,通过使用一些历史信号数据来生成特征组,基于所生成该特征组训练分类器,提取分类器模型并最终基于分类器模型生成类标签预测。
因此,需要促进推荐母小波的技术,基于该技术可以使用小波分析技术中的任一种来执行信号组的分解,不同类信号间的区别或分离变得明显。此外,该技术必须促进实现机器学习任务,其中可以自动学习信号和类标签之间的映射,使得在这种标签被认为是未知的情况下,可以在测试或对信号进行现实世界部署期间,进行预测。简而言之,该技术必须提供信号类之间的明确区分并进一步促进机器学习任务。
现在参考附图,并更特别地参考图1至图5,其中类似的附图标记在整个附图中始终表示对应的特征,示出了优选实施方式,并且在以下示例性系统和/或方法的上下文中描述了这些实施方式。
图1示出了根据本公开的实施方式的用于获得用于促进机器学习任务的最佳母小波的系统100的示例性框图。在一种实施方式中,系统100包括一个或多个处理器104;通信接口设备(一个或多个)或输入/输出(I/O)接口(一个或多个)106;以及一个或多个数据存储设备或存储器102,可操作地耦合到一个或多个处理器104。一个或多个处理器104为硬件处理器,其可以实现为一个或多个微处理器、微计算机、微控制器、数字信号处理器、中央处理单元、状态机、逻辑电路和/或基于操作指令操纵信号的任何设备。在其他能力中,处理器(一个或多个)被配置为取得并实行存储在存储器中的计算机可读指令。在一种实施方式中,系统100可以在各种计算系统中实现,诸如膝上型计算机、笔记本、手持设备、工作站、大型计算机、服务器、网络云等。
I/O接口设备(一个或多个)106可以包括各种软件和硬件接口,例如,web接口、图形用户接口等,并且可以促进多种网络N/W和协议类型中的多通信,包括有线网络,例如LAN、电缆等,以及无线网络,诸如WLAN、蜂窝或卫星。在一种实施方式中,I/O接口设备(一个或多个)可以包括一个或多个端口,用于将若干设备彼此连接或连接到另一服务器。
存储器102可以包括本领域中已知的任何计算机可读介质,包括例如易失性存储器,诸如静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM),和/或非易失性存储器,诸如只读存储器(ROM)、可擦除可编程ROM、闪存、硬盘、光盘和磁带。
图2参考图1,示出了根据本公开的实施方式的用于获得用于促进机器学习任务的最佳母小波的方法的示例性流程图。在一种实施方式中,系统100包括存储器102的一个或多个数据存储设备,可操作地耦合到一个或多个硬件处理器104,并且被配置为存储用于由一个或多个处理器104实行该方法的步骤的指令。现在将参考系统100的部件来解释本公开的方法的步骤,如图1和流程图所描绘的。在本公开的实施方式中,硬件处理器104在被配置指令时,执行本文描述的一个或多个方法。
根据本公开的实施方式,在步骤201处,一个或多个硬件处理器104基于多个信号识别第一组信号数据,其中第一组信号数据包括对应于一个或多个信号类的标记数据集。在一种实施方式中,可以使用一个或多个传感器(图中未示出)来获取多个信号。在一种实施方式中,获得标记数据集包括获取未标记数据作为输入,并为每条该未标记数据增加某种有意义的“标签”、“标记”或“类”,其以某些方式提供信息或是希望知道的。参考图3和图4,可以考虑通过一个或多个传感器来获取多个信号(以波形方式),其中图3示出了对应于一个类的多个信号,例如,来自一个或多个信号类中的类1,并且图4示出了对应于另一类的多个信号,例如,来自一个或多个信号类中的类2。参考下面的表1,可以参考包括标记数据集基于多个信号的第一组信号数据,其中每行对应于通过一个或多个传感器获取的来自多个信号中的信号,并且其中第一列,即列A,显示一个或多个信号类,并且列B、C、D和E示出在记录的每个时间步的幅度值组。
表1
根据本公开的实施方式,在步骤202处,基于第一组信号数据和可能的母小波组,可以计算能量和熵的值,其中能量和熵的值包括第一组信号的熵比和多级小波熵,以对应于通过可能的母小波组的小波变换。在一种实施方式中,可以通过任何传统技术或方法来执行可能的母小波组的识别。例如,一个或多个硬件处理器104可以通过抓取网络(web)和出版物来提取小波关键字的列表或表,以取得可能的母小波组。此外,还可以通过深度神经网络技术(本文未讨论)来执行识别,其中输入信号通过各种级别的网络来获得可能的母小波组。
表2
母小波(子组)
haar
db1
db2
db3
sym2
sym3
coif1
coif2
coif3
在该实施方式中,然后可以使用所识别的可能的母小波组来通过对第一组信号数据应用小波变换而分解第一组信号。每当识别出与第一组信号的形态匹配的任何母小波(从可能的母小波组中)时,小波变换的应用促进分析和从信号中提取特征(从第一组信号中)。因此,小波变换的整个过程意在获得信号(对应于第一组信号)的一个或多个系数(包括第一级系数和详细系数),特征提取以及用于促进机器学习任务或任何其他用例的那些特征的最终使用可以自动化。在一种实施方式中,小波变换可以通过基本函数或可能的母小波组来描述,其允许改变先前函数的值以便得到新函数。
在示例实现中,可以通过执行小波变换获得一个或多个系数,如下:
近似系数=-0.000598948,-0.002581435,-0.003833862;以及
详细系数=0.000598948,0.000419951,0.000169352
在一种实施方式中,单个母小波(从可能的母小波组中)形成表示无限数量的子小波的基础。不同的术语包括小波族、母小波和子小波。执行小波变换常用的方法包括连续小波变换(CWT)、离散小波变换(DWT)、快速小波变换(FWT)、提升方案和广义提升方案、小波包分解(WPD)、平稳小波变换(SWT)、分数傅里叶变换(FRFT)和分数小波变换(FRWT)。
根据本公开的实施方式,基于一个或多个系数,可以使用例如香农熵技术来获得能量和熵的值。对应于一个或多个信号类的信号的能量和熵的值测量例如能量/熵的比的值。设该比由信号i的xi表示。因此,在第一组信号数据中存在每个信号(从多个信号中)的一个测量值。此外,使用具有可能的母小波组的信号(从多个信号中)的小波变换获得的小波系数的n个数量的能量可以表示为下面的-等式(1):
一个或多个系数的香农熵可以定义为下面的等式(2):
其中pi是每个小波系数Ci的能量概率的分布。
因此,具有可能的母小波组(表示为xi)的信号(从多个信号中)的能量与香农熵的比可以定义为:
以及
在示例实现中,基于对应于能量与香农熵的比的等式(3)和(4)与一个或多个系数,可以获得包括第一组信号的熵比和多级小波熵的能量和熵的值如下:
能量值=112.4818103,
熵值=-24.029115;以及
熵比=-4.68106338
可以注意到,本公开的实施方式不是仅使用能量与香农熵的比来限制能量和熵值的计算。在一种实施方式中,可以执行类似的其他计算来获得能量和熵的值,例如,多级小波时间-能量香农熵(MWTEE)来获得xi
根据本公开的实施方式,在步骤203处,基于能量和熵的值,对应于一个或多个信号类,可以计算包括第一组信号的标准偏差和质心的值的第二组信号数据。在一种实施方式中,可以使用属于对应于一个或多个信号类的信号(从多个信号中)中的每个的所有xi来计算质心和标准偏差的值。
在一种实施方式中,质心的值可以获得为:
其中向量空间Rn中有限点集x1+x2+x3….+xm的质心是:
在一种实施方式中,有限点集的标准偏差可以被计算为:
其中
在示例实现中,使用以上等式,可以获得对应于一个或多个信号类的第二组信号数据,如下面的表3所示:
表3
类1 类2
质心的值 -0.424363441708168 -1.44449956902769
标准偏差的值 1.58208913535412 6.15306158570416
根据本公开的实施方式,在步骤204处,基于第二组信号数据,包括对应于一个或多个信号类的质心之间的距离的距离值组,其中基于对应于第二组信号数据的函数来计算该距离值组。在一种实施方式中,可以使用任何已知的技术和方法,例如欧几里德距离技术,基于质心和标准偏差的值来计算该距离值组。在欧几里德距离技术中,欧几里德距离或欧几里德度量包括欧几里德空间中的两点之间的普通直线距离。通过这个距离,欧几里德空间成为度量空间。如本领域中已知的,度量包括在集上的非负函数d,即d:XxX→(0,inf)。对于属于X的任何x,y,z,满足以下条件:
d(x,y)≥0,
d(x,y)=0<=>x=y,
d(x,y)=d(y,x);以及
d(x,z)<=d(x,y)+d(y,z)
在示例实现中,使用欧几里德距离技术,可以获得包括质心之间的距离的该距离值组(对于可能的母小波组中的每个),如下面的表4所示:
表4
根据本公开的一种实施方式,可以使用N范数技术或最大距离值技术来归一化(normalized,标准化)该距离值组。如本领域中已知的,范数可以是为向量空间中的每个向量分配严格正长度或大小的函数,除了零向量之外。例如,在n-维欧几里得空间Rn上,向量x=(x1,x2,…,xn)的长度的直觉概念可以被捕获为:
在示例实现中,在执行归一化之后,可以获得该距离值组,如下面的表5所示:
表5
可以注意到,本公开的实施方式不是仅使用欧几里德距离技术来限制该距离值组的计算。实施方式提供使用任何其他技术(例如,性能度量技术或n球八面体技术)或其它们的组合来计算该距离值组。适当距离函数的选择可以基于标记数据集的类型和标记数据集的对应属性。此外,本公开的实施方式支持使用任何其他技术或其它们的组合来执行该距离值组的归一化。
根据本公开的实施方式,在步骤205处,可以基于对应于一个或多个信号类的该距离值组和标准偏差的值,获得一个或多个最佳母小波,用于执行第一组信号的小波变换。因此,选择对应于最大距离值(来自在上面的步骤204中计算的该距离值组)的一个或多个母小波。因此,在一种实施方式中,如果多个母小波对应于最大距离值,可以选择具有标准偏差的最小值的母小波。
参考图5,可以考虑样本结果是MIMIC BP数据集(a freely accessible criticalcare database,由Johnson AEW,Pollard TJ,Shen L,Lehman L,Feng M,Ghassemi M,Moody B,Szolovits P,Celi LA和Mark RG.Scientific Data(2016)),其具有两个信号类。对应于上面分析的母小波中的每个,可以参考所绘制的质心之间的计算的归一化距离。再次参考图5,可以注意到'db10'母小波(从可能的母小波组中)给出了类之间的最大区别(基于上面的步骤202到204中所示的示例计算),且因此可以被选择作为最佳母小波。
根据本公开的实施方式,所获得的一个或多个最佳母小波能够通过执行第二组信号的离散小波变换来分解第二组信号,并且其中第二组信号通过对对应于第二组信号的一个或多个信号类进行分类或回归来促进机器学习实现。例如,参考上面的步骤205,如果获得'db10'作为最佳母小波,'db10'可以在机器学习任务中实现,就像对来自第二组信号(其是新的信号组)中的相同类型的类似标记信号的分类。传统的系统和方法提供信号分类,通过使用一些历史信号数据来生成特征组,基于所生成该组特征关于历史信号数据的训练部分训练分类器,提取分类器模型并最终基于分类器模型生成类标记预测。
本公开的实施方式促进根据历史信号数据生成该组特征。在基于小波变换生成该组特征的同时,母小波必须是最佳的。最佳母小波的选择促进生成更高质量的特征。所选择的最佳母小波提供了促进区分不同类信号的特征组。这促进了学习并产生良好的分类器或回归模型以及对第二组信号的预测。在一种实施方式中,在基于所获得的一个或多个最佳母小波在执行小波变换之后,可以计算的特征中的一些包括偏度、峰度、能量、过零率、均值、方差等。基于小波变换的所有这些特征的计算取决于一个或多个最佳母小波。
在一种实施方式中,存储器102可以被配置为存储与获得用于促进机器学习任务的最佳母小波相关联的任何数据。在一种实施方式中,关于第一组信号数据、可能的母小波组、质心和标准偏差的值、第二组信号数据和该距离值组等的信息存储在存储器102中。此外,关于获得用于促进机器学习任务的最佳母小波的所有信息(输入、输出等)也可以作为历史数据存储在数据库中,以供参考。
书面说明书描述了本文的主题,以使本领域技术人员能够制造和使用实施方式。主题实施方式的范围由权利要求限定,并且可以包括本领域技术人员想到的其他修改。如果这种其他修改具有与权利要求的字面语言没有不同的相似元素,或者如果它们包括与权利要求的字面语言无实质差别的等同元素,这种其他修改意在处于权利要求的范围内。
要理解,保护范围扩展到这样的程序,而除了其中具有消息的计算机可读装置之外;这种计算机可读存储装置包括当该程序在服务器或移动设备或任何合适的可编程设备上运行时,用于实现该方法的一个或多个步骤的程序代码装置。硬件设备可以是任何种类的可编程的设备,包括例如任何种类的计算机,如服务器或个人计算机等,或其任何组合。该设备还可以包括装置,其可以是例如硬件装置,像例如专用集成电路(ASIC)、现场可编程门阵列(FPGA),或硬件和软件装置的组合,例如,ASIC和FPGA,或至少一个微处理器和至少一个存储器,具有位于其中的软件模块。因此,该装置可以包括硬件装置和软件装置二者。本文描述的方法实施方式可以以硬件和软件实现。该设备还可以包括软件装置。可替代地,实施方式可以在不同的硬件设备上实现,例如,使用多个CPU。
本文的实施方式可以包括硬件和软件元件。以软件实现的实施方式包括但不限于固件、驻留软件、微代码等。由本文描述的各种模块执行的功能可以在其他模块或其他模块的组合中实现。出于本说明书的目的,计算机可用或计算机可读介质可以是能够包括、存储、通信、传播或传输程序以供指令实行系统、装备或设备使用或与指令实行系统、装备或设备结合使用的任何装备。
陈述所阐述的步骤以解释所示的示例性实施方式,并且应该预期,正在进行的技术开发将改变执行特定功能的方式。本文呈现这些示例用于说明而非限制的目的。此外,本文任意地限定了功能构建块的边界,以便于描述。可以限定替代边界,只要适当地执行指定的功能及其关系。基于本文包括的教导,替代方案(包括本文描述的那些等同物、扩展、变化、偏差等)对于相关领域(一个或多个)的技术人员将是显而易见的。这种替代方案落入所公开的实施方式的范围和精神内。此外,词语“包括”、“具有”、“含有”和“包含”以及其他类似形式意在意义上是等同的,并且是开放式的,其中这些词中的任何一个之后的一个或多个项目不意味着是这种一个或多个项目的详尽列表,或意味着仅限于所列出的一个或多个项目。还必须注意,如本文和所附权利要求中所使用的,单数形式“一(a)”、“一个(an)”和“该”包括复数指代,除非上下文另有明确说明。
此外,一个或多个计算机可读存储介质可用于实现符合本公开的实施方式。计算机可读存储介质指的是可以在其上存储处理器可读的信息或数据的任何类型的物理存储器。因此,计算机可读存储介质可以存储用于由一个或多个处理器实行的指令,包括用于使处理器(一个或多个)执行符合本文描述的实施方式的步骤或阶段的指令。术语“计算机可读介质”应该被理解为包括有形物品并且排除载波和瞬态信号,即,是非暂时的。示例包括随机存取存储器(RAM)、只读存储器(ROM)、易失性存储器、非易失性存储器、硬盘驱动器、CDROM、DVD、BLU-RAY、闪存驱动器、磁盘和任何其他已知的物理存储介质。
本公开和示例意在被认为仅是示例性的,具有所公开的实施方式的真实范围和精神由随附权利要求指示。

Claims (12)

1.一种用于获得用于促进机器学习任务的最佳母小波的方法,所述方法包括处理器实现的以下步骤:
由一个或多个硬件处理器基于多个信号识别第一组信号数据,其中所述第一组信号数据包括对应于一个或多个信号类的标记数据集;
基于所述第一组信号数据和可能的母小波组计算能量和熵的值,包括对应于通过所述可能的母小波组的小波变换的第一组信号的熵比和多级小波熵;
基于所述能量和熵的值计算第二组信号数据,包括对应于所述一个或多个信号类的所述第一组信号的质心和标准偏差的值;
基于所述第二组信号数据计算距离值组,包括对应于所述一个或多个信号类的所述质心之间的距离,其中基于对应于所述第二组信号数据的函数来计算所述距离值组;以及
基于对应于所述一个或多个信号类的所述距离值组和所述标准偏差的值,获得一个或多个最佳母小波,用于执行所述第一组信号的所述小波变换。
2.根据权利要求1所述的方法,其中,计算所述距离值组包括,基于所述能量和熵的值,使用N范数技术来归一化所述距离值组,以获得所述一个或多个最佳母小波。
3.根据权利要求1所述的方法,其中,获得所述一个或多个最佳母小波包括,基于所述标记数据集来分析所述可能的母小波组,以对所述一个或多个信号类进行分类。
4.根据权利要求1所述的方法,其中,所述获得的一个或多个最佳母小波能够通过执行所述第二组信号的小波变换来分解第二组信号,并且
其中所述第二组信号通过对对应于所述第二组信号的一个或多个信号类进行分类或回归来促进机器学习任务。
5.一种用于获得用于促进机器学习任务的最佳母小波的系统,所述系统包括:
存储器,存储指令;
一个或多个通信接口;以及
经由所述一个或多个通信接口耦合到所述存储器的一个或多个硬件处理器,其中所述一个或多个硬件处理器通过所述指令配置为:
由所述一个或多个硬件处理器基于多个信号识别第一组信号数据,其中所述第一组信号数据包括对应于一个或多个信号类的标记数据集;
基于可能的母小波组和所述第一组信号数据计算能量和熵的值,包括对应于通过所述可能的母小波组的小波变换的第一组信号的熵比和多级小波熵;
基于所述能量和熵的值计算第二组信号数据,包括对应于所述一个或多个信号类的所述第一组信号的质心和标准偏差的值;
基于所述第二组信号数据计算距离值组,包括对应于所述一个或
多个信号类的所述质心之间的距离,其中基于对应于所述第二组信号数据的函数计算所述距离值组;以及
基于对应于所述一个或多个信号类的所述距离值组和所述标准偏差的值,获得一个或多个最佳母小波,用于执行所述第一组信号的所述小波变换。
6.根据权利要求5所述的系统,其中,通过基于所述能量和熵的值,使用N范数技术归一化所述距离值组来计算所述距离值组,以获得所述一个或多个最佳母小波。
7.根据权利要求5所述的系统,其中,通过基于所述标记数据集分析所述可能的母小波组来获得所述一个或多个最佳母小波,以对所述一个或多个信号类进行分类。
8.根据权利要求5所述的系统,其中,所述获得的一个或多个最佳母小波能够通过执行所述第二组信号的小波变换来分解第二组信号,并且其中所述第二组信号通过对对应于所述第二组信号的一个或多个信号类进行分类或回归来促进机器学习任务。
9.一个或多个非暂时性机器可读信息存储介质,包括一个或多个指令,所述指令当由一个或多个硬件处理器实行时,使得所述一个或多个硬件处理器执行一种用于获得用于促进机器学习任务的最佳母小波的方法,所述方法包括:
(i)由所述一个或多个硬件处理器基于多个信号识别第一组信号数据,其中所述第一组信号数据包括对应于一个或多个信号类的标记数据集;
(ii)基于所述第一组信号数据和可能的母小波组计算能量和熵的值,包括对应于通过所述可能的母小波组的小波变换的第一组信号的熵比和多级小波熵;
(iii)基于所述能量和熵的值计算第二组信号数据,包括对应于所述一个或多个信号类的所述第一组信号的质心和标准偏差的值;
(iv)基于所述第二组信号数据计算距离值组,包括对应于所述一个或多个信号类的所述质心之间的距离,其中基于对应于所述第二组信号数据的函数来计算所述距离值组;以及
(v)基于对应于所述一个或多个信号类的所述距离值组和所述标准偏差的值,获得一个或多个最佳母小波,用于执行所述第一组信号的所述小波变换。
10.根据权利要求9所述的一个或多个非暂时性机器可读信息存储介质,其中,计算所述距离值组包括,基于所述能量和熵的值,使用N范数技术来归一化所述距离值组,以获得所述一个或多个最佳母小波。
11.根据权利要求9所述的一个或多个非暂时性机器可读信息存储介质,其中,所述获得的一个或多个最佳母小波包括基于所述标记数据集来分析所述可能的母小波组,以对所述一个或多个信号类进行分类。
12.根据权利要求9所述的一个或多个非暂时性机器可读信息存储介质,其中,所述获得的一个或多个最佳母小波能够通过执行所述第二组信号的小波变换来分解第二组信号,并且其中所述第二组信号通过对对应于所述第二组信号的一个或多个信号类进行分类或回归来促进机器学习任务。
CN201811520918.3A 2017-12-28 2018-12-12 用于获得促进机器学习任务用的最佳母小波的系统和方法 Active CN110059288B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN201721047125 2017-12-28
IN201721047125 2017-12-28

Publications (2)

Publication Number Publication Date
CN110059288A true CN110059288A (zh) 2019-07-26
CN110059288B CN110059288B (zh) 2023-04-14

Family

ID=64172222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811520918.3A Active CN110059288B (zh) 2017-12-28 2018-12-12 用于获得促进机器学习任务用的最佳母小波的系统和方法

Country Status (5)

Country Link
US (1) US11475341B2 (zh)
EP (1) EP3506125A1 (zh)
JP (1) JP6787981B2 (zh)
CN (1) CN110059288B (zh)
AU (1) AU2018271286B2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018116445A1 (de) * 2018-07-06 2020-01-09 Wobben Properties Gmbh Verfahren zum Erkennen niederfrequenter Schwingungen und Erfassungseinrichtung dafür
CN112347588A (zh) * 2020-11-26 2021-02-09 中国舰船研究设计中心 基于小波包分解的旋转机械故障诊断方法
CN114019321A (zh) * 2021-10-25 2022-02-08 国网江苏省电力有限公司 一种基于归一化标准差和小波熵的直流串联电弧故障检测方法及装置
CN116976857B (zh) * 2023-08-08 2024-03-12 中国铁建电气化局集团北方工程有限公司 一种基于深度学习的铁路电力设备预测性维护方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6542836B1 (en) * 1999-03-26 2003-04-01 Kabushiki Kaisha Toshiba Waveform signal analyzer
CN103728551A (zh) * 2013-01-30 2014-04-16 中国人民解放军海军航空工程学院 一种基于级联集成分类器的模拟电路故障诊断方法
CN107341519A (zh) * 2017-07-10 2017-11-10 电子科技大学 一种基于多分辨率分析的支持向量机识别优化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434261B1 (en) 1998-02-23 2002-08-13 Board Of Regents, The University Of Texas System Method for automatic detection of targets within a digital image
US6219373B1 (en) * 1998-06-15 2001-04-17 The United States Of America As Represented By The Secretary Of The Navy Wavelet-based interference filtering for spread-spectrum signal
US6728645B1 (en) 2003-01-07 2004-04-27 Electro-Optics Research & Development Ltd. Method and system for automatic identification of objects type according to their characteristic spectrum of vibration frequencies
CN104523266B (zh) 2015-01-07 2017-04-05 河北大学 一种心电信号自动分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6542836B1 (en) * 1999-03-26 2003-04-01 Kabushiki Kaisha Toshiba Waveform signal analyzer
CN103728551A (zh) * 2013-01-30 2014-04-16 中国人民解放军海军航空工程学院 一种基于级联集成分类器的模拟电路故障诊断方法
CN107341519A (zh) * 2017-07-10 2017-11-10 电子科技大学 一种基于多分辨率分析的支持向量机识别优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SNEHASIS BANERJEE ET AL: "Interpretable Feature Recommendation for Signal Analytics", 《CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA,NY 14853,ARXIV.ORG》 *

Also Published As

Publication number Publication date
JP6787981B2 (ja) 2020-11-18
AU2018271286B2 (en) 2020-11-05
AU2018271286A1 (en) 2019-07-18
US11475341B2 (en) 2022-10-18
US20190205778A1 (en) 2019-07-04
JP2019121376A (ja) 2019-07-22
EP3506125A1 (en) 2019-07-03
CN110059288B (zh) 2023-04-14

Similar Documents

Publication Publication Date Title
CN110059288A (zh) 用于获得促进机器学习任务用的最佳母小波的系统和方法
Dzemyda et al. Multidimensional data visualization
Matioli et al. A new algorithm for clustering based on kernel density estimation
EP3029606A2 (en) Method and apparatus for image classification with joint feature adaptation and classifier learning
Casati et al. Synthetic population generation by combining a hierarchical, simulation-based approach with reweighting by generalized raking
Nanni et al. Ensemble of deep learning, visual and acoustic features for music genre classification
CN107680600A (zh) 声纹模型训练方法、语音识别方法、装置、设备及介质
Miao et al. Underwater acoustic signal classification based on sparse time–frequency representation and deep learning
Soro et al. Joint time-frequency RSSI features for convolutional neural network-based indoor fingerprinting localization
Xie et al. Forecasting container throughput based on wavelet transforms within a decomposition-ensemble methodology: a case study of China
CN109145083A (zh) 一种基于深度学习的候选答案选取方法
Han et al. Speech emotion recognition based on Gaussian kernel nonlinear proximal support vector machine
Syam et al. Efficient similarity measure via Genetic algorithm for content based medical image retrieval with extensive features
Honda et al. PCA-guided k-means clustering with incomplete data
CN102034102B (zh) 图像显著对象提取方法、互补显著度图学习方法及系统
Arbabi et al. Data-driven modeling of strongly nonlinear chaotic systems with non-Gaussian statistics
Masood et al. Semi-advised learning model for skin cancer diagnosis based on histopathalogical images
Ba et al. Statistical descriptors of ocean regimes from the geometric regularity of SST observations
Chen et al. Experiments with rough set approach to face recognition
Wang et al. VMF-SNE: embedding for spherical data
Lu et al. Flower classification based on single petal image and machine learning methods
Blachnik et al. Simplifying SVM with weighted LVQ algorithm
Sengottuvelan et al. Object classification using substance based neural network
Arulmozhi et al. ALRC: A novel adaptive linear regression based classification for grade based student learning using radio frequency identification
CN117476036B (zh) 一种环境噪声识别方法、系统、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant