CN114098764B - 数据处理方法、装置、电子设备和存储介质 - Google Patents

数据处理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114098764B
CN114098764B CN202111309087.7A CN202111309087A CN114098764B CN 114098764 B CN114098764 B CN 114098764B CN 202111309087 A CN202111309087 A CN 202111309087A CN 114098764 B CN114098764 B CN 114098764B
Authority
CN
China
Prior art keywords
brain wave
wave data
preset
data
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111309087.7A
Other languages
English (en)
Other versions
CN114098764A (zh
Inventor
陈松蹊
童培峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202111309087.7A priority Critical patent/CN114098764B/zh
Publication of CN114098764A publication Critical patent/CN114098764A/zh
Application granted granted Critical
Publication of CN114098764B publication Critical patent/CN114098764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • A61B5/372Analysis of electroencephalograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7203Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7225Details of analog processing, e.g. isolation amplifier, gain or sensitivity adjustment, filtering, baseline or drift compensation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Surgery (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Psychiatry (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychology (AREA)
  • Power Engineering (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本申请公开了一种数据处理方法、装置、电子设备和存储介质。该方法包括:获取检测对象的第一脑电波数据,其中,所述第一脑电波数据包括所述检测对象的各通道的脑电波数据;响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据;其中,所述第一子脑电波数据为所述第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据;去除所述第二脑电波数据中的噪声数据,得到第三脑电波数据;根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本。采用本申请提供的数据处理方法,可以实现用较少的训练样本得到较高精度的发病时段标注模型的效果。

Description

数据处理方法、装置、电子设备和存储介质
技术领域
本申请涉及数据处理领域,具体涉及一种数据处理方法、装置、电子设备和存储介质。
背景技术
医生在获取到检测对象的一段时间的脑部监测数据后,需要将该段时间内的脑电波数据中感兴趣时段标注出来,然后将标注后的脑电波数据进行存档。
目前,现有的脑电波数据的标注方法通常是采用发病时段标注模型来进行,而发病时段标注模型是以采集到的原始的脑电波数据作为训练样本来进行训练得到的,而利用原始的脑电波数据作为训练样本,会导致发病时段标注模型的训练样本数据量较大。
发明内容
本申请实施例的目的是提供一种数据处理方法、装置、电子设备和存储介质,以实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
本申请的技术方案如下:
第一方面,提供了一种数据处理方法,该方法包括:
获取检测对象的第一脑电波数据,其中,所述第一脑电波数据包括所述检测对象的各通道的脑电波数据;
响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据;其中,所述第一子脑电波数据为所述第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据;
去除所述第二脑电波数据中的噪声数据,得到第三脑电波数据;
根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本。
第二方面,提供了一种数据处理装置,该装置包括:
获取装置,用于获取检测对象的第一脑电波数据,其中,所述第一脑电波数据包括所述检测对象的各通道的脑电波数据;
第一确定模块,用于响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据;其中,所述第一子脑电波数据为所述第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据;
第二确定模块,用于去除所述第二脑电波数据中的噪声数据,得到第三脑电波数据;
构建模块,用于根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现本申请实施例任一所述的数据处理方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现本申请实施例任一所述的数据处理方法的步骤。
本申请的实施例提供的技术方案至少带来以下有益效果:
本申请实施例提供的数据处理方法,通过获取检测对象的第一脑电波数据,响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据,去除第二脑电波数据中的噪声,得到第三脑电波数据,根据第一脑电波数据和第三脑电波数据,构建发病时段标注模型的训练样本,由于第一子脑电波数据为第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据,如此由于输入到发病时段标注模型中的训练样本仅标注了一段,并未完全标注完成,如此节省了标注时间,此外,由于在将脑电波数据输入到发病时段标注模型之前对脑电波数据进行了去噪,如此,可避免输入到发病时段标注模型中的脑电波数据由于噪声数据的干扰,导致若想使发病时段标注模型的训练精度高,则需要较多的训练样本,通过本申请实施例的数据处理方法,实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
图1是本申请一示例性实施例提供的一种数据处理方法的流程示意图一;
图2是本申请一示例性实施例提供的第二脑电波数据的形成过程示意图;
图3是本申请一示例性实施例提供的对脑区进行分区的示意图;
图4是本申请一示例性实施例提供的第五脑电波数据的形成过程示意图;
图5是本申请一示例性实施例提供的一种数据处理方法的流程示意图二;
图6是本申请一示例性实施例提供的特征提取的流程示意图;
图7是本申请一示例性实施例提供的一种数据处理装置的结构示意图;
图8是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的例子。
现有技术中的脑电波数据的标注方法通常是采用发病时段标注模型来进行,而发病时段标注模型是以采集到的原始的脑电波数据作为训练样本来进行训练得到的,由于原始的脑电波数据中具有噪声数据(例如,在获取脑电波数据的过程中,检测对象眨眼、头部稍微晃动等都会造成噪声数据),利用原始的脑电波数据作为训练样本,若需要得到一定精度的发病时段标注模型,则由于噪声数据的干扰,需要很多训练样本。且在训练时是操作人员(例如医师等)是将所有的原始的脑电波数据中的预设疾病的发病时段进行标注,如此导致操作人员的工作量大,效率低。
为了解决上述问题,本申请实施例提供了一种数据处理方法,通过获取检测对象的第一脑电波数据,响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据,去除第二脑电波数据中的噪声,得到第三脑电波数据,根据第一脑电波数据和第三脑电波数据,构建发病时段标注模型的训练样本,由于第一子脑电波数据为第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据,如此由于输入到发病时段标注模型中的训练样本仅标注了一段,并未完全标注完成,如此节省了标注时间,此外,由于在将脑电波数据输入到发病时段标注模型之前对脑电波数据进行了去噪,如此,可避免输入到发病时段标注模型中的脑电波数据由于噪声数据的干扰,导致若想使发病时段标注模型的训练精度高,则需要较多的训练样本,通过本申请实施例的数据处理方法,实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的信息处理方法进行详细地说明。
图1是本申请实施例所提供的一种数据处理方法的流程示意图,如图1所示,本申请实施例提供的数据处理方法可以包括步骤110-步骤140。
步骤110、获取检测对象的第一脑电波数据。
其中,第一脑电波数据可以包括检测对象的各通道的脑电波数据。
步骤120、响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据。
其中,第一子脑电波数据可以为第一脑电波数据中按照时间顺序,预设时间段之前的脑电波数据。
步骤130、去除第二脑电波数据中的噪声数据,得到第三脑电波数据。
步骤140、根据第一脑电波数据和第三脑电波数据,构建发病时段标注模型的训练样本。
在本申请的实施例中,通过获取检测对象的第一脑电波数据,响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据,去除第二脑电波数据中的噪声,得到第三脑电波数据,根据第一脑电波数据和第三脑电波数据,构建发病时段标注模型的训练样本,由于第一子脑电波数据为第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据,如此由于输入到发病时段标注模型中的训练样本仅标注了一段,并未完全标注完成,如此节省了标注时间,此外,由于在将脑电波数据输入到发病时段标注模型之前对脑电波数据进行了去噪,如此,可避免输入到发病时段标注模型中的脑电波数据由于噪声数据的干扰,导致若想使发病时段标注模型的训练精度高,则需要较多的训练样本,通过本申请实施例的数据处理方法,实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
下面对本申请实施例提供的数据处理方法进行详细介绍。
首先介绍步骤110,获取检测对象的第一脑电波数据。
其中,检测对象可以是已经进行了检测的对象,具体的可以是进行了脑电波检测的对象。
第一脑电波数据可以是获取的检测对象的脑电波数据,该脑电波数据可以是获取的检测对象的原始的脑电波数据,即直接基于脑电波数据检测设备而获取的脑电波数据。
在本申请的一些实施例中,可以是基于脑电波数据检测设备来获取第一脑电波数据。
在本申请的一些实施例中,由于脑电波数据检测设备在获取第一脑电波数据时,脑电波数据检测设备具有多个通道,故获取的第一脑电波数据可以包括检测对象的各通道的脑电波数据。
然后介绍步骤120、响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据。
其中,第一子脑电波数据可以为第一脑电波数据中按照时间顺序,预设时间段之前的脑电波数据。
预设时间段可以是预先设置的第一脑电波数据中的时间段。例如可以是1天。
在本申请的一些实施例中,预设疾病可以是与脑电波数据有关的预先设置的疾病,例如可以是癫痫等。
在本申请的一些实施例中,发病时段可以是发生预设疾病的时段。
对第一子脑电波数据中的预设疾病的发病时段的标注操作可以是对第一子脑电波数据中发生预设疾病的时段的标注操作,具体的可以是医生等医护工作人员将获取的第一子脑电波数据中,将预设疾病的时段进行手动标注的操作。
在本申请的一些实施例中,第二脑电波数据可以是在第一脑电波数据中标注了预设时间段内的预设疾病的发病时段的脑电波数据。即在第二脑电波数据中,按照时间顺序,在预设时间段内标注有预设疾病的发病时段,预设时间段之后的脑电波数据中未进行标注。
在一个示例中,如图2所示,图2为第二脑电波数据的形成过程示意图。图2中的脑电波数据A为获取的检测对象2天内的脑电波数据(即第一脑电波数据),可以将检测对象第1天内的脑电波数据(即图2中的脑电波数据B,即第一子脑电波数据)中具有预设疾病的发病时段的脑电波数据进行标注出来(例如可以是将图2中的脑电波数据B中的B1、B2和B3标注出来,这里的B1、B2和B3即为预设疾病的发病时段),响应于该标注操作,可得到第二脑电波数据,即图2的结果。
在本申请的一些实施例中,可以提供操作人员交互界面,以便操作人员可在交互界面上进行标注,在此可允许操作人员选取常用的数据滤波模式和数据导联模式,如0.53-70Hz的带通滤波和50Hz的带阻滤波,双极导联等。
接着介绍步骤130、去除第二脑电波数据中的噪声数据,得到第三脑电波数据。
其中,第三脑电波数据可以是将第二脑电波数据中的噪声去除后所得到的脑电波数据。
在本申请的一些实施例中,由于检测对象在进行检测时,即在利用脑电波数据检测设备获取检测对象的脑电波数据时,检测对象可能出现眨眼、微小晃动等动作,这些动作会导致获取到的脑电波数据相较于检测对象没有任何动作的情况下的脑电波数据具有一定的不规则性,例如,脑电波数据会具有较大的起伏,此类数据称之为噪声数据。
在本申请的一些实施例中,为了进一步实现用较少的训练样本得到较高精度的发病时段标注模型的效果,步骤130具体可以包括:
设定第二脑电波数据满足预设序列模型条件;
对满足预设序列模型条件的第二脑电波数据进行求解,得到与第二脑电波数据对应的第一约束参数;
设定与第二脑电波数据对应的第二约束参数满足预设约束条件;
确定在预设约束条件下,第一约束参数中第一子约束参数的预设估计值;
在预设估计值满足预设条件的情况下,基于第一约束参数中的第二子约束参数确定第三脑电波数据。
其中,预设序列模型条件可以是预先设置的序列模型。例如可以是多元线性时间序列模型。
第一约束参数可以是在第二脑电波数据满足预设序列模型条件的情况下,对该第二脑电波数据进行求解所得到的参数。
在本申请的一些实施例中,第一约束参数可以是有多个,具体的第一约束参数可以包括第一子约束参数和第二子约束参数。第一子约束参数和第二子约束参数可以是对满足预设序列模型条件的第二脑电波数据进行求解所得到的参数。
在本申请的一些实施例中,在设定第二脑电波数据满足预设序列模型条件时,与第二脑电波数据对应的参数可以有多个,具体的除了第一约束参数外,还可以具有第二约束参数,故第二约束参数也可以是与第二脑电波数据对应的参数。
在本申请的一些实施例中,第二约束参数可以是用于表征第二脑电波数据中的预设疾病数据的参数。
在本申请的一些实施例中,在去除第二脑电波数据中的噪声数据,得到第三脑电波数据时可以采用独立分量分析方法来实现,下面详细介绍如何去除第二脑电波数据中的噪声数据,得到第三脑电波数据:
设定第二脑电波数据服从如下公式(1)的多元性时间序列模型(即设定第二脑电波数据满足预设序列模型条件):
x(t)=As(t) (1)
其中,在公式(1)中,x(t)=[x1(t),…,xp(t)]T,t=1,…,T;p为第二脑电波数据的通道数量;x(t)是在时刻t下,均值为0的p维脑电波数据(即第二脑电波数据);s(t)=[s1(t),…,sp(t)]T,t=1,…,T;s(t)是时刻t下,均值为0的p维独立分量,其空间维度独立,但允许保有时间维度的自相关性;A是p×p维的混合矩阵。
需要说明的是,这里遵循独立分量模型的一般假设,即没有模型误差,独立分量个数和第二脑电波数据的维数相等。
需要说明的是,上述x(t)=[x1(t),…,xp(t)]T为第二脑电波数据,但是其实也可以是第一脑电波数据,因为第一脑电波数据和第二脑电波数据的区别仅在于是否有预设疾病的发病时段的标注,故其实x(t)=[x1(t),…,xp(t)]T可以是第一脑电波数据,也可以是第二脑电波数据,这里可根据用户需求自行选取,其计算方法是一致的。
不失一般性的,可以将第二脑电波数据x(t)变换为空间不相关的数据z(t)。令x(t)的协方差矩阵为Σ,考虑V=Σ-1/2,有
z(t)=Vx(t)=VAs(t)=Hs(t) (2)
在上述公式(2)中,z(t)的协方差矩阵为Ip,故空间不相关。
因为s(t)空间独立,故可知H是正交矩阵。若s(t)包含至多一个正态分量且限制H标准正交,此时可以通过最大化负熵或最大化以四阶矩表示的非正态程度等方式求解上述公式(2)(即对对满足预设序列模型条件的第二脑电波数据进行求解)。
具体的对公式(2)进行求解的过程如下:
具体的,可以使用Hyvarinen提出的Fast ICA方法求解上述公式(2)中的H和s(t)的值和/>(即第一约束参数,其中H可以为第一子约束参数,s(t)可以为第二子约束参数)。
首先,令s(t)=Wz(t),其中W=H-1,W是逆混合矩阵。考虑s(t)的概率密度函数f(s(t)),其微分熵被定义为如下公式(3):
其中,为s(t)的微分熵。
接下来,基于微分熵可以定义s(t)的负熵为:
其中,J(s(t))为s(t)的负熵;sgauss(t)是一个正态分布的随机变量,与s(t)有着相同的均值和协方差矩阵。
由于负熵有着线性变换不变性,对于任意的非零矩阵A,具有如下公式(5)所示的性质:
J(x(t))=J(As(t))=J(s(t)) (5)
使用交叉信息量来表示随机变量之间的相关性。对于不相关的随机变量,其交叉信息量可以被表示为如下公式(6):
利用负熵的线性变换不变性,最大化变量独立性等价于最小化交叉信息量,等价于对每一维度的J(si(t))单独进行最大化。
为了实现最大化J(si(t)),使用如下公式(7)逼近:
J(si(t))≈c(E(G(si(t))))-E(G(v)) (7)
在公式(7)中,c是不相关的常数;E(·)为求取随机变量的期望;G(u)=log coshu,ν是一个标准正态分布的随机变量。
因此,上述问题变为求解如下公式(8)和公式(9)的优化问题:
使得
其中,wi是矩阵W的第i行向量,δjk是Kronecker delta函数,当且仅当j=k时,δjk等于1,否则δjk=0。
求解上述优化问题可以通过牛顿法,即每一步通过下述公式(10)和(11)更新wi
其中,是更新后的wi,/>为求解过程中由(10)式定义的中间变量。
在本申请的实施例中,其实是在计算/>的过程中的中间变量,也可以是相当于是/>只是/>的模不是1,故/>是模为1的/>
下一步迭代开始时,令再重复上述步骤。当迭代次数达到预定的上限,或与wi的差距很小时,停止迭代。为了避免求解得到的p个wi收敛到同一点,在每一步迭代中可以使用Gram-Schmidt正交化更新所有wi使它们之间保持正交性。
以上为无约束下的独立分量分析方法。进一步的,可以对混合矩阵A施加空间约束(即设定与第二脑电波数据对应的第二约束参数满足预设约束条件,这里的第二约束参数可以是混合矩阵A的某些列向量)。
令A=[Ac,Au],其中Ac是被约束的p×p′维混合矩阵,第i列代表独立分量si(t)映射为x(t)的空间投影方式。Au是无约束的p×(p-p′)维混合矩阵。相对应的,我们可以切分标准正交阵H=[Hc,Hu]。
其中,p′为比p小的数值,任意p′为比p小均可,这里不作限定。
给定约束条件Hc,可以使用余弦相似度表示估计得到的与Hc的不相似程度,并对估计值施加软约束。其中,/>是Hc的估计值。
令hc为Hc的一列模长为1的向量,是hc的估计值,我们在约束/>以及/>的条件下进行求解H的估计值/>
上述H的估计值的求解过程可被分为交替的两步:1.使用无约束的求解方法得到(即上述公式(8)和(9)),交换/>和/>的位置为/>使用Gram-Schmidt过程(即上述的公式(10)和(11)的方法)更新/>2.每求出一次/>和/>就进行一次判断,判断/>和/>是否满足余弦约束,若不满足余弦约束,将/>对Hc进行投影,使得对应列向量间的夹角为α,得到新的/>符合约束的估计值,并再次交换/>和/>的位置为/>使用Gram-Schmidt过程更新/>重复这一过程直至收敛(即当迭代次数达到预定的上限,或当前求解的/>与上次求解的/>的差距很小时收敛)。
上述对和/>进行迭代的过程,即为在Hc和Hu的预估值满足预设条件(即满足余弦约束)情况下,根据第二子约束参数s(t)可确定第三脑电波数据。
在本申请的一些实施例中,为了精确确定第三脑电波数据,所述基于第一约束参数中的第二子约束参数确定第三脑电波数据,具体可以包括:
设定第二脑电波数据的相似度小于预设阈值的第一独立分量集合,以及与第二子约束参数对应的第二独立分量集合;
获取第一独立分量集合和第二独立分量集合的交集;
将交集确定为第三脑电波数据。
其中,预设阈值可以是预先设置的第二脑电波数据的相似度的阈值。
第一独立分量集合可以是第二脑电波数据的相似度小于预设阈值的独立分量集合。
第二独立分量集合可以是与第二子约束参数对应的独立分量集合。
在本申请的一些实施例中,继续参考上述求解过程,为了实现上述求解过程,还需指定合适的空间约束(即需要给定合适的Hc的值)。为此,可以使用无约束的独立成分分析方法,在第一子脑电波数据上估计合适的约束条件。
令T1={t:t∈发病时段},T2={t:t∈非发病时段}分别表示第二脑电波数据中发病时段与非发病时段的时间索引集合,和/>分别表示在第二脑电波数据上使用无约束独立分量分析拟合得到的混合矩阵的估计值和独立分量的估计值。对于每一个独立分量i=1,…,p,分别考察其与发病期脑电波信号的相似程度以及其在发病期与非发病期信号能量的差异。考虑/>为/>与xj(t),t=1,…,T的Spearman相关系数。
其中,公式(12)为在发病时段的能量。
其中,公式(13)为在非发病时段的能量。
可以定义与预设疾病信号相似的独立分量集合(即第一独立分量集合)为如下公式(14):
在预设疾病的发病时段有较高能量的独立分量集合(即第二独立分量集合)为如下公式(15):
其中,ζ1k和ζ2k作为阈值使得集合S1和S2中各包含k个元素(例如可以是5个元素,即仅包含第一约束参数中的第二子约束参数中的与预设疾病信号关系最为密切的5维数据)。
令S=S1∩S2,如此可最终得到了作为预设疾病信号的独立分量集合S,以及相对应的空间约束条件基于这一空间约束条件,可以在第二脑电波数据上进行空间约束的独立分量分析,得到估计的/>和/>
通过空间约束的独立分量分析,最终目的是提取第一脑电波数据中的预设疾病信号,同时过滤不相关的生理信号和伪差(即噪声数据)。这一目的的实现可以通过去除与预设疾病信号无关的独立分量,再进行逆独立分量变换得到。为此,可以定义预设疾病信号增强的序列为如下公式(16)和(17):
其中,和/>分别代表独立分量估计中的被约束部分(其中,/>为噪声数据对应的独立分量,/>为非噪声数据对应的独立分量),y(t)代表预设疾病信号增强的脑电波数据(即第三脑电波数据),用于取代x(t)(即第二脑电波数据),y*(t)则是y(t)在各个通道上的平均值,用于随后的预设疾病信号强度特征提取。
通过上述计算,可去除第二脑电波数据中的噪声数据,得到第三脑电波数据。
在本申请的一些实施例中,还可以通过上述去除第二脑电波数据中的噪声数据的方式,去除第一脑电波数据中的噪声数据,具体的在此不再赘述。
在本申请的实施例中,通过对第二脑电波数据中的噪声数据进行清除,可得到没有噪声数据的第三脑电波数据,如此可基于该第三脑电波数据对发病时段标注模型进行训练,如此,由于输入到发病时段标注模型中的脑电波数据没有噪声数据的干扰,故若想使发病时段标注模型的训练精度高,则需要相对现有技术而言更少的训练样本,实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
最后介绍步骤140、根据第一脑电波数据和第三脑电波数据,构建发病时段标注模型的训练样本。
在本申请的一些实施例中,在得到第三脑电波数据后,可根据第一脑电波数据和第三脑电波数据,构建发病时段标注模型的训练样本,如此可用较少的训练样本得到较高精度的发病时段标注模型的效果。
在本申请的一些实施例中,在对发病时段标注模型进行训练时,需要第三脑电波数据(第三脑电波数据中具有标注的发病时段),同时也需要第一脑电波数据(这是因为需要利用与第三脑电波数据中进行标注的发病时段相同的在第一脑电波数据中未被标注的脑电波数据)。
在一个示例中,若第三脑电波数据中具有脑电波数据P,其中P中的一段Q被标注了发病时段,则在对发病时段标注模型进行训练时,除了需要标注的Q段脑电波数据外,还需要在第一脑电波数据中与Q段相同的未被标注的脑电波数据,如此在利用发病时段标注模型进行训练时,才可以得到未被标注脑电波数据的预测标注时段,将预测标注时段与之前标注的时段进行比对,得到发病时段标注模型的损失函数,基于损失函数,迭代训练发病时段标注模型。
需要说明的是,在利用第一脑电波数据构建训练样本时,同时利用了去除噪声数据后的第一脑电波数据和原始第一脑电波数据,因为去除噪声可能引入新的误差,带来去掉预设疾病数据而带来的风险,后续随机森林分类其可自动确定去除噪声数据后的第一脑电波数据(即第三脑电波数据)和原始第一脑电波数据(即第一脑电波数据)的权重,在去除噪声的脑电波数据(即第三脑电波数据)表现好的情况下,可少用或不用初始的脑电波数据(即第一脑电波数据)。
在本申请的一些实施例中,由于第一脑电波数据和第三脑电波数据均为连续的信号,直接对其进行分类(即将其分出发病时段和非发病时段)是很困难的,故可以通过将连续的信号切分为离散的时间片段,在每一离散的片段上计算其特征统计量,并基于这些特征统计量对片段进行分类。此外,整段长程脑电波数据往往是时间维度不平稳的,不平稳性导致其特征统计量随着时间的推移而发生变化。分段平稳建模是一种常用的处理不平稳性的方法,其可以假设不平稳的时间序列可以分解为多个平稳的片段,故可以找到平稳片段之间的转换时刻,以这些变点时刻为基础,对时间片段进行切分,提高发病时段标注模型的识别精度。
在现有技术中,通常是将脑电波数据每隔预设时间进行切断,例如可以是每隔4秒就切断,如此导致切断不够精确,进而导致其计算的特征统计量不够精确,进而导致发病时段标注模型的识别精度不够高。
然而,在本申请实施例中是利用自适应分割时段算法精确计算出变点位置,基于变点位置,将脑电波数据进行分段,如此可精确确定特征统计量不够精确,进而提高发病时段标注模型的识别精度。
在本申请的一些实施例中,为了进一步提高发病时段标注模型的识别精度,在步骤130之后,上述所涉及的数据处理方法还可以包括:
对第三脑电波数据的变化进行校验,确定第三脑电波数据中发生突变的变点位置;
基于变点位置,将第三脑电波数据进行分段,得到至少一段第四脑电波数据。
其中,发生突变的变点位置可以是第三脑电波数据中发生突变的位置。
第四脑电波数据可以是将第三脑电波数据进行分段后所得到的每段脑电波数据。
需要说明的是,在确定第三脑电波数据中发生突变的变点位置时可以是在不同频率区间单独进行,即在某一个频率区间中确定第三脑电波数据中发生突变的变点位置,然后在另外一个频率区间中也确定第三脑电波数据中发生突变的变点位置,将各频率区间确定出的变点位置分别用于后续的发病时段标注模型,发病时段标注模型在哪个频率区间下的精确度高,就选哪个频率区间。
在本申请的一些实施例中,可以通过自适应分割时段算法来对第三脑电波数据的变化进行校验,确定第三脑电波数据中发生突变的变点位置。具体的实现方式如下:
在介绍确定第三脑电波数据中发生突变的变点位置之前,首先需要说明的一点是上述公式(17)中的y(t)即为第三脑电波数据,但该脑电波数据并不是满秩的,在确定变点位置时,需要用满秩的脑电波数据,在利用独立分量分析算法求解出的是满秩的,即y(t)的维数比/>的维数要高,y(t)和/>的变点位置是一样的。故检验第三脑电波数据中的变点等价于检验被约束的独立分量中的变点。即获取被约束的独立分量数据/>由于的均值恒为0,可以对其二阶协方差的变化进行检验,找到二阶信息突变的位置作为变点。
为了表述的简便,可以使用s(t)指代预设维度的预设疾病独立分量假设存在N个变点0=η01<…<ηNN+1=T,将整个观测时段分为N+1段,第k个片段(ηk-1k]内的数据具有平稳性。考虑如下的局部平稳小波模型,即每个片段符合如下公式(18)的局部平稳小波模型:
其中,其是Haar小波的母小波函数;i和k分别是尺度(即频率区间)和位置参数(即每个片段中的哪个时刻);ξij(k)代表随机扰动项;/>代表小波系数。
利用局部平稳小波模型,可以将预设疾病信号分解为各个位置和尺度的基函数的加和,同时引入了可乘误差项。
进一步的,可以对误差扰动项ξij(k)的相关性质进行建模。假设ξi(k)=[ξi1(k),…,ξi5(k)]T,独立生成于如下公式(19)的多元正态分布:
在上述公式(19)中,公式(19)满足如下公式(20)-(21):
其中,δii′是Kroneckerδ函数,当i=i′时输出1,否则输出0。
假设扰动项在不同尺度、不同位置之间没有相关性,所有的相关性来自变量之间。不妨令u=t/T是归一化后的时间,遵循局部平稳性质,可以假设Wij(u)和Σi,(j,l)(u)均为分段常数函数。因此,可以将尺度i的变点集合写为如下公式(22)-(23)的形式:
因此s(t)的所有变点集合可表示为如下公式(24):
为了估计上述变点,定义尺度i上的经验小波周期谱和交叉周期谱为如下公式(25):
其中,wij(t)=∑usj(u)ψi(t-u)是经验小波系数;sgn(·)是符号函数;corr(·)返回相关系数。
令Ii满足如下公式(26):
其中,Ii是尺度i周期谱和交叉周期谱的集合。
由于小波周期谱与第二脑电波数据的序列的协方差具有一一对应关系,检验上述定义的协方差变点集合等价于检验小波周期谱和交叉周期谱上的变点。为此,可以使用阈值CUSUM统计量。给定长度为n=e-s+1的待检验区间{(s,e):1≤s<e≤T},CUSUM统计量定义为如下公式(27)-(28):
其中,τi,(j,l)是针对该维统计量的阈值,可以使用蒙特卡洛方法模拟计算。由此,在尺度i和区间(s,e)内估计得到的变点为公式(29):
这里0.5<c*<1是控制变点远离端点的参数。
最后,可以采用二分的方式估计尺度i上整个区间的变点。具体的,可以先令(s,e)=(1,T),在整个区间上找到最显著的变点接下来,考虑区间/>和/>在这两个区间上分别寻找显著变点,并基于找到的变点继续二分区间。如果在每个区间上都不能找到显著的变点,则停止算法的搜寻,并得到最终的变点集合/>
不同的尺度i代表着不同的频率范围。以256Hz采样率为例,可以选择8~16Hz、16~32Hz、32~64Hz三个频率范围分别估计变点,并基于第三脑电波数据选择表现最好的频率范围作为最终变点估计尺度,令这一尺度上得到的变点集合为
根据上述方式可得到第三脑电波数据中发生突变的变点位置,然后可基于这些变点位置,将第三脑电波数据进行分段,得到至少一段第四脑电波数据。
在本申请的一些实施例中,在得到至少一段第四脑电波数据后,对应的步骤140可以包括:
根据第一脑电波数据和第四脑电波数据,构建发病时段标注模型的训练样本。
在本申请的实施例中,通过对第三脑电波数据的变化进行校验,得到第三脑电波数据中发生突变的变点位置,然后可基于这些变点位置,将第三脑电波数据进行分段,得到至少一段第四脑电波数据,如此可精确确定第三脑电波数据中发生突变的变点位置,进而可得到精确的分段片段,进而提高提高发病时段标注模型的识别精度。
在本申请的一些实施例中,在多数情形下,基于空间约束的独立分量分析算法能够取得很好的效果。然而,如果独立分量分析所假设的空间约束随着时间发生了变化,那么该算法可能失效。特别的,对于没有明显预设疾病源区域的预设疾病种类,可能不存在稳定的空间约束关系,从而导致对预设疾病信号的增强效果较差。
为了解决这一问题,可以考虑引入医生在诊断预设疾病时用到的拓扑学特征——特征预设疾病病理波形,来辅助预设疾病的识别过程。
在本申请的一些实施例中,为了进一步的实现用较少的训练样本得到较高精度的发病时段标注模型的效果,在步骤110之后,上述所涉及的数据处理方法还可以包括:
根据第一脑电波数据对应的频率范围,以及预设的基函数对应的频率范围,构建基函数字典;
根据第一脑电波数据以及基函数字典,确定第一脑电波数据对应的基函数集合,以及第一脑电波数据对应的组合系数。
其中,预设的基函数可以是根据第一脑电波数据对应的频率范围预先设置的基函数。
基函数字典中可以包括至少一个基函数集合,每个基函数集合可以包括第一脑电波数据,以及与第一脑电波数据对应的基函数。
组合系数可以是用于表征第一脑电波数据的稀疏性的系数。
在本申请的一些实施例中,具体的解决独立分量分析所假设的空间约束随着时间发生了变化,算法可能失效的问题,可以是利用匹配追踪算法来实现的,具体的实现过程可以是:
匹配追踪算法可以是通过建立一套冗余的基函数集合(字典),将信号分解为这些基函数的稀疏线性组合。基函数的选取通常要求其具有不同的时域-频域特征,且能量集中于局部的时域和频域。为此,可以使用“正弦波”和“半正弦波”来表示预设疾病信号中的“慢波”信号,使用“尖波”来表示预设疾病信号“尖波”(70~200ms)和“棘波”(<70ms)信号,使用“Haar波”来避免发病时段标注模型的过拟合。
如表1所示,给出了所选基函数的函数形式,定义域范围以及频率选取。
需要说明的是,本申请实施例中是将“正弦波”和“半正弦波”重复了三个周期来提高识别的特异性,且所有的基函数都是零均值的。
表1
/>
基于以上给出的四类零均值波形函数,可以构建冗余的基函数字典Ψ={φk,f,λ(t)},字典中包含的元素可以用如下公式(30)来表示:
其中,φλ(·)是定义的4类波形函数形式,λ=1,…,4;k=1,…,T是位置参数;f是频率参数;σλ是与基函数有关的尺度参数,使得调整后的基函数能量‖σλφλ(t)‖=1。
在得到上述基函数字典后,可根据第一脑电波数据以及基函数字典,确定第一脑电波数据对应的基函数集合,以及第一脑电波数据对应的组合系数。
在本申请的一些实施例中,具体的根据第一脑电波数据以及基函数字典,确定第一脑电波数据对应的基函数集合,以及第一脑电波数据对应的组合系数可以包括:
计算第一脑电波数据对应的基函数字典中的每个基函数集合与第一预设残差的内积绝对值;
基于内积绝对值,更新基函数集合;
对更新后的基函数集合进行线性回归,得到组合系数;
基于组合系数,确定回归残差,将所述回归残差作为第一预设残差,
重复执行上述步骤,直至第一预设残差的模小于预设残差阈值,或迭代次数大于预设迭代次数的情况下,输出基函数集合,以及组合系数。
其中,第一预设残差可以是预先设置的初始残差。
预设残差阈值可以是预先设置的第一预设残差的模所对应的阈值。
预设迭代次数可以是预先设置的迭代次数。
在本申请的一些实施例中,具体的如何据第一脑电波数据以及基函数字典,确定第一脑电波数据对应的基函数集合,以及第一脑电波数据对应的组合系数,可以利用如下方式进行实现:
给定第一脑电波数据x(t)=[x1(t),…,xp(t)]T,t=1,…,T和基函数字典Ψ={φk,f,λ},正交匹配追踪算法的计算过程如下所示:
(1)考虑第一脑电波数据的第i个通道xi=[xi(1),…,xi(T)]T,给定最大基选取个数为Mmax,停止残差阈值为ε0。初始化迭代过程,令迭代次数m=0,被选中的基函数集合初始残差∈im=xi
(2)令m=m+1,计算基函数字典中的每一个基函数φk,f,λ与残差∈im的内积绝对值|<φk,f,λ,∈m>|,令使得内积绝对值最大的基函数为更新被选中的基函数集合为/>
(3)将中已有的基函数作为列向量,记作矩阵Ψim,使用Ψim对xi进行线性回归,即考虑xi=Ψimβim+∈im,使用最小二乘方法估计回归系数/>令更新后的残差为/>
(4)若‖∈im‖<ε0或m≥Mmax,停止迭代,输出和/>否则,回到第(2)步中继续计算。
基于匹配追踪算法,可以最终得到每一个通道的第一脑电波数据xi对应的基函数集合和其对应的组合系数/>当限制最大基函数个数Mmax较小或停止残差阈值ε0较大时,这一表示具有稀疏性。
需要说明的是,上述给定第一脑电波数据x(t)=[x1(t),…,xp(t)]T,也可以是给定第二脑电波数据,第一脑电波数据和第二脑电波数据的区别仅在于是否有预设疾病的发病时段的标注,
需要说明的是,上述步骤(1)中最大基选取个数的含义是从上述的4类基函数中选取预设个数(这里的预设个数可以根据用户需求自行选取,这里不做限定)。由于4类基函数中每个基函数具有不同的频率范围,还有不同定义域,故这4类基函数所表征的数据很多,为了减轻数据处理的计算量,这里可以是从上述的4类基函数中选取预设个数作为后续的计算。
在本申请实施例中,通过计算第一脑电波数据对应的基函数字典中的每个基函数集合与第一预设残差的内积绝对值,基于内积绝对值,更新基函数集合,对更新后的基函数集合进行线性回归,得到组合系数,基于组合系数,更新第一预设残差,重复执行上述步骤,直至第一预设残差的模小于预设残差阈值,或迭代次数大于预设迭代次数的情况下,输出基函数集合,以及组合系数,如此可以得到稀疏性较好的第一脑电波数据系数表示(即组合系统),避免由于独立分量分析所假设的空间约束随时间发生变化,导致独立分量分析方法无法使用,进而导致无法对第二脑电波数据中的噪声数据完全去除的问题,如此进一步的实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
在本申请的一些实施例中,在匹配追踪算法中,对于每一个脑电波通道i所对应的数据,获得了第二脑电波数据的基函数表示集合和对应的组合系数/>由于上述基函数集合中的数据过多,为了减轻数据处理的压力,可以对上述得到的基函数集合中的数据进行降维处理。
在本申请的一些实施例中,为了减轻数据处理的压力,在所述根据第一脑电波数据以及基函数字典,确定第一脑电波数据对应的基函数集合,以及第一脑电波数据对应的组合系数之后,上述所涉及的数据处理方法还可以包括:
对基函数集合和组合系数进行系数序列计算,得到第一脑电波数据对应的第一系数序列;
将各通道对应的第三脑电波数据的第一系数序列进行汇总,得到第二系数序列的第三子脑电波数据。
其中,第一系数序列可以是对基函数集合和组合系数进行系数序列计算后所得到的与第一脑电波数据对应的序列。
第二系数序列可以是对各通道对应的第一脑电波数据的第一系数序列进行汇总所得到的序列。
在本申请的一些实施例中,具体可以通过如下方式对数据进行降维处理:
首先,对于每一个脑电波通道i,可以提取其对应于“慢波”和“尖波”的基函数以及系数。下面公式中的λ=1,2对应于慢波基底,λ=3对应于尖波基底。对于每一类脑电波信号的基底,可以将其组合系数对应于位置参数k,再对所有备选的频率参数f进行加总。例如,令集合/> 是对应于基函数φk,f,λ估计的回归系数。定义:
根据上述公式(31)和(32)可以得到脑电波通道i的慢波系数序列SLOWi(t)和尖波(棘波)系数序列SHARPi(t)(即第一系数序列)。
接下来,将脑电波通道i的系数序列(第一系数序列)针对脑区进行加总。如图3所示(在图3中,相同的纹理代表同一脑区,例如,图3中的A1和A2是相同的纹理进行标注的,即A1和A2属于相同的脑区;T3和T5是相同的纹理进行标注的,即T3和T5属于相同的脑区;P3和O1是相同的纹理进行标注的,即P3和O1属于相同的脑区;P4和O2是相同的纹理进行标注的,即P4和O2属于相同的脑区;Fp2、F8、F4和C4是相同的纹理进行标注的,即FP2、F8、F4和C4属于相同的脑区;Fz、Cz和Pz是相同的纹理进行标注的,即Fz、Cz和Pz属于相同的脑区),对于常见的10-20系统,可以将其划分为八个特征脑区计算脑区内的平均信号。脑区的分划基于预设疾病的先验知识,以及大脑功能区划的内在特征。其中A1和A2作为参考电极被单独分为一类,若选取耳单导联方式,可以简单的忽略这一参考类。由此,可以将脑区定义的系数序列记为:
其中,Sj是图3中定义的脑区,如T3,T5两个通道可以定义左颞区区域,|Sj|返回区域内包含的电极数量。
通过空间聚合,可以将42维系数序列减少为16维,能够显著减小变量选择负担,同时降低单个通道上的噪音干扰。
最后,对于第k个自适应分割片段可以对片段内的SLOWj(t)和SHARPj(t)求取均值作为预设疾病信号波形强度特征,将片段内的SLOWj(t)和SHARPj(t)非零系数个数加总作为预设疾病信号波形出现数量特征。故用作分类的预设疾病信号波形特征共有32维。/>
对应的,步骤140可以具体包括:
根据第一脑电波数据和第二系数序列的第三子脑电波数据,构建发病时段标注模型的训练样本。
在本申请的实施例中,通过对基函数集合和所述组合系数进行系数序列计算,得到第一脑电波数据对应的第一系数序列,将各通道对应的第一脑电波数据的第一系数序列进行汇总,得到第二系数序列的第三子脑电波数据,如此可以对基函数集合中的数据进行降维,减轻数据处理的压力。
在本申请的一些实施例中,在将第一脑电波数据和第三脑电波数据作为构建发病时段标注模型的训练样本时,具体的可以是利用第一脑电波数据的统计量和第三脑电波数据的统计量来构建发病时段标注模型的训练样本,如此可直接基于统计量来构建训练样本,相较于直接利用脑电波数据而言,数据量少,减轻了发病时段标注模型的计算压力。
在本申请的一些实施例中,统计量可以是平均值、最大值、方差和标准差等。
在本申请的一些实施例中,为了减轻发病时段标注模型的计算压力,提高发病时段标注的效率,在步骤130之后,上述所涉及的数据处理方法还可以包括:
计算第一脑电波数据的第一统计量,以及第三脑电波数据的第二统计量。
其中,第一统计量可以是计算得到的第一脑电波数据的统计量。
第二统计量可以是计算得到的第三脑电波数据的统计量。
在本申请的一些实施例中,在获取到第三脑电波数据后,可以对第一脑电波数据和第三脑电波数据进行计算,得到其对应的统计量。
在本申请的一些实施例中,具体的对第一脑电波数据的统计量,以及第三脑电波数据的统计量进行计算具体可以采用如下方式:
给定空间约束的独立分量分析计算的y*(t),以及自适应分割时段算法给出的变点集合可以计算预设疾病信号的强度特征(即统计量)。
这里可以选用局部方差来表征预设疾病信号的强度。具体的,考虑核回归方法(如公式(35)):
其中,h是窗宽;是对y*(t)的核回归估计;Kh(u)是高斯核函数,且Kh(u)满足如下公式(36):
令核回归残差可以再次使用核回归估计局部方差:
其中,为估计的第三脑电波数据的局部方差;b是针对残差回归的窗宽;窗宽h和b的选择可以通过交叉验证方式实现。
类似的,若将y*(t)替换为第一脑电波数据在各个通道的均值可以得到对第一脑电波数据局部方差的估计/>
在本申请的一些实施例中,可以使用y*(t)的局部方差表示预设疾病信号的绝对强度,使用二者的方差比值/>作为预设疾病信号的相对强弱。最后,在第k个自适应分割片段/>可以对片段内的/>和/>求取均值作为预设疾病信号强度特征。
根据上述计算可计算得到第一脑电波数据的统计量和第三脑电波数据的统计量。
对应的,步骤140可以具体包括:
根据第一统计量和第二统计量,构建发病时段标注模型的训练样本。
在本申请的实施例中,通过计算第一脑电波数据的统计量,以及第三脑电波数据的统计量,基于第一脑电波数据的统计量,以及第三脑电波数据的统计量构建发病时段标注模型的训练样本,如此可直接基于统计量来构建训练样本,相较于直接利用脑电波数据而言,数据量少,减轻了发病时段标注模型的计算压力。
在本申请的一些实施例中,在构建发病时段标注模型的训练样本之后,上述所涉及的数据处理方法还可以包括:
针对每个训练样本,分别执行如下步骤:
将第一统计量和第二统计量输入至发病时段标注模型中,得到与第三脑电波数据对应的预设疾病的预测发病时段;
根据预设疾病的预测发病时段和第三脑电波数据中的预设疾病的发病时段,确定发病时段标注模型的损失函数值;
在损失函数值不满足训练停止条件的情况下,调整发病时段标注模型的模型参数,并利用训练样本训练参数调整后的发病时段标注模型,直至满足训练停止条件,得到训练后的发病时段标注模型。
其中,预测发病时段可以是利用发病时段标注模型对第一脑电波数据中的与第三脑电波中标注的发病时段进行预测所得到的发病时段。
损失函数值可以是发病时段标注模型的损失函数值。
训练停止条件可以是预设的发病时段标注模型进行训练时的停止训练的条件。例如可以是损失函数值小于预设损失函数阈值,还可以是迭代次数大于或等于预设迭代次数。在此不做限定。
需要说明的是,对发病时段标注模型进行训练时,利用的是标注有发病时段的脑电波数据(即图2中的脑电波数据B部分)。
在本申请的实施例中,在获取到训练样本后,利用训练样本对发病时段标注模型进行训练,得到训练后的发病时段标注模型,如此可以利用该训练完的发病时段标注模型对第三脑电波数据中未被标注的部分脑电波数据进行标注,提高了预设疾病发病时段的标注效率。
本申请的一些实施例中,在所述得到训练后的发病时段标注模型之后,上述所涉及的数据处理方法还可以包括:
将第一统计量和第二统计量输入至训练好的发病时段标注模型中,得到第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率值;
在概率值大于或等于预设概率阈值的情况下,确定时刻下的第三脑电波数据为预设疾病的发病时段;
将确定为预设疾病的发病时段的第三脑电波数据进行标注,得到第五脑电波数据。
其中,第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率值可以是第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率。
预设概率阈值可以是预先设置的第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率值的阈值。
第五脑电波数据可以是将确定为预设疾病的发病时段的第三脑电波数据进行标注后所得到的脑电波数据。
在本申请的一些实施例中,在得到训练好的发病时段标注模型后,可以将第一统计量和第二统计量输入至训练好的发病时段标注模型中,得到第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率值,在概率值大于或等于预设概率阈值的情况下,确定时刻下的第三脑电波数据为预设疾病的发病时段,将确定为预设疾病的发病时段的第三脑电波数据进行标注,得到第五脑电波数据。
在一个示例中,如图4所示为Q为第三脑电波数据,其中第三脑电波数据由Q1和Q2两段脑电波数据组成,其中,Q1段的脑电波数据可以是预先标注好发病时段的脑电波数据,即为图2中的脑电波数据B,Q2段的脑电波数据可以是未被标注的脑电波数据。将图4中的第三脑电波数据对应的统计量输入到训练好的发病时段标注模型,可以得到Q2段的各时刻的脑电波数据中为预设疾病的发病时段的概率值,例如t3-t4时刻为预设疾病的发病时段的概率值为0.4,t4-t6时刻为预设疾病的发病时段的概率值为0.8,若取判断发病时段的概率阈值为0.5,则可确定t3-t4时刻不为预设疾病的发病时段,t4-t6为预设疾病的发病时段,则将t4-t6时刻的脑电波数据进行标注,得到完成预设疾病的发病时段的标注的第五脑电波数据(即在图4的基础上,将图4中的t4-t6时刻标注了发病时段的脑电波数据)。
在本申请的一些实施例中,将第一统计量和第二统计量均输入至训练好的发病时段标注模型中是因为,如果利用独立分量分析算法得到第三脑电波数据后,若空间约束随着时间发生了改变,则所得到的第三脑电波数据中的可能会缺少一部分的预设疾病数据,如此在计算该第三脑电波数据对应的波形特征时,就会不精确,进而导致预测出的发病时段不精确,故这里需要将第一脑电波数据对应的统计量也输入进去,提高发病时段的预测精度。
在本申请的一些实施例中,基于上述提取的第一统计量和第二统计量,可以将21维连续第三脑电波数据,离散化为K+1个时间维度的自适应分割片段,每个片段包含2个预设疾病信号强度特征以及32个预设疾病信号波形特征统计量。利用这些特征统计量,可以使用随机森林分类器(即发病时段标注模型)将片段分类为预设疾病的发病片段或预设疾病的非发病片段,如此实现在整个检测时段的自动化标记。
在本申请的一些实施例中,作为非均衡分类问题,在一个典型的检测对象的脑电波序列中,预设疾病的发病时段占比往往不足1%,即正样本数量远小于负样本。因此为了纠正数据样本的不均衡问题,可以在发病时段标注模型训练中对训练样本进行加权,给予正样本10倍于负样本的训练权重。此外,由于每个自适应分割片段代表的时长不同,还可以给予每个片段正比于其时长的训练权重,即长的片段在训练中有更大的重要性。
除了调整样本训练权重,还可以针对得分函数本身做出修改。对于二分类问题,分类的结果只有四类,即真阳性、假阳性、真阴性和假阴性。如表2所示,可以对于预设疾病的发病时段的正确分类赋予了较高权重,同时对于预设疾病的发病时段误分类为预设疾病的非发病时段施加了较大惩罚,让算法进一步倾向于正样本的正确预测,如此可得到精确的某一时刻下的脑电波数据为预设疾病的发病时段的概率值。
表2
在利用上述方式调整了发病时段标注模型的训练权重以及得分函数后,可对发病时段标注模型进行训练,得到可精确的预测某一时刻下的脑电波数据为预设疾病的发病时段的概率值的发病时段标注模型。
在定义了样本的权重和损失函数后,可以将第一统计量和第二统计量标准化后输入加权随机森林模型,利用训练好的发病时段标注模型,输出该片段分类为预设疾病发病时段的概率值。可以令预测预设疾病发病时段的概率值高于阈值λ∈(0,0.5]的片段为预设疾病发病片段。这里,λ的选取可以是基于发病时段标注模型在训练时基于受试者工作特征(receiver operating characteristic curve,ROC)曲线来确定。
在本申请的一些实施例中,在得到训练好的发病时段标注模型后,可将第一统计量和第二统计量输入至训练好的发病时段标注模型中,得到第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率值,在概率值大于或等于预设概率阈值的情况下,确定时刻下的第三脑电波数据为预设疾病的发病时段,将确定为预设疾病的发病时段的第三脑电波数据进行标注,得到第五脑电波数据,如此由于输入到发病时段标注模型中的第三脑电波数据仅标注了一段,并未完全标注完成,如此节省了标注时间。
在本申请的一些实施例中,通过上述的标注和计算,最终得到了脑电波数据的分类信息(即某一时刻的脑电波数据是否为预设疾病的发病时段)。这些分类信息可以通过图形界面与操作人员(例如可以是医生)进行交互。具体的,可以将分类为预设疾病的发病时段在脑电波数据的图像中用高亮表示。同时还可以提供跳转功能,允许操作人员快速定位目标时段(即当操作人员点击高亮部分时,可快速跳转到发病时段,即将发病时段扩大显示)。如果操作人员认为自动化识别时段正确或错误,其可以接受或拒绝发病时段标注模型的分类结果,或者提供自己的标注建议。
除了可以标注预设疾病分类时段,还可以展示预设疾病的发病的可能病灶源和特征病理波形。在上述实施例中定义了代表预设疾病信号的独立分量以及其对应的拓扑结构通过使用随机森林模型进行变量选择,选取了对应于不同脑区和不同波形的特征用于预测。综合这些结果,可以提供可能的病灶源估计和波形估计,辅助操作人员决策。/>
在操作人员的反馈过程中,发病时段标注模型可以通过两种不同途径更新预测结果。其中,快速更新过程无需重新训练发病时段标注模型,而是通过修正上述实施例中的预设疾病的判断阈值λ来实现,这一过程仅需重新建立ROC曲线,可以实现实时更新。对于精确更新过程,可以重新执行上述实施例中除匹配追踪算法以外的所有部分,从而优化整个发病时段标注模型过程。
在本申请的实施例中,通过提供操作人员的交互界面,可以使操作人员直接将预设疾病的发病时段进行标注,便于操作人员及时查看到预设疾病的发病时段,提高了用户体验。同时操作人员还可以根据自己的反馈信息来不断发病时段标注模型,提升了发病时段标注模型的精度。
在本申请的一些实施例中,本申请实施例可以应用于医院脑电图室的预设疾病的辅助或自动标注工作。目前医院脑电图室常配备全职技术人员进行检测对象的脑电波数据的发病时段标注工作。运用本申请实施例提供的算法或集成设备,可以将标注所需时间缩短,并且提供辅助的发病区域和特征波形信息,大幅节省人力劳动。
在本申请的一些实施例中,为了便于理解本申请实施例的技术方案,本申请实施例还提供了数据处理方法的另一种实现方式,具体的可以参考图5。
如图5为本申请实施例提供的数据处理方法的流程图,具体包括如下步骤510-步骤540:
步骤510、数据标注
在本申请的一些实施例中,针对步骤510即为上述实施例中的步骤120,在此不再赘述。
步骤520、特征提取
在本申请的一些实施例中,针对步骤520即为上述实施例中的步骤130,以及得到第三脑电波数据后,利用自适应分割时段算法对第三脑电波数据进行处理、计算第三脑电波数据的统计量、利用匹配追踪算法对第一脑电波数据进行处理和对匹配追踪算法得到的基函数集合进行降维处理等过程(如图6),在此不再赘述。
步骤530、模型训练
在本申请的一些实施例中,针对步骤530即为上述实施例中的对发病时段标注模型的训练过程,在此不再赘述。
步骤540、结果展示和反馈
在本申请的一些实施例中,针对步骤540即为上述实施例中的提供的交互界面,以供操作人员进行标注,同时还可接收操作人员的反馈信息,基于该反馈信息对发病时段标注模型进行优化的过程,在此不再赘述。
在本申请的实施例中,通过对数据进行标注,然后提取数据的特征信息,对发病时段标注模型进行训练,利用训练好的发病时段标注模型确定未被标注的各时刻的第三脑电波数据是否为预设疾病的发病时段,如此由于输入到发病时段标注模型中的训练样本仅标注了一段,并未完全标注完成,如此节省了标注时间,此外,由于在将脑电波数据输入到发病时段标注模型之前对脑电波数据进行了去噪,如此,可避免输入到发病时段标注模型中的脑电波数据由于噪声数据的干扰,导致若想使发病时段标注模型的训练精度高,则需要较多的训练样本,通过本申请实施例的数据处理方法,实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
需要说明的是,本申请实施例提供的数据处理方法,执行主体可以为数据处理装置,或者该数据处理装置中的用于执行数据处理方法的控制模块。
基于与上述的数据处理方法相同的发明构思,本申请还提供了一种数据处理装置。下面结合图7对本申请实施例提供的数据处理装置进行详细说明。
图7是根据一示例性实施例示出的一种数据处理装置的结构示意图。
如图7所示,该数据处理装置700可以包括:
获取模块710,用于获取检测对象的第一脑电波数据,其中,所述第一脑电波数据包括所述检测对象的各通道的脑电波数据;
第一确定模块720,用于响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据;其中,所述第一子脑电波数据为所述第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据;
第二确定模块730,用于去除所述第二脑电波数据中的噪声,得到第三脑电波数据;
构建模块740,用于根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本。
在本申请的实施例中,通过获取模块获取检测对象的第一脑电波数据,基于第一确定模块响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据,基于第二确定模块去除第二脑电波数据中的噪声,得到第三脑电波数据,基于构建模块根据第一脑电波数据和第三脑电波数据,构建发病时段标注模型的训练样本,由于第一子脑电波数据为第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据,如此由于输入到发病时段标注模型中的训练样本仅标注了一段,并未完全标注完成,如此节省了标注时间,此外,由于在将脑电波数据输入到发病时段标注模型之前对脑电波数据进行了去噪,如此,可避免输入到发病时段标注模型中的脑电波数据由于噪声数据的干扰,导致若想使发病时段标注模型的训练精度高,则需要较多的训练样本,通过本申请实施例的数据处理方法,实现用较少的训练样本得到较高精度的发病时段标注模型的效果。
在本申请的一些实施例中,为了进一步实现用较少的训练样本得到较高精度的发病时段标注模型的效果,第二确定模块730可以包括:
第一设定单元,用于设定所述第二脑电波数据满足预设序列模型条件;
第一确定单元,用于对满足所述预设序列模型条件的第二脑电波数据进行求解,得到与所述第二脑电波数据对应的第一约束参数;其中,所述第一约束参数包括第一子约束参数和第二子约束参数;
第二设定单元,用于设定与所述第二脑电波数据对应的第二约束参数满足预设约束条件;
第二确定单元,用于确定在所述预设约束条件下,所述第一约束参数中第一子约束参数的预设估计值;其中,所述第二约束参数用于表征所述第二脑电波数据中的预设疾病数据;
第三确定单元,用于在所述预设估计值满足预设条件的情况下,基于所述第一约束参数中的第二子约束参数确定所述第三脑电波数据。
在本申请的一些实施例中,第三确定单元具体用于所述预设估计值满足预设条件的情况下,设定第二脑电波数据的相似度小于预设阈值的第一独立分量集合,以及与第二子约束参数对应的第二独立分量集合;获取第一独立分量集合和所述第二独立分量集合的交集;将所述交集确定为所述第三脑电波数据。
在本申请的一些实施例中,为了进一步提高发病时段标注模型的识别精度,上述涉及的数据处理装置还可以包括:
第三确定模块,用于对所述第三脑电波数据的变化进行校验,确定所述第三脑电波数据中发生突变的变点位置;
第四确定模块,用于基于所述变点位置,将所述第三脑电波数据进行分段,得到至少一段第四脑电波数据;
对应的,构建模块740具体可以用于:根据所述第一脑电波数据和所述第四脑电波数据,构建发病时段标注模型的训练样本。
在本申请的一些实施例中,为了进一步的实现用较少的训练样本得到较高精度的发病时段标注模型的效果,上述涉及的数据处理装置还可以包括:
基函数字典构建模块,用于根据所述第一脑电波数据对应的频率范围,以及预设的基函数对应的频率范围,构建基函数字典;其中,所述基函数字典中包括至少一个基函数集合,每个所述基函数集合包括所述第一脑电波数据,以及与所述第一脑电波数据对应的所述基函数;
第五确定模块,用于根据所述第一脑电波数据以及所述基函数字典,确定所述第一脑电波数据对应的基函数集合,以及所述第一脑电波数据对应的组合系数。
在本申请的一些实施例中,第五确定模块具体可以用于:计算所述第一脑电波数据对应的所述基函数字典中的每个基函数集合与第一预设残差的内积绝对值;基于所述内积绝对值,更新所述基函数集合;对更新后的基函数集合进行线性回归,得到组合系数;基于所述组合系数,确定回归残差,将所述回归残差作为第一预设残差,重复执行上述步骤,直至所述第一预设残差的模小于预设残差阈值,或迭代次数大于预设迭代次数的情况下,输出基函数集合,以及组合系数。
在本申请的一些实施例中,为了减轻数据处理的压力,上述所涉及的数据处理装置还可以包括:
第六确定模块,用于对所述基函数集合和所述组合系数进行系数序列计算,得到所述第一脑电波数据对应的第一系数序列;
第七确定模块,用于将各通道对应的第一脑电波数据的第一系数序列进行汇总,得到第二系数序列的第三子脑电波数据;
对应的,构建模块740具体可以用于:根据所述第一脑电波数据和所述第二系数序列的第三子脑电波数据,构建发病时段标注模型的训练样本。
在本申请的一些实施例中,为了减轻了发病时段标注模型的计算压力,上述所涉及的数据处理装置还可以包括:
计算模块,用于计算所述第一脑电波数据的第一统计量,以及所述第三脑电波数据的第二统计量;
对应的,构建模块740具体可以用于:根据所述第一统计量和所述第二统计量,构建发病时段标注模型的训练样本。
在本申请的一些实施例中,上述所涉及的数据处理装置还可以包括模型训练模块,该模型训练模块具体用于:
针对每个训练样本,分别执行如下步骤:
将所述第一统计量和所述第二统计量输入至发病时段标注模型中,得到与所述第三脑电波数据对应的预设疾病的预测发病时段;
根据所述预设疾病的预测发病时段和所述第三脑电波数据中的预设疾病的发病时段,确定所述发病时段标注模型的损失函数值;
在所述损失函数值不满足训练停止条件的情况下,调整所述发病时段标注模型的模型参数,并利用所述训练样本训练参数调整后的发病时段标注模型,直至满足所述训练停止条件,得到训练后的发病时段标注模型。
在本申请的一些实施例中,为了快速得到第三脑电波数据中未被标注的各时刻的第三脑电波数据是否为预设疾病的发病时段,上述所涉及的数据处理装置还可以包括:
第八确定模块,用于将所述第一统计量和所述第二统计量输入至训练好的发病时段标注模型中,得到所述第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率值;
第九确定模块,用于在所述概率值大于或等于预设概率阈值的情况下,确定所述时刻下的第三脑电波数据为预设疾病的发病时段;
第十确定模块,用于将确定为预设疾病的发病时段的第三脑电波数据进行标注,得到第五脑电波数据。
本申请实施例提供的数据处理装置,可以用于执行上述各方法实施例提供的数据处理方法,其实现原理和技术效果类似,为简介起见,在此不再赘述。
基于同一发明构思,本申请实施例还提供了一种电子设备。
图8是本申请实施例提供的一种电子设备的结构示意图。如图8所示,电子设备可以包括处理器801以及存储有计算机程序或指令的存储器802。
具体地,上述处理器801可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器802可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器802可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器802可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器802可在综合网关容灾设备的内部或外部。在特定实施例中,存储器802是非易失性固态存储器。在特定实施例中,存储器802包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器801通过读取并执行存储器802中存储的计算机程序指令,以实现上述实施例中的任意一种数据处理方法。
在一个示例中,电子设备还可包括通信接口803和总线810。其中,如图8所示,处理器801、存储器802、通信接口803通过总线810连接并完成相互间的通信。
通信接口803,主要用于实现本发明实施例中各模块、设备、单元和/或设备之间的通信。
总线810包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线810可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该电子设备可以执行本发明实施例中的数据处理方法,从而实现图1-图6任一描述的数据处理方法。
另外,结合上述实施例中的数据处理方法,本发明实施例可提供一种可读存储介质来实现。该可读存储介质上存储有程序指令;该程序指令被处理器执行时实现上述实施例中的任意一种数据处理方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (13)

1.一种数据处理方法,其特征在于,所述方法包括:
获取检测对象的第一脑电波数据,其中,所述第一脑电波数据包括所述检测对象的各通道的脑电波数据;
响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据;其中,所述第一子脑电波数据为所述第一脑电波数据中按照时间顺序,预设时间段之前的脑电波数据;
去除所述第二脑电波数据中的噪声数据,得到第三脑电波数据;
根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本,并将所述训练样本输入至所述发病时段标注模型中,得到所述第一脑电波数据中未被标注的脑电波数据的预测标注时段,基于所述预测标注时段与所述第三脑电波数据进行比对,得到所述发病时段标注模型的损失函数,基于所述损失函数,迭代训练所述发病时段标注模型。
2.根据权利要求1所述的方法,其特征在于,所述去除所述第二脑电波数据中的噪声数据,得到第三脑电波数据,包括:
设定所述第二脑电波数据满足预设序列模型条件;
对满足所述预设序列模型条件的第二脑电波数据进行求解,得到与所述第二脑电波数据对应的第一约束参数;其中,所述第一约束参数包括第一子约束参数和第二子约束参数;
设定与所述第二脑电波数据对应的第二约束参数满足预设约束条件;
确定在所述预设约束条件下,所述第一约束参数中第一子约束参数的预设估计值;其中,所述第二约束参数用于表征所述第二脑电波数据中的预设疾病数据;
在所述预设估计值满足预设条件的情况下,基于所述第一约束参数中的第二子约束参数确定所述第三脑电波数据。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一约束参数中的第二子约束参数确定所述第三脑电波数据,包括:
设定第二脑电波数据的相似度小于预设阈值的第一独立分量集合,以及与第二子约束参数对应的第二独立分量集合;
获取第一独立分量集合和所述第二独立分量集合的交集;
将所述交集确定为所述第三脑电波数据。
4.根据权利要求1所述的方法,其特征在于,在所述去除所述第二脑电波数据中的噪声,得到第三脑电波数据之后,所述方法还包括:
对所述第三脑电波数据的变化进行校验,确定所述第三脑电波数据中发生突变的变点位置;
基于所述变点位置,将所述第三脑电波数据进行分段,得到至少一段第四脑电波数据;
所述根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本,包括:
根据所述第一脑电波数据和所述第四脑电波数据,构建发病时段标注模型的训练样本。
5.根据权利要求1所述的方法,其特征在于,在所述获取检测对象的第一脑电波数据之后,所述方法还包括:
根据所述第一脑电波数据对应的频率范围,以及预设的基函数对应的频率范围,构建基函数字典;其中,所述基函数字典中包括至少一个基函数集合,每个所述基函数集合包括所述第一脑电波数据,以及与所述第一脑电波数据对应的所述基函数;
根据所述第一脑电波数据以及所述基函数字典,确定所述第一脑电波数据对应的基函数集合,以及所述第一脑电波数据对应的组合系数。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一脑电波数据以及所述基函数字典,确定所述第一脑电波数据对应的基函数集合,以及所述第一脑电波数据对应的组合系数,包括:
计算所述第一脑电波数据对应的所述基函数字典中的每个基函数集合与第一预设残差的内积绝对值;
基于所述内积绝对值,更新所述基函数集合;
对更新后的基函数集合进行线性回归,得到组合系数;
基于所述组合系数,确定回归残差,将所述回归残差作为第一预设残差,
重复执行上述步骤,直至所述第一预设残差的模小于预设残差阈值,或迭代次数大于预设迭代次数的情况下,输出基函数集合,以及组合系数。
7.根据权利要求5所述的方法,其特征在于,在所述根据所述第一脑电波数据以及所述基函数字典,确定所述第一脑电波数据对应的基函数集合,以及所述第一脑电波数据对应的组合系数之后,所述方法还包括:
对所述基函数集合和所述组合系数进行系数序列计算,得到所述第一脑电波数据对应的第一系数序列;
将各通道对应的第一脑电波数据的第一系数序列进行汇总,得到第二系数序列的第三子脑电波数据;
所述根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本,包括:
根据所述第一脑电波数据和所述第二系数序列的第三子脑电波数据,构建发病时段标注模型的训练样本。
8.根据权利要求1所述的方法,其特征在于,在所述去除所述第二脑电波数据中的噪声,得到第三脑电波数据之后,所述方法还包括:
计算所述第一脑电波数据的第一统计量,以及所述第三脑电波数据的第二统计量;
所述根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本,包括:
根据所述第一统计量和所述第二统计量,构建发病时段标注模型的训练样本。
9.根据权利要求8所述的方法,其特征在于,在所述根据所述第一统计量和所述第二统计量,构建发病时段标注模型的训练样本之后,包括:
针对每个训练样本,分别执行如下步骤:
将所述第一统计量和所述第二统计量输入至发病时段标注模型中,得到与所述第三脑电波数据对应的预设疾病的预测发病时段;
根据所述预设疾病的预测发病时段和所述第三脑电波数据中的预设疾病的发病时段,确定所述发病时段标注模型的损失函数值;
在所述损失函数值不满足训练停止条件的情况下,调整所述发病时段标注模型的模型参数,并利用所述训练样本训练参数调整后的发病时段标注模型,直至满足所述训练停止条件,得到训练后的发病时段标注模型。
10.根据权利要求9所述的方法,其特征在于,在所述得到训练后的发病时段标注模型之后,所述方法还包括:
将所述第一统计量和所述第二统计量输入至训练好的发病时段标注模型中,得到所述第三脑电波数据中未被标注的各时刻的第三脑电波数据为预设疾病的发病时段的概率值;
在所述概率值大于或等于预设概率阈值的情况下,确定所述时刻下的第三脑电波数据为预设疾病的发病时段;
将确定为预设疾病的发病时段的第三脑电波数据进行标注,得到第五脑电波数据。
11.一种数据处理装置,其特征在于,所述装置包括:
获取装置,用于获取检测对象的第一脑电波数据,其中,所述第一脑电波数据包括所述检测对象的各通道的脑电波数据;
第一确定模块,用于响应于对第一子脑电波数据中的预设疾病的发病时段的标注操作,得到第二脑电波数据;其中,所述第一子脑电波数据为所述第一脑电波数据中按照时间顺序,预设时间段之前的预设疾病的发病时段的脑电波数据;
第二确定模块,用于去除所述第二脑电波数据中的噪声数据,得到第三脑电波数据;
构建模块,用于根据所述第一脑电波数据和所述第三脑电波数据,构建发病时段标注模型的训练样本,并将所述训练样本输入至所述发病时段标注模型中,得到所述第一脑电波数据中未被标注的脑电波数据的预测标注时段,基于所述预测标注时段与所述第三脑电波数据进行比对,得到所述发病时段标注模型的损失函数,基于所述损失函数,迭代训练所述发病时段标注模型。
12.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-10任一所述的数据处理方法的步骤。
13.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-10任一所述的数据处理方法的步骤。
CN202111309087.7A 2021-11-05 2021-11-05 数据处理方法、装置、电子设备和存储介质 Active CN114098764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111309087.7A CN114098764B (zh) 2021-11-05 2021-11-05 数据处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111309087.7A CN114098764B (zh) 2021-11-05 2021-11-05 数据处理方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN114098764A CN114098764A (zh) 2022-03-01
CN114098764B true CN114098764B (zh) 2024-02-20

Family

ID=80381292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111309087.7A Active CN114098764B (zh) 2021-11-05 2021-11-05 数据处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114098764B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116303731B (zh) * 2023-05-22 2023-07-21 四川互慧软件有限公司 医院标准主数据的对码方法、装置及电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009084898A2 (en) * 2007-12-27 2009-07-09 Korea Institute Of Brain Science (Kibs) System and method for analysing brain wave
KR20180002102A (ko) * 2016-06-28 2018-01-08 주식회사 소소 뇌파 기반 주의력 결핍 과잉 행동 장애 진단 시스템
CN108564128A (zh) * 2018-04-19 2018-09-21 重庆大学 一种融合数据结构信息的脑电信号在线识别方法
CN109645990A (zh) * 2018-08-30 2019-04-19 北京航空航天大学 一种癫痫患者脑电信号的计算机模式识别方法
CN111000555A (zh) * 2019-11-29 2020-04-14 中山大学 一种癫痫脑电信号的训练数据生成方法、自动识别模型建模方法和自动识别方法
CN111134664A (zh) * 2019-12-18 2020-05-12 武汉工程大学 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质
CN112244876A (zh) * 2020-09-30 2021-01-22 北京工业大学 一种基于可变遗忘因子的自适应滤波器的脑电信号时序随机噪声去除方法
CA3146349A1 (en) * 2019-08-22 2021-02-25 Advanced Global Clinical Solutions Inc. Systems and methods for seizure detection based on changes in electroencephalogram (eeg) non-linearities
CN112450885A (zh) * 2020-11-27 2021-03-09 湖南师范大学 一种面向癫痫脑电的识别方法
CH716863A2 (de) * 2019-11-22 2021-05-31 Univ Lanzhou Depressionserkennungssystem basierend auf einer unter Verwendung von Trainingssätzen getroffenen Kanalauswahl von Mehrkanal-Elektroenzephalographie.
DE102020213483A1 (de) * 2019-11-28 2021-06-02 Hyundai Motor Company Einrichtung und Verfahren zur Überwachung eines Fahrers mit Epilepsie unter Verwendung von Gehirnwellen

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100719068B1 (ko) * 2005-09-14 2007-05-17 재단법인 한국정신과학연구소 전전두엽에서 측정한 뇌파 데이터의 고속푸리에변환을 통한누적데이터의 패턴분석을 이용한 건강진단 장치 및 그방법
JP6013438B2 (ja) * 2014-12-09 2016-10-25 株式会社Nttデータ・アイ 脳疾患診断支援システム、脳疾患診断支援方法及びプログラム
CN109684296A (zh) * 2018-12-14 2019-04-26 深圳大学 脑纹识别数据库构建方法、装置、计算机设备和存储介质
CN113349800A (zh) * 2021-06-10 2021-09-07 重庆工程学院 一种基于生成式对抗网络的脑电波信号降噪方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009084898A2 (en) * 2007-12-27 2009-07-09 Korea Institute Of Brain Science (Kibs) System and method for analysing brain wave
KR20180002102A (ko) * 2016-06-28 2018-01-08 주식회사 소소 뇌파 기반 주의력 결핍 과잉 행동 장애 진단 시스템
CN108564128A (zh) * 2018-04-19 2018-09-21 重庆大学 一种融合数据结构信息的脑电信号在线识别方法
CN109645990A (zh) * 2018-08-30 2019-04-19 北京航空航天大学 一种癫痫患者脑电信号的计算机模式识别方法
CA3146349A1 (en) * 2019-08-22 2021-02-25 Advanced Global Clinical Solutions Inc. Systems and methods for seizure detection based on changes in electroencephalogram (eeg) non-linearities
CH716863A2 (de) * 2019-11-22 2021-05-31 Univ Lanzhou Depressionserkennungssystem basierend auf einer unter Verwendung von Trainingssätzen getroffenen Kanalauswahl von Mehrkanal-Elektroenzephalographie.
DE102020213483A1 (de) * 2019-11-28 2021-06-02 Hyundai Motor Company Einrichtung und Verfahren zur Überwachung eines Fahrers mit Epilepsie unter Verwendung von Gehirnwellen
CN111000555A (zh) * 2019-11-29 2020-04-14 中山大学 一种癫痫脑电信号的训练数据生成方法、自动识别模型建模方法和自动识别方法
CN111134664A (zh) * 2019-12-18 2020-05-12 武汉工程大学 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质
CN112244876A (zh) * 2020-09-30 2021-01-22 北京工业大学 一种基于可变遗忘因子的自适应滤波器的脑电信号时序随机噪声去除方法
CN112450885A (zh) * 2020-11-27 2021-03-09 湖南师范大学 一种面向癫痫脑电的识别方法

Also Published As

Publication number Publication date
CN114098764A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN111222290B (zh) 一种基于多参数特征融合的大型设备剩余使用寿命预测方法
Schiratti et al. A Bayesian mixed-effects model to learn trajectories of changes from repeated manifold-valued observations
Schiratti et al. Learning spatiotemporal trajectories from manifold-valued longitudinal data
US20150356421A1 (en) Method for Learning Exemplars for Anomaly Detection
CN105205112A (zh) 一种时序数据异常特征的挖掘系统及方法
CN115412455B (zh) 一种基于时间序列的服务器多性能指标异常检测方法及装置
CN103440512A (zh) 一种基于张量局部保持投影的大脑认知状态的识别方法
CN105205113A (zh) 一种时序数据异常变化过程的挖掘系统及方法
De et al. An adaptive vector quantization approach for image segmentation based on SOM network
CN115345938B (zh) 基于全局到局部的头影标记点定位方法、设备及介质
CN114098764B (zh) 数据处理方法、装置、电子设备和存储介质
CN112163624A (zh) 基于深度学习和极值理论的数据异常判断方法及系统
Li et al. Human sperm health diagnosis with principal component analysis and K-nearest neighbor algorithm
WO2017195126A1 (en) A method for determining the temporal progression of a biological phenomenon and associated methods and devices
CN108805181B (zh) 一种基于多分类模型的图像分类装置及分类方法
US20230260110A1 (en) Method and apparatus for processing abnormal region in image, and image segmentation method and apparatus
Ge et al. Two-level multiblock statistical monitoring for plant-wide processes
CN112884570A (zh) 一种模型安全性的确定方法、装置和设备
Kaya et al. SAGA: A novel signal alignment method based on genetic algorithm
WO2014188659A1 (en) Latent feature models estimation device, method, and program
CN108009586B (zh) 封顶概念分解方法及图像聚类方法
JP6930195B2 (ja) モデル同定装置、予測装置、監視システム、モデル同定方法および予測方法
Chapel et al. Anomaly detection with score functions based on the reconstruction error of the kernel PCA
CN112804650B (zh) 一种信道状态信息数据降维方法及智能室内定位方法
Zhu et al. Profile Abstract: An Optimization-based Subset Selection and Summarization Method for Profile Data Mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant