CN116127288A - 基于独立成分分析的纳米孔传感信号噪声去除方法及装置 - Google Patents
基于独立成分分析的纳米孔传感信号噪声去除方法及装置 Download PDFInfo
- Publication number
- CN116127288A CN116127288A CN202310395250.9A CN202310395250A CN116127288A CN 116127288 A CN116127288 A CN 116127288A CN 202310395250 A CN202310395250 A CN 202310395250A CN 116127288 A CN116127288 A CN 116127288A
- Authority
- CN
- China
- Prior art keywords
- signal
- matrix
- nanopore
- noise
- independent component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012880 independent component analysis Methods 0.000 title claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims abstract description 92
- 238000001228 spectrum Methods 0.000 claims abstract description 31
- 230000002087 whitening effect Effects 0.000 claims abstract description 26
- 230000005945 translocation Effects 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 238000011084 recovery Methods 0.000 claims abstract description 14
- 230000001360 synchronised effect Effects 0.000 claims abstract description 4
- 150000002500 ions Chemical class 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 11
- 239000011148 porous material Substances 0.000 claims description 10
- 238000002156 mixing Methods 0.000 claims description 8
- 230000011664 signaling Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000010183 spectrum analysis Methods 0.000 claims description 7
- 230000005284 excitation Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 241000764238 Isis Species 0.000 claims description 3
- 238000005259 measurement Methods 0.000 abstract description 3
- 230000001052 transient effect Effects 0.000 abstract description 3
- 230000009467 reduction Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004088 simulation Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 108020004414 DNA Proteins 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 239000007783 nanoporous material Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
Abstract
Description
技术领域
本发明涉及的技术领域是纳米孔传感技术领域,尤其涉及一种基于独立成分分析的纳米孔传感信号噪声去除方法及装置。
背景技术
纳米孔传感技术是一种简单高效的单分子分析方法,被广泛用于DNA测序、蛋白质鉴定以及病毒颗粒检测等诸多领域。纳米孔传感器的检测原理是在纳米孔两端的充满液体的腔室中的电极施加偏置电压,分子穿过纳米孔时会形成离子电流波动,即纳米孔电流信号。而设备获取的纳米孔电流信号通常受纳米孔材料、仪器噪声和外界电磁干扰的影响,导致信号失真,因此需要对检测到的DNA信号先去噪再分析。然而由于纳米孔测量系统中的离子电流和背景噪声的频率重叠范围分布较多,因此,在选择处理纳米孔测量数据时,需要根据具体情况进行权衡和选择。
上述问题是在纳米孔电流信号去噪过程中应当予以考虑并解决的问题。通过独立成分分析来去除纳米孔电流信号中的噪声,在实现去除多频段噪声的同时,能还原出滤波器方法所抑制的分子易位事件的瞬态特性。独立成分分析指的是从多个观测到的混合信号中分析出无法直接观测的原始信号,有着不需要预定混合系数、鲁棒性好、实时性强等优点,使用独立成分分析方法去噪已在各种心电图、超声图像、语音识别和脑电波分析等场景下进行了探索,逐渐成为焦点。低通滤波器可以去除高频噪声,但也会使信号变得钝化,掩盖细微且重要的特征;小波变换可以去除更多频段的噪声,但可能会抑制快速的电流波动,导致离子电流曲线的形态改变。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述存在的问题,提出了本发明。
因此,本发明解决的技术问题是:传统滤波器方法在频率上处理信号可能会造成信号钝化,从而掩盖离子电流曲线上细微且重要的变化。纳米孔测量系统中的离子电流和背景噪声的频率范围重叠,先前的研究发现在降噪的过程中区分背景噪声和分子易位波形是一项不易的任务,频域计算会造成信号失真,从而掩盖了由于分子动力学的随机性导致的可变时间尺度上的细微变化。
为解决上述技术问题,本发明提供如下技术方案:
第一方面,本发明实施例提供了一种基于独立成分分析的纳米孔传感信号噪声去除方法,包括:
使用纳米孔传感信号采集设备同步采集偏置电压信号 及在其激励下溶液中离子定向运动产生的纳米孔电流信号 ;
将所述纳米孔电流信号 和偏置电压信号 进行去均值及白化预处理,得到二维信号矩阵 ;
随机初始化一个解混矩阵 ,将所述二维信号矩阵 进行独立成分分离,对解混矩阵 进行迭代运算,使解混矩阵 达到收敛条件,得到最优解混矩阵,根据最优解混矩阵 和二维信号矩阵 计算出由两个独立分量组成的信号矩阵 ;
对所述信号矩阵 中的两个分量进行频谱分析,使用频谱匹配算法,识别出包含纳米孔易位信息的分量信号 ;
恢复所述分量信号 的方差和幅值,使用快速恢复矩阵算法,得到去噪后纳米孔电流信号 ,用于特征提取、易位事件定位,实现噪声去除。
作为基于独立成分分析的纳米孔传感信号噪声去除方法的一种优选方案,其中:
所述预处理包括去均值和白化两个步骤,其中去均值包括:将纳米孔电流信号和偏置电压信号两个信号组成二维信号矩阵,第一行是电流信号 ,第二行是电压信号 ,根据公式 分别对每一行信号数据进行去均值,其中原始信号为 ,去均值后的信号为 ,mean()是求均值函数。
作为基于独立成分分析的纳米孔传感信号噪声去除方法的一种优选方案,其中:
所述白化包括:先计算 的协方差矩阵:
;
并对协方差矩阵C进行特征值分解,得到特征值和特征向量,将特征向量组成一个正交矩阵E,并且对所有特征值组成对角矩阵D,然后对去均值矩阵 进行白化变换, ;经过白化的数据矩阵,每个信号的方差都为1。
作为基于独立成分分析的纳米孔传感信号噪声去除方法的一种优选方案,其中:
所述对解混矩阵 进行迭代运算包括:迭代运算公式为:
;
其中, 为第n+1次迭代计算后的解混矩阵, 为混合二维信号矩阵,是估计函数,这里选取的是非线性函数, 为的导函数,在本公式中即 的导函数, 表示期望运算符。
作为基于独立成分分析的纳米孔传感信号噪声去除方法的一种优选方案,其中:
所述使解混矩阵 达到收敛条件包括:
在判断 收敛时,需要满足两种收敛条件中的一个,具体的,当某一次收敛值小于设置的收敛阈值或者迭代次数大于最大迭代次数就停止迭代;
收敛评估指标使用均方误差MSE,公式为:
;
其中,N是 的采样点数, 值为 第i个样本点, 为估计值,即通过本次迭代产生的解混矩阵得到的信号 中第i个采样点, ,用来评估两个分量的独立性。
作为基于独立成分分析的纳米孔传感信号噪声去除方法的一种优选方案,其中:
所述对所述信号矩阵中的两个分量进行频谱分析包括:
包含的独立成分分量有且只有两个,纳米孔传感信号噪声主要包含闪烁噪声、热噪声、白噪声和介电噪声;根据噪声频谱分布特点和已识别出的历史数据拟合多种频谱样本,建立频谱样本表,并计算中两种独立分量信号频谱,通过频谱样本表的数据一起使用相关性算法进行对照匹配,由于纳米孔传感信号中电流信号和噪声信号的频谱具有不同的分布规律,可以确定 行分量的物理意义为电流信号或噪声信号,频谱计算公式为 ,N为s(t)的采样点数。
作为基于独立成分分析的纳米孔传感信号噪声去除方法的一种优选方案,其中:
所述恢复所述分量信号 的方差和幅值包括:通过将白化矩阵 、解混矩阵 和逆白化矩阵 ,合并为恢复矩阵 来恢复信号幅值方差,合并公式为 , 是 的逆矩阵,且对应噪声独立分量的部分置为零。
作为基于独立成分分析的纳米孔传感信号噪声去除方法的一种优选方案,其中:
第二方面,本发明实施例提供了一种基于独立成分分析的纳米孔传感信号噪声去除系统,其特征在于,包括:
采集模块,用于使用纳米孔传感信号采集设备同步采集偏置电压信号及在其激励下溶液中离子定向运动产生的纳米孔电流信号 ;
预处理模块,用于将所述纳米孔电流信号和偏置电压信号 进行去均值及白化预处理,得到二维信号矩阵 ;
信号分离模块,用于随机初始化一个 解混矩阵 ,将所述二维信号矩阵 进行独立成分分离,对解混矩阵 进行迭代运算,使解混矩阵 达到收敛条件,得到最优解混矩阵,根据最优解混矩阵 和二维信号矩阵 计算出由两个独立分量组成的信号矩阵 ;
成分识别模块,用于对所述信号矩阵 中的两个分量进行频谱分析,使用频谱匹配算法,识别出包含纳米孔易位信息的分量信号;
幅值恢复模块,用于恢复所述分量信号 的方差和幅值,使用快速恢复矩阵算法,得到去噪后纳米孔电流信号 ,用于特征提取、易位事件定位,实现噪声去除。
第三方面,本发明实施例提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的基于独立成分分析的纳米孔传感信号噪声去除方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现所述的基于独立成分分析的纳米孔传感信号噪声去除方法。
本发明的有益效果:本发明在实现去除多频段噪声的同时,能还原出传统滤波器方法所抑制的易位事件的瞬态特性,降噪信号加强事件脉冲拐点的区分度,减少了脉冲信号的过度抹平。由于独立成分分析方法减少了纳米孔电流信号中噪声成分分量,未来可能会提高分子易位事件定位以及深度学习训练的性能;本发明还通过利用纳米孔噪声频率的分布特性构建了分量识别模型,从而实现了在独立成分分析过程中识别和筛选信号成分分量,避免了靠经验确定信号的物理意义。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1 是本发明第一个实施例所述的基于独立成分分析的纳米孔传感信号噪声去除方法的整体流程图;
图2 是本发明第二个实施例所述的基于独立成分分析的纳米孔传感信号噪声去除方法的仿真实例中实验室采集的λ-DNA分子易位时产生的纳米孔电流信号及其局部脉冲放大图;
图3 是本发明第二个实施例所述的基于独立成分分析的纳米孔传感信号噪声去除方法的仿真实例中λ-DNA短链过孔时的纳米孔电流信号去噪得到的波形和低通滤波、小波变换降噪效果波形对比图;
图4 是本发明第二个实施例所述的基于独立成分分析的纳米孔传感信号噪声去除方法的仿真实例中λ-DNA长链过孔时的纳米孔电流信号去噪得到的波形和低通滤波、小波变换降噪效果波形对比图;
图5 是本发明第二个实施例所述的基于独立成分分析的纳米孔传感信号噪声去除方法的仿真实例中的纳米孔电流信号去噪得到的波形和低通滤波、小波变换降噪效果频谱对比图;
图6 是本发明第二个实施例所述的基于独立成分分析的纳米孔传感信号噪声去除方法的仿真实例中的纳米孔电流信号去噪得到的波形和低通滤波、小波变换降噪信号脉冲事件检出数量对比图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
实施例1
参照图1,为本发明的第一个实施例,该实施例提供了一种基于独立成分分析的纳米孔传感信号噪声去除方法,包括:
S1:使用纳米孔传感信号采集设备同步采集偏置电压信号 及在其激励下溶液中离子定向运动产生的纳米孔电流信号 ;将所述纳米孔电流信号(t)和偏置电压信号 进行去均值及白化预处理,得到二维信号矩阵 。
具体的,所述预处理包括去均值和白化两个步骤,其中去均值包括:将纳米孔电流信号和偏置电压信号 两个信号组成二维信号矩阵 ,第一行是电流信号 ,第二行是电压信号, 根据公式 分别对每一行信号数据进行去均值,其中原始信号为 ,去均值后的信号为 ,mean()是求均值函数。
更进一步的,所述白化包括:先计算 的协方差矩阵:
;
并对协方差矩阵C进行特征值分解,得到特征值和特征向量,将特征向量组成一个正交矩阵E,并且对所有特征值组成对角矩阵D,然后对去均值矩阵 进行白化变换, ;经过白化的数据矩阵,每个信号的方差都为1。
S2:随机初始化一个 解混矩阵 ,将所述二维信号矩阵 进行独立成分分离,对解混矩阵 进行迭代运算,使解混矩阵 达到收敛条件,得到最优解混矩阵 ,根据最优解混矩阵 和二维信号矩阵 计算出由两个独立分量组成的信号矩阵 。
具体的,所述对解混矩阵 进行迭代运算包括:迭代运算公式为:
;
其中, 为第n+1次迭代计算后的解混矩阵, 为混合二维信号矩阵,是估计函数,这里选取的是非线性函数 ,为 的导函数,在本公式中即 的导函数,表示期望运算符。
更进一步的,所述使解混矩阵 达到收敛条件包括:
在判断 收敛时,需要满足两种收敛条件中的一个,具体的,当某一次收敛值小于设置的收敛阈值或者迭代次数大于最大迭代次数就停止迭代;
收敛评估指标使用均方误差MSE,公式为:
;
其中,N是 的采样点数, 值为 第i个样本点, 为估计值,即通过本次迭代产生的解混矩阵得到的信号 中第i个采样点, ,用来评估两个分量的独立性。
应说明的是,根据纳米孔过孔信号的特点,通过计算发现在一定的迭代次数前收敛,在此基础上继续增加迭代次数,收敛的效果不会增强。因此通过选取合适的迭代次数,在保证纳米孔信号具有较好的降噪效果同时也加快了纳米孔过孔信号降噪算法运行速度。
S3:对所述信号矩阵 中的两个分量进行频谱分析,使用频谱匹配算法,识别出包含纳米孔易位信息的分量信号 。
具体的, 包含的独立成分分量有且只有两个,纳米孔传感信号噪声主要包含闪烁噪声、热噪声、白噪声和介电噪声;根据噪声频谱分布特点和已识别出的历史数据拟合多种频谱样本,建立频谱样本表,并计算中两种独立分量信号频谱,通过频谱样本表的数据一起使用相关性算法进行对照匹配,由于纳米孔传感信号中电流信号和噪声信号的频谱具有不同的分布规律,可以确定 行分量的物理意义为电流信号或噪声信号,频谱计算公式为 ,N为s(t)的采样点数。
S4:恢复所述分量信号 的方差和幅值,使用快速恢复矩阵算法,得到去噪后纳米孔电流信号 ,用于特征提取、易位事件定位,实现噪声去除。
具体的,所述恢复所述分量信号 的方差和幅值包括:通过将白化矩阵 、解混矩阵 和逆白化矩阵 ,合并为恢复矩阵 来恢复信号幅值方差,合并公式为 , 是 的逆矩阵,且对应噪声独立分量的部分置为零。
应说明的是,该方法在恢复纳米孔电流信号方差的同时可减少信号计算步骤,加快纳米孔电流信号的去噪速度。
实施例2
参照图2-图6,为本发明的一个实施例,提供了一种基于独立成分分析的纳米孔传感信号噪声去除方法,为了验证本发明的有益效果,通过仿真实验进行科学论证。
S1:使用纳米孔传感信号采集设备同步采集偏置电压信号 及在其激励下溶液中离子定向运动产生的纳米孔电流信号 ,其中纳米孔电流信号 包含了许多背景噪声。
其中,本实施例中原始数据是在实验室中采集的。在 1mol氯化钾溶液中稀释λ-DNA,pH 值为 8.0,样品λ-DNA分子使用电阻大于18 MΩ/cm 的 Milli-Q 超纯水制备。所有溶液在使用前都用过滤器过滤,λ-DNA分子信号由纳米孔传感器检测。膜片钳放大器用于将流过纳米孔的相应离子电流转化为偏置电压。电流信号由 1440A 数字转换器记录,整个纳米孔装置设置在法拉第笼中以屏蔽电磁噪声。采集到的纳米孔传感信号如图2所示,下方波形为电流信号 ,上方波形为纳米孔两端电压信号 。
S2:将S1中得到的纳米孔电流信号 和偏置电压信号 进行预处理,包括去均值和白化两个步骤,得到二维信号矩阵 。
其中,所述信号预处理具体过程为:将纳米孔电流信号 和偏置电压信号 两个信号组成二维信号矩阵 ,第一行是电流信号 ,第二行是电压信号,根据公式 分别对每一行信号数据进行去均值,其中原始信号为 ,去均值后的信号为 ,mean()是求均值函数。白化过程是先计算 的协方差矩阵:
;
并对协方差矩阵C进行特征值分解,得到特征值和特征向量。将特征向量组成一个正交矩阵E,并且对所有特征值取倒数再开根号,得到对角矩阵 ,然后对去均值矩阵 进行白化变换, ,经过白化的数据矩阵,每个信号的方差都为1。
S3:随机初始化一个 解混矩阵 ,将S2中二维信号矩阵 进行独立成分分离,使解混矩阵 不断收敛,得到的最优解混矩阵 ,根据 计算出由离子电流和背景噪声两个独立分量组成的信号矩阵 ;
其中,所述独立成分分离迭代公式 , 是S2中的信号矩阵,函数 为非线性函数t,为 的导函数,在本公式中即为 的导函数,表示期望运算符,对样本进行平均。该迭代过程尽可能使得到的解混矩阵 每一行彼此正交,达到独立成分的分离效果,即尽可能分离离子电流和背景噪声两个独立成分。
其中,所述收敛过程是在判断 收敛时,需要满足2种收敛条件中的一个,分别为收敛阈值法和最大迭代次数法,当某一次收敛值小于设置的收敛阈值或者迭代次数大于最大迭代次数就停止迭代。收敛评估指标使用均方误差MSE,
;
值为 第i个样本点, 为估计值,即通过本次迭代产生的解混矩阵得到的信号 中第i个采样点, ,用来评估两个分量的独立性。根据纳米孔电流信号的特点,通过计算发现在一定的迭代次数前 收敛,在此基础上继续增加迭代次数,发现收敛的效果不会增强。因此通过本方法选取合适的迭代次数,在保证纳米孔信号具有较好的降噪效果同时也加快了纳米孔电流信号降噪算法运行速度。
S4:对S3中得到的信号矩阵 中的两个分量进行特性分析,结合频谱匹配算法,识别出由λ-DNA分子易位时电荷波动引起的信号分量 ;
其中,频谱匹配算法具体过程是: 包含的独立成分分量有且只有两个,分别为纳米孔电流信号 和背景噪声 声。背景噪声包含闪烁噪声、热噪声、白噪声和介电噪声等,利用上述噪声模型和已识别出的历史数据建立标准参数模型。根据纳米孔电流信号中离子电流信号和背景噪声信号的能量在不同频段的分布规律,计算出两种信号频谱走势,与标准参数模型中的数据一起使用汉明距离等相关性算法进行对照匹配,来确定行分量的物理意义(离子电流信号或背景噪声信号)。
S5:恢复识别出的信号分量 的方差和幅值,使用快速恢复矩阵算法,得到用于特征识别、过易位事件定位的离子电流信号 。
其中,具体过程是:由于S4中获取的分量信号 幅值与方差不能真实反应分子易位时电荷波动的大小,通过将白化矩阵 、解混矩阵 和逆白化矩阵,合并为恢复矩阵 来恢复信号幅值方差,合并公式为 , 是 的逆矩阵,且对应噪声独立分量的部分置为零,该方法在恢复纳米孔电流信号方差的同时可减少信号计算步骤,加快纳米孔电流信号的去噪速度。
本实施例通过仿真实验将基于独立成分分析的纳米孔电流信号去噪算法和传统的低通滤波器和小波变换做对比:
如图3、图4所示,本方法在基线附近去除了大量高频噪声,保留了溶液间的离子电流波动。图中展示的λ-DNA分子易位事件中,脉冲的幅值还原准确且拐点更加明确。
如图5所示,本方法在全频段可以识别出离子电流信号和背景噪声,在本方法中,仅对背景噪声做了抑制处理,并没有减弱电流信号部分,对比低通滤波和小波变化都具有明显优势。
如图6所示,纳米孔电流信号在通过本方法降噪后,相比于低通滤波和小波降噪方法,有着较高的λ-DNA易位事件检测率。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种基于独立成分分析的纳米孔传感信号噪声去除方法,其特征在于,包括:
使用纳米孔传感信号采集设备同步采集偏置电压信号及在其激励下溶液中离子定向运动产生的纳米孔电流信号;
将所述纳米孔电流信号(t)和偏置电压信号(t)进行去均值及白化预处理,得到二维信号矩阵;
随机初始化一个解混矩阵,将所述二维信号矩阵进行独立成分分离,对解混矩阵进行迭代运算,使解混矩阵达到收敛条件,得到最优解混矩阵,根据最优解混矩阵和二维信号矩阵计算出由两个独立分量组成的信号矩阵;
对所述信号矩阵中的两个分量进行频谱分析,使用频谱匹配算法,识别出包含纳米孔易位信息的分量信号;
恢复所述分量信号的方差和幅值,使用快速恢复矩阵算法,得到去噪后纳米孔电流信号,用于特征提取、易位事件定位,实现噪声去除。
2.如权利要求1所述的基于独立成分分析的纳米孔传感信号噪声去除方法,其特征在于,所述预处理包括去均值和白化两个步骤,其中去均值包括:将纳米孔电流信号(t)和偏置电压信号(t)两个信号组成二维信号矩阵,第一行是电流信号(t),第二行是电压信号根据公式分别对每一行信号数据进行去均值,其中原始信号为,去均值后的信号为,mean()是求均值函数。
3.如权利要求2所述的基于独立成分分析的纳米孔传感信号噪声去除方法,其特征在于,所述白化包括:先计算的协方差矩阵:
;
并对协方差矩阵C进行特征值分解,得到特征值和特征向量,将特征向量组成一个正交矩阵E,并且对所有特征值组成对角矩阵D,然后对去均值矩阵进行白化变换,;经过白化的数据矩阵,每个信号的方差都为1。
4.如权利要求1或3所述的基于独立成分分析的纳米孔传感信号噪声去除方法,其特征在于,所述对解混矩阵进行迭代运算包括:迭代运算公式为:
;
其中,为第n+1次迭代计算后的解混矩阵,为混合二维信号矩阵,是估计函数,这里选取的是非线性函数tanh(), 为的导函数,在本公式中即的导函数,表示期望运算符。
5.如权利要求4所述的基于独立成分分析的纳米孔传感信号噪声去除方法,其特征在于,所述使解混矩阵达到收敛条件包括:
在判断收敛时,需要满足两种收敛条件中的一个,具体的,当某一次收敛值小于设置的收敛阈值或者迭代次数大于最大迭代次数就停止迭代;
收敛评估指标使用均方误差MSE,公式为:
;
其中,N是的采样点数,值为第i个样本点,为估计值,即通过本次迭代产生的解混矩阵得到的信号中第i个采样点,,用来评估两个分量的独立性。
6.如权利要求1所述的基于独立成分分析的纳米孔传感信号噪声去除方法,其特征在于,所述对所述信号矩阵中的两个分量进行频谱分析包括:
包含的独立成分分量有且只有两个,纳米孔传感信号噪声主要包含闪烁噪声、热噪声、白噪声和介电噪声;根据噪声频谱分布特点和已识别出的历史数据拟合多种频谱样本,建立频谱样本表,并计算 中两种独立分量信号频谱,通过频谱样本表的数据一起使用相关性算法进行对照匹配,由于纳米孔传感信号中电流信号和噪声信号的频谱具有不同的分布规律,可以确定行分量的物理意义为电流信号或噪声信号,频谱计算公式为,N为s(t)的采样点数。
7.如权利要求6所述的基于独立成分分析的纳米孔传感信号噪声去除方法,其特征在于,所述恢复所述分量信号的方差和幅值包括:通过将白化矩阵、解混矩阵和逆白化矩阵,合并为恢复矩阵来恢复信号幅值方差,合并公式为,是的逆矩阵,且对应噪声独立分量的部分置为零。
8.一种基于独立成分分析的纳米孔传感信号噪声去除系统,其特征在于,包括:
采集模块,用于使用纳米孔传感信号采集设备同步采集偏置电压信号及在其激励下溶液中离子定向运动产生的纳米孔电流信号;
预处理模块,用于将所述纳米孔电流信号(t)和偏置电压信号(t)进行去均值及白化预处理,得到二维信号矩阵;
信号分离模块,用于随机初始化一个解混矩阵,将所述二维信号矩阵进行独立成分分离,对解混矩阵进行迭代运算,使解混矩阵达到收敛条件,得到最优解混矩阵,根据最优解混矩阵和二维信号矩阵计算出由两个独立分量组成的信号矩阵;
成分识别模块,用于对所述信号矩阵中的两个分量进行频谱分析,使用频谱匹配算法,识别出包含纳米孔易位信息的分量信号;
幅值恢复模块,用于恢复所述分量信号的方差和幅值,使用快速恢复矩阵算法,得到去噪后纳米孔电流信号,用于特征提取、易位事件定位,实现噪声去除。
9.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至7任意一项所述基于独立成分分析的纳米孔传感信号噪声去除方法的步骤。
10.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至7任意一项所述基于独立成分分析的纳米孔传感信号噪声去除方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310395250.9A CN116127288B (zh) | 2023-04-14 | 2023-04-14 | 基于独立成分分析的纳米孔传感信号噪声去除方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310395250.9A CN116127288B (zh) | 2023-04-14 | 2023-04-14 | 基于独立成分分析的纳米孔传感信号噪声去除方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116127288A true CN116127288A (zh) | 2023-05-16 |
CN116127288B CN116127288B (zh) | 2023-09-15 |
Family
ID=86306618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310395250.9A Active CN116127288B (zh) | 2023-04-14 | 2023-04-14 | 基于独立成分分析的纳米孔传感信号噪声去除方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116127288B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116881634A (zh) * | 2023-09-06 | 2023-10-13 | 北京齐碳科技有限公司 | 用于清洗纳米孔信号数据的方法、设备和存储介质 |
CN116912446A (zh) * | 2023-09-13 | 2023-10-20 | 南京邮电大学 | 基于自闭合正交多边形的遥感建筑物样本快速采集方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111512155A (zh) * | 2017-12-28 | 2020-08-07 | 豪夫迈·罗氏有限公司 | 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声 |
CN113631925A (zh) * | 2019-03-19 | 2021-11-09 | 牛津纳米孔科技公司 | 电流测量设备、分子实体感测设备、测量电流的方法、感测分子实体的方法 |
CN113966403A (zh) * | 2019-04-22 | 2022-01-21 | 奥特拉公司 | 样品中多核苷酸序列的分数丰度的多孔测定 |
CN114878800A (zh) * | 2022-03-24 | 2022-08-09 | 清华大学 | 基于纳米孔技术的单分子周期性过孔调制及信号检测装置 |
CN115485552A (zh) * | 2020-04-03 | 2022-12-16 | 伦敦国王学院 | 检测包含光散射成分的介质中的分析物的方法 |
-
2023
- 2023-04-14 CN CN202310395250.9A patent/CN116127288B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111512155A (zh) * | 2017-12-28 | 2020-08-07 | 豪夫迈·罗氏有限公司 | 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声 |
CN113631925A (zh) * | 2019-03-19 | 2021-11-09 | 牛津纳米孔科技公司 | 电流测量设备、分子实体感测设备、测量电流的方法、感测分子实体的方法 |
CN113966403A (zh) * | 2019-04-22 | 2022-01-21 | 奥特拉公司 | 样品中多核苷酸序列的分数丰度的多孔测定 |
CN115485552A (zh) * | 2020-04-03 | 2022-12-16 | 伦敦国王学院 | 检测包含光散射成分的介质中的分析物的方法 |
CN114878800A (zh) * | 2022-03-24 | 2022-08-09 | 清华大学 | 基于纳米孔技术的单分子周期性过孔调制及信号检测装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116881634A (zh) * | 2023-09-06 | 2023-10-13 | 北京齐碳科技有限公司 | 用于清洗纳米孔信号数据的方法、设备和存储介质 |
CN116881634B (zh) * | 2023-09-06 | 2023-12-26 | 北京齐碳科技有限公司 | 用于清洗纳米孔信号数据的方法、设备和存储介质 |
CN116912446A (zh) * | 2023-09-13 | 2023-10-20 | 南京邮电大学 | 基于自闭合正交多边形的遥感建筑物样本快速采集方法 |
CN116912446B (zh) * | 2023-09-13 | 2023-12-08 | 南京邮电大学 | 基于自闭合正交多边形的遥感建筑物样本快速采集方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116127288B (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116127288B (zh) | 基于独立成分分析的纳米孔传感信号噪声去除方法及装置 | |
Hu et al. | An enhanced empirical wavelet transform for noisy and non-stationary signal processing | |
CN110786850B (zh) | 基于多特征稀疏表示的心电信号身份识别方法及系统 | |
Sun et al. | ECG signal conditioning by morphological filtering | |
CN103971124B (zh) | 一种基于相位同步的多类别运动想象脑电信号分类方法 | |
CN107157477A (zh) | 脑电信号特征识别系统及方法 | |
CN110188614A (zh) | 一种基于皮裂纹分割的nlm滤波指静脉去噪方法 | |
CN112906578B (zh) | 一种桥梁时间序列位移信号去噪的方法 | |
CN110763913B (zh) | 一种基于信号分段分类的导数谱平滑处理方法 | |
CN108444954B (zh) | 光谱信号峰值检测方法、装置以及系统 | |
Li et al. | An improved method for independent component analysis with reference | |
CN105225216A (zh) | 基于空间距圆标记边缘检测的虹膜预处理算法 | |
CN102184451B (zh) | 一种基于多小波融合特征的神经元动作特征提取方法 | |
CN107361764A (zh) | 一种心电信号特征波形r波的快速提取方法 | |
Kusban et al. | Excellent performance of palmprint recognition by using wavelet filter | |
CN113436216B (zh) | 基于Canny算子的电气设备红外图像边缘检测方法 | |
CN108197577B (zh) | 联合Sobel和MFRAT的指静脉图像特征提取方法 | |
Fatemi et al. | A robust framework for noninvasive extraction of fetal electrocardiogram signals | |
CN106326827A (zh) | 掌静脉识别系统 | |
Suresh et al. | Denoising and detecting discontinuities using wavelets | |
CN110929574A (zh) | 一种红外弱小目标快速检测方法 | |
Zhang et al. | Digital instruments recognition based on PCA-BP neural network | |
Liu et al. | An image edge detection algorithm based on improved canny | |
Budhiraja et al. | Effect of pre-processing on MST based infrared and visible image fusion | |
Ahmed et al. | Satellite images features extraction using phase congruency model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |