CN116904569A - 信号处理方法、装置、电子设备、介质和产品 - Google Patents

信号处理方法、装置、电子设备、介质和产品 Download PDF

Info

Publication number
CN116904569A
CN116904569A CN202311181331.5A CN202311181331A CN116904569A CN 116904569 A CN116904569 A CN 116904569A CN 202311181331 A CN202311181331 A CN 202311181331A CN 116904569 A CN116904569 A CN 116904569A
Authority
CN
China
Prior art keywords
electric signal
signal
electrical
target
sets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311181331.5A
Other languages
English (en)
Other versions
CN116904569B (zh
Inventor
李锐
郝俊龙
卓远
魏强
王聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qitan Technology Ltd Beijing
Chengdu Qitan Technology Ltd
Original Assignee
Qitan Technology Ltd Beijing
Chengdu Qitan Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qitan Technology Ltd Beijing, Chengdu Qitan Technology Ltd filed Critical Qitan Technology Ltd Beijing
Priority to CN202311181331.5A priority Critical patent/CN116904569B/zh
Publication of CN116904569A publication Critical patent/CN116904569A/zh
Application granted granted Critical
Publication of CN116904569B publication Critical patent/CN116904569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

本申请公开了一种信号处理方法、装置、电子设备、介质和产品,该方法包括:获取基于纳米孔测序采集的多组第一电信号集,其中,每组第一电信号集包括每个采集时刻下的电信号值;针对每组第一电信号集,对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集;基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集。以提升对纳米孔测序所采集的信号的后续处理的精确性。

Description

信号处理方法、装置、电子设备、介质和产品
技术领域
本申请涉及数据处理技术领域,具体涉及一种信号处理方法、装置、电子设备、介质和产品。
背景技术
跨膜孔,也称为纳米孔,其作为用于聚合物和各种小分子的直接的、电生物传感器,具有很大的潜力。特别是,利用纳米孔测序采集的信号进行后续测序研究是目前研究的热点话题。
目前在利用纳米孔测序所采集的信号进行后续处理时,存在后续处理精确性低的问题。
发明内容
本申请实施例的目的是提供一种信号处理方法、装置、电子设备、介质和产品,以提升对纳米孔测序所采集的信号的后续处理的精确性。
本申请的技术方案如下:
第一方面,提供了一种信号处理方法,该方法包括:
获取基于纳米孔测序采集的多组第一电信号集,其中,每组第一电信号集包括每个采集时刻下的电信号值;
针对每组第一电信号集,对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集;
基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集。
第二方面,提供了一种信号处理装置,该装置包括:
获取模块,用于获取基于纳米孔测序采集的多组第一电信号集,其中,每组第一电信号集包括每个采集时刻下的电信号值;
信号增强模块,用于针对每组第一电信号集,对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集;
确定模块,用于基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现本申请实施例任一所述的信号处理方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现本申请实施例任一所述的信号处理方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本申请实施例任一所述的信号处理方法的步骤。
本申请的实施例提供的技术方案至少带来以下有益效果:
在本申请实施例中,通过获取基于纳米孔测序采集的多组第一电信号集,然后针对每组第一电信号集,对第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集,如此对纳米孔测序采集的第一电信号集进行信号增强,可减少第一电信号集中信号值的噪声,然后基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集,如此可基于去除噪声后的目标电信号集进行后续的电信号处理,而非是仅利用纳米孔测序采集的电信号集进行后续的电信号处理,提升后续电信号处理的精确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
图1是本申请第一方面实施例提供的一种信号处理方法的流程示意图;
图2是本申请第一方面实施例涉及的第一电信号集的示意图;
图3是本申请第一方面实施例涉及的对第一电信号集进行带通滤波后所得到的第二电信号集的示意图;
图4是本申请第一方面实施例涉及的对第一电信号集进行低通滤波后所得到的第二电信号集的示意图;
图5是本申请第一方面实施例涉及的采用插值方式对第一目标电信号集进行上采样和下采样后所得到的第二电信号集的示意图;
图6是本申请第一方面实施例涉及的采用自编码-解码器方式对第一目标电信号集进行上采样和下采样后所得到的第二电信号集的示意图;
图7是本申请第一方面实施例涉及的对第一电信号集中的电信号值进行差值计算后所得到的第二电信号集的示意图;
图8是本申请第一方面实施例涉及的对第一电信号集中的电信号值进行滤波后的电信号值进行差值计算后所得到的第二电信号集的示意图;
图9是本申请第一方面实施例提供的一种信号处理方法的流程示意图;
图10是本申请第二方面实施例提供的一种信号处理装置的结构示意图;
图11是本申请第三方面实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的例子。
在介绍本申请实施例提供的技术方案之前,首先介绍一下本申请实施例的背景技术:
目前在利用纳米孔测序所采集的信号进行后续处理时,存在后续处理精确性低的问题,例如利用纳米孔信号对应的纳米孔碱基解读模型basecall模型对纳米孔信号进行解读时,输入至basecall模型的信号是基于某一特定的测序方式采集的信号,即不论测序方式如何更改,对碱基进行解读时利用的信号均为该特定测序方式所采集的信号,但是不同的测序方式其对应的信号是会有所变化的,例如可以是测序时电压值的变化或电流值的变化等会造成采集的信号有所变化,此时若还是利用上述特定测序方式所采集的信号输入至basecall模型中进行碱基解读,则解读精度会有影响。
为了解决上述问题,本申请实施例提供了一种信号处理方法、装置、电子设备、介质和产品,通过获取基于纳米孔测序采集的多组第一电信号集,然后针对每组第一电信号集,对第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集,如此对纳米孔测序采集的第一电信号集进行信号增强,然后基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集,如此可基于目标电信号集进行后续的信号处理,而非是仅利用纳米孔测序采集的原始信号集进行后续的信号处理,提升后续信号处理的精确性。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的信号处理方法进行详细地说明。
图1是本申请实施例所提供的一种信号处理方法的流程示意图,如图1所示,本申请实施例提供的信号处理方法可以包括步骤110-步骤130。
步骤110、获取基于纳米孔测序采集的多组第一电信号集,其中,每组第一电信号集包括每个采集时刻下的电信号值。
其中,第一电信号集可以是纳米孔测序在不同时刻下所采集的电信号值,即第一电信号集中包括每个采集时刻下的电信号值。
步骤120、针对每组第一电信号集,对第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集。
其中,第二电信号集为对第一电信号集中每个采集时刻下的电信号值进行信号增强后所得到的信号值组成的集合。
在本申请的一些实施例中,为了精确对第一电信号集中每个采集时刻下的电信号值进行信号增强,步骤120具体可以包括:
将第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;
滤除频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;
将目标频域信号转换为时域信号,得到第二电信号集。
其中,预设频域范围可以是预先设置的一个频域范围,预设频域范围的具体数值可以根据用户需求自行设置,在本申请实施中不做限定。
目标频域信号可以是将频域信号中频率不在预设频域范围内的频域信号进行滤除后所得到的频域信号。
在本申请的一些实施例中,可以是利用频域转换算法将第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号,这里的将时域信号转换为频域信号的算法包括但不限于是傅里叶变换方法。
在将频域信号中频率不在预设频域范围内的频域信号滤除时可以是将频域信号中频率超过一定频率的频域信号滤除,还可以是将频域信号中频率低于一定频率的频域信号滤除,即这里的将频域信号中的部分频域信号进行滤除时,可以是采用高通滤波方式,也可以是采用低通滤波方式或带通滤波方式,在本申请实施中不做限定。
在将目标频域信号再转换为时域信号时,可以但不限于包括傅里叶变换方法。
在一个示例中,图2为采集的第一电信号集,图3为对第一电信号集进行带通滤波后所得到的第二电信号集,图4为对第一电信号集进行低通滤波后所得到的第二电信号集。
在本申请的实施例中,通过滤波的方式对第一信号集中的每个采集时刻下的电信号值进行信号增强,能较好的抑制毛刺等噪声,从而使得第一信号集中的每个采集时刻下的电信号值台阶更加平整,有利于提升后续信号处理的精确性。
在本申请的一些实施例中,步骤120还可以具体包括:
对第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集;
对第三电信号集进行上采样,得到第四电信号集;
基于第四电信号集,得到第二电信号集。
其中,第一目标电信号集可以为第一电信号集中的部分或全部电信号集。在第一目标电信号集可以为第一电信号集中的部分电信号集的情况下,第一目标电信号集可以是从第一电信号集中任意选取的部分采集时刻下的电信号值所组成的集合。
以第一目标电信号集为第一电信号集中的部分电信号集为例,如图2所示,第一电信号集为0s至140s采集时刻之间的电信号值,第一目标电信号集可以为20s至80s采集时刻之间的电信号值。
第三电信号集可以是对第一电信号集中的第一目标电信号集进行下采样后得到的信号集,这里的下采样指的是对时间维度的下采样。例如,第一电信号集为0s至140s采集时刻之间的电信号值,第一目标电信号集为20s至80s采集时刻之间的电信号值,若之前在对电信号值进行采集时是每隔20s采集一次电信号值,此时在采集20s至80s采集时刻之间的电信号值时可以是每隔30s采集一次。
第四电信号集可以是对第三电信号集进行上采样后所得到的电信号集。
继续参考上述示例,由于之前每次采集电信号值都是每隔20s采集一次,然而20s至80s采集时刻之间的电信号值时是每隔30s采集一次,故20s至80s采集时刻之间的电信号值相比其他采集时刻所采集的电信号值就会有一部分的缺失,故需要对缺失的采集时刻下的电信号值进行补充,故需要对第三电信号集进行上采样,具体的上采样方式可以但不限于包括进行插值计算,或者自编码-解码器等机器学习方法,这里以插值计算为例,也就是说是对20s至80s采集时刻之间的电信号值进行插值计算,得到20s至80s采集时刻之间每隔20s的电信号值,即对20s至50s采集时刻之间的电信号值进行插值,得到第40s采集时刻下的电信号值,然后对50s至80s采集时刻之间的电信号值进行插值,得到第60s采集时刻下的电信号值,如此可得到20s至80s采集时刻之间每20s采集时刻下的电信号值。
需要说明的是,插值方法可以但不限于包括线性差值、多项式差值。自编码-解码器等机器学习方法可以是通过编码器通过下采样实现信息压缩,保留重要信息,丢弃噪声信息,解码器可以是通过反卷积或插值等方式实现上采样,恢复信号。
在一个示例中,图5为采用插值方式对第一目标电信号集进行上采样和下采样后所得到的第二电信号集,图6为采用自编码-解码器方式对第一目标电信号集进行上采样和下采样后所得到的第二电信号集。
在本申请的一些实施例中,在得到第四电信号集后,可直接基于该第四电信号集得到第二电信号集。
在本申请的实施例中,通过上下采样的方式对第一信号集中的每个采集时刻下的电信号值进行信号增强,也可以在一定程度上抑制噪声,同时,模拟了第一信号集中的每个采集时刻下的电信号值的片段缺失的场景,可进一步提升后续信号处理的精确性。
在本申请的一些实施例中,在第一目标电信号集是第一电信号集中的全部电信号集的情况下,可直接将第四电信号集作为第二电信号集。
在第一目标电信号集是第一电信号集中的部分电信号集的情况下,所述基于第四电信号集,得到第二电信号集具体可以包括:
基于第四电信号集和第二目标电信号集,得到第二电信号集。
其中,第二目标电信号集可以为第一电信号集中除第一目标电信号集外的电信号集。例如,第一电信号集为0s至140s采集时刻之间的电信号值,第一目标电信号集为20s至80s采集时刻之间的电信号值,则第二目标电信号集为1至20s采集时刻之间的电信号值,以及80s至140s采集时刻之间的电信号值,如此在得到第四电信号集后,可将第四电信号集,以及1至20s采集时刻之间的电信号值,以及80s至140s采集时刻之间的电信号值共同作为第二电信号集。
在本申请的一些实施例中,步骤120还可以具体包括:
计算第一电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于差值,得到第二电信号集。
在本申请的一些实施例中,可以计算每相邻的两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值,基于该差值,以及采集时刻得到第二电信号集。
在一个示例中,针对0s至140s采集时刻之间的电信号值,若每隔20s采集一次,则0s至140s采集时刻之间一共有8个电信号值,即分别是在第0s采集时刻下采集一个电信号值,在第20s采集时刻下采集一个电信号值,在第40s采集时刻下采集一个电信号值,在第60s采集时刻下采集一个电信号值,以此类推,一共采集了8个电信号值,若采集的8个信号值分别为1.5、1.6、1.4、1.55和1.45,则可计算第20s采集时刻与第0s采集时刻之间的信号值的差值(即1.6-1.5=0.1),计算第40s采集时刻与第20s采集时刻之间的信号值的差值(即1.4-1.6=-0.2),以此类推,得到0s至140s采集时刻之间每两个相邻采集时刻下的信号值之间的差值,然后将采集时刻与差值作为第二电信号集。
具体的在将采集时刻与差值作为第二电信号集时,可以是将每相邻两个采集时间中的任意一个采集时刻与这两个采集时刻下的电信号差值作为第二电信号集中的一个元素,还可以是每相邻两个采集时间中的两个采集时刻的平均值与这两个采集时刻下的电信号差值作为第二电信号集中的一个元素。例如,继续参考上述示例,可以将第20s采集时刻与第0s采集时刻之间的信号值的差值0.1,以及第20s采集时刻与第0s采集时刻中的任意一个采集时刻作为第二电信号集中的一个元素,比如可以是将第0s采集时刻,以及第20s采集时刻与第0s采集时刻之间的信号值的差值0.1作为第二电信号集中的第一个元素,将第20s采集时刻,以及第40s采集时刻与第20s采集时刻之间的信号值的差值-0.2作为第二电信号集中的第二个元素,以此类推,得到第二电信号集。
在本申请的一些实施例中,除了上述可以计算第一电信号集中每相邻的两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值外,还可以是计算通过上述滤波方式得到的第二电信号集中的每相邻的两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值,还可以是计算通过上述上下采样方式得到的第二电信号集中的每相邻的两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值,即在计算每相邻两个采集时刻下的后一采集时刻的电信号值与前一采集时刻的电信号值的差值时,可以是基于第一电信号集中的电信号值进行计算,也可以是对第一电信号集中的电信号值进行滤波后的电信号值进行计算,也可以是对第一电信号集中的电信号值进行上下采样后的电信号值进行计算,即步骤120还可以具体包括:
将第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;滤除频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;将目标频域信号转换为时域信号,得到目标第二电信号集,
计算目标第二电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于差值,得到第二电信号集;
或者,
对第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集,第一目标电信号集为第一电信号集中的部分或全部电信号集;对第三电信号集进行上采样,得到第四电信号集;基于第四电信号集,得到目标第二电信号集,
计算目标第二电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于差值,得到第二电信号集。
其中,目标第二电信号集可以是将第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;滤除频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;将目标频域信号转换为时域信号后所得到的电信号集。
需要说明的是,这里的将第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;滤除频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;将目标频域信号转换为时域信号的过程与上述实施例中的将第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;滤除频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;将目标频域信号转换为时域信号的过程一致,在此不再赘述。
目标第二电信号集还可以是对第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集;对第三电信号集进行上采样,得到第四电信号集;基于第四电信号集所得到的电信号集。
需要说明的是,这里的对第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集;对第三电信号集进行上采样,得到第四电信号集;基于第四电信号集得到目标第二电信号集的过程与上述实施例中对第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集;对第三电信号集进行上采样,得到第四电信号集;基于第四电信号集得到第二电信号集的过程一致,在此不再赘述。
具体的是对第一电信号集中的电信号值进行差值计算,还是对第一电信号集中的电信号值进行滤波后的电信号值进行差值计算,还是对第一电信号集中的电信号值进行上下采样后的电信号值进行差值计算,可根据用户需求自行选取,在本申请实施例中不做限定。
在一个示例中,图7是对第一电信号集中的电信号值进行差值计算后所得到的第二电信号集,图8是对第一电信号集中的电信号值进行滤波后的电信号值进行差值计算后所得到的第二电信号集。
需要说明的是,图2-图8中横坐标均为采集时刻,纵坐标为信号值,具体的是电流值。
在本申请的实施例中,通过差值计算的方式对第一信号集中的每个采集时刻下的电信号值进行信号增强,如此突出了第一信号集中的每个采集时刻下的电信号值台阶跳变边缘,提升后续信号处理的精确性。
步骤130、基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集。
其中,目标电信号集可以是基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集所组成的电信号集。
在本申请的一些实施例中,为了精确确定目标电信号集,步骤130具体可以包括:
针对每组第一电信号集,将第一电信号集,以及经过至少一种信号增强方式对第一电信号集增强后得到的第二电信号集拼接成二维信号组,得到目标电信号集。
在本申请的一些实施例中,针对每组第一电信号集,可以该组第一电信号集,以及经过至少一种信号增强方式对该组第一电信号集增强后所得到的第二电信号集拼接成二维信号组,如此可得到目标电信号集。
在一个示例中,参考图9,图9中以一组第一电信号集为例来进行说明,该组第一电信号集可以为1行t列的信号矩阵,这里的t用于表征第一电信号集中的电信号值的长度,即采集时刻的数量。然后通过上述几种信号增强方式对该组第一电信号集分别进行信号增强,每种信号增强方式均可分别得到1行t列的信号矩阵,然后将至少一种信号增强方式所得到的1行t列的信号矩阵,与第一电信号集的1行t列的信号矩阵进行拼接,即可得到n行t列的信号矩阵,这里的n用于表征对第一电信号集中的电信号值进行信号增强次数-1。
需要说明的是,上述三种对信号进行增强的方式中,在利用每种信号增强方式对第一电信号集中的电信号值进行增强时,均可增强多次,具体的每种信号增强方式的增强次数可根据用户需求自行设置,在本申请实施例中不做限定。
在本申请实施例中,针对每组第一电信号集,可以通过将第一电信号集,以及经过至少一种信号增强方式对第一电信号集增强后得到的第二电信号集拼接成二维信号组,如此可保证增强后的信号值与原始信号值之间的时序相关性,促进了后续对信号的处理的精确性。
在本申请的一些实施例中,目标电信号集可以用于作为纳米孔碱基解读模型的训练样本,如此在步骤130之后,上述所涉及的方法还可以包括:
基于目标电信号集对纳米孔碱基解读模型进行训练,得到训练后的纳米孔碱基解读模型。
在本申请的实施例中,将目标电信号集作为纳米孔碱基解读模型的训练样本,对纳米孔碱基解读模型进行训练,如此可基于训练后的纳米孔碱基解读模型对不同测序方式所得到的电信号值进行处理,对碱基进行解读,而不是一定要采用固定某种测序方式所得到的电信号值所训练的模型对碱基进行解读,提升了碱基解读的精确性、鲁棒性。
在现有技术中,纳米孔碱基解读模型中包括卷积层,利用卷积层可以对电信号值进行特征提取,然后依次输入至序列特征提取层、输出成以及序列解码层,实现对碱基的解读。这里的序列特征提取层可以但不限于是卷积神经网络(Convolutional neuralnetwork,CNN)、循环神经网络(Recurrent Neural Network,RNN)和图形神经网络(Graphical neural network,GNN)中的一种或多种的组合。输出层可以是使用基于动态规划的方法或直接使用分类的方法输出特征。解码层可以使用考虑单个时间步长或多个时间步长概率最大的局部最优方法或全局最优的搜索方法。
在本申请的一些实施例中,在目标电信号集为二维信号的情况下,对应的纳米孔碱基解读模型中的卷积层也为二维卷积层,如图9所示,卷积层通过对目标电信号集进行处理,将其转换为一维电信号,然后输入到序列特征提取层、输出成以及序列解码层,这里的序列特征提取层、输出成以及序列解码层与现有技术中的序列特征提取层、输出成以及序列解码层的作用相同,在此不再赘述。
需要说明的是,本申请实施例提供的信号处理方法,执行主体可以为信号处理装置,或者该信号处理装置中的用于执行信号处理方法的控制模块。
基于与上述的信号处理方法相同的发明构思,本申请还提供了一种信号处理装置。下面结合图10对本申请实施例提供的信号处理装置进行详细说明。
图10是根据一示例性实施例示出的一种信号处理装置的结构示意图。
如图10所示,该信号处理装置1000可以包括:
获取模块1010,用于获取基于纳米孔测序采集的多组第一电信号集,其中,每组第一电信号集包括每个采集时刻下的电信号值;
信号增强模块1020,用于针对每组第一电信号集,对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集;
确定模块1030,用于基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集。
在本申请实施例中,通过获取基于纳米孔测序采集的多组第一电信号集,然后针对每组第一电信号集,对第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集,如此对纳米孔测序采集的第一电信号集进行信号增强,可减少第一电信号集中信号值的噪声,然后基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集,如此可基于去除噪声后的目标电信号集进行后续的电信号处理,而非是仅利用纳米孔测序采集的电信号集进行后续的电信号处理,提升后续电信号处理的精确性。
在本申请的一些实施例中,确定模块1030具体可以用于:
针对每组第一电信号集,将所述第一电信号集,以及经过至少一种信号增强方式对所述第一电信号集增强后得到的第二电信号集拼接成二维信号组,得到目标电信号集。
在本申请的一些实施例中,信号增强模块1020具体可以用于:
将所述第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;
滤除所述频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;
将所述目标频域信号转换为时域信号,得到第二电信号集。
在本申请的一些实施例中,信号增强模块1020具体可以用于:
对所述第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集,其中,所述第一目标电信号集为所述第一电信号集中的部分或全部电信号集;
对所述第三电信号集进行上采样,得到第四电信号集;
基于所述第四电信号集,得到第二电信号集。
在本申请的一些实施例中,信号增强模块1020具体可以用于:
计算所述第一电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于所述差值,得到第二电信号集。
在本申请的一些实施例中,信号增强模块1020具体可以用于:
将所述第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;滤除所述频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;将所述目标频域信号转换为时域信号,得到目标第二电信号集,
计算所述目标第二电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于所述差值,得到第二电信号集;
或者,
对所述第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集,其中,所述第一目标电信号集为所述第一电信号集中的部分或全部电信号集;对所述第三电信号集进行上采样,得到第四电信号集;基于所述第四电信号集,得到目标第二电信号集,
计算所述目标第二电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于所述差值,得到第二电信号集。
在本申请的一些实施例中,上述所涉及的装置还可以包括:
模型训练模块,用于基于目标电信号集对纳米孔碱基解读模型进行训练,得到训练后的纳米孔碱基解读模型。
在本申请的一些实施例中,所述纳米孔碱基解读模型包括卷积层,所述卷积层为二维卷积层。
本申请实施例提供的信号处理装置,可以用于执行上述各方法实施例提供的信号处理方法,其实现原理和技术效果类似,为简介起见,在此不再赘述。
基于同一发明构思,本申请实施例还提供了一种电子设备。
图11是本申请实施例提供的一种电子设备的结构示意图。如图11所示,电子设备可以包括处理器1101以及存储有计算机程序或指令的存储器1102。
具体地,上述处理器1101可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit ,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器1102可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器1102可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器1102可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器1102可在综合网关容灾设备的内部或外部。在特定实施例中,存储器1102是非易失性固态存储器。存储器可包括只读存储器(Read Only Memory image,ROM)、随机存取存储器(Random-Access Memory,RAM)、磁盘存储介质设备、光存储介质设备、闪存设备、电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行上述实施例提供的信号处理方法所描述的操作。
处理器1101通过读取并执行存储器1102中存储的计算机程序指令,以实现上述实施例中的任意一种信号处理方法。
在一个示例中,电子设备还可包括通信接口1103和总线1110。其中,如图11所示,处理器1101、存储器1102、通信接口1103通过总线1110连接并完成相互间的通信。
通信接口1103,主要用于实现本发明实施例中各模块、设备、单元和/或设备之间的通信。
总线1110包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线1110可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该电子设备可以执行本发明实施例中的信号处理方法,从而实现图1描述的信号处理方法。
另外,结合上述实施例中的信号处理方法,本发明实施例可提供一种可读存储介质来实现。该可读存储介质上存储有程序指令;该程序指令被处理器执行时实现上述实施例中的任意一种信号处理方法。
另外,结合上述实施例中的信号处理方法,本发明实施例可提供一种计算机程序产品,该计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行上述实施例中的任意一种信号处理方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (12)

1.一种信号处理方法,其特征在于,所述方法包括:
获取基于纳米孔测序采集的多组第一电信号集,其中,每组第一电信号集包括每个采集时刻下的电信号值;
针对每组第一电信号集,对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集;
基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集。
2.根据权利要求1所述的方法,其特征在于,所述基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集,包括:
针对每组第一电信号集,将所述第一电信号集,以及经过至少一种信号增强方式对所述第一电信号集增强后得到的第二电信号集拼接成二维信号组,得到目标电信号集。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集,包括:
将所述第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;
滤除所述频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;
将所述目标频域信号转换为时域信号,得到第二电信号集。
4.根据权利要求1所述的方法,其特征在于,所述对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集,包括:
对所述第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集,其中,所述第一目标电信号集为所述第一电信号集中的部分或全部电信号集;
对所述第三电信号集进行上采样,得到第四电信号集;
基于所述第四电信号集,得到第二电信号集。
5.根据权利要求1所述的方法,其特征在于,所述对所述第一电信号集中每个时刻下的电信号值进行信号增强,得到第二电信号集,包括:
计算所述第一电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于所述差值,得到第二电信号集。
6.根据权利要求1所述的方法,其特征在于,所述对所述第一电信号集中每个时刻下的电信号值进行信号增强,得到第二电信号集,包括:
将所述第一电信号集中每个采集时刻下的电信号值由时域信号转换为频域信号;滤除所述频域信号中频率不在预设频域范围内的频域信号,得到目标频域信号;将所述目标频域信号转换为时域信号,得到目标第二电信号集,
计算所述目标第二电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于所述差值,得到第二电信号集;
或者,
对所述第一电信号集中的第一目标电信号集进行下采样,得到第三电信号集,其中,所述第一目标电信号集为所述第一电信号集中的部分或全部电信号集;对所述第三电信号集进行上采样,得到第四电信号集;基于所述第四电信号集,得到目标第二电信号集,
计算所述目标第二电信号集中每相邻两个采集时刻中后一采集时刻的电信号值与前一采集时刻的电信号值的差值;
基于所述差值,得到第二电信号集。
7.根据权利要求2所述的方法,其特征在于,在所述确定目标电信号集之后,所述方法还包括:
基于所述目标电信号集对纳米孔碱基解读模型进行训练,得到训练后的纳米孔碱基解读模型。
8.根据权利要求7所述的方法,其特征在于,所述纳米孔碱基解读模型包括卷积层,所述卷积层为二维卷积层。
9.一种信号处理装置,其特征在于,所述装置包括:
获取模块,用于获取基于纳米孔测序采集的多组第一电信号集,其中,每组第一电信号集包括每个采集时刻下的电信号值;
信号增强模块,用于针对每组第一电信号集,对所述第一电信号集中每个采集时刻下的电信号值进行信号增强,得到第二电信号集;
确定模块,用于基于多组第一电信号集,以及与每组第一电信号集对应的第二电信号集,确定目标电信号集。
10.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1-8任意一项所述的信号处理方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-8任意一项所述的信号处理方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-8任意一项所述的信号处理方法。
CN202311181331.5A 2023-09-13 2023-09-13 信号处理方法、装置、电子设备、介质和产品 Active CN116904569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311181331.5A CN116904569B (zh) 2023-09-13 2023-09-13 信号处理方法、装置、电子设备、介质和产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311181331.5A CN116904569B (zh) 2023-09-13 2023-09-13 信号处理方法、装置、电子设备、介质和产品

Publications (2)

Publication Number Publication Date
CN116904569A true CN116904569A (zh) 2023-10-20
CN116904569B CN116904569B (zh) 2023-12-15

Family

ID=88363405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311181331.5A Active CN116904569B (zh) 2023-09-13 2023-09-13 信号处理方法、装置、电子设备、介质和产品

Country Status (1)

Country Link
CN (1) CN116904569B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117497055A (zh) * 2024-01-02 2024-02-02 北京普译生物科技有限公司 神经网络模型训练、碱基测序电信号的片段化方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016098179A1 (ja) * 2014-12-16 2016-06-23 株式会社日立製作所 無線局装置、ベースバンドユニット及びrfユニット
CN106546793A (zh) * 2016-11-01 2017-03-29 长园深瑞继保自动化有限公司 三相一体化全光纤电流互感器
US20200069201A1 (en) * 2018-09-03 2020-03-05 Lite-On Singapore Pte. Ltd. Heart rate detection system and wearable device using the same
CN113743301A (zh) * 2021-09-03 2021-12-03 中国科学院重庆绿色智能技术研究院 一种基于残差自编码器卷积神经网络的固态纳米孔测序电信号降噪处理方法
WO2022160593A1 (zh) * 2021-01-28 2022-08-04 歌尔股份有限公司 一种语音增强方法、装置、系统及计算机可读存储介质
CN115062663A (zh) * 2022-06-27 2022-09-16 浙江正泰中自控制工程有限公司 一种模拟信号的数字滤波方法、系统、服务器及介质
CN116711007A (zh) * 2021-04-01 2023-09-05 深圳市韶音科技有限公司 一种语音增强方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016098179A1 (ja) * 2014-12-16 2016-06-23 株式会社日立製作所 無線局装置、ベースバンドユニット及びrfユニット
CN106546793A (zh) * 2016-11-01 2017-03-29 长园深瑞继保自动化有限公司 三相一体化全光纤电流互感器
US20200069201A1 (en) * 2018-09-03 2020-03-05 Lite-On Singapore Pte. Ltd. Heart rate detection system and wearable device using the same
WO2022160593A1 (zh) * 2021-01-28 2022-08-04 歌尔股份有限公司 一种语音增强方法、装置、系统及计算机可读存储介质
CN116711007A (zh) * 2021-04-01 2023-09-05 深圳市韶音科技有限公司 一种语音增强方法和系统
CN113743301A (zh) * 2021-09-03 2021-12-03 中国科学院重庆绿色智能技术研究院 一种基于残差自编码器卷积神经网络的固态纳米孔测序电信号降噪处理方法
CN115062663A (zh) * 2022-06-27 2022-09-16 浙江正泰中自控制工程有限公司 一种模拟信号的数字滤波方法、系统、服务器及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117497055A (zh) * 2024-01-02 2024-02-02 北京普译生物科技有限公司 神经网络模型训练、碱基测序电信号的片段化方法及装置
CN117497055B (zh) * 2024-01-02 2024-03-12 北京普译生物科技有限公司 神经网络模型训练、碱基测序电信号的片段化方法及装置

Also Published As

Publication number Publication date
CN116904569B (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
US11113816B2 (en) Image segmentation apparatus, method and relevant computing device
CN116904569B (zh) 信号处理方法、装置、电子设备、介质和产品
CN107068161B (zh) 基于人工智能的语音降噪方法、装置和计算机设备
CN108172213B (zh) 娇喘音频识别方法、装置、设备及计算机可读介质
CN111238814B (zh) 一种基于短时希尔伯特变换的滚动轴承故障诊断方法
CN110189260B (zh) 一种基于多尺度并行门控神经网络的图像降噪方法
EP2636993A1 (en) Stereo image processing device and stereo image processing method
WO2023035757A1 (zh) 生物聚合物的表征方法、装置、设备及计算机存储介质
CN104394411A (zh) 中值滤波装置及方法
CN110020658B (zh) 一种基于多任务深度学习的显著目标检测方法
CN111046971A (zh) 图像识别方法、装置、设备及计算机可读存储介质
CN114022479A (zh) 电池极耳外观缺陷检测方法
CN110677364A (zh) 一种检测主同步信号的方法及检测装置
CN113706462A (zh) 产品表面缺陷检测方法、装置、设备及存储介质
CN117036190A (zh) 图像去噪方法、装置及电子设备
CN112420065A (zh) 音频降噪处理方法和装置及设备
CN112116917B (zh) 基于相位跃变度的电抗器本体与风机声信号分离方法
CN113723442A (zh) 一种电子鼻气体识别方法、系统、电子设备及存储介质
CN113313086A (zh) 特征向量转换模型处理方法、装置、服务器及存储介质
CN113679386A (zh) 对注意力进行识别的方法、装置、终端及介质
Park et al. Diagonally-reinforced lane detection scheme for high-performance advanced driver assistance systems
CN118098276A (zh) 故障检测方法、装置、设备、存储介质及车辆
CN112985583B (zh) 结合短时脉冲检测的声学成像方法和系统
CN114266997A (zh) 视频动作识别模型的训练方法、装置、计算设备及存储介质
CN116166498A (zh) 故障监测方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant