CN115101128B - 一种杂交捕获探针脱靶危险性评估的方法 - Google Patents

一种杂交捕获探针脱靶危险性评估的方法 Download PDF

Info

Publication number
CN115101128B
CN115101128B CN202210758056.8A CN202210758056A CN115101128B CN 115101128 B CN115101128 B CN 115101128B CN 202210758056 A CN202210758056 A CN 202210758056A CN 115101128 B CN115101128 B CN 115101128B
Authority
CN
China
Prior art keywords
probe
sequence
value
target
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210758056.8A
Other languages
English (en)
Other versions
CN115101128A (zh
Inventor
汪彪
曲燕
吴强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naonda Nanjing Biological Technology Co ltd
Original Assignee
Naonda Nanjing Biological Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naonda Nanjing Biological Technology Co ltd filed Critical Naonda Nanjing Biological Technology Co ltd
Priority to CN202210758056.8A priority Critical patent/CN115101128B/zh
Publication of CN115101128A publication Critical patent/CN115101128A/zh
Application granted granted Critical
Publication of CN115101128B publication Critical patent/CN115101128B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/50Compression of genetic data

Landscapes

  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种评估杂交捕获探针脱靶危险性的方法,其原理是将待靶向富集的基因组参考序列截取一定长度的序列片段,记录不同序列的片段出现的次数,然后分析探针序列中这一长度片段出现的次数,评估探针非特异地捕获到区域外序列的危险性。该方法不依赖比对软件,可以一次性地获取整个基因组上所有区域的杂交捕获探针脱靶危险性信息,并快速调用,减少了杂交捕获NGS测序中的脱靶问题。

Description

一种杂交捕获探针脱靶危险性评估的方法
技术领域
本发明涉及基因检测领域,具体涉及一种杂交捕获探针脱靶危险性评估的方法。
背景技术
核酸序列是生命信息的载体,而高通量测序技术已成为生物和医学领域的核心技术之一。高通量测序产生大量的数据,其中并非全部都是研究或者检测的目标序列,杂交捕获NGS即是利用针对待富集序列设计的探针,与待富集的文库杂交,捕获待富集文库分子,然后进行高通量测序的技术,这一技术可以大大提高测序数据中感兴趣序列的比例,节约测序成本,并获得更丰富的目标区域序列信息。与基于PCR技术的靶向捕获NGS相比,由于采用了探针杂交而具有更高的容错性,即使结合区域含有序列变异,仍然能够成功捕获,但是正因如此,杂交捕获富集相比PCR富集,测序数据中含有的目标区域外的序列较多,较难以获得接近100%的中靶率,特别是当部分探针设计在基因组中的重复区时,由于基因组中含有大量类似的序列,这部分探针会带来大量的脱靶序列,最终杂交捕获的中靶率可能会大幅下降。因此,评估探针脱靶的危险性,是杂交捕获NGS技术的重要环节。
探针脱靶危险性评估常用的方法包括两种,一是利用已知的基因组注释信息,将与已知的重复区重叠的探针评估为危险,不与已知重复区重叠的探针评估为安全;另一种是将探针的序列比对到基因组上,根据其在基因组上可以比对的位置个数来评估其脱靶危险性。其中,第一种速度快,但依赖于基因组注释的可获得性及准确性,且这种评估方式准确度不高,注释为重复区的区间也可能存在较多的序列多态性,因而不会产生脱靶现象,未注释为重复区的区间也有可能存在较多的序列相似区,因而产生预料之外的脱靶现象。第二种方法则存在速度过慢的情况,特别是基因组的大小较大时。例如人基因组约有三十亿个碱基,要寻找每一条探针可能的比对位置,需要的时间较长,特别是当需要评估的探针数量较多时。
当目标区域的探针脱靶危险性较高,但是又不能放弃这一区域时,可以考虑将探针位置移动到临近的安全区间,由于文库分子片段只需要有一部分和探针结合即可被捕获,而基因组断裂成片段时断裂位置通常是有随机性的,捕获到的片段会包含探针临近区域的序列。如果采用的是探针比对到基因组上的评估方法,则需要对挪动后的探针再次评估,进一步增加评估难度。因此,对基因组先行评估,直接调用脱靶危险性信息的方法可以提高探针设计效率,获得更好地满足分析需求的杂交捕获探针池。
目前杂交捕获NGS在医学临床检测及生命科学研究中应用极为广泛,各种个性化的应用需要设计个性化的探针池,因此,开发一个快速可靠的探针脱靶危险性评估方法具有重要的意义。
发明内容
针对现有杂交捕获NGS技术的探针脱靶危险性评估环节的部分技术问题,本发明的目的在于提供一种快捷、准确的评估方法,其不依赖基因组重复区注释,也不依赖序列比对软件。
为实现上述目的,本发明提供如下技术方案:
一种探针脱靶危险性评估方法,包括如下步骤:
(1)从参考基因组序列中依次截取长度为k的序列片段,每隔n个碱基截取一次,记录上述序列片段出现的次数n’;
(2)计算参考基因组所有位置对应探针的脱靶危险性评分
i.从参考基因组序列中再次依次截取长度为k的序列片段,每间隔一个碱基截取一次,每次截取后,从步骤(1)中记录的片段出现次数中查找此片段的出现次数n’;
ii.以全基因组中的所有碱基自身位置为起始,所有起始碱基对应的长度为p的探针的初始脱靶危险评分设为0;
iii.假设前述步骤(2)i.记录的截取的长度为k的序列片段是从第i个碱基截取的,则其出现次数n’的值需要计入临近区域内探针的评分,即从碱基i-p+m开始,至碱基i+k-m结束,每个起始碱基对应的探针,其脱靶危险评分增加n’,最终得到每个碱基位置相应探针的脱靶危险性评分值;
(3)非参考基因组探针的脱靶危险性评估
i.将非参考基因组探针的初始脱靶危险性评分设为0;
ii.针对外源靶标序列设置的探针序列,以1个碱基为间隔,依次截取长度为k的序列片段,接着查找步骤在(1)记录的参考基因组中此序列片段出现的次数n’,最后将本步骤中每个截取的长度为k的序列片段的出现次数n’相加起来,即为此探针的脱靶危险性评分。
前述步骤根据脱靶危险性评分值来对探针的风险进行排序或者分档,并不单纯设置危险与安全的一个阈值。在实施例2中,根据分值进行排序划分出3组;实际应用中,可以根据可接受的中靶率和需要达到的探针覆盖完全度进行取舍。
优选地,上述步骤(1)的k值在20-60之间。
更优选地,上述步骤(1)的k值为30。
优选地,上述步骤(1)的n值在1-30之间。
更优选地,上述步骤(1)的n值为5。
优选地,上述步骤(2)的p值在60-160nt之间。
更优选地,上述步骤(2)的p值为120nt。
可选的,于上述步骤(1)中一并记录序列片段的反向互补序列。
可选的,于上述步骤(1)过滤出现次数小于阈值的序列,减少存储空间占用。
若上述步骤(1)中未记录反向互补序列,则查找截取片段的出现次数时需要进一步查找此片段反向互补序列的出现次数,并与原片段的数值相加。
若上述步骤(1)中记录了反向互补序列,则查找截取片段的出现次数时不需要再考虑反向互补序列。
优选地,上述步骤(2)的m值在0与k之间。
更优选地,上述步骤(2)的m值为k/2。
本发明还提供一种全基因组探针评估结果储存的方案,可快速调用便于探针的挑选。
优选地,将前述评估方法步骤(2)中计算得到的每个碱基位置相应探针的脱靶危险性评分值依次转化为字符,生成的字符串以FASTA格式存储为FASTA文件。
举例来说,生成的字符串可以是从A到Z的字符,对应ASCII表65至90位字符,字符即代表此位置备选探针的脱靶危险性评估等级。
前述FASTA格式文件与参考基因组序列FASTA格式文件在碱基位置上为映射关系。
进一步地,前述FASTA文件可以压缩储存,并建立索引,方便调用。
优选地,以FASTA文件可以用bgzip压缩成BGZF格式,再以samtools faidx建立索引。
更优选地,前述FASTA格式文件利用索引可快速提取参考基因组特定位置的字符信息,即该位置备选探针的脱靶危险性评估等级。
与现有技术相比,本发明的方法有益效果在于:
(1)直接记录参考基因组中不同短序列片段出现的次数,不依赖序列比对软件,计算速度快。
(2)一次分析即可获得整个参考基因组所有位置的探针脱靶危险性评估结果,且易于存储和调用。
(3)利用了液相杂交捕获技术对探针错配容忍度的特性,不考虑序列差异,仅考虑特定短序列出现的次数,评估结果更为可靠。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成本发明的不当限定。
图1为本发明探针脱靶危险性评估方法步骤的流程图。
图2为本发明的方法对探针脱靶危险性评估和根据bowtie2比对hits数进行评估的测试结果,可以看出本发明的方法评估结果更为准确,中靶率更高。
具体实施方式
以下结合附图与具体实施例对本发明做进一步的描述,本发明的保护内容不局限于以下实施例。还应该理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围,并不是唯一性限定。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求及其任何等同物为本发明的保护范围。
本文中使用的所有技术和科学术语具有被本发明所属领域技术人员普遍理解的相同含义。在其他情况下,本文使用的某些术语会在说明书中阐明其含义。下列实施例中未注明具体条件的实验方法,均为本领域技术人员的普遍知识和公知常识。实施例中使用的试剂,如果没有特别说明,在满足实验要求的情况下,均购自试剂公司。本申请中的实施例及实施例中的特征可以相互组合。
通过以下详细说明结合附图可以进一步理解本发明的特点和优点。所提供的实施例仅是对本发明方法的说明,而不以任何方式限制本发明揭示的其余内容。
本发明提供了探针脱靶危险性评估方法,该方法能够计算参考基因组所有位置对应探针的脱靶危险性评分,并且能够对非参考基因组探针的脱靶危险性进行评估。
除此之外,还提供一种全基因组探针评估结果储存的方案,能够储存参考基因组所有探针脱靶危险性评分并且可以快速调用评分,便于探针的筛选。
应用本发明的评估方法,使探针可依据其捕获特异性进行分组,明确了探针设计中的风险探针和安全探针的分类标准。经验证,依本发明的方法进行分类的探针在后续应用过程中有着良好的表现,较现有分类方法筛选出的探针其中靶率水平有明显的提升。
本发明使用的探针是常规的120碱基探针,不同厂商提供单链DNA、双链DNA、单链RNA、双链RNA等多种形式,以及末端生物素修饰,或中间生物素修饰等修饰形式。以下实施例中均采用5'端生物素修饰的单链DNA。
本发明的非参考基因组探针一方面是指同一物种中,参考基因组中未体现的序列,例如针对高多态区差异性序列所设置的探针;另一方面,也指在参考基因组的背景下,捕获外源核酸序列的探针,例如人源标本中病原微生物的捕获探针。
以下实施例中使用的对软件bowtie2参数可随实际研究的物种及待评估探针长度改变而变化,可根据实际探针试捕获效果进行统筹评估后确定最优参数,本领域技术人员能够根据实际情况进行相关参数的设定。
实施例1:人参考基因组hg19探针脱靶危险性评估
本实施例中,从UCSC网站下载hg19参考基因组FASTA文件,其中包含3,137,161,264个碱基。以5个碱基为间隔,依次截取长度为30碱基的片段,记录每个片段序列出现的次数,同时记录其反向互补序列的次数,共记录525,961,648种序列,仅保留出现次数5次以上的序列,共1,452,870种。
候选探针长度设为120碱基,对全基因组所有可能的位置进行评估,全基因组所有位置的候选探针初始脱靶危险性评估值均设定为0。
再次依次截取长度为30碱基的片段,间隔为1个碱基,每个片段查到在上一步记录的出现次数,此数值加进从其前105至其后15范围内的每一个候选探针评估值中。具体来说,在碱基位置x处取30碱基的片段,查找其出现次数,从x-105到x+15的范围内所有的120碱基的探针都会包含这一个30碱基的片段,因此都要加上这一个出现次数的数字。
根据数值分布,评估值每480分为一档,依次对应A到Z的字符,即0-480分:A,480-960分:B,以此类推,至Z档封顶,并根据在基因组中的顺序存储为FASTA格式,压缩成BGZF格式,建立索引。
最终产生人参考基因组hg19全部120碱基探针脱靶危险性评估等级文件,大小为70.7MB。
调取并输出随机排序的四十万条探针(全外显子规模)评估等级,典型用时为45秒。
实施例2:人参考基因组复杂区域探针评估及杂交捕获实验测试
本实施例中,从与人参考基因组hg19中致癌融合基因相关的内含子区选取90条位于已知重复区的探针,以bowtie2将其序列比对到人基因组上,探针涉及高度重复序列,获得全部的比对结果耗时过长,因此设置参数为最多寻找10,000个比对,单进程耗时约9分钟。以比对hits数评估其脱靶危险性,按照hits数由低到高排列,对应危险性由低到高,分为三组,每组30条,分别以A1、A2、A3指代。从实例1中所获得的评估结果中调取风险等级,耗时仅0.06秒,同样根据等级排序,分为三组,分别以B1、B2、B3指代,分组详见表1。
表1
以一组探针数量为2,200条的探针池(OncoFu Panel v2.0,纳昂达(南京)生物科技有限公司)为基础,记为S,向其中依次添加上述A1、A2、A3或B1、B2、B3探针,以及对人基因组DNA文库(DNA为Promega Human Genomic DNA,货号G1471,以纳昂达DNA通用型文库构建试剂盒制备文库,货号1002101),以NadPrep Hybrid Capture Reagents(货号:1005102,纳昂达(南京)生物科技有限公司)进行杂交捕获并测序,杂交捕获流程按照产品说明书中的步骤进行。从测序数据中,统计比对位置与探针位置有重叠的读段(reads)占比,即中靶率。
如图2所示,基础探针池单独捕获,中靶率为89.3,加入A1探针后为79.2,而加入B1探针后为84.2;加入A1和A2后为63.4,加入B1和B2后为76.4;加入A1、A2、A3后为55.8,加入B1、B2、B3后为56.9。基础探针池已是市售商品,本实例试图增加其未覆盖的复杂区域,必然会造成中靶率相对下降,但是本发明的方法提供了更为准确的评估方式,以降低中靶率下降的幅度。本实例的结果显示,本发明提供的方法对探针脱靶危险性的评估结果相较于根据bowtie2比对hits数进行的评估结果更为准确,加入危险性较低的30条或60条探针时,中靶率更高,按照本方法评估后,能够找出相对安全的探针,加入后中靶率下降显著减少。
实施例3:非参考基因组探针评估实验测试
本实施例针对13种高危人乳突瘤病毒(HPV16、18、31、33、35、39、45、51、52、56、58、59、68,序列NCBI编号分别为:K02718、X05015、J04353、M12732、X74477、M62849、X74479、M62877、X74481、X74483)和5种中危人乳突瘤病毒(HPV 26、53、66、73、82,序列NCBI编号分别为:X74472、X74482、U31794、X94165、AB027021)设计杂交捕获探针,并按照实施例1的方法评估其在人源核酸背景下的脱靶危险性。其中HPV82第7022-7141区间的探针被评为F,而其余探针均为B或以下。
以Hela细胞系gDNA建库,NadPrep Hybrid Capture Reagents进行杂交捕获,Illumina测序平台测序。结果显示,以全部探针捕获,平均中靶率为84.3(SD=1.3,n=3),去掉HPV82:7022-7141探针,平均中靶率为85.5(SD=0.5,n=3),HPV82:7022-7141探针能引起约1%的中靶率降低,可根据对中靶率和覆盖度的不同侧重,考虑是否删除此条探针。
以上仅为本发明的优选实施例,并不用于限制本发明。本发明提及的所有文献都在本申请中全文引用作为参考。此外应理解,在阅读了本发明的上述讲授内容之后,凡在本发明的精神和原则之内,本领域技术人员可以对本发明作各种改动或修改,这些等价形式的修改同样落于本申请权利要求书所限定的范围。

Claims (8)

1.一种探针脱靶危险性评估方法,其特征在于,包括如下步骤:
(1)从参考基因组序列中依次截取长度为k的序列片段,每隔n个碱基截取一次,记录所述序列片段出现的次数n’;所述k的取值在20-60之间;所述n的取值在1-30之间;
(2)计算参考基因组所有位置对应探针的脱靶危险性评分
i.从参考基因组序列中再次依次截取长度为k的序列片段,
每间隔一个碱基截取一次,每次截取后,从步骤(1)中记录的片段出现次数中查找此片段的出现次数n’;
ii.以全基因组中的所有碱基自身位置为起始,所有起始碱基对应的长度为p的探针的初始脱靶危险评分设为0;所述p的取值在60-160nt之间;
iii.假设所述步骤(2)i.记录的截取的长度为k的序列片段是从第i个碱基开始截取的,则其出现次数n’的值需要计入临近区域内探针的评分,即从碱基i-p+m开始,至碱基i+k-m结束,每个起始碱基对应的探针,其脱靶危险评分增加n’,最终得到每个碱基位置相应探针的脱靶危险性评分值;所述m的取值在0与k之间;
(3)非参考基因组探针的脱靶危险性评估
i.将非参考基因组探针的初始脱靶危险性评分设为0;
ii.针对外源靶标序列设置的探针序列,以1个碱基为间隔,依次截取长度为k的序列片段,接着查找步骤(1)记录的参考基因组中此序列片段出现的次数n’,最后将本步骤中每个截取的长度为k的序列片段的出现次数n’相加起来,即为此探针的脱靶危险性评分。
2.根据权利要求1所述的方法,其特征在于,所述k的取值为30。
3.根据权利要求2所述的方法,其特征在于,所述n的取值为5。
4.根据权利要求3所述的方法,其特征在于,所述p的取值为120nt。
5.根据权利要求4所述的方法,其特征在于,所述m的取值为k/2。
6.一种探针脱靶危险性评估结果的储存方法,其特征在于,将权利要求1所述方法得到的探针脱靶危险性评分值依次转化为字符,生成的字符串以FASTA格式存储为FASTA文件。
7.根据权利要求6所述的方法,其特征在于,所述FASTA文件进一步压缩储存,并建立索引。
8.根据权利要求7所述的方法,其特征在于,所述FASTA文件用bgzip压缩成BGZF格式,再以samtools faidx建立索引。
CN202210758056.8A 2022-06-29 2022-06-29 一种杂交捕获探针脱靶危险性评估的方法 Active CN115101128B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210758056.8A CN115101128B (zh) 2022-06-29 2022-06-29 一种杂交捕获探针脱靶危险性评估的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210758056.8A CN115101128B (zh) 2022-06-29 2022-06-29 一种杂交捕获探针脱靶危险性评估的方法

Publications (2)

Publication Number Publication Date
CN115101128A CN115101128A (zh) 2022-09-23
CN115101128B true CN115101128B (zh) 2023-09-15

Family

ID=83295410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210758056.8A Active CN115101128B (zh) 2022-06-29 2022-06-29 一种杂交捕获探针脱靶危险性评估的方法

Country Status (1)

Country Link
CN (1) CN115101128B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116230086B (zh) * 2022-12-26 2023-11-10 纳昂达(南京)生物科技有限公司 一种通过修改模体提升探针安全性的方法及装置
CN116206684B (zh) * 2022-12-26 2024-01-30 纳昂达(南京)生物科技有限公司 一种评估基因组重复区探针捕获安全性的方法及其装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016000267A1 (zh) * 2014-07-04 2016-01-07 深圳华大基因股份有限公司 确定探针序列的方法和基因组结构变异的检测方法
CN108474032A (zh) * 2015-10-07 2018-08-31 亿明达股份有限公司 测序技术中的脱靶捕捉降低
CN114300052A (zh) * 2021-12-15 2022-04-08 纳昂达(南京)生物科技有限公司 评估核酸探针捕获特异性的方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070042388A1 (en) * 2005-08-12 2007-02-22 Wong Christopher W Method of probe design and/or of nucleic acids detection
US7979215B2 (en) * 2007-07-30 2011-07-12 Agilent Technologies, Inc. Methods and systems for evaluating CGH candidate probe nucleic acid sequences
EP3427171A1 (en) * 2016-03-10 2019-01-16 Genomic Vision Method for analyzing a sequence of target regions and detect anomalies

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016000267A1 (zh) * 2014-07-04 2016-01-07 深圳华大基因股份有限公司 确定探针序列的方法和基因组结构变异的检测方法
CN108474032A (zh) * 2015-10-07 2018-08-31 亿明达股份有限公司 测序技术中的脱靶捕捉降低
CN114300052A (zh) * 2021-12-15 2022-04-08 纳昂达(南京)生物科技有限公司 评估核酸探针捕获特异性的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于数据挖掘的癌症 DNA 序列变异检测及分类方法研究;陈国彬;《中国博士学位论文全文数据库 (医药卫生科技辑)》(第第2期期);E072-4 *

Also Published As

Publication number Publication date
CN115101128A (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN115101128B (zh) 一种杂交捕获探针脱靶危险性评估的方法
RU2610691C2 (ru) Способ обнаружения микроделеций в области хромосомы с днк-маркирующим участком
CN110189796A (zh) 一种绵羊全基因组重测序分析方法
CN110669834A (zh) 一种基于转录组序列开发多态性ssr标记的方法
CN114657238A (zh) 一种枸杞40k液相芯片及应用
WO2013097048A1 (zh) 基因组单核苷酸多态性位点的标记方法和装置
CN115083521A (zh) 一种单细胞转录组测序数据中肿瘤细胞类群的鉴定方法及系统
CN110556163B (zh) 一种基于翻译组的长链非编码rna翻译小肽的分析方法
EP1889924B1 (en) Method of designing probes for detecting target sequence and method of detecting target sequence using the probes
CN110970091A (zh) 标签质控的方法及装置
CN110782946A (zh) 识别重复序列的方法及装置、存储介质、电子设备
KR102347463B1 (ko) 핵산 서열 분석에서 위양성 변이를 검출하는 방법 및 장치
CN116083562B (zh) 一种与阿司匹林抵抗辅助诊断相关的snp标志物组合、引物合集及其应用
CN114530200B (zh) 基于计算snp熵值的混合样本鉴定方法
CN112885407B (zh) 一种基于二代测序的微单倍型检测分型系统和方法
CN110684830A (zh) 一种石蜡切片组织rna分析方法
CN110066862B (zh) 一种基于高通量测序读数的重复dna序列识别方法
CN116230086B (zh) 一种通过修改模体提升探针安全性的方法及装置
CN116206684B (zh) 一种评估基因组重复区探针捕获安全性的方法及其装置
CN112634983B (zh) 病原物种特异pcr引物优化设计方法
CN109321646A (zh) 基于ngs读段与参考序列比对的虚拟pcr方法
CN116206686B (zh) 非对称pcr反应中的pcr熔解曲线分析方法及其应用
CN113764041B (zh) 物种基因识别标签的查找方法、装置及电子设备
KR102111731B1 (ko) 핵산 시퀀스를 분석하는 방법 및 장치
CN114171121A (zh) 一种mRNA 5’3’末端差异的快速检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant