CN110904182A - 基因组重复序列删除率确定方法、装置、设备及存储介质 - Google Patents

基因组重复序列删除率确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110904182A
CN110904182A CN201911135235.0A CN201911135235A CN110904182A CN 110904182 A CN110904182 A CN 110904182A CN 201911135235 A CN201911135235 A CN 201911135235A CN 110904182 A CN110904182 A CN 110904182A
Authority
CN
China
Prior art keywords
bacteria
bacterium
sequence
fluorescent protein
deletion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911135235.0A
Other languages
English (en)
Other versions
CN110904182B (zh
Inventor
金帆
黄亚佳
倪磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201911135235.0A priority Critical patent/CN110904182B/zh
Publication of CN110904182A publication Critical patent/CN110904182A/zh
Priority to PCT/CN2020/129210 priority patent/WO2021098661A1/zh
Application granted granted Critical
Publication of CN110904182B publication Critical patent/CN110904182B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Optics & Photonics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本申请适用于属于生物技术领域,提供了一种基因组重复序列删除率确定方法、装置、设备及存储介质。方法包括获取细菌集中每个细菌的荧光数据和细菌集中所有细菌的数目,细菌集中的细菌由同一个母代细菌分裂获得;根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型,统计细菌集中重复序列删除细菌的数目;根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。本申请提供的基因组重复序列删除率确定方法,可以通过荧光数据直接识别细菌集中发生重复序列删除的细菌,进而根据重复序列删除细菌的数目计算获得重复序列删除率,方案简单且可信度高。

Description

基因组重复序列删除率确定方法、装置、设备及存储介质
技术领域
本申请属于生物技术领域,尤其涉及一种基因组重复序列删除率确定方法、装置、设备及存储介质。
背景技术
重组是细胞修复DNA(脱氧核糖核酸)双链断裂的重要途径,它影响着种群的基因多样性和自然选择。由于重组常常伴随着DNA序列中重复序列的删除,因此定量获得基因组的重复序列删除率对研究重组的发生机制有着重要的意义。
目前,重复序列删除率的检测方法主要为生物信息学方法。生物信息学方法主要通过对细菌的DNA序列测序比对来识别各DNA序列中的重组或者寻找重组的热点,进而统计分析获得重组过程中的各基因组的重复序列删除率。
基于生物信息学的方法主要依赖于分析算法的建立,而现有的分析算法繁杂且标准不统一,无法对分析结果进行准确的验证,导致基因组的重复序列删除率的可信度较低。
发明内容
有鉴于此,本申请实施例提供了一种基因组重复序列删除率确定方法、装置、设备及存储介质,以解决现有技术中基因组重复序列删除率可信度较低的技术问题。
第一方面,本申请实施例提供了一种基因组重复序列删除率确定方法,包括:
获取细菌集中每个细菌的荧光数据和细菌集中所有细菌的数目;细菌集中的细菌由同一个母代细菌分裂获得;
根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型;DNA序列的变化类型包括重复序列删除;
统计细菌集中重复序列删除细菌的数目;重复序列删除细菌为DNA序列的变化类型为重复序列删除的细菌;
根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。
在第一方面的一种可能的实现方式中,母代细菌的DNA序列包括:两个同源序列、响应蛋白的编码序列、第一荧光蛋白的编码序列和第二荧光蛋白的编码序列;响应蛋白的编码序列和第一荧光蛋白的编码序列位于两个同源序列之间;响应蛋白用于抑制第二荧光蛋白的表达;
获取细菌集中每个细菌的荧光数据,包括:
获取每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度;
分别根据每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度,确定每个细菌的第一荧光蛋白的荧光状态和第二荧光蛋白的荧光状态。
在第一方面的一种可能的实现方式中,分别根据每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度,确定每个细菌的第一荧光蛋白的荧光状态和第二荧光蛋白的荧光状态,包括:
针对每个细菌,若该细菌的第一荧光蛋白的荧光强度大于第一预设值,则该细菌的第一荧光蛋白的荧光状态为开;和/或,若该细菌的第二荧光蛋白的荧光强度大于第二预设值,则该细菌的第二荧光蛋白的荧光状态为开。
在第一方面的一种可能的实现方式中,根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型,包括:
针对每个细菌,在该细菌的第一荧光蛋白的荧光状态为关且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变化类型为重复序列删除。
在第一方面的一种可能的实现方式中,响应蛋白为Lacl蛋白;
根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型,包括:
针对每个细菌,在该细菌的第一荧光蛋白的荧光状态为开且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变化类型为有义突变;其中,有义突变用于指示Lacl蛋白功能性失活。
在第一方面的一种可能的实现方式中,母代细菌的DNA序列还包括第三荧光蛋白的编码序列;第三荧光蛋白用于识别所述母代细菌的轮廓。
在第一方面的一种可能的实现方式中,根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率,包括:
将细菌集中重复序列删除细菌的数目与细菌集中所有细菌的数目作商,获得重复序列删除细菌的比重;
根据细菌集中所有细菌的数目,确定母代细菌的分裂代数;
根据重复序列删除细菌的比重和分裂代数,计算获得母代细菌的重复序列删除率。
在第一方面的一种可能的实现方式中,根据重复序列删除细菌的比重和分裂代数,计算获得母代细菌的重复序列删除率,包括:
将重复序列删除细菌的比重和分裂代数作商,获得母代细菌的重复序列删除率。
第二方面,本申请实施例提供了一种基因组重复序列删除率确定装置,包括:
获取模块,用于获取细菌集中每个细菌的荧光数据和细菌集中所有细菌的数目;细菌集中的细菌由同一个母代细菌分裂获得;
确定模块,用于根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型;DNA序列的变化类型包括重复序列删除;
统计模块,用于统计细菌集中重复序列删除细菌的数目;重复序列删除细菌为DNA序列的变化类型为重复序列删除的细菌;
计算模块,用于根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。
第三方面,本申请实施例提供了一种基因组重复序列删除率确定设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述第一方面任一项方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任一项方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项的方法。
本申请实施例提供的基因组重复序列删除率确定方法,获取基于同一个母代细菌培育获得的细菌集中每个细菌的荧光数据和该细菌集中所有细菌的数目,然后根据每个细菌的荧光数据,确定细菌集中每个细菌的DNA序列变化类型,统计获得重复序列删除细菌的数目,重复序列删除细菌即基因组发生重复序列删除的细菌,最后根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。本申请实施例提供的基因组重复序列删除率确定方法,根据细菌的荧光数据直接确定每个细菌的基因组在重组中是否发生重复序列删除,从而获得细菌集中重复序列删除细菌的数目,然后根据重复序列删除细菌的数目计算获得重复序列删除率,方案简单且可信度高。
另一方面,本申请实施例提供的基因组重复序列删除率确定方法可以将用于发出荧光数据的荧光标记物引入母代细菌基因组的任意位置,从而实现对基因组任意位置的重复序列删除率的定量测量。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的基因组重复序列删除率确定系统的架构示意图;
图2是本申请一实施例提供的基因组重复序列删除率确定方法的流程示意图;
图3是本申请一实施例提供的母代细菌的DNA序列组成示意图;
图4是本申请一实施例提供的获取每个细菌的荧光数据的流程示意图;
图5是本申请一实施例提供的获得母代细菌的重复序列删除率的流程示意图;
图6是本申请一实施例提供的基因组重复序列删除率确定装置的结构示意图;
图7是本申请一实施例提供的基因组重复序列删除率确定设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
图1为本申请一实施例提供的基因组重复序列删除率确定系统的架构示意图,如图1所示,本申请实施例提供的基因组重复序列删除率确定方法可以应用如图1所示的基因组重复序列删除率确定系统。
基因组重复序列删除率确定系统包括光检测设备10和重复序列删除率确定设备20。
光检测设备10用于检测样本细菌中荧光标记物发射的荧光并生成荧光数据。其中,荧光标记物可以为荧光蛋白。
示例性的,光检测设备10可以为光学显微镜。
重复序列删除率确定设备20通过网络与光检测设备10连接,用于获取光检测设备10采集到的样本细菌的荧光数据,并根据该荧光数据确定样本细菌的重复序列删除率;其中,重复序列是细菌的基因组中重复拷贝的序列;基因组为细菌中所有具有遗传效应的DNA序列的总称。应理解的是,基因组可以包含有多个DNA序列。
样本细菌为包含有荧光蛋白的编码序列的细菌。通过设置荧光蛋白的编码序列在细菌基因组目标DNA序列的位置,使得荧光蛋白的编码序列与DNA序列中的重复序列的同步删除,进而通过荧光蛋白的荧光数据表征DNA序列中的重复序列的删除情况。
实际应用中,样本细菌的DNA序列在基因转录/翻译过程中,荧光蛋白也将表达(发射荧光);光检测设备10检测样本细菌的荧光蛋白的荧光并生成荧光数据,重复序列删除率确定设备20接收该荧光数据,并根据荧光数据直接获取样本细菌中发生重复序列删除的细菌的数目,进而可以确定重复序列的删除率。
进一步地,可以通过将荧光蛋白设置在样本细菌的DNA序列的任意位置,从而实现对DNA序列任意位置重复序列删除率的定量测量。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行示例性说明。值得说明的是,下文中列举的具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请一实施例提供的基因组重复序列删除率确定方法的流程示意图,本实施例的执行主体为图1中的重复序列删除率确定设备。如图2所示,该基因组重复序列删除率确定方法包括:
S201、获取细菌集中每个细菌的荧光数据和细菌集中所有细菌的数目;细菌集中的细菌由同一个母代细菌分裂获得。
在本实施例中,母代细菌的DNA序列中包含有荧光蛋白的编码序列。可以通过重组遗传技术将荧光蛋白的编码序列连接到母代细菌的DNA序列的目标位置,然后对母代细菌进行培育获得大量的子代细菌,大量的子代细菌构成细菌集。
其中,荧光蛋白为一种荧光蛋白质,该荧光蛋白质的光穿透性极强,通过该荧光蛋白质可以观测到细菌细胞的活动。例如:通过将荧光蛋白的编码序列设置在母代细菌的DNA序列的目标位置,母代细菌的DNA序列在基因转录/翻译过程(体现为细菌的分裂过程)中,荧光蛋白也将表达(发射荧光);光检测设备10检测细菌的荧光蛋白发射的荧光并生成荧光数据。
其中,对母代细菌进行培育获得细菌集的过程,包括:完整地刮取单克隆菌斑重悬于新鲜的肉汤培养基,取1/10体积的细菌悬液滴在该新鲜的固体肉汤培养基上培养20小时至24小时。培养完成后,完整地刮取单克隆菌斑重悬于1mL的10%蔗糖溶液中,测量并记录细菌悬液的OD600值,并获得细菌集。应理解的是,在环境适宜的时候,细菌约30分钟分裂一次,经过24小时后,母代细菌可以分裂48代,此时细菌悬液中的细菌个数约为2的48次方。可选地,可以根据细菌悬液的OD600值确定细菌悬液中细菌浓度。
在本实施例中,获取细菌集中每个细菌的荧光数据包括通过光学显微镜扫描获取细菌悬液中每个细菌的荧光数据,并将每个细菌的荧光数据发送至重复序列删除率确定设备。可选地,光学显微镜的扫描方式为蒙太奇扫描。
在本实施例中,获取细菌集中所有细菌的数目包括基于细菌悬液的OD600值确定细菌悬液中包括的细菌的数目。本实施例中,细菌集中的子代细菌的数目不少于十万个。
S202、根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型;DNA序列的变化类型包括重复序列删除。
母代细菌在分裂获得子代细菌的过程中,DNA序列可能会发生变化也可能保持不变。其中,DNA序列的变化类型包括重复序列的删除、基因突变(有义突变)等。
在本实施例中,荧光数据可以为每个细菌包含的荧光蛋白的荧光强度,也可以每个细菌包含的荧光蛋白的荧光状态。荧光状态可以为开或关。实际应用中,光学显微镜扫描细菌,获取每个细菌的DNA序列的图像,并根据荧光蛋白在DNA序列中的位置,识别不同荧光蛋白的荧光强度。
根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型,包括根据每个细菌的荧光蛋白的荧光状态,确定每个细菌的DNA序列的变换类型。
例如:可以将荧光蛋白的编码序列设置在重复序列之间,当某一细菌的DNA序列中该重复序列发生删除时,则荧光蛋白的编码序列也将被删除;此时采集获得的荧光数据中,该荧光蛋白的荧光状态表征为关,因此通过荧光蛋白的荧光状态的变化来表征DNA序列中是否发生重复序列的删除。
为了更清楚的说明本步骤,请一并参阅图3,图3为本申请实施例提供的母代细菌的DNA序列组成示意图。
如图3所示,母代细菌的DNA序列包括两个同源序列、响应蛋白的编码序列、第一荧光蛋白的编码序列和第二荧光蛋白的编码序列;其中响应蛋白的编码序列和第一荧光蛋白的编码序列位于两个同源序列之间;响应蛋白用于抑制第一荧光蛋白的表达。
示例性的,同源序列R用于指代重复序列,可以为母代细菌的DNA序列中的任意一组重复序列。响应蛋白为Lacl蛋白,第一荧光蛋白为红色荧光蛋白mScarletI,第二荧光蛋白为绿色荧光蛋白SfGFP,Lacl蛋白的编码序列和红色荧光蛋白SfGFP的编码序列位于两个同源序列R之间。
母代细菌分裂获得细菌集的过程中,可能会有子代细菌发生重复序列的删除,当发生重复序列删除的时候,两个同源序列的其中之一以及位于两个同源序列R之间的Lacl蛋白的编码序列和红色荧光蛋白SfGFP的编码序列也将被删除,此时发生重复序列删除的子代细菌中将没有红色荧光蛋白SfGFP的荧光数据,因此与未发生重复序列删除的细菌的荧光数据不同,可以通过细菌的荧光数据识别该细菌的DNA序列变化类型。
S203、统计细菌集中重复序列删除细菌的数目;重复序列删除细菌为DNA序列的变化类型为重复序列删除的细菌。
在本实施例中,将DNA序列的变化类型为重复序列删除的细菌作为重复序列删除细菌。将DNA序列的变化类型为有义突变的细菌作为有义突变细菌。
统计获得所有重复序列删除细菌的数目,即确定细菌集中重复序列删除细菌的数目。
S204、根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。
母代细菌经过多代分裂获得该细菌集。当数据量足够大的时候,在每一代细菌的分裂中,当前的细菌分裂获得子代细菌时的重复序列删除率相似,即每一代细菌的重复序列删除率相似。
在本实施例中,根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率,包括获取当前细菌集中重复序列删除细菌的比重,根据重复序列删除细菌的比重和分裂代数,计算获得母代细菌的重复序列删除率。其中,分类代数为母代细菌分裂获得当前细菌集的分裂代数。
本申请实施例提供的基因组重复序列删除率确定方法,获取基于同一个母代细菌培育获得的细菌集中每个细菌的荧光数据和该细菌集中所有细菌的数目,然后根据每个细菌的荧光数据,确定细菌集中每个细菌的DNA序列变化类型,统计获得重复序列删除细菌的数目,重复序列删除细菌即基因组发生重复序列删除的细菌,最后根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。本申请实施例提供的基因组重复序列删除率确定方法,根据细菌的荧光数据直接确定每个细菌的基因组在重组中是否发生重复序列删除,从而获得细菌集中重复序列删除细菌的数目,然后根据重复序列删除细菌的数目计算获得重复序列删除率,方案简单且可信度高。
另一方面,本申请实施例提供的基因组重复序列删除率确定方法可以将用于发出荧光数据的荧光标记物引入母代细菌基因组的任意位置,从而实现对基因组任意位置的重复序列删除率的定量测量。
细菌的荧光数据可以为荧光蛋白的荧光状态,其中荧光状态可以为开或者关。当荧光蛋白的荧光状态为开时,则表示该荧光蛋白正常表达;当荧光蛋白的荧光状态为关时,则表示该荧光蛋白的编码序列被删除或者该荧光蛋白的表达受到抑制。获取细菌集中每个细菌的荧光数据包括获取每个细菌中各个荧光蛋白的荧光状态。下面通过图4所示的实施例进行示例性的说明。
图4为本申请一实施例提供的获取每个细菌的荧光数据的流程示意图。本实施例在图2实施例的基础上,对步骤S201中如何获取每个细菌的荧光数据进行了示例性说明;步骤S201中的母代细菌的DNA序列包括两个同源序列、响应蛋白的编码序列、第一荧光蛋白的编码序列和第二荧光蛋白的编码序列;其中响应蛋白的编码序列和第一荧光蛋白的编码序列位于两个同源序列之间;响应蛋白用于抑制第二荧光蛋白的表达。如图4所示,获取细菌集中每个细菌的荧光数据,包括:
S401、获取每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度。
在本实施例中,通过光学显微镜采集每个细菌的荧光图像,通过对图像进行处理获得第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度。其中荧光强度具体体现为图像灰度的不同。
在本实施例中,为了更好的区分第一荧光蛋白和第二荧光蛋白,第一荧光蛋白和第二荧光蛋白是荧光颜色不同的荧光蛋白。
S402、分别根据每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度,确定每个细菌的第一荧光蛋白的荧光状态和第二荧光蛋白的荧光状态。
针对每个细菌,根据该细菌的第一荧光蛋白的荧光强度确定该细菌的第一荧光蛋白的荧光状态。
其中,荧光蛋白的荧光状态可以为关或开。在一种实施方式中,根据该细菌的第一荧光蛋白的荧光强度确定该细菌的第一荧光蛋白的荧光状态,包括:判断该细菌的第一荧光蛋白的荧光强度是否大于第一预设值,若是,则确定该细菌的第一荧光蛋白的荧光状态为开;若否,则确定该细菌的第一荧光蛋白的荧光状态为关。
同样的,针对每个细菌,根据该细菌的第二荧光蛋白的荧光强度是否大于第二预设值来确定该细菌的第二荧光蛋白的荧光状态。与获取第一荧光蛋白的荧光状态的技术方案相同,在此不再赘述。应理解的是,第一预设值根据第一荧光蛋白发光时的荧光强度确定;第二预设值根据第二荧光蛋白发光时的荧光强度确定;第二预设值可以与第一预设值不同。
示例性的,请一并参阅图3。如图3所示,母代细菌的DNA序列中第一荧光蛋白为红色荧光蛋白mScarletI,第二荧光蛋白为绿色荧光蛋白SfGFP,红色荧光蛋白的编码序列和响应蛋白的编码序列位于两个同源序列R之间。同源序列R用于指代重复序列。响应蛋白为Lacl蛋白,可以抑制绿色荧光蛋白的表达。
通过光学显微镜获得各细菌的荧光图像,对各细菌的荧光图像进行分析处理,获得每个细菌的红色荧光蛋白的荧光强度(具体体现为图像处理后的灰度值)和绿色荧光蛋白的荧光强度。针对每个细菌,判断其红色荧光蛋白的荧光强度是否大于第一预设值,若是,则标记红色荧光蛋白的荧光状态为开,即红色荧光蛋白正常表达。若红色荧光蛋白的荧光强度小于等于第一预设值,则标记红色荧光蛋白的荧光状态为关。判断绿色荧光蛋白的荧光状态的方式同上。
本实施例中,获取细菌集中每个细菌中每个荧光蛋白的荧光状态,以便通过各个荧光蛋白的荧光状态判断该细菌中DNA序列的变化类型。
针对每个细菌,在该细菌的第一荧光蛋白的荧光状态为关且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变化类型为重复序列删除。
在该细菌的第一荧光蛋白的荧光状态为开且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变换类型为响应蛋白编码序列有义突变。其中,有义突变可以为响应蛋白编码序列有义突变,具体表征为响应蛋白功能性失活。
在该细菌的第一荧光蛋白的荧光状态为开且第二荧光蛋白的荧光状态为关时,确定该细菌的DNA序列未发生变化。
示例性的,假设母代细菌的DNA序列中第一荧光蛋白为红色荧光蛋白mScarletI,第二荧光蛋白为绿色荧光蛋白SfGFP,红色荧光蛋白的编码序列和响应蛋白的编码序列位于两个同源序列R之间。同源序列R用于指代重复序列。响应蛋白为Lacl蛋白,可以抑制绿色荧光蛋白的表达。两个同源序列其中一个、红色荧光蛋白的序列以及响应蛋白的序列组成删除响应序列集;绿色荧光蛋白的序列作为荧光报告序列。并且绿色荧光蛋白的编码序列不位于两个同源序列之间,重复序列的删除对绿色荧光蛋白的编码序列不造成影响。
初始状态时,母代细菌的DNA序列中包含有Lacl蛋白的编码序列、红色荧光蛋白的编码序列和绿色荧光蛋白的编码序列。红色荧光蛋白正常表达,绿色荧光蛋白因受Lacl蛋白的抑制而表达受限,此时获得细菌的荧光数据中红色荧光蛋白为开,绿色荧光蛋白为关。
母代细菌分裂获得子代细菌过程中,可能发生DNA序列的重排,每个子代细菌的DNA序列的变换类型包括重复序列删除、有义突变以及保持不变;其中有义突变为响应蛋白编码序列有义突变;表征为响应蛋白的功能性失活。
当子代细菌的DNA序列保持不变时,红色荧光蛋白和绿色荧光蛋白的荧光状态也不变,此时该子代细菌的荧光状态与初始状态时母代细菌的各荧光蛋白的荧光状态相同。因此,在该细菌的红色荧光蛋白的荧光状态为开且绿色荧光蛋白的荧光状态为关时,确定该细菌的DNA序列未发生变化。
子代细菌的DNA序列发生重复序列的删除,具体表征为图3中的同源序列R中任一序列以及位于两个同源序列R之间的Lacl蛋白的编码序列和红色荧光蛋白的编码序列的删除。此时,绿色荧光蛋白不受Lacl蛋白的抑制而正常表达,红色荧光蛋白被删除,故获得的细菌的荧光数据中红色荧光蛋白的荧光状态为关,绿色荧光蛋白的荧光状态为开。
子代细菌的的DNA序列发生有义突变,具体表征为图3中的Lacl蛋白功能性失活,此时Lacl蛋白对绿色荧光蛋白的抑制功能丧失,绿色荧光蛋白可以正常表达,绿色荧光蛋白的荧光状态为开;而同源序列R以及位于两个同源序列之间的Lacl蛋白的编码序列和红色荧光蛋白的编码序列的并未被删除,故红色荧光蛋白的荧光状态也为开。因此,在该细菌的红色荧光蛋白的荧光状态为开且绿色荧光蛋白的荧光状态均为开时,确定该细菌的DNA序列的变换类型为有义突变。
在本实施例中,母代细菌的DNA序列还包括第三荧光蛋白的编码序列,第三荧光蛋白用于识别母代细菌的轮廓,以对第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度进行辅助计算。具体的,第三荧光蛋白的编码序列和第二荧光蛋白的编码序列顺序布置。
示例性的,请一并参阅图3,第三荧光蛋白为橙色荧光蛋白CyOFP,橙色荧光蛋白的编码序列和绿色荧光蛋白的编码序列顺序布置,共同构成荧光报告序列。橙色荧光蛋白作为背景矫正,用于识别母代细菌的轮廓,以对红色荧光蛋白和绿色荧光蛋白的荧光强度进行辅助计算。
细菌的DNA序列的变化,例如重复序列的删除或者有义突变,均对橙色荧光蛋白编码序列没有影响,故所有细菌的橙色荧光蛋白的荧光状态一直为开。
可选地,可以根据对细菌的三色荧光蛋白的荧光状态,识别细菌的DNA序列变化类型。细菌的三色荧光状态对应的DNA序列变化类型可参见下表1。
表1细菌的三色荧光状态对应的DNA序列变化类型
Figure BDA0002279418090000141
本实施例中,在统计所有重复序列删除细菌的数目的同时,还可以根据第一荧光蛋白和第二荧光蛋白的荧光状态,确定细菌集中有义突变细菌的数目,以进一步根据细菌集中所有细菌的数目和细菌集中有义突变细菌的数目,计算获得母代细菌的有义突变率。此时即可以同时定量获取细菌的重复序列删除率和有义突变率,为研究基因重组的发生机制提供数据支撑。
本申请实施例提供的基因组重复序列删除率确定方法,通过引入第一荧光蛋白,可以将第二荧光蛋白的开荧光状态,识别为响应蛋白删除(表征DNA序列变化类型为重复序列删除)和响应蛋白失活(表征DNA序列变化类型为有义突变)两种情况,进而精准识别细菌中的重复序列删除细菌的数据,提高了重复序列删除率的准确度。
请一并参阅图5,图5为本申请实施例提供的获得母代细菌的重复序列删除率的流程示意图。如图5所示,步骤S204根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率,包括:
S501、将细菌集中重复序列删除细菌的数目与细菌集中所有细菌的数目作商,获得重复序列删除细菌的比重。
细菌集中重复序列删除细菌为母代细菌经过多代分裂后获得的。本实施例中,重复序列删除细菌的比重为当前时刻所有重复序列删除细菌在细菌集中的比重。
S502、根据细菌集中所有细菌的数目,确定母代细菌的分裂代数。
细菌集中的所有细菌由同一个母代细菌分裂获得。细菌的分裂遵循一分为二的原则,故可以根据细菌集中细菌的数目,确定母代细菌的分裂代数。
示例性的,母代细菌分裂40代,则细菌集中细菌的个数为2的40次方,反之,可以根据细菌集中细菌的个数获得母代细菌的分裂代数。
S503、根据重复序列删除细菌的比重和分裂代数,计算获得母代细菌的重复序列删除率。
母代细菌经过多代分裂获得该细菌集。当数据量足够大的时候,在每一代细菌的分裂中,当前的细菌分裂获得子代细菌时的重复序列删除率相似。即每一代细菌的重复序列删除率相似,可以将每一代基因组重复序列删除率确定为母代细菌的重复序列删除率。
在本实施例中,将重复序列删除细菌的比重和分裂代数作商,获得母代细菌的重复序列删除率。
本申请实施例提供的基因组重复序列删除率确定方法,通过将重复序列删除细菌的比重和分裂代数作商,直接计算获得母代细菌的重复序列删除率,相比于现有技术中通过大量DNA序列进行比对确定重复序列删除率的技术方案,具有较高的准确度和可信度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
基于上述实施例所提供的基因组重复序列删除率确定,本发明实施例进一步给出实现上述方法实施例的装置实施例。
图6为本申请一实施例提供的基因组重复序列删除率确定装置的结构示意图。如图6所示,基因组重复序列删除率确定装置60包括:获取模型601、确定模块602、统计模块603以及计算模块604。
获取模块601,用于获取细菌集中每个细菌的荧光数据和细菌集中所有细菌的数目;细菌集中的细菌由同一个母代细菌分裂获得;
确定模块602,用于根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型;DNA序列的变化类型包括重复序列删除;
统计模块603,用于统计细菌集中重复序列删除细菌的数目;重复序列删除细菌为DNA序列的变化类型为重复序列删除的细菌;
计算模块604,用于根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。
可选地,母代细菌的DNA序列包括:两个同源序列、响应蛋白的编码序列、第一荧光蛋白的编码序列和第二荧光蛋白的编码序列;响应蛋白的编码序列和第一荧光蛋白的编码序列位于两个同源序列之间;响应蛋白用于抑制第二荧光蛋白的表达。
获取模块601,具体用于:
获取每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度;
分别根据每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度,确定每个细菌的第一荧光蛋白的荧光状态和第二荧光蛋白的荧光状态。
获取模块601,还具体用于:
针对每个细菌,若该细菌的第一荧光蛋白的荧光强度大于第一预设值,则该细菌的第一荧光蛋白的荧光状态为开;和/或,若该细菌的第二荧光蛋白的荧光强度大于第二预设值,则该细菌的第二荧光蛋白的荧光状态为开。
确定模块602,具体用于:
针对每个细菌,在该细菌的第一荧光蛋白的荧光状态为关且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变化类型为重复序列删除。
可选地,响应蛋白为Lacl蛋白;确定模块602,还具体用于:
根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型,包括:
针对每个细菌,在该细菌的第一荧光蛋白的荧光状态为开且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变化类型为有义突变;其中,有义突变用于指示Lacl蛋白功能性失活。
可选地,母代细菌的DNA序列还包括第三荧光蛋白的编码序列;第三荧光蛋白用于识别目标细菌的轮廓。
计算模块604,用于:
将细菌集中重复序列删除细菌的数目与细菌集中所有细菌的数目作商,获得重复序列删除细菌的比重;
根据细菌集中所有细菌的数目,确定母代细菌的分裂代数;
根据重复序列删除细菌的比重和分裂代数,计算获得母代细菌的重复序列删除率。
计算模块604,具体用于:
将重复序列删除细菌的比重和分裂代数作商,获得母代细菌的重复序列删除率。
本申请实施例提供的基因组重复序列删除率确定装置,获取基于同一个母代细菌培育获得的细菌集中每个细菌的荧光数据和该细菌集中所有细菌的数目,然后根据每个细菌的荧光数据,确定细菌集中每个细菌的DNA序列变化类型,统计获得重复序列删除细菌的数目,重复序列删除细菌即基因组发生重复序列删除的细菌,最后根据细菌集中所有细菌的数目和细菌集中重复序列删除细菌的数目,计算获得母代细菌的重复序列删除率。本申请实施例提供的基因组重复序列删除率确定方法,根据细菌的荧光数据直接确定每个细菌的基因组在重组中是否发生重复序列删除,从而获得细菌集中重复序列删除细菌的数目,然后根据重复序列删除细菌的数目计算获得重复序列删除率,方案简单且可信度高。
另一方面,本申请实施例提供的基因组重复序列删除率确定装置,可以将用于发出荧光数据的荧光蛋白引入母代细菌基因组的任意位置,从而实现对基因组任意位置的重复序列删除率的定量测量。
进一步地,本申请实施例提供的基因组重复序列删除率确定装置,通过引入第一荧光蛋白,可以将第二荧光蛋白的开荧光状态,识别为响应蛋白删除(表征DNA序列变化类型为重复序列删除)和响应蛋白失活(表征DNA序列变化类型为有义突变)两种情况,进而精准识别细菌中的重复序列删除细菌的数据,提高了重复序列删除率的准确度。
图6所示实施例提供的基因组重复序列删除率确定装置,可用于执行上述方法实施例中的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图7是本申请一实施例提供的基因组重复序列删除率确定设备的示意图。如图7所示,该实施例的基因组重复序列删除率确定设备70包括:至少一个处理器701、存储器702以及存储在所述存储器702中并可在所述处理器701上运行的计算机程序。基因组重复序列删除率确定设备还包括通信部件703,其中,处理器701、存储器702以及通信部件703通过总线704连接。
所述处理器701执行所述计算机程序时实现上述各个基因组重复序列删除率确定方法实施例中的步骤,例如图2所示实施例中的步骤S201至步骤S204。或者,所述处理器701执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图6所示模块601至604的功能。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器702中,并由所述处理器701执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述基因组重复序列删除率确定设备70中的执行过程。
本领域技术人员可以理解,图7仅仅是基因组重复序列删除率确定设备的示例,并不构成对基因组重复序列删除率确定设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如输入输出设备、网络接入设备、总线等。
所称处理器701可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器702可以是基因组重复序列删除率确定设备的内部存储单元,也可以是基因组重复序列删除率确定设备的外部存储设备,例如插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。所述存储器702用于存储所述计算机程序以及基因组重复序列删除率确定设备所需的其他程序和数据。所述存储器702还可以用于暂时地存储已经输出或者将要输出的数据。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (11)

1.一种基因组重复序列删除率确定方法,其特征在于,包括:
获取细菌集中每个细菌的荧光数据和所述细菌集中所有细菌的数目;所述细菌集中的细菌由同一个母代细菌分裂获得;
根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型;所述DNA序列的变化类型包括重复序列删除;
统计所述细菌集中重复序列删除细菌的数目;所述重复序列删除细菌为DNA序列的变化类型为重复序列删除的细菌;
根据所述细菌集中所有细菌的数目和所述细菌集中重复序列删除细菌的数目,计算获得所述母代细菌的重复序列删除率。
2.如权利要求1所述的基因组重复序列删除率确定方法,其特征在于,所述母代细菌的DNA序列包括:两个同源序列、响应蛋白的编码序列、第一荧光蛋白的编码序列和第二荧光蛋白的编码序列;所述响应蛋白的编码序列和所述第一荧光蛋白的编码序列位于两个所述同源序列之间;所述响应蛋白用于抑制所述第二荧光蛋白的表达;
所述获取细菌集中每个细菌的荧光数据,包括:
获取每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度;
分别根据每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度,确定每个细菌的第一荧光蛋白的荧光状态和第二荧光蛋白的荧光状态。
3.如权利要求2所述的基因组重复序列删除率确定方法,其特征在于,所述分别根据每个细菌的第一荧光蛋白的荧光强度和第二荧光蛋白的荧光强度,确定每个细菌的第一荧光蛋白的荧光状态和第二荧光蛋白的荧光状态,包括:
针对每个细菌,若所述细菌的第一荧光蛋白的荧光强度大于第一预设值,则所述细菌的第一荧光蛋白的荧光状态为开;和/或,若所述细菌的第二荧光蛋白的荧光强度大于第二预设值,则所述细菌的第二荧光蛋白的荧光状态为开。
4.如权利要求3所述的基因组重复序列删除率确定方法,其特征在于,所述根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型,包括:
针对每个细菌,在所述细菌的第一荧光蛋白的荧光状态为关且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变化类型为重复序列删除。
5.如权利要求3所述的基因组重复序列删除率确定方法,其特征在于,所述响应蛋白为Lacl蛋白;
所述根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型,包括:
针对每个细菌,在所述细菌的第一荧光蛋白的荧光状态为开且第二荧光蛋白的荧光状态为开时,确定该细菌的DNA序列的变化类型为有义突变;其中,有义突变用于指示所述Lacl蛋白功能性失活。
6.如权利要求2所述的基因组重复序列删除率确定方法,其特征在于,所述母代细菌的DNA序列还包括第三荧光蛋白的编码序列;所述第三荧光蛋白用于识别所述母代细菌的轮廓。
7.如权利要求1-6任一项所述的基因组重复序列删除率确定方法,其特征在于,所述根据所述细菌集中所有细菌的数目和所述细菌集中重复序列删除细菌的数目,计算获得所述母代细菌的重复序列删除率,包括:
将所述细菌集中重复序列删除细菌的数目与所述细菌集中所有细菌的数目作商,获得重复序列删除细菌的比重;
根据所述细菌集中所有细菌的数目,确定所述母代细菌的分裂代数;
根据所述重复序列删除细菌的比重和所述分裂代数,计算获得所述母代细菌的重复序列删除率。
8.如权利要求7所述的基因组重复序列删除率确定方法,其特征在于,所述根据所述重复序列删除细菌的比重和所述分裂代数,计算获得所述母代细菌的重复序列删除率,包括:
将所述重复序列删除细菌的比重和所述分裂代数作商,获得所述母代细菌的重复序列删除率。
9.一种基因组重复序列删除率确定装置,其特征在于,包括:
获取模块,用于获取细菌集中每个细菌的荧光数据和所述细菌集中所有细菌的数目;所述细菌集中的细菌由同一个母代细菌分裂获得;
确定模块,用于根据每个细菌的荧光数据,确定每个细菌的DNA序列的变化类型;所述DNA序列的变化类型包括重复序列删除;
统计模块,用于统计所述细菌集中重复序列删除细菌的数目,所述重复序列删除细菌为DNA序列的变化类型为重复序列删除的细菌
计算模块,用于根据所述细菌集中所有细菌的数目和所述细菌集中重复序列删除细菌的数目,计算获得所述母代细菌的重复序列删除率。
10.一种基因组重复序列删除率确定设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述方法的步骤。
11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述方法的步骤。
CN201911135235.0A 2019-11-19 2019-11-19 基因组重复序列删除率确定方法、装置、设备及存储介质 Active CN110904182B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911135235.0A CN110904182B (zh) 2019-11-19 2019-11-19 基因组重复序列删除率确定方法、装置、设备及存储介质
PCT/CN2020/129210 WO2021098661A1 (zh) 2019-11-19 2020-11-17 基因组重复序列删除率确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911135235.0A CN110904182B (zh) 2019-11-19 2019-11-19 基因组重复序列删除率确定方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110904182A true CN110904182A (zh) 2020-03-24
CN110904182B CN110904182B (zh) 2023-08-18

Family

ID=69818138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911135235.0A Active CN110904182B (zh) 2019-11-19 2019-11-19 基因组重复序列删除率确定方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN110904182B (zh)
WO (1) WO2021098661A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021098661A1 (zh) * 2019-11-19 2021-05-27 中国科学院深圳先进技术研究院 基因组重复序列删除率确定方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2219027A1 (en) * 2009-02-12 2010-08-18 Centre National de la Recherche Scientifique Devices and methods for observing the cell division
CN108229103A (zh) * 2018-01-15 2018-06-29 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
WO2019033065A1 (en) * 2017-08-11 2019-02-14 Atila Biosystems, Inc. DIGITAL AMPLIFICATION WITH LIMITED NUCLEOTIDE COMPOSITION PRIMERS

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110904182B (zh) * 2019-11-19 2023-08-18 中国科学院深圳先进技术研究院 基因组重复序列删除率确定方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2219027A1 (en) * 2009-02-12 2010-08-18 Centre National de la Recherche Scientifique Devices and methods for observing the cell division
WO2019033065A1 (en) * 2017-08-11 2019-02-14 Atila Biosystems, Inc. DIGITAL AMPLIFICATION WITH LIMITED NUCLEOTIDE COMPOSITION PRIMERS
CN108229103A (zh) * 2018-01-15 2018-06-29 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CARRIE A HENDRICKS ET AL.: "Spontaneous mitotic homologous recombination at an enhanced yellow fluorescent protein (EYFP) cDNA direct repeat in transgenic mice", vol. 100, no. 11, pages 6325 - 30 *
赵宏宇;蔡禄;赵秀娟;王晶妍;陈元秀;刘水峰;: "化学药物导致的与Friedreich共济失调相关的GAA重复序列不稳定性的研究" *
赵宏宇;蔡禄;赵秀娟;王晶妍;陈元秀;刘水峰;: "化学药物导致的与Friedreich共济失调相关的GAA重复序列不稳定性的研究", 生物技术通报, no. 01, pages 147 - 152 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021098661A1 (zh) * 2019-11-19 2021-05-27 中国科学院深圳先进技术研究院 基因组重复序列删除率确定方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2021098661A1 (zh) 2021-05-27
CN110904182B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
Lu et al. Removing contaminants from databases of draft genomes
CN111951895A (zh) 基于宏基因组学的病原分析方法、分析装置、设备及存储介质
Xie et al. De novo plant genome assembly based on chromatin interactions: a case study of Arabidopsis thaliana
Albert et al. Genetics of single-cell protein abundance variation in large yeast populations
Suurväli et al. The laboratory domestication of zebrafish: from diverse populations to inbred substrains
Szövényi et al. Efficient purging of deleterious mutations in plants with haploid selfing
Nakagome et al. Estimating the ages of selection signals from different epochs in human history
CN109887546B (zh) 基于二代测序的单基因或多基因拷贝数检测系统及方法
EP3919629A1 (en) Method for using whole genome re-sequencing data to quickly identify transgenic or gene editing material and insertion sites thereof
JP2003116593A (ja) 微生物の判定方法およびその装置
CN114292928B (zh) 一种与母猪繁殖性状有关的分子标记及筛选方法和应用
Sproul et al. Repetitive DNA profiles reveal evidence of rapid genome evolution and reflect species boundaries in ground beetles
Chen et al. Tumorigenesis as the paradigm of quasi-neutral molecular evolution
CN110904182A (zh) 基因组重复序列删除率确定方法、装置、设备及存储介质
CN106795551B (zh) 单细胞染色体的cnv分析方法和检测装置
Zhou et al. Identification and utilization of genetic determinants of trait measurement errors in image-based, high-throughput phenotyping
CN107967411B (zh) 一种脱靶位点的检测方法、装置及终端设备
Tross et al. 3D reconstruction identifies loci linked to variation in angle of individual sorghum leaves
CN105052729A (zh) 一种基于受选择位点指数评估动植物品种育种潜力的方法及其应用
CN116312779A (zh) 检测样本污染和识别样本错配的方法和装置
CN114058732A (zh) 一种高效鉴定粒重基因gw5不同等位的引物组合及鉴定方法和应用
CN113793637A (zh) 基于亲本基因型与子代表型的全基因组关联分析算法
CN108304693B (zh) 利用高通量测序数据分析基因融合的方法
Chen et al. Quasi-neutral molecular evolution—When positive and negative selection cancel out
Hill et al. Tapping culture collections for fungal endophytes: first genome assemblies for three genera and five species in the Ascomycota

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant