CN111564180A - 一种鮡科鱼类古染色体进化比较分析的方法 - Google Patents
一种鮡科鱼类古染色体进化比较分析的方法 Download PDFInfo
- Publication number
- CN111564180A CN111564180A CN202010397964.XA CN202010397964A CN111564180A CN 111564180 A CN111564180 A CN 111564180A CN 202010397964 A CN202010397964 A CN 202010397964A CN 111564180 A CN111564180 A CN 111564180A
- Authority
- CN
- China
- Prior art keywords
- chromosome
- ancient
- maculatum
- glyptosternum
- chromosomes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 210000000349 chromosome Anatomy 0.000 title claims abstract description 136
- 241000746747 Glyptosternon maculatum Species 0.000 title claims abstract description 85
- 241000251468 Actinopterygii Species 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000010835 comparative analysis Methods 0.000 title claims description 12
- 241000894007 species Species 0.000 claims abstract description 21
- 238000005516 engineering process Methods 0.000 claims abstract description 9
- 108090000623 proteins and genes Proteins 0.000 claims description 29
- 238000005215 recombination Methods 0.000 claims description 21
- 230000006798 recombination Effects 0.000 claims description 21
- 238000012163 sequencing technique Methods 0.000 claims description 20
- 241000376029 Tachysurus fulvidraco Species 0.000 claims description 14
- 241000252498 Ictalurus punctatus Species 0.000 claims description 13
- 241000276569 Oryzias latipes Species 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 102000004169 proteins and genes Human genes 0.000 claims description 7
- 241000252212 Danio rerio Species 0.000 claims description 6
- 241000746746 Glyptosternon Species 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 230000002759 chromosomal effect Effects 0.000 claims description 6
- 230000008707 rearrangement Effects 0.000 claims description 5
- 238000002864 sequence alignment Methods 0.000 claims description 3
- 108091026890 Coding region Proteins 0.000 claims description 2
- 238000007671 third-generation sequencing Methods 0.000 claims description 2
- 208000037088 Chromosome Breakage Diseases 0.000 claims 1
- 230000004927 fusion Effects 0.000 claims 1
- 238000011160 research Methods 0.000 abstract description 9
- 238000010276 construction Methods 0.000 abstract description 7
- 230000000052 comparative effect Effects 0.000 abstract description 4
- 238000013081 phylogenetic analysis Methods 0.000 abstract description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000011835 investigation Methods 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 11
- 238000012937 correction Methods 0.000 description 8
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 208000037516 chromosome inversion disease Diseases 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 241000252500 Ictalurus Species 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- 208000020584 Polyploidy Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000011331 genomic analysis Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 208000016718 Chromosome Inversion Diseases 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000007605 air drying Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B10/00—ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Physiology (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
发明涉及一种鮡科鱼类古染色体进化比较分析的方法,使用比较基因组技术对鮡科鱼的古染色体进行分析,对其染色体的进化研究有利于摸清其基因组的进化规律,为鮡科鱼的进化研究和资源保护提供基本的数据。本发明提出的方法包括黑斑原鮡染色体序列构建、系统发育分析、近缘物种染色体比较和古染色体构建等步骤,适用于西藏鮡科鱼类,可广泛应用于青藏高原鮡科鱼的资源调查和保护研究。
Description
【技术领域】
本发明涉及生物基因组分析技术,具体涉及一种多倍体生物基因组二倍化程度量化评估的方法。
【背景技术】
生物进化所涉及的范围很广,生物大分子、基因和基因组、细胞、生物个体、生物群体以至地球上的整个生物圈的发展和变化都与生物进化有关,从而在各个水平上的生物结构都有其起源与进化的历史。探讨这些生物结构的起源过程及演化方式,重建其历史是生物进化研究的重要方面。这些研究必将能大大提高人类对生命以及对自身的认识。
染色体变异在真核生物的体内,染色体是遗传物质DNA的载体。当染色体的数目发生改变时(缺少,增多)或者染色体的结构发生改变时,遗传信息就随之改变,带来的就是生物体的后代性状的改变,这就是染色体变异。它是可遗传变异的一种。根据产生变异的原因,它可以分为结构变异和数量变异两大类。染色体倒位是染色体结构变异的一种,指某染色体的内部区段发生180°的倒转,而使该区段的原来基因顺序发生颠倒的现象。倒位区段只涉及染色体的一个臂,称为臂内倒位;涉及包括着丝粒在内的两个臂,称为臂间倒位。那么染色体倒位和生物的进化有何关系,生物的进化就是新物种的形成,物种形成的要点是在生殖隔离的形成。
染色体倒位首先是改变了倒位区段内外基因的连锁关系,还可使基因的正常表达因位置改变而有所变化。倒位杂合体联会时可形成特征性的倒位环,引起部分不育性,并降低连锁基因的重组率。倒位杂合体形成的配子大多是异常的,从而影响了个体的育性。倒位纯合体通常也不能和原种个体间进行有性生殖,但是这样形成的生殖隔离,为新物种的进化提供了有利条件。
西藏地区鱼类在青藏高原长期进化过程中,形成了其独特的染色体核型,特别是鮡科鱼,发生了大规模的染色体重排的现象。利用染色体的序列特征研究染色体重排的现象在很多多倍体植物中采用,但是二倍体物种的染色体重排现象的研究工具,特别是西藏鮡科鱼类基因组的染色体大规模重组,尚没有相关的技术。
因此,有必要研究一种使用比较基因组技术,对鮡科鱼的古染色体进行分析,从而便于研究染色体重排,推进对鮡科鱼染色体的进化研究。
【发明内容】
为了克服重构西藏鮡科鱼类祖先的染色体核型的困难,研究鮡科鱼类祖先染色体上的大规模重组现象,本发明提供一种利用西藏鮡科鱼类近缘物种作为参考,推测其祖先染色体核型的方法,能够对西藏鮡科鱼类的祖先的染色体核型进行深入分析。
本发明解决其技术问题所采用的方法具体步骤如下:
1)获取黑斑原鮡的染色体级别参考基因组:通过三代测序,结合HiC建库测序的技术,构建黑斑原鮡的染色体级别的组装结果,并通过转录组等测序数据,对染色体级别组装结果进行注释,预测其全基因组水平的蛋白编码序列;
进一步地,其中所述步骤1)中三代测序使用Falcon进行三代基因组组装,利用所有PacBio测序数据。在序列纠错阶段,取10kb作为阈值,将10kb以下的序列比对到10kb以上的序列上,利用比对结果进行纠错,获得长片段的纠错序列。利用纠错序列进行比对,过滤掉长度低于2kb的比对结果。最后,使用序列网络信息构建最长的序列路径,获得基因组contig序列。
进一步地,所述步骤1)中HiC建库测序具体为:取不同量的Hi-C文库模板,使用KAPAHiFi聚合酶进行固定10个循环的PCR扩增,扩增产物经电泳、切胶纯化后得到Hi-C文库。构建好的Hi-C文库经过质量检测,利用高通量测序技术对Hi-C library包含样品进行双末端测序。
进一步地,所述步骤1)中使用Bowtie通过迭代比对的方法,将Hi-C测序数据通过允许空缺的方式比对到上述组装的contig序列上。基于比对结果,使用hiclib的方法计算contig序列之间的互作频率。通过互作频率信息,使用3D-DNA确定contig序列的染色体分布、contig之间的排序和方向,组装到染色体级别。
2)通过同源序列比对,确定用于染色体分析的近缘物种:利用全基因组蛋白序列,结合其他具有染色体级别组装的鱼类基因序列信息,构建鮡科鱼类与其他鱼类的系统发育关系,确定它们之间的系统发育关系;
3)利用近缘物种的基因同源性,以及染色体上的基因排序信息,确定染色体的共线性:对鮡科鱼类和其他鱼类的基因序列进行同源比对,获得全基因组基因之间的同源性,并根据同源基因在染色体上的排布,确定鮡科鱼与其他鱼类的染色体的共线性;
4)找到鮡科鱼与不同近缘关系鱼类的染色体重组区域:通过鮡科鱼与其他鱼类的染色体的共线性信息,确定黑斑原鮡与不同鱼类的染色体水平上的重组区域;
5)利用近缘关系远近的鱼类的染色体比较,确定鮡科鱼的古染色体核型:基于黑斑原鮡与不同鱼类的染色体水平上的重组区域,以及鮡科鱼与其他鱼类的进化关系,确定每个染色体水平上的重组区域是鮡科鱼特有的,还是其他鱼类特有的,确定各个重组现象发生的时间,从而推算鮡科鱼的古染色体核型;
进一步地,所述步骤5)具体为分别观察统计黑斑原鮡和黄颡鱼的染色体共线性结构,以及黑斑原鮡和斑点叉尾鮰的共线性结构,找到两个比较中均共线的区域,即为黑斑原鮡、黄颡鱼和斑点叉尾鮰祖先的古染色体核型;而非两个比较中均共线的区域,则需要在利用斑马鱼和青鳉鱼作为进化外群,如果斑马鱼和青鳉鱼支持黑斑原鮡的核型,则黑斑原鮡、黄颡鱼和斑点叉尾鮰祖先的古染色体与黑斑原鮡一致,相反,黑斑原鮡、黄颡鱼和斑点叉尾鮰祖先的古染色体则与黄颡鱼和斑点叉尾鮰一致。
6)通过鮡科鱼的古染色体核型,推断黑斑原鮡的染色体形成的过程:基于鮡科鱼的古染色体核型,推算由鮡科鱼的古染色体演变为黑斑原鮡染色体的过程。
本发明与现有技术相比的有益效果:
本发明提出一种使用比较基因组技术对鮡科鱼的古染色体进行分析的技术,通过发育关系和染色体重组结果确定重组结果发生的时间;通过发现染色体的共线性,可确定染色体上的重组位置,该方法对其染色体的进化研究有利于摸清其基因组的进化规律,为鮡科鱼的进化研究和资源保护提供基本的数据。
本发明提出的方法包括黑斑原鮡染色体序列构建、系统发育分析、近缘物种染色体比较和古染色体构建等步骤,适用于西藏鮡科鱼类,可广泛应用了青藏高原鮡科鱼的资源调查和保护研究。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例4中黑斑原鮡与黄颡鱼和斑点叉尾鮰染色体比较的结果
图2是本发明实施例6中进行对黑斑原鮡染色体2号染色体进行古染色体分析的结果。
【具体实施方式】
下面结合实施例对本发明作进一步的说明,但本发明并不局限于此实施例。本实施例利用该发明提供的一种使用比较基因组技术对黑斑原鮡的古染色体进行分析。
实施例1:材料获取
本实验采用一种西藏高原特有鱼类黑斑原鮡作为研究对象。从雅鲁藏布江野外捕获的雌性黑斑原鮡成鱼。记录基本的性状指标后,取鱼鳍用液氮速冻一小时,并放于冰箱-80℃保存。
实施例2:黑斑原鮡DNA提取与三代长片段基因组测序与基因组contig组装利用传统苯酚法提取黑斑原鮡的基因组DNA,具体方法是,将样品进行液氮研磨只粉状。加入1mL消化液,于37℃下静置5小时。待冷却到室温,取0.5mL苯酚混合进行4000×g离心10min,吸出水相。加入苯酚、氯仿和异戊醇DNA提取的混合液0.5mL再次提取两次,提取水相并加入NaCl至浓度0.3M。加入乙醇,进行3000×g离心15min后,使用70%乙醇漂洗二次,吸出上清液,晾干。粉末样本在TE中在悬浮,加入NaCl至100mM,加入RNA酶A至浓度100ug/mL,并于37℃下保持3hr后,加入SDS至最终浓度0.2%。获得的DNA样品在260nm下测定OD值已确定浓度,并置于-20℃环境下保存。将上述操作获得的DNA样品使用PacBio测序平台推荐的方法进行测序文库构建,并使用PacBio Sequel测序平台进行测序,获得约80Gb长片段测序数据。
使用Falcon进行三代基因组组装,利用所有PacBio测序数据。在序列纠错阶段,取10kb作为阈值,将10kb以下的序列比对到10kb以上的序列上,利用比对结果进行纠错,获得长片段的纠错序列。利用纠错序列进行比对,过滤掉长度低于2kb的比对结果。最后,使用序列网络信息构建最长的序列路径,获得基因组contig序列。
实施例3:黑斑原鮡Hi-C组织建库测序与染色体组装
取新鲜黑斑原鮡肌肉组织,使用细胞筛获得,细胞悬浮液。使用37%甲醛进行甲醛处理。使用SDS、Triton处理以后,离心去除上清,用限制性内切酶Buffer重悬沉淀物,加入不同用量的限制性内切酶HindⅢ-HF,在37℃于旋转混匀仪上酶切过夜。在酶切结束以后,选择低温23℃进行末端补平标记。补平产物4℃低温500g离心2min,去上清,沉淀用1×T4DNA Ligase Buffer重悬,按照1~2Cohesive unit/μL的连接酶用量在250μL连接体系中进行平末端连接,16℃连接4~8h。连接产物加入终浓度200mmol/L的NaCl、1μg/μL的蛋白酶K,65℃解交联过夜、RNase A处理去除RNA,乙醇沉淀回收DNA,经QIAGEN DNA回收试剂盒再次纯化后,NanoDrop ND-1000测浓度。分别取基因组DNA、限制性酶切产物、连接产物等电泳,通过条带大小等进行酶切、连接效果的检测与质量控制。在低温12℃以及底物核苷酸不完全等条件下,优先激活T4DNA聚合酶的外切酶活性。Hi-C样品经过超声破碎、片段断裂成200~300bp大小的DNA,样品经琼脂糖凝胶电泳缓慢分离、切胶回收、QIAGEN DNA回收试剂盒纯化、NanoDrop ND-1000定量。使用预洗过的Streptavidin C1 beads通过混匀、磁力架富集、去上清、洗涤再富集等步骤,回收带生物素标记的DNA。为了便于缓冲体系的转换,在捕获有DNA的磁珠上进行末端修复、加“A”与Adapter连接等后续步骤。取不同量的Hi-C文库模板,使用KAPA HiFi聚合酶进行固定10个循环的PCR扩增,扩增产物经电泳、切胶纯化后得到Hi-C文库。构建好的Hi-C文库经过质量检测,利用高通量测序技术对Hi-C library包含样品进行双末端测序。共获得60Gb的Hi-C测序数据。
使用Bowtie通过迭代比对的方法,将Hi-C测序数据通过允许空缺的方式比对到上述组装的contig序列上。基于比对结果,使用hiclib的方法计算contig序列之间的互作频率。通过互作频率信息,使用3D-DNA确定contig序列的染色体分布、contig之间的排序和方向,组装到染色体级别。
实施例4:系统发育关系构建
利用黑斑原鮡基因组上蛋白编码基因序列,与近缘物种进行系统发育分析,获得物种之间的进化关系。本实例中使用青鳉鱼、斑马鱼、黄颡鱼和斑点叉尾鮰作为黑斑原鮡的近缘物种,进行系统发育分析,结果发现青鳉鱼在最早从祖先分化出来,然后是斑马鱼、斑点叉尾鮰,最后是黄颡鱼和黑斑原鮡。
实施例5:物种染色体比较分析和重组区域鉴定
对以上物种,分别利用染色体上蛋白编码基因,利用基因在染色体上的共线性,构建染色体的共线性关系。根据共线性关系,确定染色体上的重组位置。
实施例6:黑斑原鮡祖先古染色体确定和分析
基于实施例4中的系统发育关系,以及实施例5中各物种间的染色体重组结果,确定每个重组结果发生的时间。比如我们发现黑斑原鮡的2号染色体的上下二端分别与黄颡鱼的16号和24号染色体共线性。为了确定祖先染色体核型,我们观察黑斑原鮡和斑点叉尾鮰的共线性,发现黑斑原鮡的2号染色体的上下二端分别与斑点叉尾鮰的24号和25号染色体共线性,表明黑斑原鮡的2号染色体是通过一个物种特异的染色体融合形成的。这个结果与黑斑原鮡2号染色体与斑马鱼和青鳉鱼的比较得到进一步确认。
通过该方法确定和分析黑斑原鮡祖先古染色体,对研究其染色体的进化有利于摸清其基因组的进化规律,为鮡科鱼的进化研究和资源保护提供基本的数据。
本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和修改,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的实验方案和这里示出与描述的图示示例。
Claims (10)
1.一种鮡科鱼类古染色体进化比较分析的方法,其特征在于,包括以下步骤:
S1:获取黑斑原鮡的染色体级别参考基因组;
S2:通过同源序列比对,确定用于染色体分析的近缘物种;
S3:利用近缘物种的基因同源性,以及染色体上的基因排序信息,确定染色体的共线性;
S4:找到鮡科鱼与不同近缘关系鱼类的染色体重组区域;
S5:利用近缘关系远近的鱼类的染色体比较,确定鮡科鱼的古染色体核型;
S6:通过鮡科鱼的古染色体核型,推断黑斑原鮡的染色体形成的过程。
2.根据权利要求1所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于:
所述步骤S1通过三代测序,结合HiC建库测序的技术,构建黑斑原鮡的染色体级别的组装结果,并通过转录组等测序数据,对染色体级别组装结果进行注释,预测其全基因组水平的蛋白编码序列。
3.根据权利要求1所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于:所述步骤S2通过同源序列比对,确定用于染色体分析的近缘物种:利用全基因组蛋白序列,结合其他具有染色体级别组装的鱼类基因序列信息,构建鮡科鱼类与其他鱼类的系统发育关系,确定它们之间的系统发育关系。
4.根据权利要求1所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于:所述步骤S3利用近缘物种的基因同源性,以及染色体上的基因排序信息,确定染色体的共线性:对鮡科鱼类和其他鱼类的基因序列进行同源比对,获得全基因组基因之间的同源性,并根据同源基因在染色体上的排布,确定鮡科鱼与其他鱼类的染色体的共线性。
5.根据权利要求1所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于:所述步骤S4找到鮡科鱼与不同近缘关系鱼类的染色体重组区域:通过鮡科鱼与其他鱼类的染色体的共线性信息,确定黑斑原鮡与不同鱼类的染色体水平上的重组区域。
6.根据权利要求1所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于:所述步骤S5利用近缘关系远近的鱼类的染色体比较,确定鮡科鱼的古染色体核型:基于黑斑原鮡与不同鱼类的染色体水平上的重组区域,以及鮡科鱼与其他鱼类的进化关系,确定每个染色体水平上的重组区域是鮡科鱼特有的,还是其他鱼类特有的,确定各个重组现象发生的时间,从而推算鮡科鱼的古染色体核型。
7.根据权利要求1所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于:所述步骤S6通过鮡科鱼的古染色体核型,推断黑斑原鮡的染色体形成的过程:基于鮡科鱼的古染色体核型,推算由鮡科鱼的古染色体演变为黑斑原鮡染色体的过程。
8.根据权利要求1或6所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于:所述步骤S5为:分别观察统计黑斑原鮡和黄颡鱼的染色体共线性结构,以及黑斑原鮡和斑点叉尾鮰的共线性结构,找到两个比较中均共线的区域,即为黑斑原鮡、黄颡鱼和斑点叉尾鮰祖先的古染色体核型;而非两个比较中均共线的区域,则需要在利用斑马鱼和青鳉鱼作为进化外群,如果斑马鱼和青鳉鱼支持黑斑原鮡的核型,则黑斑原鮡、黄颡鱼和斑点叉尾鮰祖先的古染色体与黑斑原鮡一致,相反,黑斑原鮡、黄颡鱼和斑点叉尾鮰祖先的古染色体则与黄颡鱼和斑点叉尾鮰一致。
9.根据权利要求1或7所述的一种鮡科鱼类古染色体进化比较分析的方法,其特征在于所述步骤S6为:使用古染色体核型与黑斑原鮡的染色体进行比较分析,找到古染色体与黑斑原鮡的染色体的共线性区域,如果发现黑斑原鮡的一条染色体明显来自不同的古染色体的片段,则将黑斑原鮡的该染色体为一次物种特异的染色体融合;若发现黑斑原鮡的两条染色体与古染色体核型的两条染色体有共线性,表明这是黑斑原鮡特有的一次染色体断裂。
10.权利要求1-7任意一项所述的一种鮡科鱼类古染色体进化比较分析的方法在鮡科鱼类古染色体重排研究中的运用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010397964.XA CN111564180B (zh) | 2020-05-12 | 2020-05-12 | 一种鮡科鱼类古染色体进化比较分析的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010397964.XA CN111564180B (zh) | 2020-05-12 | 2020-05-12 | 一种鮡科鱼类古染色体进化比较分析的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111564180A true CN111564180A (zh) | 2020-08-21 |
CN111564180B CN111564180B (zh) | 2024-08-06 |
Family
ID=72074633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010397964.XA Active CN111564180B (zh) | 2020-05-12 | 2020-05-12 | 一种鮡科鱼类古染色体进化比较分析的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111564180B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113122642A (zh) * | 2021-04-16 | 2021-07-16 | 中国农业科学院兰州畜牧与兽药研究所 | 一种基于三代PacBio和Hi-C技术组装和注释湖羊基因组的方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101509043A (zh) * | 2009-04-03 | 2009-08-19 | 河北省农林科学院谷子研究所 | 禾本科通用分子标记cns-aflp |
US20090307798A1 (en) * | 2007-06-15 | 2009-12-10 | E.I. Du Pont De Nemours And Company | Polynucleotides and Methods for Making Plants Resistant to Fungal Pathogens |
CN101957892A (zh) * | 2010-09-17 | 2011-01-26 | 深圳华大基因科技有限公司 | 一种全基因组复制事件的检测方法和系统 |
CN102559880A (zh) * | 2011-12-23 | 2012-07-11 | 北京林业大学 | 一种构建蔷薇科原始染色体的方法 |
CN109326323A (zh) * | 2018-09-13 | 2019-02-12 | 北京百迈客生物科技有限公司 | 一种基因组的组装方法及装置 |
CN109920479A (zh) * | 2019-03-13 | 2019-06-21 | 复旦大学附属妇产科医院 | 一种鉴别胚胎染色体倒位携带状态的方法 |
CN110910959A (zh) * | 2019-11-04 | 2020-03-24 | 中国水稻研究所 | 群体遗传进化图谱及其构建方法 |
-
2020
- 2020-05-12 CN CN202010397964.XA patent/CN111564180B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090307798A1 (en) * | 2007-06-15 | 2009-12-10 | E.I. Du Pont De Nemours And Company | Polynucleotides and Methods for Making Plants Resistant to Fungal Pathogens |
CN101509043A (zh) * | 2009-04-03 | 2009-08-19 | 河北省农林科学院谷子研究所 | 禾本科通用分子标记cns-aflp |
CN101957892A (zh) * | 2010-09-17 | 2011-01-26 | 深圳华大基因科技有限公司 | 一种全基因组复制事件的检测方法和系统 |
CN102559880A (zh) * | 2011-12-23 | 2012-07-11 | 北京林业大学 | 一种构建蔷薇科原始染色体的方法 |
CN109326323A (zh) * | 2018-09-13 | 2019-02-12 | 北京百迈客生物科技有限公司 | 一种基因组的组装方法及装置 |
CN109920479A (zh) * | 2019-03-13 | 2019-06-21 | 复旦大学附属妇产科医院 | 一种鉴别胚胎染色体倒位携带状态的方法 |
CN110910959A (zh) * | 2019-11-04 | 2020-03-24 | 中国水稻研究所 | 群体遗传进化图谱及其构建方法 |
Non-Patent Citations (5)
Title |
---|
JASON HILL等: "Unprecedented reorganization of holocentric chromosomes provides insights into the enigma of lepidopteran chromosome evolution", 《SCIENCE ADVANCES》, vol. 05, no. 06, pages 2375 - 2548 * |
周勇等: "玉米核型进化的比较研究", 《分子植物育种》, vol. 15, no. 07, pages 2736 - 2741 * |
孙朋川: "葫芦科基因组结构与功能的精细进化分析", 《中国优秀硕士学位论文全文数据库 (基础科学辑)》, no. 2019, pages 006 - 264 * |
徐革锋等: "不同流域细鳞鱼染色体演化的初步研究", 《中国工程院第77场工程科技论坛·2008水产科技论坛——渔业现代化与可持续发展论文集》, pages 28 - 33 * |
田菲等: "青海湖裸鲤高原极端环境适应的基因组基础", 《第八届中国西部动物学学术研讨会会议摘要汇编》, pages 98 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113122642A (zh) * | 2021-04-16 | 2021-07-16 | 中国农业科学院兰州畜牧与兽药研究所 | 一种基于三代PacBio和Hi-C技术组装和注释湖羊基因组的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111564180B (zh) | 2024-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Marchant et al. | The C-Fern (Ceratopteris richardii) genome: insights into plant genome evolution with the first partial homosporous fern genome assembly | |
Sloan et al. | Intraspecific variation in mitochondrial genome sequence, structure, and gene content in Silene vulgaris, an angiosperm with pervasive cytoplasmic male sterility | |
Patwardhan et al. | Molecular markers in phylogenetic studies-a review | |
Pace et al. | The analysis of natural microbial populations by ribosomal RNA sequences | |
Liao et al. | Topologically associating domains and their role in the evolution of genome structure and function in Drosophila | |
Wolf et al. | The evolution of chloroplast genes and genomes in ferns | |
Aury et al. | Long-read and chromosome-scale assembly of the hexaploid wheat genome achieves high resolution for research and breeding | |
CN111584004B (zh) | 一种基于三维组学数据的西藏特色鱼类基因组组装方法 | |
Song et al. | Conserved noncoding sequences provide insights into regulatory sequence and loss of gene expression in maize | |
CN105950707A (zh) | 一种确定核酸序列的方法及系统 | |
Bennetzen et al. | Distinguishing friends, foes, and freeloaders in giant genomes | |
Alberts et al. | Isolating, cloning, and sequencing DNA | |
CN111564180A (zh) | 一种鮡科鱼类古染色体进化比较分析的方法 | |
Gao et al. | Chromosome-scale genome assembly of the resurrection plant Acanthochlamys bracteata (Velloziaceae) | |
Pootakham et al. | A de novo reference assembly of the yellow mangrove Ceriops zippeliana genome | |
CN111916151B (zh) | 一种苜蓿黄萎病菌的溯源检测方法及应用 | |
Raveendar et al. | The complete chloroplast genome sequence of Korean landrace “Subicho” pepper (Capsicum annuum var. annuum) | |
CN110343741B (zh) | 一种基于双酶切的简化基因组测序文库的构建方法 | |
CN105838720B (zh) | Ptprq基因突变体及其应用 | |
Song et al. | Constrained non-coding sequence provides insights into regulatory elements and loss of gene expression in maize | |
Sandler et al. | Population genomics of the facultatively sexual liverwort Marchantia polymorpha | |
CN112746121A (zh) | 一种与大豆农艺性状相关的snp位点组合、基因芯片及应用 | |
CN109988769B (zh) | 基因及其应用 | |
Moore et al. | The evolution of widespread recombination suppression on the dwarf hamster (Phodopus) X chromosome | |
CN109280699A (zh) | 一种基于ddRAD方法的新品种鉴定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |