CN116884488B - 一种男性不育标志物的筛查方法、系统及设备 - Google Patents
一种男性不育标志物的筛查方法、系统及设备 Download PDFInfo
- Publication number
- CN116884488B CN116884488B CN202311149986.4A CN202311149986A CN116884488B CN 116884488 B CN116884488 B CN 116884488B CN 202311149986 A CN202311149986 A CN 202311149986A CN 116884488 B CN116884488 B CN 116884488B
- Authority
- CN
- China
- Prior art keywords
- rbps
- marker
- analysis
- expression
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000007466 Male Infertility Diseases 0.000 title claims abstract description 50
- 206010021929 Infertility male Diseases 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012216 screening Methods 0.000 title claims abstract description 41
- 101710146873 Receptor-binding protein Proteins 0.000 claims abstract description 143
- 101710137011 Retinol-binding protein 4 Proteins 0.000 claims abstract description 143
- 101710183439 Riboflavin-binding protein Proteins 0.000 claims abstract description 143
- 102100024544 SURP and G-patch domain-containing protein 1 Human genes 0.000 claims abstract description 143
- 239000003550 marker Substances 0.000 claims abstract description 92
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 72
- 230000014509 gene expression Effects 0.000 claims abstract description 62
- 210000001550 testis Anatomy 0.000 claims abstract description 51
- 230000004186 co-expression Effects 0.000 claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 206010003883 azoospermia Diseases 0.000 claims abstract description 25
- 238000003012 network analysis Methods 0.000 claims abstract description 19
- 238000010230 functional analysis Methods 0.000 claims abstract description 14
- 238000010195 expression analysis Methods 0.000 claims abstract description 10
- 210000004027 cell Anatomy 0.000 claims description 42
- 201000010099 disease Diseases 0.000 claims description 33
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 33
- 230000021595 spermatogenesis Effects 0.000 claims description 31
- 210000000130 stem cell Anatomy 0.000 claims description 30
- 230000035772 mutation Effects 0.000 claims description 19
- 238000012163 sequencing technique Methods 0.000 claims description 19
- 108091033409 CRISPR Proteins 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 12
- 241001465754 Metazoa Species 0.000 claims description 12
- 210000004602 germ cell Anatomy 0.000 claims description 12
- 230000000920 spermatogeneic effect Effects 0.000 claims description 12
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 11
- 238000010219 correlation analysis Methods 0.000 claims description 11
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 10
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 10
- 101710105008 RNA-binding protein Proteins 0.000 claims description 10
- 238000003209 gene knockout Methods 0.000 claims description 9
- 238000001727 in vivo Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 108010060424 DEAD Box Protein 20 Proteins 0.000 claims description 6
- 102100026091 Probable ATP-dependent RNA helicase DDX20 Human genes 0.000 claims description 6
- 241000700605 Viruses Species 0.000 claims description 6
- 238000003556 assay Methods 0.000 claims description 6
- 231100001160 nonlethal Toxicity 0.000 claims description 6
- 238000010200 validation analysis Methods 0.000 claims description 6
- -1 zchc 13 Proteins 0.000 claims description 6
- 101001120706 Homo sapiens Outer dense fiber protein 2 Proteins 0.000 claims description 5
- 101000609215 Homo sapiens Polyadenylate-binding protein 3 Proteins 0.000 claims description 5
- 102100026069 Outer dense fiber protein 2 Human genes 0.000 claims description 5
- 102100039425 Polyadenylate-binding protein 3 Human genes 0.000 claims description 5
- 102100026141 ATP-dependent RNA helicase DDX25 Human genes 0.000 claims description 4
- 101000912706 Homo sapiens ATP-dependent RNA helicase DDX25 Proteins 0.000 claims description 4
- 241000282376 Panthera tigris Species 0.000 claims description 4
- 230000004570 RNA-binding Effects 0.000 claims description 4
- 230000002950 deficient Effects 0.000 claims description 4
- 208000015181 infectious disease Diseases 0.000 claims description 4
- 238000004806 packaging method and process Methods 0.000 claims description 4
- 230000001717 pathogenic effect Effects 0.000 claims description 4
- 101001114057 Homo sapiens P antigen family member 1 Proteins 0.000 claims description 3
- 101001111898 Homo sapiens RNA-binding protein 44 Proteins 0.000 claims description 3
- 101000647095 Homo sapiens Transcriptional protein SWT1 Proteins 0.000 claims description 3
- 102100023219 P antigen family member 1 Human genes 0.000 claims description 3
- 102100023858 RNA-binding protein 44 Human genes 0.000 claims description 3
- 102100025094 Transcriptional protein SWT1 Human genes 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 102000014914 Carrier Proteins Human genes 0.000 claims 2
- 108091008324 binding proteins Proteins 0.000 claims 2
- 230000003834 intracellular effect Effects 0.000 claims 2
- 238000002731 protein assay Methods 0.000 claims 2
- 238000010008 shearing Methods 0.000 claims 2
- 230000001850 reproductive effect Effects 0.000 abstract description 6
- 238000003745 diagnosis Methods 0.000 abstract description 2
- 210000001519 tissue Anatomy 0.000 description 74
- 230000006870 function Effects 0.000 description 16
- 102000004169 proteins and genes Human genes 0.000 description 12
- 241000282414 Homo sapiens Species 0.000 description 9
- 241000699670 Mus sp. Species 0.000 description 9
- 230000033228 biological regulation Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000002381 testicular Effects 0.000 description 5
- 201000010208 Seminoma Diseases 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 208000000509 infertility Diseases 0.000 description 4
- 230000036512 infertility Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 230000001124 posttranscriptional effect Effects 0.000 description 4
- COVZYZSDYWQREU-UHFFFAOYSA-N Busulfan Chemical compound CS(=O)(=O)OCCCCOS(C)(=O)=O COVZYZSDYWQREU-UHFFFAOYSA-N 0.000 description 3
- 238000003559 RNA-seq method Methods 0.000 description 3
- 229960002092 busulfan Drugs 0.000 description 3
- 230000009395 genetic defect Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000000653 nervous system Anatomy 0.000 description 3
- 230000000414 obstructive effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 102100034663 Caseinolytic peptidase B protein homolog Human genes 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 101000946436 Homo sapiens Caseinolytic peptidase B protein homolog Proteins 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- 231100000535 infertility Toxicity 0.000 description 2
- 208000021267 infertility disease Diseases 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 230000007918 pathogenicity Effects 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 230000014493 regulation of gene expression Effects 0.000 description 2
- 230000008844 regulatory mechanism Effects 0.000 description 2
- 210000004994 reproductive system Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 102100021548 5-methylcytosine rRNA methyltransferase NSUN4 Human genes 0.000 description 1
- 102100027521 60S ribosomal protein L10-like Human genes 0.000 description 1
- 102100024090 Aldo-keto reductase family 1 member C3 Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 102100033672 Deleted in azoospermia-like Human genes 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 101001108645 Homo sapiens 5-methylcytosine rRNA methyltransferase NSUN4 Proteins 0.000 description 1
- 101000724931 Homo sapiens 60S ribosomal protein L10-like Proteins 0.000 description 1
- 101000690306 Homo sapiens Aldo-keto reductase family 1 member C3 Proteins 0.000 description 1
- 101000871280 Homo sapiens Deleted in azoospermia-like Proteins 0.000 description 1
- 101001054842 Homo sapiens Leucine zipper protein 4 Proteins 0.000 description 1
- 101001128158 Homo sapiens Nanos homolog 2 Proteins 0.000 description 1
- 101000830411 Homo sapiens Probable ATP-dependent RNA helicase DDX4 Proteins 0.000 description 1
- 101000952113 Homo sapiens Probable ATP-dependent RNA helicase DDX5 Proteins 0.000 description 1
- 101001048992 Homo sapiens Protein FAM186A Proteins 0.000 description 1
- 101000762425 Homo sapiens Protein boule-like Proteins 0.000 description 1
- 101000984042 Homo sapiens Protein lin-28 homolog A Proteins 0.000 description 1
- 101000889756 Homo sapiens Tudor domain-containing protein 1 Proteins 0.000 description 1
- 101000889708 Homo sapiens Tudor domain-containing protein 10 Proteins 0.000 description 1
- 101000823778 Homo sapiens Y-box-binding protein 2 Proteins 0.000 description 1
- 101100377226 Homo sapiens ZBTB16 gene Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102100026910 Leucine zipper protein 4 Human genes 0.000 description 1
- 108091077621 MAPRE family Proteins 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000009664 Microtubule-Associated Proteins Human genes 0.000 description 1
- 102100031892 Nanos homolog 2 Human genes 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101710129472 PAB1-binding protein 1 Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102100024770 Probable ATP-dependent RNA helicase DDX4 Human genes 0.000 description 1
- 102100037434 Probable ATP-dependent RNA helicase DDX5 Human genes 0.000 description 1
- 108700003766 Promyelocytic Leukemia Zinc Finger Proteins 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 102100023820 Protein FAM186A Human genes 0.000 description 1
- 102100024493 Protein boule-like Human genes 0.000 description 1
- 102100025460 Protein lin-28 homolog A Human genes 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102100040192 Tudor domain-containing protein 1 Human genes 0.000 description 1
- 102100040182 Tudor domain-containing protein 10 Human genes 0.000 description 1
- 102100022222 Y-box-binding protein 2 Human genes 0.000 description 1
- 102100040314 Zinc finger and BTB domain-containing protein 16 Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 238000010820 immunofluorescence microscopy Methods 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000013332 literature search Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000003068 pathway analysis Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 102000028499 poly(A) binding Human genes 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 208000017443 reproductive system disease Diseases 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 210000002863 seminiferous tubule Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 210000004336 spermatogonium Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种男性不育标志物的筛查方法、系统及设备,涉及生殖分子生物学领域。所述方法包括:获取RBP样本集和不同组织转录组数据;将RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;对睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;将第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,即为目标男性不育标志物。本发明提供的方法综合利用了多种数据源,具有睾丸组织特异性,采用高度关联性分析和多层次筛选的方法,提高筛查的准确性和可靠性,为男性不育的诊断和治疗提供重要的参考依据。
Description
技术领域
本发明属于生殖分子生物学领域,更具体地,涉及一种男性不育标志物的筛查方法、系统及设备。
背景技术
遗传缺陷是男性产生不育的根本病理原因之一。遗传缺陷包括基因突变、基因缺失、染色体异常等引起的遗传性疾病或异常。这些遗传缺陷直接或间接地影响精子发生的各个阶段,进而导致精子发生异常或无法正常进行。
精子发生是雄性生殖发育中受众多基因精密调控的细胞增殖与分化过程,在该过程中,RNA代谢异常活跃,需要复杂的转录后基因调控(Post-Transcriptional GeneRegulation, PTGR)机制的协同作用以确保种系中基因组的稳定性来延续生命的繁殖。RNA结合蛋白质(RNA Binding Protein, RBP)作为PTGR机制的重要组成部分,通过协调RNA活动的各个方面来调控细胞正常代谢,例如RNA的运输、定位、稳定性、编辑、剪接、翻译和降解。研究报道睾丸组织是RBP表达最特异的器官,RBPs的功能障碍通常会导致严重的精子发生缺陷和男性生育力低下,甚至造成不育症的发生。然而,在庞大而复杂的精子发生调控网络中,仍有大量RBPs在精子发生中的作用尚未明确,有待进一步探索。
发明内容
本发明公开一种男性不育标志物的筛查方法,所述方法深入研究了精子发生过程中功能性RBP对于解析精子发生过程中基因的调控机制以及临床不育症的发病机理,系统性搜集RBP文库结合组织共表达网络分析,获取了514个在睾丸组织中共表达最显著的RBP,其中包括62个在睾丸组织高度富集或特异性表达的RBPs,所述62个RBPs为临床不育症的诊断和治疗提供新的分子指标,具有重要的临床应用价值。
一种男性不育标志物的筛查方法,所述方法包括:
获取RBP样本集和不同组织转录组数据;
将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
进一步,所述方法还包括:
将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;
将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物。
进一步,所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块。
进一步,所述方法还包括:
将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
进一步,所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx。
进一步,所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判。
进一步,所述目标男性不育标志物包括以下任意一种或几种:DDX20、DDX25、ZCCHC13、PAGE1、PABPC3、RBM44、SWT1、BOLL、ODF2、SLC25G6。
进一步,所述方法还包括对所述目标男性不育标志物进行模式动物基因敲除验证,所述模式动物基因敲除验证包括:
步骤1:制备用于单细胞测序的敲除所述目标男性不育标志物的载体;
步骤2:制备稳定表达Cas9蛋白的精原干细胞;
步骤3:将所述载体包装病毒感染到所述精原干细胞中,流式筛选到感染后未致死的精原干细胞;
步骤4:将所述未致死的精原干细胞移植到生殖细胞缺陷的模式动物睾丸中进行体内精子发生;
步骤5:对精子发生的生精细胞进行单细胞测序负向筛选出对精子发生至关重要的基因。
一种男性不育标志物的筛查系统,所述系统包括:
获取单元,用于获取RBP样本集和不同组织转录组数据;
共表达网络分析单元,用于将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
睾丸组织共表达模块分析单元,用于在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
数据整合单元,用于将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
一种男性不育标志物的筛查设备,所述设备包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时,用于执行上述的男性不育标志物的筛查方法。
本发明的优点:
1.本发明所公开的方法利用了不同组织转录组数据和RBP样本集进行共表达网络分析,进一步结合了差异表达分析和基因功能分析,利用多种数据进行数据挖掘,提高了筛查的准确性和可靠性。
2. 本发明所公开的方法选择了睾丸组织中高度富集的共表达模块作为第一候选标志物,这样可以更加准确地筛选出与男性不育相关的标志物,增加了筛查的特异性。
3. 本发明所公开的方法通过联合分析第一候选标志物和无精症患者的转录组数据中差异表达基因,得到第二候选标志物,这样可以进一步筛选出与无精症相关的标志物,提高了筛查的相关性。
4. 本发明所公开的方法将第一候选标志物进行疾病相关性分析,得到第三候选标志物,再通过联合分析第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因,得到第四候选标志物,这样的多层次筛选可以进一步提高筛查的准确性和可靠性。
5. 本发明所公开的方法对目标标志物进行模式动物基因敲除验证,通过制备单细胞测序的敲除目标标志物的载体,包装病毒感染到精原干细胞中,并在生殖细胞缺陷的模式动物体内进行体内精子发生,从而验证目标标志物的有效性,这种验证方法突破了除精原干细胞外的生精细胞不能在体外培养的限制,可以更直接地在体内验证标志物的功能和作用,提高了筛查结果的可信度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是一种本发明实施例提供的一种男性不育标志物的筛查方法流程示意图;
图2是一种本发明实施例提供的一种男性不育标志物的筛查系统示意图;
图3是一种本发明实施例提供的一种男性不育标志物的筛查设备示意图;
图4是一种本发明实施例提供的共表达网络分析RBP的可视化热图,每一个小方块代表了模块与不同组织之间的相关性,方块中值表示相关性和p值,正分数表示正相关;
图5是一种本发明实施例提供的睾丸组织共表达RBPs特征及功能分析中514个RBP在睾丸中不同细胞中表达谱;
图6是一种本发明实施例提供的睾丸组织共表达RBPs特征及功能分析中生精细胞中高表达RBP的功能分析示意图;
图7是一种本发明实施例提供的睾丸组织共表达RBPs特征及功能分析中514个RBP相互作用网络图;
图8是一种本发明实施例提供的睾丸组织共表达RBP在睾丸组织特异性表达及功能分析示意图,将RBP划分为候选RBP、已报道在精子发生无功能的RBP、已报道在精子发生中具有功能的RBP和其他不显著富集的RBP;
图9是一种本发明实施例提供的62个在睾丸组织中高表达RBP的功能分析示意图;
图10是一种本发明实施例提供的候选RBP疾病分析结果示意图;
图11是一种本发明实施例提供的候选RBP疾病分析中,25个RBP在无精症患者转录组中的表达分析;
图12是一种本发明实施例提供的候选RBP疾病分析中,患有梗阻性无精子症(OA)患者与患有非梗阻性无精子症(NOA)患者睾丸单细胞分群;
图13是一种本发明实施例提供的候选RBP疾病分析中,候选RBPs在OA与NOA患者生精细胞中的表达变化;
图14是一种本发明实施例提供的模式动物基因敲除验证步骤流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S101、S102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种男性不育标志物的筛查方法,包括:
S101:获取RBP样本集和不同组织转录组数据;
在一个实施例中,所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx。HPA(Human Protein Atlas)是一个综合性的人类蛋白质组学数据库,旨在提供全面的人类蛋白质表达信息。该数据库通过对人类不同组织和细胞类型中蛋白质的免疫组化染色和高通量转录组学分析,提供了蛋白质在不同组织和细胞中的表达情况、亚细胞定位、组织特异性等信息。HPA还提供了基因和蛋白质的注释信息、蛋白质拓扑结构和功能的预测等。TiGER(Tissue-specific Gene Expression andRegulation)是一个组织特异性基因表达和调控数据库,旨在研究和理解基因在不同组织和细胞类型中的表达调控。该数据库整合了大量的转录组学数据,包括RNA-seq和微阵列等,提供了基因在不同组织和细胞类型中的表达水平和调控因子的信息。TiGER还提供了基因表达的调控网络和通路分析工具,帮助研究人员深入分析基因的组织特异性表达和调控机制。GTEx(Genotype-Tissue Expression)是一个大规模的人类基因表达数据库,旨在研究基因在人体不同组织和器官中的表达模式和调控机制。该数据库整合了来自上千个个体的RNA-seq数据,包括正常组织和器官的基因表达谱,提供了基因在不同组织中的表达水平、组织特异性、基因变异对表达的影响等信息。GTEx还提供了遗传变异与基因表达的关联分析工具,帮助研究人员理解基因的表达调控和基因与疾病之间的关系。
在一个具体实施例中,早期RNA结合蛋白质的捕获主要来源于对多聚腺苷酸化RNA结合蛋白组的分析以及对常规RNA结合域(RBP)的分析,最近的研究报道了一些非常规的RBP,它们缺乏可识别的RBP,但通常包含直接参与RNA结合的内在无序区域或单核苷酸和双核苷酸结合域。为了全面系统的概括精子发生过程中的功能性RBP,发明人团队进一步更新了总RBP列表,将poly(A)结合蛋白以及包含非常规RBP的RNA结合蛋白的研究结果进行合并汇总,如OOPS、SONAR、XRNAX等,最终将来自不同类型的人类细胞的候选RBP的综合数量增加到4692个,这远超过目前单一研究报道的RBP列表。这可能是由于不同研究采用紫外交联和质谱的分析方法,往往会遗漏实验和分析中低丰度的蛋白质或该研究方法不能很好的将RNA与蛋白质进行交联,因此,随着新的检测技术发展,未来RBP的数量可能会持续增加。同时,RBP的广泛性和功能的重要性也将随着进一步深入的研究逐渐被解析出来。
S102:将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
在一个实施例中,所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块。
在一个具体实施例中,蛋白质在调控细胞的生物学过程中,通常采取“联合作战”的模式,因此,绝大多数蛋白质以协同表达的模式共同参与细胞的功能调控。为了探索汇集的RBP是否在精子发生过程中参与重要的转录后调控,发明人团队将汇集的RBP与HPA数据库中不同组织的转录本进行共表达网络分析(WGCNA),最终获得19个组织共表达模块,其中包括10个组织特异性表达模块和9个非组织特异性表达模块,见图4。在组织特异性表达模块中,组织特异性得分最高的模块是在睾丸组织中高度富集,其中包含了514个睾丸组织中共表达RBPs。
S103:在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
在一个实施例中,发明人团队针对在睾丸组织富集的模块中的RBP进行了表达特征及功能分析。首先,分析了514个RBP在睾丸不同生精细胞及体细胞的表达特征,发现超过96%的RBP在生殖细胞中表达并显示出谱系特异性表达,见图5。进一步,预测了这些RBPs的功能,发现精原细胞中高表达的RBPs大多具有解旋酶活性,精母细胞中核质转运活性明显,精子细胞中微管相关蛋白和蛋白酶体活性更高,见图6。这些结果表明,这些RBP的功能与精子发生阶段的特征相匹配。蛋白质-蛋白质相互作用(PPI)网络分析表明,这些RBP的主要成员构成了一个广泛的转录后协同调控网络参与精子发生的调控过程,在功能上具有紧密相关性,见图7。
在一个实施例中,为了进一步探索在精子发生过程中具有潜在生精功能的RBP,发明人团队将睾丸组织富集的模块中的RBP与HPA数据库中人睾丸组织高度富集以及特异性表达的基因进行分析,最终获得了62个在睾丸组织中高度富集或特异性表达的RBP,其中大部分是在睾丸组织中具有重要功能的RBP,如DDX4、DAZL、BOLL、YBX2、TDRD1、LIN28A、NANOS2、DDX5、DDX25、RPL10L等,见图8。功能分析发现这些基因广泛涉及男性不育等相关术语,见图9。通过文献检索以及对在线功能性生精数据库Spermatogenesis Online 1.0查询,发现上述62个候选RBP中,有37个基因在睾丸组织的功能已有明确报道,其中包括7个无生育表型的RBP以及30个对精子发生至关重要的RBP,这也表明目前发明人的筛选方案具有很高的准确性。
S104:将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
在一个实施例中,所述方法还包括:
将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;
将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物。
在一个实施例中,所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判。DisGeNET是一个广泛整合了多个公共数据库中的疾病关联基因信息的知识库。它提供了基于多种数据源的疾病-基因关联数据,并为每个关联提供了一个相关性分值。这些数据源包括疾病基因组学、文献挖掘和遗传关联研究等。在DisGeNET中,疾病-基因关联的得分是根据多种因素计算得出的。其中包括关联研究的质量评估、关联研究的样本大小、重复性等。这些因素被用来评估每个疾病-基因关联的可靠性和重要性。得分越高表示关联越强,表明该基因与疾病之间的关联更为可信。通过使用DisGeNET的多组数据得分,可以评估一个基因与多个疾病之间的关联程度,有助于确定一个基因在不同疾病中的重要性和相关性。SpermGenes是一个专门用于研究与精子发生和生殖功能相关的基因的数据库。SpermGenes 2.0是该数据库的最新版本,提供了更全面和更新的精子相关基因信息。SpermGenes 2.0中的得分是根据多个因素计算得出的。这些因素包括基因在不同精子发生阶段的表达水平、基因在精子中的丰度和特异性、基因在不同物种中的保守性等。通过综合考虑这些因素,为每个基因分配一个得分,用于评估其与精子发生和生殖功能的相关性。SpermGenes 2.0的得分可以帮助研究人员确定在精子发生和生殖功能中具有重要作用的基因,并提供了有关这些基因的详细信息,有助于进一步的研究和理解生殖系统的功能和疾病。
在一个具体实施例中,与转录因子相比,RBP在进化上更为保守,并且在组织中分布更广泛,并常常作为管家基因发挥功能,而管家RBP表达的突变或改变往往又会导致组织特异性缺陷。因此,RBP的致病性可能在不同组织有不同的表现。接下来,发明人团队针对剩余未被研究的25个RBP进行疾病相关性分析。为此,使用了DisGeNET数据库进行候选RBP的人类疾病查询,DisGeNET数据库整合了公共数据库、GWAS目录、动物模型和科学文献的数据,收集了大量与人类疾病相关的变异和基因,因此该数据库具有很好的代表性及全面性。同时,通过精子发生2.0在线预测功能性基因的网站数据联合分析,发明人团队发现25个候选RBP中有13个RBP在不同组织器官中导致疾病发生,有5个RBP存在疾病相关的突变,分别为NSUN4、CLPB、FAM186A、DDX20和TDRD10。其中大多数疾病涉及到神经系统以及肿瘤相关的疾病,一部分基因涉及生殖系统疾病,见图10。考虑神经系统和睾丸两个组织存在诸多的相似性,因此,这些在睾丸中共表达且高度富集的基因在神经系统也会导致疾病的产生,同样,这些基因在睾丸组织中也可能导致生殖系统的疾病产生。进一步,通过分析无精症患者的转录组测序数据,发现DDX20、ODF2、PABPC3和LUZP4的表达水平在无精子症患者的睾丸中显著降低,见图11。对人类睾丸(GSE14951222)的单细胞转录组学分析显示,在严重的非梗阻性无精子症患者中相应细胞类型中的候选RBPs表达下调,见图12、13,表明这些RBPs可能在相应的生殖细胞中具有潜在功能。
在一个实施例中,所述方法还包括:将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
在一个实施例中,所述目标男性不育标志物包括以下任意一种或几种:DDX20、DDX25、ZCCHC13、PAGE1、PABPC3、RBM44、SWT1、BOLL、ODF2、SLC25G6。
在一个具体实施例中,为了进一步探索上述候选的RBP在男性不育中的致病性,发明人团队对来自中国地区无精症患者的全外显子的测序数据进行分析,发现候选基因中PABPC3、DDX20、CLPB、ODF2等在无精症患者的全外显子测序中存在大量的突变,其中DDX20包括剪接缺失以及众多的点突变,尤其是在重要结构域上的Arg 348 His点突变,通过在线的预测突变危害的PolyPhen2数据库进行分析,发现其中预测具有危害突变的HumVar数值得分以及预测可能参与复杂疾病的稀有等位基因的HumDiv数值得分都达到了满分。
在一个实施例中,所述方法还包括对所述目标男性不育标志物进行模式动物基因敲除验证,所述模式动物基因敲除验证步骤如图14所示,具体包括:
步骤1:制备用于单细胞测序的敲除所述目标男性不育标志物的载体;
在一个实施例中,为了实现单细胞层面的CRISPR/Cas9敲除筛选,发明人团队改造了表达sgRNA的质粒,通过将sgRNA表达元件插入到慢病毒3’长末端重复序列(LongTerminal Repeat, LTR)中,使得sgRNA成为由RNA聚合酶II转录的TurboGFP mRNA的一部分,并且通过使用聚腺苷酸富集的RNA-seq方案检测,而功能性gRNA继续从U6启动子表达,进而发挥sgRNA引导的Cas9敲除。选择前期已完成验证过的一个靶点sgRNA构建到CROP-TurboGFP-guide载体中,包装成慢病毒,并感染稳定表达Cas9蛋白的Hela细胞。随后提取感染细胞的基因组,通过对靶标附近基因进行PCR扩增出基因组片段并测序,测序结果发现,改造的载体能够产生有效的基因组切割效果。同时,提取感染细胞的RNA,使用oligo dT引物进行逆转录成cDNA,再使用针对载体中表达sgRNA元件片段的引物对cDNA进行PCR扩增,通过回收PCR产物进行测序,发现由oligo dT富集的RNA能够很好的检测到sgRNA的表达。上述结果表明,改造后的载体能够正常引导Cas9蛋白质对基因组进行切割,同时载体表达的sgRNA能够被oligo dT的引物富集,可以在单细胞测序中被检测到。
步骤2:制备稳定表达Cas9蛋白的精原干细胞;在一个实施例中,生殖细胞由于存在天然的免疫屏障导致精原干细胞较常规细胞系更加难以感染,于是发明人团队选择使用内源表达Cas9蛋白质,以此减少病毒大小,提高感染效率。为了获得内源表达Cas9的精原干细胞,发明人团队使用表达Cas9蛋白质的小鼠,使用Ddx4-Cre工具鼠与Cas9小鼠杂交,获得在生殖细胞中表达Cas9蛋白质的小鼠。随后,取出生后6天左右且已表达Cas9蛋白质小鼠的睾丸分离生精细胞并建系。在表达Cas9蛋白质的精原干细胞稳定成系后,通过免疫荧光显微镜检测SSC中标签蛋白tdTomato的表达,发现培养中的SSC自带红色荧光。进一步,通过提取培养的Cas9-精原干细胞及小鼠睾丸组织的蛋白质进行western blot分析精原干细胞中Cas9的蛋白质表达,我们发现培养的Cas9-精原干细胞表达Cas9蛋白良好。同时,发明人团队通过免疫荧光检测了建系的精原干细胞干性标志物的表达,未分化型精原干细胞标志物Lin28a和PLZF表达较高,表明Cas9-精原干细胞建系成功。
步骤3:将所述载体包装病毒感染到所述精原干细胞中,流式筛选到感染后未致死的精原干细胞;
流式筛选是一种细胞分选技术,基于细胞表面的特定标记物,通过标记物与特定抗体的结合,使细胞在流式细胞仪中以不同的信号强度进行分离和检测。步骤4:将所述未致死的精原干细胞移植到生殖细胞缺陷的模式动物睾丸中进行体内精子发生;
在一个实施例中,为了在体内筛选精子发生中的功能性RBP,发明人团队设计将感染的精原干细胞移植回输至精原细胞缺失的小鼠睾丸内。发明人团队通过对6周c57小鼠腹腔注射白消安耗竭生殖细胞。为了保持睾丸的最近状态,测试了20mg/kg、25mg/kg、30mg/kg以及35mg/kg的不同白消安浓度,并分别检测了注射后3周、4周及8周睾丸组织的生精变化,最终选择了30mg/kg的浓度,H&E染色显示曲细精管较完整,生精细胞基本缺失,符合精原干细胞的移植需求。
用白消安处理小鼠后,会让小鼠精原干细胞死亡,一个月后,小鼠睾丸中就没有生精细胞了,便可以通过移植回输精原干细胞,再体内模拟精子发生的过程,精原干细胞分化成精母细胞,减数分裂,随后分化为圆形精子,精子变形形成成熟精子。
步骤5:对精子发生的生精细胞进行单细胞测序负向筛选出对精子发生至关重要的基因。
在一个实施例中,通过构建单细胞筛选的体系,可以检测回输的细胞里感染了哪些病毒(载体),通过测序负向筛选进一步得知哪些基因被敲除了。由于生殖细胞在体内精子发生是一个连续的过程,某个基因可能在精原干细胞中没有功能,但在减数分裂的精母细胞中有功能,这样回输体内,就有可能检测到精母细胞有功能,通过回输体内,可以检测到精母细胞停滞发育,进一步检测这个细胞某一个或几个基因被敲除了,因此得知被敲除基因或几个基因联合发挥作用的细胞时期。
通过上述构建单细胞筛选体系,回输体内观测基因敲除后细胞发育过程与是否死亡,进一步通过单细胞测序检测导致细胞停止发育与死亡的某一种或几种基因的方法,解决体外培养仅能培养精原干细胞的不足,所述方法在生殖细胞发育研究领域具有重要的应用价值。
图2是本发明实施例提供的一种男性不育标志物的筛查系统,包括:
S201:获取单元,用于获取RBP样本集和不同组织转录组数据;
S202:共表达网络分析单元,用于将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
S203:睾丸组织共表达模块分析单元,用于在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
S204:数据整合单元,用于将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物。
图3是本发明实施例提供的一种男性不育标志物的筛查设备示意图,其包括:存储器和/或处理器;该设备还可以包括:输入装置和输出装置。
存储器、处理器、输入装置和输出装置可以通过总线或者其他方式连接。图3所示的是以总线连接方式为例;其中,存储器用于存储程序指令;处理器用于调用程序指令,当程序指令被执行时,用于实现上述男性不育标志物的筛查方法。在一个实施例中,存储器可以理解为程序的任何保存设备,处理器可以理解为程序的使用设备。
Claims (5)
1.一种男性不育标志物的筛查方法,其特征在于,所述方法包括:
获取RBP样本集和不同组织转录组数据;RBP为RNA结合蛋白,RBP通过识别特殊的RNA结构域与RNA互作,参与到RNA剪切、转运、序列编辑、胞内定位及翻译过程;所述RBP样本集中的RBP来源于以下任意一种或几种分析方法:多聚腺苷酸化RNA结合蛋白组分析、常规RNA结合域分析、polyA结合蛋白分析和非常规RBP的RNA结合蛋白研究结果;所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx;
将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块;
在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物;
将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判;将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物;
将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物也为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
2.根据权利要求1所述的男性不育标志物的筛查方法,其特征在于,所述目标男性不育标志物包括以下任意一种或几种:DDX20、DDX25、ZCCHC13、PAGE1、PABPC3、RBM44、SWT1、BOLL、ODF2、SLC25G6。
3.根据权利要求1所述的男性不育标志物的筛查方法,其特征在于,所述方法还包括对所述目标男性不育标志物进行模式动物基因敲除验证,所述模式动物基因敲除验证包括:
步骤1:制备可进行单细胞测序的敲除所述目标男性不育标志物的载体;
步骤2:制备稳定表达Cas9蛋白的精原干细胞;
步骤3:将所述载体包装病毒感染到所述精原干细胞中,流式筛选到感染后未致死的精原干细胞;
步骤4:将所述未致死的精原干细胞移植到生殖细胞缺陷的模式动物睾丸中进行体内精子发生;
步骤5:对精子发生的生精细胞进行单细胞测序负向筛选出对精子发生至关重要的基因。
4.一种男性不育标志物的筛查系统,其特征在于,所述系统包括:
获取单元,用于获取RBP样本集和不同组织转录组数据;RBP为RNA结合蛋白,RBP通过识别特殊的RNA结构域与RNA互作,参与到RNA剪切、转运、序列编辑、胞内定位及翻译过程;所述RBP样本集中的RBP来源于以下任意一种或几种分析方法:多聚腺苷酸化RNA结合蛋白组分析、常规RNA结合域分析、polyA结合蛋白分析和非常规RBP的RNA结合蛋白研究结果;所述不同组织转录组数据来自于以下组织特异性基因表达数据库中的任意一种或几种:HPA、TiGER、GTEx;
共表达网络分析单元,用于将所述RBP样本集和不同组织转录组数据进行多组织共表达网络分析得到RBPs共表达模块;
所述共表达网络分析步骤包括:
步骤1:获取所述RBP样本集和不同组织转录组数据;
步骤2:基于所述不同组织转录组数据中RBPs表达量数据计算RBPs之间的相关性,得到RBPs相关性矩阵;
步骤3:基于所述RBPs相关性矩阵构建RBPs共表达网络;
步骤4:基于所述RBPs共表达网络的拓扑结构,使用聚类算法将RBPs划分为不同的模块,得到RBPs共表达模块;
睾丸组织共表达模块分析单元,用于在所述RBPs共表达模块中选择睾丸组织中高度富集或特异性表达的共表达模块,并对所述睾丸组织中高度富集或特异性表达的共表达模块中的基因进行功能分析和差异表达分析,得到第一候选标志物;
数据整合单元,用于将所述第一候选标志物和无精症患者的转录组数据中差异表达基因进行联合分析,得到第二候选标志物,所述第二候选标志物为目标男性不育标志物;将所述第一候选标志物进行疾病相关性分析,得到第三候选标志物;所述疾病相关性分析采用以下方法中的任意一种或几种:DisGeNET多组数据得分、SpermGenes2.0得分评判;将所述第三候选标志物和无精症患者的睾丸组织的单细胞转录组数据中差异表达基因进行联合分析,得到第四候选标志物,所述第四候选标志物也为目标男性不育标志物;将所述第二和/或第四候选标志物和无精症患者的全外显子测序数据中突变位点进行联合分析,得到第五候选标志物,所述第五候选标志物也为目标男性不育标志物,所述突变位点是通过在线预测软件预测所述第二和/或第四候选标志物上的有致病性的突变位点。
5.一种男性不育标志物的筛查设备,其特征在于,所述设备包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用程序指令,当程序指令被执行时,用于执行权利要求1-3任意一项所述的男性不育标志物的筛查方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311149986.4A CN116884488B (zh) | 2023-09-07 | 2023-09-07 | 一种男性不育标志物的筛查方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311149986.4A CN116884488B (zh) | 2023-09-07 | 2023-09-07 | 一种男性不育标志物的筛查方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116884488A CN116884488A (zh) | 2023-10-13 |
CN116884488B true CN116884488B (zh) | 2023-11-24 |
Family
ID=88255476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311149986.4A Active CN116884488B (zh) | 2023-09-07 | 2023-09-07 | 一种男性不育标志物的筛查方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116884488B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105473714A (zh) * | 2013-05-31 | 2016-04-06 | 重组股份有限公司 | 遗传不育动物 |
EP3006560A1 (en) * | 2014-10-09 | 2016-04-13 | European Molecular Biology Laboratory | Miwi2 as a marker for spermatogonial stem cells and method for diagnosing spermatogonial stem cells based on said marker |
CN107916289A (zh) * | 2017-05-31 | 2018-04-17 | 南京优智源医药科技有限公司 | 精子piRNA和精子蛋白MitoPLD作为检测和预测男性不育的生物标志物 |
CN113215234A (zh) * | 2021-06-10 | 2021-08-06 | 中国科学院生物物理研究所 | 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110158966A1 (en) * | 2002-07-23 | 2011-06-30 | Judith Seligman | Stem cells characterized by expression of germline specific genes |
-
2023
- 2023-09-07 CN CN202311149986.4A patent/CN116884488B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105473714A (zh) * | 2013-05-31 | 2016-04-06 | 重组股份有限公司 | 遗传不育动物 |
EP3006560A1 (en) * | 2014-10-09 | 2016-04-13 | European Molecular Biology Laboratory | Miwi2 as a marker for spermatogonial stem cells and method for diagnosing spermatogonial stem cells based on said marker |
CN107916289A (zh) * | 2017-05-31 | 2018-04-17 | 南京优智源医药科技有限公司 | 精子piRNA和精子蛋白MitoPLD作为检测和预测男性不育的生物标志物 |
CN113215234A (zh) * | 2021-06-10 | 2021-08-06 | 中国科学院生物物理研究所 | 一种鉴定RNA结合蛋白靶位点的方法LACE-seq及试剂盒和应用 |
Non-Patent Citations (1)
Title |
---|
牦牛、犏牛TB-RBP基因克隆及在睾丸组织中的表达;柴志欣;王会;王吉坤;王嘉博;钟金城;;华北农学报(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116884488A (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lachance et al. | Evolutionary history and adaptation from high-coverage whole-genome sequences of diverse African hunter-gatherers | |
Kruger et al. | A neofunctionalized X-linked ampliconic gene family is essential for male fertility and equal sex ratio in mice | |
Lemmon et al. | The role of cis regulatory evolution in maize domestication | |
Georges | Mapping, fine mapping, and molecular dissection of quantitative trait loci in domestic animals | |
Veeramah et al. | The impact of whole-genome sequencing on the reconstruction of human population history | |
Network | What do we need to know about speciation? | |
Kent et al. | Conservation genomics of the declining North American bumblebee Bombus terricola reveals inbreeding and selection on immune genes | |
Dean et al. | Proteomics and comparative genomic investigations reveal heterogeneity in evolutionary rate of male reproductive proteins in mice (Mus domesticus) | |
Morgan et al. | Sequence and structural diversity of mouse Y chromosomes | |
Du et al. | Deep sequencing analysis of microRNAs in bovine sperm | |
Choi et al. | Divergent selection and primary gene flow shape incipient speciation of a riparian tree on Hawaii Island | |
Gioti et al. | Neurospora and the dead-end hypothesis: genomic consequences of selfing in the model genus | |
US20220277807A1 (en) | Methods and systems for assessing genetic variants | |
Liu et al. | A comprehensive catalogue of regulatory variants in the cattle transcriptome | |
Argaw-Denboba et al. | Paternal microbiome perturbations impact offspring fitness | |
David et al. | Genotyping by sequencing transcriptomes in an evolutionary pre-breeding durum wheat population | |
Kozlowski et al. | Transposable Elements are an evolutionary force shaping genomic plasticity in the parthenogenetic root-knot nematode Meloidogyne incognita | |
Tzur | lncRNAs in fertility: redefining the gene expression paradigm? | |
Zunino et al. | Genomic evidence of genuine wild versus admixed olive populations evolving in the same natural environments in western Mediterranean Basin | |
CN116884488B (zh) | 一种男性不育标志物的筛查方法、系统及设备 | |
Battlay et al. | Large haploblocks underlie rapid adaptation in an invasive weed | |
Barragan et al. | Homozygosity at its limit: inbreeding depression in wild Arabidopsis arenosa populations | |
Cauret et al. | Functional dissection and assembly of a small, newly evolved, W chromosome-specific genomic region of the African clawed frog Xenopus laevis | |
Fischer et al. | Genome sequences of Tropheus moorii and Petrochromis trewavasae, two eco-morphologically divergent cichlid fishes endemic to Lake Tanganyika | |
Li et al. | Unravelling the genomic basis and evolution of the pea aphid male wing dimorphism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |