CN115678898A - 一种基于crispr技术检测病毒的方法 - Google Patents
一种基于crispr技术检测病毒的方法 Download PDFInfo
- Publication number
- CN115678898A CN115678898A CN202110838306.4A CN202110838306A CN115678898A CN 115678898 A CN115678898 A CN 115678898A CN 202110838306 A CN202110838306 A CN 202110838306A CN 115678898 A CN115678898 A CN 115678898A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- grna
- sequence
- seq
- target nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 241000700605 Viruses Species 0.000 title claims abstract description 29
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 16
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract description 16
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 228
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 226
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 226
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 86
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 81
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 80
- 238000001514 detection method Methods 0.000 claims abstract description 59
- 201000010099 disease Diseases 0.000 claims abstract description 22
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 22
- 230000008685 targeting Effects 0.000 claims description 54
- 241000202347 Porcine circovirus Species 0.000 claims description 41
- 230000000295 complement effect Effects 0.000 claims description 35
- 241000710777 Classical swine fever virus Species 0.000 claims description 34
- 241001135549 Porcine epidemic diarrhea virus Species 0.000 claims description 31
- 239000000203 mixture Substances 0.000 claims description 21
- 230000002441 reversible effect Effects 0.000 claims description 21
- 230000027455 binding Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 206010012735 Diarrhoea Diseases 0.000 claims description 10
- 208000001726 Classical Swine Fever Diseases 0.000 claims description 8
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 8
- 241001465754 Metazoa Species 0.000 claims description 7
- 230000007026 protein scission Effects 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 239000010931 gold Substances 0.000 claims description 4
- 229910052737 gold Inorganic materials 0.000 claims description 4
- 239000002105 nanoparticle Substances 0.000 claims description 4
- 238000000835 electrochemical detection Methods 0.000 claims description 3
- 238000002875 fluorescence polarization Methods 0.000 claims description 3
- 239000004065 semiconductor Substances 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 53
- 102000053602 DNA Human genes 0.000 description 46
- 230000003321 amplification Effects 0.000 description 31
- 238000003199 nucleic acid amplification method Methods 0.000 description 31
- 239000002773 nucleotide Substances 0.000 description 28
- 125000003729 nucleotide group Chemical group 0.000 description 28
- 108020004682 Single-Stranded DNA Proteins 0.000 description 25
- 230000000694 effects Effects 0.000 description 22
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 16
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 13
- 238000003776 cleavage reaction Methods 0.000 description 12
- 238000003752 polymerase chain reaction Methods 0.000 description 12
- 238000012408 PCR amplification Methods 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 230000007017 scission Effects 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090001008 Avidin Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 125000006853 reporter group Chemical group 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 4
- 108700004991 Cas12a Proteins 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 239000012636 effector Substances 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- -1 morpholino nucleic acids Chemical class 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 238000010791 quenching Methods 0.000 description 4
- 230000000171 quenching effect Effects 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 241000282898 Sus scrofa Species 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 125000004437 phosphorous atom Chemical group 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- UDGUGZTYGWUUSG-UHFFFAOYSA-N 4-[4-[[2,5-dimethoxy-4-[(4-nitrophenyl)diazenyl]phenyl]diazenyl]-n-methylanilino]butanoic acid Chemical compound COC=1C=C(N=NC=2C=CC(=CC=2)N(C)CCCC(O)=O)C(OC)=CC=1N=NC1=CC=C([N+]([O-])=O)C=C1 UDGUGZTYGWUUSG-UHFFFAOYSA-N 0.000 description 2
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 2
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- 238000007397 LAMP assay Methods 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000000741 diarrhetic effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 238000010166 immunofluorescence Methods 0.000 description 2
- 238000007901 in situ hybridization Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- CROXPNJRCAVBAQ-VLJOUNFMSA-N (2s)-4-amino-2-[[(2s)-4-amino-2-[[(2s)-2-[[(2s)-2-[[(2r)-2-amino-3-sulfanylpropanoyl]amino]propanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoyl]amino]-4-oxobutanoic acid Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CROXPNJRCAVBAQ-VLJOUNFMSA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- XCVRVWZTXPCYJT-BIIVOSGPSA-N Ala-Asn-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N XCVRVWZTXPCYJT-BIIVOSGPSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 1
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- FXGMURPOWCKNAZ-JYJNAYRXSA-N Arg-Val-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FXGMURPOWCKNAZ-JYJNAYRXSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- FANGHKQYFPYDNB-UBHSHLNASA-N Asn-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N FANGHKQYFPYDNB-UBHSHLNASA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- XLHLPYFMXGOASD-CIUDSAMLSA-N Asn-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLHLPYFMXGOASD-CIUDSAMLSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- NUCUBYIUPVYGPP-XIRDDKMYSA-N Asn-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CC(N)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O NUCUBYIUPVYGPP-XIRDDKMYSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- GOPFMQJUQDLUFW-LKXGYXEUSA-N Asn-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O GOPFMQJUQDLUFW-LKXGYXEUSA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- WLKVEEODTPQPLI-ACZMJKKPSA-N Asp-Gln-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WLKVEEODTPQPLI-ACZMJKKPSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 1
- IMGLJMRIAFKUPZ-FXQIFTODSA-N Asp-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N IMGLJMRIAFKUPZ-FXQIFTODSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- 241000182988 Assa Species 0.000 description 1
- 241000589941 Azospirillum Species 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 206010006895 Cachexia Diseases 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- OJQJUQUBJGTCRY-WFBYXXMGSA-N Cys-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CS)N OJQJUQUBJGTCRY-WFBYXXMGSA-N 0.000 description 1
- KGIHMGPYGXBYJJ-SRVKXCTJSA-N Cys-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CS KGIHMGPYGXBYJJ-SRVKXCTJSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 208000005156 Dehydration Diseases 0.000 description 1
- 208000000059 Dyspnea Diseases 0.000 description 1
- 206010013975 Dyspnoeas Diseases 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- RFDHKPSHTXZKLL-IHRRRGAJSA-N Glu-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N RFDHKPSHTXZKLL-IHRRRGAJSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- 241000032681 Gluconacetobacter Species 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- CJGDTAHEMXLRMB-ULQDDVLXSA-N His-Arg-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CJGDTAHEMXLRMB-ULQDDVLXSA-N 0.000 description 1
- QZAFGJNKLMNDEM-DCAQKATOSA-N His-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 QZAFGJNKLMNDEM-DCAQKATOSA-N 0.000 description 1
- ORZGPQXISSXQGW-IHRRRGAJSA-N His-His-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O ORZGPQXISSXQGW-IHRRRGAJSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- HWMQRQIFVGEAPH-XIRDDKMYSA-N Leu-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 HWMQRQIFVGEAPH-XIRDDKMYSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- PXHCFKXNSBJSTQ-KKUMJFAQSA-N Lys-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)O PXHCFKXNSBJSTQ-KKUMJFAQSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- CFOLERIRBUAYAD-HOCLYGCPSA-N Lys-Trp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O CFOLERIRBUAYAD-HOCLYGCPSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- OCRSGGIJBDUXHU-WDSOQIARSA-N Met-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OCRSGGIJBDUXHU-WDSOQIARSA-N 0.000 description 1
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 1
- ZRACLHJYVRBJFC-ULQDDVLXSA-N Met-Lys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZRACLHJYVRBJFC-ULQDDVLXSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- YIGCDRZMZNDENK-UNQGMJICSA-N Met-Thr-Phe Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YIGCDRZMZNDENK-UNQGMJICSA-N 0.000 description 1
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 1
- FAKYXUOUQCRGMO-FDARSICLSA-N Met-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N FAKYXUOUQCRGMO-FDARSICLSA-N 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241001386753 Parvibaculum Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 1
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 1
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- BARPGRUZBKFJMA-SRVKXCTJSA-N Pro-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BARPGRUZBKFJMA-SRVKXCTJSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241001383286 Rochelia Species 0.000 description 1
- 241001256145 Satrapia Species 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- GWMXFEMMBHOKDX-AVGNSLFASA-N Ser-Gln-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GWMXFEMMBHOKDX-AVGNSLFASA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- LPSKHZWBQONOQJ-XIRDDKMYSA-N Ser-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N LPSKHZWBQONOQJ-XIRDDKMYSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 241000949716 Sphaerochaeta Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 108700010646 Thr(3)- soymetide-4 Proteins 0.000 description 1
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- AVYVKJMBNLPWRX-WFBYXXMGSA-N Trp-Ala-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 AVYVKJMBNLPWRX-WFBYXXMGSA-N 0.000 description 1
- JZHJLBPBQKPTNX-UBHSHLNASA-N Trp-Cys-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 JZHJLBPBQKPTNX-UBHSHLNASA-N 0.000 description 1
- SNJAPSVIPKUMCK-NWLDYVSISA-N Trp-Glu-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SNJAPSVIPKUMCK-NWLDYVSISA-N 0.000 description 1
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 1
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- LQGDFDYGDQEMGA-PXDAIIFMSA-N Tyr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N LQGDFDYGDQEMGA-PXDAIIFMSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 1
- SDUBQHUJJWQTEU-XUXIUFHCSA-N Val-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C(C)C)N SDUBQHUJJWQTEU-XUXIUFHCSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- IEBGHUMBJXIXHM-AVGNSLFASA-N Val-Lys-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N IEBGHUMBJXIXHM-AVGNSLFASA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 208000010399 Wasting Syndrome Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000003570 air Substances 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000004081 cilia Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 208000026500 emaciation Diseases 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 208000021760 high fever Diseases 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000012151 immunohistochemical method Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 208000011140 intestinal infectious disease Diseases 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010056787 lysyl-arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000004264 monolayer culture Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000002741 palatine tonsil Anatomy 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010014563 tryptophyl-cysteinyl-serine Proteins 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基于CRISPR技术检测病毒的方法,尤其涉及一种基于CRISPR技术检测病毒或疾病的方法,所述方法包括利用gRNA、Cas蛋白和单链核酸检测器进行检测的步骤;本发明通过对gRNA的筛选和优化,提高了检测效率,具有广阔的应用前景。
Description
技术领域
本发明涉及核酸检测领域,具体地涉及一种基于CRISPR技术检测病毒的方法,尤其涉及基于CRISPR技术检测病毒的方法、系统和试剂盒。
背景技术
古典猪瘟(Classical swine fever),俗称“烂肠瘟”、“猪霍乱”,是由猪瘟病毒(Classical swine fever virus)引起的一种急性、发热、接触性传染传染病,以病畜高热、内脏器官严重出血和高死亡率为特征,但对人类没有直接危害。目前用于诊断猪瘟病毒的检验方法包括:抗原检测的免疫组化方法、抗原捕获ELISA方法、病毒分离、RT-PCR法、检测血清抗体的ELlSA方法等。
猪圆环病毒病(Porcine circovirus disease),是由猪圆环病毒(Porcinecircovirus)引起,以仔猪体质下降、消瘦、腹泻和呼吸困难等为主要症状。因该病主要感染8~10周龄仔猪,又称断奶仔猪多系统衰竭综合征。该病发病率和死亡率不定,呈地方性流行。目前用于诊断猪圆环病毒的检验方法包括:病毒分离与鉴定、间接免疫荧光法(IIF)、免疫过氧化物单层培养法、ELISA方法、聚合酶链式反应(PCR)方法、核酸探针杂交及原位杂交试验(ISH)等方法。
猪流行性腹泻(Porcine epidemic diarrhea)是由猪流行性腹泻病毒(Porcineepidemic diarrhea virus)引起的一种接触性肠道传染病,其特征为呕吐、腹泻、脱水,本病多发生于寒冷季节。目前用于诊断猪流行性腹泻病毒的检验方法包括:病毒分离鉴定、病毒抗原的直接免疫荧光法、双抗体夹心酶联免疫吸附试验(ELISA)、检测抗体的血清中和试验、间接ELISA试验技术等。
本发明提供了一种新型的检测病毒的方法,所述病毒选自:猪瘟病毒、猪圆环病毒或猪流行性腹泻病毒。该方法是基于CRISPR技术,尤其是基于V型Cas酶的trans活性,提供的一种特异性高、检测灵敏度高的检测方法。
发明内容
本发明提供了一种基于CRISPR技术进行病毒检测的方法、系统和试剂盒。
一方面,本发明提供了一种用于检测猪瘟病毒的gRNA,所述gRNA包括与Cas蛋白结合的区域和与靶核酸杂交的导向序列,所述靶核酸为来源于猪瘟病毒的核酸。
在一个实施方式中,所述与靶核酸杂交的导向序列含有20-30个碱基,并且与SEQID No.2所示的序列或其反向互补序列杂交,并且所述导向序列包含SEQ ID No.3-4任一所示的序列;优选的,所述导向序列包含SEQ ID No.3、4任一所示的序列。
在优选的实施方式中,所述与靶核酸杂交的导向序列含有20-30个碱基,例如,20、21、22、23、24、25、26、27、28、29或30个碱基。
在一个实施方式中,所述与靶核酸杂交的导向序列包含SEQ ID No.3-4任一所示的序列,并且在SEQ ID No.3-4任一所示的序列的3’端还包括1-10个碱基(优选,1、2、3、4、5、6、7、8、9个碱基),并且,所述与靶核酸杂交的导向序列与SEQ ID No.2所示的序列或其反向互补序列杂交;优选的,所述导向序列包含SEQ ID No.3、4任一所示的序列。
在一个实施方式中,所述与靶核酸杂交的导向序列与SEQ ID No.3-4任一所示的序列相比,在SEQ ID No.3-4任一所示的序列的3’端连续缺失1-5个碱基(例如,1、2、3、4、5个碱基)。
所述与SEQ ID No.2所示的序列或其反向互补序列杂交,是指上述导向序列与SEQID No.2或SEQ ID No.2的反向互补序列的连续的一段可以连续的互补配对。比如,所述与靶核酸杂交的导向序列含有30个碱基,则,导向序列的30个碱基需要与SEQ ID No.2或其互补序列的连续30个碱基互补配对。
在更优选的实施方式中,所述与靶核酸杂交的导向序列如SEQ ID No.3-4任一所示。
另一方面,本发明提供了一种用于检测猪圆环病毒的gRNA,所述gRNA包括与Cas蛋白结合的区域和与靶核酸杂交的导向序列,所述靶核酸为来源于猪圆环病毒的核酸。
在一个实施方式中,所述与靶核酸杂交的导向序列含有20-30个碱基,并且与SEQID No.5所示的序列或其反向互补序列杂交,并且所述导向序列包含SEQ ID No.6-10任一所示的序列;优选的,所述导向序列包含SEQ ID No.6、7、8、9、10任一所示的序列。
在优选的实施方式中,所述与靶核酸杂交的导向序列含有20-30个碱基,例如,20、21、22、23、24、25、26、27、28、29或30个碱基。
在一个实施方式中,所述与靶核酸杂交的导向序列包含SEQ ID No.6-10任一所示的序列,并且在SEQ ID No.0-10任一所示的序列的3’端还包括1-10个碱基(优选,1、2、3、4、5、6、7、8、9个碱基),并且,所述与靶核酸杂交的导向序列与SEQ ID No.5所示的序列或其反向互补序列杂交;优选的,所述导向序列包含SEQ ID No.6、7、8、9、10任一所示的序列。
在一个实施方式中,所述与靶核酸杂交的导向序列与SEQ ID No.6-10任一所示的序列相比,在SEQ ID No.6-10任一所示的序列的3’端连续缺失1-5个碱基(例如,1、2、3、4、5个碱基)。
所述与SEQ ID No.5所示的序列或其反向互补序列杂交,是指上述导向序列与SEQID No.5或SEQ ID No.5的反向互补序列的连续的一段可以连续的互补配对。比如,所述与靶核酸杂交的导向序列含有30个碱基,则,导向序列的30个碱基需要与SEQ ID No.5或其互补序列的连续30个碱基互补配对。
在更优选的实施方式中,所述与靶核酸杂交的导向序列如SEQ ID No.6-10任一所示。
另一方面,本发明提供了一种用于检测猪流行性腹泻病毒的gRNA,所述gRNA包括与Cas蛋白结合的区域和与靶核酸杂交的导向序列,所述靶核酸为来源于猪流行性腹泻病毒的核酸。
在一个实施方式中,所述与靶核酸杂交的导向序列含有20-30个碱基,并且与SEQID No.11所示的序列或其反向互补序列杂交,并且所述导向序列包含SEQ ID No.12-13任一所示的序列;优选的,所述导向序列包含SEQ ID No.12、13任一所示的序列。
在优选的实施方式中,所述与靶核酸杂交的导向序列含有20-30个碱基,例如,20、21、22、23、24、25、26、27、28、29或30个碱基。
在一个实施方式中,所述与靶核酸杂交的导向序列包含SEQ ID No.12-13任一所示的序列,并且在SEQ ID No.12-13任一所示的序列的3’端还包括1-10个碱基(优选,1、2、3、4、5、6、7、8、9个碱基),并且,所述与靶核酸杂交的导向序列与SEQ ID No.11所示的序列或其反向互补序列杂交;优选的,所述导向序列包含SEQ ID No.12、13任一所示的序列。
在一个实施方式中,所述与靶核酸杂交的导向序列与SEQ ID No.12-13任一所示的序列相比,在SEQ ID No.12-13任一所示的序列的3’端连续缺失1-5个碱基(例如,1、2、3、4、5个碱基)。
所述与SEQ ID No.11所示的序列或其反向互补序列杂交,是指上述导向序列与SEQ ID No.11或SEQ ID No.11的反向互补序列的连续的一段可以连续的互补配对。比如,所述与靶核酸杂交的导向序列含有30个碱基,则,导向序列的30个碱基需要与SEQ IDNo.11或其互补序列的连续30个碱基互补配对。
在更优选的实施方式中,所述与靶核酸杂交的导向序列如SEQ ID No.12-13任一所示。
本发明中,所述与CRISPR/CAS效应蛋白结合的区域又称为同向重复序列、骨架区或spacer序列,该区域与Cas蛋白相互作用,从而结合Cas蛋白。
在一个实施方式中,所述gRNA自5’端至3’端依次包括与Cas蛋白结合的区域和与靶核酸杂交的导向序列。
在一个实施方式中,所述Cas蛋白选自V型Cas蛋白,例如,Cas12、Cas14家族蛋白或其突变体。
在一个实施方式中,所述Cas蛋白优选为Cas12家族,包括但不限于Cas12a、Cas12b、Cas12d、Cas12e、Cas12f、Cas12g、Cas12h、Cas12i、Cas12j中的一种或任意几种。
优选的,所述与Cas蛋白结合的区域的序列如SEQ ID No.14所示。
另一方面,本发明提供了一种检测/诊断病毒的组合物,所述组合物包括上述gRNA,还包括Cas蛋白以及单链核酸检测器,所述病毒选自:猪瘟病毒、猪圆环病毒或猪流行性腹泻病毒。
另一方面,本发明提供了一种检测/诊断猪瘟病毒或者古典猪瘟的方法,所述方法包括将待测核酸与V型Cas蛋白、上述检测猪瘟病毒的gRNA和单链核酸检测器接触;检测由Cas蛋白切割单链核酸检测器产生的可检测信号,从而检测猪瘟病毒或者古典猪瘟。
另一方面,本发明提供了一种检测/诊断猪圆环病毒或者猪圆环病毒病的方法,所述方法包括将待测核酸与V型Cas蛋白、上述检测猪圆环病毒的gRNA和单链核酸检测器接触;检测由Cas蛋白切割单链核酸检测器产生的可检测信号,从而检测猪圆环病毒或者猪圆环病毒病。
另一方面,本发明提供了一种检测/诊断猪流行性腹泻病毒或者猪流行性腹泻的方法,所述方法包括将待测核酸与V型Cas蛋白、上述检测猪流行性腹泻病毒的gRNA和单链核酸检测器接触;检测由Cas蛋白切割单链核酸检测器产生的可检测信号,从而检测猪流行性腹泻病毒或者猪流行性腹泻。
进一步的,所述方法还包括从待测样品中获得待测核酸的步骤;优选的,采用扩增的方法从待测样品中获得待测核酸。
本发明中,所述待测核酸可以是双链核酸,也可以是单链核酸。
本发明所述扩增选自PCR、基于核酸测序的扩增(NASBA)、重组酶聚合酶扩增(RPA)、环介导的等温扩增(LAMP)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、或切口酶扩增反应(NEAR)、多重置换扩增(MDA)、滚环扩增(RCA)、连接酶链反应(LCR)、或衍生物扩增方法(RAM)中的一种或任意几种。
本发明中,所述样品可以为来自动物的样品,例如,猪、牛、羊;其他的实施方式中,所述样品还可以来自其他动物,例如,马、驴。
在一个实施方式中,所述样品可以为细胞培养物、排泄物、分泌物、脏器、尸体、血液、肉、扁桃体组织、淋巴结等。
在其他的实施方式中,所述样品还可以来源于养殖场的环境样品,例如,空气、水体、土壤、饲料、养殖场的设备等。
另一方面,本发明还提供了一种用于检测或诊断待测动物是否感染疾病的系统、组合物或试剂盒,所述疾病选自:古典猪瘟、猪圆环病毒病或猪流行性腹泻,所述系统、组合物或试剂盒包括V型Cas蛋白、单链核酸检测器、以及上述检测猪瘟病毒的gRNA或上述检测猪圆环病毒的gRNA或上述检测猪流行性腹泻病毒的gRNA。进一步的,所述系统、组合物或试剂盒还包括扩增引物。
在一个实施方式中,所述疾病为古典猪瘟,所述gRNA为上述检测猪瘟病毒的gRNA。
在另一个实施方式中,所述疾病为猪圆环病毒病,所述gRNA为上述检测猪圆环病毒的gRNA。
在另一个实施方式中,所述疾病为猪流行性腹泻,所述gRNA为上述检测猪流行性腹泻病毒的gRNA。
另一方面,本发明还提供了上述用于检测或诊断待测动物是否感染疾病的组合物在诊断或检测疾病中的用途,或者在用于制备诊断或检测疾病的试剂或试剂盒中的用途,所述疾病选自:古典猪瘟、猪圆环病毒病或猪流行性腹泻。
另一方面,本发明还提供了一种用于检测/诊断病毒的系统、组合物或试剂盒,所述系统、组合物或试剂盒包括V型Cas蛋白、上述gRNA(指导RNA)和单链核酸检测器,所述病毒选自:猪瘟病毒、猪圆环病毒或猪流行性腹泻病毒。
在一个实施方式中,所述病毒为猪瘟病毒,所述gRNA为上述检测猪瘟病毒的gRNA。
在另一个实施方式中,所述病毒为猪圆环病毒,所述gRNA为上述检测猪圆环病毒的gRNA。
在另一个实施方式中,所述病毒为猪流行性腹泻病毒,所述gRNA为上述检测猪流行性腹泻病毒的gRNA。
另一方面,本发明还提供了上述系统、组合物或试剂盒在检测/诊断病毒中的应用,所述病毒选自:猪瘟病毒、猪圆环病毒或猪流行性腹泻病毒。
另一方面,本发明还提供了上述组合物在制备检测/诊断病毒的试剂或试剂盒中的用途,所述病毒选自:猪瘟病毒、猪圆环病毒或猪流行性腹泻病毒。
进一步的,所述V型Cas蛋白选自Cas12、Cas14家族蛋白或其突变体。
在一个实施方式中,所述Cas蛋白优选为Cas12家族,包括但不限于Cas12a、Cas12b、Cas12d、Cas12e、Cas12f、Cas12g、Cas12h、Cas12i、Cas12j中的一种或任意几种。
在一个实施方式中,所述Cas12a选自FnCas12a、AsCas12a、LbCas12a、Lb5Cas12a、HkCas12a、OsCas12a、TsCas12a、BbCas12a、BoCas12a或Lb4Cas12a中一种或任意几种。
在优选的实施方式中,所述Cas12i蛋白的氨基酸序列选自下组:
(1)SEQ ID NO:1所示的蛋白;
(2)将SEQ ID NO:1所示氨基酸序或其活性片段经过一个或多个(如2个、3个、4个,5个,6个,7个,8个,9个或10个)氨基酸残基的取代、缺失或添加而形成的,且具有基本相同功能的衍生蛋白;
(3)与SEQ ID NO:1具有至少50%,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或至少99%的序列同一性的,且具有trans活性的蛋白。
在一个实施方式中,所述Cas蛋白突变体包括氨基酸取代、缺失或替换,且所述突变体至少保留其trans切割活性。优选地,所述突变体具有Cis和trans切割活性。
本发明中,所述单链核酸检测器包括单链DNA、单链RNA或者单链DNA-RNA杂交体。在其他的实施方式中,所述单链核酸检测器包括单链DNA、单链RNA或者单链DNA-RNA杂交体的任意两种或三种的混合物,例如,单链DNA和单链RNA的组合物、单链DNA和单链DNA-RNA杂交体的组合物、单链RNA和单链DNA-RNA的组合物。在其他的实施方式中,所述单链核酸检测器还包括对碱基的修饰。
在优选的实施方式中,所述单链核酸检测器为单链寡核酸检测器。
所述单链核酸检测器不与所述gRNA杂交。
本发明中,所述可检测信号通过以下方式实现:基于视觉的检测,基于传感器的检测,颜色检测,基于金纳米颗粒的检测,荧光偏振,荧光信号,胶体相变/分散,电化学检测和基于半导体的检测。
在一些实施方式中,本发明的方法还包括测量CRISPR/CAS效应蛋白(Cas蛋白)产生的可检测信号的步骤。所述Cas蛋白识别所述靶核酸或与所述靶核酸杂交之后可以激发任意单链核酸的切割活性,从而切割所述单链核酸检测器进而产生可检测信号。
本发明中,所述可检测信号可以是当切割单链核酸检测器时产生的任何信号。例如,基于金纳米颗粒的检测,荧光偏振,荧光信号,胶体相变/分散,电化学检测,基于半导体的传感。所述可检测信号可通过任何合适的方式读出,包括但不限于:可检测的荧光信号的测量,凝胶电泳检测(通过检测凝胶上的条带的变化),基于视觉或传感器的颜色的存在或不存在的检测、或者颜色存在的差异(例如,基于金纳米颗粒)以及电信号的差异。
在优选的实施方式中,所述可检测信号通过以下方式实现:所述单链核酸检测器的5’端和3’端分别设置不同的报告基团,当所述单链核酸检测器被切割后,可以表现出可检测的报告信号;例如,单链核酸检测器的两端分别设置荧光基团和淬灭基团,当所述单链核酸检测器被切割后,可以表现出可检测的荧光信号。
在一个实施方式中,所述荧光基团选自FAM、FITC、VIC、JOE、TET、CY3、CY5、ROX、Texas Red或LC RED460中的一种或任意几种;所述淬灭基团选自BHQ1、BHQ2、BHQ3、Dabcy1或Tamra中的一种或任意几种。
在其他的实施方式中,所述可检测信号还可以通过以下方式实现:所述单链核酸检测器的5’端和3’端分别设置不同的标记分子,通过胶体金检测的方式检测反应信号。
在一些实施方式中,所述可检测信号的测量可以是定量的,在其他的实施方式中,所述可检测信号的测量可以是定性的。
优选的,所述单链核酸检测器在被所述Cas蛋白切割之前产生第一可检测信号,并且在被切割之后产生不同于第一可检测信号的第二可检测信号。
在其他的实施方式中,单链核酸检测器包括一个或多个的修饰,例如碱基修饰,骨架修饰,糖修饰等,以向核酸提供新的或增强的特征(例如改进的稳定性)。合适修饰的例子包括修饰的核酸骨架和非天然核苷间连接,具有修饰主链的核酸包括那些在主链中保留磷原子的核酸和那些在主链中不具有磷原子的核酸。合适的其中含有磷原子的修饰的寡核苷酸骨架包括硫代磷酸酯,手性硫代磷酸酯,二硫代磷酸酯,磷酸三酯,氨基烷基磷酸三酯,甲基和其它烷基膦酸酯。在一些实施方式中,单链核酸检测器包含一个或多个硫代磷酸酯和/或杂原子核苷键。在其他的实施方式中,所述单链核酸检测器可以是核酸模拟物;在某些实施方式中,所述核酸模拟物为肽核酸(PNA),另一类核酸模拟物是基于具有连接到吗啉环上的杂环碱基的连接吗啉基单元(吗啉基核酸),其他的核酸模拟物还包括环己烯基核酸(CENA),还包括核糖或者脱氧核糖链。
在一个实施方式中,所述Cas蛋白与gRNA的用量摩尔比为(0.8-1.2):1。
在一个实施方式中,所述Cas蛋白的用量终浓度为20-200nM,优选,30-100nM,更优选,40-80nM,更优选,50nM。
在一个实施方式中,所述gRNA的用量终浓度为20-200nM,优选,30-100nM,更优选,40-80nM,更优选,50nM。
在一个实施方式中,所述待测核酸的用量终浓度为5-100nM,优选,10-50nM。
在一个实施方式中,所述单链核酸检测器的用量终浓度为100-1000nM,优选,150-800nM,优选,200-800nM,优选,200-500nM,优选,200-300nM。
在一个实施方式中,所述单链核酸检测器具有2-300个核苷酸,优选,3-200个核苷酸,优选,3-100个核苷酸,优选,具有3-30个核苷酸,优选,4-20个核苷酸,更优选,5-15个核苷酸。
术语“杂交”或“互补的”或“基本上互补的”是指核酸(例如RNA、DNA)包含使其能够非共价结合的核苷酸序列,即以序列特异性,反平行的方式(即核酸特异性结合互补核酸)与另一核酸形成碱基对和/或G/U碱基对,“退火”或“杂交”。杂交需要两个核酸含有互补序列,尽管碱基之间可能存在错配。两个核酸之间杂交的合适条件取决于核酸的长度和互补程度,这是本领域公知的变量。典型地,可杂交核酸的长度为8个核苷酸或更多(例如,10个核苷酸或更多,12个核苷酸或更多,15个核苷酸或更多,20个核苷酸或更多,22个核苷酸或更多,25个核苷酸或更多,或30个核苷酸或更多)。
应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补以特异性杂交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高,98%或更高,99%或更高,99.5%或更高,或与其杂交的靶核酸序列中的靶区域的序列互补性为100%。
一般定义:
除非另有定义,否则本文所用的技术和科学术语具有与所属领域的普通技术人员之一通常理解的相同的含义。
术语“氨基酸”是指含有氨基的羧酸。生物体内的各种蛋白质是由20种基本氨基酸构成的。
术语“多核苷酸”、“核苷酸序列”、“核酸序列”、“核酸分子”和“核酸”可以互换使用,包括DNA、RNA或者其杂交体,可以是双链或单链的。
术语“寡核苷酸”是指含有3-100个核苷酸的序列,优选,具有3-30个核苷酸,优选,4-20个核苷酸,更优选,5-15个核苷酸。
术语“同源性”或“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,氨基酸序列的同一性可以通过常规方法,参考例如Smith and Waterman,1981,Adv.Appl.Math.2:482Pearson&Lipman,1988,Proc.Natl Acad.Sci.USA 85:2444,Thompson etal.,1994,Nucleic AcidsRes 22:467380等的教导,通过计算机化运行运算法则(Wisconsin Genetics软件包中的GAP,BESTFIT,FASTA,和TFASTA,Genetics Computer Group)来确定。也可使用可从美国国立生物技术信息中心(NCBI www.ncbi.nlm.nih.gov/)获得的BLAST运算法则,使用默认参数确定。
如本文所用,所述“CRISPR”是指成簇、规律间隔的短回文重复序列(Clusteredregularly interspaced short palindromic repeats),其来自微生物的免疫系统。
如本文所用,“生物素(biotin)”也称维生素H,是一种分子量为244Da的小分子维生素。“亲和素(avidin)”,又称抗生物素,是一种碱性糖蛋白,具有4个同生物素亲和力极高的结合位点,常用亲和素有链霉亲合素。生物素与亲和素的极强亲和力可用于在检测体系中放大或增强检测信号。如生物素很易与蛋白质(如抗体等)以共价键结合,而结合了酶的亲和素分子与结合有特异性抗体的生物素分子产生反应,既起到了多级放大作用,又由于酶在遇到相应底物时的催化作用而呈色,达到检测未知抗原(或抗体)分子的目的。
Cas蛋白
本文所述“Cas蛋白”是指CRISPR-associated蛋白,优选来自V型或VI型CRISPR/CAS蛋白,其一旦与待检测特征序列(靶序列)结合(即形成Cas蛋白-gRNA-靶序列的三元复合物),就可以诱发其trans活性,即随机切割非靶向单链核苷酸(即本文所述单链核酸检测器,优选单链DNA(ssDNA)、单链DNA-RNA杂交体、单链RNA)。当Cas蛋白与特征序列结合后,其切割或不切割特征序列,均可以诱发其trans活性;优选地,其通过切割特征序列诱发其trans活性;更优选地,其通过切割单链特征序列诱发其trans活性。
本发明所述的Cas蛋白为至少具有trans切割活性的蛋白,优选地,所述的Cas蛋白为具有Cis和trans切割活性的蛋白。所述的Cis活性是指Cas蛋白可在gRNA的作用下识别PAM位点并特异性切割靶序列的活性。
本发明所述的Cas蛋白包括V型CRISPR/CAS效应蛋白,包括Cas12、Cas14等蛋白家族。优选地,例如Cas12蛋白,例如Cas12a、Cas1 2b、Cas12d、Cas12e、Cas12f、Cas12g、Cas12h、Cas12i、Cas12j;优选地,所述Cas蛋白为Cas12a、Cas12b、Cas12i、Cas12j。
在实施方式中,本文所称的Cas蛋白,如Cas12,也涵盖Cas的功能变体或其同源物或直系同源物。如本文所用的蛋白的“功能变体”是指至少部分保留该蛋白的活性的这样的蛋白的变体。功能变体可以包括突变体(其可以是插入、缺失或替换突变体),包括多晶型物等。功能变体中还包括这样的蛋白与另一种通常不相关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人造的。有利的实施方式可以涉及工程化或非天然存在的V型DNA靶向效应蛋白。
在一个实施方式中,编码Cas蛋白,如Cas12,的一种或多种核酸分子或其直系同源物或同源物可以被密码子优化用于在真核细胞中表达。真核生物可如本文所述。一种或多种核酸分子可以是工程化的或非天然存在的。
在一个实施方式中,Cas12蛋白或其直系同源物或同源物可以包含一个或多个突变(并且因此编码其的核酸分子可以具有一个或多个突变。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。
在一个实施方式中,Cas蛋白可以来自:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真细菌属、链球菌属、乳酸菌属、支原体属、拟杆菌属、Flaviivola、黄杆菌属、固氮螺菌属、Sphaerochaeta、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、Parvibaculum、葡萄球菌属、Nitratifractor、支原体属、弯曲杆菌属和毛螺菌属。
所述的Cas蛋白可以通过重组表达载体技术获得,即将编码该蛋白的核酸分子构建到合适的载体上,再转化到宿主细胞中,使得所述的编码核酸分子在细胞中表达,从而获得相应的蛋白。所述的蛋白可以被细胞分泌出来,或者破解细胞通过常规的提取技术获得该蛋白。所述的编码核酸分子可以整合至宿主细胞的基因组中进行表达,也可以不整合到宿主细胞中进行表达。所述的载体还进一步包括有利于序列整合,或进行自我复制的调节元件。所述的载体可以是质粒、病毒、粘粒、噬菌体等类型,它们是本领域技术人员所熟知的,优选地,本发明中的表达载体是质粒。所述的载体进一步包括一种或多种调控元件,选自启动子、增强子、翻译起始的核糖体结合位点、终止子、多聚腺苷酸序列、筛选标记基因。
宿主细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞。本领域一般技术人员都清楚如何选择适当的载体和宿主细胞。
gRNA
如本文所用,所述的“gRNA”又称为guide RNA或导向RNA,并且具有本领域技术人员通常理解的含义。一般而言,导向RNA可以包含同向(direct)重复序列和导向序列(guidesequence),或者基本上由或由同向重复序列和导向序列(在内源性CRISPR系统背景下也称为间隔序列(spacer))组成。gRNA在不同的CRISPR系统中,依据其所依赖的Cas蛋白的不同,可以包括crRNA和tracrRNA,也可以只含有crRNA。crRNA和tracrRNA可以经过人工改造融合形成single guide RNA(sgRNA)。在某些情况下,导向序列是与靶序列(本发明中所述特征序列)具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列,通常具有12-25nt的序列长度。所述的同向重复序列可折叠形成特定结构(如茎环结构)供Cas蛋白识别,以形成复合物。所述的导向序列不需要与特征序列(靶序列)100%互补。所述的导向序列不与单链核酸检测器互补。
在某些实施方案中,当最佳比对时,导向序列与其相应靶序列之间的互补程度(匹配度)为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。
本发明所述的gRNA可以是天然的,也可以是经过人工改造或设计合成的。
单链核酸检测器
本发明所述的单链核酸检测器是指含有2-200个核苷酸的序列,优选,具有2-150个核苷酸,优选,3-100个核苷酸,优选,3-30个核苷酸,优选,4-20个核苷酸,更优选,5-15个核苷酸。优选为单链DNA分子、单链RNA分子或单链DNA-RNA杂交体。
所述的单链核酸检测器在检测方法或系统中用以报告样品中是否存在靶核酸。所述的单链核酸检测器两端包括不同的报告基团或标记分子,当其处于初始状态(即未被切割状态时)不呈现报告信号,当该单链核酸检测器被切割后,呈现出可检测的信号,即切割后与切割前表现出可检测的区别。在本发明中,如果能够检测出可检测的区别,则反映能够检测出靶核酸;或者,如果无法检检测出所述的可检测的区别,则反映无法检测出靶核酸。
在一个实施方式中,所述的报告基团或标记分子包括荧光基团和淬灭基团,所述荧光基团选自FAM、FITC、VIC、JOE、TET、CY3、CY5、ROX、Texas Red或LC RED460中的一种或任意几种;所述淬灭基团选自BHQ1、BHQ2、BHQ3、Dabcy1或Tamra中的一种或任意几种。
在其他的实施方式中,所述的单链核酸检测器具有连接至一端第一分子(如FAM或FITC)和连接至另一端的第二分子(如生物素)。所述的含有单链核酸检测器的反应体系与流动条配合用以检测靶核酸(优选,胶体金检测方式)。所述的流动条被设计为具有两条捕获线,在样品接触端(胶体金)设有结合第一分子的抗体(即第一分子抗体),在第一线(control line)处含有结合第一分子抗体的抗体,在第二线(test line)处含有与第二分子结合的第二分子的抗体(即第二分子抗体,如亲和素)。当反应沿着条带流动时,第一分子抗体与第一分子结合携带切割或未切割的寡核苷酸至捕获线,切割的报告子将在第一个捕获线处结合第一分子抗体的抗体,而未切割的报告子将在第二捕获线处结合第二分子抗体。报告基团在各条线的结合将导致强读出/信号(例如颜色)。随着更多的报告子被切割,更多的信号将在第一捕获线处累积,并且在第二线处将出现更少的信号。在某些方面,本发明涉及如本文所述的流动条用于检测核酸的用途。在某些方面,本发明涉及用本文定义的流动条检测核酸的方法,例如(侧)流测试或(侧)流免疫色谱测定。在某些方面,所述单链核酸检测器中的分子可相互替换,或改变分子的位置,只要其报告原理与本发明相同或相近,所改进的方式也均包含在本发明中。
本发明所述的检测方法,可用于靶核酸的定量检测。所述的定量检测指标可以根据报告基团的信号强弱进行定量,如根据荧光基团的发光强度,或根据显色条带的宽度等。
序列信息
本发明涉及的部分序列信息提供如下:
序号 | 描述 |
SEQ ID NO:1 | Cas12i |
SEQ ID NO:2 | CSFV扩增产物 |
SEQ ID NO:3 | gRNA-1的靶向区 |
SEQ ID NO:4 | gRNA-2的靶向区 |
SEQ ID NO:5 | PCV扩增产物 |
SEQ ID NO:6 | gRNA-3的靶向区 |
SEQ ID NO:7 | gRNA-4的靶向区 |
SEQ ID NO:8 | gRNA-5的靶向区 |
SEQ ID NO:9 | gRNA-6的靶向区 |
SEQ ID NO:10 | gRNA-7的靶向区 |
SEQ ID NO:11 | PEDV扩增产物 |
SEQ ID NO:12 | gRNA-8的靶向区 |
SEQ ID NO:13 | gRNA-9的靶向区 |
SEQ ID NO:14 | gRNA的DR区 |
附图说明
图1.不同gRNA(gRNA-1、gRNA-2)检测来源于CSFV的ssDNA时的检测结果图;其中,线条1为实验组;gRNA-1、gRNA-2与ssDNA靶核酸进行反应时荧光信号达到峰值(达到平台期)的时间分别在6min和4min左右。
图2.不同gRNA(gRNA-1、gRNA-2)检测来源于CSFV的dsDNA靶核酸时的检测结果图。其中,线条1为实验组,线条2为不添加靶核酸的对照组;gRNA-1、gRNA-2与dsDNA靶核酸进行反应时荧光信号达到峰值(达到平台期)的时间分别在30min和20min左右。
图3.不同gRNA(gRNA-3、gRNA-4、gRNA-5、gRNA-6、gRNA-7)检测来源于PCV的ssDNA时的检测结果图;其中,线条1为实验组;gRNA-3、gRNA-4、gRNA-5、gRNA-6、gRNA-7与ssDNA靶核酸进行反应时荧光信号达到峰值(达到平台期)的时间分别在17min、6min、8min、6.5min和26min左右。
图4.不同gRNA(gRNA-4、gRNA-5、gRNA-6)检测来源于PCV的dsDNA靶核酸时的检测结果图。其中,线条1为实验组,线条2为不添加靶核酸的对照组;gRNA-4、gRNA-5、gRNA-6与dsDNA靶核酸进行反应时荧光信号达到峰值(达到平台期)的时间分别在13min、27min和23min左右。
图5.不同gRNA(gRNA-8、gRNA-9)检测来源于PEDV的ssDNA时的检测结果图;其中,线条1为实验组;gRNA-8、gRNA-9与ssDNA靶核酸进行反应时荧光信号达到峰值(达到平台期)的时间分别在7min和8min左右。
图6.不同gRNA(gRNA-8、gRNA-9)检测来源于PEDV的dsDNA靶核酸时的检测结果图。其中,线条1为实验组,线条2为不添加靶核酸的对照组;gRNA-8、gRNA-9与dsDNA靶核酸进行反应时荧光信号达到峰值(达到平台期)的时间分别在20min和30min左右。
具体实施方式
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
本发明技术方案基于如下原理,将PCR扩增与CRISPR技术相结合,具有快速、灵敏、特异、高效的特点。在样本中存在目标病原菌的特异核酸的前提下,特异性引物与靶标序列结合,通过PCR扩增富集目标序列,Cas酶(Cas蛋白)在gRNA引导下与扩增产物结合,激活Cas蛋白反式剪切(trans)活性,剪切体系中的Reporter(Reporter一端连接荧光基团,一端连接淬灭基团),Reporter被Cas蛋白剪切后会释放荧光,以呈现检测结果。在其他的实施方式中,单链核酸检测器(Reporter)的两端还可以设置成能够被胶体金检测的标记。
实施例1、猪瘟病毒特异核酸的扩增和gRNA的设计
本实施方式中,针对猪瘟病毒(CSFV)Classical swine fever virus的特异性核酸进行引物的设计和靶核酸的扩增。
根据CSFV的基因组序列,设计扩增引物如下:
CSFV-5UTR-F1:TACAGGACAGTCGTCAGTAGTTCG;
CSFV-5UTR-R1:CCGCTAGGGTTAAGGTGTGTCT;
扩增得到的靶序列如下:
tacaggacagtcgtcagtagttcgacgtgagcaggagcccacctcgagatgctatgtggacgagggcatgcccaagacacaccttaaccctggcgg(SEQ ID No.2)。
针对上述靶序列,在区段内部或其互补序列内部设计了2条gRNA,本实施方式是基于Cas12i(SEQ ID No.1)设计的能够结合Cas12i的gRNA,每条gRNA5’端的前3个碱基均为TTN(PAM序列)。
所设计的gRNA的序列如下:
实施例2、gRNA在进行猪瘟病毒特异核酸检测时的应用
为了验证实施例1设计的不同的gRNA与Cas12i蛋白应用时的检测效率,本实施方式对不同gRNA的活性进行了验证。
首先采用单链的靶序列(ssDNA,SEQ ID No.2)或者其反向互补序列作为靶核酸,ssDNA为对应的gRNA所靶向的ssDNA。
单链核酸检测器序列为FAM-TTATT-BHQ1;
采用如下反应体系:Cas12i终浓度为25nM,gRNA终浓度为25nM,靶核酸终浓度为25nM,单链核酸检测器终浓度200nM。37℃孵育,读取FAM荧光/20s。对照组不添加靶核酸。
图1示出了利用gRNA-1、gRNA-2与ssDNA的靶核酸进行反应时的结果。其中,与对照组相比,gRNA-1和gRNA-2均能快速的报告出荧光,并且,荧光信号的峰值会在6min之内出,反映出其在进行猪瘟病毒特异核酸检测时的较好的灵敏度。图1中,1为实验组。
针对检测单链靶序列的gRNA-1和gRNA-2,进一步验证了其在检测双链靶序列(dsDNA)时的效率。
采用双链的靶序列(dsDNA,SEQ ID No.2)作为双链靶核酸。
双链靶核酸采用PCR反应获得,其中,PCR扩增体系如下:
其中,模板采用含目标核酸片段的质粒,PCR反应模板添加量为100个拷贝,PCR扩增45个循环,最后取2μl的PCR扩增产物作为双链靶核酸进行检测。
单链核酸检测器序列为FAM-TTATT-BHQ1;
采用如下检测体系:Cas12i终浓度为50nM,gRNA终浓度为50nM,靶核酸(上述PCR扩增得到的双链DNA)2μl,单链核酸检测器终浓度200nM。37℃孵育,读取FAM荧光/20s。对照组不添加靶核酸。
图2示出了gRNA-1和gRNA-2在与dsDNA的靶核酸进行反应时的结果;与对照组相比,gRNA-1和gRNA-2均能在较短的时间内表现出显著的荧光信号,反映出其具有较好的检测dsDNA的灵敏度;尤其是gRNA-2,在20min左右就可以达到荧光信号的峰值。图2中,1为实验组,2为对照组。
实施例3、猪圆环病毒特异核酸的扩增和gRNA的设计
本实施方式中,针对猪圆环病毒(PCV)Porcine circovirus的特异性核酸进行引物的设计和靶核酸的扩增。
根据PCV的基因组序列,设计扩增引物如下:
PCV-ORF1-F1:GGAGTCTGGTGACCGTTGC;
PCV-ORF1-R1:CCAATCACGCTTCTGCATTTT;
扩增得到的靶序列如下:
ggagtctggtgaccgttgcagagcagcaccctgtaacgtttgtcagaaatttccgcgggctggctgaacttttgaaagtgagcgggaaaatgcagaagcgtgattgg(SEQ ID No.5)。
针对上述靶序列,在区段内部或其互补序列内部设计了5条gRNA,本实施方式是基于Cas12i(SEQ ID No.1)设计的能够结合Cas12i的gRNA,每条gRNA5’端的前3个碱基均为TTN(PAM序列)。
所设计的gRNA的序列如下:
实施例4、gRNA在进行猪圆环病毒特异核酸检测时的应用
为了验证实施例3设计的不同的gRNA与Cas12i蛋白应用时的检测效率,本实施方式对不同gRNA的活性进行了验证。
首先采用单链的靶序列(ssDNA,SEQ ID No.5)或者其反向互补序列作为靶核酸,ssDNA为对应的gRNA所靶向的ssDNA。
单链核酸检测器序列为FAM-TTATT-BHQ1;
采用如下反应体系:Cas12i终浓度为25nM,gRNA终浓度为25nM,靶核酸终浓度为25nM,单链核酸检测器终浓度200nM。37℃孵育,读取FAM荧光/20s。对照组不添加靶核酸。
图3示出了利用gRNA-3、gRNA-4、gRNA-5、gRNA-6、gRNA-7与ssDNA的靶核酸进行反应时的结果。其中,与对照组相比,gRNA-3、gRNA-4、gRNA-5、gRNA-6和gRNA-7均能快速的报告出荧光,并且,荧光信号的峰值会在26min之内出,反映出其在进行猪圆环病毒特异核酸检测时的较好的灵敏度;尤其是gRNA-4、gRNA-5和gRNA-6,在8min之内都可以达到荧光信号的峰值。图3中,1为实验组。
针对检测单链靶序列效果较好的gRNA-4、gRNA-5和gRNA-6,进一步验证了其在检测双链靶序列(dsDNA)时的效率。
采用双链的靶序列(dsDNA,SEQ ID No.5)作为双链靶核酸。
双链靶核酸采用PCR反应获得,其中,PCR扩增体系如下:
其中,模板采用含目标核酸片段的质粒,PCR反应模板添加量为10个拷贝,PCR扩增45个循环,最后取2μl的PCR扩增产物作为双链靶核酸进行检测。
单链核酸检测器序列为FAM-TTATT-BHQ1;
采用如下检测体系:Cas12i终浓度为50nM,gRNA终浓度为50nM,靶核酸(上述PCR扩增得到的双链DNA)2μl,单链核酸检测器终浓度200nM。37℃孵育,读取FAM荧光/20s。对照组不添加靶核酸。
图4示出了gRNA-4、gRNA-5和gRNA-6在与dsDNA的靶核酸进行反应时的结果;与对照组相比,gRNA-4、gRNA-5和gRNA-6均能在较短的时间内表现出显著的荧光信号,反映出其具有较好的检测dsDNA的灵敏度;尤其是gRNA-4,在13min左右就可以达到荧光信号的峰值。图4中,1为实验组,2为对照组。
实施例5、猪流行性腹泻病毒特异核酸的扩增和gRNA的设计
本实施方式中,针对猪流行性腹泻病毒(PEDV)Porcine epidemic diarrheavirus的特异性核酸进行引物的设计和靶核酸的扩增。
根据PEDV的基因组序列,设计扩增引物如下:
PEDV-M-F1:AACGCTAACACTCCTTAG;
PEDV-M-R1:GAAGCATTGACTGAACGAC;
扩增得到的靶序列如下:
aacgctaacactccttagtggtacattgcttgtagagggctataaggttgctactggcgtacaggtaagtcaattacctaatttcgtcacagtcgccaaggccactacaacaattgtctatggacgtgttggtcgttcagtcaatgcttc(SEQ ID No.11)。
针对上述靶序列,在区段内部或其互补序列内部设计了2条gRNA,本实施方式是基于Cas12i(SEQ ID No.1)设计的能够结合Cas12i的gRNA,每条gRNA5’端的前3个碱基均为TTN(PAM序列)。
所设计的gRNA的序列如下:
实施例6、gRNA在进行猪流行性腹泻病毒特异核酸检测时的应用
为了验证实施例5设计的不同的gRNA与Cas12i蛋白应用时的检测效率,本实施方式对不同gRNA的活性进行了验证。
首先采用单链的靶序列(ssDNA,SEQ ID No.11)或者其反向互补序列作为靶核酸,ssDNA为对应的gRNA所靶向的ssDNA。
单链核酸检测器序列为FAM-TTATT-BHQ1;
采用如下反应体系:Cas12i终浓度为25nM,gRNA终浓度为25nM,靶核酸终浓度为25nM,单链核酸检测器终浓度200nM。37℃孵育,读取FAM荧光/20s。对照组不添加靶核酸。
图5示出了利用gRNA-8、gRNA-9与ssDNA的靶核酸进行反应时的结果。其中,与对照组相比,gRNA-8和gRNA-9均能快速的报告出荧光,并且,荧光信号的峰值会在8min之内出,反映出其在进行猪瘟病毒特异核酸检测时的较好的灵敏度。图5中,1为实验组。
针对检测单链靶序列的gRNA-8和gRNA-9,进一步验证了其在检测双链靶序列(dsDNA)时的效率。
采用双链的靶序列(dsDNA,SEQ ID No.11)作为双链靶核酸。
双链靶核酸采用PCR反应获得,其中,PCR扩增体系如下:
其中,模板采用含目标核酸片段的质粒,PCR反应模板添加量为100个拷贝,PCR扩增45个循环,最后取2μl的PCR扩增产物作为双链靶核酸进行检测。
单链核酸检测器序列为FAM-TTATT-BHQ1;
采用如下检测体系:Cas12i终浓度为50nM,gRNA终浓度为50nM,靶核酸(上述PCR扩增得到的双链DNA)2μl,单链核酸检测器终浓度200nM。37℃孵育,读取FAM荧光/20s。对照组不添加靶核酸。
图6示出了gRNA-8和gRNA-9在与dsDNA的靶核酸进行反应时的结果;与对照组相比,gRNA-8和gRNA-9均能在较短的时间内表现出显著的荧光信号,反映出其具有较好的检测dsDNA的灵敏度;尤其是gRNA-8,在20min左右就可以达到荧光信号的峰值。图6中,1为实验组,2为对照组。
本申请中筛选出的效果较好的gRNA(gRNA-1、2、3、4、5、6、7、8、9)的引导序列的长度为20bp,即,其与靶核酸杂交的区域为20bp;实际在使用时,本领域技术人员也可以在引导序列的3’端增加或减少任意的碱基(当然还要保证其与靶核酸杂交);引导序列的5’端毗邻PAM序列,不适合再调整;但是,针对其3’端,只要保证其能够与靶序列具有15bp-30bp的杂交区域,即能够实现将Cas酶结合在靶序列上的功能,这些长度的改变不会实质性的影响gRNA的活性。例如,针对gRNA-1、2、3、4、5、6、7、8、9的引导序列,在保证其与靶序列配对的情况下,可以在3’端减少1-5个碱基(例如,1、2、3、4或5个碱基),或者增加1-10个碱基(例如,1、2、3、4、5、6、7、8、9或10个碱基),其不会实质性的影响gRNA与Cas蛋白在检测靶核酸时的效率。
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。
序列表
<110> 山东舜丰生物科技有限公司
<120> 一种基于CRISPR技术检测病毒的方法
<130> P2021-1929
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 1045
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> Cas12i
<400> 1
Met Lys Lys Val Glu Val Ser Arg Pro Tyr Gln Ser Leu Leu Leu Pro
1 5 10 15
Asn His Arg Lys Phe Lys Tyr Leu Asp Glu Thr Trp Asn Ala Tyr Lys
20 25 30
Ser Val Lys Ser Leu Leu His Arg Phe Leu Val Cys Ala Tyr Gly Ala
35 40 45
Val Pro Phe Asn Lys Phe Val Glu Val Val Glu Lys Val Asp Asn Asp
50 55 60
Gln Leu Val Leu Ala Phe Ala Val Arg Leu Phe Arg Leu Val Pro Val
65 70 75 80
Glu Ser Thr Ser Phe Ala Lys Val Asp Lys Ala Asn Leu Ala Lys Ser
85 90 95
Leu Ala Asn His Leu Pro Val Gly Thr Ala Ile Pro Ala Asn Val Gln
100 105 110
Ser Tyr Phe Asp Ser Asn Phe Asp Pro Lys Lys Tyr Met Trp Ile Asp
115 120 125
Cys Ala Trp Glu Ala Asp Arg Leu Ala Arg Glu Met Gly Leu Ser Ala
130 135 140
Ser Gln Phe Ser Glu Tyr Ala Thr Thr Met Leu Trp Glu Asp Trp Leu
145 150 155 160
Pro Leu Asn Lys Asp Asp Val Asn Gly Trp Gly Ser Val Ser Gly Leu
165 170 175
Phe Gly Glu Gly Lys Lys Glu Asp Arg Gln Gln Lys Val Lys Met Leu
180 185 190
Asn Asn Leu Leu Asn Gly Ile Lys Lys Asn Pro Pro Lys Asp Tyr Thr
195 200 205
Gln Tyr Leu Lys Ile Leu Leu Asn Ala Phe Asp Ala Lys Ser His Lys
210 215 220
Glu Ala Val Lys Asn Tyr Lys Gly Asp Ser Thr Gly Arg Thr Ala Ser
225 230 235 240
Tyr Leu Ser Glu Lys Ser Gly Glu Ile Thr Glu Leu Met Leu Glu Gln
245 250 255
Leu Met Ser Asn Ile Gln Arg Asp Ile Gly Asp Lys Gln Lys Glu Ile
260 265 270
Ser Leu Pro Lys Lys Asp Val Val Lys Lys Tyr Leu Glu Ser Glu Ser
275 280 285
Gly Val Pro Tyr Asp Gln Asn Leu Trp Ser Gln Ala Tyr Arg Asn Ala
290 295 300
Ala Ser Ser Ile Lys Lys Thr Asp Thr Arg Asn Phe Asn Ser Thr Leu
305 310 315 320
Glu Lys Phe Lys Asn Glu Val Glu Leu Arg Gly Leu Leu Ser Glu Gly
325 330 335
Asp Asp Val Glu Ile Leu Arg Ser Lys Phe Phe Ser Ser Glu Phe His
340 345 350
Lys Thr Pro Asp Lys Phe Val Ile Lys Pro Glu His Ile Gly Phe Asn
355 360 365
Asn Lys Tyr Asn Val Val Ala Glu Leu Tyr Lys Leu Lys Ala Glu Ala
370 375 380
Thr Asp Phe Glu Ser Ala Phe Ala Thr Val Lys Asp Glu Phe Glu Glu
385 390 395 400
Lys Gly Ile Lys His Pro Ile Lys Asn Ile Leu Glu Tyr Ile Trp Asn
405 410 415
Asn Glu Val Pro Val Glu Lys Trp Gly Arg Val Ala Arg Phe Asn Gln
420 425 430
Ser Glu Glu Lys Leu Leu Arg Ile Lys Ala Asn Pro Thr Val Glu Cys
435 440 445
Asn Gln Gly Met Thr Phe Gly Asn Ser Ala Met Val Gly Glu Val Leu
450 455 460
Arg Ser Asn Tyr Val Ser Lys Lys Gly Ala Leu Val Ser Gly Glu His
465 470 475 480
Gly Gly Arg Leu Ile Gly Gln Asn Asn Met Ile Trp Leu Glu Met Arg
485 490 495
Leu Leu Asn Lys Gly Lys Trp Glu Thr His His Val Pro Thr His Asn
500 505 510
Met Lys Phe Phe Glu Glu Val His Ala Tyr Asn Pro Ser Leu Ala Asp
515 520 525
Ser Val Asn Val Arg Asn Arg Leu Tyr Arg Ser Glu Asp Tyr Thr Gln
530 535 540
Leu Pro Ser Ser Ile Thr Asp Gly Leu Lys Gly Asn Pro Lys Ala Lys
545 550 555 560
Leu Leu Lys Arg Gln His Cys Ala Leu Asn Asn Met Thr Ala Asn Val
565 570 575
Leu Asn Pro Lys Leu Ser Phe Thr Ile Asn Lys Lys Asn Asp Asp Tyr
580 585 590
Thr Val Ile Ile Val His Ser Val Glu Val Ser Lys Pro Arg Arg Glu
595 600 605
Val Leu Val Gly Asp Tyr Leu Val Gly Met Asp Gln Asn Gln Thr Ala
610 615 620
Ser Asn Thr Tyr Ala Val Met Gln Val Val Lys Pro Lys Ser Thr Asp
625 630 635 640
Ala Ile Pro Phe Arg Asn Met Trp Val Arg Phe Val Glu Ser Gly Ser
645 650 655
Ile Glu Ser Arg Thr Leu Asn Ser Arg Gly Glu Tyr Val Asp Gln Leu
660 665 670
Asn His Asp Gly Val Asp Leu Phe Glu Ile Gly Asp Thr Glu Trp Val
675 680 685
Asp Ser Ala Arg Lys Phe Phe Asn Lys Leu Gly Val Lys His Lys Asp
690 695 700
Gly Thr Leu Val Asp Leu Ser Thr Ala Pro Arg Lys Ala Tyr Ala Phe
705 710 715 720
Asn Asn Phe Tyr Phe Lys Thr Met Leu Asn His Leu Arg Ser Asn Glu
725 730 735
Val Asp Leu Thr Leu Leu Arg Asn Glu Ile Leu Arg Val Ala Asn Gly
740 745 750
Arg Phe Ser Pro Met Arg Leu Gly Ser Leu Ser Trp Thr Thr Leu Lys
755 760 765
Ala Leu Gly Ser Phe Lys Ser Leu Val Leu Ser Tyr Phe Asp Arg Leu
770 775 780
Gly Ala Lys Glu Met Val Asp Lys Glu Ala Lys Asp Lys Ser Leu Phe
785 790 795 800
Asp Leu Leu Val Ala Ile Asn Asn Lys Arg Ser Asn Lys Arg Glu Glu
805 810 815
Arg Thr Ser Arg Ile Ala Ser Ser Leu Met Thr Val Ala Gln Lys Tyr
820 825 830
Lys Val Asp Asn Ala Val Val His Val Val Val Glu Gly Asn Leu Ser
835 840 845
Ser Thr Asp Arg Ser Ala Ser Lys Ala His Asn Arg Asn Thr Met Asp
850 855 860
Trp Cys Ser Arg Ala Val Val Lys Lys Leu Glu Asp Met Cys Asn Leu
865 870 875 880
Tyr Gly Phe Asn Ile Lys Gly Val Pro Ala Phe Tyr Thr Ser His Gln
885 890 895
Asp Pro Leu Val His Arg Ala Asp Tyr Asp Asp Pro Lys Pro Ala Leu
900 905 910
Arg Cys Arg Tyr Ser Ser Tyr Ser Arg Ala Asp Phe Ser Lys Trp Gly
915 920 925
Gln Asn Ala Leu Ala Ala Val Val Arg Trp Ala Ser Asn Lys Lys Ser
930 935 940
Asn Thr Cys Tyr Lys Val Gly Ala Val Glu Phe Leu Lys Gln His Gly
945 950 955 960
Leu Phe Ala Asp Lys Lys Leu Thr Val Glu Gln Phe Leu Ser Lys Val
965 970 975
Lys Asp Glu Glu Ile Leu Ile Pro Arg Arg Gly Gly Arg Val Phe Leu
980 985 990
Thr Thr His Arg Leu Leu Ala Glu Ser Thr Phe Val Tyr Leu Asn Gly
995 1000 1005
Val Lys Tyr His Ser Cys Asn Ala Asp Glu Val Ala Ala Val Asn
1010 1015 1020
Ile Cys Leu Asn Asp Trp Val Ile Pro Cys Lys Lys Lys Met Lys
1025 1030 1035
Glu Glu Ser Ser Ala Ser Gly
1040 1045
<210> 2
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CSFV扩增产物
<400> 2
tacaggacag tcgtcagtag ttcgacgtga gcaggagccc acctcgagat gctatgtgga 60
cgagggcatg cccaagacac accttaaccc tggcgg 96
<210> 3
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-1的靶向区
<400> 3
gacgugagca ggagcccacc 20
<210> 4
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-2的靶向区
<400> 4
ggcaugcccu cguccacaua 20
<210> 5
<211> 107
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PCV扩增产物
<400> 5
ggagtctggt gaccgttgca gagcagcacc ctgtaacgtt tgtcagaaat ttccgcgggc 60
tggctgaact tttgaaagtg agcgggaaaa tgcagaagcg tgattgg 107
<210> 6
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-3的靶向区
<400> 6
ugacaaacgu uacagggugc 20
<210> 7
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-4的靶向区
<400> 7
cugacaaacg uuacagggug 20
<210> 8
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-5的靶向区
<400> 8
gucagaaauu uccgcgggcu 20
<210> 9
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-6的靶向区
<400> 9
agccagcccg cggaaauuuc 20
<210> 10
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-7的靶向区
<400> 10
aaaaguucag ccagcccgcg 20
<210> 11
<211> 150
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PEDV扩增产物
<400> 11
aacgctaaca ctccttagtg gtacattgct tgtagagggc tataaggttg ctactggcgt 60
acaggtaagt caattaccta atttcgtcac agtcgccaag gccactacaa caattgtcta 120
tggacgtgtt ggtcgttcag tcaatgcttc 150
<210> 12
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-8的靶向区
<400> 12
ccuguacgcc aguagcaacc 20
<210> 13
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA-9的靶向区
<400> 13
acuuaccugu acgccaguag 20
<210> 14
<211> 23
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> gRNA的DR区
<400> 14
agagaaugug ugcauaguca cac 23
Claims (16)
1.一种基于CRISPR技术检测病毒的gRNA,所述gRNA包括与V型Cas蛋白结合的区域和与靶核酸杂交的导向序列,所述靶核酸为来源于猪瘟病毒、猪圆环病毒或猪流行性腹泻病毒的核酸。
2.根据权利要求1所述检测病毒的gRNA,其特征在于,所述gRNA包括与V型Cas蛋白结合的区域和与靶核酸杂交的导向序列,所述靶核酸为来源于猪瘟病毒的核酸;其特征在于,所述与靶核酸杂交的导向序列选自下组任意一种或其组合:
(1)所述与靶核酸杂交的导向序列含有20-30个碱基,并且与SEQ ID No.2所示的序列或其反向互补序列杂交,并且所述导向序列包含SEQ ID No.3-4任一所示的序列;
(2)所述与靶核酸杂交的导向序列包含SEQ ID No.3-4任一所示的序列,并且在SEQ IDNo.3-4任一所示的序列的3’端还包括1-10个碱基,并且,所述与靶核酸杂交的导向序列与SEQ ID No.2或其反向互补序列杂交;
(3)所述与靶核酸杂交的导向序列与SEQ ID No.3-4任一所示的序列相比,在SEQ IDNo.3-4任一所示的序列的3’端连续缺失1-5个碱基;
(4)所述与靶核酸杂交的导向序列如SEQ ID No.3-4任一所示。
3.根据权利要求1所述检测病毒的gRNA,其特征在于,所述gRNA包括与V型Cas蛋白结合的区域和与靶核酸杂交的导向序列,所述靶核酸为来源于猪圆环病毒的核酸;其特征在于,所述与靶核酸杂交的导向序列选自下组任意一种或其组合:
(1)所述与靶核酸杂交的导向序列含有20-30个碱基,并且与SEQ ID No.5所示的序列或其反向互补序列杂交,并且所述导向序列包含SEQ ID No.6-10任一所示的序列;
(2)所述与靶核酸杂交的导向序列包含SEQ ID No.6-10任一所示的序列,并且在SEQID No.6-10任一所示的序列的3’端还包括1-10个碱基,并且,所述与靶核酸杂交的导向序列与SEQ ID No.5或其反向互补序列杂交;
(3)所述与靶核酸杂交的导向序列与SEQ ID No.6-10任一所示的序列相比,在SEQ IDNo.6-10任一所示的序列的3’端连续缺失1-5个碱基;
(4)所述与靶核酸杂交的导向序列如SEQ ID No.6-10任一所示。
4.根据权利要求1所述检测病毒的gRNA,其特征在于,所述gRNA包括与V型Cas蛋白结合的区域和与靶核酸杂交的导向序列,所述靶核酸为来源于猪流行性腹泻病毒的核酸;其特征在于,所述与靶核酸杂交的导向序列选自下组任意一种或其组合:
(1)所述与靶核酸杂交的导向序列含有20-30个碱基,并且与SEQ ID No.11所示的序列或其反向互补序列杂交,并且所述导向序列包含SEQ ID No.12-13任一所示的序列;
(2)所述与靶核酸杂交的导向序列包含SEQ ID No.12-13任一所示的序列,并且在SEQID No.12-13任一所示的序列的3’端还包括1-10个碱基,并且,所述与靶核酸杂交的导向序列与SEQ ID No.11或其反向互补序列杂交;
(3)所述与靶核酸杂交的导向序列与SEQ ID No.12-13任一所示的序列相比,在SEQ IDNo.12-13任一所示的序列的3’端连续缺失1-5个碱基;
(4)所述与靶核酸杂交的导向序列如SEQ ID No.12-13任一所示。
5.一种检测猪瘟病毒的方法,所述方法包括将待测核酸与V型Cas蛋白、权利要求2所述的gRNA和单链核酸检测器接触;检测由Cas蛋白切割单链核酸检测器产生的可检测信号,从而检测猪瘟病毒。
6.一种检测猪圆环病毒的方法,所述方法包括将待测核酸与V型Cas蛋白、权利要求3所述的gRNA和单链核酸检测器接触;检测由Cas蛋白切割单链核酸检测器产生的可检测信号,从而检测猪圆环病毒。
7.一种检测猪流行性腹泻病毒的方法,所述方法包括将待测核酸与V型Cas蛋白、权利要求4所述的gRNA和单链核酸检测器接触;检测由Cas蛋白切割单链核酸检测器产生的可检测信号,从而检测猪流行性腹泻病毒。
8.根据权利要求5-7任一所述的方法,其特征在于,所述方法还包括从待测样品中获得待测核酸的步骤。
9.根据权利要求8所述的方法,其特征在于,所述样品为来自动物的样品。
10.根据权利要求5-7任一所述的方法,其特征在于,所述可检测信号可通过以下任一方式实现:基于视觉的检测,基于传感器的检测,颜色检测,基于金纳米颗粒的检测,荧光偏振,荧光信号,胶体相变,电化学检测或基于半导体的检测。
11.一种检测/诊断猪瘟病毒或者古典猪瘟的系统、组合物或试剂盒,所述系统、组合物或试剂盒包括权利要求2所述的gRNA,所述系统、组合物或试剂盒还包括V型Cas蛋白以及单链核酸检测器。
12.一种检测/诊断猪圆环病毒或者猪圆环病毒病的系统、组合物或试剂盒,所述系统、组合物或试剂盒包括权利要求3所述的gRNA,所述系统、组合物或试剂盒还包括V型Cas蛋白以及单链核酸检测器。
13.一种检测/诊断猪流行性腹泻病毒或者猪流行性腹泻的系统、组合物或试剂盒,所述系统、组合物或试剂盒包括权利要求4所述的gRNA,所述系统、组合物或试剂盒还包括V型Cas蛋白以及单链核酸检测器。
14.权利要求11-13任一所述的组合物在诊断或检测疾病中的用途,或者在用于制备诊断或检测疾病的试剂或试剂盒中的用途,所述疾病选自古典猪瘟、猪圆环病毒病或猪流行性腹泻中的任意一种。
15.权利要求11-13任一所述的组合物在检测或诊断病毒中的用途,或者在制备检测或诊断病毒的试剂或试剂盒中的用途,所述病毒选自猪瘟病毒、猪圆环病毒或猪流行性腹泻病毒中的任意一种。
16.根据权利要求14或15所述的用途,其特征在于,所述检测或诊断的待测样品来源于动物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110838306.4A CN115678898A (zh) | 2021-07-23 | 2021-07-23 | 一种基于crispr技术检测病毒的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110838306.4A CN115678898A (zh) | 2021-07-23 | 2021-07-23 | 一种基于crispr技术检测病毒的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115678898A true CN115678898A (zh) | 2023-02-03 |
Family
ID=85044243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110838306.4A Pending CN115678898A (zh) | 2021-07-23 | 2021-07-23 | 一种基于crispr技术检测病毒的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115678898A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116218957A (zh) * | 2023-03-13 | 2023-06-06 | 重庆大学 | 一种检测谷子抗除草剂ahas基因的方法 |
-
2021
- 2021-07-23 CN CN202110838306.4A patent/CN115678898A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116218957A (zh) * | 2023-03-13 | 2023-06-06 | 重庆大学 | 一种检测谷子抗除草剂ahas基因的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111996236B (zh) | 基于crispr技术进行靶核酸检测的方法 | |
CN111690717B (zh) | 基于crispr技术进行目标核酸检测的方法和系统 | |
CN111690720B (zh) | 利用修饰的单链核酸进行靶核酸检测的方法 | |
WO2022012423A1 (zh) | 利用含有无碱基间隔物的核酸检测器检测靶核酸的方法 | |
CN115678898A (zh) | 一种基于crispr技术检测病毒的方法 | |
CN114164214B (zh) | 一种基于crispr技术检测病原微生物的方法 | |
US20060188871A1 (en) | Detection of very virulent infectious bursal disease virus | |
CN115707775A (zh) | 一种基于crispr技术检测非洲猪瘟病毒的方法 | |
KR20230142378A (ko) | 돼지열병바이러스의 검출 또는 판별을 위한 조성물 및 방법 | |
CN113789330A (zh) | 一种基于crispr技术检测甘薯褪绿矮化病毒的方法 | |
CN114015687A (zh) | 一种基于crispr技术检测甘薯病毒病的方法 | |
KR102030245B1 (ko) | 치쿤군야 바이러스 검출용 올리고뉴클레오티드 세트 및 이의 용도 | |
CN113832154A (zh) | 一种基于crispr技术检测甘薯褪绿斑病毒的方法 | |
CN113913429A (zh) | 一种基于crispr技术检测甘薯卷叶病毒的方法 | |
CN116103286A (zh) | 一种基于crispr技术检测甘薯羽状斑驳病毒的方法 | |
CN114480384B (zh) | 一种基于crispr技术检测口蹄疫病毒的方法 | |
CN114457073B (zh) | 一种基于crispr技术检测副结核分枝杆菌的方法 | |
CN115637268A (zh) | 一种基于crispr技术检测病毒的方法 | |
CN114507665B (zh) | 一种基于crispr技术检测黄瓜绿斑驳花叶病毒的方法 | |
CN113913497B (zh) | 利用碱基修饰的单链核酸进行靶核酸检测的方法 | |
CN113755499A (zh) | 一种基于crispr技术检测甘薯潜隐病毒的方法 | |
CN114634972B (zh) | 利用Cas酶进行核酸检测的方法 | |
CN114058735A (zh) | 一种基于crispr技术检测手足口病的方法 | |
CN113930548A (zh) | 一种基于crispr技术检测甘薯g病毒的方法 | |
CN118460746A (zh) | 一种基于crispr技术检测布鲁氏杆菌的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |