JP2023514316A - ペプチドおよびタンパク質のc末端の標識法 - Google Patents
ペプチドおよびタンパク質のc末端の標識法 Download PDFInfo
- Publication number
- JP2023514316A JP2023514316A JP2022549421A JP2022549421A JP2023514316A JP 2023514316 A JP2023514316 A JP 2023514316A JP 2022549421 A JP2022549421 A JP 2022549421A JP 2022549421 A JP2022549421 A JP 2022549421A JP 2023514316 A JP2023514316 A JP 2023514316A
- Authority
- JP
- Japan
- Prior art keywords
- peptide
- amino acid
- moiety
- protein
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 510
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 242
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 242
- 210000004899 c-terminal region Anatomy 0.000 title claims description 197
- 238000002372 labelling Methods 0.000 title claims description 144
- 102000004196 processed proteins & peptides Human genes 0.000 title description 149
- 238000000034 method Methods 0.000 claims abstract description 262
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims abstract description 39
- 235000018102 proteins Nutrition 0.000 claims description 239
- 229940024606 amino acid Drugs 0.000 claims description 188
- 235000001014 amino acid Nutrition 0.000 claims description 188
- 150000001413 amino acids Chemical class 0.000 claims description 177
- 239000003153 chemical reaction reagent Substances 0.000 claims description 126
- 230000008878 coupling Effects 0.000 claims description 115
- 238000010168 coupling process Methods 0.000 claims description 115
- 238000005859 coupling reaction Methods 0.000 claims description 115
- 125000000539 amino acid group Chemical group 0.000 claims description 87
- 239000003795 chemical substances by application Substances 0.000 claims description 87
- 150000007523 nucleic acids Chemical class 0.000 claims description 62
- 108020004707 nucleic acids Proteins 0.000 claims description 58
- 102000039446 nucleic acids Human genes 0.000 claims description 58
- -1 polyethylene Polymers 0.000 claims description 52
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 51
- 238000012163 sequencing technique Methods 0.000 claims description 51
- 239000004472 Lysine Substances 0.000 claims description 49
- 239000000370 acceptor Substances 0.000 claims description 48
- 239000000203 mixture Substances 0.000 claims description 44
- 239000000523 sample Substances 0.000 claims description 42
- 235000018417 cysteine Nutrition 0.000 claims description 41
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 39
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 38
- 150000001732 carboxylic acid derivatives Chemical group 0.000 claims description 37
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 35
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 32
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 30
- 239000011148 porous material Substances 0.000 claims description 30
- 239000007787 solid Substances 0.000 claims description 29
- 150000001412 amines Chemical class 0.000 claims description 28
- 150000007942 carboxylates Chemical group 0.000 claims description 27
- 239000000126 substance Substances 0.000 claims description 27
- 229940009098 aspartate Drugs 0.000 claims description 25
- 239000012472 biological sample Substances 0.000 claims description 23
- 102000004190 Enzymes Human genes 0.000 claims description 21
- 108090000790 Enzymes Proteins 0.000 claims description 21
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 21
- 229940088598 enzyme Drugs 0.000 claims description 21
- 229930195712 glutamate Natural products 0.000 claims description 21
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 20
- 239000004475 Arginine Substances 0.000 claims description 18
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 18
- HUQXEIFQYCVOPD-UHFFFAOYSA-N bicyclo[2.2.1]hept-2-en-5-one Chemical compound C1C2C(=O)CC1C=C2 HUQXEIFQYCVOPD-UHFFFAOYSA-N 0.000 claims description 18
- 239000012039 electrophile Substances 0.000 claims description 18
- 238000007672 fourth generation sequencing Methods 0.000 claims description 18
- 239000012038 nucleophile Substances 0.000 claims description 18
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 17
- SJHPCNCNNSSLPL-CSKARUKUSA-N (4e)-4-(ethoxymethylidene)-2-phenyl-1,3-oxazol-5-one Chemical group O1C(=O)C(=C/OCC)\N=C1C1=CC=CC=C1 SJHPCNCNNSSLPL-CSKARUKUSA-N 0.000 claims description 16
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 claims description 16
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 16
- 235000020958 biotin Nutrition 0.000 claims description 16
- 230000003287 optical effect Effects 0.000 claims description 16
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 15
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 15
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 15
- 150000001345 alkine derivatives Chemical class 0.000 claims description 15
- 239000011324 bead Substances 0.000 claims description 15
- 229960002685 biotin Drugs 0.000 claims description 15
- 239000011616 biotin Substances 0.000 claims description 15
- 125000000524 functional group Chemical group 0.000 claims description 15
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 14
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 14
- 239000004473 Threonine Substances 0.000 claims description 14
- 150000001540 azides Chemical class 0.000 claims description 14
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 14
- KPDQZGKJTJRBGU-UHFFFAOYSA-N lumiflavin Chemical group CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O KPDQZGKJTJRBGU-UHFFFAOYSA-N 0.000 claims description 14
- 102000035195 Peptidases Human genes 0.000 claims description 13
- 108091005804 Peptidases Proteins 0.000 claims description 13
- 239000011347 resin Substances 0.000 claims description 13
- 229920005989 resin Polymers 0.000 claims description 13
- 150000003573 thiols Chemical class 0.000 claims description 13
- 230000003100 immobilizing effect Effects 0.000 claims description 12
- 210000001519 tissue Anatomy 0.000 claims description 12
- 102000005367 Carboxypeptidases Human genes 0.000 claims description 11
- 108010006303 Carboxypeptidases Proteins 0.000 claims description 11
- 239000011941 photocatalyst Substances 0.000 claims description 11
- 150000001408 amides Chemical group 0.000 claims description 10
- 230000001699 photocatalysis Effects 0.000 claims description 10
- 102000005572 Cathepsin A Human genes 0.000 claims description 9
- 108010059081 Cathepsin A Proteins 0.000 claims description 9
- 150000001336 alkenes Chemical class 0.000 claims description 9
- 235000003704 aspartic acid Nutrition 0.000 claims description 8
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 8
- 210000004369 blood Anatomy 0.000 claims description 8
- 239000008280 blood Substances 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 7
- 150000001993 dienes Chemical class 0.000 claims description 7
- 150000002540 isothiocyanates Chemical class 0.000 claims description 7
- 235000019833 protease Nutrition 0.000 claims description 7
- 150000003568 thioethers Chemical group 0.000 claims description 7
- CSDSSGBPEUDDEE-UHFFFAOYSA-N 2-formylpyridine Chemical compound O=CC1=CC=CC=N1 CSDSSGBPEUDDEE-UHFFFAOYSA-N 0.000 claims description 6
- XVGRLAPKPXXDHV-UHFFFAOYSA-N 2-methyl-n-prop-2-ynylprop-2-enamide Chemical compound CC(=C)C(=O)NCC#C XVGRLAPKPXXDHV-UHFFFAOYSA-N 0.000 claims description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 6
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 claims description 6
- 150000003926 acrylamides Chemical class 0.000 claims description 6
- 150000001298 alcohols Chemical group 0.000 claims description 6
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 claims description 6
- AFOSIXZFDONLBT-UHFFFAOYSA-N divinyl sulfone Chemical compound C=CS(=O)(=O)C=C AFOSIXZFDONLBT-UHFFFAOYSA-N 0.000 claims description 6
- 230000002255 enzymatic effect Effects 0.000 claims description 6
- 239000012948 isocyanate Substances 0.000 claims description 6
- 150000002513 isocyanates Chemical class 0.000 claims description 6
- 238000004949 mass spectrometry Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims description 6
- 150000001299 aldehydes Chemical class 0.000 claims description 5
- 150000001735 carboxylic acids Chemical group 0.000 claims description 5
- 239000000463 material Substances 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 108010011110 polyarginine Proteins 0.000 claims description 5
- 210000003296 saliva Anatomy 0.000 claims description 5
- 210000002700 urine Anatomy 0.000 claims description 5
- FNOOZJAPZFHNCW-UHFFFAOYSA-N 2-methylidenebicyclo[2.2.1]heptan-3-one Chemical compound C1CC2C(=O)C(=C)C1C2 FNOOZJAPZFHNCW-UHFFFAOYSA-N 0.000 claims description 4
- 102000005593 Endopeptidases Human genes 0.000 claims description 4
- 108010059378 Endopeptidases Proteins 0.000 claims description 4
- 102000018389 Exopeptidases Human genes 0.000 claims description 4
- 108010091443 Exopeptidases Proteins 0.000 claims description 4
- 102000004157 Hydrolases Human genes 0.000 claims description 4
- 108090000604 Hydrolases Proteins 0.000 claims description 4
- 239000004698 Polyethylene Substances 0.000 claims description 4
- 108090001109 Thermolysin Proteins 0.000 claims description 4
- 229920000573 polyethylene Polymers 0.000 claims description 4
- 125000006850 spacer group Chemical group 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 3
- 239000003054 catalyst Substances 0.000 claims description 3
- 238000001962 electrophoresis Methods 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 3
- 210000002751 lymph Anatomy 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 claims description 3
- 150000003457 sulfones Chemical class 0.000 claims description 3
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 claims description 3
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 claims description 2
- 108010088751 Albumins Proteins 0.000 claims description 2
- 102000009027 Albumins Human genes 0.000 claims description 2
- 102000004092 Amidohydrolases Human genes 0.000 claims description 2
- 108090000531 Amidohydrolases Proteins 0.000 claims description 2
- 108010090804 Streptavidin Proteins 0.000 claims description 2
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 claims description 2
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 claims description 2
- XLJMAIOERFSOGZ-UHFFFAOYSA-M cyanate Chemical compound [O-]C#N XLJMAIOERFSOGZ-UHFFFAOYSA-M 0.000 claims description 2
- 229940066758 endopeptidases Drugs 0.000 claims description 2
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 claims description 2
- 150000002460 imidazoles Chemical group 0.000 claims description 2
- 150000002475 indoles Chemical group 0.000 claims description 2
- 150000002989 phenols Chemical group 0.000 claims description 2
- 229920002554 vinyl polymer Polymers 0.000 claims description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 claims 6
- 238000012412 chemical coupling Methods 0.000 claims 3
- 102000044159 Ubiquitin Human genes 0.000 claims 2
- 108090000848 Ubiquitin Proteins 0.000 claims 2
- 229910021645 metal ion Inorganic materials 0.000 claims 2
- JECYNCQXXKQDJN-UHFFFAOYSA-N 2-(2-methylhexan-2-yloxymethyl)oxirane Chemical compound CCCCC(C)(C)OCC1CO1 JECYNCQXXKQDJN-UHFFFAOYSA-N 0.000 claims 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 claims 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 claims 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 claims 1
- 102000000584 Calmodulin Human genes 0.000 claims 1
- 108010041952 Calmodulin Proteins 0.000 claims 1
- 102000014914 Carrier Proteins Human genes 0.000 claims 1
- 229920002101 Chitin Polymers 0.000 claims 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 claims 1
- 102000004856 Lectins Human genes 0.000 claims 1
- 108090001090 Lectins Proteins 0.000 claims 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 claims 1
- 238000001261 affinity purification Methods 0.000 claims 1
- 150000001454 anthracenes Chemical class 0.000 claims 1
- 108091008324 binding proteins Proteins 0.000 claims 1
- 229920002678 cellulose Polymers 0.000 claims 1
- 239000001913 cellulose Substances 0.000 claims 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 claims 1
- 229960001231 choline Drugs 0.000 claims 1
- 239000003623 enhancer Substances 0.000 claims 1
- 108010090623 galactose binding protein Proteins 0.000 claims 1
- 102000021529 galactose binding proteins Human genes 0.000 claims 1
- 239000002523 lectin Substances 0.000 claims 1
- 150000003220 pyrenes Chemical class 0.000 claims 1
- 239000012070 reactive reagent Substances 0.000 claims 1
- 108010018381 streptavidin-binding peptide Proteins 0.000 claims 1
- 238000000734 protein sequencing Methods 0.000 abstract description 6
- 125000002843 carboxylic acid group Chemical group 0.000 description 81
- 125000000217 alkyl group Chemical group 0.000 description 57
- 235000018977 lysine Nutrition 0.000 description 50
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 45
- 210000004027 cell Anatomy 0.000 description 31
- 238000006243 chemical reaction Methods 0.000 description 30
- 125000003275 alpha amino acid group Chemical group 0.000 description 27
- 125000003118 aryl group Chemical group 0.000 description 26
- 125000004432 carbon atom Chemical group C* 0.000 description 19
- 125000001072 heteroaryl group Chemical group 0.000 description 19
- 229960004441 tyrosine Drugs 0.000 description 19
- 102000007079 Peptide Fragments Human genes 0.000 description 18
- 108010033276 Peptide Fragments Proteins 0.000 description 18
- 125000002947 alkylene group Chemical group 0.000 description 18
- 125000004404 heteroalkyl group Chemical group 0.000 description 18
- 230000005945 translocation Effects 0.000 description 18
- 235000002374 tyrosine Nutrition 0.000 description 18
- 108020004414 DNA Proteins 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 17
- 125000004429 atom Chemical group 0.000 description 17
- 125000003729 nucleotide group Chemical group 0.000 description 17
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 16
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 16
- 229910052799 carbon Inorganic materials 0.000 description 15
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 15
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 14
- 239000002773 nucleotide Substances 0.000 description 14
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 13
- 230000029087 digestion Effects 0.000 description 13
- 230000002378 acidificating effect Effects 0.000 description 12
- 125000003277 amino group Chemical group 0.000 description 12
- 150000001875 compounds Chemical class 0.000 description 12
- 125000000753 cycloalkyl group Chemical group 0.000 description 12
- 150000002148 esters Chemical class 0.000 description 12
- 230000000269 nucleophilic effect Effects 0.000 description 12
- 235000008521 threonine Nutrition 0.000 description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 11
- 125000003342 alkenyl group Chemical group 0.000 description 11
- 125000002619 bicyclic group Chemical group 0.000 description 11
- 229910052736 halogen Inorganic materials 0.000 description 11
- 150000002367 halogens Chemical class 0.000 description 11
- 238000003384 imaging method Methods 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 238000001327 Förster resonance energy transfer Methods 0.000 description 10
- 125000000304 alkynyl group Chemical group 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 238000001212 derivatisation Methods 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 10
- 125000005647 linker group Chemical group 0.000 description 10
- 125000003588 lysine group Chemical class [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 10
- 241000894007 species Species 0.000 description 10
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 9
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 9
- 108091093037 Peptide nucleic acid Proteins 0.000 description 9
- 230000015556 catabolic process Effects 0.000 description 9
- 238000006731 degradation reaction Methods 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 235000013922 glutamic acid Nutrition 0.000 description 9
- 239000004220 glutamic acid Substances 0.000 description 9
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 239000001257 hydrogen Substances 0.000 description 9
- 239000000543 intermediate Substances 0.000 description 9
- 108010064733 Angiotensins Proteins 0.000 description 8
- 102000015427 Angiotensins Human genes 0.000 description 8
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 150000001721 carbon Chemical group 0.000 description 8
- 125000004122 cyclic group Chemical group 0.000 description 8
- 125000000623 heterocyclic group Chemical group 0.000 description 8
- 230000009257 reactivity Effects 0.000 description 8
- 125000001424 substituent group Chemical group 0.000 description 8
- 108090000144 Human Proteins Proteins 0.000 description 7
- 102000003839 Human Proteins Human genes 0.000 description 7
- 229940098773 bovine serum albumin Drugs 0.000 description 7
- 150000005829 chemical entities Chemical class 0.000 description 7
- 230000021615 conjugation Effects 0.000 description 7
- 239000000975 dye Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 125000003709 fluoroalkyl group Chemical group 0.000 description 7
- 125000004433 nitrogen atom Chemical group N* 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 238000011002 quantification Methods 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- AEMRFAOFKBGASW-UHFFFAOYSA-N Glycolic acid Chemical compound OCC(O)=O AEMRFAOFKBGASW-UHFFFAOYSA-N 0.000 description 6
- 239000004365 Protease Substances 0.000 description 6
- 108010026552 Proteome Proteins 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 239000007850 fluorescent dye Substances 0.000 description 6
- 239000011521 glass Substances 0.000 description 6
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 229910052760 oxygen Inorganic materials 0.000 description 6
- 210000002381 plasma Anatomy 0.000 description 6
- 125000003367 polycyclic group Chemical group 0.000 description 6
- 229920001184 polypeptide Polymers 0.000 description 6
- 229910052717 sulfur Inorganic materials 0.000 description 6
- 101800000733 Angiotensin-2 Proteins 0.000 description 5
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 5
- 229920001222 biopolymer Polymers 0.000 description 5
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 239000011593 sulfur Substances 0.000 description 5
- FITNPEDFWSPOMU-UHFFFAOYSA-N 2,3-dihydrotriazolo[4,5-b]pyridin-5-one Chemical compound OC1=CC=C2NN=NC2=N1 FITNPEDFWSPOMU-UHFFFAOYSA-N 0.000 description 4
- NQUNIMFHIWQQGJ-UHFFFAOYSA-N 2-nitro-5-thiocyanatobenzoic acid Chemical compound OC(=O)C1=CC(SC#N)=CC=C1[N+]([O-])=O NQUNIMFHIWQQGJ-UHFFFAOYSA-N 0.000 description 4
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 4
- GANZODCWZFAEGN-UHFFFAOYSA-N 5-mercapto-2-nitro-benzoic acid Chemical compound OC(=O)C1=CC(S)=CC=C1[N+]([O-])=O GANZODCWZFAEGN-UHFFFAOYSA-N 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 102400000345 Angiotensin-2 Human genes 0.000 description 4
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 4
- 108010058643 Fungal Proteins Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- CZGUSIXMZVURDU-JZXHSEFVSA-N Ile(5)-angiotensin II Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=[NH2+])NC(=O)[C@@H]([NH3+])CC([O-])=O)C(C)C)C1=CC=C(O)C=C1 CZGUSIXMZVURDU-JZXHSEFVSA-N 0.000 description 4
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- 102000015636 Oligopeptides Human genes 0.000 description 4
- 108010038807 Oligopeptides Proteins 0.000 description 4
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 125000003545 alkoxy group Chemical group 0.000 description 4
- 229950006323 angiotensin ii Drugs 0.000 description 4
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 4
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 4
- 229910052794 bromium Inorganic materials 0.000 description 4
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000001816 cooling Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- 235000004554 glutamine Nutrition 0.000 description 4
- 125000001188 haloalkyl group Chemical group 0.000 description 4
- 125000005842 heteroatom Chemical group 0.000 description 4
- 239000007791 liquid phase Substances 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 150000002924 oxiranes Chemical class 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- 125000004430 oxygen atom Chemical group O* 0.000 description 4
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 239000007790 solid phase Substances 0.000 description 4
- 125000004434 sulfur atom Chemical group 0.000 description 4
- ASOKPJOREAFHNY-UHFFFAOYSA-N 1-Hydroxybenzotriazole Chemical compound C1=CC=C2N(O)N=NC2=C1 ASOKPJOREAFHNY-UHFFFAOYSA-N 0.000 description 3
- 239000012099 Alexa Fluor family Substances 0.000 description 3
- 108700023418 Amidases Proteins 0.000 description 3
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 3
- 101800001415 Bri23 peptide Proteins 0.000 description 3
- 102400000107 C-terminal peptide Human genes 0.000 description 3
- 101800000655 C-terminal peptide Proteins 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 150000001335 aliphatic alkanes Chemical class 0.000 description 3
- 102000005922 amidase Human genes 0.000 description 3
- 125000006615 aromatic heterocyclic group Chemical group 0.000 description 3
- XSCHRSMBECNVNS-UHFFFAOYSA-N benzopyrazine Natural products N1=CC=NC2=CC=CC=C21 XSCHRSMBECNVNS-UHFFFAOYSA-N 0.000 description 3
- 150000001576 beta-amino acids Chemical class 0.000 description 3
- 230000001588 bifunctional effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 125000001246 bromo group Chemical group Br* 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 239000013626 chemical specie Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 150000001945 cysteines Chemical class 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- LBBAWVLUOZVYCC-UHFFFAOYSA-N diethyl 2-ethylidenepropanedioate Chemical compound CCOC(=O)C(=CC)C(=O)OCC LBBAWVLUOZVYCC-UHFFFAOYSA-N 0.000 description 3
- 238000005886 esterification reaction Methods 0.000 description 3
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- 125000001153 fluoro group Chemical group F* 0.000 description 3
- 125000004428 fluoroalkoxy group Chemical group 0.000 description 3
- 229960004275 glycolic acid Drugs 0.000 description 3
- 125000005843 halogen group Chemical group 0.000 description 3
- 125000004474 heteroalkylene group Chemical group 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 3
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 3
- 229920002521 macromolecule Polymers 0.000 description 3
- 125000002950 monocyclic group Chemical group 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- KPMKEVXVVHNIEY-UHFFFAOYSA-N norcamphor Chemical class C1CC2C(=O)CC1C2 KPMKEVXVVHNIEY-UHFFFAOYSA-N 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 125000005415 substituted alkoxy group Chemical group 0.000 description 3
- 125000000547 substituted alkyl group Chemical group 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 125000003396 thiol group Chemical group [H]S* 0.000 description 3
- 125000002733 (C1-C6) fluoroalkyl group Chemical group 0.000 description 2
- 125000005913 (C3-C6) cycloalkyl group Chemical group 0.000 description 2
- FCEHBMOGCRZNNI-UHFFFAOYSA-N 1-benzothiophene Chemical compound C1=CC=C2SC=CC2=C1 FCEHBMOGCRZNNI-UHFFFAOYSA-N 0.000 description 2
- UUFQTNFCRMXOAE-UHFFFAOYSA-N 1-methylmethylene Chemical compound C[CH] UUFQTNFCRMXOAE-UHFFFAOYSA-N 0.000 description 2
- FPQQSJJWHUJYPU-UHFFFAOYSA-N 3-(dimethylamino)propyliminomethylidene-ethylazanium;chloride Chemical compound Cl.CCN=C=NCCCN(C)C FPQQSJJWHUJYPU-UHFFFAOYSA-N 0.000 description 2
- ACWBBAGYTKWBCD-ZETCQYMHSA-N 3-chloro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(Cl)=C1 ACWBBAGYTKWBCD-ZETCQYMHSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 101100167062 Caenorhabditis elegans chch-3 gene Proteins 0.000 description 2
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 102000017033 Porins Human genes 0.000 description 2
- 108010013381 Porins Proteins 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 2
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 2
- 238000001069 Raman spectroscopy Methods 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 125000005907 alkyl ester group Chemical group 0.000 description 2
- 125000005360 alkyl sulfoxide group Chemical group 0.000 description 2
- 125000004414 alkyl thio group Chemical group 0.000 description 2
- 229910045601 alloy Inorganic materials 0.000 description 2
- 239000000956 alloy Substances 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 125000005362 aryl sulfone group Chemical group 0.000 description 2
- 125000005361 aryl sulfoxide group Chemical group 0.000 description 2
- 125000005110 aryl thio group Chemical group 0.000 description 2
- 125000004104 aryloxy group Chemical group 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 2
- 229940000635 beta-alanine Drugs 0.000 description 2
- 125000002618 bicyclic heterocycle group Chemical group 0.000 description 2
- 239000013060 biological fluid Substances 0.000 description 2
- 125000002837 carbocyclic group Chemical group 0.000 description 2
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 125000001309 chloro group Chemical group Cl* 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 150000001913 cyanates Chemical class 0.000 description 2
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 2
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 125000000582 cycloheptyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000000640 cyclooctyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 2
- 229960003067 cystine Drugs 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 125000004852 dihydrofuranyl group Chemical group O1C(CC=C1)* 0.000 description 2
- 125000005043 dihydropyranyl group Chemical group O1C(CCC=C1)* 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 230000032050 esterification Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 229920002313 fluoropolymer Polymers 0.000 description 2
- 239000004811 fluoropolymer Substances 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 125000003838 furazanyl group Chemical group 0.000 description 2
- 125000002541 furyl group Chemical group 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 101150017583 gluC gene Proteins 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 2
- 125000004438 haloalkoxy group Chemical group 0.000 description 2
- 125000002632 imidazolidinyl group Chemical group 0.000 description 2
- 125000002883 imidazolyl group Chemical group 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 2
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 2
- 125000001041 indolyl group Chemical group 0.000 description 2
- 238000002329 infrared spectrum Methods 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- AWJUIBRHMBBTKR-UHFFFAOYSA-N isoquinoline Chemical compound C1=NC=CC2=CC=CC=C21 AWJUIBRHMBBTKR-UHFFFAOYSA-N 0.000 description 2
- 125000001786 isothiazolyl group Chemical group 0.000 description 2
- 125000000842 isoxazolyl group Chemical group 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000002757 morpholinyl group Chemical group 0.000 description 2
- 150000002825 nitriles Chemical class 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 229910000069 nitrogen hydride Inorganic materials 0.000 description 2
- 125000002868 norbornyl group Chemical group C12(CCC(CC1)C2)* 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 125000001715 oxadiazolyl group Chemical group 0.000 description 2
- 125000002971 oxazolyl group Chemical group 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 229960005190 phenylalanine Drugs 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 2
- 125000004193 piperazinyl group Chemical group 0.000 description 2
- 125000003386 piperidinyl group Chemical group 0.000 description 2
- 238000000623 plasma-assisted chemical vapour deposition Methods 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 150000003138 primary alcohols Chemical class 0.000 description 2
- 150000003141 primary amines Chemical class 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 125000003373 pyrazinyl group Chemical group 0.000 description 2
- 125000003226 pyrazolyl group Chemical group 0.000 description 2
- 125000002098 pyridazinyl group Chemical group 0.000 description 2
- 125000004076 pyridyl group Chemical group 0.000 description 2
- 125000000714 pyrimidinyl group Chemical group 0.000 description 2
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 2
- 125000000168 pyrrolyl group Chemical group 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 239000001044 red dye Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- CVHZOJJKTDOEJC-UHFFFAOYSA-N saccharin Chemical group C1=CC=C2C(=O)NS(=O)(=O)C2=C1 CVHZOJJKTDOEJC-UHFFFAOYSA-N 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 2
- 150000003333 secondary alcohols Chemical class 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 125000005017 substituted alkenyl group Chemical group 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 238000004885 tandem mass spectrometry Methods 0.000 description 2
- 238000011191 terminal modification Methods 0.000 description 2
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 2
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 2
- 125000005958 tetrahydrothienyl group Chemical group 0.000 description 2
- 125000004632 tetrahydrothiopyranyl group Chemical group S1C(CCCC1)* 0.000 description 2
- 125000003831 tetrazolyl group Chemical group 0.000 description 2
- 125000001113 thiadiazolyl group Chemical group 0.000 description 2
- 125000000335 thiazolyl group Chemical group 0.000 description 2
- 125000001544 thienyl group Chemical group 0.000 description 2
- 125000004568 thiomorpholinyl group Chemical group 0.000 description 2
- 125000004306 triazinyl group Chemical group 0.000 description 2
- 125000001425 triazolyl group Chemical group 0.000 description 2
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- PECGVEGMRUZOML-CQSZACIVSA-N (2r)-2-amino-3,3-diphenylpropanoic acid Chemical compound C=1C=CC=CC=1C([C@@H](N)C(O)=O)C1=CC=CC=C1 PECGVEGMRUZOML-CQSZACIVSA-N 0.000 description 1
- 125000003161 (C1-C6) alkylene group Chemical group 0.000 description 1
- 125000006716 (C1-C6) heteroalkyl group Chemical group 0.000 description 1
- 125000006747 (C2-C10) heterocycloalkyl group Chemical group 0.000 description 1
- 125000006570 (C5-C6) heteroaryl group Chemical group 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- JPRPJUMQRZTTED-UHFFFAOYSA-N 1,3-dioxolanyl Chemical group [CH]1OCCO1 JPRPJUMQRZTTED-UHFFFAOYSA-N 0.000 description 1
- FLBAYUMRQUHISI-UHFFFAOYSA-N 1,8-naphthyridine Chemical compound N1=CC=CC2=CC=CN=C21 FLBAYUMRQUHISI-UHFFFAOYSA-N 0.000 description 1
- 125000001462 1-pyrrolyl group Chemical group [*]N1C([H])=C([H])C([H])=C1[H] 0.000 description 1
- HYZJCKYKOHLVJF-UHFFFAOYSA-N 1H-benzimidazole Chemical compound C1=CC=C2NC=NC2=C1 HYZJCKYKOHLVJF-UHFFFAOYSA-N 0.000 description 1
- BAXOFTOLAUCFNW-UHFFFAOYSA-N 1H-indazole Chemical compound C1=CC=C2C=NNC2=C1 BAXOFTOLAUCFNW-UHFFFAOYSA-N 0.000 description 1
- 125000004206 2,2,2-trifluoroethyl group Chemical group [H]C([H])(*)C(F)(F)F 0.000 description 1
- OXBLVCZKDOZZOJ-UHFFFAOYSA-N 2,3-Dihydrothiophene Chemical compound C1CC=CS1 OXBLVCZKDOZZOJ-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- DJQYYYCQOZMCRC-UHFFFAOYSA-N 2-aminopropane-1,3-dithiol Chemical compound SCC(N)CS DJQYYYCQOZMCRC-UHFFFAOYSA-N 0.000 description 1
- 125000000143 2-carboxyethyl group Chemical group [H]OC(=O)C([H])([H])C([H])([H])* 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- JMTMSDXUXJISAY-UHFFFAOYSA-N 2H-benzotriazol-4-ol Chemical compound OC1=CC=CC2=C1N=NN2 JMTMSDXUXJISAY-UHFFFAOYSA-N 0.000 description 1
- 125000001698 2H-pyranyl group Chemical group O1C(C=CC=C1)* 0.000 description 1
- BXRLWGXPSRYJDZ-UHFFFAOYSA-N 3-cyanoalanine Chemical compound OC(=O)C(N)CC#N BXRLWGXPSRYJDZ-UHFFFAOYSA-N 0.000 description 1
- DMJNCFAKQKMMOK-UHFFFAOYSA-N 3-nitrobicyclo[2.2.1]hept-2-ene Chemical compound C1CC2C([N+](=O)[O-])=CC1C2 DMJNCFAKQKMMOK-UHFFFAOYSA-N 0.000 description 1
- 125000001397 3-pyrrolyl group Chemical group [H]N1C([H])=C([*])C([H])=C1[H] 0.000 description 1
- NIGWMJHCCYYCSF-QMMMGPOBSA-N 4-chloro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Cl)C=C1 NIGWMJHCCYYCSF-QMMMGPOBSA-N 0.000 description 1
- 125000001826 4H-pyranyl group Chemical group O1C(=CCC=C1)* 0.000 description 1
- GDRVFDDBLLKWRI-UHFFFAOYSA-N 4H-quinolizine Chemical compound C1=CC=CN2CC=CC=C21 GDRVFDDBLLKWRI-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 102100026882 Alpha-synuclein Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 125000006519 CCH3 Chemical group 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 102000003670 Carboxypeptidase B Human genes 0.000 description 1
- 108090000087 Carboxypeptidase B Proteins 0.000 description 1
- 102000000496 Carboxypeptidases A Human genes 0.000 description 1
- 108010080937 Carboxypeptidases A Proteins 0.000 description 1
- 108010075016 Ceruloplasmin Proteins 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000005698 Diels-Alder reaction Methods 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- KRHYYFGTRYWZRS-UHFFFAOYSA-M Fluoride anion Chemical compound [F-] KRHYYFGTRYWZRS-UHFFFAOYSA-M 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- PVHLMTREZMEJCG-GDTLVBQBSA-N Ile(5)-angiotensin II (1-7) Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N1[C@@H](CCC1)C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H](CCCNC(N)=[NH2+])NC(=O)[C@@H]([NH3+])CC([O-])=O)C(C)C)C1=CC=C(O)C=C1 PVHLMTREZMEJCG-GDTLVBQBSA-N 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- DGYHPLMPMRKMPD-UHFFFAOYSA-N L-propargyl glycine Natural products OC(=O)C(N)CC#C DGYHPLMPMRKMPD-UHFFFAOYSA-N 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-L Malonate Chemical compound [O-]C(=O)CC([O-])=O OFOBLEOULBTSOW-UHFFFAOYSA-L 0.000 description 1
- 150000001204 N-oxides Chemical class 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 108090000279 Peptidyltransferases Proteins 0.000 description 1
- 108010020346 Polyglutamic Acid Proteins 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108010077895 Sarcosine Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 108010078233 Thymalfasin Proteins 0.000 description 1
- 102400000800 Thymosin alpha-1 Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 150000001252 acrylic acid derivatives Chemical class 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 125000005073 adamantyl group Chemical group C12(CC3CC(CC(C1)C3)C2)* 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 150000001294 alanine derivatives Chemical class 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001338 aliphatic hydrocarbons Chemical class 0.000 description 1
- 125000002355 alkine group Chemical group 0.000 description 1
- 150000003973 alkyl amines Chemical class 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 108090000185 alpha-Synuclein Proteins 0.000 description 1
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 210000001742 aqueous humor Anatomy 0.000 description 1
- 150000007860 aryl ester derivatives Chemical class 0.000 description 1
- 125000000732 arylene group Chemical group 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 125000002393 azetidinyl group Chemical group 0.000 description 1
- 125000004069 aziridinyl group Chemical group 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- RQPZNWPYLFFXCP-UHFFFAOYSA-L barium dihydroxide Chemical compound [OH-].[OH-].[Ba+2] RQPZNWPYLFFXCP-UHFFFAOYSA-L 0.000 description 1
- 229910001863 barium hydroxide Inorganic materials 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- RFRXIWQYSOIBDI-UHFFFAOYSA-N benzarone Chemical compound CCC=1OC2=CC=CC=C2C=1C(=O)C1=CC=C(O)C=C1 RFRXIWQYSOIBDI-UHFFFAOYSA-N 0.000 description 1
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 1
- 125000000499 benzofuranyl group Chemical group O1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000004601 benzofurazanyl group Chemical group N1=C2C(=NO1)C(=CC=C2)* 0.000 description 1
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000004541 benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 description 1
- MKCBRYIXFFGIKN-UHFFFAOYSA-N bicyclo[1.1.1]pentane Chemical compound C1C2CC1C2 MKCBRYIXFFGIKN-UHFFFAOYSA-N 0.000 description 1
- JSMRMEYFZHIPJV-UHFFFAOYSA-N bicyclo[2.1.1]hexane Chemical compound C1C2CC1CC2 JSMRMEYFZHIPJV-UHFFFAOYSA-N 0.000 description 1
- BVCRERJDOOBZOH-UHFFFAOYSA-N bicyclo[2.2.1]heptanyl Chemical group C1C[C+]2CC[C-]1C2 BVCRERJDOOBZOH-UHFFFAOYSA-N 0.000 description 1
- GPRLTFBKWDERLU-UHFFFAOYSA-N bicyclo[2.2.2]octane Chemical compound C1CC2CCC1CC2 GPRLTFBKWDERLU-UHFFFAOYSA-N 0.000 description 1
- WNTGVOIBBXFMLR-UHFFFAOYSA-N bicyclo[3.3.1]nonane Chemical compound C1CCC2CCCC1C2 WNTGVOIBBXFMLR-UHFFFAOYSA-N 0.000 description 1
- BFTIPPVTTJTHLM-MNXVOIDGSA-N biocytinamide Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCC[C@H](N)C(N)=O)SC[C@@H]21 BFTIPPVTTJTHLM-MNXVOIDGSA-N 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- 239000001045 blue dye Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 229910021538 borax Inorganic materials 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 1
- 125000000480 butynyl group Chemical group [*]C#CC([H])([H])C([H])([H])[H] 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- ATZQZZAXOPPAAQ-UHFFFAOYSA-M caesium formate Chemical compound [Cs+].[O-]C=O ATZQZZAXOPPAAQ-UHFFFAOYSA-M 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 230000021235 carbamoylation Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- VQXINLNPICQTLR-UHFFFAOYSA-N carbonyl diazide Chemical class [N-]=[N+]=NC(=O)N=[N+]=[N-] VQXINLNPICQTLR-UHFFFAOYSA-N 0.000 description 1
- XEVRDFDBXJMZFG-UHFFFAOYSA-N carbonyl dihydrazine Chemical compound NNC(=O)NN XEVRDFDBXJMZFG-UHFFFAOYSA-N 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000004182 chemical digestion Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- WCZVZNOTHYJIEI-UHFFFAOYSA-N cinnoline Chemical compound N1=NC=CC2=CC=CC=C21 WCZVZNOTHYJIEI-UHFFFAOYSA-N 0.000 description 1
- 125000000259 cinnolinyl group Chemical group N1=NC(=CC2=CC=CC=C12)* 0.000 description 1
- PMMYEEVYMWASQN-QWWZWVQMSA-N cis-4-hydroxy-D-proline Chemical compound O[C@H]1C[NH2+][C@@H](C([O-])=O)C1 PMMYEEVYMWASQN-QWWZWVQMSA-N 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 230000006329 citrullination Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- ARUKYTASOALXFG-UHFFFAOYSA-N cycloheptylcycloheptane Chemical compound C1CCCCCC1C1CCCCCC1 ARUKYTASOALXFG-UHFFFAOYSA-N 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 125000002433 cyclopentenyl group Chemical group C1(=CCCC1)* 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 125000004855 decalinyl group Chemical group C1(CCCC2CCCCC12)* 0.000 description 1
- DIOQZVSQGTUSAI-NJFSPNSNSA-N decane Chemical compound CCCCCCCCC[14CH3] DIOQZVSQGTUSAI-NJFSPNSNSA-N 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 125000002576 diazepinyl group Chemical group N1N=C(C=CC=C1)* 0.000 description 1
- 125000001028 difluoromethyl group Chemical group [H]C(F)(F)* 0.000 description 1
- 125000005057 dihydrothienyl group Chemical group S1C(CC=C1)* 0.000 description 1
- 125000000532 dioxanyl group Chemical group 0.000 description 1
- 238000003618 dip coating Methods 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 125000005883 dithianyl group Chemical group 0.000 description 1
- 125000005411 dithiolanyl group Chemical group S1SC(CC1)* 0.000 description 1
- 238000000313 electron-beam-induced deposition Methods 0.000 description 1
- 125000006575 electron-withdrawing group Chemical group 0.000 description 1
- 230000003241 endoproteolytic effect Effects 0.000 description 1
- 210000001842 enterocyte Anatomy 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 125000004494 ethyl ester group Chemical group 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- KTWOOEGAPBSYNW-UHFFFAOYSA-N ferrocene Chemical compound [Fe+2].C=1C=C[CH-]C=1.C=1C=C[CH-]C=1 KTWOOEGAPBSYNW-UHFFFAOYSA-N 0.000 description 1
- 238000002795 fluorescence method Methods 0.000 description 1
- 238000002875 fluorescence polarization Methods 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 125000004216 fluoromethyl group Chemical group [H]C([H])(F)* 0.000 description 1
- 238000005558 fluorometry Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- IAODRFIZLKITMK-UHFFFAOYSA-N furan-2,3-dione Chemical compound O=C1OC=CC1=O IAODRFIZLKITMK-UHFFFAOYSA-N 0.000 description 1
- 125000004612 furopyridinyl group Chemical group O1C(=CC2=C1C=CC=N2)* 0.000 description 1
- YQGDEPYYFWUPGO-UHFFFAOYSA-N gamma-amino-beta-hydroxybutyric acid Chemical compound [NH3+]CC(O)CC([O-])=O YQGDEPYYFWUPGO-UHFFFAOYSA-N 0.000 description 1
- HNJBEVLQSNELDL-UHFFFAOYSA-N gamma-butyrolactam Natural products O=C1CCCN1 HNJBEVLQSNELDL-UHFFFAOYSA-N 0.000 description 1
- 229920000370 gamma-poly(glutamate) polymer Polymers 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 150000002332 glycine derivatives Chemical class 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000001046 green dye Substances 0.000 description 1
- 150000002357 guanidines Chemical class 0.000 description 1
- ZRALSGWEFCBTJO-UHFFFAOYSA-O guanidinium Chemical compound NC(N)=[NH2+] ZRALSGWEFCBTJO-UHFFFAOYSA-O 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000005980 hexynyl group Chemical group 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 125000002768 hydroxyalkyl group Chemical group 0.000 description 1
- NPZTUJOABDZTLV-UHFFFAOYSA-N hydroxybenzotriazole Substances O=C1C=CC=C2NNN=C12 NPZTUJOABDZTLV-UHFFFAOYSA-N 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 125000002962 imidazol-1-yl group Chemical group [*]N1C([H])=NC([H])=C1[H] 0.000 description 1
- 125000003037 imidazol-2-yl group Chemical group [H]N1C([*])=NC([H])=C1[H] 0.000 description 1
- 125000002140 imidazol-4-yl group Chemical group [H]N1C([H])=NC([*])=C1[H] 0.000 description 1
- 125000000336 imidazol-5-yl group Chemical group [H]N1C([H])=NC([H])=C1[*] 0.000 description 1
- 125000002636 imidazolinyl group Chemical group 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 125000003453 indazolyl group Chemical group N1N=C(C2=C1C=CC=C2)* 0.000 description 1
- 125000003387 indolinyl group Chemical group N1(CCC2=CC=CC=C12)* 0.000 description 1
- HOBCFUWDNJPFHB-UHFFFAOYSA-N indolizine Chemical compound C1=CC=CN2C=CC=C21 HOBCFUWDNJPFHB-UHFFFAOYSA-N 0.000 description 1
- 125000003406 indolizinyl group Chemical group C=1(C=CN2C=CC=CC12)* 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 125000002346 iodo group Chemical group I* 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 125000000904 isoindolyl group Chemical group C=1(NC=C2C=CC=CC12)* 0.000 description 1
- 125000002183 isoquinolinyl group Chemical group C1(=NC=CC2=CC=CC=C12)* 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000007169 ligase reaction Methods 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 238000005649 metathesis reaction Methods 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 150000004702 methyl esters Chemical class 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 244000005706 microflora Species 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- DIOQZVSQGTUSAI-UHFFFAOYSA-N n-butylhexane Natural products CCCCCCCCCC DIOQZVSQGTUSAI-UHFFFAOYSA-N 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 125000001624 naphthyl group Chemical group 0.000 description 1
- 125000004593 naphthyridinyl group Chemical group N1=C(C=CC2=CC=CN=C12)* 0.000 description 1
- 125000001971 neopentyl group Chemical group [H]C([*])([H])C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 150000002826 nitrites Chemical class 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- UMRZSTCPUPJPOJ-KNVOCYPGSA-N norbornane Chemical compound C1C[C@H]2CC[C@@H]1C2 UMRZSTCPUPJPOJ-KNVOCYPGSA-N 0.000 description 1
- 150000002848 norbornenes Chemical class 0.000 description 1
- 125000003518 norbornenyl group Chemical group C12(C=CC(CC1)C2)* 0.000 description 1
- 238000010534 nucleophilic substitution reaction Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 125000003551 oxepanyl group Chemical group 0.000 description 1
- 125000003566 oxetanyl group Chemical group 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 1
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 1
- 125000005981 pentynyl group Chemical group 0.000 description 1
- 150000002994 phenylalanines Chemical class 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000007146 photocatalysis Methods 0.000 description 1
- LFSXCDWNBUNEEM-UHFFFAOYSA-N phthalazine Chemical compound C1=NN=CC2=CC=CC=C21 LFSXCDWNBUNEEM-UHFFFAOYSA-N 0.000 description 1
- 125000004592 phthalazinyl group Chemical group C1(=NN=CC2=CC=CC=C12)* 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 229920000083 poly(allylamine) Polymers 0.000 description 1
- 229920000052 poly(p-xylylene) Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 150000003147 proline derivatives Chemical class 0.000 description 1
- 125000004368 propenyl group Chemical group C(=CC)* 0.000 description 1
- 125000002568 propynyl group Chemical group [*]C#CC([H])([H])[H] 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 210000004908 prostatic fluid Anatomy 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 238000000164 protein isolation Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 238000000575 proteomic method Methods 0.000 description 1
- CPNGPNLZQNNVQM-UHFFFAOYSA-N pteridine Chemical compound N1=CN=CC2=NC=CN=C21 CPNGPNLZQNNVQM-UHFFFAOYSA-N 0.000 description 1
- 125000001042 pteridinyl group Chemical group N1=C(N=CC2=NC=CN=C12)* 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 125000003072 pyrazolidinyl group Chemical group 0.000 description 1
- 125000002755 pyrazolinyl group Chemical group 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- HNJBEVLQSNELDL-YZRHJBSPSA-N pyrrolidin-2-one Chemical group O=C1CC[14CH2]N1 HNJBEVLQSNELDL-YZRHJBSPSA-N 0.000 description 1
- 125000004292 pyrrolin-2-yl group Chemical group [H]C1([H])N=C(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000004363 pyrrolin-3-yl group Chemical group [H]C1=NC([H])([H])C([H])([H])C1([H])* 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- JWVCLYRUEFBMGU-UHFFFAOYSA-N quinazoline Chemical compound N1=CN=CC2=CC=CC=C21 JWVCLYRUEFBMGU-UHFFFAOYSA-N 0.000 description 1
- 125000002294 quinazolinyl group Chemical group N1=C(N=CC2=CC=CC=C12)* 0.000 description 1
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 125000001567 quinoxalinyl group Chemical group N1=C(C=NC2=CC=CC=C12)* 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 229940043267 rhodamine b Drugs 0.000 description 1
- 239000001022 rhodamine dye Substances 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 125000006413 ring segment Chemical group 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 229940043230 sarcosine Drugs 0.000 description 1
- 150000003335 secondary amines Chemical class 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- FZHAPNGMFPVSLP-UHFFFAOYSA-N silanamine Chemical compound [SiH3]N FZHAPNGMFPVSLP-UHFFFAOYSA-N 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 235000010339 sodium tetraborate Nutrition 0.000 description 1
- 238000003836 solid-state method Methods 0.000 description 1
- 239000011537 solubilization buffer Substances 0.000 description 1
- 238000010530 solution phase reaction Methods 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000004528 spin coating Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 125000004426 substituted alkynyl group Chemical group 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 125000005346 substituted cycloalkyl group Chemical group 0.000 description 1
- 108010037022 subtiligase Proteins 0.000 description 1
- YBBRCQOCSYXUOC-UHFFFAOYSA-N sulfuryl dichloride Chemical class ClS(Cl)(=O)=O YBBRCQOCSYXUOC-UHFFFAOYSA-N 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 150000003509 tertiary alcohols Chemical class 0.000 description 1
- 150000003512 tertiary amines Chemical class 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- WGTODYJZXSJIAG-UHFFFAOYSA-N tetramethylrhodamine chloride Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C(O)=O WGTODYJZXSJIAG-UHFFFAOYSA-N 0.000 description 1
- 125000005308 thiazepinyl group Chemical group S1N=C(C=CC=C1)* 0.000 description 1
- 125000001583 thiepanyl group Chemical group 0.000 description 1
- 125000002053 thietanyl group Chemical group 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 150000003558 thiocarbamic acid derivatives Chemical class 0.000 description 1
- 150000003567 thiocyanates Chemical class 0.000 description 1
- 125000005503 thioxanyl group Chemical group 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- NZVYCXVTEHPMHE-ZSUJOUNUSA-N thymalfasin Chemical compound CC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NZVYCXVTEHPMHE-ZSUJOUNUSA-N 0.000 description 1
- 229960004231 thymalfasin Drugs 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- ZGYICYBLPGRURT-UHFFFAOYSA-N tri(propan-2-yl)silicon Chemical compound CC(C)[Si](C(C)C)C(C)C ZGYICYBLPGRURT-UHFFFAOYSA-N 0.000 description 1
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 description 1
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 1
- 150000003667 tyrosine derivatives Chemical class 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 238000007740 vapor deposition Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000001429 visible spectrum Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/13—Labelling of peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/485—Exopeptidases (3.4.11-3.4.19)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N11/00—Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
- C12N11/02—Enzymes or microbial cells immobilised on or in an organic carrier
- C12N11/06—Enzymes or microbial cells immobilised on or in an organic carrier attached to the carrier via a bridging agent
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/58—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本明細書には、ペプチドまたはタンパク質のC末端アミノ酸を選択的に切断するための方法が記載される。本明細書に記載される方法は、例えば、1分子ペプチドまたはタンパク質シーケンシングに適用され得る。TIFF2023514316000009.tif66168
Description
本願は、2020年2月18日に出願された米国特許仮出願第62/978,035号の優先権を主張するものであり、その全体が参照により本明細書に組み入れられる。
連邦政府の助成を受けた研究に関する記述
本発明は、米国国立衛生研究所からR35 GM122480として授与された政府の助成金を得てなされた。米国政府は本発明に一定の権利を有する。
本発明は、米国国立衛生研究所からR35 GM122480として授与された政府の助成金を得てなされた。米国政府は本発明に一定の権利を有する。
背景
ペプチド分子の反応性アミノ酸側鎖を選択的かつ高効率に標識するための合成技法が開発されている。N末端アミノ酸を内側アミノ酸残基(例えば、リジン)と区別するための方法論が探られてもいる。しかし、ペプチドまたはタンパク質のC末端に化学ハンドルを区別的に結合させるための方法論は、一般化された手順には適用できない。それは、例えば、(i)酸性アミノ酸残基(例えば、アスパラギン酸とグルタミン酸)の反応性が似ていること、および(ii)残基の酸性側鎖はC末端の酸性部分の約50倍豊富であることから、元来困難である。タンパク質およびペプチドを、末端アミノ酸のアイデンティティにより生じるバイアスは一切なしで、C末端を介して固定ハンドルに連結する困難を克服することが、プロテオミクスの研究などで必要とされている。
ペプチド分子の反応性アミノ酸側鎖を選択的かつ高効率に標識するための合成技法が開発されている。N末端アミノ酸を内側アミノ酸残基(例えば、リジン)と区別するための方法論が探られてもいる。しかし、ペプチドまたはタンパク質のC末端に化学ハンドルを区別的に結合させるための方法論は、一般化された手順には適用できない。それは、例えば、(i)酸性アミノ酸残基(例えば、アスパラギン酸とグルタミン酸)の反応性が似ていること、および(ii)残基の酸性側鎖はC末端の酸性部分の約50倍豊富であることから、元来困難である。タンパク質およびペプチドを、末端アミノ酸のアイデンティティにより生じるバイアスは一切なしで、C末端を介して固定ハンドルに連結する困難を克服することが、プロテオミクスの研究などで必要とされている。
概要
本明細書には、タンパク質およびペプチドのC末端カルボン酸を選択的に修飾するための組成物および(例えば、化学的および酵素的)方法が記載される。連結方法としては、例えば、オキサゾロンベースのケミストリー、光レドックスケミストリー、カルボキシペプチダーゼ(例えば、カルボキシペプチダーゼY)、およびペプチリガーゼ(例えば、オムニリガーゼ(Omniligase))の使用が挙げられる。別の局面では、本明細書では、ペプチドのC末端を選択的に反応させるためのハンドルを含む組成物が記載され、以後はC末端カップリング試薬と呼ばれる。本明細書に記載される方法および組成物は、例えばタンパク質およびペプチドの(i)表面固定化、(ii)多重化(例えば、化学バーコードを介する)、(iii)濃縮、(iv)フルオロシーケンシング(例えば、1分子タンパク質シーケンシング)、ならびに(v)ナノポア転位およびシーケンシングなどの、いくつかの用途のために構成されていてもよい、ペプチドのヘテロ集団を提供することができ、そのすべてが一定なC末端カップリング試薬を含有している。
本明細書には、タンパク質およびペプチドのC末端カルボン酸を選択的に修飾するための組成物および(例えば、化学的および酵素的)方法が記載される。連結方法としては、例えば、オキサゾロンベースのケミストリー、光レドックスケミストリー、カルボキシペプチダーゼ(例えば、カルボキシペプチダーゼY)、およびペプチリガーゼ(例えば、オムニリガーゼ(Omniligase))の使用が挙げられる。別の局面では、本明細書では、ペプチドのC末端を選択的に反応させるためのハンドルを含む組成物が記載され、以後はC末端カップリング試薬と呼ばれる。本明細書に記載される方法および組成物は、例えばタンパク質およびペプチドの(i)表面固定化、(ii)多重化(例えば、化学バーコードを介する)、(iii)濃縮、(iv)フルオロシーケンシング(例えば、1分子タンパク質シーケンシング)、ならびに(v)ナノポア転位およびシーケンシングなどの、いくつかの用途のために構成されていてもよい、ペプチドのヘテロ集団を提供することができ、そのすべてが一定なC末端カップリング試薬を含有している。
例えば、図1Aは、本明細書に記載される化合物および方法の区別能力を例示している。ペプチド、タンパク質、またはそれらの組み合わせのC末端カルボン酸残基は、酵素的方法、化学的方法、またはそれらの組み合わせを用いて、カルボン酸残基(例えば、グルタミン酸およびアスパラギン酸)を含む内側アミノ酸と区別され得る。本明細書に記載される方法および組成物は、C末端アミノ酸残基を介して修飾された(例えば、C末端カップリング試薬に結合された)タンパク質、ペプチド、またはそれらの組み合わせを生産し得る。いくつかの態様では、ペプチド、タンパク質、またはそれらの組み合わせのC末端カルボン酸残基は、本明細書に記載される組成物および方法を用いて、カルボン酸アミノ酸残基を含有する内側アミノ酸残基と区別され得る。ハンドルの組成によって(例えば、図1B)、これらのタンパク質、ペプチド、またはそれらの組み合わせは本明細書に記載されるように操作されて、例えばフルオロシーケンシングなどの様々なプロテオミクス用途を達成し得る(図2)。いくつかの態様では、本明細書に記載される方法および組成物は、タンパク質、ペプチド、またはそれらの組み合わせの1分子フルオロシーケンシングに適用できる。タンパク質またはペプチドのC末端を選択的に標識すること(例えば、C末端カップリング試薬をタンパク質またはペプチドC末端に結合させること)は、例えば、表面に結合するハンドル、ペプチドまたはタンパク質の場所を決定する基準、およびペプチドまたはタンパク質のアイデンティティを決定するバーコードを提供し得る。
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が記載され、前記方法は、前記第2のカルボン酸部分よりも優先的に、前記第1のカルボン酸部分を、反応性物質(例えば、C末端カップリング試薬)と結合させる工程を含む。いくつかの態様では、前記第1のカルボン酸部分と前記反応性物質との結合は、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも50%優先的である。いくつかの態様では、前記第1のカルボン酸部分と前記反応性物質との結合は、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも75%優先的である。いくつかの態様では、前記第1のカルボン酸部分と前記反応性物質との結合は、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも90%優先的である。いくつかの態様では、前記第1のカルボン酸部分と前記反応性物質との結合は、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも95%優先的である。いくつかの態様では、前記第1のカルボン酸部分と前記反応性物質との結合は、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも98%優先的である。いくつかの態様では、前記第1のカルボン酸部分と前記反応性物質との結合は、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも99%優先的である。いくつかの態様では、前記第1のカルボン酸部分と前記反応性物質との結合は、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも99.99%優先的である。いくつかの態様では、ペプチドまたはタンパク質は、(例えば、ガラススライド、ナノ粒子、またはミクロ粒子などの基板に)固定化されている。
特定の局面では、本明細書には、第1のカルボン酸部分(例えば、C末端アミノ酸カルボキシルであり、かつC末端側鎖ではない)を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が記載され、前記方法は、前記ペプチドまたはタンパク質の前記第2のカルボン酸部分よりも優先的に、前記固定化されたペプチドまたは前記タンパク質の前記第1のカルボン酸部分を、反応性物質と結合させる工程を含む。いくつかの態様では、ペプチドまたはタンパク質は固定化されている。
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が記載され、前記方法は、前記第2のカルボン酸部分よりも優先的に、前記第1のカルボン酸部分を、反応性物質と結合させる工程を含み、前記反応性試薬は、官能基付与部分、濃縮部分、またはそれらの組み合わせを含む。
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するため方法が記載され、前記方法は、前記反応性物質と前記第2のカルボン酸部分との結合の非存在下で、反応性物質(例えば、C末端カップリング試薬)を前記第1のカルボン酸部分に結合させる工程を含む。いくつかの態様では、前記ペプチドまたはタンパク質は、少なくとも2個の内側アミノ酸残基を含み、前記少なくとも2個の内側アミノ酸残基のうちの少なくとも1個が、前記第2のカルボン酸部分を含む。いくつかの態様では、前記ペプチドまたはタンパク質は、少なくとも20個の内側アミノ酸残基を含み、前記少なくとも20個の内側アミノ酸残基のうちの少なくとも1個が、第2のカルボン酸部分を含む。
いくつかの態様では、前記反応性物質は、標識を含む。いくつかの態様では、前記標識は、光学標識(例えばフルオロフォア)、核酸分子(例えば、DNA、RNA、PNA)、イオン化可能分子(例えば、臭素、アミン、ホスファート)、ポリエチレンスペーサー、ポリアルギニンペプチド、またはそれらの任意の組み合わせを含む。いくつかの態様では、前記核酸分子は、核酸バーコードを含む。
いくつかの態様では、前記反応性物質は、求核剤または求電子剤を含む。いくつかの態様では、前記求核剤は、アミン、アルコール、硫化物、シアナート、チオシアナート、負電荷種、またはそれらの任意の組み合わせを含む。いくつかの態様では、前記求電子剤は、マイケルアクセプター、アルケン、ジエン、アクリルアミド、N-(プロパ-2-イン-1-イル)メチルアクリルアミド、イソシアナート、イソチオシアナート、立体構造制限部分(例えば、オキシラン、α,β-不飽和カルボニル)、ビニルスルホン、またはそれらの任意の組み合わせを含む。
いくつかの態様では、前記反応性物質は、官能基付与部分、濃縮部分、またはそれらの組み合わせを含む。いくつかの態様では、前記官能基付与部分は、アルキン、アジド、フルオロフォア、ビオチン、核酸分子(例えば、RNA、DNA、PNA)、アミノ酸、ペプチド、固体支持体ビーズもしくは樹脂、またはそれらの任意の組み合わせを含む。いくつかの態様では、前記濃縮部分は、アルキン、アジド、フルオロフォア、ビオチン、核酸分子(例えば、RNA、DNA、PNA)、アミノ酸、ペプチド、固体支持体ビーズもしくは樹脂、またはそれらの任意の組み合わせを含む。
いくつかの態様では、方法は、前記ペプチドまたはタンパク質を、少なくとも1つの化学物質、少なくとも1つの酵素、またはそれらの組み合わせで処理する工程をさらに含む。いくつかの態様では、前記少なくとも1つの化学物質は、光触媒である。いくつかの態様では、前記光触媒は、ルミフラビンである。いくつかの態様では、前記少なくとも1つの化学物質は、前記ペプチドまたはタンパク質と反応して、前記ペプチドまたはタンパク質のオキサゾロン中間体を形成する。いくつかの態様では、前記少なくとも1つの化学物質は、無水酢酸、ヒドロキシベンゾトリアゾール(HOBT)、ヒドロキシアザベンゾトリアゾール(HOAT)、2-ニトロ-5-チオ安息香酸(NTCB)、またはそれらの組み合わせを含む。いくつかの態様では、前記少なくとも1つの酵素は、エンドペプチダーゼ、エキソペプチダーゼ、カルボキシペプチダーゼ、アミダーゼ、ヒドロラーゼ、プロテイナーゼ、ペプチリガーゼ、またはそれらの任意の組み合わせである。いくつかの態様では、前記ペプチリガーゼは、オムニリガーゼである。いくつかの態様では、前記ペプチリガーゼは、水中でペプチド結合を触媒する酵素である。いくつかの態様では、前記カルボキシペプチダーゼは、カルボキシペプチダーゼYである。いくつかの態様では、前記プロテイナーゼは、サーモリシンである。
いくつかの態様では、方法は、複数のペプチドまたはタンパク質を切断する工程を含み得、ここで前記複数のペプチドまたはタンパク質は、1つの前記ペプチドまたはタンパク質を含む。いくつかの態様では、前記反応性物質は、前記ペプチドまたはタンパク質の(i)前記少なくとも1個の内側アミノ酸残基および(ii)N末端アミノ酸残基と実質的に結合しない。いくつかの態様では、前記反応性物質は、前記ペプチドまたはタンパク質のいずれの内側アミノ酸残基とも実質的に結合しない。
いくつかの態様では、前記少なくとも1個の内側アミノ酸残基は、天然アミノ酸である。いくつかの態様では、前記少なくとも1つの前記内側アミノ酸残基は、アミン、カルボン酸、インドール、アルコール、チオール、チオエーテル、フェノール、アミド、グアニジウム、およびイミダゾールからなる群より選択される官能基を含む。いくつかの態様では、前記少なくとも1つの前記内側アミノ酸残基は、アミン、カルボン酸、およびチオールからなる群より選択される官能基を含む。いくつかの態様では、前記少なくとも1つの前記内側アミノ酸残基は、非天然アミノ酸である。
いくつかの態様では、前記ペプチドもしくはタンパク質の前記少なくとも1個の内側アミノ酸残基、前記ペプチドもしくはタンパク質の前記N末端アミノ酸残基、またはそれらの組み合わせが、前記反応性物質を前記第1のカルボン酸部分に結合させる前に修飾される。いくつかの態様では、前記ペプチドもしくはタンパク質の前記少なくとも1個の内側アミノ酸残基、前記ペプチドもしくはタンパク質の前記N末端アミノ酸残基、またはそれらの組み合わせは、前記反応性物質を前記第1のカルボン酸部分に結合させた後に修飾される。いくつかの態様では、前記ペプチドまたはタンパク質は、可逆的に修飾される。
いくつかの態様では、前記少なくとも1個の内側アミノ酸残基は、システイン、リジン、チロシン、トリプトファン、セリン、ヒスチジン、スレオニン、およびアルギニン、リン酸化アミノ酸、翻訳後修飾されたアミノ酸、またはそれらの任意の組み合わせからなる群より選択される。いくつかの態様では、前記少なくとも1個の内側アミノ酸残基は、システインおよびリジンからなる群より選択される。いくつかの態様では、前記少なくとも1個の内側アミノ酸残基は、少なくとも1つの標識に結合される。いくつかの態様では、前記複数の内側アミノ酸残基の各内側アミノ酸は、前記少なくとも1つの標識に結合される。いくつかの態様では、前記少なくとも1つの標識は、各内側アミノ酸タイプの異なる標識に対応する。
いくつかの態様では、前記少なくとも1つの標識は、光学標識である。いくつかの態様では、前記光学標識は、フルオロフォアである。
いくつかの態様では、方法は、表面固定化、試料多重化、試料濃縮、シーケンシング、標的同定、質量分析、またはそれらの任意の組み合わせのために、標識されたペプチドまたはタンパク質を生産する工程をさらに含む。いくつかの態様では、前記シーケンシングは、1分子シーケンシング、ナノポアシーケンシング、フルオロシーケンシング、またはそれらの組み合わせである。
いくつかの態様では、方法は、前記ペプチドまたはタンパク質を生物学的試料から単離する工程をさらに含む。いくつかの態様では、前記生物学的試料は、組織、血液、尿、唾液、リンパ液、またはそれらの任意の組み合わせに由来する。いくつかの態様では、前記ペプチドまたはタンパク質は、組換えまたは合成ペプチドまたはタンパク質である。
いくつかの態様では、方法は、前記ペプチドまたはタンパク質を消化する工程をさらに含む。いくつかの態様では、方法は、(i)前記ペプチドまたはタンパク質を単離する工程、(ii)前記ペプチドまたはタンパク質を固体支持体に固定化する工程、(iii)少なくとも1個の内側アミノ酸残基を標識する工程、および(iv)前記ペプチドまたはタンパク質を前記固体支持体から遊離する工程をさらに含む。いくつかの態様では、前記ペプチドまたはタンパク質を固定化する工程は、前記ペプチドまたはタンパク質のN末端アミノ酸残基を、前記固体支持体に結合された捕捉部分に結合させることを含む。いくつかの態様では、前記捕捉部分は、アルデヒドを含む。いくつかの態様では、前記捕捉部分は、ピリジンカルボキシアルデヒドまたはそのアナログを含む。
参照による組み入れ
本明細書に記載されるすべての刊行物、特許、および特許出願は、一つ一つの刊行物、特許、および特許出願が、参照により組み入れられる、と具体的かつ個別に示されたも同然に、本明細書に参照により組み入れられる。
本明細書に記載されるすべての刊行物、特許、および特許出願は、一つ一つの刊行物、特許、および特許出願が、参照により組み入れられる、と具体的かつ個別に示されたも同然に、本明細書に参照により組み入れられる。
本発明の特徴は、添付の請求項に具体的に示される。本発明の特徴および利点のより良い理解が、本発明の原理が活用されている例示的な態様を示す以下の詳しい説明、および添付の図面を参照することにより得られよう。
リガンド結合のためのC末端カルボン酸連結の概略図である。
C末端カップリング試薬の設計の概略図である。
C末端連結を用いるフルオロシーケンシング技術の原理の例示である。
C末端カルボン酸をC末端カップリング試薬で標識するためのオキサゾロンケミストリーを含む化学的方法の一例を表す。
図4Aおよび4Bは、ペプチドの末端カルボキシラートをアジドハンドルで標識したMSスペクトルの証拠を表す。配列H2N-ELYAEKVATR-OH(SEQ ID NO:22)を有するペプチドを求核性ハンドル(H2N-PEG4-アジド)に結合させる。産物の12分間のLC/MS分離を実施し(図4A)、MS1スペクトル(m/z-716.7、+2 電荷)は所望の産物を示している(図4B)。
図5A~Hは、アンジオテンシンのC末端の光レドックス触媒による結合の反応スキームを示す。(Asp-Arg-Val-Tyr-Ile-His-Pro = SEQ ID NO: 23)図5Bおよび図5Cは、12分間のLC分離の523~524(5B、アンジオテンシン - 5.3分にピークのある抽出)および594~595(5C、アンジオテンシンC末端付加物)に対応する質量範囲の抽出イオンクロマトグラムを示す。図5D~5Hは、図5Bおよび図5Cの高分解能画像である。
(a)ペプチドC末端カルボン酸残基への結合用のアミンまたはマイケルアクセプター、(b)ハイブリダイゼーションによる検出用のバーコード化核酸オリゴマー、および(c)アルキン官能基付与表面を用いるクリックケミストリー固定化のためのアルキン残基を含む、C末端カップリング試薬の一例を示す。
フルオロシーケンシング技術による同定および定量のために異なる試料からペプチドを多重化する概略を例示する。
光レドックスC末端標識アッセイ用のベンチトップのセットアップの写真を提供する。
図9Aは、光レドックスC末端標識反応のスキームを提供する。図9Bは、アンジオテンシンIIの光レドックスC末端標識アッセイの液体クロマトグラフィー質量分析(LCMS)の結果を提供する。図9Cは、ノルボルネノン標識されたアンジオテンシンIIの質量スペクトルを提供する。
図10Aは、光レドックス結合アッセイによる、トリプシン処理されたウシ胎仔血清アルブミン(BSA)、ヒトタンパク質単離物、および酵母タンパク質単離物のノルボルネノンでのC末端標識効率を要約している。図10Bは、光レドックス結合アッセイによる、GluCおよびトリプシン消化された、ウシ胎仔血清アルブミン(BSA)、ヒトタンパク質単離物、および酵母タンパク質単離物のノルボルネノンでのC末端標識効率を要約している。
様々なアミノ酸を末端にもつペプチドのC末端標識効率を要約している。
図12パネルAは、C末端および選択的アミノ酸側鎖の標識を含むペプチドフルオロシーケンシングのスキームを提供する。図12パネルBは、基板に固定化され蛍光標識された複数のペプチドの蛍光画像を提供する。図12パネルCは、図12パネルAに概説したアンジオテンシン、配列AK*AGANY{PRA}R-ONH2(SEQ ID NO: 24)を含むペプチド、およびペプチドフリーの水を用いたアッセイからのペプチドの数を提供する。
異なるC末端アミノ酸タイプを含むペプチドのばらばらなC末端標識効率の表を提供する。
詳細な説明
ペプチドまたはタンパク質のC末端カルボン酸を選択的に反応させることは、例えば、ペプチドおよびタンパク質のC末端カルボン酸と、カルボン酸部分(例えば、グルタマートおよびアスパルタート)を含むアミノ酸残基との化学的類似性のため、些末事ではない。C末端カルボキシルを選択的に標的にする能力は、プロテオミクス分野において幅広いポテンシャルを有する。C末端を標識することを、官能基付与された求核性ハンドルの設計により改変することで、1分子タンパク質シーケンシング、質量分析、ペプチド精製、およびナノポア技術における数々の方法に有用性が提供される。一局面では、本明細書では、例えば、(a)作用物質(例えば、C末端カップリング試薬)をペプチドまたはタンパク質のC末端アミノ酸と選択的に反応させるための方法、(b)ペプチドまたはタンパク質のC末端アミノ酸と選択的に反応することができる組成物および作用物質(例えば、C末端カップリング試薬)、ならびに(c)本明細書に記載されるC末端選択性作用物質を用いる数々のプロテオミクス技術、例えば、1分子タンパク質シーケンシングなどの用途および方法が記載される。
ペプチドまたはタンパク質のC末端カルボン酸を選択的に反応させることは、例えば、ペプチドおよびタンパク質のC末端カルボン酸と、カルボン酸部分(例えば、グルタマートおよびアスパルタート)を含むアミノ酸残基との化学的類似性のため、些末事ではない。C末端カルボキシルを選択的に標的にする能力は、プロテオミクス分野において幅広いポテンシャルを有する。C末端を標識することを、官能基付与された求核性ハンドルの設計により改変することで、1分子タンパク質シーケンシング、質量分析、ペプチド精製、およびナノポア技術における数々の方法に有用性が提供される。一局面では、本明細書では、例えば、(a)作用物質(例えば、C末端カップリング試薬)をペプチドまたはタンパク質のC末端アミノ酸と選択的に反応させるための方法、(b)ペプチドまたはタンパク質のC末端アミノ酸と選択的に反応することができる組成物および作用物質(例えば、C末端カップリング試薬)、ならびに(c)本明細書に記載されるC末端選択性作用物質を用いる数々のプロテオミクス技術、例えば、1分子タンパク質シーケンシングなどの用途および方法が記載される。
用語および定義:
本明細書で使用する場合、単数形の「1つの(a)」、「1つの(and)」、および「その(the)」は、文脈からそうではないことが明示されないかぎり、複数形の指示対象も含む。したがって、例えば、「1つの作用物質」への言及は、そのような作用物質の複数を含み、また、「その細胞」への言及は、1つまたは複数の細胞(あるいは複数の細胞)および当業者には公知のそれらの等価物への言及を含む。本明細書で、分子量などの物理特性または化学式などの化学特性に、範囲が用いられる場合、範囲のあらゆる組み合わせおよび下位の組み合わせ、ならびにその具体的な態様も、含まれるものとする。「約」という用語は、数または数の範囲に言及する場合、言及された数または数の範囲が、実験のばらつきの近似内(または統計学的実験誤差内)にあること、したがって、数または数の範囲は、記述された数または数の範囲から1%~15%のばらつきがあり得ることを意味する。「~を含む(comprising)」という用語(および「~を含む(comprise)」または「~を含む(comprises)」または「~を有する(having)」または「~を含む(including)」などの関連用語)は、他の特定の態様、例えば本明細書に記載される任意の物質の組成物、組成物、方法、またはプロセス等の態様が、記載の事柄「からなる」または「から本質的になる」かもしれないことを排除するものではない。
本明細書で使用する場合、単数形の「1つの(a)」、「1つの(and)」、および「その(the)」は、文脈からそうではないことが明示されないかぎり、複数形の指示対象も含む。したがって、例えば、「1つの作用物質」への言及は、そのような作用物質の複数を含み、また、「その細胞」への言及は、1つまたは複数の細胞(あるいは複数の細胞)および当業者には公知のそれらの等価物への言及を含む。本明細書で、分子量などの物理特性または化学式などの化学特性に、範囲が用いられる場合、範囲のあらゆる組み合わせおよび下位の組み合わせ、ならびにその具体的な態様も、含まれるものとする。「約」という用語は、数または数の範囲に言及する場合、言及された数または数の範囲が、実験のばらつきの近似内(または統計学的実験誤差内)にあること、したがって、数または数の範囲は、記述された数または数の範囲から1%~15%のばらつきがあり得ることを意味する。「~を含む(comprising)」という用語(および「~を含む(comprise)」または「~を含む(comprises)」または「~を有する(having)」または「~を含む(including)」などの関連用語)は、他の特定の態様、例えば本明細書に記載される任意の物質の組成物、組成物、方法、またはプロセス等の態様が、記載の事柄「からなる」または「から本質的になる」かもしれないことを排除するものではない。
「実質的に」または「実質的な」という用語は、本明細書で使用する場合、例えばもとの組成物またはある物体の状態などの基準に対して、少なくとも約60%もしくは60%、約70%もしくは70%、約75%もしくは75%、約80%もしくは80%、約85%もしくは85%、約90%もしくは90%、約95%もしくは95%、約96%もしくは96%、約97%もしくは97%、約98%もしくは98%、または約99%もしくは99%、またはそれ以上を一般に指す。したがって、内側アミノ酸に「実質的に」結合しない作用物質とは、少なくとも約60%もしくは60%、約70%もしくは70%、約75%もしくは75%、約80%もしくは80%、約85%もしくは85%、約90%もしくは90%、約95%もしくは95%、約96%もしくは96%、約97%もしくは97%、約98%もしくは98%、または約99%もしくは99%、またはそれ以上の量の作用物質が、内側アミノ酸と反応していないことを示す。
「選択的」または「選択的に」という用語は、本明細書で使用する場合、別の組成物よりもある組成物に対する、少なくとも約50%もしくは50%、約60%もしくは60%、約70%もしくは70%、約75%もしくは75%、約80%もしくは80%、約85%もしくは85%、約90%もしくは90%、約95%もしくは95%、約96%もしくは96%、約97%もしくは97%、約98%もしくは98%、約99%もしくは99%、または100%の好みを一般に指す。例えば、ペプチドまたはタンパク質のC末端アミノ酸に対し「選択的」である反応は、前記ペプチドまたはタンパク質の別の基、例えば前記ペプチドまたはタンパク質の内側アミノ酸よりも、前記C末端アミノ酸と反応する、約50%もしくは50%、約60%もしくは60%、約70%もしくは70%、約75%もしくは75%、約80%もしくは80%、約85%もしくは85%、約90%もしくは90%、約95%もしくは95%、約96%もしくは96%、約97%もしくは97%、約98%もしくは98%、約99%もしくは99%、または100%の好みを有する。
本明細書で使用する場合、「アミノ酸」という用語は、イオン化した形態 -NH3
+として存在し得る、少なくとも1つのアミノ基 -NH2と、イオン化した形態 -COO-として存在し得る、1つのカルボキシル基 -COOHとを含む有機化合物を一般に指し、ここでカルボン酸が中性pHで脱プロトン化され、式+NH3CHRCOO-を有する。アミノ酸、およびしたがってペプチドは、N(アミノ)末端残基領域とC(カルボキシ)末端残基領域とを有する。アミノ酸のタイプとしては、「天然」とみなされるものが少なくとも20挙げられ得、それらは哺乳動物の大多数の生体タンパク質を構成しており、例えば、リジン、システイン、チロシン、スレオニン他などのアミノ酸が挙げられる。アミノ酸は側鎖に基づいて分類することもでき、アスパラギン酸またはアスパルタート(Asp;D)およびグルタミン酸またはグルタマート(Glu;E)などの(中性pHの)カルボン酸基を有するもの、ならびにリジン(Lys;L)、アルギニン(Arg;N)、およびヒスチジン(His;H)などの(中性pHの)塩基性アミノ酸を有するものなどがある。
本明細書で使用する場合、「末端」という用語は、1つの末端および複数の末端を指す。「N末端アミノ酸残基」は、遊離NH2またはNH3を有する、ペプチドまたはタンパク質の端部のアミノ酸残基を指し得る。「C末端アミノ酸残基」は、遊離COOHまたはCOO-を有するペプチドまたはタンパク質の端部のアミノ酸残基を指し得る。
本明細書で使用する場合、「側鎖」、「残基」、または「R」という用語は、α炭素(アミノ酸のアミン基およびカルボン酸基が結合する炭素)に結合した、アミノ酸(例えば天然のアミノ酸)の各タイプをもたらす基を指す。R基は、例えば、荷電極性側鎖(例えば、正または負に帯電した、例えばリジン(+)、アルギニン(+)、ヒスチジン(+)、アスパルタート(-)、およびグルタマート(-)など)など、様々な形状、サイズ、電荷、および反応性を有し;アミノ酸はまた、塩基性(例えば、リジン)または酸性(例えば、グルタミン酸)であり得;非荷電極性側鎖は、例えば、ヒドロキシル基、アミド基、またはチオール基などの基を含み得(例えば、システイン)、それは化学反応性側鎖であり得(例えば、別のシステイン、セリン(Ser)、およびスレオニン(Thr)との結合を形成できるチオール基);アスパラギン(Asn)、グルタミン(Gin)、およびチロシン(Tyr);メチル基(例えば、アラニン)から異性体ブチル基(例えば、ロイシンおよびイソロイシン)までサイズに幅のある脂肪族炭化水素側鎖を有する、非極性疎水性アミノ酸側鎖(例えば、グリシン、アラニン、バリン、ロイシン、およびイソロイシン);メチオニン(Met)はチオールエーテル側鎖を有し;プロリン(Pro)は環式ピロリジン側基を有する。フェニルアラニン(Phe)(フェニル部分を有する)およびトリプトファン(Trp)(インドール基を有する)は、芳香族側鎖を含有し、それらは容積によって、また極性をもたないことによっても、特徴づけられる。
アミノ酸は、名前、3文字コード、または1文字コードで、例えば、それぞれ、システイン、Cys、C;リジン、Lys、K;トリプトファン、Trp、Wと言及され得る。
「非天然の」アミノ酸は、哺乳動物および植物において、遺伝子コードに本来コードされない、もしくは見られない、またデノボの代謝経路を介しても生産されない、アミノ酸である。それらは、天然のアミノ酸に通常は見られない、またはめったに見られない側鎖を付加することにより合成され得る。それらの例としては、β-アミノ酸(例えば、β-アラニン)、ホモ-アミノ酸(例えば、ホモセリン)、プロリン誘導体(例えば、cis-4-ヒドロキシ-D-プロリン)、3置換アラニン誘導体(例えば、3,3-ジフェニル-D-アラニン)、グリシン誘導体(例えば、サルコシン)、環置換フェニルアラニンおよびチロシン誘導体(例えば、それぞれ4-クロロ-L-フェニルアラニンおよび3-クロロ-L-チロシン)、直鎖コアアミノ酸(例えば、4-アミノ-3-ヒドロキシ酪酸)、ならびにN-メチルアミノ酸(例えば、L-アブリン)が挙げられ得る。
本明細書で使用する場合、アミノ基が、20種類の標準的な生体アミノ酸のようにα炭素ではなく、β炭素に結合しているβアミノ酸は、非天然アミノ酸である。唯一の一般的な天然のβアミノ酸は、β-アラニンである。
本明細書で使用する場合、「アミノ酸配列」、「ペプチド」、「ペプチド配列」、「ポリペプチド」、「オリゴペプチド」、「ポリペプチド配列」、および「オリゴペプチド配列」という用語は、本明細書で使用する場合、ペプチド(アミド)結合またはペプチド結合アナログにより共有結合で連結されている、少なくとも2つのアミノ酸またはアミノ酸アナログを指す。ペプチドという用語は、アミノ酸またはアミノ酸アナログのオリゴマーおよびポリマーを含む。ペプチドという用語は、オリゴペプチドと呼ばれ得る分子も含み、それらは約2~約20個のアミノ酸を含有し得る。ペプチドという用語は、一般にポリペプチドと呼ばれる分子を含み得、それらはたいてい20個超のアミノ酸を含有する。ペプチドという用語は、一般にタンパク質と呼ばれる分子も含み、それらは少なくとも約20個のアミノ酸、および一式の定義された構造特徴(例えば、一式の二級、三級、および四級構造)を含有し得る。ペプチドのアミノ酸は、L-アミノ酸またはD-アミノ酸であり得る。ペプチド、ポリペプチド、またはタンパク質は、合成、組み換え、または天然であり得る。合成ペプチドは、インビトロで人工手段により生産されたペプチドである。
本明細書で使用する場合、「蛍光」という用語は、異なる波長の光を吸収した物質による可視光の発光を指す。蛍光は、特定の波長の蛍光発光に基づき生物学的分子を追跡および/または分析する、非破壊的な方法を提供し得る。タンパク質(抗体を含む)、ペプチド、核酸、オリゴヌクレオチド(一本鎖および二本鎖プライマーを含む)が、フルオロフォアと呼ばれる様々な外的蛍光分子で「標識」され得る。
本明細書で使用する場合、「1分子レベルでの」ペプチドのシーケンシングは、個々の(すなわち単一の)ペプチド分子から得られたアミノ酸配列情報を指し、それらは多様なペプチド分子の混合体中にあり得る。本発明は、個々のペプチド分子から得られたアミノ酸配列情報が、個々のペプチド分子の完全なまたは一続きのアミノ酸配列である方法に限られる必要はない。ペプチドまたはタンパク質の同定を可能にする部分的なアミノ酸配列情報が得られるだけで十分であり得る。例えば、個々のペプチド分子内の特定のアミノ酸残基(すなわち、リジン)のパターンなどの、部分的なアミノ酸配列情報は、個々のペプチド分子を一意的に同定するのに十分であり得る。例えば、個々のペプチド分子を同定するために、例えば個々のペプチド分子内のリジン分子の分布を示すX-X-X-Lys-X-X-X-X-Lys-X-Lys(SEQ ID NO: 25)などのアミノ酸のパターンが、所与の生物の既知のプロテオームに対し検索され得る。1分子レベルのペプチドのシーケンシングが、個々のペプチド分子におけるリジン残基のパターンを同定することに限られる、というものではなく、任意のアミノ酸残基(複数のアミノ酸残基を含む)の配列情報を、多様なペプチド分子の混合体における個々のペプチド分子を同定するのに用いてもよい。
本明細書で使用する場合、「1分子感受性」は、多様なペプチド分子の混合体における個々のペプチド分子からデータ(例えば、アミノ酸配列情報を含む)を取得する能力を指す。一つの非限定例では、多様なペプチド分子の混合体は、固体表面(例えば、ガラススライド、または表面が化学修飾されているガラススライドを含む)に固定化され得る。これには、ガラス表面全体に分布した複数の個々の(すなわち単一の)ペプチド分子の蛍光強度を同時記録する能力が含まれ得る。このように用いられ得る光学デバイスが市販されている。例えば、全反射照明および強化電荷結合素子(CCD)検出器を備えた従来型顕微鏡が用いることできる(Braslaysky et al., 2003を参照)。高感度CCDカメラで撮影すると、表面全体に分布した複数の個々の(すなわち単一の)ペプチド分子の蛍光強度を機器が同時記録することが可能になる。画像収集は、2つのバンドパスフィルター(各蛍光分子に適したもの)に導光し透過させ、CCD表面に2枚の隣り合わせの画像として記録させるイメージスプリッターを用いて実施され得る。自動フォーカス制御される電動顕微鏡ステージを用いてフローセルで複数のステージ位置を撮影することで、何百万という個々の単一ペプチド(またはそれ以上)を1回の実験で配列決定することが可能になる。
「シングルセルプロテオミクス」という用語は、本明細書で使用する場合、細胞のプロテオームの研究を指す。プロテオームは、単一細胞のものであり得る。プロテオームは、細胞クラスターのものであり得る。細胞クラスターは、少なくとも2つの細胞であり得る。細胞クラスターは、2、5、10、20、30、40、50、60、70、80、90、100個、またはそれ以上の細胞であり得る。細胞クラスターは、2~10細胞であり得る。いくつかの態様では、単一細胞のプロテオームは、タンパク質、ペプチド、またはそれらの組み合わせを含む。いくつかの態様では、プロテオームを研究することは、少なくとも1つのペプチド、タンパク質、またはそれらの組み合わせのアミノ酸配列を決定することを含む。いくつかの態様では、アミノ酸配列は、ペプチド、タンパク質、またはそれらの組み合わせのシーケンシングにより決定される。細胞は、真核生物、原核生物、または古細菌の細胞であり得る。
「支持体」という用語は、本明細書で使用する場合、固体または半固体としての支持体を指す。いくつかの態様では、支持体はビーズまたは樹脂である。
「バーコード」または「バーコード配列」という用語は、本明細書で使用する場合、あるプローブ、ペプチド、タンパク質、またはそれらの任意の組み合わせと、別のプローブ、ペプチド、タンパク質、またはそれらの任意の組み合わせとを識別するために同定され得る分子を指す。一般に、バーコードまたはバーコード配列は、分子を標識するか、またはアイデンティティつきの分子を提供する。バーコードは、人工分子または天然分子であり得る。いくつかの態様では、バーコード集団の少なくとも一部のバーコードが、前記バーコード集団の別のバーコードと異なるバーコードを含む。いくつかの態様では、バーコードの少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、またはそれ以上が互いに異なる。バーコード集団の異なるバーコードの多様性は、ランダムに生じさせても、または非ランダムに生じさせてもよい。
「核酸バーコード配列」という用語は、本明細書で使用する場合、特定の核酸配列を有する分子を指す。一般に、核酸バーコード配列は、1つまたは複数の特定の核酸を同定するのに用いられ得る、1つまたは複数のヌクレオチド配列を含み得る。核酸バーコード配列は、人工配列または天然配列であり得る。核酸バーコード配列は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれ以上の連続ヌクレオチドを含み得る。いくつかの態様では、核酸バーコード配列は、少なくとも約10、20、30、40、50、60、70、80、90、100個、またはそれ以上の連続ヌクレオチドを含む。いくつかの態様では、バーコードを含む核酸集団の核酸バーコード配列の少なくとも一部が異なる。いくつかの態様では、核酸バーコード配列の少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、またはそれ以上が互いに異なる。核酸バーコード配列を含む核酸集団の異なる核酸バーコード配列の多様性は、ランダムに生じさせても、または非ランダムに生じさせてもよい。
「核酸」という用語は、本明細書で使用する場合、リボヌクレオチド(RNA)であれ、デオキシリボヌクレオチド(DNA)であれ、ペプチド核酸(PNA)であれ、プリン塩基およびピリミジン塩基、あるいは他の天然の、化学修飾もしくは生化学修飾された、非天然の、または誘導体化されたヌクレオチド塩基を含む、任意の長さの高分子形態のヌクレオチドを一般に指す。ポリヌクレオチドの主鎖は、RNAまたはDNAに典型的に見られ得るような糖およびホスファート基、または修飾もしくは置換された糖もしくはホスファート基を含み得る。ポリヌクレオチドは、メチル化されたヌクレオチドおよびヌクレオチドアナログなどの修飾ヌクレオチドを含み得る。ヌクレオチドの配列は、非ヌクレオチド構成要素により中断され得る。したがって、ヌクレオシド、ヌクレオチド、デオキシヌクレオシド、およびデオキシヌクレオチドという用語は、本明細書に記載されるものなどの、アナログを一般に含む。これらのアナログは、天然のヌクレオシドまたはヌクレオチドと共通の何らかの構造特徴を有する分子であるため、核酸またはオリゴヌクレオシド配列に組み入れられた場合、溶液中での天然の核酸配列とのハイブリダイゼーションを可能にする。典型的には、これらのアナログは、天然のヌクレオシドおよびヌクレオチドから、塩基、リボース、またはホスホジエステル部分を置き換える、かつ/または修飾することにより、誘導される。これらの変化は、ハイブリッド形成を安定化もしくは脱安定化するよう、または相補性核酸配列によりハイブリダイゼーションの特異性を増大させるよう、所望に応じてカスタマイズすることができる。核酸分子はDNA分子であり得る。核酸分子はRNA分子であり得る。
シーケンシング反応は、例えば、キャピラリーシーケンシング、次世代シーケンシング、サンガーシーケンシング、合成によるシーケンシング、1分子ナノポアシーケンシング、連結によるシーケンシング、ハイブリダイゼーションによるシーケンシング、ナノポア電流制限によるシーケンシング、またはそれらの組み合わせを含み得る。合成によるシーケンシングは、可逆性ターミネーターシーケンシング、プロセッシブ1分子シーケンシング、逐次ヌクレオチドフローシーケンシング、またはそれらの組み合わせを含み得る。1分子シーケンシングは、1分子分解能を提供し得る。逐次ヌクレオチドフローシーケンシングは、パイロシーケンシング、pH媒介シーケンシング、半導体シーケンシング、またはそれらの組み合わせを含み得る。1つまたは複数のシーケンシング反応を実施することは、全ゲノムシーケンシングまたはエキソームシーケンシングを含み得る。ハイブリダイゼーション反応は、例えば、蛍光インサイチューハイブリダイゼーション(FISH)、DNAペイント、多重バーコード同定(例えば、MER-FISH)を含み得る。
シーケンシング反応またはハイブリダイゼーション反応は、1つまたは複数の捕捉プローブ、または捕捉プローブのライブラリーを含み得る。1つまたは複数の捕捉プローブライブラリーのうちの少なくとも1つは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個、またはそれ以上のゲノム領域に対する1つまたは複数の捕捉プローブを含み得る。捕捉プローブのライブラリーは、少なくとも部分的に相補性であり得る。捕捉プローブのライブラリーは、完全に相補性であり得る。捕捉プローブのライブラリーは、少なくとも約5%、10%、15%、20%、%、25%、30%、35%、40%、45%、50%、55%、60%、70%、80%、90%、95%、97%、またはそれ以上相補性であり得る。
本明細書に開示される方法およびシステムは、1つまたは複数のシーケンシング反応またはハイブリダイゼーション反応を、1つまたは複数の捕捉プローブフリー核酸分子に対し実施することをさらに含み得る。本明細書に開示される方法およびシステムは、1つまたは複数のシーケンシング反応またはハイブリダイゼーション反応を、1つまたは複数の捕捉プローブフリー核酸分子を含む、1つまたは複数の核酸分子サブセットに対し実施することをさらに含み得る。
「標識」という用語は、本明細書で使用する場合、何らかの形態の測定可能なシグナルを生じる化学基を分子に導入することである。そのようなシグナルとしては、限定ではないが、蛍光、可視光、質量、放射線、または核酸配列が挙げられ得る。
本明細書で使用する場合、C1~Cxは、C1~C2、C1~C3 ... C1~Cxを含む。単に例として、「C1~C4」と称される基は、その部分には1~4個の炭素原子があること、すなわち1個の炭素原子、2個の炭素原子、3個の炭素原子、または4個の炭素原子を含有する基を示す。したがって、単に例として、「C1~C4アルキル」は、アルキル基に1~4個の炭素原子があることを示し、すなわち、アルキル基は、メチル、エチル、プロピル、イソ-プロピル、n-ブチル、イソ-ブチル、sec-ブチル、およびt-ブチルから選択される。
「アルキル」基は、脂肪族炭化水素基を指す。アルキル基は、分枝鎖または直鎖である。いくつかの態様では、「アルキル」基は、1~10個の炭素原子を有し、すなわちC1~C10アルキルである。本明細書に登場する場合はいつでも、「1~10個」などの数の範囲は、その範囲内の各整数を指し、例えば、「1~10個の炭素原子」は、アルキル基が、1個の炭素原子、2個の炭素原子、3個の炭素原子、4個の炭素原子、5個の炭素原子、6個の炭素原子他、最大で10個の炭素原子からなることを意味するが、この定義は、数の範囲が指定されていない「アルキル」という用語の出現も網羅している。いくつかの態様では、アルキルは、C1~C6アルキルである。一局面では、アルキルは、メチル、エチル、プロピル、イソ-プロピル、n-ブチル、イソ-ブチル、sec-ブチル、またはt-ブチルである。典型的なアルキル基としては、決して限定ではないが、メチル、エチル、プロピル、イソプロピル、ブチル、イソブチル、sec-ブチル、三級ブチル、ペンチル、ネオペンチル、またはヘキシルが挙げられる。
「アルキレン」基は、二価アルキル基を指す。上述した一価アルキル基はどれでも、前記アルキルから第2の水素原子を引き抜くことで、アルキレンになり得る。いくつかの態様では、アルキレンは、C1~C6アルキレンである。他の態様では、アルキレンは、C1~C4アルキレンである。特定の態様では、アルキレンは、1~4個の炭素原子を含む(例えば、C1~C4アルキレン)。他の態様では、アルキレンは、1~3個の炭素原子を含む(例えば、C1~C3アルキレン)。他の態様では、アルキレンは、1~2個の炭素原子を含む(例えば、C1~C2アルキレン)。他の態様では、アルキレンは、1個の炭素原子を含む(例えば、C1アルキレン)。他の態様では、アルキレンは、2個の炭素原子を含む(例えば、C2アルキレン)。他の態様では、アルキレンは、2~4個の炭素原子を含む(例えば、C2~C4アルキレン)。典型的なアルキレン基としては、限定ではないが、-CH2-、-CH(CH3)-、-C(CH3)2-、-CH2CH2-、-CH2CH(CH3)-、-CH2C(CH3)2-、-CH2CH2CH2-、-CH2CH2CH2CH2-等が挙げられる。
「アルケニル」という用語は、少なくとも1つの炭素-炭素二重結合が存在している、アルキル基のタイプを指す。一態様では、アルケニル基は式 -C(R)=CR2を有し、式中、Rは、アルケニル基の残りの部分を指し、それは同じでも、または異なっていてもよい。いくつかの態様では、Rは、Hまたはアルキルである。いくつかの態様では、アルケニルは、エテニル(すなわち、ビニル)、プロペニル(すなわち、アリル)、ブテニル、ペンテニル、ペンタジエニル等から選択される。アルケニル基の非限定例としては、-CH=CH2、-C(CH3)=CH2、-CH=CHCH3、-C(CH3)=CHCH3、および-CH2CH=CH2が挙げられる。
「アルキニル」という用語は、少なくとも1つの炭素-炭素三重結合が存在している、アルキル基のタイプを指す。一態様では、アルケニル基は式 -C≡C-Rを有し、式中、Rは、アルキニル基の残りの部分を指す。いくつかの態様では、Rは、Hまたはアルキルである。いくつかの態様では、アルキニルは、エチニル、プロピニル、ブチニル、ペンチニル、ヘキシニル等から選択される。アルキニル基の非限定例としては、-C≡CH、-C≡CCH3-C≡CCH2CH3、-CH2C≡CHが挙げられる。
「アルコキシ」基は、(アルキル)O-基を指し、アルキルは本明細書で定義されるとおりである。
「アルキルアミン」という用語は、-N(アルキル)xHy基を指し、ここで、xは0でありかつyは2であるか、またはxは1でありかつyは1であるか、またはxは2でありかつyは0である。
「芳香族」という用語は、nが整数である4n+2 π電子を含有する非局在化π電子系を有する平面状の環を指す。「芳香族」という用語は、炭素環式アリール(「アリール」、例えばフェニル)基およびヘテロ環式アリール(または「ヘテロアリール」もしくは「ヘテロ芳香族」)基(例えば、ピリジン)の両方を含む。この用語は、単環基または縮合環多環(すなわち、隣接する炭素原子対または窒素原子対を共有する環)基を含む。
「炭素環式」または「炭素環」という用語は、環の主鎖を形成する原子がすべて炭素原子である環または環系を指す。したがって、この用語は、炭素環式を、環の主鎖が炭素ではない原子を少なくとも1つ含む「ヘテロ環式」環または「ヘテロ環」と識別するものである。いくつかの態様では、二環式炭素環の2つの環のうち少なくとも1つが芳香族である。いくつかの態様では、二環式炭素環の環は両方とも芳香族である。炭素環としては、シクロアルキルおよびアリールが挙げられる。
「オキソ」という用語は、C=Oを指す。
本明細書で使用する場合、「アリール」という用語は、環を形成する各原子が炭素原子である、芳香族環を指す。一局面では、アリールは、フェニルまたはナフチルである。いくつかの態様では、アリールはフェニルである。いくつかの態様では、アリールはC6~C10アリールである。構造によっては、アリール基はモノラジカルまたはジラジカル(すなわち、アリーレン基)である。
「シクロアルキル」という用語は、単環式または多環式の脂肪族、非芳香族基を指し、ここで環を形成する各原子(すなわち骨格原子)が炭素原子である。いくつかの態様では、シクロアルキルは、スピロ環式または橋かけ化合物である。いくつかの態様では、シクロアルキルは、芳香族環と縮合していてもよく、結合点は芳香族環の炭素原子ではない炭素にある。シクロアルキル基としては、3~10個の環原子を有する基が挙げられる。いくつかの態様では、シクロアルキル基は、シクロプロピル、シクロブチル、シクロペンチル、シクロペンテニル、シクロヘキシル、シクロヘキセニル、シクロヘプチル、シクロオクチル、スピロ[2.2]ペンチル、ノルボルニル、およびビシクロ[1.1.1]ペンチルのなかから選択される。いくつかの態様では、シクロアルキルは、C3~C6シクロアルキルである。いくつかの態様では、シクロアルキルは、単環式シクロアルキルである。単環式シクロアルキルとしては、限定ではないが、シクロプロピル、シクロブチル、シクロペンチル、シクロヘキシル、シクロヘプチル、およびシクロオクチルが挙げられる。多環式シクロアルキルとしては、例えば、アダマンチル、ノルボルニル(すなわち、ビシクロ[2.2.1]ヘプタニル)、ノルボルネニル、デカリニル、7,7-ジメチル-ビシクロ[2.2.1]ヘプタニル等が挙げられる。
「ハロ」、または、かわりに「ハロゲン」もしくは「ハロゲン化物」という用語は、フルオロ、クロロ、ブロモ、またはヨードを意味する。いくつかの態様では、ハロは、フルオロ、クロロ、またはブロモである。
「ハロアルキル」という用語は、1つまたは複数の水素原子がハロゲン原子で置き換えられているアルキルを指す。一局面では、フルオロアルキルはC1~C6フルオロアルキルである。
「フルオロアルキル」という用語は、1つまたは複数の水素原子がフッ素原子で置き換えられているアルキルを指す。一局面では、フルオロアルキルはC1~C6フルオロアルキルである。いくつかの態様では、フルオロアルキルは、トリフルオロメチル、ジフルオロメチル、フルオロメチル、2,2,2-トリフルオロエチル、1-フルオロメチル-2-フルオロエチル等から選択される。
「ヘテロアルキル」という用語は、アルキルの1つまたは複数の骨格原子が、炭素ではない原子、例えば酸素、窒素(例えば、-NH-、-N(アルキル)-)、硫黄、またはそれらの組み合わせから選択される、アルキル基を指す。ヘテロアルキルは、前記ヘテロアルキルの炭素原子で分子の残部に結合している。一局面では、ヘテロアルキルは、C1~C6ヘテロアルキルである。
「ヘテロアルキレン」という用語は、二価ヘテロアルキル基を指す。
「ヘテロ環」または「ヘテロ環式」という用語は、環内に1~4ヘテロ原子を含有する、ヘテロ芳香族環(ヘテロアリールとしても知られる)およびヘテロシクロアルキル環(ヘテロ脂環基としても知られる)を指し、ここで環内の各ヘテロ原子は、O、S、およびNから選択され、ここで各ヘテロ環基がその環系に3~10個の原子を有するが、ただしどの環も2つの隣接するOまたはS原子をもたない。いくつかの態様では、ヘテロ環は、単環式、二環式、多環式、スピロ環式、または橋かけ化合物である。非芳香族ヘテロ環基(ヘテロシクロアルキルとしても知られる)は、その環系に3~10個の原子を有する環を含み、芳香族ヘテロ環基は、その環系に5~10個の原子を有する環を含む。ヘテロ環基としては、ベンゾ縮合環系が挙げられる。非芳香族ヘテロ環基の例は、ピロリジニル、テトラヒドロフラニル、ジヒドロフラニル、テトラヒドロチエニル、オキサゾリジノニル、テトラヒドロピラニル、ジヒドロピラニル、テトラヒドロチオピラニル、ピペリジニル、モルホリニル、チオモルホリニル、チオキサニル、ピペラジニル、アジリジニル、アゼチジニル、オキセタニル、チエタニル、ホモピペリジニル、オキセパニル、チエパニル、オキサゼピニル、ジアゼピニル、チアゼピニル、1,2,3,6-テトラヒドロピリジニル、ピロリン-2-イル、ピロリン-3-イル、インドリニル、2H-ピラニル、4H-ピラニル、ジオキサニル、1,3-ジオキソラニル、ピラゾリニル、ジチアニル、ジチオラニル、ジヒドロピラニル、ジヒドロチエニル、ジヒドロフラニル、ピラゾリジニル、イミダゾリニル、イミダゾリジニル、3-アザビシクロ[3.1.0]ヘキサニル、3-アザビシクロ[4.1.0]ヘプタニル、3H-インドリル、インドリン-2-オニル、イソインドリン-1-オニル、イソインドリン-1,3-ジオニル、3,4-ジヒドロイソキノリン-1(2H)-オニル、3,4-ジヒドロキノリン-2(1H)-オニル、イソインドリン-1,3-ジチオニル、ベンゾ[d]オキサゾール-2(3H)-オニル、1H-ベンゾ[d]イミダゾール-2(3H)-オニル、ベンゾ[d]チアゾール-2(3H)-オニル、およびキノリジニルである。芳香族ヘテロ環基の例は、ピリジニル、イミダゾリル、ピリミジニル、ピラゾリル、トリアゾリル、ピラジニル、テトラゾリル、フリル、チエニル、イソキサゾリル、チアゾリル、オキサゾリル、イソチアゾリル、ピロリル、キノリニル、イソキノリニル、インドリル、ベンズイミダゾリル、ベンゾフラニル、シンノリニル、インダゾリル、インドリジニル、フタラジニル、ピリダジニル、トリアジニル、イソインドリル、プテリジニル(pteridinyl)、プリニル、オキサジアゾリル、チアジアゾリル、フラザニル、ベンゾフラザニル、ベンゾチオフェニル、ベンゾチアゾリル、ベンズオキサゾリル、キナゾリニル、キノキサリニル、ナフチリジニル、およびフロピリジニルである。前述の基は、可能な場合は、C結合(またはC連結)またはN結合である。例えば、ピロールから誘導された基としては、ピロール-1-イル(N結合)またはピロール-3-イル(C結合)の両者が挙げられる。さらに、イミダゾールから誘導された基としては、イミダゾール-1-イルもしくはイミダゾール-3-イル(どちらもN結合)、またはイミダゾール-2-イル、イミダゾール-4-イル、もしくはイミダゾール-5-イル(すべてC結合)が挙げられる。ヘテロ環基としては、ベンゾ縮合環系が挙げられる。非芳香族ヘテロ環は、ピロリジン-2-オンなど、1つまたは2つのオキソ(=O)部分で置換されていてもよい。いくつかの態様では、二環式ヘテロ環の2つの環のうち少なくとも1つが芳香族である。いくつかの態様では、二環式ヘテロ環の環は両方とも芳香族である。
「ヘテロアリール」、または、かわりに「ヘテロ芳香族」という用語は、窒素、酸素、および硫黄から選択される1つまたは複数の環ヘテロ原子を含むアリール基を指す。ヘテロアリール基の例示的な例としては、単環式ヘテロアリールおよび二環式ヘテロアリールが挙げられる。単環式ヘテロアリールとしては、ピリジニル、イミダゾリル、ピリミジニル、ピラゾリル、トリアゾリル、ピラジニル、テトラゾリル、フリル、チエニル、イソキサゾリル、チアゾリル、オキサゾリル、イソチアゾリル、ピロリル、ピリダジニル、トリアジニル、オキサジアゾリル、チアジアゾリル、およびフラザニルが挙げられる。二環式ヘテロアリールとしては、インドリジン、インドール、ベンゾフラン、ベンゾチオフェン、インダゾール、ベンズイミダゾール、プリン、キノリジン、キノリン、イソキノリン、シンノリン、フタラジン、キナゾリン、キノキサリン、1,8-ナフチリジン、およびプテリジン(pteridine)が挙げられる。いくつかの態様では、ヘテロアリールは、環内に0~4個のN原子を含む。いくつかの態様では、ヘテロアリールは、環内に1~4個のN原子を含有する。いくつかの態様では、ヘテロアリールは、環内に0~4個のN原子、0~1個のO原子、および0~1個のS原子を含有する。いくつかの態様では、ヘテロアリールは、環内に1~4個のN原子、0~1個のO原子、および0~1個のS原子を含有する。いくつかの態様では、ヘテロアリールは、C1~C9ヘテロアリールである。いくつかの態様では、単環式ヘテロアリールは、C1~C5ヘテロアリールである。いくつかの態様では、単環式ヘテロアリールは、5員または6員ヘテロアリールである。いくつかの態様では、二環式ヘテロアリールは、C6~C9ヘテロアリールである。
「ヘテロシクロアルキル」基または「ヘテロ脂環」基は、窒素、酸素、および硫黄から選択される少なくとも1つのヘテロ原子を含むシクロアルキル基を指す。いくつかの態様では、ヘテロシクロアルキルは、アリールまたはヘテロアリールと縮合している。いくつかの態様では、ヘテロシクロアルキルは、オキサゾリジノニル、ピロリジニル、テトラヒドロフラニル、テトラヒドロチエニル、テトラヒドロピラニル、テトラヒドロチオピラニル、ピペリジニル、モルホリニル、チオモルホリニル、ピペラジニル、ピペリジン-2-オニル、ピロリジン-2,5-ジチオニル、ピロリジン-2,5-ジオニル、ピロリジノニル、イミダゾリジニル、イミダゾリジン-2-オニル、またはチアゾリジン-2-オニルである。ヘテロ脂環式という用語は、限定ではないが、単糖、二糖、およびオリゴ糖を含め、炭化水素のあらゆる環形態も含む。一局面では、ヘテロシクロアルキルは、C2~C10ヘテロシクロアルキルである。別の局面では、ヘテロシクロアルキルは、C4~C10ヘテロシクロアルキルである。いくつかの態様では、ヘテロシクロアルキルは、環内に0~2個のN原子を含有する。いくつかの態様では、ヘテロシクロアルキルは、環内に0~2個のN原子、0~2個のO原子、および0~1個のS原子を含有する。
「結合」または「一重結合」という用語は、その結合により接合される原子がより大きいサブ構造の一部とみなされる場合の、2つの原子または2つの部分の間の化学的結合を指す。一局面では、本明細書に記載される基が結合である場合、参照された基は不存在であり、それによって残りの同定された基間に結合が形成されるのを可能にする。
「部分」という用語は、分子の特定のセグメントまたは官能基を指す。化学部分は、分子に埋め込まれた、または付加された化学的実体と認識されることが多い。
「置換されていてもよい」または「置換(された)」という用語は、参照された基が、1つまたは複数の追加の基で置換されていてもよいことを意味する。いくつかの他の態様では、任意選択の置換基は、D、ハロゲン、-CN、-NH2、-NH(アルキル)、-N(アルキル)2、-OH、-CO2H、-CO2アルキル、-C(=O)NH2、-C(=O)NH(アルキル)、-C(=O)N(アルキル)2、-S(=O)2NH2、-S(=O)2NH(アルキル)、-S(=O)2N(アルキル)2、-CH2CO2H、-CH2CO2アルキル、-CH2C(=O)NH2、-CH2C(=O)NH(アルキル)、-CH2C(=O)N(アルキル)2、-CH2S(=O)2NH2、-CH2S(=O)2NH(アルキル)、-CH2S(=O)2N(アルキル)2、アルキル、アルケニル、アルキニル、シクロアルキル、フルオロアルキル、ヘテロアルキル、アルコキシ、フルオロアルコキシ、ヘテロシクロアルキル、アリール、ヘテロアリール、アリールオキシ、アルキルチオ、アリールチオ、アルキルスルホキシド、アリールスルホキシド、アルキルスルホン、およびアリールスルホンから個別にかつ独立して選択される。「置換されていてもよい」または「置換(された)」という用語は、参照された基が、D、ハロゲン、-CN、-NH2、-NH(アルキル)、-N(アルキル)2、-OH、-CO2H、-CO2アルキル、-C(=O)NH2、-C(=O)NH(アルキル)、-C(=O)N(アルキル)2、-S(=O)2NH2、-S(=O)2NH(アルキル)、-S(=O)2N(アルキル)2、アルキル、シクロアルキル、フルオロアルキル、ヘテロアルキル、アルコキシ、フルオロアルコキシ、ヘテロシクロアルキル、アリール、ヘテロアリール、アリールオキシ、アルキルチオ、アリールチオ、アルキルスルホキシド、アリールスルホキシド、アルキルスルホン、およびアリールスルホンから個別にかつ独立して選択される1つまたは複数の追加の基で置換されていてもよいことを意味する。いくつかの他の態様では、任意選択の置換基が、D、ハロゲン、-CN、-NH2、-NH(CH3)、-N(CH3)2、-OH、-CO2H、-CO2(C1~C4アルキル)、-C(=O)NH2、-C(=O)NH(C1~C4アルキル)、-C(=O)N(C1~C4アルキル)2、-S(=O)2NH2、-S(=O)2NH(C1~C4アルキル)、-S(=O)2N(C1~C4アルキル)2、C1~C4アルキル、C3~C6シクロアルキル、C1~C4フルオロアルキル、C1~C4ヘテロアルキル、C1~C4アルコキシ、C1~C4フルオロアルコキシ、-SC1~C4アルキル、-S(=O)C1~C4アルキル、および-S(=O)2C1~C4アルキルから独立して選択される。いくつかの態様では、任意選択の置換基が、D、ハロゲン、-CN、-NH2、-OH、-NH(CH3)、-N(CH3)2、-CH3、-CH2CH3、-CF3、-OCH3、および-OCF3から独立して選択される。いくつかの態様では、置換された基は、前述の基の1つまたは2つで置換されている。いくつかの態様では、置換された基は、前述の基の1つで置換されている。いくつかの態様では、(非環式または環式)脂肪族炭素原子上の任意選択の置換基は、オキソ(=O)を含む。
本明細書に記載される場合、「ハンドル」という用語は、タンパク質またはペプチドのC末端カルボン酸に結合できる分子を指す。ハンドルは、主鎖(例えば、アルキレン、ポリエチレングリコール、およびアミド基)、求核剤(例えば、アミンもしくはチオール)、求電子剤(例えば、マイケルアクセプター)、検出ユニット(例えば、フルオロフォア、核酸オリゴマー、もしくは荷電基)、官能基付与ユニット(例えば、ビオチン、アジド、アルキン、チオール、アルケン、カルボン酸、もしくはアミン)、またはそれらの任意の組み合わせを含み得る。ハンドルは、少なくとも1つのリンカーを含み得る。
「リンカー」は、本明細書に記載される場合、少なくとも2つの分子同士を結合する。いくつかの態様では、リンカーは、少なくとも2つの分子同士を直接または間接的に結合する。リンカーは、アミノ酸側鎖を標識するための二官能性分子であり得る。前記分子の一端はアミノ酸特異的官能基(例えば、システインのチオール残基を標識するためのヨードアセトアミド)を含み得、他端は標識に適用可能な異なる官能基であり得る。レポーターを結合させる必要がなければ、官能基は不活基(例えば、アルカン)であり得る。タグ分子のレポーター末端は、フルオロフォアであり得る。タグは、明瞭な(例えば、蛍光または電子)シグナルを生成できる少なくとも1つの荷電分子を含み得る。
「レポーター」または「タグ」という用語は、同定可能なシグナルを生成する分子を指す。レポーターの例としては、フルオロフォア(例えば、フルオロフォアのクラスター)、ハイブリダイズされ得るDNA分子、または明瞭な電気シグナル状態を生成する分子が挙げられる。
「反応性物質」という用語は、本明細書で使用する場合、ペプチドまたはタンパク質と反応する化学的または生物学的な作用物質を一般に指す。「反応性物質」は、ペプチドまたはタンパク質のC末端アミノ酸と選択的に反応し得る。
「内側アミノ酸残基」という用語は、本明細書で使用する場合、ペプチドまたはタンパク質のC末端アミノ酸残基またはN末端アミノ酸残基の間のアミノ酸残基を一般に指す。
「求核剤」という用語は、本明細書で使用する場合、別の化学種(例えば、第2の原子)と化学的結合を形成するために電子対を供与する化学種(例えば、第1の原子)を一般に指す。求核剤として作用し得る原子の例は、ハロゲン(例えば、フッ化物、塩化物、臭素、ヨウ素)、酸素、硫黄、窒素、および炭素である。求核剤の例としては、限定ではないが、電子が豊富な化学種、負電荷化学種、アミン、アルコール、チオール、硫化物、アルキン、アルケン、カルボン酸、ニトリル、水、アジド、亜硝酸(nitrite)、ヒドロキシルアミン、ヒドラジン、およびカルバジドが挙げられる。「求電子剤」という用語は、本明細書で使用する場合、別の化学種(例えば、第2の原子)と化学的結合を形成するために電子対を受け取る化学種(例えば、第1の原子)を一般に指す。求電子剤として作用し得る原子の例は、水素、ハロゲン、硫黄、および炭素である。求電子剤の例としては、限定ではないが、電子が少ない化学種、正電荷化学種、アルケン、ジエン、アクリラート、アクリルアミド、シアナート、カルボン酸、アミド、エステル、スルホン、アルデヒド、および共役系(例えば、マイケルアクセプターまたは共役芳香族系)が挙げられる。例えば、求核剤は求電子剤と反応して、前記求核剤と前記求電子剤との間に化学的結合を形成することができる。
「官能基付与部分」という用語は、本明細書で使用する場合、親分子に結合させられ、かつ前記親分子を操作する方策を提供するために化学修飾されていることもある化学種を一般に指す。
「濃縮部分」という用語は、本明細書で使用する場合、親分子に結合させられ、かつ試料において前記親分子の相対量を増加させる方策を提供するために化学修飾されていることもある化学種を一般に指す。
化合物
本開示は、C末端アミノ酸を標識するためのC末端カップリング試薬を提供する。C末端カップリング試薬は、(i)選択的にペプチドC末端カルボキシラートに結合する(例えば、共有結合による結合を形成する)部分、例えば求核剤(例えば、オキサゾロンタイプもしくは酵素タイプの求核剤(例えば、アミン))またはマイケルアクセプター(例えば、光レドックスタイプのマイケルアクセプター)、ならびに(ii)C末端ペプチドの表面固定化および/または濃縮のための少なくとも1つの官能性ハンドル(例えば、アルキン、アジド、ビオチン、または核酸(例えば、RNA、DNA、およびPNA))(図1B)を含み得る。C末端カップリング試薬は、ペプチドまたは核酸を含み得る。ペプチドまたは核酸は、少なくとも1つの官能基(例えば、核酸オリゴマー、フルオロフォア、アルキン、アジド、およびビオチン)を含む少なくとも1個の内側アミノ酸鎖を含み得る。ペプチドは、少なくとも1、2、5、10、20、30、40、50、60、70、80、90、100個、またはそれ以上のアミノ酸を含み得る。ペプチドは、少なくとも1、2、5、10、20、30、40、50、60、70、80、90、100個、またはそれ以上の官能基を含み得る。官能基は、アルカンなどの不活基、またはチオールなどの反応性官能基であり得る。ペプチドまたは核酸は、ペプチドまたは核酸バーコードであり得る。複数のC末端カップリング試薬が、複数のバーコードを含み得、例えばそれによって試料間の相対的なタンパク質定量、バッチ効果の制御を可能にする。本明細書に記載されるC末端カップリング試薬の設計の例を、図1Bおよび図6に示す。
本開示は、C末端アミノ酸を標識するためのC末端カップリング試薬を提供する。C末端カップリング試薬は、(i)選択的にペプチドC末端カルボキシラートに結合する(例えば、共有結合による結合を形成する)部分、例えば求核剤(例えば、オキサゾロンタイプもしくは酵素タイプの求核剤(例えば、アミン))またはマイケルアクセプター(例えば、光レドックスタイプのマイケルアクセプター)、ならびに(ii)C末端ペプチドの表面固定化および/または濃縮のための少なくとも1つの官能性ハンドル(例えば、アルキン、アジド、ビオチン、または核酸(例えば、RNA、DNA、およびPNA))(図1B)を含み得る。C末端カップリング試薬は、ペプチドまたは核酸を含み得る。ペプチドまたは核酸は、少なくとも1つの官能基(例えば、核酸オリゴマー、フルオロフォア、アルキン、アジド、およびビオチン)を含む少なくとも1個の内側アミノ酸鎖を含み得る。ペプチドは、少なくとも1、2、5、10、20、30、40、50、60、70、80、90、100個、またはそれ以上のアミノ酸を含み得る。ペプチドは、少なくとも1、2、5、10、20、30、40、50、60、70、80、90、100個、またはそれ以上の官能基を含み得る。官能基は、アルカンなどの不活基、またはチオールなどの反応性官能基であり得る。ペプチドまたは核酸は、ペプチドまたは核酸バーコードであり得る。複数のC末端カップリング試薬が、複数のバーコードを含み得、例えばそれによって試料間の相対的なタンパク質定量、バッチ効果の制御を可能にする。本明細書に記載されるC末端カップリング試薬の設計の例を、図1Bおよび図6に示す。
本開示の様々な局面が、C末端カップリング試薬に結合された、かつ固体支持体に固定化されたペプチドを含む組成物を提供する。ペプチドは、固体支持体に、C末端カップリング試薬により(例えば、C末端カップリング試薬がペプチドに、そして固体支持体に結合され得る)、そのN末端により、または内側アミノ酸残基により、結合され得る(例えば、ペプチドのシステインチオールが、固体支持体に結合されたマレイミドリンカーに結合され得る)。
C末端カップリング試薬は、1つ、2つ、3つ、または複数のハンドルを含有し得る。ハンドルは、C末端カップリング試薬に特性(例えば、蛍光または電荷)を与え得る。ハンドルは、検出のために(例えば、フルオロフォアなどの検出可能部分を含み得る)、表面固定化のために(例えば、基板に固定化されたアジドと結合するように構成されたアルキンを含み得る)、濃縮のために(例えば、His-タグもしくはFLAG-タグなどのタンパク質精製タグを含み得る)、ナノポアシーケンシングのために(例えば、電子勾配媒介性移動を増大させるために複数の正電荷残基を含む部分を含み得る)、または化学的結合のために(例えば、関心対象の種との銅媒介性メタセシス、例えばフルオロフォア)、あるいはそれらの任意の組み合わせのために、構成され得る。ハンドルは、1つまたは複数のリンカー(例えば、オリゴエチレングリコールリンカー)を通してC末端カップリング試薬に連結され得る。
C末端カップリング試薬は、表面固定化のために構成され得る。例えば、C末端カップリング試薬は、官能基付与された表面上のアジド基に結合するように構成されたアルキン基を含むハンドルを含み得、それによって前記表面への選択的反応による結合を可能にする(例えば、固定化は、C末端カップリング試薬に結合したペプチドと、表面に結合したアジド基との間にのみ生じ得る)。C末端カップリング試薬は、クリックケミストリー、ディールス・アルダー反応、チオール-エンケミストリー、アミド結合、またはそれらの任意の組み合わせのために構成されたハンドルを含み得る。
本明細書に開示される特定の局面は、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を標識するための化合物を提供し、前記化合物は、前記第2のカルボン酸部分よりも優先的に前記第1のカルボン酸部分に結合するように構成されており、前記化合物は、式(I):
の構造を有し、
式中、
L1、L2、およびL3は、独立して、置換リンカー、非置換リンカー、または結合であり;
R1は、C末端カップリング試薬を含み;
R2は、検出可能部分を含むハンドルを含み;
R3は、濃縮部分を含むハンドルを含み;
Xの各事例は、C-H、アミノ酸、またはヌクレオチドから独立して選択され;かつ
nは、1~12である。
の構造を有し、
式中、
L1、L2、およびL3は、独立して、置換リンカー、非置換リンカー、または結合であり;
R1は、C末端カップリング試薬を含み;
R2は、検出可能部分を含むハンドルを含み;
R3は、濃縮部分を含むハンドルを含み;
Xの各事例は、C-H、アミノ酸、またはヌクレオチドから独立して選択され;かつ
nは、1~12である。
いくつかの場合では、R1は、カルボキシラート含有アミノ酸側鎖(例えば、グルタマート側鎖またはアスパルタート側鎖)よりもペプチドC末端カルボキシラートに選択的に結合するように構成されたC末端カップリング試薬を含む。
いくつかの場合では、R2およびL2は存在しない(例えば、水素またはアルカンで置き換えられている)。いくつかの場合では、R3およびL3は存在しない。いくつかの場合では、R2、R3、L2、およびL3は存在しない。
いくつかの場合では、化合物は、-L2-R2の複数の事例を含み、ここで-L2-R2の複数の事例は、異なっていても、または同じでもよい。
化合物は、式(Ia):
の構造を有し得、
式中、
L1、L2、およびL3は、独立して、結合、置換または非置換アルキレン、置換または非置換アルケニル、置換または非置換アルキニル、置換または非置換ヘテロアルキル、-(R4)O(R4)-、オキソ、-(R5)N(R6)(=O)(R5)-であり;
R1は、C末端カップリング試薬であり;
R2は、検出部分、反応性物質、またはそれらの任意の組み合わせであり;
R3は、表面官能基付与部分または表面濃縮部分であり;
Xの各事例は、C-H、アミノ酸、またはヌクレオチドから独立して選択され;
R4は、結合、H、置換もしくは非置換アルキレン、置換もしくは非置換アルケニル、置換もしくは非置換アルキニル、または置換もしくは非置換ヘテロアルキルであり;
R5は、結合、H、置換または非置換アルキレン、置換または非置換アルケニル、置換または非置換アルキニル、置換または非置換ヘテロアルキルであり;
R6は、H、または置換もしくは非置換アルキルであり;かつ
nは、1~12である。
の構造を有し得、
式中、
L1、L2、およびL3は、独立して、結合、置換または非置換アルキレン、置換または非置換アルケニル、置換または非置換アルキニル、置換または非置換ヘテロアルキル、-(R4)O(R4)-、オキソ、-(R5)N(R6)(=O)(R5)-であり;
R1は、C末端カップリング試薬であり;
R2は、検出部分、反応性物質、またはそれらの任意の組み合わせであり;
R3は、表面官能基付与部分または表面濃縮部分であり;
Xの各事例は、C-H、アミノ酸、またはヌクレオチドから独立して選択され;
R4は、結合、H、置換もしくは非置換アルキレン、置換もしくは非置換アルケニル、置換もしくは非置換アルキニル、または置換もしくは非置換ヘテロアルキルであり;
R5は、結合、H、置換または非置換アルキレン、置換または非置換アルケニル、置換または非置換アルキニル、置換または非置換ヘテロアルキルであり;
R6は、H、または置換もしくは非置換アルキルであり;かつ
nは、1~12である。
いくつかの場合では、R1は、求核剤を含む。いくつかの場合では、求核剤は、アミン、アルコール、硫化物、負電荷種、またはそれらの任意の組み合わせを含む。いくつかの場合では、アミンは、一級アミンである。いくつかの場合では、アミンは、二級アミンである。いくつかの場合では、アミンは、三級アミンである。いくつかの場合では、アルコールは、一級アルコールである。いくつかの場合では、アルコールは、二級アルコールである。いくつかの場合では、アルコールは、三級アルコールである。いくつかの場合では、R1は、求電子剤を含む。いくつかの場合では、求電子剤は、マイケルアクセプター、アルケン、ジエン、アクリルアミド、N-(プロパ-2-イン-1-イル)メチルアクリルアミド、イソシアナート、イソチオシアナート、オキシラン、α,β-不飽和カルボニル、ビニルスルホン、ノルボルナノン、またはそれらの任意の組み合わせからなる群より選択される。いくつかの場合では、R1は、マイケルアクセプターを含む。マイケルアクセプターは、α,β-不飽和ケトン、α,β-不飽和カルボキシラート、α,β-不飽和エステル、α,β-不飽和アミド、α,β-不飽和ニトリル、ニトロアルケン(例えば、2-ニトロビシクロ[2.2.1]ヘプタ-2-エン)、α,β-不飽和スルホン、またはそれらの任意の組み合わせを含み得る。マイケルアクセプターは、立体的に制限されたマイケルアクセプターであり得る(例えば、マイケルα,β-不飽和位置は、ビシクロヘプタンなどの二環基内に配置され得る)。[それにしたがって、それを編集してください―歪みモノカルボニル含有化合物は、光レドックスケミストリーによりC末端に作用する一般的な化合物名であり得る]
本開示の様々な局面は、橋かけ多環式アルキルまたはヘテロアルキル構造を含むマイケルアクセプターを含むC末端カップリング試薬を提供する。そのようなマイケルアクセプターは、それらの立体容積、および場合によってはより低い反応性によって、(例えば、アスパルタート側鎖およびグルタマート側鎖のカルボキシル基よりも)C末端カルボキシル基に対する増大された選択性を与え得る。橋かけ多環式構造は、置換されていてもよい橋かけ二環式C5~C14構造、例えばビシクロ[1.1.1]ペンタン、ビシクロ[2.1.1]ヘキサン、ビシクロ[2.2.1]ヘプタン、ビシクロ[2.2.2]オクタン、またはビシクロ[3.3.1]ノナンを含み得る。橋かけ多環式構造は、置換されていてもよい橋かけ三環式構造、例えばトリシクロ[2.2.1.02,6]ヘプタンまたはトリシクロ[5.2.1.02,6]デカンを含み得る。いくつかの場合では、マイケルアクセプターは、電子吸引基および橋かけ多環式構造(例えば、
)に直接結合したβ-不飽和炭素(例えば、カルボニル基またはニトロ基)を含む。いくつかの場合では、マイケルアクセプターは、橋かけ多環式構造内にα,β-不飽和炭素を含む。例えば、化合物は、
またはその誘導体を含むC末端反応性マイケルアクセプターを含み得る。
)に直接結合したβ-不飽和炭素(例えば、カルボニル基またはニトロ基)を含む。いくつかの場合では、マイケルアクセプターは、橋かけ多環式構造内にα,β-不飽和炭素を含む。例えば、化合物は、
またはその誘導体を含むC末端反応性マイケルアクセプターを含み得る。
いくつかの場合では、マイケルアクセプターは、式(II):
の構造、またはその塩、溶媒和物、互変異生体、もしくはN-オキシドを含み、
式中、
R7とR8とは、互いに結合して、R11の1つまたは複数の事例で置換されていてもよい、橋かけ二環式または三環式C5~C14アルキルまたはヘテロアルキル構造を形成し;
R9、R10、およびR11の各事例は、独立して、水素、ハロゲン、ヒドロキシル、置換されていてもよいアリール、置換されていてもよいヘテロアリール、置換されていてもよいシクロアルキル、置換されていてもよいヘテロシクロアルキル、置換されていてもよいアミン、-C(=O)-R12、置換されていてもよいアルキル、置換されていてもよいアルケニル、置換されていてもよいアルキニル、置換されていてもよいアルコキシ、置換されていてもよいハロアルキル、置換されていてもよいヘテロアルキレン、および置換されていてもよいハロアルコキシからなる群より選択され、あるいはR9とR10とは、互いに結合して、シクロアルキル、ヘテロシクロアルキル、アリール、またはヘテロアリールを形成し;かつ
R12の各事例は、独立して、水素、ハロゲン、ヒドロキシル、置換されていてもよいアルキル、置換されていてもよいヒドロキシアルキル、置換されていてもよいヘテロアルキレン、置換されていてもよいアルコキシ、置換されていてもよいハロアルキル、および置換されていてもよいハロアルコキシからなる群より選択される。
の構造、またはその塩、溶媒和物、互変異生体、もしくはN-オキシドを含み、
式中、
R7とR8とは、互いに結合して、R11の1つまたは複数の事例で置換されていてもよい、橋かけ二環式または三環式C5~C14アルキルまたはヘテロアルキル構造を形成し;
R9、R10、およびR11の各事例は、独立して、水素、ハロゲン、ヒドロキシル、置換されていてもよいアリール、置換されていてもよいヘテロアリール、置換されていてもよいシクロアルキル、置換されていてもよいヘテロシクロアルキル、置換されていてもよいアミン、-C(=O)-R12、置換されていてもよいアルキル、置換されていてもよいアルケニル、置換されていてもよいアルキニル、置換されていてもよいアルコキシ、置換されていてもよいハロアルキル、置換されていてもよいヘテロアルキレン、および置換されていてもよいハロアルコキシからなる群より選択され、あるいはR9とR10とは、互いに結合して、シクロアルキル、ヘテロシクロアルキル、アリール、またはヘテロアリールを形成し;かつ
R12の各事例は、独立して、水素、ハロゲン、ヒドロキシル、置換されていてもよいアルキル、置換されていてもよいヒドロキシアルキル、置換されていてもよいヘテロアルキレン、置換されていてもよいアルコキシ、置換されていてもよいハロアルキル、および置換されていてもよいハロアルコキシからなる群より選択される。
いくつかの場合では、R7とR8とは、互いに結合して、R11の1つまたは複数の事例で置換されていてもよい、橋かけ二環式C5~C14アルキルまたはヘテロアルキル構造を形成する。いくつかの場合では、R7とR8とは、互いに結合して、R11の1つまたは複数の事例で置換されていてもよい、橋かけ二環式C6~C10アルキルまたはヘテロアルキル構造を形成する。いくつかの場合では、R7とR8とは、互いに結合して、R11の1つまたは複数の事例で置換されていてもよい、橋かけ二環式C7~C9アルキルまたはヘテロアルキル構造を形成する。いくつかの場合では、R7とR8とは、互いに結合して、R11の少なくとも1つの事例で置換されている、橋かけ二環式C7~C9アルキルまたはヘテロアルキル構造を形成する。いくつかの場合では、R7とR8とは、互いに結合して、R11の少なくとも1つの事例で置換されている、橋かけ二環式C8~C10アルキルまたはヘテロアルキル構造を形成する。
いくつかの場合では、R9、R10、およびR11の各事例は、独立して、水素、ハロゲン、ヒドロキシル、-C(=O)-R12、置換されていてもよいアルキル、置換されていてもよいアルケニル、置換されていてもよいアルキニル、置換されていてもよいアルコキシ、および置換されていてもよいハロアルキルからなる群より選択される。いくつかの場合では、R9およびR10のうちの少なくとも1つが水素である。いくつかの場合では、R9およびR10のうちの少なくとも1つが水素ではない。いくつかの場合では、R9およびR10は水素である。いくつかの場合では、R11の各事例は水素ではない。いくつかの場合では、R11の各事例は、C1~C4アルキルからなる群より選択される。いくつかの場合では、R11の各事例はメチルである。
いくつかの場合では、置換されていてもよいとは、ヒドロキシル、ハロゲン、-NH2、アルキル、アルケニル、またはアルキニル置換を表す。いくつかの場合では、置換されていてもよいとは、ヒドロキシル、-NH2、またはアルキル置換を表す。
いくつかの場合では、マイケルアクセプターが、ノルボルネノン部分またはその誘導体を含む。いくつかの場合では、ノルボルネノンは、メチレンノルボルナノンまたはその誘導体を含む。いくつかの場合では、マイケルアクセプターは、3-メチレン-2-ノルボルナノンまたはその誘導体を含む。
C末端修飾のための方法
タンパク質、ペプチド、またはそれらの組み合わせは、C末端アミノ酸残基を含み得る。タンパク質、ペプチド、またはそれらの組み合わせは、例えば、細胞ライセート、生物学的液体(例えば、血液、血漿、尿、唾液)、またはそれらの組み合わせに由来し得る。タンパク質、ペプチド、またはそれらの組み合わせは、組み換え、合成、またはそれらの組み合わせであり得る。タンパク質、ペプチド、またはそれらの組み合わせは、例えば、抗体プルダウン方法(例えば、免疫沈降)、アフィニティープルダウン方法、グルタチオン-S-トランスフェラーゼ(GST)プルダウン方法、タンデムアフィニティー精製(TAP)方法、またはそれらの任意の組み合わせを用いて濃縮され得る。タンパク質、ペプチド、またはそれらの組み合わせは、タンパク質単離方法(例えば、クロマトグラフィーおよび電気泳動)により抽出され得る。ペプチド、タンパク質、またはそれらの組み合わせは、細胞、生物学的液体、またはそれらの組み合わせから生成され得、そしてクロマトグラフィー(例えば、サイズ排除、イオン交換、およびアフィニティーベース)または他のゲルベースの抽出方法(例えば、アガロース)を用いて分離され得る。
タンパク質、ペプチド、またはそれらの組み合わせは、C末端アミノ酸残基を含み得る。タンパク質、ペプチド、またはそれらの組み合わせは、例えば、細胞ライセート、生物学的液体(例えば、血液、血漿、尿、唾液)、またはそれらの組み合わせに由来し得る。タンパク質、ペプチド、またはそれらの組み合わせは、組み換え、合成、またはそれらの組み合わせであり得る。タンパク質、ペプチド、またはそれらの組み合わせは、例えば、抗体プルダウン方法(例えば、免疫沈降)、アフィニティープルダウン方法、グルタチオン-S-トランスフェラーゼ(GST)プルダウン方法、タンデムアフィニティー精製(TAP)方法、またはそれらの任意の組み合わせを用いて濃縮され得る。タンパク質、ペプチド、またはそれらの組み合わせは、タンパク質単離方法(例えば、クロマトグラフィーおよび電気泳動)により抽出され得る。ペプチド、タンパク質、またはそれらの組み合わせは、細胞、生物学的液体、またはそれらの組み合わせから生成され得、そしてクロマトグラフィー(例えば、サイズ排除、イオン交換、およびアフィニティーベース)または他のゲルベースの抽出方法(例えば、アガロース)を用いて分離され得る。
タンパク質、ペプチド、またはそれらの組み合わせは、消化により、タンパク質、ペプチド、またはそれらの組み合わせのペプチド断片とされ得る。消化は、例えば、酵素または小分子(例えば、臭化シアン、NTCB(2-ニトロ-5-チオ安息香酸)、およびイソチオシアナート)により達成され得る。酵素は、タンパク質分解性酵素であり得る。酵素は、エンドタンパク質分解性酵素(例えば、トリプシンおよびGlu-C)であり得る。タンパク質、ペプチド、またはそれらの組み合わせに由来するペプチド断片は、末端カルボキシラートを含むC末端アミノ酸を含有し得る。本明細書に開示される消化方法は、様々な長さのペプチド断片を生成し得る。方法は、少なくとも10アミノ酸、少なくとも12アミノ酸、少なくとも15アミノ酸、少なくとも20アミノ酸、少なくとも25アミノ酸、少なくとも30アミノ酸、少なくとも40アミノ酸、少なくとも50アミノ酸、少なくとも60アミノ酸、少なくとも70アミノ酸、または少なくとも80アミノ酸の平均長を有するペプチド断片を生成し得る。例えば、消化方法は、55~70アミノ酸の平均長を有するペプチド断片を生成する、一変異体プロテアーゼを含み得る。方法は、多くとも80、多くとも70、多くとも60、多くとも50、多くとも40、多くとも30、多くとも25、多くとも20、多くとも15、多くとも10、多くとも8、または多くとも5アミノ酸の平均長を有するペプチド断片を生成し得る。例えば、消化方法は、トリプシン処理を含み得、それによって、7~15アミノ酸の平均長を有するペプチド断片を生成し得る。
方法は、同一のC末端アミノ酸を含む、複数のペプチド断片を生成し得る。選択的C末端標識における一課題は、いくつかのC末端カップリング試薬により示される、ばらばらなアミノ酸タイプの親和性から生じる。C末端カップリング試薬は、種々のタイプのC末端アミノ酸に対するある範囲の親和性を含み得る。例えば、図11に示すように、ノルボルネノンC末端カップリング試薬は、システインおよびバリンのC末端アミノ酸カルボキシル基に対し高親和性を、そしてヒスチジンのC末端アミノ酸カルボキシル基に対し比較的低い親和性を含み得る。したがって、方法はGluC消化を含み得、それによってグルタミン酸およびアスパラギン酸のC末端を有するペプチド断片を生じるように構成され得る。方法は、エンテロキナーゼ消化またはトロンビン消化を含み得、それによってリジンC末端を有するペプチド断片を生じるように構成され得る。方法は、ファクターXa消化を含み得、それによってアルギニンC末端を有するペプチド断片を生じるように構成され得る。方法は、TEVプロテアーゼ消化を含み得、それによってグルタミンC末端を有するペプチドを生じるように構成され得る。
タンパク質、ペプチド、またはそれらの組み合わせは、反応性アミノ酸残基(例えば、内側アミノ酸側鎖残基、N末端アミノ酸アミンまたは側鎖残基)を含み得る。タンパク質、ペプチド、またはそれらの組み合わせの反応性アミノ酸残基は、保護され得る(例えば、反応性アミノ酸残基の反応性を低下させるために、保護試薬に可逆的に結合される)。反応性アミノ酸残基は、C末端アミノ酸を標識する前に保護され得る。反応性アミノ酸残基は、可逆的に、または非可逆的に、反応させることができる。反応性アミノ酸残基を保護することで、C末端標識反応の際に形成し得る副産物の生成を防止または排除することができる。反応性アミノ酸は、タンパク質、ペプチド、またはそれらの組み合わせの単離の前または後に修飾され得る。タンパク質、ペプチド、またはそれらの組み合わせの単離の前の修飾は、翻訳後修飾であり得る。翻訳後修飾としては、例えば、リン酸化、ユビキチン化(ubiquitinoylation)、メチル化、アセチル化、アシル化、カルボキシル化、ニトロシル化、シトルリン化、またはそれらの任意の組み合わせが挙げられ得る。反応性アミノ酸残基としては、例えば、システイン、N末端、リジン、チロシン、セリン、スレオニン、アルギニン、ヒスチジン、アスパラギン酸、グルタミン酸、グルタミン、プロリン、およびトリプトファンが挙げられ得る。
C末端標識の前または後の求核性側鎖のブロッキングの例としては以下が挙げられる。
a)システイン: システイン残基上のチオール基が、ヨードアセトアミド含有化合物またはマレイミド含有化合物などのシステイン反応性リンカーで可逆的または非可逆的に標識され得る。
b)N末端アミノ酸: タンパク質、ペプチド、またはそれらの組み合わせのN末端のアミノ基が、求電子剤(例えば、ピリジンカルボキシアルデヒド(PCA))を介して選択的にブロックされ得る。N末端は、液相または固相のいずれかでブロックされ得る(例えば、求電子剤が固体支持体に連結される)。N末端アミノ基は、可逆性保護基を得るためにブロックされ得る。
c)リジン: アミン側鎖が、スクシニミジルエステル、リジン選択性メチルトランスフェラーゼ、ビニルスルホン、カルバマート、チオカルバマート、カルボナート、チオカルボナート、塩化スルホニル、テトラフルオロフェニル(TFP)エステル、カルボニルアジド、アルデヒド、またはそれらの任意の組み合わせで標識され得る。
a)システイン: システイン残基上のチオール基が、ヨードアセトアミド含有化合物またはマレイミド含有化合物などのシステイン反応性リンカーで可逆的または非可逆的に標識され得る。
b)N末端アミノ酸: タンパク質、ペプチド、またはそれらの組み合わせのN末端のアミノ基が、求電子剤(例えば、ピリジンカルボキシアルデヒド(PCA))を介して選択的にブロックされ得る。N末端は、液相または固相のいずれかでブロックされ得る(例えば、求電子剤が固体支持体に連結される)。N末端アミノ基は、可逆性保護基を得るためにブロックされ得る。
c)リジン: アミン側鎖が、スクシニミジルエステル、リジン選択性メチルトランスフェラーゼ、ビニルスルホン、カルバマート、チオカルバマート、カルボナート、チオカルボナート、塩化スルホニル、テトラフルオロフェニル(TFP)エステル、カルボニルアジド、アルデヒド、またはそれらの任意の組み合わせで標識され得る。
求核性側鎖のブロッキングの他の例としては、例えば、Basle et al., Protein Chemical Modification on Endogenous Amino Acids, Chemistry and Biology, 17, March 26, 2010に開示される組成物および方法が挙げられる。本明細書において提供される求核性側鎖のブロッキングの例は、限定的なものではない。ペプチドまたはタンパク質の任意の求核性アミノ酸側鎖が、アミノ酸タイプに選択的な反応性物質でブロックされ得る。本明細書に記載される組成物をペプチドまたはタンパク質のC末端アミノ酸と選択的に反応させるためにペプチドまたはタンパク質のアミノ酸側鎖をブロックすることが、必要でない場合もある。
タンパク質、ペプチド、またはそれらの組み合わせは、C末端の修飾の前または後に遊離され得る。いくつかの場合では、次のことが実施され得る-(1)複数のペプチドの収集または単離、(2)ペプチドを固体支持体に固定化(例えば、システイン選択的捕捉部分またはPCA-ビーズ捕捉ケミストリーによる(例えばN末端アミン結合による))、(3)ペプチドC末端をC末端カップリング試薬に結合、(4)タンパク質、ペプチド、またはそれらの組み合わせの側鎖の標識、および(5)下流分析のためのタンパク質、ペプチド、またはそれらの組み合わせの遊離。
化学的方法
本開示の様々な方法が、C末端カップリング試薬の結合前に、ペプチドC末端の誘導体化を含む。誘導体化は、C末端の、C末端カップリング試薬に対する反応性を増加させ得る。誘導体化は、C末端カップリング試薬の選択性を増加させ得る。誘導体化は、酵素的であり得る。誘導体化は、非酵素的であり得る。誘導体化は、単一工程(例えば、ペプチドC末端のオキサゾロン誘導体化)または複数工程を含み得る。誘導体化は、C末端のオキサゾロン中間体への転換、C末端のカルバモイル化、C末端のフランジオンへの転換、C末端のアミド化、C末端の脱カルボキシル化(例えば、脱カルボキシルアルキル化)、またはそれらの任意の組み合わせを含み得る。
本開示の様々な方法が、C末端カップリング試薬の結合前に、ペプチドC末端の誘導体化を含む。誘導体化は、C末端の、C末端カップリング試薬に対する反応性を増加させ得る。誘導体化は、C末端カップリング試薬の選択性を増加させ得る。誘導体化は、酵素的であり得る。誘導体化は、非酵素的であり得る。誘導体化は、単一工程(例えば、ペプチドC末端のオキサゾロン誘導体化)または複数工程を含み得る。誘導体化は、C末端のオキサゾロン中間体への転換、C末端のカルバモイル化、C末端のフランジオンへの転換、C末端のアミド化、C末端の脱カルボキシル化(例えば、脱カルボキシルアルキル化)、またはそれらの任意の組み合わせを含み得る。
ペプチドC末端は、誘導体化されてオキサゾロン中間体を形成し得、それによって、C末端とAsp/Glu側鎖との区別は難しいにもかかわらず、特異的なC末端反応が可能になり得る。現行の区別方法には限界があるが、それは少なくともそれらの方法が(i)低い誘導体化効率を有し、(ii)官能基付与部分もしくは濃縮部分(例えば、二官能性ハンドル)を含有せず、(iii)反応しても、プロテオミクス(例えば、シーケンシング)を実施するのに十分な収率(例えば、少なくとも約90%、95%、99%、99.9%、もしくはそれ以上のC末端反応ペプチドもしくはタンパク質)が得られず、(iv)ペプチド、タンパク質、もしくはそれらの組み合わせに適さない有機試薬および高温の使用を必要とし、かつ/または(v)プロテオミクス(例えば、シーケンシング)を実施するのに、Asp/Gluよりも高い特異性(C末端アミノ酸残基に対し、内側アミノ酸残基と比べて少なくとも約10:1、100:1、1,000:1、もしくはそれ以上の特異性)を提供しないからである。本明細書に開示されるいくつかの方法および組成物は、二官能性ハンドルがアスパルタート残基またはグルタマート残基上の内側酸性基と反応することなくC末端に結合することを可能にするように適合化された形態の、C末端選択的オキサゾロン環形成を提供する。
オキサゾロン環は、C末端カップリング試薬と直接反応させてもよいし、またはC末端カップリング試薬との反応前に(例えば、ヒドロキシベンゾトリアゾール(HoBT)への結合により)活性化させてもよい。オキサゾロン中間体の活性化は、C末端カップリング試薬およびペプチドC末端を含む結合工程の収率および特異性を増加させ得る。例えば、オキサゾロン中間体を活性化することでその求電子性が増加し得、それによってもっと求核性が低い(したがってもっと交差反応性が低く、もっと特異性が高い)C末端カップリング試薬の使用が可能になり得る。そのようなメカニズムの一例を図3に例示する。
本開示の方法は、C末端カップリング試薬をペプチドC末端と直接反応させる工程を含み得る。ペプチドC末端のカルボキシル基を区別するように構成され得る化学的方法の一例は、光レドックスケミストリーである。したがって、本開示は、ペプチドおよびタンパク質(例えば、インスリン)の選択的C末端標識のために最適化された光レドックス方法および試薬(例えば、光レドックス触媒)を提供する。光レドックス触媒および方法は、内側カルボキシラートとC末端カルボキシラートとを、それらの還元電位の差に基づき区別し得る(例えば、C末端のほうが、内側カルボキシラート残基よりも容易に還元され得る)。例えば、フラビン光触媒は、C末端カルボキシラートに対し、カルボキシル側鎖の少なくとも3倍の特異性、少なくとも5倍の特異性、少なくとも8倍の特異性、少なくとも10倍の特異性、少なくとも12倍の特異性、少なくとも15倍の特異性、少なくとも20倍の特異性、少なくとも25倍の特異性、少なくとも50倍の特異性、少なくとも100倍の特異性、または少なくとも200倍の特異性を含み得る。
光触媒活性化は、C末端選択性のために最適化され得る。いくつかの場合では、光触媒活性化は、比較的低電力の光によって実現され得、それによって非選択的で相手を選ばない光触媒のふるまいが最小限化され得る。例えば、光触媒活性化は、2ワット(W)未満の光、1.5 W未満の光、1 W未満の光、750 mW未満の光、500 mW未満の光、400 mW未満の光、300 mW未満の光、200 mW未満の光、150 mW未満の光、120 mW未満の光、100 mW未満の光、80 mW未満の光、60 mW未満の光、または50 mW未満の光により実現され得る。同様に、狭バンド幅(例えば、半最大強度時の全幅)光を光触媒活性化に用いることで、C末端カルボキシラート選択性が増大され得る。したがって、光触媒活性化は、60 nm未満のバンド幅の光(例えば、ランプなどの光励起源からの390~490 nmの光)、50 nm未満のバンド幅の光、40 nm未満のバンド幅の光、30 nm未満のバンド幅の光、25 nm未満のバンド幅の光、20 nm未満のバンド幅の光、15 nm未満のバンド幅の光、12 nm未満のバンド幅の光、10 nm未満のバンド幅の光、8 nm未満のバンド幅の光、6 nm未満のバンド幅の光、5 nm未満のバンド幅の光、3 nm未満のバンド幅の光、または2 nm未満のバンド幅の光により実現され得る。光源は、試料に達する光のバンド幅を制御するフィルター(例えば、狭バンドパス光学フィルター)を含み得る。光源は、350 nm~550 nm、400 nm~700 nm、350 nm~400 nm、400 nm~450 nm、450 nm~500 nm、500 nm~550 nm、または550 nm~600 nmの中心波長を有する光を提供し得る。例えば、光触媒方法は、電力220 mW、バンド幅25 nmの450 nm(青色)LED光源を用い得る。照射は、少なくとも0.25時間、少なくとも0.5時間、少なくとも0.75時間、少なくとも1時間、少なくとも1.5時間、少なくとも2時間、少なくとも2.5時間、少なくとも3時間、少なくとも3.5時間、少なくとも4時間、少なくとも5時間、少なくとも6時間、少なくとも7時間、少なくとも8時間、少なくとも9時間、少なくとも10時間、少なくとも11時間、または少なくとも12時間実施され得る。
光レドックスケミストリーのマイケルアクセプターは、例えば、置換もしくは非置換ノルボルナノン、マロナート、またはマレイミドであり得る。マイケルアクセプターは、例えば、ノルボルネノンバリアント、3-メチレン-2-ノルボルナノン、ジエチルエチリデンマロナート、またはマレイミドであり得る。他のマイケルアクセプターとしては、例えば、置換アルケン、ジエン、アクリルアミド、N-(プロパ-2-イン-1-イル)メチルアクリルアミド、イソシアナート、イソチオシアナート、オキシラン、α,β-不飽和カルボニル、ノルボルナノン、ビニルスルホン、またはそれらの任意の組み合わせが挙げられ得る。
酵素的方法
C末端を標識することは、酵素的連結を含み得る。酵素的連結ストラテジーの原則は、エンドペプチダーゼおよびエキソペプチダーゼの切断特性を、ペプチド連結を実施するために(例えば、改造された酵素立体構造の下の適切な求核剤の結合により)転用することである。酵素は、種々のアミノ酸タイプに対し様々な特異度を有し得る。酵素(例えば、カルボキシペプチダーゼY)は、C末端アミノ酸に対し広範な特異性を有し得、またはC末端アミノ酸タイプの厳格な要件を有し得る(例えば、サーモリシン)。他のクラスの修飾酵素(例えば、アミダーゼ)をC末端の標識に用いてもよい。
C末端を標識することは、酵素的連結を含み得る。酵素的連結ストラテジーの原則は、エンドペプチダーゼおよびエキソペプチダーゼの切断特性を、ペプチド連結を実施するために(例えば、改造された酵素立体構造の下の適切な求核剤の結合により)転用することである。酵素は、種々のアミノ酸タイプに対し様々な特異度を有し得る。酵素(例えば、カルボキシペプチダーゼY)は、C末端アミノ酸に対し広範な特異性を有し得、またはC末端アミノ酸タイプの厳格な要件を有し得る(例えば、サーモリシン)。他のクラスの修飾酵素(例えば、アミダーゼ)をC末端の標識に用いてもよい。
本明細書には、ドナー(例えば、ペプチド、タンパク質、またはそれらの組み合わせ)のカルボキシル末端をアクセプター(例えば、C末端カップリング試薬などの固定分子アダプター)で酵素標識する工程を含む方法が記載される。酵素の活性は、標的ペプチドのC末端アミノ酸のタイプに依存する場合もあるし、またはそれとは関係ない場合もある。例えば、カルボキシペプチダーゼ酵素は、C末端のアミノ酸タイプとは関係ない活性を示し得る。逆に、ペプチリガーゼ酵素(例えば、オムニリガーゼバリアントのチモシン-アルファ-1)は、C末端アミノ酸タイプに依存する活性を含み得る(例えば、プロリンC末端を含有するペプチドに対しては反応性がないが、双性イオンのリジンC末端およびアルギニンC末端を含有するペプチドに対しては高活性)。ペプチリガーゼ酵素のN末端リガーゼ活性を、ペプチド、タンパク質、またはそれらの組み合わせのC末端標識反応用に転用することができる。
カルボキシペプチダーゼYは、C末端アミノ酸の除去に一般的に用いられる酵母セリンプロテアーゼであり、トランスペプチダーゼ活性を有し得る。カルボキシペプチダーゼは、タンパク質、ペプチド、またはそれらの組み合わせのC末端への、求核性ハンドルの連結を媒介し得る。連結は、タンパク質、ペプチド、またはそれらの組み合わせのC末端ペプチドだけの選択的かつ能動的な濃縮を含み得る。本明細書に記載される方法および組成物は、求核性ハンドルを、ペプチド、タンパク質、またはそれらの組み合わせのC末端に結合させるように適合化され得る。
オムニリガーゼは、ペプチド転移反応を実施できる改変サブチリガーゼ(subtiligase)であり、かつEnzyPep B.V(オランダ国ヘレーン)により販売されている。分子内連結反応は、アシル修飾アミノ酸エステル(例えば、置換Cam-エステル)の反応を含み得、アクセプターペプチドまたはタンパク質の遊離N末端アミンのついたドナーペプチドまたはタンパク質のC末端端部を作り得る。高効率な連結反応のためのアミノ酸選択のバイアスがあり得る。このバイアスは、連結されるペプチドまたはタンパク質の数を減じ得るが、ドナーまたはアクセプターペプチドまたはタンパク質分子を構成する許容されるアミノ酸配列の情報を担持し得る。オムニリガーゼ反応は本明細書に記載されており、一定な「アクセプター」ハンドルを個々のペプチド、タンパク質、またはそれらの組み合わせのN末端に連結するのに用いられ得る。
オムニリガーゼ反応性の連結活性は、ヘテロプールの各ペプチド、タンパク質、またはそれらの組み合わせのC末端を、一定な求核性ハンドル(アクセプター)と連結するのに転用され得る。このことは、ペプチドまたはタンパク質の酸性末端をエステル形態(例えば、アルキルエステルまたはCam-エステル)として活性化させることにより達成され得る。酸性末端は、メタノール性HClにより、エステル形態として活性化させられ得る。リンカーが結合された後、Asp/Glu側鎖はエステルとしてキャップされ得る。ペプチドまたはタンパク質のエステルは、高pH(pH 12)下で加水分解されて標準的な酸性側鎖を現し得る。ペプチド転移反応は、固相固定化ペプチドまたはタンパク質で、または液相で実施され得る。ペプチド転移反応は、液相で実施され得る。
ペプチドまたはタンパク質の固定化は、C末端アミノ酸残基の側鎖を用いて実現され得る。例えば、タンパク質ライセートのNTCB(2-ニトロ-5-チオ安息香酸)による化学的消化の場合、ペプチド、タンパク質、およびそれらの組み合わせは、C末端アミノ酸残基としてシステインを有し得る。チオール含有側鎖は、表面固定化のために、ヨードアセトアミド基および適切な官能基を含むハンドルにより官能基付与され得る。別の例として、C末端にリジンを有するペプチドの場合、トリプシン消化に続いて、ハンドルに反応するε-アミンを介して表面に固定化され得る。これらの方法では、グルタマート、アスパルタート、およびC末端アミノ酸の酸性残基を、反応に用いることができる。したがって、本開示の方法は、内側アミノ酸残基、N末端アミノ酸末端アミンもしくは側鎖、またはC末端アミノ酸側鎖により、ペプチドを表面に固定化する工程、およびC末端アミノ酸をC末端カップリング試薬に結合させる工程を含み得る。いくつかの場合では、ペプチドは、C末端カップリング試薬との結合前に、表面に固定化される。いくつかの場合では、ペプチドは、表面に固定化される前に、C末端カップリング試薬に結合される。
ペプチドまたはタンパク質のC末端を標識する方法
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が開示され、前記方法は、前記第2のカルボン酸部分よりも優先的に、前記第1のカルボン酸部分を、反応性物質(例えば、C末端カップリング試薬)と結合させる工程を含む。C末端カップリング試薬は、少なくとも約10%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約99%、少なくとも約99.9%、もしくは少なくとも約99.99%、またはそれ以上の効率で、第2のカルボン酸部分よりも優先的に第1のカルボン酸部分に結合し得る。C末端カップリング試薬は、約10%~約99.99%、約50%~99.99%、約90%~約99.99%、または95%~99.99%の効率で、第2のカルボン酸部分よりも優先的に第1のカルボン酸部分に結合し得る。反応性物質は、第2のカルボン酸部分とは反応しない場合もある。反応性物質は、第1のカルボン酸部分とだけ反応し得る。いくつかの場合では、ペプチドまたはタンパク質は、第2のカルボン酸部分を含まない。ペプチドまたはタンパク質は、カルボン酸側鎖を含まないアミノ酸残基を含み得る。
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が開示され、前記方法は、前記第2のカルボン酸部分よりも優先的に、前記第1のカルボン酸部分を、反応性物質(例えば、C末端カップリング試薬)と結合させる工程を含む。C末端カップリング試薬は、少なくとも約10%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約99%、少なくとも約99.9%、もしくは少なくとも約99.99%、またはそれ以上の効率で、第2のカルボン酸部分よりも優先的に第1のカルボン酸部分に結合し得る。C末端カップリング試薬は、約10%~約99.99%、約50%~99.99%、約90%~約99.99%、または95%~99.99%の効率で、第2のカルボン酸部分よりも優先的に第1のカルボン酸部分に結合し得る。反応性物質は、第2のカルボン酸部分とは反応しない場合もある。反応性物質は、第1のカルボン酸部分とだけ反応し得る。いくつかの場合では、ペプチドまたはタンパク質は、第2のカルボン酸部分を含まない。ペプチドまたはタンパク質は、カルボン酸側鎖を含まないアミノ酸残基を含み得る。
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が開示され、前記方法は、前記反応性物質と前記第2のカルボン酸部分との結合の非存在下で、反応性物質(例えば、C末端カップリング試薬)を前記第1のカルボン酸部分に結合させる工程を含む。ペプチドまたはタンパク質は、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000個、またはそれ以上の内側アミノ酸残基を含み得る。ペプチドまたはタンパク質は、多くとも約1,000、900、800、700、600、500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2個、またはそれ未満の内側アミノ酸残基を含み得る。ペプチドまたはタンパク質は、約2~約1,000、約10~約100、または約10~約50個の内側アミノ酸残基を含み得る。少なくとも2個の内側アミノ酸残基のうちの少なくとも1個または複数個が、第2のカルボン酸部分を含み得る。例えば、ペプチドまたはタンパク質が100個の内側アミノ酸残基を含む場合、前記100個の内側アミノ酸残基のうちの1、2、3、4、5、6、7、8、9、10、15、20、30、40、50個、またはそれ以上が、第2のカルボン酸部分を含み得る。
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が記載され、前記方法は、前記固定化されたペプチドまたはタンパク質の前記第2のカルボン酸部分よりも優先的に、前記固定化されたペプチドまたはタンパク質の前記第1のカルボン酸部分を、C末端カップリング試薬と結合させる工程を含む。いくつかの場合では、ペプチドまたはタンパク質は、スライド(例えば、顕微鏡スライド)、ビーズ、またはウェルプレートのウェル表面などの表面に固定化されている。
特定の局面では、本明細書には、第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸残基とを含むペプチドまたはタンパク質を処理するための方法が記載され、前記方法は、前記ペプチドまたはタンパク質の前記第1のカルボン酸部分を、前記ペプチドまたはタンパク質の前記第2のカルボン酸部分よりも優先的に、C末端カップリング試薬と結合させる工程を含み、前記反応性試薬は、官能基付与部分、濃縮部分、またはそれらの組み合わせを含む。
C末端カップリング試薬は、ハンドルを含み得る。ハンドルは、例えば、蛍光色素、量子ドット、発光色素、またはFRETアクセプターもしくはドナーなどの光学標識を含み得る。ハンドルは、例えば、ナノスケールトポグラフィー(DNA-ペイント)アッセイにおける撮像用のDNAバーコードまたはDNAポイント蓄積などの核酸分子を含み得る。ハンドルは、例えば、タンデム質量タグ(TMT)または等圧タグなどのイオン化可能分子を含み得る。ハンドルは、電子化学的に検出可能な標識(例えば、フェロセンなどの特徴的な還元または酸化電位を含む部分)を含み得る。ハンドルは、ポリエチレンスペーサーを含み得る。ハンドルは、ポリアルギニンペプチドを含み得る。ハンドルは、光学標識(例えばフルオロフォア)、核酸分子(例えば、DNA、RNA、PNA)、イオン化可能分子(例えば、臭素、アミン、ホスファート)、ポリエチレンスペーサー、ポリアルギニンペプチド、またはそれらの任意の組み合わせを含み得る。
C末端カップリング試薬は、求核剤(例えば、一級アミン)などのカルボキシラート捕捉部分を含み得る。C末端カップリング試薬は、求電子剤を含み得る。反応性物質は、求核剤および求電子剤を含み得る。求核剤は、例えば、アミン、アルコール、硫化物、シアナート、チオシアナート、脱プロトン化原子、またはそれらの任意の組み合わせを含み得る。求電子剤は、マイケルアクセプター、アルケン、ジエン、アクリルアミド、N-(プロパ-2-イン-1-イル)メチルアクリルアミド、イソシアナート、イソチオシアナート、立体構造制限部分(例えば、オキシラン、α,β-不飽和カルボニル、ノルボルナノン)、ビニルスルホン、またはそれらの任意の組み合わせを含み得る。
C末端カップリング試薬は、官能基付与部分、濃縮部分、またはそれらの組み合わせを含む、ハンドルを含み得る。濃縮部分は、C末端官能基付与ペプチドの精製を、例えば親和性クロマトグラフィーまたは免疫沈降により、可能にし得る。官能基付与部分は、基板結合(例えば、ビーズまたはガラススライドに結合した)捕捉剤などの捕捉試薬に結合するように構成され得る。官能基付与部分または濃縮部分は、アルキン、アジド、フルオロフォア、ビオチン、核酸分子(例えば、RNA、DNA、PNA)、アミノ酸、ペプチド(例えば、FLAG-タグなどのエピトープ)、固体支持体ビーズもしくは樹脂、またはそれらの任意の組み合わせを含み得る。
方法は、前記ペプチドまたはタンパク質を、少なくとも1つの化学物質、少なくとも1つの酵素、またはそれらの組み合わせで処理する工程を含み得る。少なくとも1つの化学物質、少なくとも1つの酵素、またはそれらの組み合わせは、ペプチドまたはタンパク質のC末端アミノ酸残基を、(例えば、C末端カップリング試薬との結合のために)選択的に活性化し得る。少なくとも1つの化学物質は、光触媒であり得る。光触媒は、例えば、フラビン(例えば、リボフラビン、ルミフラビン)であり得る。少なくとも1つの化学物質を、ペプチドまたはタンパク質のC末端アミノ酸と反応させて、前記ペプチドまたはタンパク質の前記C末端アミノ酸のオキサゾロン中間体を形成してもよい。オキサゾロン中間体は、C末端カップリング試薬と反応させてもよいし、またはC末端カップリング試薬との反応の前に活性化させてもよい。少なくとも1つの化学物質は、例えば、無水酢酸、ヒドロキシベンゾトリアゾール(HOBT)、ヒドロキシアザベンゾトリアゾール(HOAT)、2-ニトロ-5-チオ安息香酸(NTCB)、またはそれらの組み合わせであり得る。少なくとも1つの酵素は、ペプチダーゼ、アミンダーゼ、ヒドロラーゼ、またはそれらの任意の組み合わせであり得る。少なくとも1つの酵素は、例えば、エンドペプチダーゼ、エキソペプチダーゼ、カルボキシペプチダーゼ、アミダーゼ、ヒドロラーゼ、プロテイナーゼ、ペプチリガーゼ、またはそれらの任意の組み合わせであり得る。ペプチリガーゼは、オムニリガーゼまたはその修飾誘導体であり得る。カルボキシペプチダーゼは、例えば、カルボキシペプチダーゼA、カルボキシペプチダーゼB、カルボキシペプチダーゼC、カルボキシペプチダーゼY、またはその修飾誘導体であり得る。カルボキシペプチダーゼはカルボキシペプチダーゼYであり得る。プロテイナーゼは、サーモリシンまたはその修飾誘導体であり得る。
前記方法は、複数のペプチドまたはタンパク質を切断する工程を含み得、ここで前記複数のペプチドまたはタンパク質は、前記ペプチドまたはタンパク質を含む。ペプチドまたはタンパク質は、第2のカルボン酸部分を含まない場合がある。複数のペプチドまたはタンパク質は、第2のカルボン酸部分を有する少なくとも1つのペプチドまたはタンパク質を含み得る。
C末端カップリング試薬は、ペプチドまたはタンパク質の(i)少なくとも1個の内側アミノ酸残基および(ii)N末端アミノ酸残基に対し、不活(例えば、実質的に結合しない)であり得る。C末端カップリング試薬は、ペプチドまたはタンパク質の少なくとも1個の内側アミノ酸残基に対し不活であり得る。反応性物質は、ペプチドまたはタンパク質のN末端アミノ酸残基に対し不活であり得る。C末端カップリング試薬は、ペプチドまたはタンパク質の複数の内側アミノ酸残基に対し不活であり得る。C末端カップリング試薬は、ペプチドまたはタンパク質の1つの内側アミノ酸残基に対し不活であり得る。少なくとも1個の内側アミノ酸残基は、天然または非天然アミノ酸であり得る。前記少なくとも1つの前記内側アミノ酸残基は、アミン、カルボン酸、インドール、一級アルコール、二級アルコール、チオール、チオエーテル、フェノール、アミド、グアニジン、イミダゾール、またはそれらの任意の組み合わせからなる群より選択される官能基を含み得る。前記ペプチドもしくはタンパク質の少なくとも1個の内側アミノ酸残基、前記ペプチドもしくはタンパク質のN末端アミノ酸残基、またはそれらの組み合わせは、反応性物質を第1のカルボン酸部分に結合させる前に修飾され得る。前記ペプチドもしくはタンパク質の少なくとも1個の内側アミノ酸残基、前記ペプチドもしくはタンパク質のN末端アミノ酸残基、またはそれらの組み合わせは、反応性物質を第1のカルボン酸部分に結合させた後に修飾され得る。ペプチドまたはタンパク質のうちの少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20種類、またはそれ以上のアミノ酸タイプが、反応性物質を第1のカルボン酸部分に結合させる前または結合させた後に修飾され得る。ペプチドまたはタンパク質の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20種類、またはそれ以上のアミノ酸タイプおよびN末端アミノ酸が、反応性物質を第1のカルボン酸部分に結合させる前または結合させた後に修飾され得る。修飾される内側アミノ酸タイプは、システイン、リジン、チロシン、トリプトファン、セリン、スレオニン、アルギニン、またはそれらの任意の翻訳後修飾もしくは組み合わせである。
少なくとも1個の内側アミノ酸残基は、少なくとも1つの標識に結合され得る。複数の内側アミノ酸残基はそれぞれ、少なくとも1つの標識に結合され得る(例えば、5つの標識が、別々に、5個の内側アミノ酸残基に結合され得る)。ペプチドまたはタンパク質の各内側アミノ酸は、少なくとも1つの標識に結合され得る。ペプチドまたはタンパク質のアミノ酸タイプ(例えば、リジン、シスチン、セリン他)の各内側アミノ酸は、少なくとも1つの標識に結合され得る。ペプチドまたはタンパク質のアミノ酸タイプ(例えば、リジン、シスチン、セリン他)の各内側アミノ酸は、同じタイプの標識試薬に結合され得る。少なくとも1つの標識は、異なる内側アミノ酸タイプの異なる標識に対応し得る。例えば、ペプチドまたはタンパク質のいずれのリジンも赤色蛍光標識に結合され得、いずれのセリンも緑色蛍光標識に結合され得る。少なくとも1つの標識は、光学検出可能標識であり得る。光学標識は、蛍光色素またはFRETドナーもしくはアクセプターであり得る。光学標識はフルオロフォアであり得る。少なくとも1つの標識は、リジン特異的標識、システイン特異的標識、カルボキシラート側鎖(例えば、グルタマートおよびアスパルタート)特異的標識、トリプトファン特異的標識、チロシン特異的標識、ヒスチジン特異的標識、アルギニン特異的標識、セリン特異的標識、スレオニン特異的標識、またはそれらの任意の組み合わせを含み得る。少なくとも1つの標識は、非天然アミノ酸(例えば、クロロチロシン)または翻訳後修飾されたアミノ酸(例えば、ホスホチロシン)特異的標識をさらに含み得る。
前記方法は、表面固定化、試料多重化、試料濃縮、シーケンシング、標的同定、質量分析、またはそれらの任意の組み合わせのために、標識されたペプチドまたはタンパク質を生産する工程をさらに含み得る。シーケンシングは、1分子シーケンシング、ナノポアシーケンシング、フルオロシーケンシング、またはそれらの組み合わせであり得る。シーケンシングは、核酸シーケンシングまたはペプチドシーケンシングであり得る。シーケンシングは、エドマン分解を含み得る。
前記方法は、ペプチドまたはタンパク質を生物学的試料から単離する工程をさらに含み得る。生物学的試料は、例えば、組織、血液、尿、唾液、リンパ液、またはそれらの任意の組み合わせに由来し得る。方法は、ペプチドまたはタンパク質を消化する工程をさらに含み得る。方法は、(i)ペプチドまたはタンパク質を生物学的試料から単離する工程、(ii)前記ペプチドまたはタンパク質を固体支持体に固定化する工程、(iii)少なくとも1個の内側アミノ酸残基を標識する工程、および(iv)前記ペプチドまたはタンパク質を前記固体支持体から遊離する工程をさらに含み得る。固定化する工程は、前記ペプチドまたはタンパク質のN末端アミノ酸残基を、固体支持体に結合された捕捉部分に結合させることを含み得る。捕捉部分は、例えば、ピリジンカルボキシアルデヒドまたはその誘導体などのアルデヒドを含み得る。
ペプチドまたはタンパク質は、組換えまたは合成ペプチドまたはタンパク質であり得る。
タンパク質またはペプチドは、反応性物質により可逆的に修飾され得る。タンパク質またはペプチドは、反応性物質により非可逆的に修飾され得る。
質量分析
本明細書に記載される組成物および方法は、ペプチドおよびタンパク質の同定に便利であり得る。改良された質量分析のために官能基をペプチドC末端に付加する(例えば、臭素タグ)能力は、ペプチドの定量および同定を可能にし得る。例えば、C末端プロテオミクスの技法(例えば、消化されたタンパク質のC末端ペプチドの濃縮および同定)は、そのような標識ストラテジーを用いることができる。ペプチドのN末端を(例えば、リジン残基に対する交差反応性により)標識するのに用いられる等圧タグ方法と同様に、等圧タグをペプチドのC末端を標識するのに用いることができる。等圧タグは、異なる試料からタンパク質試料を多重化するのに、ならびに異なる試料中のペプチド、タンパク質、またはそれらの組み合わせの相対的な定量を得るのに、用いられ得る。試料における多重化の数は、ペプチドまたはタンパク質のN末端残基およびC末端残基をタグ化することにより倍増し得る。C末端を選択的に標識することによるペプチドおよびタンパク質の同定における別の改良は、タンデム質量分析のためである。タンパク質またはペプチドのC末端は、高荷電基(例えば、正電荷アミン、臭素、または負電荷ホスファート)を提供し得る。ペプチドまたはタンパク質のC末端を標識することで、実質的に全部のペプチド断片が等しい効率でイオン化できることが保証され得、より正確なタンパク質およびペプチドの同定が可能になり得る。
本明細書に記載される組成物および方法は、ペプチドおよびタンパク質の同定に便利であり得る。改良された質量分析のために官能基をペプチドC末端に付加する(例えば、臭素タグ)能力は、ペプチドの定量および同定を可能にし得る。例えば、C末端プロテオミクスの技法(例えば、消化されたタンパク質のC末端ペプチドの濃縮および同定)は、そのような標識ストラテジーを用いることができる。ペプチドのN末端を(例えば、リジン残基に対する交差反応性により)標識するのに用いられる等圧タグ方法と同様に、等圧タグをペプチドのC末端を標識するのに用いることができる。等圧タグは、異なる試料からタンパク質試料を多重化するのに、ならびに異なる試料中のペプチド、タンパク質、またはそれらの組み合わせの相対的な定量を得るのに、用いられ得る。試料における多重化の数は、ペプチドまたはタンパク質のN末端残基およびC末端残基をタグ化することにより倍増し得る。C末端を選択的に標識することによるペプチドおよびタンパク質の同定における別の改良は、タンデム質量分析のためである。タンパク質またはペプチドのC末端は、高荷電基(例えば、正電荷アミン、臭素、または負電荷ホスファート)を提供し得る。ペプチドまたはタンパク質のC末端を標識することで、実質的に全部のペプチド断片が等しい効率でイオン化できることが保証され得、より正確なタンパク質およびペプチドの同定が可能になり得る。
シーケンシング
本明細書に記載される組成物および方法は、ペプチドおよびタンパク質のシーケンシングに便利であり得る。
本明細書に記載される組成物および方法は、ペプチドおよびタンパク質のシーケンシングに便利であり得る。
ナノポアシーケンシング
ナノポアシーケンシングは、例えばポリヌクレオチドなどのバイオポリマーの、第三世代シーケンシング方法である。生物学的方法および固体方法の両方が存在している。方法は、電気泳動を用いて、例えばポリンタンパク質、アンフォルダーゼ(unfoldase)-プロテアーゼポア複合体、または金属もしくは合金におけるナノメートルサイズの穴などの小オリフィスを経由して、ポリマーを移動させることができる。これらの小オリフィスは、表面(例えば、脂質膜または金属または合金)に埋め込まれて、多孔表面をなすことができる。この系から電流を測定することができ、また、各ポリマーサブユニット(例えば、DNAおよびRNA塩基)の電気シグナルの差を測定して、そのポリマーサブユニットのアイデンティティを決定することができる。いくつかの場合では、アミノ酸またはアミノ酸タイプ(例えば、ペプチド中の全リジン)が、ポア通過中に同定可能な電気シグナルを提供する標識に、結合され得る。電流測定のかわりに、またはそれと組み合わせて、ポア経由のバイオポリマーの転位が光学的に観察され得る。例えば、ポアは、バイオポリマー上のFRETアクセプターを活性化するように構成されたFRETドナーを含み得、したがってポア経由のバイオポリマーの転位は、時間分解されるFRETシグナルを生じ得る。ペプチドは、ポア経由の転位後に各々シグナルを生じる複数の標識を含み得る。シグナルは、ペプチドのアミノ酸(例えば、シグナルを生じている標識が結合されているアミノ酸タイプを同定する)または配列(例えば、リジン-スレオニン-チロシンなどの連続した3アミノ酸配列)を同定し得る。系は、ペプチドまたはその一部分(例えば、個々のアミノ酸)を定量するように構成され得る。ナノポアシーケンシングアッセイは、ペプチド(例えば、C末端カップリング試薬に結合されたペプチド)の残基または配列を同定し得る。本明細書に記載される方法および組成物を考慮すると、ナノポアシーケンシングのバイオポリマーは、バーコードとして構成されてもよい。
ナノポアシーケンシングは、例えばポリヌクレオチドなどのバイオポリマーの、第三世代シーケンシング方法である。生物学的方法および固体方法の両方が存在している。方法は、電気泳動を用いて、例えばポリンタンパク質、アンフォルダーゼ(unfoldase)-プロテアーゼポア複合体、または金属もしくは合金におけるナノメートルサイズの穴などの小オリフィスを経由して、ポリマーを移動させることができる。これらの小オリフィスは、表面(例えば、脂質膜または金属または合金)に埋め込まれて、多孔表面をなすことができる。この系から電流を測定することができ、また、各ポリマーサブユニット(例えば、DNAおよびRNA塩基)の電気シグナルの差を測定して、そのポリマーサブユニットのアイデンティティを決定することができる。いくつかの場合では、アミノ酸またはアミノ酸タイプ(例えば、ペプチド中の全リジン)が、ポア通過中に同定可能な電気シグナルを提供する標識に、結合され得る。電流測定のかわりに、またはそれと組み合わせて、ポア経由のバイオポリマーの転位が光学的に観察され得る。例えば、ポアは、バイオポリマー上のFRETアクセプターを活性化するように構成されたFRETドナーを含み得、したがってポア経由のバイオポリマーの転位は、時間分解されるFRETシグナルを生じ得る。ペプチドは、ポア経由の転位後に各々シグナルを生じる複数の標識を含み得る。シグナルは、ペプチドのアミノ酸(例えば、シグナルを生じている標識が結合されているアミノ酸タイプを同定する)または配列(例えば、リジン-スレオニン-チロシンなどの連続した3アミノ酸配列)を同定し得る。系は、ペプチドまたはその一部分(例えば、個々のアミノ酸)を定量するように構成され得る。ナノポアシーケンシングアッセイは、ペプチド(例えば、C末端カップリング試薬に結合されたペプチド)の残基または配列を同定し得る。本明細書に記載される方法および組成物を考慮すると、ナノポアシーケンシングのバイオポリマーは、バーコードとして構成されてもよい。
C末端カップリング試薬は、ナノポアシーケンシングアッセイで情報を提供し得る、検出可能標識(例えば、フルオロフォアなどの検出可能部分を含むハンドル)を含み得る。検出可能標識は、バーコード(例えば、核酸またはペプチドバーコード)を含み得る。バーコードは、情報を含み得る。例えば、核酸またはペプチドバーコードの配列は、C末端タグ化ペプチドが由来する試料または細胞(例えば、細胞分別実験からの単一細胞、またはコロニーからの細胞)を同定し得る。いくつかの場合では、C末端カップリング試薬のバーコード配列が、ナノポアシーケンシングにより同定される。いくつかの場合では、(例えば、C末端カップリング試薬により)ペプチドに結合された核酸バーコードの配列、および前記ペプチドの配列が、ナノポアシーケンシングにより同定される。いくつかの場合では、検出可能標識は、蛍光色素、FRETドナーもしくはアクセプター、またはクエンチャーなどの光学検出可能な標識であり得る。いくつかの場合では、検出可能標識は、電子化学的に検出可能な標識であり得る(例えば、特徴的な酸化または還元電位を含み得る)。
検出可能標識は、ポア経由の転位後、シグナルを生じ得る。例えば、光学的に検出可能な標識は、ポア結合FRETドナーまたはアクセプターを通過した後、FRETシグナルを生じ得、あるいは電子化学的に検出可能な標識は、ポア内通過時に検出可能な酸化または還元を経ることができる。C末端のポア内通過の検出は、ナノポアシーケンシング方法の確度を向上させ得る。例えば、検出可能に標識されたペプチドC末端を用いたナノポアシーケンシング方法は、ポア転位事象の開始または終了を識別することができ、したがって時間的に間隔の近い2つのペプチド転位を識別することができる。検出可能に標識されたペプチドC末端を用いるナノポアシーケンシング方法は、ペプチドの長さを同定することができ得る。例えば、方法は、対象ペプチドのC末端を第1の検出可能標識(例えば、赤色色素を含むC末端カップリング試薬の結合)で、およびN末端(例えば、アミンまたは青色色素を含むN末端特異的標識)を、選択的に標識する工程を含み得、したがって対象ペプチドの最初と最後の位置がポア転位事象の際に同定され得る。
検出可能標識はまた、ポア内通過の前または後に検出可能シグナルを提供し得る。例えば、蛍光標識は、多孔質膜越しの転位の前および後のタグ化ペプチドの定量を可能にし得、それによって例えば転位効率の定量を可能にし得る。
C末端カップリング試薬は、ポア転位効率に影響するハンドルを含み得る。様々なナノポアシーケンシング方法が、荷電種の(例えばポア経由の)移動を誘導する電位によりポアまたは膜転位を駆動する。そのような技法は、もともと正味負電荷を担持する核酸には適用可能であるが、電位による各種ペプチドのポア転位は、ペプチドが正置換基、負置換基(例えば、アスパルタート残基)、中性置換基(例えば、フェニルアラニン残基)、および双性イオン置換基(例えば、ADP-リボシル化アルギニン)を含有し得るので、しばしばより困難である。したがって、典型的には、複数のペプチドのうち、あるサブセットだけがある電位に応答してポアまたは膜経由で転位することになる。本開示は、この限界を克服するための組成物および方法を提供する。いくつかの場合では、C末端カップリング試薬は、ポリアルギニンまたはポリグルタマートオリゴペプチド標識などの荷電標識を含み得る。そのような標識により提供される正または負の電荷は、C末端カップリング試薬が結合したペプチドが電位に応答してポアまたは膜を転位する効率または比率を増大し得る。
C末端カップリング試薬はまた、ポアまたはポアに結合された種に対する親和性を含み得る。例えば、C末端カップリング試薬は、ポアタンパク質に対する結合親和性を含むリガンドに結合され得、それによって前記C末端カップリング試薬(およびそれに結合された任意のペプチド)がポアに局在し得、そして前記ペプチドによるポア転位の可能性が高まり得る。
本開示の方法は、C末端カップリング試薬をペプチドに結合させる工程、および前記ペプチドをポア(例えば、ナノポア)経由で転位させる工程を含み得、この転位後に前記ペプチド、それに結合されたC末端カップリング試薬、またはそれらの組み合わせからのシグナルが検出される。ペプチドは、(例えば、溶解または均質化により)ウイルス、細胞、または組織試料に由来し得る。ペプチドは、別のタンパク質またはペプチドの(例えば、臭化シアンなどによる化学的な、または酵素的な、例えばトリプシン処理による)切断により、得られ得る。C末端カップリング試薬は、検出可能標識を含み得る。検出可能標識は、ヌクレオチドまたはペプチド配列を含み得る。検出可能標識は、光学的または電子化学的に検出可能な部分を含み得る。C末端試薬は、ポア転位率に影響する標識を含み得る。
シグナルは、ペプチドのアミノ酸を同定し得る。シグナルは、ペプチドの配列の少なくとも一部分を同定し得る。シグナルは、C末端カップリング試薬に結合されたバーコードの配列、およびペプチドの配列の少なくとも一部分を同定し得る。シグナルは、複数の別個のシグナル(例えば、ペプチドの複数のアミノ酸残基からの複数のシグナル)を含み得る。方法は、前記ペプチドのN末端または内側アミノ酸を標識する工程を含み得、前記標識は、前記ペプチドの前記ポア経由の前記転位の際に前記ペプチドから検出される前記シグナルを提供するように構成されている。N末端または内側アミノ酸の標識は、アミノ酸タイプ特異的標識であり得る。そのような場合、前記シグナルは、前記アミノ酸タイプを同定し得る。ペプチドは、複数のN末端標識または内側アミノ酸標識を含み得る。いくつかの場合では、1タイプの複数のアミノ酸が標識される(例えば、ペプチド内の全リジン残基が標識される)。いくつかの場合では、2つまたはそれ以上のタイプのアミノ酸が、アミノ酸タイプを同定する標識に結合される(例えば、各リジンが赤色色素で標識され、各システインが緑色色素で標識される)。方法は、少なくとも1つの、少なくとも2つの、少なくとも3つの、少なくとも4つの、または少なくとも5つのアミノ酸タイプを標識する工程を含み得る。アミノ酸タイプ特異的標識は、リジン、システイン、アミノ酸(例えば、アスパラギン酸およびグルタミン酸)含有カルボキシラート側鎖、チロシン、トリプトファン、アルギニン、ヒスチジン、セリン、スレオニン、またはそれらの任意の組み合わせに結合(例えば、選択的に結合)するように構成され得る。アミノ酸タイプ特異的標識は、非天然のアミノ酸、または翻訳後修飾されたアミノ酸、例えばホスホチロシンに結合するように構成され得る。
フルオロシーケンシング
フルオロシーケンシングは、タンパク質およびペプチドのシーケンシングの1分子分解能を提供することができる(Swaminathan, 2010; 米国特許第9,625,469号;米国特許仮出願第15/461,034号;同第15/510,962号)。フルオロシーケンシングの特質の一つは、フルオロフォアまたは他の標識の、対象タンパク質またはペプチド(例えば、フルオロシーケンシングされるペプチド)の特定のタイプのアミノ酸残基との結合である。このことは、1つまたは複数のアミノ酸残基を、標識部分で標識することを含み得る。フルオロシーケンシング方法は、対象タンパク質またはペプチドにおける1タイプのアミノ酸(例えば、全リジンまたは全システイン)を標識する工程を含み得る。フルオロシーケンシング方法は、対象タンパク質またはペプチドにおける複数のタイプのアミノ酸(例えば、リジンおよびチロシン)を標識する工程を含み得る。フルオロシーケンシング方法は、対象タンパク質またはペプチドにおける1つの、2つの、3つの、4つの、5つの、6つの、またはそれ以上の異なるタイプのアミノ酸残基を標識する工程を含み得る。使用され得る標識部分としては、例えば、フルオロフォア、発色団、およびクエンチャーが挙げられる。複数のアミノ酸残基としては、例えば、N末端アミノ酸、システイン、リジン、グルタミン酸、アスパラギン酸、トリプトファン、チロシン、セリン、スレオニン、アルギニン、ヒスチジン、メチオニン、またはそれらの任意の組み合わせが挙げられ得る。これらのアミノ酸残基はそれぞれ、異なる標識部分で標識され得る。アスパラギン酸およびグルタミン酸またはアスパラギンおよびグルタミンなどの複数のアミノ酸残基が、同じ標識部分で標識され得る。
フルオロシーケンシングは、タンパク質およびペプチドのシーケンシングの1分子分解能を提供することができる(Swaminathan, 2010; 米国特許第9,625,469号;米国特許仮出願第15/461,034号;同第15/510,962号)。フルオロシーケンシングの特質の一つは、フルオロフォアまたは他の標識の、対象タンパク質またはペプチド(例えば、フルオロシーケンシングされるペプチド)の特定のタイプのアミノ酸残基との結合である。このことは、1つまたは複数のアミノ酸残基を、標識部分で標識することを含み得る。フルオロシーケンシング方法は、対象タンパク質またはペプチドにおける1タイプのアミノ酸(例えば、全リジンまたは全システイン)を標識する工程を含み得る。フルオロシーケンシング方法は、対象タンパク質またはペプチドにおける複数のタイプのアミノ酸(例えば、リジンおよびチロシン)を標識する工程を含み得る。フルオロシーケンシング方法は、対象タンパク質またはペプチドにおける1つの、2つの、3つの、4つの、5つの、6つの、またはそれ以上の異なるタイプのアミノ酸残基を標識する工程を含み得る。使用され得る標識部分としては、例えば、フルオロフォア、発色団、およびクエンチャーが挙げられる。複数のアミノ酸残基としては、例えば、N末端アミノ酸、システイン、リジン、グルタミン酸、アスパラギン酸、トリプトファン、チロシン、セリン、スレオニン、アルギニン、ヒスチジン、メチオニン、またはそれらの任意の組み合わせが挙げられ得る。これらのアミノ酸残基はそれぞれ、異なる標識部分で標識され得る。アスパラギン酸およびグルタミン酸またはアスパラギンおよびグルタミンなどの複数のアミノ酸残基が、同じ標識部分で標識され得る。
標識特異性は、多くのフルオロシーケンシング方法における大きな課題である。多くの場合、1つの標識が、複数のアミノ酸タイプに対する反応性を含み得る。例えば、いくつかのマレイミド標識は、システイン、リジン、およびN末端アミンと反応し得る。反応性の似ているアミノ酸残基を区別することは、標識工程の精密な順序づけを要し得る。上のマレイミドの例では、まずはシステイン特異的標識工程(例えば、pH 7~8個のヨードアセトアミドの結合)によりシステインを反応させることによって、リジンをシステインと区別することができ、それによって後続のリジン標識工程でさらなるシステイン標識をせずにすむ。方法は、リジン標識する前にシステイン標識する工程を含み得る。方法は、グルタマート標識する前にシステイン標識する工程を含み得る。方法は、アスパルタート標識する前にシステイン標識する工程を含み得る。方法は、トリプトファン標識する前にシステイン標識する工程を含み得る。方法は、チロシン標識する前にシステイン標識する工程を含み得る。方法は、セリン標識する前にシステイン標識する工程を含み得る。方法は、スレオニン標識する前にシステイン標識する工程を含み得る。方法は、ヒスチジン標識する前にシステイン標識する工程を含み得る。方法は、アルギニン標識する前にシステイン標識する工程を含み得る。方法は、グルタマート標識する前にリジン標識する工程を含み得る。方法は、アスパルタート標識する前にリジン標識する工程を含み得る。方法は、トリプトファン標識する前にリジン標識する工程を含み得る。方法は、チロシン標識する前にリジン標識する工程を含み得る。方法は、セリン標識する前にリジン標識する工程を含み得る。方法は、スレオニン標識する前にリジン標識する工程を含み得る。方法は、アルギニン標識する前にリジン標識する工程を含み得る。方法は、トリプトファン標識する前にカルボキシラート側鎖(例えば、グルタマート側鎖およびアスパルタート側鎖)標識する工程を含み得る。方法は、チロシン標識する前にカルボキシラート側鎖(例えば、グルタマート側鎖およびアスパルタート側鎖)標識する工程を含み得る。方法は、セリン標識する前にカルボキシラート側鎖(例えば、グルタマート側鎖およびアスパルタート側鎖)標識する工程を含み得る。方法は、スレオニン標識する前にカルボキシラート側鎖(例えば、グルタマート側鎖およびアスパルタート側鎖)標識する工程を含み得る。方法は、ヒスチジン標識する前にカルボキシラート側鎖(例えば、グルタマート側鎖およびアスパルタート側鎖)標識する工程を含み得る。方法は、アルギニン標識する前にカルボキシラート側鎖(例えば、グルタマート側鎖およびアスパルタート側鎖)標識する工程を含み得る。方法は、標識の交差反応性を最小限化または防止するように構成された、逐次的に実施される、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、または少なくとも6つのアミノ酸標識工程(例えば、所期の1つまたは複数のタイプのアミノ酸を標識する)を含み得る。
本開示は、カルボキシル含有アミノ酸側鎖(例えば、アスパラギン酸側鎖およびグルタミン酸側鎖)よりもC末端カルボキシル基を選択的に標識するための試薬、組成物、および方法を提供する。ペプチドのC末端(を例えばC末端捕捉試薬で)およびカルボキシル含有アミノ酸側鎖を、示差的に標識することは、複数の標識工程の後のペプチド固定化(例えば、C末端に結合されたC末端捕捉試薬による)またはペプチド分析(例えば、フルオロシーケンシング)を可能にし得る。
したがって、本開示は、(i)反応性物質(例えば、C末端カップリング試薬)をペプチドのC末端カルボキシラートに選択的に結合させる工程、および(ii)前記ペプチドのN末端アミノ酸または内側アミノ酸に標識を結合させる工程、を含む方法を提供する。いくつかの場合では、前記反応性物質を前記ペプチドの前記C末端カルボキシラートに選択的に結合させる工程は、前記ペプチドの前記N末端アミノ酸および前記内側アミノ酸に前記標識を結合させることの後である。いくつかの場合では、前記ペプチドの前記N末端アミノ酸および前記内側アミノ酸に前記標識を結合させる工程は、前記反応性物質を前記ペプチドの前記C末端カルボキシラートに選択的に結合させることの後である。前記標識は、アミノ酸タイプ特異的標識、例えばリジン特異的標識、システイン特異的標識、チロシン特異的標識、トリプトファン特異的標識、ヒスチジン特異的標識、セリン特異的標識、スレオニン特異的標識、特異的標識、アルギニン特異的標識、グルタミン酸特異的標識、アスパラギン酸特異的標識、N末端アミン特異的標識、またはそれらの任意の組み合わせであり得る。いくつかの場合では、前記標識は、リジン特異的標識、システイン特異的標識、グルタミン酸特異的標識、アスパラギン酸特異的標識、N末端アミン特異的標識、またはそれらの任意の組み合わせである。
方法は、C末端カップリング試薬からのシグナルにより、試料のペプチドを定量する工程を含み得る。方法は、試料中のペプチドのC末端をC末端カップリング試薬で標識する工程、未反応C末端カップリング試薬を(例えば、洗浄することにより)除去する工程、および試料中に存在するC末端カップリング試薬を定量する工程を含み得る。
いくつかの場合では、方法は、前記ペプチドの複数のアミノ酸(例えば、システイン、リジン、およびN末端アミノ酸)を標識する工程を含む。そのような場合、前記反応性物質を前記ペプチドの前記C末端カルボキシラートに選択的に結合させることは、第1の標識(例えば、アミノ酸タイプ特異的標識)を前記ペプチドの第1のアミノ酸に結合させた後、かつ第2の標識(例えば、第1の標識とは異なるアミノ酸タイプ特異性を有する、アミノ酸タイプ特異的標識)を前記ペプチドの第2のアミノ酸に結合させる前であり得る。例えば、ペプチド標識方法は、C末端カルボキシラートを選択的に標識する前に、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのタイプのアミノ酸を標識する工程を含み得、かつ前記C末端カルボキシラートを標識する工程に続いて、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、または少なくとも5つのタイプのアミノ酸を標識する工程をさらに含み得る。
この技法は上記のような標識部分を用いて使用され得るが、フルオロシーケンシング様の方法では、合成オリゴヌクレオチドまたはペプチド核酸などの他の標識部分も使用され得る。具体的には、本願で用いられる標識部分は、1つまたは複数のアミノ酸残基を除去する条件に耐えるのに好適であり得る。この方法で用いられ得る潜在的な標識部分のいくつかの非限定例としては、例えば、Alexa Fluor(登録商標)色素、Atto色素、Janelia Fluor(登録商標)色素、ローダミン色素、または他の類似の色素などの、赤色~赤外スペクトルの蛍光シグナルを生じるものが挙げられる。アミノ酸残基を除去する条件に耐えることができたこれらの色素の各例としては、Alexa Fluor(登録商標) 405、ローダミンB、テトラメチルローダミン、Janelia Fluor(登録商標) 549、Alexa Fluor(登録商標) 555、Atto647N、および(5)6-ナフトフルオレセインが挙げられる。標識部分は、蛍光ペプチドもしくはタンパク質、または量子ドットであり得る。
フルオロシーケンシングは、エドマン分解およびその後の可視化などの技法によってペプチドを除去することを含み得る。逐次ペプチド除去は、配列または位置に特異的な情報を生成し得る。例えば、N末端アミノ酸除去工程後の蛍光の減少は、標識アミノ酸が、ひいては特定のタイプのアミノ酸が、ペプチドN末端に配置されたことを示し得る。各アミノ酸残基の除去は、エドマン分解およびタンパク質分解性切断を含め、多種多様な技法を用いて実行され得る。技法には、エドマン分解を用いて末端アミノ酸残基を除去することが含まれ得る。あるいは、技法は、酵素を用いて末端アミノ酸残基を除去することを含み得る。これらの末端アミノ酸残基は、ペプチド鎖のC末端またはN末端のどちらからでも除去され得る。エドマン分解が用いられる状況では、ペプチド鎖のN末端のアミノ酸残基が除去される。
ペプチド配列のシーケンシングまたは撮像の方法は、ペプチドを表面に固定化する工程を含み得る。ペプチドは、ペプチド由来システイン残基、ペプチドN末端、またはペプチドC末端を、表面と、または表面に結合された捕捉試薬と結合させることにより、前記表面に固定化され得る。ペプチドは、システイン残基を表面と、または表面に結合された捕捉試薬と反応させることにより、固定化され得る。ペプチドは、ペプチドC末端をC末端カップリング試薬(例えば、式(I)を含む捕捉試薬)と結合させ、そして前記C末端カップリング試薬を、表面に、または表面に結合された試薬に結合させることにより、固定化され得る。ペプチドは、表面に固定化され得る。表面は、可視スペクトルおよび/または赤外スペクトル全体で、光学的に透明であり得る。表面は、低屈折率(例えば、1.3~1.6の屈折率)を有し得る。表面は、10~50 nmの厚さ、20~80 nmの厚さ、50~200 nmの厚さ、100~500 nmの厚さ、200~800 nmの厚さ、500 nm~1 μmの厚さ、1~5 μmの厚さ、2~10 μmの厚さ、5~20 μmの厚さ、20~50 μmの厚さ、50~200 μmの厚さ、200~500 μmの厚さ、または500 μm超の厚さであり得る。表面は、有機溶媒に化学的に耐性があり得る。表面は、トリフルオロ酢酸または硫酸などの強酸に化学的に耐性があり得る。多様な(フルオロポリマー(テフロン-AF(Dupont)、Cytop(登録商標)(Asahi Glass、日本国))、芳香族ポリマー(ポリキシレン(Parylene、Kisco、カリフォルニア州)、ポリスチレン、ポリメタメチルアクリタート(polymethmethylacrytate))、および金属表面(金コーティング)のような)基板、コーティングスキーム(スピンコーティング、ディップコーティング、金属の電子ビーム堆積、熱気相成長、プラズマ援用化学気相成長)、ならびに官能基付与方法(ポリアリルアミングラフティング、PECVDにおけるアンモニアガスの使用、長鎖末端官能基付与フルオロアルカンのドーピング、他)が、本明細書に記載される方法で、便利な表面として使用され得る。厚さ20 nmの、Cytop(登録商標)で作られた光学的に透明なフルオロポリマー表面が、本明細書に記載される方法で使用され得る。本明細書で使用される表面は、シーケンシング用にペプチドを、および選択用に修飾標的を隔離する、様々なフルオロアルカンで、さらに誘導体化され得る。あるいは、アミノシラン修飾表面が、本明細書に記載される方法で使用され得る。方法は、ペプチドを、ビーズ、樹脂、ゲル、石英粒子、ガラスビーズ、またはそれらの組み合わせの表面に固定化する工程を含み得る。いくつかの非限定例では、方法は、Tentagel(登録商標)ビーズ、Tentagel(登録商標)樹脂、または他の類似のビーズもしくは樹脂の表面に固定化されているペプチドを用いることを意図している。本明細書において使用される表面は、ポリエチレングリコールなどのポリマーでコーティングされ得る。表面は、アミン官能基付与またはチオール官能基付与され得る。
本明細書に記載されるシーケンシング技法は、ペプチドまたはタンパク質を撮像して、前記ペプチドに結合された1つまたは複数の標識部分(例えば、アミノ酸標識)の存在を決定することを含む。シーケンシング技法は、複数のペプチドまたはタンパク質を撮像して、前記複数のペプチドの中からの個々のペプチド上の1つまたは複数の標識部分の存在を決定することを含み得る。シーケンシング技法は、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108種類、またはそれ以上のタンパク質またはペプチドを撮像すること(例えば、少なくとも103~少なくとも108種類のタンパク質またはペプチドを含む表面の一部分を撮像すること)を含み得る。これらの画像は、アミノ酸残基の各除去の後に撮像され得、したがってペプチド配列における特定のアミノ酸の場所の決定を可能にし得る。例えば、C末端固定化ペプチドは、配列
(N末端からC末端)(SEQ ID NO:26、ここで「K」はリジンを表し、「D」はアスパルタートを表し、「Y」はチロシンを表し、「A」はアラニンを表し、「G」はグリシンを表す)を含み得、かつ、各リジンおよびチロシン残基に結合された標識を含み得る。C末端固定化ペプチドを含む最初の画像は、ペプチド内の2つのリジンおよび1つのチロシンの存在を示し得る。N末端アミノ酸は(例えば、エドマン分解により)除去され得、したがってC末端固定化ペプチドを含む2枚目の画像は、ペプチド内の1つのリジンおよび1つのチロシンの存在を示し得る。このプロセスは、前記ペプチドについて配列
が同定されるまで繰り返され得、ここで「X」はリジンでもチロシンでもないアミノ酸を示し、「K」はリジンを示し、「Y」はチロシンを示す。本開示の方法は、ペプチド配列内の特定のアミノ酸の位置を同定することができる。方法が、ペプチド配列内の特定のアミノ酸残基の場所を特定するために使用され得、あるいはそれらの結果が、ペプチド配列内の全部のアミノ酸残基を決定するのに用いられ得る。方法は、ペプチド配列内の1つまたは複数のアミノ酸残基の場所を決定する工程、およびそれらの場所を既知のペプチド配列と比較する工程を含み得、それによってペプチド配列内の全部のアミノ酸残基が同定され得る。例えば、ヒトタンパク質の40アミノ酸断片におけるリジンおよびシステインの位置を同定することで、前記タンパク質が一意的に同定され得る(例えば、前記40アミノ酸断片において同定されるリジンおよびシステイン残基の特異なパターンを含有するヒトタンパク質は、1つしかない)。
(N末端からC末端)(SEQ ID NO:26、ここで「K」はリジンを表し、「D」はアスパルタートを表し、「Y」はチロシンを表し、「A」はアラニンを表し、「G」はグリシンを表す)を含み得、かつ、各リジンおよびチロシン残基に結合された標識を含み得る。C末端固定化ペプチドを含む最初の画像は、ペプチド内の2つのリジンおよび1つのチロシンの存在を示し得る。N末端アミノ酸は(例えば、エドマン分解により)除去され得、したがってC末端固定化ペプチドを含む2枚目の画像は、ペプチド内の1つのリジンおよび1つのチロシンの存在を示し得る。このプロセスは、前記ペプチドについて配列
が同定されるまで繰り返され得、ここで「X」はリジンでもチロシンでもないアミノ酸を示し、「K」はリジンを示し、「Y」はチロシンを示す。本開示の方法は、ペプチド配列内の特定のアミノ酸の位置を同定することができる。方法が、ペプチド配列内の特定のアミノ酸残基の場所を特定するために使用され得、あるいはそれらの結果が、ペプチド配列内の全部のアミノ酸残基を決定するのに用いられ得る。方法は、ペプチド配列内の1つまたは複数のアミノ酸残基の場所を決定する工程、およびそれらの場所を既知のペプチド配列と比較する工程を含み得、それによってペプチド配列内の全部のアミノ酸残基が同定され得る。例えば、ヒトタンパク質の40アミノ酸断片におけるリジンおよびシステインの位置を同定することで、前記タンパク質が一意的に同定され得る(例えば、前記40アミノ酸断片において同定されるリジンおよびシステイン残基の特異なパターンを含有するヒトタンパク質は、1つしかない)。
撮像方法は、蛍光定量、拡散反射、干渉散乱、ラマン法、共鳴強化ラマン法、赤外線吸収、可視光吸収、紫外線吸収、および蛍光などの、多種多様な分光光度方法および顕微鏡方法を含み得る。蛍光方法は、そのような蛍光技法、例えば蛍光偏光、フェルスター共鳴エネルギー移動(FRET)、または時間分解蛍光測定を使用し得る。分光光度方法または顕微鏡方法は、単一ペプチドに結合された1つまたは複数のフルオロフォアの存在を決定するために用いられ得る。そのような撮像方法は、特定のペプチド配列上の標識の存在または不存在を決定するために用いられ得る。アミノ酸残基除去および対象ペプチド撮像のサイクルを繰り返した後、ペプチドにおける標識アミノ酸残基の位置を決定することができる。
本明細書に記載される方法および組成物を用いて、タンパク質またはペプチドの長さを決定することができる。C末端カップリング試薬が、ペプチド分子の長さを決定するのに用いられ得るバーコード(例えば、フルオロフォアまたは核酸オリゴマー)を含み得る。分解(例えば、エドマン分解)の各サイクルを集計することができ、集計の総和が、ペプチドまたはタンパク質中に存在するアミノ酸の数に対応し得る。フルオロフォアの除去、または蛍光ハイブリダイゼーション事象の不存在は、ペプチドまたはタンパク質中に存在するアミノ酸の数を示し得る。
C末端ペプチドの濃縮
本開示の様々な局面は、ペプチドC末端を反応性物質で選択的に官能基付与するための方法を提供する。反応性物質は、ペプチドを精製するための官能性ハンドル(例えば、ビオチン)を含み得る。タンパク質またはペプチドのC末端アミノ酸は、前記タンパク質中、官能性ハンドルを含有する唯一のアミノ酸であり得る。標識後のタンパク質、ペプチド、またはそれらの組み合わせのプロテアーゼ消化は、反応性物質に結合されていない、したがって官能性ハンドル(例えば、ビオチン)を含有していない、ペプチド断片を生じ得る。例えば、20アミノ酸ペプチドのC末端がC末端カップリング試薬に結合され得、次いでその10番目のアミノ酸のところで切断されて、もとのペプチドの最初の10アミノ酸を含むがC末端カップリング試薬は含まない第1のペプチド断片と、反応性物質に結合されているC末端を含むもとのペプチドの次の10アミノ酸を含む第2のペプチド断片とを生じ得る。したがって、タンパク質またはペプチドの断片化(例えば、プロテアーゼ消化)により複数のペプチド断片が生じ得、ここで複数のペプチド断片の1つのペプチド断片だけが反応性物質に(したがって、ビオチンなどの官能性ハンドルに)結合されている。
本開示の様々な局面は、ペプチドC末端を反応性物質で選択的に官能基付与するための方法を提供する。反応性物質は、ペプチドを精製するための官能性ハンドル(例えば、ビオチン)を含み得る。タンパク質またはペプチドのC末端アミノ酸は、前記タンパク質中、官能性ハンドルを含有する唯一のアミノ酸であり得る。標識後のタンパク質、ペプチド、またはそれらの組み合わせのプロテアーゼ消化は、反応性物質に結合されていない、したがって官能性ハンドル(例えば、ビオチン)を含有していない、ペプチド断片を生じ得る。例えば、20アミノ酸ペプチドのC末端がC末端カップリング試薬に結合され得、次いでその10番目のアミノ酸のところで切断されて、もとのペプチドの最初の10アミノ酸を含むがC末端カップリング試薬は含まない第1のペプチド断片と、反応性物質に結合されているC末端を含むもとのペプチドの次の10アミノ酸を含む第2のペプチド断片とを生じ得る。したがって、タンパク質またはペプチドの断片化(例えば、プロテアーゼ消化)により複数のペプチド断片が生じ得、ここで複数のペプチド断片の1つのペプチド断片だけが反応性物質に(したがって、ビオチンなどの官能性ハンドルに)結合されている。
方法は、反応性物質の官能性ハンドル(例えば、ビオチン)による選択的ペプチド濃縮を含み得る。そのような方法(例えば、ビオチン標識されたペプチドのストレプトアビジンベースの濃縮)は、複雑な混合体からペプチドのサブ集団を濃縮し得る。ペプチド、タンパク質、またはそれらの組み合わせは、フルオロシーケンシングのために、ペプチド分子を共有結合的に固定化した種々の官能性ハンドルによる捕捉に供され得る。本明細書に記載される方法および組成物は、試料中のタンパク質、ペプチド、またはそれらの組み合わせの相対的な定量を増加させることにより、限られた数のタンパク質、ペプチド、またはそれらの組み合わせの改良された分析を提供し得る。試料中のタンパク質、ペプチド、またはそれらの組み合わせのストイキオメトリは、選択的ハンドルを用いたC末端標識により改良され得る。
多重化
本開示の方法は、複数の別個の試料(例えば、別々の細胞培養物または生検試料)に由来する複数のペプチドを同時に分析する工程を含み得、ここで前記複数のペプチドからの1つのペプチドが、前記ペプチドが由来する試料を同定するハンドル(例えば、核酸バーコードまたはフルオロフォア)を含むC末端カップリング試薬で標識されている場合がある。
本開示の方法は、複数の別個の試料(例えば、別々の細胞培養物または生検試料)に由来する複数のペプチドを同時に分析する工程を含み得、ここで前記複数のペプチドからの1つのペプチドが、前記ペプチドが由来する試料を同定するハンドル(例えば、核酸バーコードまたはフルオロフォア)を含むC末端カップリング試薬で標識されている場合がある。
多重化によるペプチドの同定および定量の概略図が、図7に示されている。ハンドルは、核酸オリゴマーを含み得る(例えば、図6)。核酸オリゴマーの配列は、試料のアイデンティティを反映し得る(例えば、バーコード)。ある試料に由来するペプチドはすべて、核酸オリゴマー上に同じ配列を含有し得る。異なる試料上のC末端連結反応は、ユニークバーコードを含み得る。ペプチド、タンパク質、またはそれらの組み合わせは、同じ反応バイアル内で混合され得る。ペプチド、タンパク質、またはそれらの組み合わせは、例えばフルオロフォアで標識され得る。表面への固定化後、既知のバーコードのそれぞれとハイブリダイズできる逐次または並行フローのオリゴヌクレオチドを、ペプチドと接触させることができる。オリゴヌクレオチドは、スペクトル的に特徴のあるフルオロフォアを含有し得る。オリゴヌクレオチドの局在は、ペプチドまたはタンパク質の試料アイデンティティを表し得る。例えば、第1の試料を第1のバーコードを含む第1の反応性物質と接触させることができ、第2の試料を第2のバーコードを含む第2の反応性物質と接触させることができ、第3の試料を第3のバーコードを含む第3の反応性物質と接触させることができる。混合(例えば、反応性物質の結合後、第1の、第2の、および第3の試料を合わせる)に続いて、各ペプチドの起源の試料を、バーコードの同定を通して決定することができる。試料アイデンティティを各ペプチド、タンパク質、またはそれらの組み合わせと結びつけることにより、最終分析は、定量の変化のみならず、かなりの数の試料を配列決定する能力を示すことができる。例えば、各試料をユニークハンドル(例えば、特徴的な吸光または発光特性をもつフルオロフォア)を含む反応性物質と接触させることにより、タンパク質発現が複数の試料において同時に測定され得る。
ペプチドのC末端残基を選択的に標識することは、プロテオミクスの調査のための数々の高感度分析方法にとって、重要な突破口となろう。例えば、選択的末端アミノ酸標識は、複雑な混合体からペプチドの選択的固定化および示差的標識を可能にし得る。このことは、特定のタンパク質分析方法、例えばナノポアシーケンシングの有用性を大きく拡大し得、それらは広範な系の正確かつ再現可能なタンパク質検出および定量を提供することができる。ナノポアシーケンシングは、同一のナノポア実験で相異なる試料に由来するタンパク質を多重化する経路を提供し得る。これらのより新規な方法の一部は、フルオロシーケンシング、ナノポアによるタンパク質シーケンシング、またはN末端親和性試薬に基づくいくつかのペプチドシーケンシング方法である。ペプチドの末端認識の結果、固体表面への固定化の選択性が得られる、またはポア経由の転位のために示差的な荷電末端が生じるとあれば、なおさらであろう。
試料タイプ
本明細書に記載される方法は、生物学的試料を分析する工程を含み得る。生物学的試料は、対象(例えば、患者または試験参加者)に、組織試料(例えば、改変された組織試料)に、細胞培養物(例えば、ヒト細胞株または細菌コロニー)に、細胞(例えば、単一細胞分別アッセイで単離された細胞)に、またはそれらの一部分(例えば、細胞のオルガネラ、または血液試料のエキソソーム)に由来し得る。生物学的試料は、合成ペプチドの組成物などの合成物であり得る。試料は、単一の種、または複数の種の混合体を含み得る。生物学的試料は、単一の生物に、遺伝的にほぼ同一な生物同士のコロニーに、または複数の生物(例えば、ヒト消化管に由来する腸細胞および細菌叢)に由来する生体材料を含み得る。生物学的試料は、分画され得(例えば、全血から分離された血漿)、濾過され得、または無くされ得る(例えば、血漿から除去されるアルブミンおよびセルロプラスミンなどの高濃度タンパク質)。
本明細書に記載される方法は、生物学的試料を分析する工程を含み得る。生物学的試料は、対象(例えば、患者または試験参加者)に、組織試料(例えば、改変された組織試料)に、細胞培養物(例えば、ヒト細胞株または細菌コロニー)に、細胞(例えば、単一細胞分別アッセイで単離された細胞)に、またはそれらの一部分(例えば、細胞のオルガネラ、または血液試料のエキソソーム)に由来し得る。生物学的試料は、合成ペプチドの組成物などの合成物であり得る。試料は、単一の種、または複数の種の混合体を含み得る。生物学的試料は、単一の生物に、遺伝的にほぼ同一な生物同士のコロニーに、または複数の生物(例えば、ヒト消化管に由来する腸細胞および細菌叢)に由来する生体材料を含み得る。生物学的試料は、分画され得(例えば、全血から分離された血漿)、濾過され得、または無くされ得る(例えば、血漿から除去されるアルブミンおよびセルロプラスミンなどの高濃度タンパク質)。
試料は、対象、組織試料、細胞培養物、細胞、またはそれらの一部分に由来する生体分子の全部またはそのサブセットを含み得る。例えば、対象に由来する試料は、その対象内に存在するタンパク質の大半を含み得、または、その対象に由来するタンパク質の小サブセットを含み得る。生物学的試料は、脳脊髄液、唾液、尿、涙、血液、血漿、血清、乳房吸引液、前立腺液、精液、大便、羊水、眼内液、粘液、またはそれらの任意の組み合わせなどの体液を含み得る。生物学的試料は、組織培養物、例えば腫瘍試料、または腎臓、肝臓、肺、膵臓、胃、腸、膀胱、卵巣、睾丸、皮膚、大腸、乳房、脳、食道、胎盤、もしくは前立腺に由来する組織を含み得る。
生物学的試料は、存在または不存在が測定され得るまたは同定され得る分子を含み得る。生物学的試料は、例えばポリペプチドまたはタンパク質などの巨大分子を含み得る。巨大分子は単離され得(例えば、そのソースであった他の構成要素から分離され)、または精製され得、その結果として前記巨大分子は、重量で(例えば、乾燥重量で、または溶媒を含めて)組成物の少なくとも0.5%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも7.5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、または少なくとも99%を占める。生物学的試料は複合体であり得、かつ複数の構成要素(例えば、種々のポリペプチド、プロテオパチー患者のCSFに由来するヘテロ試料)を含み得る。生物学的試料は、細胞もしくは組織の構成要素、細胞もしくは組織の抽出物、またはそれらの分画ライセートを含み得る。生物学的試料は、1つのタイプの分子(ペプチド、核酸、脂質、小分子)を含有するように、実質的に精製され得る。生物学的試料は、本開示の方法(例えば、消化、C末端標識、またはフルオロシーケンシング)用に構成された複数のペプチドを含み得る。
本開示による方法は、生体分子、生体巨大分子構造(例えば、オルガネラまたはリボソーム)、細胞、または組織を生物学的試料から単離するか、濃縮するか、または精製する工程を含み得る。方法は、関心対象の生物学的種のソースとして、生物学的試料を活用し得る。例えば、アッセイが、血液または血漿試料から、タンパク質、例えばアルファシヌクレイン、細胞、例えば循環腫瘍細胞(CTC)、または核酸、例えば細胞フリーDNAを、派生させ得る。方法は、1つの生物学的試料から、2つの別のタイプの細胞などの、複数の別個の生物学的種を派生させ得る。そのような場合、別個の生物学的種を異なる分析のために分けてもよく(例えば、CTCライセートとバフィーコートタンパク質とを分け、別々に分析してもよい)、または共通の分析のためにプールしてもよい。生物学的種は、分析前に、均質化され得、断片化され得、または溶解され得る。特定の事例では、ホモジネート、断片化産物、またはライセートから、1つまたは複数の種が分析用に収集され得る。例えば、方法は、液体細胞診時に循環腫瘍細胞を収集する工程、任意選択により個々の循環腫瘍細胞を単離する工程、前記循環腫瘍細胞を溶解する工程、得られたライセートからペプチドを単離する工程、および本開示のフルオロシーケンシング方法により前記ペプチドを分析する工程を含み得る。方法は、C末端捕捉試薬を用いて試料からペプチドを捕捉する工程、および前記ペプチドを(例えばフルオロシーケンシング方法により)分析する工程を含み得る。
本開示による方法は、シーケンシング、サザンブロット、またはエピジェネティック分析などの核酸分析を含み得る。核酸分析は、第2の分析方法、例えば本開示のフルオロシーケンシング方法と並行で実施され得る。核酸と、第2の分析方法の対象とは、同じ対象または同じ試料に由来し得る。例えば、方法は、ヒト血漿試料から細胞フリーDNAおよびペプチドを収集する工程、(例えば、がんマーカーを同定するために)細胞フリーDNAをシーケンシングする工程、および血漿タンパク質でプロテオミクス分析を実施する工程を含み得る。
実施例1:オキサゾロンベースのケミストリー
本実施例は、反応性物質をペプチドC末端に結合させ、そしてハンドルを、C末端に結合した反応性物質に結合させ、それによってC末端が標識されたペプチドを得るための方法を提供する。図3は、C末端標識方法の概要を提供する。ペプチド(301、乾燥材料として約1 mg)を無水酢酸および酢酸(95:5 v/v)に可溶化し、次いで70℃で1時間インキュベートし、高速真空(speed vacuum)下で乾燥してオキサゾロン中間体302を得る。H2O/アセトニトリル(50:50 v/v)中に再懸濁した後、HoBTおよびトリエチルアミン(300 mM)を加え、反応混合体をおよそ1分間恒温放置して、反応中に無水物を加水分解させる。得られたHOBt誘導体化ペプチド303を、ハンドル304を含む反応性物質と50 mMで合わせ、ボルテックスし、室温で4時間インキュベートし、ペプチド305のC末端に結合された反応性物質を得る。これらのペプチドは、下流分析(例えば、シーケンシング)のために提供される。ペプチド、タンパク質、またはそれらの組み合わせは、下流分析の前または後に精製され得る。ハンドルは、選択的精製用に構成され得る(例えば、ハンドルは、ストレプトアクチンベースの精製のためのストレプ-タグを含み得る)。
本実施例は、反応性物質をペプチドC末端に結合させ、そしてハンドルを、C末端に結合した反応性物質に結合させ、それによってC末端が標識されたペプチドを得るための方法を提供する。図3は、C末端標識方法の概要を提供する。ペプチド(301、乾燥材料として約1 mg)を無水酢酸および酢酸(95:5 v/v)に可溶化し、次いで70℃で1時間インキュベートし、高速真空(speed vacuum)下で乾燥してオキサゾロン中間体302を得る。H2O/アセトニトリル(50:50 v/v)中に再懸濁した後、HoBTおよびトリエチルアミン(300 mM)を加え、反応混合体をおよそ1分間恒温放置して、反応中に無水物を加水分解させる。得られたHOBt誘導体化ペプチド303を、ハンドル304を含む反応性物質と50 mMで合わせ、ボルテックスし、室温で4時間インキュベートし、ペプチド305のC末端に結合された反応性物質を得る。これらのペプチドは、下流分析(例えば、シーケンシング)のために提供される。ペプチド、タンパク質、またはそれらの組み合わせは、下流分析の前または後に精製され得る。ハンドルは、選択的精製用に構成され得る(例えば、ハンドルは、ストレプトアクチンベースの精製のためのストレプ-タグを含み得る)。
実施例2:光レドックスケミストリー
本実施例は、ペプチドを、マイケルアクセプターを含む反応性物質と選択的に反応させることに関する。本実施例では、事前の誘導体化(例えば、反応性ハンドルに結合させる前に、C末端を反応性オキサゾロンに転換すること)なしで、マイケルアクセプターをペプチドC末端に直接結合させる。図5Aに概説するように、アンジオテンシンIIのC末端特異的標識を、ルミフラビン光触媒およびフルスペクトルLED光源を用いて実施した。ファン動力式の冷却システム、または他の冷却源を用いることができる。対象のアンジオテンシン断片の量の30% mol/molのルミフラビンを加える。本実施例では、アンジオテンシン(Angeiotensin)IIペプチドのC末端に結合するように構成されたマイケルアクセプターとして、ジエチルエチリデンマロナート(例えば、20 eq.)を用いる。末端官能性ハンドル(例えば、アルキンまたはアジド)またはバーコード化(例えば、核酸バーコード)のための官能性ハンドルを有する他のマイケルアクセプターが合成され得る。逆に、C末端結合の後、官能性ハンドルを反応性物質に付加してもよい(例えば、反応性物質のエチルエステル部分における求核性置換による)。
本実施例は、ペプチドを、マイケルアクセプターを含む反応性物質と選択的に反応させることに関する。本実施例では、事前の誘導体化(例えば、反応性ハンドルに結合させる前に、C末端を反応性オキサゾロンに転換すること)なしで、マイケルアクセプターをペプチドC末端に直接結合させる。図5Aに概説するように、アンジオテンシンIIのC末端特異的標識を、ルミフラビン光触媒およびフルスペクトルLED光源を用いて実施した。ファン動力式の冷却システム、または他の冷却源を用いることができる。対象のアンジオテンシン断片の量の30% mol/molのルミフラビンを加える。本実施例では、アンジオテンシン(Angeiotensin)IIペプチドのC末端に結合するように構成されたマイケルアクセプターとして、ジエチルエチリデンマロナート(例えば、20 eq.)を用いる。末端官能性ハンドル(例えば、アルキンまたはアジド)またはバーコード化(例えば、核酸バーコード)のための官能性ハンドルを有する他のマイケルアクセプターが合成され得る。逆に、C末端結合の後、官能性ハンドルを反応性物質に付加してもよい(例えば、反応性物質のエチルエステル部分における求核性置換による)。
1 mgのアンジオテンシンIIを300 uLの水に可溶化し、300 μLの16.6% グリセロール(例えば、全量で1 mL中5%となる)および100 μLの0.1 M クエン酸ナトリウムバッファー(pH 3.5)と合わせる。得られた混合体を、4ドラムバイアル中、バッファー、グリセロール、ルミフラビン光触媒、およびマイケルアクセプター(ジエチル2-エチリデンマロナート)と合わせる。LED光の下、室温で12時間(一晩)反応させる。総体積は1 mLとした。ほぼ40~50%のアンジオテニン(Angiotenin)II C末端が、マイケルアクセプターと結合される。LC-MS1トレースは、未精製最終産物中に観測される産物を強調する(図5B~D)。
実施例3:カルボキシペプチダーゼ連結
ペプチド、タンパク質、またはそれらの組み合わせのカルボン酸基は、乾燥ペプチドを、0.1M メタノール性HCl中2時間インキュベートすることにより、エステル化される(例えば、アルキルエステル(例えば、メチルエステル)、アリールエステル、チオエステル)。余剰のエステル化試薬および水を除去すると、ペプチド、タンパク質、またはそれらの組み合わせの塩が残る。他のバリアントでは、ペプチド、タンパク質、またはそれらの組み合わせが、水中10 mM 酢酸をバッファーとして透析により分離される。
ペプチド、タンパク質、またはそれらの組み合わせのカルボン酸基は、乾燥ペプチドを、0.1M メタノール性HCl中2時間インキュベートすることにより、エステル化される(例えば、アルキルエステル(例えば、メチルエステル)、アリールエステル、チオエステル)。余剰のエステル化試薬および水を除去すると、ペプチド、タンパク質、またはそれらの組み合わせの塩が残る。他のバリアントでは、ペプチド、タンパク質、またはそれらの組み合わせが、水中10 mM 酢酸をバッファーとして透析により分離される。
エステル化ペプチド、タンパク質、またはそれらの組み合わせは、約50 μLの可溶化バッファー(50 mM 酢酸ナトリウム; 1% SDS、pH 5.5)に可溶化される。いくつかの場合では、ペプチド、タンパク質、またはそれらの組み合わせを溶解するのに、1X PBSバッファー(pH 7.2)が用いられる。予冷した微量遠心管に、150 μLのホウ酸ナトリウムバッファー(0.1M; pH 12.5)および20 μLの150 mM 求核性ハンドルを加える。一端にビオチンを含み、かつアミンを反応性部分とするビオシチンアミド(biocytinamide)を用いる。この混合体に、50 μLのカルボキシペプチダーゼY酵素(0.1 mg/mL; およそ10単位/mg)を、側面沿いに加える。150 μLのペプチド-エステルを混合体に加え、30分~2時間室温でインキュベートする。得られた溶液のpHは約11.6である。インキュベーション時間が長くなると、ペプチド、タンパク質、またはそれらの組み合わせからエステル基が除去され、ペプチド転移反応が途絶える。
カルボキシアミドメチル(Cam)エステルまたは置換Camエステル(例えば、-Cam-Leu-OHおよび-Cam-Leu-NH2)が、ドナーペプチドまたはタンパク質のC末端に結合され得る。-Cam-Leu-NH2は、ドナーペプチドまたはタンパク質のエステル化の際、最小限の自己エステル化により付加され得る。Camエステルは、Fmoc-Leu-rinkアミド樹脂を用いて生産され得る。
ペプチド転移反応は、固相または液相で実施され得る。液相反応を実施する場合、N末端ペプチドは、求電子剤(例えば、PCA)でブロックされ得る。C末端に結合された官能基が、顕微鏡スライドの表面に固定化するのに用いられ得る。
実施例4:ペプチリガーゼ連結
Camエステルを複数回洗って、DMF中20% ピペリジンで、室温で20分間、2回脱保護する。樹脂をDMFでよく洗う。グリコール酸のカルボン酸(すなわち、ヒドロキシ酢酸)を、アミド結合ケミストリーにより樹脂のアミンに結合させてから(例えば、1.5 eqのヒドロキシ酢酸、1.2 eqのHCTU、および6 eqのDIPEAを、脱保護Leu-rinkアミド樹脂と3時間かけて混合)、酸切断する。TFAカクテル(例えば、95% TFA、2.5% H2O、および2.5% トリイソプロピルシラン)で切断して、HO-Cam-Leu-NH2分子を遊離する。
Camエステルを複数回洗って、DMF中20% ピペリジンで、室温で20分間、2回脱保護する。樹脂をDMFでよく洗う。グリコール酸のカルボン酸(すなわち、ヒドロキシ酢酸)を、アミド結合ケミストリーにより樹脂のアミンに結合させてから(例えば、1.5 eqのヒドロキシ酢酸、1.2 eqのHCTU、および6 eqのDIPEAを、脱保護Leu-rinkアミド樹脂と3時間かけて混合)、酸切断する。TFAカクテル(例えば、95% TFA、2.5% H2O、および2.5% トリイソプロピルシラン)で切断して、HO-Cam-Leu-NH2分子を遊離する。
保護アミンを有するペプチド、タンパク質、またはそれらの組み合わせを、5 eqのLeu置換Camアルコールと混合し、乾燥DCMに溶解し、0℃まで冷却する。別のバイアルで、1.2 eqのN-(3-ジメチルアミノプロピル)-N’-エチルカルボジイミドヒドロクロリド(EDC)および0.1 eqの4-ジメチルアミノピリジン(DMAP)を乾燥DCMに溶解し、0℃まで冷却する。窒素下で、2つのバイアルを混合し、室温で3時間撹拌する。最終産物は、ドナーペプチド混合体の全酸性基が、Leu置換Camエステルに転換されている。次いでペプチドをHEPESバッファー(pH 8.0)に可溶化し、オムニリガーゼ媒介連結反応をさせる。
75 μLのエステル化ペプチド(およそ1 mg)を2.5 μLのTCEP(水中100 mg/mL TCEP.HCl)および25 μLの求核性ハンドルと混合する。この混合体に2 μLのオミニリガーゼ(Ominiligase)(10 U/mL)を加え、2時間室温でインキュベートする。エステル化ペプチドが固定リンカー(ドナー)分子に連結する。水酸化バリウムによりpHを12まで上昇させることにより、エステル化アスパラギン酸およびグルタミン酸側鎖が加水分解される。
実施例5:ノルボルネノン反応性物質でのC末端標識
別の例として、ペプチド混合体に対するC末端特異的標識手順を、光レドックスケミストリーの原理を用いて、ノルボルネノンバリアントとの結合用に最適化した。光レドックス機器Lumidox IIシステム(Analytical Sales and Services、ニュージャージー州)に電力レベル110 mWの青色LED(445 nm)を取りつけ、インキュベーション時間を6時間として、セットアップした。能動冷却基部(Analytical Sales and Services、ニュージャージー州)および卓上ファンを連続運転して、内容物を冷やしておいた。セットアップの写真を図8に示す。
別の例として、ペプチド混合体に対するC末端特異的標識手順を、光レドックスケミストリーの原理を用いて、ノルボルネノンバリアントとの結合用に最適化した。光レドックス機器Lumidox IIシステム(Analytical Sales and Services、ニュージャージー州)に電力レベル110 mWの青色LED(445 nm)を取りつけ、インキュベーション時間を6時間として、セットアップした。能動冷却基部(Analytical Sales and Services、ニュージャージー州)および卓上ファンを連続運転して、内容物を冷やしておいた。セットアップの写真を図8に示す。
C末端反応用の試薬を、次の3つの組成物として準備する。(a)水、リン酸バッファー、酸性バッファー、例えばクエン酸バッファーその他などのバッファー100 uLに可溶化したペプチド混合体901(1 nmole~1 μmole)、(b)光触媒混合物-ペプチドの1~40% mol/molのルミフラビン(0.1 mg/mL)-60 μL DMSO溶媒(水に置き換えてもよい)に可溶化、および(c)ノルボルネノン910を含む10 eqの反応性物質-20 μL DMSOに可溶化。使用されるノルボルネノン含有反応性物質は、(i)ノルボルネノン910、および(ii)特別に合成されたノルボルネノン-PEG4-アルキン911である。反応混合体は、ギ酸セシウムバッファー(pH 3.5)を用いて500 μLとした。
反応はまずアンジオテンシン-IIペプチドについて最適化され、アンジオテンシンのC末端ノルボルネノン標識を示すLCMSトレースが図9Bに示されている。図9Cに示す高分解能タンデム質量分析のトレースは、ノルボルネノンがC末端カルボン酸でのみ特異的に反応し、内側グルタミン酸では反応しないことを示す。
この方法を、100 μgのウシ胎仔血清アルブミン(BSA)、酵母、およびヒトタンパク質単離物から生成されたトリプシン消化ペプチドを含有する、より複雑なプロテオミクス試料で再現した。C末端標識効率は、平均65%であった(図10A)。追加のアッセイを、BSA、ヒトタンパク質、および酵母タンパク質トリプシン消化産物のgluC消化産物で実施し、90%近くまで増加したC末端標識効率を得た(図10B)。-トリプシンおよびgluCは、末端残基としてそれぞれリジン/アルギニンおよびアスパルタート/グルタマートを生じる。このことは、このC末端標識ケミストリーを、一般的なプロテオミクスプロテアーゼと一緒に使用できる可能性を示す。
実施例6:末端アミノ酸タイプが標識効率に及ぼす影響
いずれかの末端アミノ酸タイプが標識効率を偏らせるかどうかを理解するために、本発明者らは、2つの直交実験セットを実施した。1つめのクラスの実験では、それぞれが異なるC末端アミノ酸を有し、かつ配列LYRAGX-OH(SEQ ID NO: 28、ここで「X」は、20種類の相異なる基本的アミノ酸のいずれか1つを表す)を含む、20種類の個々のペプチドを合成し、ノルボルネノン結合効率について3つ組でアッセイした。本発明者らは、陰性対照として、ノルボルネノン標識がブロックされているC末端アミドを含むペプチドである、C末端アミド合成ペプチドLRWAG-ONH2(SEQ ID NO: 29)での標識を実施した。これらのペプチドのペプチド産物を、12分間の水 + 0.1% ギ酸/アセトニトリル + 0.1% ギ酸の5~95%勾配を備えたLC-MS分析機器(Agilent)で分析した。このアッセイの結果を要約する図13からわかるように、ロイシンC末端を有するペプチドは最高のC末端標識収率を提供したが、トリプトファン、システイン、およびアミドC末端を有するペプチドは、最低のC末端標識収率を提供した。
いずれかの末端アミノ酸タイプが標識効率を偏らせるかどうかを理解するために、本発明者らは、2つの直交実験セットを実施した。1つめのクラスの実験では、それぞれが異なるC末端アミノ酸を有し、かつ配列LYRAGX-OH(SEQ ID NO: 28、ここで「X」は、20種類の相異なる基本的アミノ酸のいずれか1つを表す)を含む、20種類の個々のペプチドを合成し、ノルボルネノン結合効率について3つ組でアッセイした。本発明者らは、陰性対照として、ノルボルネノン標識がブロックされているC末端アミドを含むペプチドである、C末端アミド合成ペプチドLRWAG-ONH2(SEQ ID NO: 29)での標識を実施した。これらのペプチドのペプチド産物を、12分間の水 + 0.1% ギ酸/アセトニトリル + 0.1% ギ酸の5~95%勾配を備えたLC-MS分析機器(Agilent)で分析した。このアッセイの結果を要約する図13からわかるように、ロイシンC末端を有するペプチドは最高のC末端標識収率を提供したが、トリプトファン、システイン、およびアミドC末端を有するペプチドは、最低のC末端標識収率を提供した。
2つめのカテゴリーの直交実験は、特定のアミノ酸タイプのN末端のペプチド結合を切断するプロテアーゼで消化されたタンパク質から生成されたペプチド内の末端アミノ酸の多様さを用いた。N末端特異的プロテアーゼ-AspN、LysN、およびLysarginase、ならびに消化BSAタンパク質、酵母、およびヒトタンパク質単離物-を用いて、末端アミノ酸が相異なるペプチドを生成した。ペプチドの標識がそのアミノ酸によって偏る程度(図11)を、末端アミノ酸がノルボルネノンマイケルアクセプターで標識された、および標識されなかった頻度を分析することにより同定した。実験間で標識効率のばらつきが観察されたが、それは光触媒およびノルボルネノンの広いバックグラウンドをもつ複雑な試料において修飾ペプチドを分離し同定することに固有の困難によるものであった。C-18チップ・クリーンアップ(C-18 tip cleanup)またはSP3ビーズなどの一般的に用いられる精製工程は、光触媒をペプチドから分離できなかった。インキュベーション時間、溶液中DMSOの%、光強度などの条件を最適化すれば、プロテオミクス用途のためのC末端付加物形成の標識効率がさらに上がると考えられる。
実施例7:選択的C末端標識によるペプチドシーケンシング
本実施例は、フルオロシーケンシング実験におけるペプチド固定化の手段としてのC末端選択的標識の有用性を実証する。図12パネルAに示すように、フルオロシーケンシング実験で、アンジオテンシン、ペプチドフリーの水を陰性対照として、および配列AK*AGANY{PRA}R-ONH2(SEQ ID NO: 24; * = Atto647N フルオロフォア; PRA = プロパルギルグリシン)のペプチドを陽性対照として用いて、一連の標識および基板固定化工程を実施した。マイケルアクセプターとしてのノルボルネノン-PEG4-リンカーの使用。本発明者らは、フルオロシーケンシングの前に、陽性対照としてアンジオテンシンを、陰性対照として水を用いて、次の順番で一連の工程を実施した。工程は次のとおりである。図12パネルA(1)(実施例5に記載されるように)アルキン部分をペプチドのC末端端部に結合させるC末端フォトレドックスケミストリー;図12パネルA(2)第1の固相支持体にN末端アミンを介してペプチドを固定化;図12パネルA(3)アミン-アジドのHCTU/DIEA媒介アミド結合により内側酸性残基を標識;図12パネルA(4)銅フリークリックケミストリーによる蛍光Atto647N-PEG4-DBCO結合。標識されたペプチドを樹脂から切断し、N末端脱保護してから、ノルボルネノン-PEG4-リンカーにより表面に固定化する(図12パネルA(5))。およそ10万個の蛍光スポット(蛍光標識されたペプチドおよび未反応フルオロフォアを含む)を、フルオロシーケンシング技術を用いて配列決定した(図12パネルB)。フルオロシーケンシングの結果を、連続エドマン分解サイクル後に蛍光強度を失ったペプチドの頻度として示す(図12パネルC)。
本実施例は、フルオロシーケンシング実験におけるペプチド固定化の手段としてのC末端選択的標識の有用性を実証する。図12パネルAに示すように、フルオロシーケンシング実験で、アンジオテンシン、ペプチドフリーの水を陰性対照として、および配列AK*AGANY{PRA}R-ONH2(SEQ ID NO: 24; * = Atto647N フルオロフォア; PRA = プロパルギルグリシン)のペプチドを陽性対照として用いて、一連の標識および基板固定化工程を実施した。マイケルアクセプターとしてのノルボルネノン-PEG4-リンカーの使用。本発明者らは、フルオロシーケンシングの前に、陽性対照としてアンジオテンシンを、陰性対照として水を用いて、次の順番で一連の工程を実施した。工程は次のとおりである。図12パネルA(1)(実施例5に記載されるように)アルキン部分をペプチドのC末端端部に結合させるC末端フォトレドックスケミストリー;図12パネルA(2)第1の固相支持体にN末端アミンを介してペプチドを固定化;図12パネルA(3)アミン-アジドのHCTU/DIEA媒介アミド結合により内側酸性残基を標識;図12パネルA(4)銅フリークリックケミストリーによる蛍光Atto647N-PEG4-DBCO結合。標識されたペプチドを樹脂から切断し、N末端脱保護してから、ノルボルネノン-PEG4-リンカーにより表面に固定化する(図12パネルA(5))。およそ10万個の蛍光スポット(蛍光標識されたペプチドおよび未反応フルオロフォアを含む)を、フルオロシーケンシング技術を用いて配列決定した(図12パネルB)。フルオロシーケンシングの結果を、連続エドマン分解サイクル後に蛍光強度を失ったペプチドの頻度として示す(図12パネルC)。
これらの例は、ペプチドおよび他のポリマーのC末端カルボン酸を選択的かつ区別的に標識するための光レドックスケミストリーの使用を拡大する。方法の記載および実証は、種々のプロテオミクス技法でその広い有用性を可能にしよう。
本発明の好ましい態様を本明細書に示し、かつ記載してきたが、当業者には、そのような態様が単に例として提供されていることが明らかになろう。本発明は、本明細書内で提供された具体例により限定されるものではない。本発明をここまで明細書を参照して記載してきたが、本明細書における態様の記載および例示は、限定的な意味で解釈すべきではない。当業者であればもう、本発明から逸脱することなく数々の変形形態、変化形態、および置換形態に想到しよう。さらに、本発明のすべての局面は、本明細書に示された、様々な条件および変数に依存する具体的な描写、構成、または相対的な量に限定されないことを理解すべきである。本発明を実施するにあたり、本明細書に記載される本発明の態様の様々な代替形態が採用され得ることを理解すべきである。したがって本発明は、そのような任意の代替形態、改造形態、変形形態、または等価形態も網羅するものと考えられる。添付の請求項が本発明の範囲を定めること、そしてそれによって、これら請求項の範囲内の方法および構造ならびにそれらの等価形態が網羅されることが意図される。
Claims (99)
- 第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸とを含むペプチドを処理するための方法であって、
前記ペプチドまたはタンパク質の前記第2のカルボン酸部分よりも優先的に、前記ペプチドまたはタンパク質の前記第1のカルボン酸部分を、C末端カップリング試薬と結合させる工程を含む、前記方法。 - 前記第1のカルボン酸部分と前記反応性物質との結合が、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも50%優先的である、請求項1記載の方法。
- 前記第1のカルボン酸部分と前記反応性物質との結合が、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも75%優先的である、請求項2記載の方法。
- 前記第1のカルボン酸部分と前記反応性物質との結合が、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも90%優先的である、請求項3記載の方法。
- 前記第1のカルボン酸部分と前記反応性物質との結合が、前記第2のカルボン酸部分と前記反応性物質との結合より少なくとも99%優先的である、請求項4記載の方法。
- 第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸とを含むペプチドを処理するための方法であって、
反応性物質と前記第2のカルボン酸部分との結合の非存在下で、前記反応性物質を前記第1のカルボン酸部分に結合させる工程を含む、前記方法。 - 前記ペプチドが、少なくとも2個の内側アミノ酸を含み、前記少なくとも2個の内側アミノ酸のうちの少なくとも1個が前記第2のカルボン酸部分を含む、請求項6記載の方法。
- 前記ペプチドが、少なくとも20個の内側アミノ酸を含み、前記少なくとも20個の内側アミノ酸のうちの少なくとも1個が第2のカルボン酸部分を含む、請求項7記載の方法。
- 前記反応性物質が標識を含む、請求項6記載の方法。
- 前記標識が、光学標識、核酸分子、ペプチド、イオン化可能分子、ポリエチレンスペーサー、ポリアルギニンペプチド、またはそれらの任意の組み合わせを含む、請求項9記載の方法。
- 前記核酸分子が核酸バーコードを含む、請求項10記載の方法。
- 前記反応性物質が求核剤または求電子剤を含む、請求項6記載の方法。
- 前記求核剤が、アミン、アルコール、硫化物、チオール、シアナート、チオシアナート、またはそれらの任意の組み合わせを含む、請求項12記載の方法。
- 前記求電子剤が、マイケルアクセプター、アルケン、ジエン、アクリルアミド、N-(プロパ-2-イン-1-イル)メチルアクリルアミド、イソシアナート、イソチオシアナート、オキシラン、α,β-不飽和カルボニル、ビニルスルホン、またはそれらの任意の組み合わせを含む、請求項12記載の方法。
- 前記マイケルアクセプターが3-メチレン-2-ノルボルナノンまたはその誘導体を含む、請求項14記載の方法。
- 前記反応性物質が、官能基付与部分、濃縮部分、またはそれらの組み合わせを含む、請求項6記載の方法。
- 前記官能基付与部分が、アルキン、アジド、フルオロフォア、ビオチン、核酸分子、アミノ酸、ペプチド、固体支持体ビーズもしくは樹脂、またはそれらの任意の組み合わせを含む、請求項16記載の方法。
- 前記濃縮部分が、アルキン、アジド、フルオロフォア、ビオチン、核酸分子、アミノ酸、ペプチド、固体支持体ビーズもしくは樹脂、またはそれらの任意の組み合わせを含む、請求項16記載の方法。
- 前記反応性物質を前記第1のカルボン酸部分に結合させる工程の前に、前記第1のカルボン酸部分を誘導体化する工程をさらに含む、請求項6記載の方法。
- 前記誘導体化する工程が、前記第1のカルボン酸を反応させてオキサゾロン部分を形成することを含む、請求項19記載の方法。
- 前記誘導体化する工程が、前記反応性物質を前記第1のカルボン酸部分に結合させる前に、前記オキサゾロン部分を活性化することを含む、請求項20記載の方法。
- 前記誘導体化する工程が光触媒による結合を含む、請求項19記載の方法。
- 前記光触媒による結合がフラビン光触媒を含む、請求項22記載の方法。
- 前記フラビン光触媒がルミフラビン触媒またはその誘導体である、請求項23記載の方法。
- 前記誘導体化する工程が、前記第1のカルボン酸を、無水酢酸、ヒドロキシベンゾトリアゾール(HOBT)、ヒドロキシアザベンゾトリアゾール(HOAT)、2-ニトロ-5-チオ安息香酸(NTCB)、またはそれらの誘導体もしくは組み合わせと反応させることを含む、請求項22記載の方法。
- 前記誘導体化する工程が酵素的である、請求項19記載の方法。
- 前記誘導体化する工程が、
エンドペプチダーゼ、エキソペプチダーゼ、カルボキシペプチダーゼ、アミダーゼ、ヒドロラーゼ、プロテイナーゼ、ペプチリガーゼ、ならびにそれらの任意の変異体、断片、および組み合わせからなる群より選択される、少なくとも1つの酵素
を含む、請求項26記載の方法。 - 前記ペプチリガーゼが、ペプチド結合を触媒する酵素である、請求項27記載の方法。
- 前記カルボキシペプチダーゼがカルボキシペプチダーゼYである、請求項27記載の方法。
- 前記プロテイナーゼがサーモリシンである、請求項27記載の方法。
- 前記ペプチドを、第2のペプチドまたはタンパク質を切断することにより生成する工程をさらに含む、請求項6記載の方法。
- 前記反応性物質が、前記ペプチドまたはタンパク質の(i)少なくとも1個の前記内側アミノ酸および(ii)N末端アミノ酸に実質的に結合しない、請求項6記載の方法。
- 前記反応性物質が、前記ペプチドまたはタンパク質のいずれの内側アミノ酸にも実質的に結合しない、請求項6記載の方法。
- 少なくとも1個の前記内側アミノ酸が、天然の翻訳後修飾されていないアミノ酸である、請求項6記載の方法。
- 前記ペプチドまたはタンパク質が、アミン、カルボン酸、インドール、アルコール、チオール、チオエーテル、フェノール、アミド、およびイミダゾールからなる群より選択される官能基を含む第2の内側アミノ酸を含む、請求項6記載の方法。
- 前記ペプチドまたはタンパク質が第2の内側アミノ酸を含み、前記第2の内側アミノ酸残基が非天然アミノ酸である、請求項6記載の方法。
- 前記反応性物質を前記第1のカルボン酸部分に結合させる工程の前に、前記ペプチドもしくはタンパク質の前記少なくとも1個の内側アミノ酸、前記ペプチドもしくはタンパク質の前記N末端アミノ酸、またはそれらの組み合わせが修飾される、請求項32記載の方法。
- 前記反応性物質を前記第1のカルボン酸部分に結合させる工程の後に、前記ペプチドもしくはタンパク質の前記少なくとも1個の内側アミノ酸、前記ペプチドもしくはタンパク質の前記N末端アミノ酸、またはそれらの組み合わせが修飾される、請求項32記載の方法。
- 前記修飾が可逆的修飾である、請求項37または38記載の方法。
- 前記内側アミノ酸が、少なくとも1つの標識に結合される、請求項6記載の方法。
- 前記ペプチドまたはタンパク質が、複数の標識に結合された複数の内側アミノ酸を含む、請求項6記載の方法。
- 前記複数の標識がアミノ酸タイプ特異的標識を含む、請求項41記載の方法。
- 前記複数の標識の中からの1つの標識が光学標識を含む、請求項42記載の方法。
- 前記光学標識がフルオロフォアである、請求項43記載の方法。
- 前記反応性物質が、表面固定化、試料濃縮、シーケンシング、標的同定、質量分析、電気泳動、またはそれらの任意の組み合わせのために構成されている、請求項6記載の方法。
- 前記シーケンシングが、1分子シーケンシング、ナノポアシーケンシング、フルオロシーケンシング、またはそれらの組み合わせである、請求項45記載の方法。
- 前記ペプチドまたはタンパク質を生物学的試料から単離する工程をさらに含む、請求項6記載の方法。
- 前記生物学的試料が、組織、血液、尿、唾液、リンパ液、またはそれらの任意の組み合わせに由来する、請求項47記載の方法。
- 前記ペプチドまたはタンパク質が組換えまたは合成ペプチドまたはタンパク質である、請求項6記載の方法。
- 前記ペプチドまたはタンパク質を消化する工程をさらに含む、請求項6記載の方法。
- (i)前記ペプチドまたはタンパク質を固体支持体に固定化する工程、(ii)少なくとも1個の内側アミノ酸を標識する工程、および(iii)前記ペプチドまたはタンパク質を前記固体支持体から遊離する工程をさらに含む、請求項6記載の方法。
- 前記固定化する工程が、前記反応性物質を前記固体支持体に結合させることを含む、請求項51記載の方法。
- 前記ペプチドまたはタンパク質を固定化する工程が、前記ペプチドまたはタンパク質のN末端アミノ酸を、前記固体支持体に結合された捕捉部分に結合させることを含む、請求項51記載の方法。
- 前記捕捉部分がアルデヒドを含む、請求項52または53記載の方法。
- 前記捕捉部分がピリジンカルボキシアルデヒドまたはそのアナログを含む、請求項52または53記載の方法。
- 第1のカルボン酸部分を含むC末端と第2のカルボン酸部分を含む内側アミノ酸とを含むペプチドまたはタンパク質を処理するための方法であって、
前記ペプチドまたはタンパク質の前記第2のカルボン酸部分よりも優先的に、前記ペプチドまたはタンパク質の前記第1のカルボン酸部分を、反応性物質と結合させる工程を含み、
前記反応性試薬が官能基付与部分、濃縮部分、またはそれらの組み合わせを含む、
前記方法。 - (A)1つまたは複数のアミノ酸を含む、ペプチド、
(B)固体支持体、および
(C)官能性ハンドル
を含む、組成物であって、
前記ペプチドが、前記固体支持体および前記官能性ハンドルに結合されている、前記組成物。 - 前記ペプチドが、前記官能性ハンドルにより前記固体支持体に結合されている、請求項57記載の組成物。
- N末端アミノ酸と複数の内側アミノ酸とC末端カルボキシラートとを含むペプチドを処理するための方法であって、
i)反応性物質を前記C末端カルボキシラートに選択的に結合させ、かつ
ii)前記N末端アミノ酸に、または前記複数の内側アミノ酸のうちの1つの内側アミノ酸に、標識を結合させる、
前記方法。 - i)の結合がii)の結合の前である、請求項59記載の方法。
- ii)の結合がi)の結合の前である、請求項59記載の方法。
- 前記標識がアミノ酸タイプ特異的標識である、請求項59または60記載の方法。
- 前記アミノ酸タイプ特異的標識が、リジン特異的標識、システイン特異的標識、チロシン特異的標識、トリプトファン特異的標識、ヒスチジン特異的標識、セリン特異的標識、スレオニン特異的標識、特異的標識、アルギニン特異的標識、グルタミン酸特異的標識、アスパラギン酸特異的標識、N末端アミン特異的標識、またはそれらの任意の組み合わせである、請求項62記載の方法。
- 前記アミノ酸タイプ特異的標識が、リジン特異的標識、システイン特異的標識、グルタミン酸特異的標識、アスパラギン酸特異的標識、N末端アミン特異的標識、またはそれらの任意の組み合わせである、請求項63記載の方法。
- ii)の結合の後に前記標識を検出する工程をさらに含む、請求項59~64のいずれか一項記載の方法。
- 前記検出する工程が光学検出を含む、請求項65記載の方法。
- 前記標識が、複数のアミノ酸タイプ特異的標識を含み、かつii)の結合が、前記複数のアミノ酸タイプ特異的標識の少なくとも1つのサブセットを前記内側アミノ酸の少なくとも1つのサブセットに結合させることを含む、請求項62記載の方法。
- i)の結合の前に、前記複数のアミノ酸タイプ特異的標識からの第1の標識が、前記内側アミノ酸の少なくとも1つのサブセットからの1アミノ酸に結合され、かつ、i)の結合の後に、前記複数のアミノ酸タイプ特異的標識からの第2の標識が、前記内側アミノ酸の少なくとも1つのサブセットからの1アミノ酸に結合される、請求項67記載の方法。
- 前記複数のアミノ酸タイプ特異的標識が、リジン特異的標識、システイン特異的標識、チロシン特異的標識、トリプトファン特異的標識、ヒスチジン特異的標識、セリン特異的標識、スレオニン特異的標識、特異的標識、アルギニン特異的標識、グルタミン酸特異的およびアスパラギン酸特異的標識、N末端アミン特異的標識、またはそれらの任意の組み合わせを含む、請求項67または68記載の方法。
- 前記複数のアミノ酸タイプ特異的標識が、リジン特異的標識、システイン特異的標識、グルタミン酸特異的およびアスパラギン酸特異的標識、N末端アミン特異的標識、またはそれらの任意の組み合わせを含む、請求項69記載の方法。
- ii)の結合の後に、前記複数のアミノ酸タイプ特異的標識の少なくとも1つのサブセットを検出する工程をさらに含む、請求項67~70のいずれか一項記載の方法。
- 前記検出する工程が、前記複数のアミノ酸タイプ特異的標識の少なくとも1つのサブセットについての少なくとも2つを識別することを含む、請求項71記載の方法。
- 前記検出する工程が、前記複数のアミノ酸特異的標識からの1つの標識を同定することを含む、請求項71記載の方法。
- 前記検出する工程が、標識に結合されていないアミノ酸を含む前記ペプチドの配列内の位置を同定することを含む、請求項71~73のいずれか一項記載の方法。
- 前記検出する工程が光学検出を含む、請求項71記載の方法。
- 前記反応性物質を用いて前記C末端アミノ酸を基板に結合させ、それによって前記ペプチドを前記基板に固定化する工程をさらに含む、請求項59~75のいずれか一項記載の方法。
- 前記固定化する工程がi)およびii)の結合の後である、請求項76記載の方法。
- 前記ペプチドを電気泳動的に移動させる工程をさらに含み、かつ
前記反応性物質に結合されていないペプチドを電気泳動的に移動させる比率と比べて、前記反応性物質によって、前記ペプチドを電気泳動的に移動させる比率が増加する、
請求項59~77のいずれか一項記載の方法。 - 前記ペプチドを電気泳動的に移動させる工程が、前記ペプチドをポア経由で転位させることを含む、請求項78記載の方法。
- 前記ポアがFRETドナーを含み、かつ前記標識がFRETアクセプターを含む、請求項79記載の方法。
- 前記ポアがFRETアクセプターを含み、かつ前記標識がFRETドナーを含む、請求項79記載の方法。
- 前記反応性物質またはその一部分を用いる前記ペプチドの親和性精製をさらに含む、請求項59~81のいずれか一項記載の方法。
- 前記反応性物質に結合された検出可能部分を検出する工程をさらに含む、請求項59~82のいずれか一項記載の方法。
- 前記反応性物質に結合された検出可能部分を検出する工程が前記反応性物質を定量することを含む、請求項83記載の方法。
- (a)ペプチド内側アミノ酸カルボキシル基よりもペプチドC末端に選択的に結合する、反応性部分、および
(b)官能性ハンドル
を含む、C末端カップリング試薬。 - 前記反応性部分が、ペプチド内側アミノ酸カルボキシル基よりもペプチドC末端に、少なくとも75%の特異性で結合する、請求項85記載のC末端カップリング試薬。
- 前記反応性部分が、ペプチド内側アミノ酸カルボキシル基よりもペプチドC末端に、少なくとも90%の特異性で結合する、請求項86記載のC末端カップリング試薬。
- 前記反応性部分が、ペプチド内側アミノ酸カルボキシル基よりもペプチドC末端に、少なくとも99%の特異性で結合する、請求項87記載のC末端カップリング試薬。
- 前記反応性部分が、アルコール、硫化物、チオール、マイケルアクセプター、アルケン、ジエン、アクリルアミド、N-(プロパ-2-イン-1-イル)メチルアクリルアミド、イソシアナート、イソチオシアナート、オキシラン、α,β-不飽和カルボニル、ビニルスルホン、またはそれらの任意の組み合わせを含む、請求項85~88のいずれか一項記載のC末端カップリング試薬。
- 前記マイケルアクセプターがノルボルネノンを含む、請求項89記載のC末端カップリング試薬。
- 前記反応性部分が光活性化可能部分である、請求項85~90のいずれか一項記載のC末端カップリング試薬。
- 前記官能性ハンドルが濃縮部分を含む、請求項85~91のいずれか一項記載のC末端カップリング試薬。
- 前記濃縮部分が、抗体、エピトープ、アルキン、アジド、フルオロフォア、ビオチン、核酸分子、アミノ酸、ペプチド、固体支持体ビーズもしくは樹脂、タンパク質親和性タグ、金属イオン、金属イオン親和性タグ、レクチン親和性タグ、ビオチン、アルブミン結合タンパク質、アルカリホスファターゼ、カルモジュリン結合ペプチド、セルロース結合ドメイン、キチン結合ドメイン、コリン結合ドメイン、FLAGタグ、E2エピトープ、ガラクトース結合タンパク質、EEタグ、HAタグ、ヒスチジン親和性タグ、Hisタグ、マルトース結合タンパク質、Mycタグ、Argタグ、Aspタグ、Cysタグ、Pheタグ、ストレプトアビジン結合ペプチド、ストレプタグ、ストレプトアビジン、ストレプトアクチン、SUMOタグ、ユビキチン、ユビキチン結合ドメイン、またはそれらの任意の部分もしくは組み合わせを含む、請求項92記載のC末端カップリング試薬。
- 前記官能性ハンドルが、それが結合するペプチドの電気泳動移動性を増大させるように構成されている、請求項85~93のいずれか一項記載のC末端カップリング試薬。
- 前記官能性ハンドルが検出可能部分を含む、請求項85~94のいずれか一項記載のC末端カップリング試薬。
- 前記検出可能部分が、フルオロフォア、色素、FRETドナー、FRETアクセプター、レドックス活性部分、質量タグ、またはそれらの任意の組み合わせを含む、請求項95記載のC末端カップリング試薬。
- 前記官能性ハンドルが化学的カップリング試薬を含む、請求項85~96のいずれか一項記載のC末端カップリング試薬。
- 前記化学的カップリング試薬が、アルキン、アジド、アントラセン、ピレン、チオール、またはそれらの任意の組み合わせを含む、請求項97記載のC末端カップリング試薬。
- 前記官能性ハンドルが、
濃縮部分、電気泳動移動性エンハンサー、検出可能部分、および化学的カップリング試薬からなる群より選択される、複数の部分
を含む、請求項85~98のいずれか一項記載のC末端カップリング試薬。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062978035P | 2020-02-18 | 2020-02-18 | |
US62/978,035 | 2020-02-18 | ||
PCT/US2021/018535 WO2021168083A1 (en) | 2020-02-18 | 2021-02-18 | Peptide and protein c-terminus labeling |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023514316A true JP2023514316A (ja) | 2023-04-05 |
Family
ID=77391594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022549421A Pending JP2023514316A (ja) | 2020-02-18 | 2021-02-18 | ペプチドおよびタンパク質のc末端の標識法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230076975A1 (ja) |
EP (1) | EP4107530A4 (ja) |
JP (1) | JP2023514316A (ja) |
CN (1) | CN115485563A (ja) |
WO (1) | WO2021168083A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201715684D0 (en) * | 2017-09-28 | 2017-11-15 | Univ Gent | Means and methods for single molecule peptide sequencing |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5279954A (en) * | 1989-06-30 | 1994-01-18 | Board Of Regents Of The University Of Nebraska And Bionebraska | Exopeptidase catalyzed site-specific bonding of supports, labels and bioactive agents to proteins |
EP3543703A1 (en) * | 2014-09-15 | 2019-09-25 | Board of Regents, The University of Texas System | Improved single molecule peptide sequencing |
-
2021
- 2021-02-18 JP JP2022549421A patent/JP2023514316A/ja active Pending
- 2021-02-18 CN CN202180026285.4A patent/CN115485563A/zh active Pending
- 2021-02-18 EP EP21757821.0A patent/EP4107530A4/en active Pending
- 2021-02-18 WO PCT/US2021/018535 patent/WO2021168083A1/en unknown
-
2022
- 2022-08-18 US US17/820,646 patent/US20230076975A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230076975A1 (en) | 2023-03-09 |
EP4107530A4 (en) | 2024-03-20 |
EP4107530A1 (en) | 2022-12-28 |
CN115485563A (zh) | 2022-12-16 |
WO2021168083A1 (en) | 2021-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220163536A1 (en) | Identifying peptides at the single molecule level | |
JP5647113B2 (ja) | 多リガンド捕捉剤ならびに関連組成物、方法およびシステム | |
US8993781B2 (en) | Fluorescent boron-substituted dipyrromethenes and use thereof for diagnosis | |
US7595198B2 (en) | Photocleavable isotope-coded affinity tags | |
US20210356473A1 (en) | Solid-phase n-terminal peptide capture and release | |
CN112469832A (zh) | 蛋白质上的翻译后修饰的单分子测序鉴别 | |
JP2023527149A (ja) | ポリペプチドの処理および分析のための方法、システムおよびキット | |
US20230076975A1 (en) | Peptide and protein c-terminus labeling | |
CA2971246C (en) | Identification of transglutaminase substrates and uses therefor | |
WO2018159841A1 (ja) | 新規化合物、当該新規化合物を含む蛍光誘導体化用試薬、並びに当該新規化合物を用いたアミノ酸の光学異性体を光学分割する方法及び蛍光誘導体化されたアミノ酸 | |
JP2007139787A (ja) | タンパク質の複雑な混合物を単純化するためのrrnkペプチドの選択的単離に基づくタンパク質の同定及び相対的定量の方法 | |
WO2022094148A1 (en) | Conjugation reagents and methods using 1,2-cyclohexanediones | |
US20230192761A1 (en) | Compounds and methods for selective c-terminal labeling | |
Sakurai | Chemical probe-based approach to discovery of target proteins of natural products | |
WO2024076928A1 (en) | Fluorophore-polymer conjugates and uses thereof | |
EP4348267A2 (en) | Compositions, methods, and utility of conjugated biomolecule barcodes | |
JPWO2007083793A1 (ja) | 光反応基を利用したパニング法およびそれに用いるキット | |
WO2023091961A2 (en) | Methods and systems for automated sample processing | |
CN114137213A (zh) | 一种体外检测ogt酶活性的方法 | |
Stindl | Evaluation of ligation methods and the synthesis of a specific PNA-encoded peptide library | |
JP2007228905A (ja) | チップ上におけるプロテインフォスファターゼ活性の検出方法 | |
JP2007195431A (ja) | 新規なプロテインキナーゼ活性の解析方法 | |
JP2006101767A (ja) | キナーゼ活性検出法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220817 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230815 |